写了个缩进文本解析器, 以及脚本语言 Cirru

2013-10-20 23:22:06 +08:00
 jiyinyiyong
有人喜欢玩编程语言的不, 而且特别讨厌括号的.. 想着用缩进全替换掉!
对 serious 的编程语言没有多少比较, 但为了日常脚本的方便, 缩进语法有效,
当然 CoffeeScript 已经很方便了, 差得就是, 这不是我们能随便折腾的语言,
自己写语言的话, 要学编译原理, 只是解释型语言还好一点..
比较简单 DIY 一个语言的方案是 Peter Norvig 的 lispy.
也许很多人都看过了, 中英文两个版本:
http://norvig.com/lispy.html
http://www.googies.info/articles/lispy.html
但对于缩进来说, 解析文本没那么麻烦, 折腾了一年多我终于能写一点了

从 lispy 出发, DIY 个编程语言两步
1) 解析文本得到一个数组的语法树
2) 递归解释执行语法树
当然为了开发效率和现实场景, 语言不能就这样的, 但玩的话足够了.
有语法树的情况下, 对数组进行递归, 就可以灵活调用宿主语言.. 我这里是 JS,
比如 `print (+ 1 2)` 这样的表达式, 嵌套复杂比较麻烦,
换成 `["print", ["+", 1, 2]]`, 解释执行的难度就小多了,
类似的数组, 还可以重新编译回文本, 比如编译 HTML CSS 这样生成文件,
那我想说的是, 通过整理了缩进语法, 我把第一步做好了(代码原型完成),
第二步的话, 可以有各种想法可以做, 不知道有没有人有兴趣玩

我的项目是 cirru-parser ,Github 页面上介绍了具体语法对应的解析结果:
https://github.com/jiyinyiyong/cirru-parser#syntax
Chrome 用户可以访问我的 Demo, 我把解析对应的数组结构打印出来了
http://jiyinyiyong.github.io/cirru-parser/
可能折叠得有点不习惯的多维数组.. `-` 开头标记 Array 一个元素啦

我自己之前做了解释器试验, 写个简单的解释器, 试验性的介绍:
http://jiyinyiyong.github.io/blog/posts/131004-cirru-status.html
然后今天完成了编译到 Mustache 的 Demo, Chrome 可以在线看:
http://jiyinyiyong.github.io/cirru-to-mustache/


然后还有 Sublime Text 上比较粗略的语法高亮:
https://github.com/jiyinyiyong/Cirru.subl
另外有计划在 CodeMirror 上尝试做语法高亮, 目前没确定好方案

目前的代码用 CoffeeScript 写的, 兼容 Node 和 RequireJS, SeaJS 加载,
我业余会花时间在上边, 因为 Mustache 的简版到时也会实际中用到,
模块目前基本的可用状态, 细节可能还是好再折腾

如果有兴趣可以留意 Cirru 相关的更新, 目前比较初级, 还能玩下~
关于早期的愿景可以看这里, 中间的代码是可以编辑, 但比较粗糙~
http://jiyinyiyong.github.io/article/04-cirru-project/page/index.html
3656 次点击
所在节点    分享创造
7 条回复
dcoder
2013-10-21 02:22:58 +08:00
在 ruby-china 看到过Cirru的帖子,顶一个!
zhkzyth
2013-10-21 20:40:31 +08:00
赞!!~
yuelang85
2014-02-02 23:58:38 +08:00
很酷
sectic
2014-02-05 07:20:37 +08:00
Ast 可以生成 llvm LR,这样llvm就可以编译执行了,llvm也支持解释执行。
sectic
2014-02-05 07:23:48 +08:00
关于括号有个八卦,lisp在论文上用的叫m eexpresion,那个不全是括号。后来第一个lisp实现直接全用括号,s expresion ,然后大家发现这样还不错,然后m expression就没有实现过。
ianva
2014-02-09 14:38:23 +08:00
可以考虑用写工具,手写有点麻烦,比如 jison,javascript 版的flex + bison,或者 peg.js,基于 parsing expression grammar 的文法会很容易折腾
jiyinyiyong
2014-03-16 13:01:29 +08:00
@sectic 未来要考虑下 LLVM, 不过现在还太早了, 做底层的语言没想清楚.

@ianva 我尝试过的, 可是发现缩进语法用生成工具做太不合适了, 做了一般放弃掉

V2EX 的通知有问题... 今天加了一条消息才看到这边的..

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/86237

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX