用自己的语言编写编译器

直观地说，Foo语言的编译器本身似乎不能用Foo来编写。更具体地说，Foo语言的第一个编译器不能用Foo编写，但任何后续的编译器都可以为Foo编写。

但这是真的吗?我隐约记得读过一种语言，它的第一个编译器是用“自身”编写的。这可能吗?如果可能，如何实现?

当前回答

这是一个dump(实际上很难搜索的话题):

闲聊 C

这也是PyPy和Rubinius的想法:

(我想这也适用于Forth，但我对Forth一无所知。)

其他回答

在之前的答案上增加好奇心。

这里引用了Linux from Scratch手册中的一段话，说明了从源代码开始构建GCC编译器的步骤。(Linux From Scratch是一种安装Linux的方式，它与安装发行版完全不同，因为你必须编译目标系统的每一个二进制文件。)

做引导 “bootstrap”目标不只是编译GCC，而是多次编译它。它使用在第一个编译的程序进行第二次编译，然后再次进行第三次。然后比较第二和第三个编译以确保它能够完美地复制自己。这也意味着它是正确编译的。

使用“bootstrap”目标的动机是，用于构建目标系统工具链的编译器可能与目标编译器的版本不完全相同。在目标系统中，以这种方式进行操作一定会获得一个可以编译自身的编译器。

我记得我听过一个软件工程广播播客，其中Dick Gabriel谈到了如何在纸上用LISP编写一个最简单的版本，然后手工将其组装成机器代码，从而引导最初的LISP解释器。从那时起，其余的LISP特性都是用LISP编写和解释的。

这就是所谓的“自我引导”。你必须首先用其他语言(通常是Java或C)为你的语言构建一个编译器(或解释器)。一旦完成了这一步，你就可以用语言Foo编写一个新版本的编译器。您使用第一个引导编译器来编译编译器，然后使用这个编译器来编译其他所有内容(包括自身的未来版本)。

大多数语言确实是以这种方式创建的，部分原因是语言设计者喜欢使用他们正在创建的语言，也因为非平凡的编译器通常可以作为语言“完整”程度的有用基准。

Scala就是一个例子。它的第一个编译器是用Martin Odersky的实验语言Pizza创建的。从2.0版开始，编译器完全用Scala重新编写。从那时起，旧的Pizza编译器可以完全被丢弃，因为新的Scala编译器可以用于将来的迭代中编译自己。

也许你可以用BNF来描述BNF。

请注意，从技术上讲，您可以用一种仍然不存在的语言编写编译器。为了做到这一点，你创建了一个解释器，它是原始语言的一个下级，通常是缓慢和无用的，因为它在执行任何东西之前解释语言的每个语句。

如果你阅读它，它看起来确实完全像预期的语言，但它的执行要经过一些过程，将其转换为可执行的不止一个步骤。

这个编译器通常非常慢，因为它使用了一些适用于几乎所有现有语言的通用数学过程，但优点是下次除了在现有代码上使用生成的编译器外，什么也不用做。

当然这一次不需要解释。

推荐文章