自制monkey语言编译器：符号系统与代码执行

前几节，我们介绍了如何使用语法解析算法对代码进行解析。语法解析的目的是为了明白代码语句的意图，例如对于语句: c = a + b; 语法解析后，编译器就明白代码是想把变量a和b的值相加，再把结果赋值给变量c.然而要想实现这样的结果，编译器还得需要不少辅助信息，例如变量a和b对应的数值是多少，这些辅助信息我们会存储在一种称之为符号表的数据结构中。

在前几节语法解析时，代码实际上建造了一种树形结构，例如语句 a+b; 其中包含三个元素，a和b属于Identifier, 三者构成了一个算术表达式，也就是expression, 这就相当于构建了一颗三叉树，树的节点就是expression, 叶子节点就是两个Identifier和加号。在进行语句执行时，编译器会遍历这样的多叉树，然后执行相应的动作，把动作执行后的结果存储在对应的符号表里。例如编译器遍历了语句a+b对应的多叉树后，会从符号表中找到变量a,b对应的数值，根据读取到的符号"+",它会做一个加法，把结果存储到变量c对应的符号表中，接下来我们先看看符号表结构，我们先看看整型和布尔型变量对应的符号是怎么定义的。

在本地目录新建一个文件叫MonkeyEvaluator.js, 添加如下代码：

class BaseObject {
    constructor (props) {
        this.INTEGER_OBJ = "INTEGER"
        this.BOOLEAN_OBJ = "BOOLEAN"
        this.NULL_OBJ = "NULL"
    }

    type() {return null}

    inspect() {return null}
}

class Integer extends BaseObject {
    constructor(props) {
        super(props)
        this.value = props.value
    }

    inspect () {
        return "" + this.value
    }

    type () {
        return this.INTEGER_OBJ
    }
}

class Boolean extends BaseObject {
    constructor (props) {
        super(props)
        this.value = props.value
    }

    type () {
        return this.BOOLEAN_OBJ
    }

    inspect () {
        return "" + this.value
    }
}

class Null extends BaseObject {
    constructor (props) {
        super(props)
    }

    type () {
        return this.NULL_OBJ
    }

    inspect () {
        return "null"
    }
}

上面代码定义了符号表中应对不同数据类型的符号，BaseObject是所有符号对象的父类，它定义所有符号对象必须导出的接口，其中type接口返回符号对应的数据类型，inspect接口打印符号对象的内容。在BaseObject的构造函数中，它定义了当前符号对象的类型，分别是整形，布尔型和NULL。

接下来的Integer, Boolean, 和 Null 分别继承自BaseObject, 他们分别用于记录数据类型为整形，布尔型和Null型变量的辅助信息，其中前两者都含有一个value域，它用来存储变量对应的数值。接着我们将实现一个能够遍历语法解析树的类，它将遍历每个节点，同时执行相应动作，我们先回到MonkeyCompilerParser.js,为每个节点增加一个类型信息，例如：

class ExpressionStatement extends Statement {
  constructor(props) {
    super(props)
    this.token = props.token
    this.expression = props.expression
    var s = "expression: " + this.expression.getLiteral()
    this.tokenLiteral = s
    this.type = "ExpressionStatement"
  }
}
...

class IntegerLiteral extends Expression {
    constructor(props) {
        super(props)
        this.token = props.token
        this.value = props.value
        var s = "Integer value is: " + this.token.getLiteral()
        this.tokenLiteral = s
        // change here
        this.type = "Integer"
    }
}

//change here 
class Boolean extends Expression {
  constructor(props) {
    super(props)
    this.token = props.token
    this.value = props.value
    var s = "Boolean token with value of " + this.value
    this.tokenLiteral = s
    //change here
    this.type = "Boolean"
  }
}
...

我们增加的type值域就是用来标明当前节点的类型。回忆前几节我们详细研究的语法解析流程，对于如下代码：

5;

语法解析器会先调用parseExpressionStatement()来执行解析，在该函数里，它会根据调用表，调用parseExpression()接口来执行解析，后者会调用parseIntegerLiteral()接口，在该函数中，它把字符"5"转换成数字5，然后创建一个IntegerLiteral对象，把数字5存储在里面，这个对象会返回到parseExpressionStatement(),这个函数会构造一个ExpressionStatement对象，然后再把IntegerLiteral对象存储其中。根据上面代码的定义，IntegeLiteral对象会存储在ExpressionStatment对象的expression值域中。

于是解析过程就构造了一个语法树节点，它的结构是这样：ExpressionStatement -> IntegerLiteral。于是变量这个节点时，我们需要先访问ExpressionStatement,然后从它的expression值域中取出IntegerLiteral对象，再从后者的value域中读取对应的数值。根据这个逻辑，我们编写语法执行器的代码如下：

class MonkeyEvaluator {
    eval (node) {
        var props = {}
        switch (node.type) {
            case "Integer":
              console.log("Integer with value:", node.value)
              props.value = node.value
              return new Integer(props)
            case "Boolean":
              props.value = node.value
              console.log("Boolean with value:", node.value)
              return new Boolean(props)
            case "ExpressionStatement":
              return this.eval(node.expression)
        }

        return null
    }
}

eval 函数负责变量语法树节点，并根据节点信息执行相应动作。当它遍历的节点类型是ExpressionStatment时，它知道需要继续解析它的expression域，于是它递归调用eval函数，传入该对象的expression域，eval再次被调用是，传进来的就是IntegerLiteral对象，它的type域对应的就是"Integer",于是代码读取它存储的数值5，然后创建一个Integer符号对象，把数值5存在里面。我们对boolean类型的解析逻辑跟整形的解析逻辑是一样的。

接着，我们看看更复杂的表达式对应的节点如何解释执行。对于表达式:!true, -5, 他们就是我们前面几节所描述的前缀表达式，我们先看看前缀表达式对应的节点对象：

class PrefixExpression extends Expression {
  constructor(props) {
    super(props)
    this.token = props.token
    this.operator = props.operator
    this.right = props.expression
    var s = "(" + this.operator + this.right.getLiteral() + " )"
    this.tokenLiteral = s
    this.type = "PrefixExpression"
  }
}

其中的operator 代表着表达式前面的操作符，而right代表操作符后面的表达式，因此我们在解析前缀表达式节点时，需要先解析它的right对象，然后再根据不同的操作符采取不同的动作，因此相应代码如下：

class MonkeyEvaluator {
    eval (node) {
        var props = {}
        switch (node.type) {
        ....
        case "PrefixExpression":
              var right = this.eval(node.right)
              if (this.isError(right)) {
                return right
              }

              var obj =  this.evalPrefixExpression(node.operator, right)
              console.log("eval prefix expression: ", obj.inspect())
              return obj
        }

        return null
    }

evalPrefixExpression(operator, right) {
        switch (operator) {
            case "!":
              return this.evalBangOperatorExpression(right)
            case "-":
              return this.evalMinusPrefixOperatorExpression(right)
            default:
              return this.newError("unknown operator:", operator, right.type())
        }
    }

    isError (obj) {
        if (obj !== null) {
            return obj.type() === obj.ERROR_OBJ
        }

        return false
    }

    evalBangOperatorExpression(right) {
        var props = {}
        if (right.type() === right.BOOLEAN_OBJ) {
            if (right.value === true) {
                props.value = false
            }

            if (right.value === false) {
                props.value = true
            }
        }

        if (right.type() === right.NULL_OBJ) {
            props.value = true
        }

        return new Boolean(props)
    }

    evalMinusPrefixOperatorExpression(right) {
        if (right.type() !== right.INTEGER_OBJ) {
            return this.newError("unknown operaotr:- ", right.type())
        }

        var props = {}
        props.value = -right.value
        return new Integer(props)
    }

    newError(msg, type) {
        var props = {}
        props.errMsg = msg + type
        return new Error(props)
    }

从上面代码看出，在解析前缀表达式节点时，解析函数eval会先对节点的right值域进行解释执行，创建相应的符号对象，然后调用evalPrefixExpression()，在该函数中，它会根据节点的operator内容进行相应的处理。如果操作符是"!",那么它调用evalBangOperatorExpression(),在这个函数里，它会对right解析后返回来的符号对象里面的value取反，如果操作符是"-", 函数调用evalMinusPrefixOperatorExpression(),它会将right解析后返回的符号对象里的value做取负操作，如果操作符不属于这两种情况，那么代码返回错误信息。

完成了节点的解释执行流程，我们需要触发这个流程，于是打开MonkeyCompilerIDE.js,添加如下代码：

onLexingClick () {
      this.lexer = new MonkeyLexer(this.inputInstance.getContent())
      this.parser = new MonkeyCompilerParser(this.lexer)
      this.parser.parseProgram()
      this.program = this.parser.program
      for (var i = 0; i < this.program.statements.length; i++) {
          console.log(this.program.statements[i].getLiteral())

          //change here
          this.evaluator.eval(this.program.statements[i])
      }
    }

上面代码执行后情况如下，在编辑框里输入如下语句：

这里写图片描述

点击底下的parser按钮，代码会被语法进行，然后进入语法树节点的解析执行流程，代码运行后结果如下：

这里写图片描述

表达式"!true"，它的值被解析成false, "-5"它的值被解析成整形-5，因此我们代码就能成功的执行了语句"!true"和"-5"。

在后续的章节中，我们将详细研究后续表达式，例如a+b, a*(b+c);这类代码的解析执行，他们的处理过程要比本节前序表达式的处理过程复杂的多，我们也将使用一一拆解，分而治之的方式将难点分解，将难度降低，以便大家的掌握和理解。

更多技术信息，包括操作系统，编译器，面试算法，机器学习，人工智能，请关照我的公众号：

这里写图片描述

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,784评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,745评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,702评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,229评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,245评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,376评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,798评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,471评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,655评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,485评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,535评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,235评论 3赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,793评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,863评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,096评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,654评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,233评论 2赞 341

自制monkey语言编译器：符号系统与代码执行

推荐阅读更多精彩内容