自制Monkey语言编译器:解释执行return语句和错误处理控制

在高级编程语言中，大多含有一个指令叫return,也就是程序的执行指令流遇到该语句后不再往下执行，而是返回上一层，如果return后面附带数据的话，程序会把数据夹带到调用栈上一层的代码执行路径。本节我们就给Monkey语言编译器增加解释执行return语句的功能，完成本节代码后，编译器能解释执行如下代码：

这里写图片描述

代码中存在两个if 间套，内层if执行return语句附带返回整数10，外层if 最后执行return语句附带放回数值1，根据代码逻辑，最后一条语句也就是return 1;不会被编译器所执行，编译器会把内层if里面的return语句执行后，把整形10返回给最外层，完成本节代码后，编译器对上面代码解释执行的结果如下：

这里写图片描述

从运行结果看，编译器解释执行了一系列if条件判断语句后，将内层if语句块包含的return语句执行了，并没有执行外层if语句块包含的return语句，所以在控制台输出上显示出编译器将数值10返回给最外层。接下来我们看看代码的实现。

我们现在代码中添加return 返回值对应的符号对象：


//change 1
class ReturnValues extends BaseObject {
    constructor(props) {
        super(props)
        this.valueObject = props.value
    }

    type () {
        return this.RETURN_VALUE_OBJECT
    }

    inspect() {
        this.msg = "return with : " + this.valueObject.inspect()
        return this.msg
    }
}

上面实现的符号对象，主要功能就是把return后面的数值或变量包裹在类ReturnValues中。接着我们在解释执行的主函数中添加对return语句的专门处理分支：

class MonkeyEvaluator {
    eval (node) {
        var props = {}
        switch (node.type) {
        ...
                    //change 2 
            case "ReturnStatement":
            var props = {}
            props.value = this.eval(node.expression)
            // change 12
            if (this.isError(props.value)) {
                return props.value
            }
            var obj =  new ReturnValues(props)
            console.log(obj.inspect())
            return obj
            ...
            }
            ...
            
}

当语法解析器解析到return语句时，会构造一个类型为"RetturnStatement"的语法树节点，我们在解释执行函数中，如果发现该节点被传入，那么就进入对应执行分支。在return语句后面很可能是一个复杂的运算表达式，所以代码先递归调用eval解释执行return后面的语句以便获得要返回的数据对象，接着把该数据对象封装在前面设计的ReturnValues符号对象里。

在上一节，我们增加了一个函数evalStatements用来解释执行if语句块，其内容如下：

evalStatements(node) {
        var result = null
        for (var i = 0; i < node.statements.length; i++) {
            result = this.eval(node.statements[i])
            if (result.type() == result.RETURN_VALUE_OBJECT
                || result.type() == result.ERROR_OBJ) {
                // change 3
                return result
            }
        }

        return result
    }

使用上面的函数去解释本文最开始给出的if间套语句会有问题，因为上面代码的执行方式是把if语句块里面的每条代码都解释执行一遍，然后把最后一条语句解释执行的结果返回给上一层，这样的话编译器在解释执行开头给出的代码时，它会解释执行最外层if语句块最后一条语句后才停止，于是使用上面代码解释执行if语句块就会造成错误，因为根据逻辑，语句“return 1;"是不应该被执行的。我们要修改代码处理这个问题，在MonkeyCompilerIDE.js中修改代码如下：

onLexingClick () {
      this.lexer = new MonkeyLexer(this.inputInstance.getContent())
      this.parser = new MonkeyCompilerParser(this.lexer)
      this.parser.parseProgram()
      this.program = this.parser.program
      /*
      for (var i = 0; i < this.program.statements.length; i++) {
          console.log(this.program.statements[i].getLiteral())
          this.evaluator.eval(this.program.statements[i])
      }
      */
      // change 4
      this.evaluator.eval(this.program)
    }

我们把语法解析后形成的语法树根节点，也就是Program对象直接传入解释器的eval函数，在MonkeyCompilerParser.js中也做一些相应修改：

class Program {
    constructor () {
        this.statements = []
      // change 3
      this.type = "program"
    }

    getLiteral() {
        if (this.statements.length > 0) {
            return this.statements[0].tokenLiteral()
        } else {
            return ""
        }
    }
}

回到MonkeyEvaluator.js中，我们在eval函数中添加对应处理代码：

eval (node) {
        var props = {}
        switch (node.type) {
            //change 5
            case "program":
            return this.evalProgram(node)
            ...
            }
            ...
}
....
    //change 5 
    // change 3 in MonkeyCompilerParser.js
    // change 4 in MonkeyCompilerIDE.js
    evalProgram (program) {
        var result = null
        for (var i = 0; i < program.statements.length; i++) {
            result = this.eval(program.statements[i])
            if (result.type() == result.RETURN_VALUE_OBJECT) {
                return result.valueObject
            }

            if (result.type() == result.NULL_OBJ) {
                return result
            }
            // change 10
            if (result.type = result.ERROR_OBJ) {
                console.log(result.msg)
                return result
            }
        } 

        return result
    }

evalProgram的逻辑跟evalStatement的逻辑其实是一样的，就是把语法树节当前点中的所有子节点进行解释执行，这么修改之后，我们就能处理前面说的if语句间套中包含return指令的问题，至于其中的详细原理，点击如下链接，查看视频讲解和代码调试演示：更详细的讲解和代码调试演示过程，请点击链接。

完成上面代码之后，编译器就能正确的解释执行return语句了，更详细的讲解和代码调试演示，请参看上头给出的视频链接。接下来我们要为编译器添加错误处理信息。所谓错误处理是指用户在编程时，使用了错误的数理逻辑，例如下面这样：

这里写图片描述

上述代码把一个整形和一个布尔型数据相加，这在逻辑上走不通，因此在编译器看来是一种逻辑错误，当出现这种错误是，编译器就得报错，并停止继续往下执行代码。编译器报错情况如下：

屏幕快照 2018-04-03 下午6.00.12.png

接下来我们就为此添加错误处理功能，在MonkeyEvaluator.js中添加如下代码：

// change 6
    newError(msg) {
        var props = {}
        props.errMsg = msg
        return new Error(props)
    }

msg表示的是错误消息字符串，上面函数把它封装到一个名为Error的符号对象里，我们看看其定义实现：

class Error extends BaseObject {
    constructor(props) {
        super(props)
        this.msg = props.errMsg
    }

    type () {
        return this.ERROR_OBJ
    }

    inspect () {
        return this.msg
    }
}

错误符号对象原理很简单，它就是封装了一条错误信息字符串msg以便给编译器在合适的时候显示出来。接着我们在合适的地方检测类型匹配错误，首先是在解释执行中序表达式时，添加代码如下：

evalInfixExpression(operator, left, right) {
        //change 7
        if (left.type() != right.type()) {
            return  this.newError("type mismatch: " +
                left.type() + " and " + right.type())
        }
        ...
//change 8
        return  this.newError("unknown operator: "+ operator)
}

前面例子中出错的语句"5+true"就是中序表达式，该函数在解释执行表达式前，先检测运算符两边的数据类型是否一致，如果不一致的话，调用newError函数构造一个Error对象后直接返回，不再继续往下执行。或者在中序表达式中，编译器遇到了识别不了的运算符，那么它也会构造一个错误对象返回。

如果代码在对两个整形数据进行运算时，使用了编译器无法识别的运算符，那么编译器也会构造一个错误对象返回：

evalIntegerInfixExpression(operator, left, right) {
    ....
    switch (operator) {
    ....
    default:
    // change 9
    return this.newError("unknown operator for Integer")
    }
    ....
}

在取负操作时，如果减号后面跟着的不是整形，那么编译器也报错，例如"-true"，这种代码是错误的，因此修改如下：

evalMinusPrefixOperatorExpression(right) {
        if (right.type() !== right.INTEGER_OBJ) {
            // change 8
            return new this.newError("unknown operaotr:- ", right.type())
        }
        ....
}

在evalProgram函数中，它会把所有子节点就像解释执行，但如果在执行中间遇到错误时，那么就必须终止执行流程，于是在该函数中也要进行相应修改：

evalProgram (program) {
        var result = null
        for (var i = 0; i < program.statements.length; i++) {
        ...
        // change 10
            if (result.type = result.ERROR_OBJ) {
                console.log(result.msg)
                return result
            }
}

我们添加一个函数用于判断，eval函数在解释执行对应的语法树节点后，返回的是否是一个错误对象：

    // change 11
    isError(obj) {
        if (obj != null) {
            return obj.type() == obj.ERROR_OBJ
        }

        return false
    }

在不少地方，例如return后面的表达式，if括号里面的条件判断表达式，他们在解释执行时都可能产生错误，因此我们需要在相应的位置进行监控：

eval(node){
    ....
    switch (node.type) {
    ....
    case "PrefixExpression":
    ...
    // change 13
    if (this.isError(right)) {
        return right
    }
    ...
    case "InfixExpression":
    var left = this.eval(node.left)
    // change 14
    if (this.isError(left)) {
        return left
    }
    var right = this.eval(node.right)
    //change 15
    if (this.isError(right)) {
        return right
    }
    case "ReturnStatement":
    ....
    // change 12
    if (this.isError(props.value)) {
        return props.value
    }
    ....    
}

上面代码在处理return语句时，检测return后面跟着的表达式被编译器解释执行后是否出错，如果出错则把错误对象返回。在解释执行前置表达式时，编译器检测运算符后面的表达式在解释执行时是否正常，如果出错则直接将错误返回。

接下来则是在if语句的解释执行部分进行错误检测：

evalIfExpression(ifNode) {
        console.log("begin to eval if statment")
        var condition = this.eval(ifNode.condition)
        // change 16
        if (this.isError(condition)) {
            return condition
        }
        ....
}

代码在执行if语句块前，先判断if括号里的条件表达式在解释执行时是否正常，如果有错就不再往下执行，完成上面代码后，编译器就基本建立了语法上的错误检测机制。

更详细的讲解和代码调试演示过程，请点击链接

更多技术信息，包括操作系统，编译器，面试算法，机器学习，人工智能，请关照我的公众号：

这里写图片描述

最后编辑于：2018.04.03 18:01:02

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,784评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,745评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,702评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,229评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,245评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,376评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,798评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,471评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,655评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,485评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,535评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,235评论 3赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,793评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,863评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,096评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,654评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,233评论 2赞 341

自制Monkey语言编译器:解释执行return语句和错误处理控制

推荐阅读更多精彩内容