语言及语法定义
布尔表达式包含:逻辑表达式 and or not,关系表达式 >, >=, ==, <=, <
源码位置:https://github.com/wangdxh/eopl3-in-python let 文件夹下面 pyand.py
简单的布尔表达式如下:
我们使用“let 变量定义 in 布尔表达式 ” 这样的语句来引入变量的定义,可以在布尔表达式中引用定义的变量,实例如下:
在《Oreilly-Getting-Started-with-Pyparsing》一书中,49页有一个逻辑表达式的BNF定义,如下:
在这个定义中,定义了逻辑表达式的优先级 not > and > or 并且是一个递归的定义,Term的定义包含 可选的 not,然后是 单个单词,字符串(quotedString),或者括号括起来的另一个表达式。这里and or not 两边并不是关系表达式,而是单词,字符串,是书中的一个例子,后面我们会将其修改为关系表达式。
And表达式的定义为 Term 跟着 可选的 多个and Term。布尔表达式定义为 And 表达式加上 可选的 多个or And表达式。这样解析的时候,a && b || c 出现||的时候,左右两边被解析为and表达式,&&的两边被解析为term表达式,优先级比较明确。
下图是使用pyparsing语法定义的 表达式:
解析的时候,term 中包含的子表达式被包含在一个列表内,多个并列的and语句包含在一个列表内。
and or not 逻辑表达式有优先级,和一元二元区分,and和or是二元,not是一元,pyparsing提供了一个简单的操作符优先级的语法定义:如下
将Term修改为只有 单词和字符串的定义,
多个操作符定义为列表,第一个元素为定义的逻辑符号,第二个元素说明是一元还是二元,第三个元素是说明操作符是left- or right-associative。使用操作符优先级定义比较简洁,效果等同于上一段的pyparsing定义。省略了递归定义,和()操作符的定义。
下面是我们定义的关系表达式的语法,关系表达式中可以使用变量,数值,字符串,支持>,== <,>=, <=.(少了一个!=)
每个关系表达式封装在一个子列表内。BoolTerm 可以是任何一个关系表达式。使用操作符优先级进行定义:
定义let表达式:原来 in 后面跟着的body,修改为boolexpr。变量定义中变量的值只能赋值为item,上面item定义为变量,数值,字符串,所以在扩展环境中的变量的值的时候,直接扩展,不需要对item进行解析计算了。
解释执行
let的语句执行时,对于变量定义列表,varvalue的值都是直接的值,直接扩展到环境中去,然后返回boolexp的解析结果
布尔表达式,首先是以and 和 or 分割的list,not 或者 关系表达式都被封装在更深一层的list内部,所以顶级有&& 或者 || 出现的时候,总是 一个或者多个 && || 组成的列表,在列表的1,3,5奇数位上总是 &&或||,0,2,4是 关系表达式,或者子布尔表达式。同一级的表达式如果出现多个||,则计算每一个的值,碰到第一个为真,就返回,表达式都执行没有返回,就返回假。 多个&&时,碰到第一个为假就返回,多个表达式计算完成没有返回,就返回真。
如果是not表达式,则exp的第一个字符是not !,直接返回 第二个元素的反值。not表达式解析为一个独立的list,所以元素为2,后面跟着not的对象。
剩余的就是计算关系表达式的值了:关系表达式都是有3个元素的,所以解析出来的list结果,每一个list都是至少有2个元素的,所以下面直接通过索引判断list的取值,并不会越界。
关系表达式的解释:关系表达式都是二元的,所以取值的时候只要取出0,2,的值即可,1号位的元素肯定是字符串的关系符号。0和2号位,如果不是以“开头的字符串说明它是一个变量,这里有个注意的地方,pyparsing解析出来的字符串,如果不设置setParseAction时,removeQuotes解析出来的结果是带引号的,这里我们通过引号来区分其实字符串类型还是变量类型。变量和字符串的类型区分,后续会用其他方法进行区分。
真正解释关系表达式的时候,是将每个关系表达式转换成字符串,然后调用eval直接当成python语言进行计算。如果关系表达式中包含变量的时候,提前将其的值从环境中查找出来 apply_env。然后再组成字符串。
遗留问题:只通过解析出来的list元素值,不太好区分 变量 和 字符串 的定义。可以通过设置setResultsName别名来区分,但是效果不是很好。