R中的一切皆对象,R表达式也是R对象。这意味着我们可以从语法上解析R表达式,或者部分地执行R表达式,来观察R是如何解释它们的。这对于了解R的工作机制或者调试R代码十分有用。
R解释器在执行语句时要经过几个步骤。第一步是从语法上解析语句,将其转化为合适的函数形式。我们可以查看R解释器是如何执行一个给定的表达式的。以下面代码片段为例:
> x = 1
> if (x > 1) "orange" else "apple"
[1] "apple"
我们可以用quote()
函数演示上述表达式的解析过程。该函数会从语法上解析它的参数,但并不执行。通过使用quote
,R表达式会返回一个语言对象。
> x = 1
> if (x > 1) "orange" else "apple"
[1] "apple"
> typeof(quote(if (x > 1) "orange" else "apple"))
[1] "language"
> quote(if (x > 1) "orange" else "apple")
if (x > 1) "orange" else "apple"
针对语言对象的print
函数返回的信息量非常有限,我们可以先将语言对象转化为列表。通过观察列表形式展示的语言对象,我们就可以看出来R是如何执行一个表达式的了。
下面是这个表达式的语法树(parse tree)。
> as(quote(if (x > 1) "orange" else "apple"),"list")
[[1]]
`if`
[[2]]
x > 1
[[3]]
[1] "orange"
[[4]]
[1] "apple"
我们可以将typeof
函数应用到列表中的所有元素上,以查看每个对象在语法树中的类型。
> lapply(as(quote(if (x > 1) "orange" else "apple"),"list"),typeof)
[[1]]
[1] "symbol"
[[2]]
[1] "language"
[[3]]
[1] "character"
[[4]]
[1] "character"
# 语句可以写为lapply(quote(if (x > 1) "orange" else "apple"),typeof),即忽略as函数,因为R会自动将语言对象强制转换为列表
可以看到if-then
语句的一些片段没有包含在解析后的表达式中(尤其是else关键字)。要注意,列表中的第一个项目是一个符号。在本例中,该符号指向的是if
函数。因此,虽然if-then
语句的语法与函数命令不同,但R语句分析器会将表达式翻译为函数命令,再执行表达式。函数名是第一个项目,剩下的项目是函数的参数。
对于常数而言,返回的列表中只有一个项目:
> as.list(quote(1))
[[1]]
[1] 1
通过使用quote
函数,我们发现,R语言中的很多结构只是函数命令的语法糖。
例如,假设我们要找向量x
的第二个元素。标准的做法是使用表达式x[2]
;还有另一种做法是把表达式替换成函数`[`(x,2)。这两种方式是等效的。
> x <- seq(1,5)
> x
[1] 1 2 3 4 5
> as.list(quote(x[2]))
[[1]]
`[`
[[2]]
x
[[3]]
[1] 2
> as.list(quote(`[`(x,2)))
[[1]]
`[`
[[2]]
x
[[3]]
[1] 2
deparse
函数可以将语法树转化回合适格式的R代码。
> deparse(quote(`[`(x,2)))
[1] "x[2]"
> deparse(quote(x[2]))
[1] "x[2]"
学习自《R核心技术手册》