语言学中的“冗余”
这本书里我觉得很有意思,也是我之前没有特别注意过的内容是“冗余”。书中给出的例子:
英语中的音标并非任意组合的,如[sk]可以出现在词首(skin或skill),而[ks]则不行。由于可能的组合数量太多,因此并不是每个都有意义,比如sick和zip各取部分组成的zick就没有意义。值得注意的是,这些较小的单位本身并没有意义。sick、zip等单词中都包含同样的元音[I](i),但它的作用仅仅在于区别于其他单词,如sick有别于[sɑk](sock),kiss不同于(cuss),billow区别于(bellow)等等。通常,整个单词的意义与某个元音或辅音没有任何关系。
我的理解是,本作中说的“冗余”就是我们可以拿来构成语言的材料多过我们的语言实际上需要的,并不是每个材料都被充分利用了。
这里说的语言材料不仅仅是字母或者汉字,还包括其组合形式。
书中给出的是英文的例子,26个字母,不同个数的字母组合,其实是可以创造出多少不同的单词来啊!比如两个字母长的词,就可以是:
aa,ab,ac,...,ba,bb,bc,…,za,zb, zc,…zx,zy,zz.
然而我们可以看到,这其中很多是在现有的英语单词中不存在的,这些本可以拿来构成单词的材料,却没有被用来构成单词,而是被抛在一边,放置不用,我想这就是作者说的“冗余”。
放到汉语里,就算是三四千个常用字,可以组成的词语也是很多的。按照4000个汉字来算,不算一字词、三字词等,仅仅算两字词,用4000字可以组成的两字词可能的组合数量为:4000×3999=15,996,000,即四千个汉字可以生成接近一千六百万个两字词。如果考虑上三字词,那么会在数量级上再上几个台阶。
再来看一个数据:中国社会科学院语言研究所词典编辑室编、商务印书馆2005年出版的第五版《现代汉语词典》,收词6.5万条。
放宽条件来计算,如果我们需要使用的词大概为10万个,那么只要充分利用汉字组合关系,连1000个汉字都不需要。而实际情况是,我们可不只这几千个常用字呢。这是不是就是所谓“冗余”呢?
语言并不是在精确计算的情况下产生的,当然不可能一个萝卜一个坑地把一切资源充分利用啦。
作者认为,言语结构必然是“冗余的”,并给了我们一个令人信服的解释:
如果工程师建桥时使用的材料多于所需最少材料的话,那么桥的物理结构就是冗余的。然而,冗余也有优点,如果某个部分破裂或爆裂,桥也不会倒塌。语言冗余的长处是言语几乎不会被误解。
为了说明这个观点,作者向我们展示了一种认为生造的“语言”:
若某词指代具体物体,则可以以n打头;若指代抽象概念,则可以以m打头。第一个元音e出现在表示植物的单词中,接下来是b,说明这些植物是可食的。下图中所有单词均以neb开头,区别在于表示一般意义的蔬菜(a)和水果(e),表示鳞茎蔬菜(p)和绿叶蔬菜(t),表示无核水果(s)和有核水果(f),只有末尾的元音才能将不同单词区分开来。
这是按照科学、经济的原则造出来的词,如果实际使用这种语言,会碰到什么问题呢?
由于不同人的口音是有区别,对于不同音素是否相同的敏感度也不一样,所以就会造成上图中的很多词语在实际交流中会出现混淆,使得交流双方产生交流障碍。比如,如果你对p和t不敏感,那么你就不太分得清韭菜和菠菜,而且这两种菜还是出现在同样的语境中的。
我们现在就算说英语,也有很多人不太分得清beach 和 bitch,不是吗?不过起码通过语境,还是分得清的。
语言与思维
语言与思维这个角度也是很有意思。
记得以前看书,说到语言与思维,会提到的例子有颜色。不同地区的人可能由于其生活环境的原因,对颜色的感知不一样,比如有的语言里可能没有紫色、橙色,有的语言里会区分特别多的绿色(忘记具体什么颜色了,只是大概举例),如果一个的语言里没有橙色,那橙色就可能是被归入到红色或者黄色里。
本作中举了一个部族语言的例子:
他们生活的地理环境是从南部陡峭山区延伸至北部山谷,于是这里的人们对于上坡、下坡等方位特别敏感,其语言也发展出了相应的词汇,与其他语言没有意义一一对应的词语。可以假设有表示如下意义的词:处于山南面下坡过程中,处于山南面上坡过程中,处于山北门上坡至1/3处,在汉语里就没有与之相对的。
今天是1000天行动计划的第一天,阅读《牛津通识读本:缤纷的语言学》,作者(英国)P.H.马修斯著;戚焱译。今天完成了本书的50%。在此打卡记录,并不为写文章或所谓输出。