第二章 自然语言处理 --- 从规则到统计
一、概念和主题
1,语言的数学本质:我们把一个要表达的意思,通过某种语言的一句话表达出来;如果对方懂得这门语言,他或者她就可以用这门语言的解码方法获得说话人要表达的意思。
2,图灵测试:图灵博士提出了一种验证机器是否有智能的方法,那就是,让人和机器交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了。
3,规则
4,统计
二、延伸阅读
1,1956年夏天的“达特茅斯夏季人工智能研究会议”:约翰·麦卡锡、马文·明斯基、罗切斯特、香农、赫伯·特西蒙、艾伦纽维尔等。
2,Google基于统计方法的翻译系统。
3,基于统计的自然语言处理的先驱:彼得·布朗、贾里尼克、约翰·霍普金斯、米奇·马库斯、吴军等。
4,文艺复兴技术公司
三、备注
1,基于统计的自然语言处理方法,在数学模型上和通信是想通的,甚至就是相同的。
2,两个认知方面的问题,一是计算机能否处理自然语言;二是如果能,那么它处理自然语言的方法是否和人类一样。答案是YES。
3,在计算机学科中,图灵奖得主高德纳提出了用计算复杂度来衡量算法的耗时。
4,自然语言处理的研究设计到了,机器翻译、语音识别、文本到数据库自动生成、数据挖掘、知识的获取等。