摘要:
讨论教材语料库的建设、应用。结合具体研发成果,从教材标准研制、教材评估与难度测定、测评软件研制和应用等方面,考察语料库对汉语教学、习得研究的促进作用。通过案例分析,展示教材语料库与其他语料库的配合使用。针对教材语料库的问题,提出解决方案,强调语料库在教学上的应用效果和转化效率。
引言:
语料库概念
语料库开发、研究现状:建库少、应用少、研究少。
建设:
教材库收录17800余册
语料库建设:
(1)选定首批入库3212册/种汉语教材。
(2)文本扫描/OCR处理
(3)标注字、词,在线检索系统。
(4)制成指南针等分析软件,实现:字词分析、语料定级、评估功能。
应用:
(一)研制编写指南(指南1 分级汉字表2 分级词汇表 3 分级语法表 4分类文化项目表)
(二)教材评估与难度测定(周小兵、陈楠,词汇研究;周小兵、程燕,成语研究‘;周小兵,文化研究;周小兵、刘娅莉,词汇难度研究)
(三)测评软件研制与使用(指南针,以语料库中课文语料为数据基础,提供汉语文本语料的难度评估与改编反馈)提供文本定级、改编反馈、例句查询三大功能。
个人感悟:(重要!!!)本人的课程论文中会提及相关语法点在教材中的展示情况,可使用此查询功能。提及的“X得很”语法点级别,可使用3 分级语法表
(四)教材语料库与其他语料库的配合使用
目标语语料库+学习者母语语料库+中介语语料库 以“见面”为例
1. 中介语 语料库中“见面”的使用情况 总结出ABCDEF六类(“离”状态+“合”状态)
2. 母语语料库 抽样1000条,六类的使用频率
对比二者,发现,“见面”离的状态,二语者频率12.7%,远低于母语者的34.2%
个人感悟:(重要!!!这一部分对比两语料库的方法,本人习得课程论文可用。本人目前的论文,从中介语料库中分出两类X得很,现已统计出各自频率。我应该在CCL语料库抽样1000条,去看这1000条里两类的使用频率。但有个问题,目前我的分类太粗略,只有X形得很,与X动得很两类。我应该继续分类,(单音节形容词、双音节形容词;心理动词、普通动词……)因为据个人猜测,母语者的X形得很的频率,肯定高于X动得很。这个数字与中介语的应该是没有差异的。所以这种粗略的分类,看不出学习者与母语者之间的差距。只有继续细分才行。)
3. 双语语料库,考察汉外对比。探讨二语者偏误原因,是否跟母语有关。
个人感悟:(其实这一部分,就是自己论文里的汉外对比。目前本人论文还比较凌乱,看起来没有什么逻辑,只是堆砌)
4. 使用教材语料库,看教材如何展示 上述分类。据此分析教材是否存在解释不够的现象。
(个人感悟:重要!这个方法,一定要加进自己的课程论文中)
问题与展望
阐释目前的问题:
类别少、容量少,加工处理不够。
为此应该做以下工作:
1. 加大建设 2 深加工 3 加强多种语料库综合使用功能的开发
和国外教材语料库的应用相比,国内教材语料库的应用不够。国外已初步形成从词汇到语法的各类应用,应用产品以词典、手机APP、教材等方式呈现,因此国内仍有所作为。