花了不少时间决定了一个方向:自然语言处理。对这个很感兴趣
目前通读了《统计自然语言处理》,瞄了《自然语言处理综论》
这个方向貌似和机器学习(比较高大上)有点关系。
需要的基础:计算机基础算法(广度,深度搜索, 动态规划,自动机, 某种语言)
语言学基础(语法,语义,歧义)
概率基础(熵,期望,方差,互信息,贝叶斯)
相似度计算
对应的专业名字:
分词:把文章分成词语(中文中使用)
搭配:语法单词的搭配(英语中使用)
歧义消除:句子有歧义,需要找到合适的意思
词性标注:一句话中单词的属性需要分类标记。
指代消解:根据上文消除她,我们等单词的意思
未登录词:没有统计到的词语
概率名词:熵,期望,方差,互信息,相似度计算,准确率,召回率。
算法:分类,聚类,词对齐,决策树,knn,神经网络,模拟退火,遗传算法,马尔可夫模型,viterbi算法。中文分词技术。
革命尚未成功,同志仍需努力。