句法语义分析的作用:
很多应用需要考虑词语之间的组合关系,那么句法语义分析就很好的刻画了这种关系。
其研究点:按照某种文法规则将句子从词语的序列形式转化为图结构。(通常为树结构)
刻画了句子内部的句法语义关系,(如主谓宾,施事受事等)
所以对于句法语义分析来讲:
其核心要素就是文法,数据,算法
文法—句子的某种分析结构或者说规则,从最开始的短语结构,到句子依存到通用依存到语义依存。
短语结构:动词短语、名词短语等
句法依存:主谓宾等句子成分
通用句法依存:针对不同语言的标注不一样制定的一个规则,直接标注实词之间的关系。
语义依存:标注的实施者和受施者
数据—理解比较直观
算法—基于图的模型,基于转移的方法,深度学习的方法
句法依存的作用:
作为抽取规则:
eg.根据句法规则抽取评价搭配,<评价对象,评价表达>
当然直接的这种分析往往不会太准确,尤其是对于一些长句子比较复杂。所以,应当使用一些句子压缩的方法,eg.抽取掉一些口语化的表达等。
作为输入特征,语义角色标注,关系抽取:
句法的路径特征很重要但是往往很稀疏,所以一般使用一些LSTM的方法去进行编码表示。
作为输入结构:
在nlp中,用的比价多的网络结构是rnn,但是rnn是一个词一个词的读入句子,不能很好的刻画句子中词语之间的关系,所以就出现了递归神经网络,和tree_lstm的网络结构,可以更好的刻画句子中词语之间的关系。可以用依存分析的结果作为网络的输入结构。
在现在的深度学习中,依存句法分析还有什么重要的作用:
对于数据量比较够的应用,模型见的的case比较多,可能就不需要句法语义分析的结果,因为句法语义分析的结果本身就不是%100准确,这样反而会引入一些噪音。
但是,对于一些数据量不够大的应用,尤其是分析长距离的词之间的关系的时候,句法分析还是很有用的,它相当于拉近了词对之间的距离。