MITIE 实现底层算法和原理:
MITIE在chatbot 框架rasa中被广泛应用,但是rasa和原始的mitie均没有介绍mitie的底层原理是什么。我也是找了很多资料才看到了一片介绍mitie底层算法。看到的求大家点个赞,哈哈哈。
1.NER
实体提取
ner使用dlib库,这个库是c++的机器学习库,由于ner是seq to seq model。mitie中ner使用structural_sequence_labeling_trainer.
实现的细节见[1]。这种方法结合和HMM 和SVM。相比单纯的HMM,这种方法基于最大margin 标准。相比于CRF或者最大熵的HMM,这种方法有很多优势:
1.可以通过核函数学习非线性的判断关系
2.可以处理overlapping features.
Reference :
Hidden Markov Support Vector Machines by Y. Altun, I. Tsochantaridis, T. Hofmann https://www.aaai.org/Papers/ICML/2003/ICML03-004.pdf
[Name Entity Recognition and Binary Relation Detection for News Query]https://pdfs.semanticscholar.org/071c/66450d977f8f5d6feb73b09b3be7b64db333.pdf