国内用CRF做中文分词的开源系统的主要是哈工大的HITLTP语言技术平台,该项目的源代码可以从https://github.com/HIT-SCIR/ltp/releases...

IP属地:江苏
国内用CRF做中文分词的开源系统的主要是哈工大的HITLTP语言技术平台,该项目的源代码可以从https://github.com/HIT-SCIR/ltp/releases...
sklearn里集成了一个数据集,里面有20类新闻的文本数据,而朴素贝叶斯算法在文本分类的应用场景中十分实用。今天就用naive_bayes来练习一下文本分类。上码:...