本文主要参考文献1, 主要目的是记录和简化核心规则,并根据实践提出了一些实践中的方案。 新词发现规则 新词发现主要依赖3个重要的度量,分别称之为...
情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion m...
由于工作需要,临时了解到一个Faiss,据说是一款较好的找相似图的工具,这里主要记录下我安装cpu版本的一个过程。主要参考了reference1...
本系列中文十年回顾中讲了时至今日,中文分词中对效果影响最大的是未登录词的识别。今天要讲的就是基于HMM算法的中文分词,可以用来发掘为登录词。 从...
中文分词是中文自然语言处理中十分重要的基础性工作,基本后续的一切工作都依赖分词。本文主要探讨MMSEG这个分词系统;因为这个的效率十分不错,准确...
中文分词四个难题 词的清晰定义 分词和理解熟先熟后 分词歧义消解 未登录词 词的清晰界定 规范+词表 到分词语料库的词语定义过程;语料标注的质量...
TensorBoard简介 TensorFlow 的计算过程其实是一个黑盒过程,为了便于使用者对TensorFlow程序的理解,调试和优化 ,T...
TensorFlow支持各种异构的平台,支持多CPU/GPU,服务器,移动设备,具有良好的跨平台的特性;TensorFlow的系统结构以C AP...
TensorFlow 简介 TensorFlow是由Jeff Dean领头的谷歌大脑团队基于谷歌内部第一代深度学习系统DistBelief改进而...