240 发简信
IP属地:浙江
  • 新词发现规则

    本文主要参考文献1, 主要目的是记录和简化核心规则,并根据实践提出了一些实践中的方案。 新词发现规则 新词发现主要依赖3个重要的度量,分别称之为...

  • 情感分类方法简介

    情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion m...

  • Faiss cpu 版本安装记

    由于工作需要,临时了解到一个Faiss,据说是一款较好的找相似图的工具,这里主要记录下我安装cpu版本的一个过程。主要参考了reference1...

  • Resize,w 360,h 240
    中文分词算法之HMM算法

    本系列中文十年回顾中讲了时至今日,中文分词中对效果影响最大的是未登录词的识别。今天要讲的就是基于HMM算法的中文分词,可以用来发掘为登录词。 从...

  • 中文分词算法初探之最大匹配

    中文分词是中文自然语言处理中十分重要的基础性工作,基本后续的一切工作都依赖分词。本文主要探讨MMSEG这个分词系统;因为这个的效率十分不错,准确...

  • 中文分词十年回顾

    中文分词四个难题 词的清晰定义 分词和理解熟先熟后 分词歧义消解 未登录词 词的清晰界定 规范+词表 到分词语料库的词语定义过程;语料标注的质量...

  • Resize,w 360,h 240
    TensorFlow 学习之三TensorBoard实战

    TensorBoard简介 TensorFlow 的计算过程其实是一个黑盒过程,为了便于使用者对TensorFlow程序的理解,调试和优化 ,T...

  • Resize,w 360,h 240
    TensorFlow 学习之二基础架构

    TensorFlow支持各种异构的平台,支持多CPU/GPU,服务器,移动设备,具有良好的跨平台的特性;TensorFlow的系统结构以C AP...

  • Resize,w 360,h 240
    Tensorflow 之一 核心基础篇

    TensorFlow 简介 TensorFlow是由Jeff Dean领头的谷歌大脑团队基于谷歌内部第一代深度学习系统DistBelief改进而...