Avatar notebook default
4篇文章 · 2708字 · 1人关注
  • NLP基本方法:TF-IDF原理及应用

    一、TF-IDF原理 1. 什么是TF-IDF TF-IDF(Term Frequency-Inverse Document Frequency...

  • Doc2Vec论文及实战

    第一部分:论文 最近读了一遍Doc2Vec原文,整篇文章思路清晰明了,建议在读博客之前先看一遍文章,因为文章中将各个部分讲的很详细。 这里只记录...

  • 词性标注-隐马尔科夫模型应用

    问题的提出 已知:词序列: 寻找词性序列: 使得条件概率最大: 解:(忽略词序列概率,因为没用) 图示: 具体实现就是:动态规划-维特比算法 [...

  • Bag-of-words模型简介

    Bag-of-words模型是信息检索领域常用的文档表示方法。在信息检索中,BOW模型假定对于一个文档,忽略它的单词顺序和语法、句法等要素,将其...

文集作者