
3篇文章 · 4343字 · 3人关注
Word2vec简介 Word2Vec是由Google的Mikolov等人提出的一个词向量计算模型。 输入:大量已分词的文本 输出:用一个稠密向...
目的 给定一个或多个搜索词,如“高血压 患者”,从已有的若干篇文本中找出最相关的(n篇)文本。 理论知识 文本检索(text retrieve)...
步骤 分词、去停用词 词袋模型向量化文本 TF-IDF模型向量化文本 LSI模型向量化文本 计算相似度 理论知识 两篇中文文本,如何计算相似度?...
文集作者