今天来讲解一个非常经典的词向量模型word2vec并介绍一个非常强大的库gensim。先贴一段代码。
from gensim.models import Word2Vec
en_wiki_word2vec_model = Word2Vec.load('wiki.zh.text.model')
test_words = ['苹果', '数学', '学术', '白痴', '篮球']
for i in range(5):
res = wn_wiki_word2vec_model.most_similar(test_words[i])
print(test_words[i])
print(res)
n-gram
logistic回归用于二分类,挑选出重要的词。
极大似然函数
Negative Sampling负采样