240 发简信
IP属地:上海
  • 楼主好,百度百科的语料库是怎么获得的?爬虫抓的吗?

    268G+训练好的word2vec模型(中文词向量)

      从网上了解到,很多人缺少大语料训练的word2vec模型,在此分享下使用268G+语料训练好的word2vec模型。 训练语料: 百度百科800w+条,26G+ 搜狐新闻...