240 发简信
IP属地:湖北
  • 120
    如何用 Python 和 BERT 做中文文本二元分类?

    兴奋 去年, Google 的 BERT 模型一发布出来,我就很兴奋。 因为我当时正在用 fast.ai 的 ULMfit 做自然语言分类任务(还专门写了《如何用 Pytho...

  • 文本特征提取

    文本特征提取 文本特征提取: 将文本数据转化成特征向量的过程 比较常用的文本特征表示法为词袋法 词袋法: 不考虑词语的出现顺序,每个出现过的单词单独作为一列特征 这些不重复的...

  • R语言学习笔记-文本挖掘之字符处理(1)

    在挖掘分析的过程当中对字符串的处理是极为重要的,且出现也较为频繁,R语言作为当前最为流行的开源数据分析和可视化平台,虽然文本的处理并不是它的强项, 但是R语言还是包含大量的字...

  • 120
    第2章 利用用户行为数据

    基于用户行为分析的推荐算法是个性化推荐系统的重要算法,学术界一般将这种类型的算法 称为协同过滤算法。顾名思义,协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使 自己的...