240 投稿
收录了3篇文章 · 2人关注
  • 03.数据预处理之文本处理——hanlp分词

    hanlp分词 介绍 HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能...

  • Resize,w 360,h 240
    01.数据预处理之抽取文本信息

    常见数据类型和数据采集 结构化数据 结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表...

  • 02.数据预处理之清洗文本信息

    准备30万条新闻数据 编号新闻类别新闻数量(条)1财经370982教育419633科技655344时政630865体育655346娱乐65534...