今天去了我们最喜欢的斯坦福大学 先去 visitor center 要了个地图,上面有一条标黄的线是比较推荐的路线,沿着它可以看到所有著名的景点...
今天去了我们最喜欢的斯坦福大学 先去 visitor center 要了个地图,上面有一条标黄的线是比较推荐的路线,沿着它可以看到所有著名的景点...
今天开始一起学习中文自然语言处理 中文NLP一般流程 1. 获取语料 语料,是NLP任务所研究的内容 通常用一个文本集合作为语料库(Corp...
中文分词 中文分词的工具有: 中科院计算所 NLPIR、哈工大 LTP、清华大学 THULAC 、斯坦福分词器、Hanlp 分词器、jieba...
提取,意思是从文本里面把意义最相关的词语抽取出来。 在文献检索、自动文摘、文本聚类/分类等任务中有重要的应用 主要有2种提取方法 1. 关键词...
文本数据可视化有下面三种 1. 基于文本内容的可视化 基于词频的可视化和基于词汇分布的可视化 常用的有词云、分布图和 Document Ca...
文本数据如何转换成计算机能够计算的数据 1. 词袋模型(Bag of Words Model) 把文本(段落或者文档)看作无序的集合,忽略语法...
中文短文本分类 文本分类是一种有监督学习 例如,输入一条数据,能够判断事情的主体是谁 主要步骤为: 1. 加载数据 2. 数据预处理 分词...
今天是大年三十儿,祝各位简友新春快乐,心想事成,万事如意!今天也继续来学一波nlp技术。 HMM 和 CRF 常被用于分词、句法分析、命名实体识...
序列模型 语言模型 N-gram 前面的词袋模型(Bag-of-Words,BoW),没有考虑每个词的顺序 有些句子即使把词的顺序打乱,还是...
推荐系统 推荐系统 用途 对用户而言:可以找到感兴趣的东西,发现新鲜的事物。 对商家而言:可以提供个性化服务,提高信任度和粘性,增加营...
专题公告
人工智能、算法、机器学习