岁月淡如水 - 简书

发简信

岁月淡如水

2
关注
9
粉丝
11
文章
7159

字数
28

收获喜欢
2

总资产

IP属地：上海

岁月淡如水

银色尘埃010
写了 44921 字，被 53 人关注，获得了 77 个喜欢

复旦大学研究生在读，目前对推荐系统与深度学习比较感兴趣，了解一点NLP、机器学习相关。
岁月淡如水

LDA主题模型Python源码实现

1355 0 0

岁月淡如水

使用别人训练好的词向量
结果如下：[ 3.5057108 0.23193994 0.19731355 0.61829925 1.3409204 -1.11813625.9609795 ...

2409 0 1
岁月淡如水

使用gensim 框架实现 LDA主题模型
0、原理整体过程就是：首先拿到文档集合，使用分词工具进行分词，得到词组序列；第二步为每个词语分配ID，既corpora.Dictionary；分配好ID后，整理出各个词语的...

9668 0 10
岁月淡如水

Beta分布
Beta分布用一句话来说，beta分布可以看作一个概率的概率分布，当你不知道一个东西的具体概率是多少时，它可以给出了所有概率出现的可能性大小。举一个简单的例子，熟悉棒球运...

4923 0 4
岁月淡如水

超图随机游走的关键词提取
1什么是超图？图模型很好理解，由若干条边连接定点组成的图，我们称之为图。那么什么是超图呢？超图和图最大的不同是：一条边可以连接多个定点，图1（b）所示就是超图。 2随机游走...

1115 0 1
岁月淡如水

王树义
写了 532926 字，被 81263 人关注，获得了 12973 个喜欢

终身学习者、大学教师。稍微懂一点儿写作、演讲、Python和机器学习。欢迎微信关注并置顶我的公众号“玉树芝兰”(nkwangshuyi)。我已委托“维权骑士”（rightknights.com）为我的文章进行维权行动。

岁月淡如水

（转）LDA处理文档主题分布及分词、词频、tfidf计算
这篇文章主要是讲述如何通过LDA处理文本内容TXT，并计算其文档主题分布，主要是核心代码为主。其中LDA入门知识介绍参考这篇文章，包括安装及用法：[python] LDA处理...

5389 0 6
岁月淡如水

文本关键词提取算法-TextRank
TextRank是一种用来做关键词提取的算法，也可以用于提取短语和自动摘要。因为TextRank是基于PageRank的，所以首先简要介绍下PageRank算法。 1.Pag...

5697 0 3
岁月淡如水

TF-IDF基本概念和原理
1、TF-IDF基本概念 TF-IDF是Term Frequency - Inverse Document Frequency的缩写，即“词频-逆文本频率”。它由两部...

7017 0 1
岁月淡如水

Scrapy爬虫模拟登陆豆瓣
首先还是创建爬虫，其命令如下：模拟登陆豆瓣的关键点1、分析真实post地址，寻找formdata；2、模拟post，构造类似的formdata；3、处理验证码。豆瓣登陆地址...

1243 1 1
岁月淡如水

从零开始实现scrapy爬取智联招聘的岗位信息-3
根据我们对当个招聘岗位的分析，我们发现我们需要爬取的数据主要有八个，分别是：职位月薪、工作地点、发布日期、工作性质、工作经验、最低学历、招聘人数、职位类别。所以我们首先在It...

1680 0 0

岁月淡如水

从零开始实现scrapy爬取智联招聘的岗位信息-2
在上一篇文章中，主要讲解了anaconda和scrapy的安装，接下来开始动手写爬虫。scrapy目前还只能在命令行中新建爬虫、执行爬虫，一开始可能并不习惯。下面开始进入an...

934 0 0
岁月淡如水

自然科普
刷牙喝凉白开编，7411 篇文章，2026906 人关注

自然科普专题收录与推荐标准请参考: https://www.jianshu.com/p/e38bf5116797 如因为一些可改动的问题被拒稿，请在修改后简信联系主编：刷牙喝凉白开，主编审核后将收录符合要求的文章；如在了解收录标准后仍对拒稿有异议，也可简信联系主编。《自然科普月刊》将恢复发刊，欢迎大家踊跃投稿，投稿可发链接给主编。专题长期招募副编。副编招募信息见下： https://www.jianshu.com/p/9d116265ccc1

暂无个人介绍