zzzzzz_ - 简书

发简信

zzzzzz_

26
关注
6
粉丝
7
文章
5306

字数
7

收获喜欢
1

总资产

IP属地：湖北

zzzzzz_

感谢作者！帮我解决了两个死活找不到原因的问题

使用jieba和gensim模块判断文本相似度
本文重新整理的更详细规范的介绍见这里判断文本的相似度在很多地方很有用，比如在爬虫中判断多篇已爬取的文章是否相似，只对不同文章进一步处理可以大大提高效率。在Python中，可...

碎冰op
5220 4 14
zzzzzz_

使用jieba和gensim模块判断文本相似度
本文重新整理的更详细规范的介绍见这里判断文本的相似度在很多地方很有用，比如在爬虫中判断多篇已爬取的文章是否相似，只对不同文章进一步处理可以大大提高效率。在Python中，可...

碎冰op
5220 4 14

zzzzzz_

Stack_empty
写了 83397 字，被 1040 人关注，获得了 1010 个喜欢

欢迎关注我的个人公众号SimpleAI.<br>以后文章会在微信公众号上更新。
zzzzzz_

【DL笔记6】从此明白了卷积神经网络（CNN）
初识卷积神经网络（CNN）从今天起，正式开始讲解卷积神经网络。这是一种曾经让我无论如何也无法弄明白的东西，主要是名字就太“高级”了，网上的各种各样的文章来介绍“什么是卷积”...

Stack_empty
83639 47 238 4
zzzzzz_

Pythoner集中营
Andrew_liu 编，864 篇文章，32403 人关注

Pythoner的集中营, 收集关于Python的各种知识教程. 推荐文章和系列阅读: 1. Python 零基础入门资料整理（更新版） http://www.jianshu.com/p/9c02dade7e90 2. Python 零基础入门资料整理 http://www.jianshu.com/p/5eee782b8627 3. Python 从入门到高手系列视频教程 http://www.jianshu.com/p/93085280e4a4 4. Python学习网络资源整理 http://www.jianshu.com/p/fe0e5a515696 5. Python爬虫学习系列专题 http://www.jianshu.com/notebooks/255245/latest 6. Python Django博客开发专题 http://www.jianshu.com/notebooks/293635/latest PS: 另招Python热心管理员
zzzzzz_

菜菜不太菜
写了 19333 字，被 28 人关注，获得了 31 个喜欢
zzzzzz_

愿每一个想成为王妃的你，都能成为自己的王凯
名人屋十年前的某个凡人，就是十年后的那个名人有一天，一个从小喜欢表演的男生，高中刚毕业就被父母安排进了书店工作；有一天，男生偷着去试镜，被导演问毕业于哪个艺术类大学，他无...

十年后
7621 30 167

zzzzzz_

利用API获取豆瓣即将上映的20条电影信息
利用爬虫爬取网页数据主要有两种方式：第一种是直接爬取HTML网页内容，它的好处是可以自定义爬取的内容，弊端是很多时候这种行为是被网站禁止的，并且需要根据网站的结构来编写代码。...

2005 0 1
zzzzzz_

SandyMeow
写了 7762 字，被 8 人关注，获得了 5 个喜欢
zzzzzz_

弹弹弹弹走于思琦
写了 8847 字，被 6 人关注，获得了 4 个喜欢
zzzzzz_

骆落啊
写了 17162 字，被 17 人关注，获得了 15 个喜欢
zzzzzz_

Python分词组件——jieba使用报告
一、安装jiaba jieba库的下载地址（支持Python2和Python3）：https://github.com/fxsjy/jieba下载jieba包后，打开命令行，...

1494 1 2

zzzzzz_

Apache Tika学习使用报告
一、Tika 简介 1. 基本介绍 Tika是一个具有内置解析器用于处理各种文档类型的程序框架。该框架公布了标准的API供应用程序调用并完成从文档中提取文本和元数据，内置解析...

1736 1 1
zzzzzz_

scrapy爬取豆瓣图书TOP250实验报告
一、实验目的实验对象：豆瓣图书 Top 250 （https://book.douban.com/top250）实验内容：用scrapy框架编写爬虫，尝试用xpath和cs...

5438 0 1
zzzzzz_

亚马逊 robots.txt 文件解析
一、robots协议 robots协议，也称爬虫协议，网站会在 robots.txt 文件中声明哪些内容可以爬取，哪些内容不能爬取。robots.txt 放在网站根目录下。举...

967 0 0
zzzzzz_

㭍葉
写了 14755 字，被 56 人关注，获得了 98 个喜欢
zzzzzz_

安装使用xshell、xftp及升级腾讯云centos7.2下python到2.7.14版本
一. 安装使用xshell和xftp 1. 软件获取这两个软件官方均有供个人使用的免费版本，下载时需要填写自己的邮箱与姓名，然后下载链接会发送到填写的邮箱里面。官方下载地址...

菜菜不太菜
799 1 10

zzzzzz_

沐弘晨
写了 680780 字，被 30370 人关注，获得了 6064 个喜欢

所有作品，均为沐弘晨原创，未经授权，谢绝转载，侵权必究！<br><br>本人70后水瓶座独居女性一枚，天生懒散，不爱运动。工作之余，看书写文，是最大的乐趣。<br>
zzzzzz_

静静的白莲
写了 191934 字，被 94718 人关注，获得了 17585 个喜欢

书写岁月，化繁为简，记录生活的点滴。我的故乡我的魂，我的美食我的文。如需转载，请联系本人授权。