240 发简信
IP属地:山西
  • Resize,w 360,h 240
    EX08——金庸小说全文索引

    1.实验目的 找到金庸的14部小说,并从中找出金庸小说哪些地方提到传奇人物“独孤求败” 2.实验环境 Windows 10;solr版本:7.3...

  • Resize,w 360,h 240
    EX07——API调用练习

    收集网络资源的时我们很多时候会使用爬虫技术,随着技术的发展,恶意的爬虫模拟人的行为和浏览器的行为进行信息爬取,有时往往给被爬网站带来诸多麻烦,爬...

  • Resize,w 360,h 240
    《我不是药神》短评关键词提取及词云制作

    环境:Windows 10、 java version "1.8.0_144" 、 Python 3.6.3、 jieba 0.39 方法一:...

  • 《Information filtering and information retrieval: Two sides of the same coin? 》读书笔记

    《Information filtering and information retrieval: Two sides of the same ...

  • Resize,w 360,h 240
    Google历年愚人节idea

    从 2000 年的 4 月 1 日开始,Google 每年都会在愚人节这天给世界开个小玩笑,每年愚人节的时候,他们的愚人节idea也逐渐成为了全...

  • Resize,w 360,h 240
    PW06——分词练习

    在接下来的分词练习中将使用到四川大学公共管理学院的一篇新闻进行练习,文本如下: 为贯彻落实党的十九大精神,不断提升党建工作科学化水平,5月23日...

  • Resize,w 360,h 240
    Apache Tika学习

    一、Tika简介 Tika是Apache下开源的文档内容解析工具,支持多种文档格式(如PPT、XLS、PDF、DOCX、JSON……)。Tika...

  • Resize,w 360,h 240
    PW05——Scrapy抓取热门标签下的名人名言

    一、抓取名人名言 名人名言的地址:http://quotes.toscrape.com/1.查看网页代码,获取待抓取元素的css:(1)打开页面...

  • Resize,w 360,h 240
    scrapy采集dmoz网站Home目录下的信息

    一、实验背景 此次实验要求我们爬取DMOZ下的Home目录(http://www.dmoztools.net/Home/)的所有子目录.Home...