240 发简信
IP属地:广东
  • 安装TA_Lib linux

    第一步 获取源码库sudo wget http://prdownloads.sourceforge.net/ta-lib/ta-lib-0.4....

  • scrapy通用爬虫

    什么是scrapy通用爬虫 CrawlSpider它是Spider的派生类,Spider类的设计原则是只爬取start_url列表中的网页,而C...

  • Resize,w 360,h 240
    Scrapy 框架

    Scrapy 框架 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。框架的力量,用户只需要...

  • 线程、进程、协程

    线程 什么是线程 线程,有时被称为轻量级进程(Lightweight Process,LWP),是程序执行流的最小单元。一个标准的线程由线程ID...

  • XPath选择器介绍(Xpath与lxml)

    什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和...

  • parse模块

    url.parse :定义了url的标准接口,实现url的各种抽取parse模块的使用:url的解析,合并,编码,解码 使用时需导入 urlpa...

  • urllib

    urllib库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网...

  • 爬虫基础

    大数据时代:数据如何产生? 1、大的公司打的企业:通过用户产生的数据2、大的数据平台:通过收集或者和其他的企业或者公司合作3、国家政府大的机构:...

  • 模板继承、转义

    模板继承 模板继承和类的继承含义是一样的,主要是为了提高代码重用,减轻开发人员的工作量。 典型应用:网站的头部、尾部信息。 父模板 如果发现在多...