240 发简信
IP属地:陕西
  • lxml模块

    Python有许多可以读写常见的HTML和XML格式数据的库,包括lxml、Beautiful Soup和html5lib。lxml的速度比较快...

  • json模块

    JSON(JavaScript Object Notation的简称)已经成为通过HTTP请求在Web浏览器和其他应用程序之间发送数据的标准格式...

  • Resize,w 360,h 240
    csv模块

    大部分存储在磁盘上的表格型数据都能用pandas.read_table进行加载。然而,有时还是需要做一些手工处理。由于接收到含有畸形行的文件而使...

  • Resize,w 360,h 240
    pandas库之读写文本格式的数据

    pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。表6-1对它们进行了总结,其中read_csv和read_table可...

  • pandas库之唯一值、值计数以及成员资格

    还有一类方法可以从一维Series的值中抽取信息。看下面的例子: 第一个函数是unique,它可以得到Series中的唯一值数组: 返回的唯一值...

  • 相关系数与协方差

    有些汇总统计(如相关系数和协方差)是通过参数对计算出来的。我们来看几个DataFrame,它们的数据来自Yahoo!Finance的股票价格和成...

  • Resize,w 360,h 240
    pandas库之汇总和计算描述统计

    pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataF...

  • pandas库之排序和排名

    根据条件对数据集排序(sorting)也是一种重要的内置运算,要对行或列索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个...

  • pandas库之函数应用和映射

    NumPy的ufuncs(元素级数组方法)也可用于操作pandas对象: 另一个常见的操作时,将函数应用到由各列或行所形成的一维数组上。Data...