240 发简信
IP属地:山东
  • 120
    爬虫篇(一)

    爬虫篇只会对简单的爬虫进行介绍,只是为了学习数据分析时方便采集数据。所以下面关于爬虫的内容将只会围绕urllib2、re这两个库开展 首先我们要对爬虫有一个大体的概念,爬虫是...

  • 职业转折点

    最近面临一个职业的转折,最终我自己选择了一条技术+管理的路。 说来自己也有些遗憾,做了半年的部门经理,最后放弃了行政岗位这条路。 技术我也一直在抓,但是并不精通,有很多的软肋...

  • 数据规整化

    1.合并数据集 DataFrame 中的merge方法是一种多对一的合并。 df1中的数据有多个被标记为a和b的行,而df2中key列的每个值则仅对应一行。对这些对象调用me...

  • Hadoop平台基础搭建

    基础准备:Ubuntuhadoop-2.7.3.tar.gzjdk-8u144-linux-x64.tar.gz 1.Hadoop平台是完全使用Java开发的,所以在搭建Ha...

  • 数据加载

    之前写的numpy和pandas都是基于一个前提下,那就是我们可以把数据直接导入到Python中进行操作,否则之前的学习都是没有意义的,而不论是pandas又或者是numpy...

  • pandas(五)——层次化索引

    pandas中的层次化索引是我们能以低纬度形式处理高纬度数据。 这样的一个数据集我们可以将它变得更加直观,将它变成只有一层索引的数据: 这样的变化是可逆的,我们同样可以将这样...

  • pandas(四)——处理缺失数据

    pandas中使用浮点值NaN表示缺失值,Python内置的None值也会被当做NA处理 pandas中常用的对NA进行处理的方法dropna:过滤NaN值的一种方法,可以通...

  • 120
    pandas(三)

    汇总和计算描述统计 调用DataFrame的sum方法将会返回一个含有列小计的Series: 传入axis=1将会按行进行求和运算: NA值将会自动被排除(除非整个切片都是N...

  • 120
    十年一觉 iPhone 梦:你根本想不到当年他们为了买部手机会做什么

    一 对过去的十年,可以说只有一个最准确的称呼:苹果手机发明后的十年。 如果你的年龄大于十岁,你就可以骄傲地说自己身处于洪流中,见证一个了不起的时代。 ​ 凌晨刚结束的苹果发布...

  • pandas(二)

    pandas重索引 如果重索引传入的索引号原在原索引中并不存在则引入空值 我们可以控制这个引入的值是什么,默认是NaN,可以通过fill_value参数更改 函数应用和映射 ...

  • pandas(一)

    pandas中的Series和DataFrame是我们非常常用的两个工具。 Series是一种类似于一维数组的对象 Series由一组数据(各种Numpy数据类型)以及一组与...

  • Python机器学习——准备篇

    机器学习的分类 监督学习(Supervised Learning)无监督学习(Unsupervised Learning)强化学习(Reinforcement Learnin...

  • 120
    Numpy

    1.numpy基础:数组和矢量计算 ndarray 可进行矢量运算并节省空间的多维数组 无需写循环即可进行标准数学函数 可以读写磁盘 线性代数、随机数生成以及傅里叶变换功能(...