手机,网络,视频,图片...世界变得越来越快速而忙乱,每天吸收的信息无法胜数,但想一想我们有多久没有长时间专注的做一件事情了?当静下来工作或学习时,注意一下有多少无关的念头会...
手机,网络,视频,图片...世界变得越来越快速而忙乱,每天吸收的信息无法胜数,但想一想我们有多久没有长时间专注的做一件事情了?当静下来工作或学习时,注意一下有多少无关的念头会...
自由是人们毕生追求一种状态,但自由是什么?自由并不是着想做什么就做什么,而是拥有选择的能力。可以基于健康的人格来选择自己喜欢的,并全力以赴的努力;可以拒绝不合理或者讨厌的任务...
文章为George Soros 2009年在中欧商学院所作系列讲座, 本文为第二部分。 金融市场为我昨天提出的抽象理论提供了一个展示和测试的绝佳实验室。在这里,事态的发展比其...
文章为George Soros 2009年在中欧商学院所作系列讲座, 本文为第一部分。 在我的一生中,我制定了一个概念框架帮助我既作为一个对冲基金经理去挣钱,也作为一个政策导...
正如我们在前面几节中已经看到的,PyData堆栈的强大功能建立在NumPy和Pandas通过直观语法将基本操作使用C实现能力之上:例如NumPy的矢量化/广播操作,Panda...
Pandas是在金融建模背景下开发出来的,所以如你期待的,它包含相当大的工具集来处理日期,时间,和时间索引数据。我们将在这里讨论记录时间和日期的几种风格: 时间戳 指特殊时刻...
Python的一个强项是它可以相对简单处理和操纵字符数据。Pandas基于Python构建,并且提供了向量化字符串操作的复杂集合。这些操作在使用(清理)真实世界数据时,是必不...
我们已经看到GroupBy抽象概念如何让我们探索数据集间的关系。数据透视表是类似的操作,它在电子表格和其他操作在表格数据的程序里很常见。透视表使用简单的列方向的数据作为输入,...
大数据分析的一个必要部分是高效的概况:计算聚合值sum(),mean(),median(),min()和max(),这些单个数值可以透视出潜在大数据集的特性。在这部分,我们将...
Pandas很出众的一个特性就是高性能的,内存内的联合和合并操作。如果你曾经使用过数据库,你将会对这种类型的数据交互很熟悉。主要接口是pd.merge函数,将会看到几个实际工...
一些最有趣的数据研究在于将不同数据源组合在一起。这些操作既包括简单的将两个不同数据集连接在一起,也包括复杂的能恰当处理数据集间重叠的数据库方式的合并和融合操作。Series和...
到目前为止我们关注的是保存在Pandas Series和DataFrame中的一维和二维数据。通常超越二维的数据,即用两个以上键值索引的数据也是很有用的。尽管Pandas提供...
教学中的数据和实际数据的区别在于,实际数据很少是干净整齐的。许多有趣的数据集都有某种程度上的数据缺失。更糟糕的是,不同的数据源数据丢失的方式也不同。本章,我们将会探讨对缺失数...
NumPy的基本功能之一是能快速的执行基于元素的操作,既包括基本算术操作(加,减,乘,等)也包括复杂一些的运算(三角函数、指数函数和对数函数等)。Pandas从NumPy继承...
数据索引和选择 在第2章,我们详细研究用于在NumPy数组中访问、设置和修改值的方法和工具。这些包括索引(例如,arr[2,1]),切片(如,arr[:,1:5]),过滤(如...
Python Data Science Handbook)Pandas部分对Pandas的基础知识有非常清晰的介绍。个人认为,对于入门来说本书更合适。之前一直从网上索取信息,...