pandas 基本操作2.0

Dataframe:基本概念及创建

Dataframe 数据结构

Dataframe是一个表格型的数据结构,“带有标签的二维数组”

Dataframe带有index(行标签)和columns(列标签),这两个属性十分重要!!!

pd.DataFrame(data,index,columns)

data:为传入的值可以为

data = {'name':['Jack','Tom','Mary']        'age':[18,19,20],      'gender':['m','m','w']}

data = {'a':[1,2,3], 'b':[3,4,5], 'c':[5,6,7]}

data = {'one':np.random.rand(3), 'two':np.random.rand(3)}

data= {'one':pd.Series(np.random.rand(2), index = ['a','b'])

data=np.random.rand(9).reshape(3,3)#直接传入2维数组,必须指定index | columns 按照list的方式来传入

data = {'Jack':{'math':90,'english':89,'art':78}, 'Marry':{'math':82,'english':95,'art':92}, 'Tom':{'math':78,'english':67}}#index在这里和之前不同,并不能改变原有index,如果指向新的标签,值为NaN (非常重要!)


              Jack    Marry  Tom

   art        78      92      NaN

 english    89    95      67.0

 math      90     82      78.0



Pandas数据结构Dataframe:索引

Dataframe既有行索引也有列索引,可以被看做由Series组成的字典(共用一个索引) 选择列 / 选择行 / 切片 / 布尔判断

注:data[‘列’][‘行’]默认的参数

data3 = df.loc['one'](.loc()选择行)

df.iloc[] - 按照整数位置(从轴的0到length-1)选择行

data4 = df.loc[['one','two']]

print(data2,type(data3))

print(data3,type(data4))

# 按照index选择行,只选择一行输出Series,选择多行输出Dataframe

#切变的操作与字典一致

布尔值索引

b1 = df < 20

b2 = df['a'] > 50

b3= df.loc[['one','three']] < 50

b4 = df[['a','b']] > 50

print(b1,type(b1))

print(df[b1])

多重索引

print(df['a'].loc[['one','three']]) # 选择a列的one,three行

print(df[['b','c','d']].iloc[::2])  # 选择b,c,d列的one,three行

print(df[df['a'] < 50].iloc[:2])  # 选择满足判断索引的前两行数据


Pandas数据结构Dataframe:基本技巧

数据查看、转置 / 添加、修改、删除值 / 对齐 / 排序

df['e'] = 10

df.loc[4] = 20

print(df)

# 新增列/行并赋值

df['e'] = 20

df[['a','c']] = 100

print(df)

# 索引后直接修改值

del df['a']

# del语句 - 删除列

print(df.drop(0))

print(df.drop([1,2]))

# drop()删除行,inplace=False → 删除后生成新的数据,不改变原数据

print(df.drop(['d'], axis = 1))

# drop()删除列,需要加上axis = 1,inplace=False → 删除后生成新的数据,不改变原数据

print(df1 + df2)

# DataFrame对象之间的数据自动按照列和索引(行标签)对齐



排序1 - 按值排序 .sort_values

# 同样适用于Series

print(df1.sort_values(['a'], ascending = True))  # 升序

print(df1.sort_values(['a'], ascending = False))  # 降序

# ascending参数:设置升序降序,默认升序

# 单列排序

print(df2.sort_values(['a','c']))

# 多列排序,按列顺序排序

 排序2 - 索引排序 .sort_index

print(df2.sort_index())

# 按照index排序

# 默认 ascending=True, inplace=False

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,841评论 5 472
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,415评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,904评论 0 333
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,051评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,055评论 5 363
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,255评论 1 278
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,729评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,377评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,517评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,420评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,467评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,144评论 3 317
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,735评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,812评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,029评论 1 256
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,528评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,126评论 2 341

推荐阅读更多精彩内容