一、基础
1、数据结构
- Data Frame
- 关系型表格
- Series
- 单一列,Data Frame包含多个Series
2、创建data frame
name = ['zhangsan','lisi','name1','name2']
id = [968,155,77,578]
datalist = list(zip(name,birth))
df = pd.DataFrame(data=datalist,columns = ['Names','Birth'])
二、分析
1、排序
Sorted = df.sort_values(['Births'], ascending=False)
Sorted.head(1)
三、CSV操作
1、转换成csv
df.to_csv('test.csv',index=False,Header=True)
2、读取csv
df = pd.read_csv(file_path)
df[:3]
3、查看df的数据类型
df.dtype
df.Birth.dtype
四、Excel操作
1、读取Excel
import pandas as pd
import xlrd
excel_path ="test.xlsx"
data = pd.read_excel(excel_path)
2、选择指定列、指定行
# 选择第1-10行(行数即index=0,index=9),第2-3列(列数即index=1,index=2)
name = data.iloc[0:10,1:3]
print(name)
显示
花费事项 金额
0 项目组周六例行加班聚餐 450.00
1 购买手机架15位 54.99
2 打码平台充值 500.00
3 寄两台手机 12.00
4 辽宁电信 200.00
5 浙江移动 100.00
6 浙江电信 50.00
7 浙江联通 50.00
8 福建电信 50.00
9 山东移动 100.00