pandas DataFrame
- 提取DataFrame的行名
df.index
- DataFrame行名的名字
df.index.name
- 取DataFrame的某一行、某一列
df.loc["某行行名"]
df["某列列名"]
取出的某行或某列为series数据结构,使用.values
转化成array
- 删除某行、某列
df.drop(labels=0) # 删除第0行
df.drop(labels="toy",axis = 1) # 删除名称为“toy”的列
df.drop(labels="toy",axix = 1, inplace = True) # 删除名称为“toy”的列,并修改原数据
- 删除nan的某行、某列
df.dropna() # 删除至少有一个元素为nan的行
df.dropna(axis=1) # 删除至少有一个元素为nan的列
df.dropna(how='all') # 删除所有元素都为nan的行
df.dropna(thresh=2) # 删除至少有2个元素为nan的行
df.dropna(subset=['name', 'toy']) # 删除'name', 'toy'列中有元素为nan的行
numpy array
- 判断array里面是否有inf或nan
np.isnan(array) # 批量判别数组中每个元素是否为 nan
np.isinf(array) # 批量判别数组中每个元素是否为 inf
np.isfinite(array) # 批量判别数组中每个元素是否为非 inf 非 nan 的值
- 字符串array、整型array、浮点型array相互转化
array.astype(int)
array.astype(str)
array.astype(float32)
- 删除array中的行、列
np.delete(array,[0,2],axis = 1) # 删除第0列和第2列
# 当axis = 0时删除的是行