今天学习的是第六章连接。其基本概念就是把两张相关的表按照某一个或某一组键连接起来。例如学生期末考试各个科目的成绩表按照 姓名 和 班级 连接成总的成绩表,又例如对企业员工的各类信息表按照 员工ID号 进行连接汇总。由此可以看出,在关系型连接中, 键 是十分重要的,往往用 on 参数表示。
一、关系型连接
值连接-merge操作
基于值的连接在pandas中可以由merge函数实现。它的主要参数有on,how,left_on,right_on等。当两张表中有重复的列名时,可以通过suffixes参数指定。
索引连接-join操作
索引连接把索引当做键,与值连接本质上没有区别,其参数有on和how,以及对重复的列指定左右后缀的lsuffix和rsuffix。
二、方向连接
这部分介绍了一个常用的连接函数--concat。concat函数中最常用的函数是axis,join和keys。分别表示拼接方向,连接形式,以及在新表中指示来自哪一种旧表的名字。默认情况下,axis=0,表示纵向拼接多个表;axis=1表示横向拼接多个表。
练习
这道题首先使用loc函数从每张表中抽取需要的行和字段,将数据添加到L列表中。全部处理完以后,使用concat函数将它们纵向拼接得到最终结果。
这道题不太会了,参照着答案敲了一遍。