第8章 数据规整:聚合,合并和重塑

it2025-02-25  28

8.1 层次化索引

层次化索引,让你能在一个轴上拥有多个索引级别。让你能以低维度形式处理高维度数据。

有两个索引轴,都可以索引出数据,每个索引轴也可以有两个标签方便索引。

unstack()方法,把一个二维index的DataFrame, 变成一个横纵索引的数据

unstack的逆运算是stack

重排与分级排序

需要调整某条轴上各级别的顺序,或根据指定级别上的值对数据进行排序,使用swaplever函数,swaplever接受两个级别编号或名称,并返回一个互换了级别的新对象。

sort_index则根据单个级别中的值对数据进行排序

使用DataFrame的列进行索引

使用DataFrame的一个或多个列当做行索引,或者可能希望将行索引变成DataFrame的列。

DataFrame的set_index函数会将其一个或多个列转换为行索引,并创建一个新的DataFrame。drop选型绝对是否其他列是否被删除。

reset_index的功能跟set_index相反,层次化索引的级别会被转移到列里面。

合并数据集

pandas.merge根据一个或多个键将不同的DataFrame中的行连接起来。

数据库风格的DataFrame合并

索引上的合并

轴向连接

连接concatenation,绑定binding, 堆叠stacking。 pandas的cancat方法将值和索引粘合在一起。

合并重叠数据

重塑和轴向旋转

重塑层次化索引

stack: 将数据的列“旋转”为行unstack:将数据的行“旋转”为列

将“长格式”旋转为“宽格式”

将“宽格式”旋转为“长格式”

最新回复(0)