Pandas 重塑(stack)和轴向旋转(pivot)的实现
import numpy as np import pandas as pd from pandas import Series,DataFrame
一、重塑
- stack:将数据的列索引旋转为行索引
- unstack:将数据的行索引旋转为列索引
df = DataFrame({'水果':['苹果','梨','草莓'], '数量':[3,4,5], '价格':[4,5,6]}) print(df)
价格 数量 水果
0 4 3 苹果
1 5 4 梨
2 6 5 草莓
1.stack()
stack_df = df.stack() print(stack_df)
0 价格 4
数量 3
水果 苹果
1 价格 5
数量 4
水果 梨
2 价格 6
数量 5
水果 草莓
dtype: object
2.unstack()
print(stack_df.unstack())
价格 数量 水果
0 4 3 苹果
1 5 4 梨
2 6 5 草莓
3.通过level参数指定旋转轴的层次(默认level=-1)
print(stack_df.unstack(level=0))
0 1 2
价格 4 5 6
数量 3 4 5
水果 苹果 梨 草莓
二、轴向旋转(pivot)
pivot(index,columns,values):将index指定为行索引,columns是列索引,values则是DataFrame中的值
df = DataFrame({'水果种类':['苹果','苹果','梨','梨','草莓','草莓'], '信息':['价格','数量','价格','数量','价格','数量'], '值':[4,3,5,4,6,5]}) print(df)
信息 值 水果种类
0 价格 4 苹果
1 数量 3 苹果
2 价格 5 梨
3 数量 4 梨
4 价格 6 草莓
5 数量 5 草莓
将水果种类作为行索引,将信息作为列索引
print(df.pivot('水果种类','信息','值'))
信息 价格 数量
水果种类
梨 5 4
苹果 4 3
草莓 6 5
pivot可以用set_index和unstack等价的实现
print(df.set_index(['水果种类','信息']).unstack())
值
信息 价格 数量
水果种类
梨 5 4
苹果 4 3
草莓 6 5