Pandas.crosstab()函数使用起来非常简单,它可以帮助我们快速计算分组频率表,是Python中数据分析的重要工具。Pandas.crosstab()函数主要有三个参数,分别是index、columns和values,分别表示索引、列名和值。
使用方法
- 1.index参数:index参数表示索引,可以是一个Series或者一个列表,用于表示每一行的标签;
- 2.columns参数:columns参数表示列名,可以是一个Series或者一个列表,用于表示每一列的标签;
- 3.values参数:values参数表示值,可以是一个Series或者一个列表,用于表示每一个单元格的值。
Pandas.crosstab()函数的使用示例如下:
import pandas as pd # 创建一个DataFrame df = pd.DataFrame({'A': ['one', 'one', 'two', 'two'], 'B': ['a', 'b', 'a', 'b'], 'C': [1, 2, 3, 4]}) # 计算分组频率表 pd.crosstab(df.A, df.B, values=df.C, aggfunc='mean')
输出结果如下:
B a b A one 1.0 2.0 two 3.0 4.0
上面的代码中,我们使用pandas.crosstab()函数计算了DataFrame中A、B两列的分组频率表,并用C列的均值作为值。
Pandas.crosstab()函数还支持计算多个分组频率表,只需要将多个列名传入即可:
pd.crosstab([df.A, df.B], df.C)
输出结果如下:
C 1 2 3 4 A B one a 1 0 0 0 b 0 1 0 0 two a 0 0 1 0 b 0 0 0 1
以上就是Pandas.crosstab()函数的使用方法,它可以帮助我们快速计算分组频率表,是Python中数据分析的重要工具。