Pandas中的分组聚合是一种按照指定字段对数据进行分组,并对每个组应用聚合函数的一种操作。它的主要功能是将数据按照指定字段进行分组,对每个分组进行聚合运算,从而实现数据的汇总、分析和统计。Pandas中的分组聚合主要由两个方法实现:groupby()和agg()。
1. groupby()方法
groupby()方法可以将数据按照指定字段进行分组,并对每个分组进行聚合运算。它的使用方法如下:
# 将数据按照指定字段进行分组 grouped = df.groupby('指定字段') # 对每个分组进行聚合运算 grouped.agg(聚合函数)
groupby()方法支持多个字段分组,只需要将多个字段以列表的形式传入即可。
# 将数据按照多个字段进行分组 grouped = df.groupby(['字段1','字段2']) # 对每个分组进行聚合运算 grouped.agg(聚合函数)
2. agg()方法
agg()方法可以对每个分组进行聚合运算,它的使用方法如下:
# 对每个分组进行聚合运算 grouped.agg(聚合函数)
agg()方法可以指定多种聚合函数,只需要将多个聚合函数以列表的形式传入即可。
# 对每个分组进行多种聚合运算 grouped.agg([聚合函数1,聚合函数2,...])
还可以指定每个字段应用不同的聚合函数,只需要将不同的聚合函数以字典的形式传入即可。
# 对每个分组指定每个字段应用不同的聚合函数 grouped.agg({'字段1':[聚合函数1,聚合函数2,...], '字段2':[聚合函数1,聚合函数2,...]})
Pandas中的分组聚合主要由groupby()和agg()方法实现,它们的使用方法也非常简单,只需要按照上面的说明操作即可。