Pandas是Python中的一个强大的数据处理和分析库,其中的agg函数是一个非常实用的函数,可以用来进行数据的统计分析。agg函数的用法如下:
基本用法
import pandas as pd data = {'A':[1,2,3,4,5], 'B':[6,7,8,9,10], 'C':[11,12,13,14,15]} df = pd.DataFrame(data) # 计算每一列的均值 df.agg('mean')
上面的代码中,我们创建了一个DataFrame对象,使用agg函数计算每一列的均值,最终得到的结果是:
A 3.0 B 8.0 C 13.0 dtype: float64
多个函数
import pandas as pd data = {'A':[1,2,3,4,5], 'B':[6,7,8,9,10], 'C':[11,12,13,14,15]} df = pd.DataFrame(data) # 计算每一列的均值、标准差和最大值 df.agg(['mean', 'std', 'max'])
上面的代码中,我们使用agg函数计算每一列的均值、标准差和最大值,最终得到的结果是:
A B C mean 3.0 8.0 13.0 std 1.4 1.4 1.4 max 5.0 10.0 15.0
自定义函数
import pandas as pd data = {'A':[1,2,3,4,5], 'B':[6,7,8,9,10], 'C':[11,12,13,14,15]} df = pd.DataFrame(data) # 自定义函数 def my_func(x): return x.max() - x.min() # 计算每一列的最大值和最小值之差 df.agg(my_func)
上面的代码中,我们先定义了一个函数my_func,用来计算每一列的最大值和最小值之差,使用agg函数调用该函数,最终得到的结果是:
A 4 B 4 C 4 dtype: int64
以上就是Pandas中agg函数的用法示例,agg函数可以用来进行数据的统计分析,可以指定多个函数,也可以自定义函数来实现更复杂的分析。