Pandas DataFrame.describe()函数是一个非常有用的函数,它可以根据数据的类型,计算出数据的统计信息,包括数据的均值、标准差、最小值、最大值、中位数、四分位数等。
使用方法
使用Pandas DataFrame.describe()函数,需要先导入Pandas库,例如:
import pandas as pd
创建一个DataFrame,例如:
data = {'name':['Tom', 'Jack', 'Steve', 'Ricky'],'age':[28,34,29,42]}
df = pd.DataFrame(data, columns=['name','age'])
调用Pandas DataFrame.describe()函数,可以获得数据的统计信息:
df.describe()
输出如下:
age
count 4.000000
mean 33.500000
std 8.506061
min 28.000000
25% 28.750000
50% 32.500000
75% 38.250000
max 42.000000
从输出结果可以看出,数据的均值为33.5,标准差为8.506,最小值为28,最大值为42,中位数为32.5,四分位数分别为28.75、38.25。
Pandas DataFrame.describe()函数可以让我们快速地获得数据的统计信息,从而更好地理解数据的分布情况,从而更好地分析数据。