Pandas的value_counts()函数可以提取数值名称和计数,提供了一种快速统计数据的方法。
使用方法
value_counts()函数的使用非常简单,只需要将数据传入函数即可,如:
import pandas as pd # 定义一个Series s = pd.Series([1,2,3,4,5,1,2,3,4,5]) # 调用value_counts()函数 s.value_counts()
运行结果如下:
5 2 4 2 3 2 2 2 1 2 dtype: int64
可以看到,value_counts()函数提取出了每个值的计数,并以Series的形式返回。
参数
value_counts()函数还提供了一些可选参数,可以根据需要进行设置,如:
- normalize:将计数转换为频率,默认为False
- sort:按照频率或者计数排序,默认为True,即按照计数排序
- ascending:排序方式,默认为True,即从小到大排序
- bins:将连续型变量离散化,默认为None
例如,我们可以将计数转换为频率,并按照频率从大到小排序,可以使用如下代码:
# 调用value_counts()函数 s.value_counts(normalize=True, sort=True, ascending=False)
运行结果如下:
5 0.2 4 0.2 3 0.2 2 0.2 1 0.2 dtype: float64
可以看到,value_counts()函数提取出了每个值的频率,并按照频率从大到小排序。
Pandas的value_counts()函数可以提取出数值名称和计数,提供了一种快速统计数据的方法。使用非常简单,只需要将数据传入函数即可,还可以设置一些可选参数,如normalize、sort、ascending、bins等。