详解Pandas中随机抽样(sample)的使用方法

分类:知识百科 日期: 点击:0

Pandas是Python中最常用的数据处理库之一,它提供了一种灵活的方式来处理和分析数据。Pandas中的随机抽样(sample)函数可以从数据集中抽取一部分数据,以便进行分析和处理。

使用方法

使用Pandas中的sample函数可以实现随机抽样,sample函数的语法如下:

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

其中,n表示抽取的样本数量;frac表示抽取样本的比例;replace表示是否放回抽样;weights表示抽样权重;random_state表示随机种子;axis表示抽样的轴。

下面以一个实例说明Pandas中sample函数的用法:

import pandas as pd
df = pd.DataFrame({'A':[1,2,3,4,5], 'B':[2,3,4,5,6], 'C':[3,4,5,6,7]})
print(df)
#    A  B  C
# 0  1  2  3
# 1  2  3  4
# 2  3  4  5
# 3  4  5  6
# 4  5  6  7

# 抽取2个样本
sample_df = df.sample(n=2)
print(sample_df)
#    A  B  C
# 0  1  2  3
# 4  5  6  7

# 抽取2个样本,放回抽样
sample_df = df.sample(n=2, replace=True)
print(sample_df)
#    A  B  C
# 3  4  5  6
# 0  1  2  3

# 抽取2个样本,按照A列的权重抽样
weights = [0.1, 0.2, 0.3, 0.4, 0.5]
sample_df = df.sample(n=2, weights=weights)
print(sample_df)
#    A  B  C
# 0  1  2  3
# 2  3  4  5

以上代码演示了如何使用Pandas中的sample函数,从数据集中抽取一部分样本数据,以便进行分析和处理。

标签:

版权声明

1. 本站所有素材,仅限学习交流,仅展示部分内容,如需查看完整内容,请下载原文件。
2. 会员在本站下载的所有素材,只拥有使用权,著作权归原作者所有。
3. 所有素材,未经合法授权,请勿用于商业用途,会员不得以任何形式发布、传播、复制、转售该素材,否则一律封号处理。
4. 如果素材损害你的权益请联系客服QQ:77594475 处理。