Pandas.Duplicated()函数使用方法详解:检测数据框重复值

分类:知识百科 日期: 点击:0

Pandas.Duplicated()函数可以检测数据框中是否有重复值,它可以检测数据框中每一行是否有重复值,也可以检测某一列的值是否有重复。它返回的是一个布尔型的Series,其中值为True的表示有重复,值为False的表示没有重复。

Pandas.Duplicated()函数的使用方法

  • 1、检测数据框中每一行是否有重复值:
import pandas as pd

df = pd.DataFrame({'A':[1,2,3,4,5,6],
                   'B':[2,3,4,5,6,7],
                   'C':[3,4,5,6,7,8]})

# 检测每一行是否有重复值
result = df.duplicated()
print(result)

# 输出结果
0    False
1    False
2    False
3    False
4    False
5    False
dtype: bool
  • 2、检测某一列的值是否有重复:
import pandas as pd

df = pd.DataFrame({'A':[1,2,3,4,5,6],
                   'B':[2,3,4,5,6,7],
                   'C':[3,4,5,6,7,8]})

# 检测A列的值是否有重复
result = df['A'].duplicated()
print(result)

# 输出结果
0    False
1    False
2    False
3    False
4    False
5    False
Name: A, dtype: bool
  • 3、检测某一列的值是否有重复,并且排除掉第一次出现的重复值:
import pandas as pd

df = pd.DataFrame({'A':[1,2,3,4,5,6],
                   'B':[2,3,4,5,6,7],
                   'C':[3,4,5,6,7,8]})

# 检测A列的值是否有重复,并且排除掉第一次出现的重复值
result = df['A'].duplicated(keep='first')
print(result)

# 输出结果
0    False
1    False
2    False
3    False
4     True
5     True
Name: A, dtype: bool
标签:

版权声明

1. 本站所有素材,仅限学习交流,仅展示部分内容,如需查看完整内容,请下载原文件。
2. 会员在本站下载的所有素材,只拥有使用权,著作权归原作者所有。
3. 所有素材,未经合法授权,请勿用于商业用途,会员不得以任何形式发布、传播、复制、转售该素材,否则一律封号处理。
4. 如果素材损害你的权益请联系客服QQ:77594475 处理。