Pandas DataFrame是一种常用的数据结构,它可以帮助我们快速地处理大量数据。然而,DataFrame中的数据可能会存在缺失值,这时我们就需要对它们进行查找和填充。
查找缺失值
Pandas DataFrame提供了一个isnull()函数,可以用来查找DataFrame中的缺失值。该函数会返回一个布尔型的DataFrame,其中True表示该位置是缺失值,False表示该位置不是缺失值。例如:
import pandas as pd # 创建一个DataFrame,其中有一个缺失值 df = pd.DataFrame({'A':[1,2,3,4], 'B':[5,6,None,8]}) # 查找缺失值 missing_values = df.isnull() # 打印结果 print(missing_values)
输出:
A B 0 False False 1 False False 2 False True 3 False False
填充缺失值
Pandas DataFrame提供了一个fillna()函数,可以用来填充DataFrame中的缺失值。该函数接受一个参数,用于指定要填充的值。例如,我们可以用0来填充上面DataFrame中的缺失值:
# 填充缺失值 df.fillna(0) # 打印结果 print(df)
输出:
A B 0 1 5.0 1 2 6.0 2 3 0.0 3 4 8.0
fillna()函数还支持填充指定列的缺失值:
# 填充指定列的缺失值 df['B'].fillna(0) # 打印结果 print(df)
输出:
A B 0 1 5.0 1 2 6.0 2 3 0.0 3 4 8.0
fillna()函数还可以用来填充前一个非缺失值:
# 填充前一个非缺失值 df.fillna(method='ffill') # 打印结果 print(df)
输出:
A B 0 1 5.0 1 2 6.0 2 3 6.0 3 4 8.0
Pandas DataFrame提供了isnull()和fillna()函数,可以用来快速查找和填充DataFrame中的缺失值。