Pandas中的dropna()函数可以用于删除缺失值,它可以接受一个参数,用于指定要删除的缺失值的行或列。该函数支持行删除和列删除,也可以同时删除行和列。
使用方法
1. 删除整行缺失值:
dataframe.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)axis:表示要删除的行或列,axis=0表示删除行,axis=1表示删除列,默认值为0;how:表示删除的条件,how='any'表示只要有一个缺失值就删除,how='all'表示必须全部是缺失值才删除,默认值为'any';thresh:表示保留的非缺失值的最小数量,如果指定了thresh,那么就会保留指定数量的非缺失值,默认值为None;subset:表示要删除的子集,默认值为None;inplace:表示是否在原来的DataFrame上进行操作,inplace=True表示在原来的DataFrame上进行操作,inplace=False表示不在原来的DataFrame上进行操作,默认值为False。
2. 删除整列缺失值:
dataframe.dropna(axis=1, how='any', thresh=None, subset=None, inplace=False)axis:表示要删除的行或列,axis=0表示删除行,axis=1表示删除列,默认值为0;how:表示删除的条件,how='any'表示只要有一个缺失值就删除,how='all'表示必须全部是缺失值才删除,默认值为'any';thresh:表示保留的非缺失值的最小数量,如果指定了thresh,那么就会保留指定数量的非缺失值,默认值为None;subset:表示要删除的子集,默认值为None;inplace:表示是否在原来的DataFrame上进行操作,inplace=True表示在原来的DataFrame上进行操作,inplace=False表示不在原来的DataFrame上进行操作,默认值为False。
3. 同时删除行和列:
dataframe.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)axis:表示要删除的行或列,axis=(0,1)表示同时删除行和列,默认值为0;how:表示删除的条件,how='any'表示只要有一个缺失值就删除,how='all'表示必须全部是缺失值才删除,默认值为'any';thresh:表示保留的非缺失值的最小数量,如果指定了thresh,那么就会保留指定数量的非缺失值,默认值为None;subset:表示要删除的子集,默认值为None;inplace:表示是否在原来的DataFrame上进行操作,inplace=True表示在原来的DataFrame上进行操作,inplace=False表示不在原来的DataFrame上进行操作,默认值为False。
dropna()函数可以用于删除缺失值,可以接受一个参数,用于指定要删除的缺失值的行或列,也可以同时删除行和列,具体的使用方法可以参考上文中的例子。