Pandas DataFrame中的loc()和iloc()是两个用于行列选择的函数,它们具有不同的使用场景,以及不同的使用方法。
loc()函数
loc()函数是根据行标签和列标签来选择数据的,它的使用方法是:
df.loc[行标签, 列标签]
loc()函数可以选择某一行或某几行,也可以选择某一列或某几列,也可以同时选择某几行和某几列,以及将某一行或某几行的某一列或某几列选择出来。例如:
# 选择所有行的'A'列 df.loc[:, 'A'] # 选择所有列的'1'行 df.loc['1', :] # 选择'A'列中值大于0的行 df.loc[df['A'] > 0, :] # 选择'A'列中值大于0的行的'B'列 df.loc[df['A'] > 0, 'B']
iloc()函数
iloc()函数是根据行号和列号来选择数据的,它的使用方法是:
df.iloc[行号, 列号]
iloc()函数可以选择某一行或某几行,也可以选择某一列或某几列,也可以同时选择某几行和某几列,以及将某一行或某几行的某一列或某几列选择出来。例如:
# 选择所有行的第1列 df.iloc[:, 0] # 选择所有列的第2行 df.iloc[1, :] # 选择第1列中值大于0的行 df.iloc[df.iloc[:, 0] > 0, :] # 选择第1列中值大于0的行的第2列 df.iloc[df.iloc[:, 0] > 0, 1]
来说,loc()函数是根据行标签和列标签来选择数据的,而iloc()函数是根据行号和列号来选择数据的。它们在使用场景上也有所不同,loc()函数更适合在有行标签和列标签的情况下使用,而iloc()函数则更适合在没有行标签和列标签的情况下使用。