pd.read_excel()操作读取Excel文件的参数整理
Pandas库中的pd.read_excel()函数可以用来读取Excel文件中的数据,它支持多种参数,可以帮助我们更方便地读取Excel文件中的数据。下面就来介绍一下这些参数的用法。
filepath_or_buffer参数
filepath_or_buffer参数用于指定要读取的Excel文件的路径,它可以是本地文件路径,也可以是URL,或者是文件对象。例如:
df = pd.read_excel('/Users/path/to/file.xlsx') df = pd.read_excel('https://example.com/file.xlsx') df = pd.read_excel(open('/Users/path/to/file.xlsx', 'rb'))
sheet_name参数
sheet_name参数用于指定要读取的Excel文件中的sheet,它可以是sheet的名字(字符串),也可以是sheet的索引(整数)。如果不指定,默认会读取第一个sheet。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', sheet_name='Sheet1') df = pd.read_excel('/Users/path/to/file.xlsx', sheet_name=0)
header参数
header参数用于指定Excel文件中的数据的第一行,它可以是行号(整数),也可以是列名(字符串)。如果不指定,默认会将第一行作为列名。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', header=0) df = pd.read_excel('/Users/path/to/file.xlsx', header='column_name')
usecols参数
usecols参数用于指定要读取的列,它可以是列号(整数),也可以是列名(字符串)。如果不指定,默认会读取所有列。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', usecols=[0,1,2]) df = pd.read_excel('/Users/path/to/file.xlsx', usecols=['column_name_1', 'column_name_2'])
skiprows参数
skiprows参数用于指定要跳过的行数,它是一个列表,里面包含要跳过的行号。如果不指定,默认不会跳过任何行。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', skiprows=[0,1,2])
na_values参数
na_values参数用于指定Excel文件中的空白单元格,它是一个字典,里面包含要替换的值。如果不指定,默认不会替换任何值。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', na_values={'column_name':['NA', 'NaN']})
converters参数
converters参数用于指定Excel文件中的数据类型,它是一个字典,里面包含要转换的数据类型。如果不指定,默认不会转换任何数据类型。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', converters={'column_name':str})
dtype参数
dtype参数用于指定读取的Excel文件中的数据的数据类型,它是一个字典,里面包含要转换的数据类型。如果不指定,默认会根据Excel文件中的数据自动推断。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', dtype={'column_name':float})
parse_dates参数
parse_dates参数用于指定Excel文件中的日期数据,它是一个列表,里面包含要转换的列名。如果不指定,默认不会转换任何列。例如:
df = pd.read_excel('/Users/path/to/file.xlsx', parse_dates=['column_name'])
date_parser参数
date_parser参数用于指定Excel文件中的日期数据的格式,它是一个