BeautifulSoup中find()和find_all()的使用
BeautifulSoup是Python的一个解析HTML的库,它可以让你方便地从HTML中提取数据。BeautifulSoup中最常用的两个函数就是find()和find_all(),它们都是用来从HTML中提取数据的,但是它们有一些不同之处。
find()函数
find()函数可以从HTML中查找第一个满足条件的元素,它接受一个参数,参数可以是标签名,属性,内容等,它会返回第一个满足条件的元素。
# 使用find()函数查找第一个p标签 soup.find('p') # 使用find()函数查找第一个class属性为title的元素 soup.find(attrs={'class': 'title'}) # 使用find()函数查找第一个包含“Hello”的元素 soup.find(string='Hello')
find_all()函数
find_all()函数可以从HTML中查找所有满足条件的元素,它接受一个参数,参数可以是标签名,属性,内容等,它会返回所有满足条件的元素。
# 使用find_all()函数查找所有p标签 soup.find_all('p') # 使用find_all()函数查找所有class属性为title的元素 soup.find_all(attrs={'class': 'title'}) # 使用find_all()函数查找所有包含“Hello”的元素 soup.find_all(string='Hello')
:find()函数可以查找第一个满足条件的元素,而find_all()函数可以查找所有满足条件的元素。