阅读量:0
Python爬取数据的代码可以使用requests库进行网络请求,并使用BeautifulSoup库进行网页解析。下面是一个简单的示例代码,演示如何使用Python爬取数据:
import requests from bs4 import BeautifulSoup # 发送网络请求 url = 'http://example.com' # 设置要爬取的网页链接 response = requests.get(url) # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 查找需要的数据 data = soup.find('div', class_='content').text # 输出结果 print(data)
上述代码中,首先使用requests库发送网络请求获取网页内容,然后使用BeautifulSoup库解析网页内容。通过调用find
方法可以选择特定的元素,例如上述代码中的div
元素,并使用class_
参数指定元素的类名。最后,通过调用text
属性获取元素的文本内容。
需要注意的是,爬取数据时要遵守网站的爬虫规则,不要过度请求,以免给网站造成负担或触发反爬虫机制。