怎么用python爬取网页内的指定内容

作者

首页»
云计算»
知识库»
怎么用python爬取网页内的指定内容

发布时间:2024-07-12 02:42

阅读量:0

要用Python爬取网页内的指定内容，可以使用第三方库 requests 和 BeautifulSoup。以下是一个示例代码，用于爬取指定网页内的标题和正文内容：

import requests from bs4 import BeautifulSoup  # 指定要爬取内容的网页链接 url = 'https://example.com'  # 发起GET请求获取网页内容 response = requests.get(url)  # 使用BeautifulSoup解析网页内容 soup = BeautifulSoup(response.text, 'html.parser')  # 获取网页标题 title = soup.title.text print('网页标题:', title)  # 获取正文内容 content = soup.find('div', class_='content').text print('正文内容:', content)