阅读量:4
Jsoup是一个开源的Java HTML解析器,可以通过选择器语法来提取和操作HTML文档。它提供了一种简单、方便的方式来解析HTML并提取其中的数据。
以下是Jsoup的一些常用用法:
- 解析HTML文档:
Document doc = Jsoup.parse(html);
- 通过URL解析HTML文档:
Document doc = Jsoup.connect(url).get();
- 选择器语法提取元素:
Elements links = doc.select("a"); Element element = doc.selectFirst("#id"); Elements elements = doc.select(".class");
- 获取元素的属性和文本:
String href = link.attr("href"); String text = link.text();
- 遍历元素:
for (Element link : links) { // do something }
- 修改元素的属性和文本:
link.attr("href", "newUrl"); link.text("newText");
- 提取表单数据:
Elements forms = doc.select("form"); for (Element form : forms) { String action = form.attr("action"); // do something }
除了上述常用用法,Jsoup还提供了强大的功能,如处理文档编码、处理HTML片段、处理文件上传等。可以通过查阅官方文档来了解更多详细用法:https://jsoup.org/