怎么用用java爬虫抓取网页数据

作者

首页»
云计算»
知识库»
怎么用用java爬虫抓取网页数据

发布时间:2024-07-13 15:36

阅读量:0

使用Java编写爬虫来抓取网页数据通常需要使用第三方库，比如Jsoup。以下是一个简单的示例代码来使用Jsoup来抓取网页数据：

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements;  import java.io.IOException;  public class WebScraper {      public static void main(String[] args) {         String url = "https://www.example.com";          try {             Document doc = Jsoup.connect(url).get();              Elements links = doc.select("a[href]");              for (Element link : links) {                 System.out.println(link.attr("href"));             }          } catch (IOException e) {             e.printStackTrace();         }     } }