阅读量:0
要使用PHP的HTML Parser来解析网页,首先需要安装一个HTML解析库。一个常用的库是simplehtmldom
。你可以通过Composer来安装它:
composer require "simplehtmldom/simple-html-dom"
安装完成后,你可以使用以下代码示例来解析网页:
<?php // 引入Composer库 require_once 'vendor/autoload.php'; // 使用simplehtmldom加载网页 include('simple_html_dom.php'); // 创建一个新的HTML DOM对象 $html = file_get_html('https://example.com'); // 查找所有的链接 foreach ($html->find('a') as $link) { // 获取链接的href属性 $href = $link->href; // 输出链接文本和href属性 echo $link->plaintext . ' (' . $href . ")\n"; } // 查找所有的图片 foreach ($html->find('img') as $img) { // 获取图片的src属性 $src = $img->src; // 输出图片alt属性和src属性 echo $img->alt . ' (' . $src . ")\n"; }
这个示例将加载指定的网页,并查找所有的链接和图片元素,然后输出它们的文本内容和属性。你可以根据需要修改代码来解析其他元素。更多关于simplehtmldom
库的信息和用法,请参考官方文档:https://simplehtmldom.sourceforge.io/manual.htm