网页网站您现在的位置是:首页 > 博客日志 > 网页网站

php解析html的方法,类库simple_html_dom(入门实例)

<a href='mailto:'>微wx笑</a>的头像微wx笑 2022-10-15网页网站 3 0关键字: php  html  

项目之前需要先下载用到的simple_html_dom类库, [ 点击下载 ]链接失效可自行搜索simple_html_dom下载;使用也非常简单,可以直接去看源代码。看一个函数中的实际应用:这是下载解

 项目之前需要先下载用到的simple_html_dom类库, [ 点击下载 ]PYQ无知

链接失效可自行搜索simple_html_dom下载;PYQ无知


PYQ无知

使用也非常简单,可以直接去看源代码。PYQ无知

看一个函数中的实际应用:PYQ无知

这是下载解析百度热搜的内容PYQ无知

require('simple_html_dom.php');.

function getBoard(){
  global $empire;
  $tm = time();
  $filePath = getFilePath();
  $content = getBoardContent($filePath);
  //echo $content;
  $html = str_get_html($content); //file_get_html($filePath);
  
  $i = 0;
  foreach($html->find('div.category-wrap_iQLoo, div.horizontal_1eKyQ') as $itm) {
    $i++;
    $title = $itm->find('div.c-single-text-ellipsis',0)->innertext;
    $intro = $itm->find('div.hot-desc_1m_jR, div.large_nSuFU',0)->innertext;
    $img = $itm->find('a img',0)->src;
    $aimg = $itm->find('a img',1);
    if (!empty($aimg)){
      $img = $itm->find('a img',1)->src;
    }
    $link = $itm->firstChild()->href;
	//if ($itm->firstChild()->tag == "a" && count($itm->firstChild()->children()) > 2){
    //  $img = $itm->find('a img',1)->src;
    //}
    //die($link);
    $index = $itm->find('.hot-index_1Bl1a',0)->innertext;
    $sql = "INSERT INTO `hot_board`(`title`, `intro`, `img`, `link`, `hotindex`, `hottime`) VALUES ('".addslashes($title)."','".addslashes($intro)."','".addslashes($img)."','".addslashes($link)."','".addslashes($index)."','".$tm."')";
    $rlt=$empire->query($sql);
    echo $rlt . " ";
  }
}

str_get_html(传递HTML内容字符串); PYQ无知

file_get_html(传递html文件的路径);PYQ无知

本文由 微wx笑 创作,采用 署名-非商业性使用-相同方式共享 4.0 许可协议,转载请附上原文出处链接及本声明。
原文链接:https://www.ivu4e.cn/blog/web/2022-10-15/1471.html

很赞哦! () 有话说 ()

上一篇:GitHub 寻宝指南

下一篇:SVG 属性参考