PHP采集框架QueryLIst:rules(array $rules) 说明

岳小威子
2022-11-07 / 483 个字 / 0 评论 / 86 阅读 / 加载耗时:30ms / 正在检测是否收录...
温馨提示:
本文最后更新于2022年11月07日,已超过775天没有更新,若内容或图片失效,请留言反馈。

设置DOM解析规则。
当没有设置range()时称为多元素DOM解析,设置了range()后称为列表DOM解析。

DOM解析规则格式

//DOM解析规则
$rules = array(
   '规则名' => array('jQuery选择器','要DOM解析的属性'[,"标签过滤列表"][,"回调函数"]),
   '规则名2' => array('jQuery选择器','要DOM解析的属性'[,"标签过滤列表"][,"回调函数"]),
    ..........
);

//注:方括号括起来的参数可选

规则解释

字段类型必填注释
规则名string任意不重复字符串
jQuery选择器string要选择的元素选择器
要DOM解析的属性string任意html元素属性
标签过滤列表string设置要过滤的内容
回调函数Closure用于对数据做额外处理

规则字段解释

1.要DOM解析的属性

值为以下几种:

  • text:返回当前选中标签下面的纯文本
  • html:返回当前选中标签下面的html片段
  • htmlOuter:返回当前选中的标签的外部html片段 (V4.2.0新增)
  • texts:返回当前选中的多个标签下面的纯文本 (V4.2.0新增)
  • htmls:返回当前选中的多个标签下面的html片段 (V4.2.0新增)
  • htmlOuters:返回当前选中的多个标签的外部html片段 (V4.2.0新增)
  • attr(HTML标签属性): 获取标签属性值,如src、href、name、data-src等任意HTML标签属性名,支持通配符*匹配标签所有属性 (V4.2.5新增)
  • attrs(HTML标签属性): 返回当前选中的多个标签的属性值 (V4.2.5新增)
2.标签过滤列表

设置此选项可用来过滤不想要的内容,多个值之间用空格隔开,有如下2条规则:

  1. 当标签名前面添加减号(-)时(此时标签可以为任意的jQuery选择器),表示移除该标签以及标签内容。
  2. 当标签名前面没有减号(-)时,当 [要DOM解析的属性] 值为text时表示需要保留的HTML标签以及内容,为html时表示要过滤掉的HTML标签但保留内容。

文章到这里就结束了

您在本文章已经停留了大概
喜欢的话就点个赞吧!或着请我喝个冰可乐,我就太感谢你了!


0
打赏
拜谢打赏(☆ω☆)

感谢老板,老板大气。。

评论 (0)

取消