OBD大数据采集平台添加规则方法(中级篇)

大数据采集资源中添加规则方法

Q2:平台上添加资源中的规则如何写呢?

A: 默认有两种简单易学易用的写法,需灵活运用,获取到正确的网址即可

第一种:文章网址a标签前面的字符串作为标识,如新浪,腾讯等门户常用“<h3”。(操作方法:用谷歌浏览器,在标题上点右键,再选审查元素,他会自动锁定标题的a标签,我们找到a标签之前的字符串部分照写即可。)

第二种:文章网址中包含的字符串作为标识,如淘宝网址中包含“/item.htm”。

查找网址前标识:

测试规则:

确认无误后,保存。

大数据采集器拥有实用操作性强,易掌握的规则写法,每一行规则分为左右两栏,可分别填入不同的内容,默认进行字符串的替换。

左侧常用标识:

<a>       网址中包含字符串
<t>        标题中包含关键字
<t2>      标题中包含关键字
<nt>      标题中不包含关键字
<charset>      指定页面的编码,如:gbk,utf-8,big5等

右侧常用标识:

<page>       文章网址a标签前字符串
<up>            过滤内容到开头
<end>          过滤内容到结尾

—————————–OVER———————————-

如果您在安装使用中有任何疑问或问题,欢迎您随时与我们取得联系。

我们的工作时间:周一到周五,早上9点到下午5点。

ONEXIN!新手交流QQ群:189610242

相关文章:

1、OBD大数据采集平台添加采集资源方法(中级篇)
https://www.clocol.com/resources.html

2、PHPCMS大数据文章采集器2021版安装说明
https://www.clocol.com/phpcms-obd.html

3、ONEXIN大数据文章采集器图文教程【最新】
https://www.clocol.com/obd.html

4、OBD大数据文章自动采集插件下载列表
https://www.clocol.com/bigdata.html

5、ONEXIN大数据采集微信文章方法(2019更新)
https://www.clocol.com/wechat.html

转载请注明出处:https://www.clocol.com/rules.html