如何配置规则

0 讨 论 244 浏览量 云采集引擎

规则配置:注意这个是正则匹配。所以当你的正则无法匹配到内容时请确认所填写的正则表达式是否正确。检查正则边界条件是否满足。

操作步骤:
1.点击右侧调试下载页面全部内容
2.找到需要抓取的内容,复制前后的html标签(尖括号里面的内容)
3.将前后html标签复制到规则中,中间使用str1和str2中的按钮点击替换你需要抓取的内容,表示要抓取的内容
4.使用*替换会变化的字符串内容

样例:
下载到的部分源码

<div class="btn-group pull-right">

<span class="btn disabled"><i class="icon-arrow-left"></i></span>
</div>
<h1>
<a href="/article/110853">声 明</a>
</h1>
</div>
<div class="row">
<div class="span1 votecell">
<div id="votediv" class="vote">

识别规则:

<a href="*">[subject]</a>

识别内同为:

声 明

Finndy Copyright©2017 | Powered by Q2A

...