采集节点管理
添加采集节点
导入采集规则
第一步:基本参数填写
第二步:采集内容规则设置
第三步:在线模拟预览结果
完成并演示
基本规则
内容规则
模拟测试
节点基本信息
采集项目名:
采集目标页面编码:
checked value="gbk" class="radio"> GBK
checked="checked" value="utf-8" class="radio"> UTF-8
checked="checked" value="big5" class="radio"> BIG5
数据栏目分类:
checked="checked" onclick="show_switch(this,'class','show');show_switch(this,'baserule2','hide');menucheck();">固定分类
checked="checked" > 智能分类
style="display:none;">
所属栏目分类:
选择栏目分类
selected>├─{$gxcms.cname}
selected>├──{$gxcms.cname}
采集方式:
checked="checked" value="desc" class="radio" >倒序采集
checked="checked" value="1" class="radio" >采集完毕自动入库
采集网址
网址类型:
checked value="1" class="radio"> 序列网址
checked="checked" class="radio"> 多个网页
checked="checked" class="radio"> 单一网页(直接采集内容页)
style="display:none" >
采集地址:
value="{$urlpage}">
(如:http://www.xxx.com/lists/p/(*).html,页码使用
(*)
做为通配符。
页码从:
到
每次增加
style="display:none">
采集地址:
{$urlpage}
每行一条
style="display:none">
采集地址:
value="{$urlpage}">
style="display:none">
采集地址:
value="{$urlpage}">
采集地址:
网址中必须包含
网址中不得包含
获取图片方式:
checked="checked" onclick="show_switch(this,'getpic','show');show_switch(this,'baserule8','hide');">从列表页获取
checked="checked"> 从内容页获取
style="display:none;">
提取链接中图片:
{$picurl_rule}
[内容]
过滤选项:
{$picurl_filter}
获取网址:
从采集目标页面中
{$url_start}
到
{$url_end}
结束
1、匹配规则请设置开始和结束符,具体内容使用“[内容]”做为通配符 。
2、过滤选项格式为“要过滤的内容[|]替换值”,要过滤的内容支持正则表达式,每行一条。
采集字段
checked="checked"
checked="checked";
onclick="show_switch(this,'baserule{$k}','show')"/>{$vo}
可选采集规则
style="display:none;"
if(in_array($key,$fields)) {echo $key.'style=display:block';}else{echo 'style="display:none;"';}
>
{$vo}规则:
{$title_rule|default="
[内容]
"}
$a=$key.'_rule';echo $$a;
[内容]
过滤选项:
$b=$key.'_filter';echo $$b;
播放地址规则
播放列表范围:
checked="checked" class="radio"> 开启
checked="checked" value="2" class="radio"> 关闭
style="display:none;">
播放列表范围规则:
从影片内容页面中
{$playlist_start}
到
{$playlist_end}
结束
获取播放地址方式:
checked="checked" value="1" class="radio"> 播放页获取单个地址
checked="checked" value="2" class="radio"> 播放页获取所有地址
checked value="3" class="radio"> 内容页直接获取地址
style="display:none;">
播放链接规则:
{$playlink_rule}
[内容]
过滤选项:
{$playlink_filter}
播放地址范围:
checked="checked" class="radio"> 开启
checked="checked" value="2" class="radio"> 关闭 (选择在播放页获取影片播放地址,该功能设置才有效)
style="display:none;">
播放地址范围规则:
从影片播放页面中
{$playurl_start}
到
{$playurl_end}
结束
播放地址规则:
{$playurl_rule}
[内容]
过滤选项:
{$playurl_filter}
分集名称设置方式:
checked="checked" value="1" class="radio" onclick="show_switch(this,'field_vname','hide')"> 系统默认设置
checked="checked" id="_2" value="2" class="radio"> 采集分集名称
style="display:none;">
分集名称规则:
{$vname_rule}
[内容]
过滤选项:
{$vname_filter}
测试采集结果预览
确定要预览吗?