采集模块使用方法 发布时间:2017-11-27 16:29:26  

采集方法使用步骤

1、添加采集点,填写规则

2、采集网址与内容

3、发布内容

 

 

1、添加采集点

采集项目名:填写自己便于记忆的名字

采集页面码:采集目标的页面编码

网址类型:需要采集目标网址的类型

网址配置:要采集对目标网址

网址配置:采集内容的限定,设置详细规则

Base配置:目标网址有设置的话就要填写

<base> 标签为页面上的所有链接规定默认地址或默认目标

获取网址:查看目标网址的源码找到需要采集的开始点和结束点(这两个点在源码内要有唯一性),从而进一步的缩小采集范围

添加采集点

填写完规则后就可以提交点击测试来看采集结果了

图片8.png


内容规则

1、匹配规则请设置开始和结束符,具体内容使用“[内容]”做为通配符 。

2、过滤选项格式为“要过滤的内容[|]替换值”,要过滤的内容支持正则表达式每行一条。

标题规则:从网页<title></title>里取标题,并去除不需要的字符

内容规则:整个页面源代码中具有唯一性。并对内容进行过滤。  

 标题规则

 内容规则


高级配置

可以设置下载的图片下载到服务器和是否打水印等选项

 采集规则高级配置


2、采集网址与内容

配置好规则后就可以进行网址采集与内容采集,最后进行内容发布

内容发布


3、发布内容到指定栏目

选择已采集的数据进行导入

选择合适数据导入

选择导入栏目

选择导入栏目

其它配置选项

其它设置

采集标题要对应数据库字段

选择采集对应字段

采集内容要与数据库字段建立对应

采集内容与数据库对应

设置 采集内容与数据库的字段对应关系.提交进行数据入库,在此期间请耐心等待, 完成后会自动转向。


上一篇:msvod v9 标签调用

下一篇:msvod v9 内容页标签汇总