siteAzure系统内容采集功能简介
来源:本站原创
点击数: 次
发布时间:2017年05月09日
本文档描述siteAzure采集功能使用及配置。siteAzure在内容采集方面更简单更易用,相信通过本文档可以让您快速掌握采集功能使用。首页我们在采集功能,新建1个采集项目。如图:
采集项目名称及采集网站名称这俩个必填项目没有特别的要求,根据实际情况填写即可。
采集网址这个要填写被采集网站栏目的列表地址,如新闻列表地址,通知列表地址。
采集数量默认是0,为全部采集。需要采集具体数目则写上具体数据即可。
特别注意所属节点这里要选择采集到本站的具体栏目。不要忘记。
一切准备,点击下一步,转到步骤2。
看看截图,点击列表的第一条,然后再点击第二条,就获取了需要被采集的整个列表。
当然,有需要的话,还可以点击高级模式进行采集规则设置。
点击下一步,转到步骤3。
设置分页,与SF系统分页设置基本一致。根据网页分页情况选择合适的分页即可。
点击下一步,转到步骤4。
点击设置采集规则进行各个字段的采集规则设置。如果还需要采集内容来源,发布时间之类的字段可以点击左侧的加号,进行需要采集的字段增加。
采集的字段规则也都是可视化,基本是点击需要采集的内容即可获得。
对于比较特殊,需要过滤功能,或者其他设置的可以使用高级模式。
设置好需要采集的字段规则点击,转到步骤5。
在采集定时里面可以根据实际要求配置每天,或者每周等特定时间段进行数据自动采集。
完成无需人工。只管审核采集回来的数据即可。
至此,整个内容采集过程结束。