siteAzure系统内容采集功能简介

作者:动易软件 来源:本站原创 点击数: 发布时间:2017年05月09日

本文档描述siteAzure采集功能使用及配置。siteAzure在内容采集方面更简单更易用,相信通过本文档可以让您快速掌握采集功能使用。首页我们在采集功能,新建1个采集项目。如图:

采集项目名称及采集网站名称这俩个必填项目没有特别的要求,根据实际情况填写即可。

采集网址这个要填写被采集网站栏目的列表地址,如新闻列表地址,通知列表地址。

采集数量默认是0,为全部采集。需要采集具体数目则写上具体数据即可。

特别注意所属节点这里要选择采集到本站的具体栏目。不要忘记。

一切准备,点击下一步,转到步骤2。

看看截图,点击列表的第一条,然后再点击第二条,就获取了需要被采集的整个列表。

当然,有需要的话,还可以点击高级模式进行采集规则设置。

点击下一步,转到步骤3。

设置分页,与SF系统分页设置基本一致。根据网页分页情况选择合适的分页即可。

点击下一步,转到步骤4。

点击设置采集规则进行各个字段的采集规则设置。如果还需要采集内容来源,发布时间之类的字段可以点击左侧的加号,进行需要采集的字段增加。

采集的字段规则也都是可视化,基本是点击需要采集的内容即可获得。

对于比较特殊,需要过滤功能,或者其他设置的可以使用高级模式。

设置好需要采集的字段规则点击,转到步骤5。

在采集定时里面可以根据实际要求配置每天,或者每周等特定时间段进行数据自动采集。

完成无需人工。只管审核采集回来的数据即可。

至此,整个内容采集过程结束。