针对数据采集iframe无法获取列表简单修改

作者:动易软件 来源:本站原创 点击数: 发布时间:2018年07月06日

问题:假设如下网站列表采用iframe嵌套方式,那么我们在后台采集是无法获取到正确的文章列表源码。

分析:那么我们主要是获取到这个页面的文章列表地址。把这个页面从浏览器保存到桌面 然后吧这个静态文件放我们站点目录下 然后域名(ip)/静态文件名称,然后在文章列表地址输入域名(ip)/静态文件名称 这样我们就可以获取到这个被采集页面的地址列表

解决:

然后我们编辑这个下载来的页面看看 文章地址如下图

我们看到 文章列表地址相对路径的、那么我们可以通过软件Sublime Text3来进行批量修改。也就是把/xinwen/2018-07/06/content_5304061.htm"改为"这样方式。修改完成之后 保存。然后把这个文件放到我们网站目录下 这样就可以获取这个页面的列表了。但是也有个弊端 就是不能多页采集 只能一个列表一个列表的进行。