WordPress使用火车头采集器采集文章教程–寻找目标网站

教程总目录:

我们首先需要确定你要采集什么内容,然后根据不同内容去找目标网站。

比如我要采集IT资讯、云服务器类的内容。

以景安的文章为例,我先找到了他的文章都放在了哪个网站。

在百度这样搜索site:zzidc.com windows2008

site:zzidc.com代表仅搜索这个域名下的内容,包括www域名和其他二级域名的内容

空格后跟一个windows2008的关键词,这样我搜出来都是景安网站下的关于windows2008的相关内容了。

WordPress使用火车头采集器采集文章教程–寻找目标网站
从搜索结果里可以看到主要有两个域名地址,我选择了server.zzidc.com这个站点,因为这个内容多!

站点里有很多文章,我们要寻找自己想采集的文章。我选择了服务器教程相关的文章

WordPress使用火车头采集器采集文章教程–寻找目标网站

点击这个分类,看看,里面有33页的列表,数量还可以

现在在列表第一页,他的地址是https://server.zzidc.com/fwqjc/

然后我们翻页看一下第二页,发现地址变成了https://server.zzidc.com/fwqjc/list_7_2.html

第三页变成了https://server.zzidc.com/fwqjc/list_7_3.html

这就有一个比较好的列表页规律,非常适合我们采集。

就选择它了!

下面我们就打开火车头采集器吧,后面的要配合采集器来操作。

请看后续教程

去看你博客原创文章,作者:去看你博客,如若转载,请注明出处:https://www.7kanni.cn/2734.html

(3)
去看你博客的头像去看你博客管理组
上一篇 2020-11-14 上午11:29
下一篇 2020-11-14 下午4:10

相关推荐

发表回复

登录后才能评论