WordPress使用火车头采集器采集文章教程–分析目标网站要采集内容的位置及规则

教程总目录:

[neilian ids=2723]

我们首先打开一篇文章,看看他的基本结构:标题和内容起始,以及是否有重复。

从下图可以看到有标题重复,以及我们不需要的内容(他的广告)

WordPress使用火车头采集器采集文章教程–分析目标网站要采集内容的位置及规则

我们查看网页的源代码,CTRL+U

先搜索标题,看看标题都在哪些位置

WordPress使用火车头采集器采集文章教程–分析目标网站要采集内容的位置及规则

可以看到有三个位置都是标题,看到这三个位置,分析下前后的内容。最终我选择了第三个作为采集标题的位置。

因为前后和其他文章更不容易出现不同的情况。避免出现个别文章采集标题为空的情况。

WordPress使用火车头采集器采集文章教程–分析目标网站要采集内容的位置及规则

我们打开火车头采集器

将<h3 class=”mtop20 txt22″>作为标题的开头字符串

</h3>作为标题的结尾字符串

这两个字符串之间的内容,火车头会全采集下来,当做标题。所以不要选择错了

WordPress使用火车头采集器采集文章教程–分析目标网站要采集内容的位置及规则

我们可以复制文章链接,在火车头里先测试下标题才是是否正确。

在下面有填测试连接的位置

去看你博客原创文章,作者:去看你博客,如若转载,请注明出处:https://www.7kanni.cn/2767.html

(3)
去看你博客的头像去看你博客管理组
上一篇 2020-11-14 下午4:19
下一篇 2020-11-14 下午4:36

相关推荐

发表回复

登录后才能评论