让火车头采集器只采集第一张图片的解决方法

火车头采集器是一款比较强大的采集工具,很多站长也都在使用,金华也不例外。最近金华在使用这个采集器的时候,碰上一个问题,网上搜索了很久之后都找不到答案,问了群里的朋友、官方的客服,都没有得到解决,SO,自己动手,丰衣足食!

目标:只采集第一页第一张图片

由于要采集的目标站点喜欢将一篇文章分成很多页,每一页又单独配了一张图片。我们采集的时候经常会连同内容当中所有的图片都采集下来,但是像我碰上的这个情况,又只是希望只采集第一页的第一张图片,其它分页的图片不想采集。这样做的好处是既可以节约空间,又可以组织更多的有用的文字内容展现给用户。

实现过程:

在昆哥的帮助下,终于找到一种解决方法,虽然不算完美,但至少在当前能解决这个问题

1、在任务的第二步:页面内容标签定义  这里增加一个新的标签,命名为图片,如下图

2、在图片标签中过滤出自己要的图片代码,通常是带<img alt=”” src=”” />这种格式,请不要在此标签中勾选:该标签在分页中使用,这样就只会采集第一张图片

3、在内容标签中将图片过滤,这里不要勾选下载图片

4、在发布模块中的body当中增加一个参数,如:body=[标签:图片][标签:内容]&,默认body当中只有内容标签,所以我们将我们新增的图片标签加到body当中去,在我们发布文章时将会直接将采集到的第一张图片发布到内容中去。

通过这样的方式,可以达到我们只采集第一张图片的功能。

目前对于这个小功能的建议已经提交给火车头官方了,希望在新版V7当中能够加上,使得火车头更人性化。

火车头是一个强大的工具,我们做网站不可能所有的内容都原创,适当的用好采集将会使你的网站更快的丰富起来。不建议纯采集,如谷歌站长指南当中所说的一样,一定要加上对用户有用的内容,体现出你网站的特色,避免被搜索引擎当作重复内容来处理。

未经允许不得转载:邝金华博客 » 让火车头采集器只采集第一张图片的解决方法

赞 (0)

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. 冷库看完之后,确实有所收获,继续加油~回复
  2. 智能家居火车头还不会用来着。。。回复
  3. 减肥门会常来看看的。回复
  4. 减肥门多谢分享。回复
  5. 北京seo文章写的很犀利,,我表示继续关注回复
  6. 宫颈糜烂治疗 火车头采集不错啊。。博主分析的很有启发性 。。你的站好了。我们才好。支持顶一个。。。 宫颈糜烂可以用药物治疗吗http://www.aiseni.org回复
  7. 束素励志网还没用过火车头回复
  8. AdWords不错回复
  9. 中频电炉一直没有玩过这个回复
  10. 在线斗地主在线斗地主http://doudizhu.yinheyule.com/回复
  11. 淘宝seo最近做了个新站,却忙不过来,一直在考虑要不要采集回复
  12. 淘宝网女装火车头还是比较好用的 有很多程序都支持 你想做一个大型的网站 采集下来 然后再给个批量伪原创 还是没多大关系的回复
  13. 单人操作火车头一直没有用过,个人认为,还是不要用火车头的好回复