网站文章被百度重复收录的解决办法

作者头像
首页 🌐建站技术 正文

最近感觉百度对于本站(阿影博客)的原创新文章的收录速度有点慢,猜测站点是不是存在什么问题,于是用百度搜索查看一下收录情况,搜索词的格式:site: aybk.cn

image.png

搜索出来的结果让我惊呆了,足足15000个,作为站长我咋不知道我的博客有这么多内容。第一反应就是肯定有问题,然后稍微往后翻了几页,果然就发现了问题

看到同一篇文章被重复收录了多次,唯一的区别仅仅是后面的动态查询参数不一样,由于我博客用的是hashover留言板,所以结尾的查询参数会带上?hashover-reply=***这样的格式,而百度蜘蛛不知道在什么情况下竟然都给收录了,有些朋友可能就会说了,都收录了不好吗?别人一看你的网站,收录量真多呀,其实不然,而且大错特错,重复收录会给我们的站点埋下巨大隐患。

一般来说,在搜索引擎在收录内容后会将动态页面剔除,但若频繁如此反复的收录剔除、剔除收录,最终将导致蜘蛛反感,直接影响蜘蛛爬行频率。另外若站点存在大量被收录的动态页没有被剔除,在未来搜索引擎更新快照时会被大批量剔除,这对于站点来说也是很不利的,严重的甚至会被百度K站,作为一个站长,这肯定是不能接受的,所以我们要想办法优化重复收录问题。

那么我们该如何做呢?这里建议大家可以从2个方面去尝试优化:

1、对于动态链接rel属性添加nofollow,当搜索引擎遇到添加了nofollowa标签之后,就不会再去抓取a标签指向的地址(href),已经收录的动态链接会自然剔除,未来的动态链接因为加了nofollow蜘蛛不会再收录,值得注意的是我们要注意严格为每一个出站链接添加nofollow,避免权重转移,当然交换的友情链接除外。

2、虽然方法1也能解决问题,但是手工改动有可能会出现漏网之鱼,更好的解决办法是在robots.txt文件中添加蜘蛛爬取的规则,我们可以按照特定的标识去添加,比如:

Disallow: /*?hashover-reply=*

当然一劳永逸的方法是直接将所有带有动态参数的链接都禁止蜘蛛抓取收录:

Disallow: /*?*

具体使用哪种方式,大家可以根据自己站点的情况去选择,在我们更新了robots文件之后,别忘了也要去百度站长工具平台检测并更新robots文件:

接下来就是静静等待规则生效,后期蜘蛛就不会再去抓取收录我们网站的动态链接,过段时间之后百度会把原来收录的动态页面自然清除,这个操作对于网站基本没啥影响。不过,有的站点可能会出现一小段时间快照停滞或者收录不好的情况,不用担心,后面会慢慢恢复,保持正常频率更新就好了。

好了,本文到此就结束了,如果你也在维护着自己的站点,赶快去查一下网站的收录情况吧

本站资源仅供学习交流使用请勿商业运营,严禁使用模板&源码从事违法,侵权等非法活动!如链接失效内容有误,请到评论反馈。

免费声明

  1. 本网站的文章内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长QQ:304906607进行删除处理。
  2. 文章采用: 《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)。
  3. 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
  4. 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
  5. 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
  6. 本站永久网址:https://www.aybk.cn
PC魔音Morin v2.7.6.0/听歌神器
« 上一篇 07-02
WordPress配置代理服务器请求
下一篇 » 07-02

发表评论

请先登录后才能发表评论

没有更多评论了

个人信息

HI好朋友 ! 请登录
开通会员,享受下载全站资源特权。
百度一下

随便看看

大家都在看

2025年 乙巳年 蛇年
13 : 36 : 00
公历日期
9月26日
农历日期
八月初五
星期
星期五
下午好
金秋时节,愿您收获满满
距离国庆节还有5天
登陆
还没有账号?立即注册
点击按钮进行验证
忘记密码?
登陆
忘记密码
已经有账号?马上登陆
获取验证码
重新获取(60s)
点击按钮进行验证
重置密码
注册
已经有账号?马上登陆
获取验证码
重新获取(60s)
点击按钮进行验证
立即注册