百度蜘蛛不抓取(网站蜘蛛不抓取怎么解决)
三石哥
2022-09-05 11:18:18
402
Baiduspider爬行异常的常见原因是网站不稳定,Baiduspider在尝试连接到您网站的服务器时暂时无法连接,可能是您的网站IP地址错误,或者是百度蜘蛛被域名服务商封禁。
有些网站的内容用户可以正常访问,但百度搜索百度的内容不能正常访问,导致大量的网站关键词搜索结果丢失,这种结果对网站和搜索引擎都是一种损失,百度搜索的网页不能正常的爬行称为“爬行异常” ,百度搜索会认为你的网站有用户体验上的爬行缺陷,减少你的网站得分,在网站的页面、索引、排序上会有负面影响,最终影响网站的流量。
下面介绍一些百度蜘蛛抓取异常的常见原因:
1、服务器连接异常
服务器连接异常一般有两种情况,一般是网站不稳定,百度搜索蜘蛛抓取你网站页面的时候出现无法抓取的情况,另一种是百度搜索蜘蛛不能正常连接你的网站服务器。
网站服务器不能正常连接的问题一般是网站服务器负载过大,也有可能是你的网站程序问题,首先检查网站web服务器(IIS或apache)是不是运行正常,并检查网站主页是不是可以正常打开,还要需要检查网站和主机是不是阻止了百度搜索蜘蛛的访问。
2、网络运营商异常
网站服务器网络运营商分为电信和联通两种,如果百度搜索蜘蛛无法通过电信或网通网络访问你的网站,出现这种情况,就需要与网站服务器运营商沟通,或者重新购买双线网站服务器空间,也可以购买网站CND服务。
3、DNS异常
当出现百度搜索无法解析网站IP地址的时候,就会同现网门dns异常的情况,这种问题可能是你的域名IP解析错误了,也有可能是域名服务商把百度蜘蛛给屏蔽了,这时候我们可以使用whois或者host查询自己的网站域名IP是不是解析正确了,如果是域名IP解析错了,重新解析域名就行了,如果无法解析,就需要联系域名注册商了。
4、IP封禁
IP封禁,限制了网站服务器出口的IP地址,禁止了某IP段的用户访问网站内容,这里主要指的是封禁了百度搜索蜘蛛的IP段,这种情况是你不希望百度搜索蜘蛛访问你的网站才需要封禁百度搜索蜘蛛的,如果你希望百度搜索蜘蛛访问你的网站,请需要添加百度搜索蜘蛛IP段,如果你没有封禁百度搜索蜘蛛IP段,也有可能是网站空间服务商把百度搜索蜘蛛IP段给封禁了,这种问题就需要找网站空间服务商解决了。
5、UA封禁
UA即为用户代理(User-Agent),网站WEB服务器通过UA识别用户身份,网站针对指定UA访问,返回异常状态码,例如403、500状态码,或者跳转到其它页面,这种情况就称之为UA封禁,这种情况是当你不希望百度搜索蜘蛛访问你网站的时候,才需要设置这个,如果你希望百度搜索蜘蛛访问你的网站,就需要检查网站服务器是否被UA封禁了,如果有就需要及时进行处理。
6、死链
页面已经无法打开,该页面已经无法对用户提供任何有价值的信息,这种页面就称之为死链接,死链接包括协议死链和内容死链两种形式:
1、协议死链,网站页面的TCP协议和HTTP协议状态明确表示的死链,常见状态码有404、403、503;
2、内容死链,指的是web服务器状态码返回正常,但内容却已经不在了,已经被删除或者需要权限才可以访问内容。
对于死链,我们建议站长使用协议死链,并通过站长平台向搜索引擎提交死链接地址,可以帮助搜索引擎更快的发现死链,减少死链对用户及搜索引擎造成的负面影响。
7、异常跳转
将用户网络访问请求重新指向其它位置,即表示为跳转,异常跳转一般指的是以下几种情况:
1)当前页面为无效页面,内容已删除或已经成为了死链,直接跳转到了前一级目录或者首页,百度搜索建议将死链接入口页面删除;
2)跳转到出错或无效页面。
注意:对于需要长时间跳转到其它域名的情况,例如新域名替换成新域名,百度搜索建议使用301永久重定向进行跳转。
8、其他异常
1)针对百度搜索refer的异常,网页针对来自百度的refer返回不同于正常内容的行业;
2)针对百度UA的异常,网页对百度UA返回不同于页面原内容的行为;
3)JS跳转异常:网页代码中加载了百度无法识别的js跳转代码,导致用户通过搜索进行网站页面后就发生了跳转行为;
4)网站抓取压力过大引起的偶然封禁,百度搜索会根据网站的规划、流量等情况,给网站设置一个合理的抓取压力。
如果网站抓取压力有异常情况,例如网站抓取压力出现失控的情况,这时web服务器会根据自身负荷能力启动临时性的封禁,例如向用户返回“Service Unavailable”,这里百度搜索会过段时间再来重新抓取网站链接,如果此时网站web服务器已恢复正常,则网站页面就会被成功抓取。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。
转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《百度蜘蛛不抓取(网站蜘蛛不抓取怎么解决)》
- 上一篇: seo技巧组合(网站搜索引擎优化的步骤)
- 下一篇: 蓝天算法升级(百度升级蓝天算法)
- 搜索
- 最新文章
- 热门文章
-
- 抖音内测的“DOU分期”是什么?抖音“DOU分期”有哪些功能?
- 自媒体如何布局热门事件关键词?自媒体热门事件关键词写作技巧有哪些?
- 抖音视频不能出现哪些敏感词?抖音视频敏感词有哪些?
- SEO标题如何优化?SEO标题优化有哪些方法?
- 抖音发布内容不符合社区规范是怎么回事?怎样避免违规?
- 抖音运营如何快速提升播放量?抖音播放量快速提升的方法有哪些?
- 提高网站用户体验的10种方法(让用户留下来的有效途径)
- 抖音直播间如何播放音乐?抖音直播间开音乐的方法有哪些?
- 如何制定高效的网站内容优化策略(内容更新及外链建设技巧)
- 优化网站设计的十五个技巧
- 抖音被限流后还要继续发作品吗?抖音限流后如何恢复流量?
- 拼多多与淘宝购物体验:质量与服务的较量
- 抖音粉丝不到1000可以直播吗?抖音直播对粉丝数量有要求吗?
- 新手怎样做好抖音账号定位?抖音账号定位有哪些要点?
- 社交媒体的SEO优化策略(实现社交媒体平台上的品牌曝光和用户增长)
- 小红书自营商品都是正品吗?小红书自营产品如何保证质量?
- 抖音粉丝达到1000需要怎么做?抖音涨粉到1000的方法有哪些?
- 常用于解决读者的疑问,通过问答形式引导读者理解文章内容(掌握5个技巧)
- 网站优化关键词怎么设置?网站关键词优化有哪些技巧?
- 2025年如何从零开始快速运营抖音账号?从零运营抖音账号的步骤是什么?
- 热门tag