造成Baiduspider抓取异常的原因


造成Baiduspider抓取异常的原因

文章插图

下面向站长介绍一些常见的抓取异常原因:
? ? ? ? 1 , 服务器连接异常
服务器连接异常会有两种情况:一种是站点不稳定 , Baiduspider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baiduspider一直无法连接上您网站的服务器 。
造成服务器连接异常的原因通常是您的网站服务器过大 , 超负荷运转 。 也有可能是您的网站运行不正常 , 请检查网站的web服务器(如apache、iis)是否安装且正常运行 , 并使用浏览器检查主要页面能否正常访问 。 您的网站和主机还可能阻止了Baiduspider的访问 , 您需要检查网站和主机的防火墙 。
2 , 网络运营商异常:网络运营商分电信和联通两种 , Baiduspider通过电信或网通无法访问您的网站 。 如果出现这种情况 , 您需要与网络服务运营商进行联系 , 或者购买拥有双线服务的空间或者购买cdn服务 。
3 , DNS异常:当Baiduspider无法解析您网站的IP时 , 会出现DNS异常 。 可能是您的网站IP地址错误 , 或者域名服务商把Baiduspider封禁 。 请使用WHOIS或者host查询自己网站IP地址是否正确且可解析 , 如果不正确或无法解析 , 请与域名注册商联系 , 更新您的IP地址 。
4 , IP封禁:IP封禁为:限制网络的出口IP地址 , 禁止该IP段的使用者进行内容访问 , 在这里特指封禁了BaiduspiderIP 。 当您的网站不希望Baiduspider访问时 , 才需要该设置 , 如果您希望Baiduspider访问您的网站 , 请检查相关设置中是否误添加了BaiduspiderIP 。 也有可能是您网站所在的空间服务商把百度IP进行了封禁 , 这时您需要联系服务商更改设置 。
5 , UA封禁:UA即为用户代理(User-Agent) , 服务器通过UA识别访问者的身份 。 当网站针对指定UA的访问 , 返回异常页面(如403 , 500)或跳转到其他页面的情况 , 即为UA封禁 。 当您的网站不希望Baiduspider访问时 , 才需要该设置 , 如果您希望Baiduspider访问您的网站 , useragent相关的设置中是否有Baiduspider UA , 并及时修改 。
6 , 死链:页面已经无效 , 无法对用户提供任何有价值信息的页面就是死链接 , 包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链 , 常见的如404、403、503状态等 。
内容死链:服务器返回状态是正常的 , 但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面 。
【造成Baiduspider抓取异常的原因】 对于死链 , 我们建议站点使用协议死链 , 并通过百度站长平台--死链工具向百度提交 , 以便百度更快地发现死链 , 减少死链对用户以及搜索引擎造成的负面影响 。
7 , 异常跳转:将网络请求重新指向其他位置即为跳转 。 异常跳转指的是以下几种情况:
? ? ? ? 1)当前该页面为无效页面(内容已删除、死链等) , 直接跳转到前一目录或者首页 , 百度建议站长将该无效页面的入口超链接删除掉
? ? ? ? 2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况 , 如网站更换域名 , 百度建议使用301跳转协议进行设置 。

相关经验推荐