搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读


搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读

文章插图
搜索引擎蜘蛛抓取流程原理图
你的网页要参与搜索引擎关键词排名 , 只有当你的网页被搜索引擎收录了才有资格 , 否则连参与排名的资格都没有 , 至于排在哪一页 , 这个就得是搜索引擎算法说了算了 , 搜索引擎算法分析你网页内容的当前价值 , 然后根据你网页的价值给出你网页关键词合理的排名 。
搜索蜘蛛抓取流程:先抓取网页—临时索引库—分析筛选—正式索引库—最后才能参与网页关键词排序 。

搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读

文章插图
spider抓取系统的基本框架图
搜索蜘蛛的工作流程步骤为先抓取网页内容 , 再分析抓取回来的网页内容 , 内容合格则收录此内容 , 不合格则不收录此内容 , 每时每刻不停的重复此步骤 , 可将搜索引擎简单地理解为是一个内容抓取程序 。
1、http的工作原理
在浏览器中输入网址向网站服务器端发送一个http访问请求 , 服务端接收到此请求并进行解析 , 向客户端以http的形式进行响应 , 并以图文并茂的形式展现在用户眼前 。
对于服务端来说 , 向客户端返回的都是http代码 , 它并不知道返回是文字还是图片 , 最后返回的结果是需要浏览器渲染用户才可以看到图文并茂的网页 。
作为SEO优化工作人员 , 对于搜索引擎的工作原理我们还是需要了解一点的 。

搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读

文章插图
http的工作原理图
2、搜索引擎抓取三步曲
搜索蜘蛛对于一个新网页内容 , 先会抓取网页链接 , 再进行分析过滤网页链接内容 , 达到收录标准的内容则进行收录 , 未达到收录标准的内容则直接删除了 , 已收录的内容根据搜索算法规则进行排序 , 最后呈现关键词查询与排序结果 。
作为我们只需要知道搜索引擎蜘蛛抓取的三步曲就行了 , 为“抓取—过滤—收录”这么一个过程 。

搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读

文章插图

二、如何提升抓取减少过滤
搜索引擎蜘蛛都是以匿名身份抓取所有网页内容的 , 如果你的网页内容加了密 , 需要输入帐号密码才可以访问 , 那么这种网页搜索引擎是无法进行正常抓取的 , 需要网页开放加密权限才可以抓取 , 如果你的网页内容需要参与搜索排名 , 一定千万注意不要限制了搜索引擎抓取网页内容 。

搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读

文章插图

无ALT属性的图片、视频、JS文件、flash动画、ifame框架等内容搜索引擎都是不能识别的 , 搜索引擎只能识别文字和数字 , 如果你的网页中存在有搜索引擎不能识别的内容 , 就很有可能会被搜索引擎蜘蛛给过滤掉 , 所以我们在设计网页的时候 , 就要避免在网页中加入搜索引擎不能识别的内容 , 如果你的网页内容都不能被搜索蜘蛛给识别到 , 又何谈收录及排名了?
【搜索引擎工作原理分析及搜索蜘蛛抓取收录排名策略解读】 搜索蜘蛛抓取了网页内容后 , 第一步就是过滤 , 过滤掉不符合搜索引擎收录标准的内容 , 搜索蜘蛛收录网页内容基本步骤为筛选、剔除、再筛选、收录到正式索引库 , 正式收录网页后接着就是分析当前网页内容的价值 , 最后就是决定当前网页关键词排序的位置 。
筛选过滤我们可简单理解为对无价值、质量度低的内容进行剔除 , 保留对用户有价值、质量高的内容 , 如果你想提高你网站内容的收录率 , 就建议多更新对用户有价值质量高、符合搜索收录规则的内容 , 不要更新低质拼接的垃圾内容 。

相关经验推荐