- Nov17
-
今天simon 来跟大家谈一下搜索引擎是如何跟上互联网上亿万个网页的,互联网爬行并不是最高效的方式,新的网页被加上,旧的网页被删除,现有的网页随时都在发生变化--蜘蛛程序不会马上就知道你的网页时否发生了变化,等待蜘蛛程序回到这里发现这些变化,可能需要几天或者几周的时间,这就是为什么搜索者在点击搜索结果的时候,有时候会得到“网页没有找到的消息”蜘蛛程序在上一次爬行时候找到了这个网页,但此后这个网页被删除了 或者改变了地址,而搜索引擎无法立即知道拟进行了更改,所以出现了以上的情况。
这一点于对于机构的网站来说是特别麻烦的情况。你的网站可能会有频繁的变动的内容,例如产品目录会列出你每天有的产品,如果你经常有新产品上市,或者有经常变化的供应状态,你的网页与蜘蛛程序已经放到搜索索引库中的网页相比可能就很难成为匹配网页,淡然付费营销是可以很好的解决这个弊端的,还有当你的网站达到了一定的高度以后百度 或者 goole的更新频率也是相当的快的,甚至做到你发布文章或者 产品 10分钟收录,当然达到这种效果需要一定的时间。我们要时刻确保搜索引擎的索引库中保持“新鲜”
蜘蛛程序更加频繁的回放变动迅速的网站,如果一个蜘蛛程序在同一天内访问了两个网页,那么它再次回到这个网页的时间正好在一个月以后,如果这两个网页变了,另一个没有变,蜘蛛程序可以决定在两周之内回访变化过的网页,而在6周后才回访那个没有变化的网页,日积月累,这项技术会极大的改变蜘蛛程序的回访率,通过更频繁的回访最经常变动的网页来提高索引库的新鲜程度。
蜘蛛程序也经常访问那些网页质量最高的网站,例如google比其他网页往往更经常的访问pr相对高的网页,相关的因素其实很多的,比如内容的更新频率,外连的质量等等,所以决定一个网站排名的几个因素一个是网站的更新频率,一个是内容的质量还有外连的质量。
原创文章请注明转载自烟台网络营销顾问:提供烟台网站推广,网站优化,SEO培训等企业网络营销服务,本文地址:http://www.0535seo.cn/SEOfuwu/560.html



- 评论:(0)
- 引用通告
【已有0位网友发表了看法】点击这里获取该日志的TrackBack引用地址