设置首页
|
加入收藏
|
联系我们
首页
┊
新闻
┊
Linux知识
┊
数据库
┊
网络应用
┊
企业应用
┊
程序设计
┊
网站设计
┊
Linux发行版
┊
交流论坛
您的位置:
主页
>
网络应用
>
搜索引擎优化
>正文
搜索引擎的缓存机制
文章来源:Linuxdby.com 编辑: 发布时间:2007-11-19
以前曾经提到过搜索引擎的缓存策略, 根据搜索引擎搜索的关键词的统计分布, 可以优化设计搜索引擎的缓存策略. 就普通的缓存策略上讲, 缓存是因为在一定的时间段内的搜索的关键词集中在一定的范围内, 并且这些搜索相对稳定. 例如每天搜索"美女"的人总有10万,20万, 而结果在这段时间相对稳定, 因此没有必要每次去检索索引文件, 而把上一个人搜索的结果直接返回便可以了.
搜索引擎缓存策略也同搜索引擎的算法密切相连, 除了搜索缓存, 索引缓存也是一个好方法. 独立或者分布一些权重较高的文档也是一种提高效率的方法. 例如我们有1000万的网页的权重(可以简单的理解为pagerank)比较高, 那么这些网页的排序相比另外一些权重较低的网页相对较为稳定, 就不妨独立出来进行相对独立的索引缓存.
关于缓存的分布, 一般的小型搜索引擎不会用到, 但是如果每天处理上亿次的搜索, 缓存的分布就应当有一定的分布规划, 例如根据提交的关键词构成hash table, 然后对应于不同的搜索服务器, 实现缓存的分布.
让我们看看实际例子吧, 我们拿百度, google, yisou, 中搜, tag.bokee.com 进行简单的测试:
因为测试, 要搜索一些在过去7天没有人搜索过的关键词, 或者组合词. 为了保证没有人搜索过, 我选择在各个搜索引擎里搜索"a s d f v g h" , 这是我在键盘上随机打出的一些组合, 相信这世界上在7天没有人相同搜索, 这样保证我的第一次的搜索是 fresh search, 就是一定需要搜索引擎去检索索引文件, 而不是通过缓存策略.
以下是结果:
百度: 0.279秒
google: 0.24 秒
一搜: 0.24 秒
中搜: 0.001秒(无结果!!!!)
博客搜索: 0.041 秒
下面是第二次搜索的结果:
百度: 0.001秒
google: 0.05 秒
一搜: 0.09 秒
中搜: 0.002秒(无结果!!!!)
博客搜索: 0.019 秒
经过简单的测试, 可以看出缓存机制只有在Baidu和google搜索引擎里都有, 但是各自效率不一样, 如下是简单的比例:
百度: 100
google: 5
一搜: 没有明显的缓存
中搜: 没有明显的缓存
博客搜索: 没有明显的缓存
而在缓存效率上百度要远远大于google, 这点大概是因为google的gfs本身的分布效率已经相当不错, 因此进行缓存也不会有数量级的提升.
而百度, 根据测试可能是集中方式的数据存储, 但是根据搜索进行hash分布, 因此才会在缓存上有显著的提升. (这个属于猜测)
Tags:
机制
搜索引擎
搜索
分布
没有
结果
策略
相对
一些
一定
输入您的搜索字词
提交搜索表单
Web
linux.jansfer.com
上一篇:
关键字和关键字优化
下一篇:
搜索引擎优化SPAM的清理规则
【返回顶部】
【打印】
【大】
【中】
【小】
【关闭】
我来说两句
用户名:
(
新注册
) 密码:
匿名评论 [
论坛讨论
]
评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
相关文章
·
关键字和关键字优化
·
搜索引擎优化SPAM的清理规则
·
SEO优化之-标题标签
·
SEO Questions
·
SEO网站推荐
·
网站首页head区代码规范
·
链接流行度(LinkPopularity)
·
中文Wiki网站列表
·
门页(Doorway Pages)
·
斑竹宝鉴
热门文章
·
百度今天有点异常
·
Google VS 百度
·
SEO服务价格的影响因素
·
SEO入门书籍及个人心得-原创
·
下载类网站TITLE写法对比实验
·
怎么样让你的页面被搜索引擎
·
Flash全站SEO方式,属作弊慎
·
我是怎么样把关键词“SEO”上
·
价值12万元的网络营销策划方
·
SEO-SEM术语
版权所有 2005-2006
Linux集中营
闽ICP备07500055号