混乱的腾讯搜搜快照?
昨天在百度520大翻新运动的刺激下,零才将微博的主题(Topic)再次做了调整,准备将话题不仅仅局限在网络推广方面,扩展至互联网产品方面,多多分享零才对眼见的一些互联网产品的体验和看法。于是,零才将博客名称调整为了零才博客,首页title设为“ 零才博客-关注网络推广与互联网产品原创博客”,而没想到今天在查看搜搜的收录时标题竟然被更新了。
然而从上图很容易看到,网址后面的日期并不是快照的日期,因为这条搜索结果的标题、描述都是零才昨天修改的,在4月30肯定不是这样的。于是零才点击后面的“快照”链接,看到了真实的快照如下:
从页面结果我们可以看出,搜搜采集的时间是5小时前,即今天15:30左右,而且整个页面的内容确实是今天的,即采集时间确实是这个时候,但是为什么索引结果显示的日期还是2011-04-30呢?难道这个不是快照时间,那这是什么时间呢?
搜搜和google一样,也在搜索结果左侧提供了结果筛选,同样是这个页面(http://www.soso.com/q?bs=%CB%D1%CB%D1%CA%B9%D3%C3&num=10&w=www.0cai.net&ch=w.tf&sf=0&sd=0&nqr=0),我们选择左侧时间搜索的“一天内”,结果竟然是零,这岂不是与前面的采集时间5小时前相矛盾?而当我们将时间锁定为“一周内”时,结果才显示了一篇内容,即昨天发布的百度520大翻新运动这篇文章,而且这里显示的时间为2010-05-20,点击查看快照显示采集时间为11-05-20 15:11,这里倒是比较准确了。
所以,搜搜的快照时间处理上给人的感觉还是有点混乱,明明是最新的内容,时间却不是最新的,难不成机器偷懒了?不过零才的猜测是搜搜的索引缓存机制,即搜搜蜘蛛采集已采集过的内容后,给予了内容上的更新,但快照时间上仍然保留上次大更新的缓存日期。不过这也是零才的一点猜测,具体如何还有待官方或专业人士解答!