飘易博客(作者:Flymorn)
订阅《飘易博客》RSS,第一时间查看最新文章!
飘易首页 | 留言本 | 关于我 | 订阅Feed

百度快照惊现1970年网页

Author:Flymorn Source:飘易博客
Categories:SEO技术 PostTime:2008-4-3 12:57:17
正 文:
    我在前两天的帖子里就提到百度快照出现了1970-1-1这个时间的网页快照,不得不令人感到惊讶。1970年百度还没出生,中国互联网还没开始发展呢,这个时间很是诡异,难道清明节来了,百度的快照也要祭拜一下祖先?

    下面是我在百度里的截图,截图不止一个,看来百度有1970年的网页快照不是偶然。
百度快照惊现1970年网页

百度快照惊现1970年网页

百度快照惊现1970年网页

    这几张图只是我发现的几个,我想没有被我发现的还有更多。打开正在使用的Windows XP系统时间,可以看出XP的系统时间是从1980年开始到2099年这个时间范围里的。很明显,百度的快照服务器不是俺们用的XP系统了,嘿嘿。如果是XP系统,它出错也不至于弄出个1970年而应该是1980年,不过无论是1970年还是1980年,我都没出生呢。

    听说,目前流传一个时间病毒很厉害,会自动修改系统的时间到1970年,你手动改好时间,一会这个病毒又自动改成它的初始时间。难道,百度的服务器也中毒了?!百度那么NB的工程师不至于要我来教嘛。

    应对措施:采取这个方法来对付这类顽固的病毒――就是取消当前所有时间修改权限,让病毒也没有权限去修改时间。

    不过,我想百度肯定没有时间来看我的这篇文章了。暂且一笑而过。

    我们再来看linux操作系统,linux的内核时间实际上是记录从1970年1月1日距离现在的秒数,并且以GMT(格林尼治时间)(或者叫UTC- Coordinated Universal Time)为标准,UTC是不随着DST(夏令时)变换,需要有变化的是由应用程序自身来完成时间的转换。

    所有32位电脑系统都用带符号32位整型来存储Time_t的值,也就是说Time_t只能用31位二进制数来表示(第一位用来表示正负号),Time_t是C/C++ 等编程语言在内部代表/存储日期和时间的一种数据类型。Time_t实际上是一个代表秒数的整数,当它的值为0时,代表的时间是1970年1月1日12:00:00;当Time_t=60时,则表示1970年1月1日12:01:00,依此类推。

    根据百度快照的这个时间的情况,难道百度服务器系统已被破坏?!从而使得抓取这些网页的时候,系统自动调用了初始时间1970年?

    从另一个方面来看,这些个1970年的网页在百度里的排名还是不错的,有的甚至排在前三名;那也可以看出,百度快照出现1970年的网页也不是百度要惩罚这些网站的手段了。百度的姨妈又来了。不过这个错误,还不至于对百度的用户搜索体验产生多大的影响,因为百度的搜索体验本就 “Just SO SO” !
作者:Flymorn
来源:飘易博客
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。
上一篇:PHP伪造来源HTTP_REFERER的方法讨论
下一篇:4月1日愚人节:今天是一个重要的日子
13条评论 “百度快照惊现1970年网页”
2008-4-3 21:40:19
以前就见过此现象了
窃以为是百度spider在抓取网页时,系统出现了问题。
2008-4-3 21:48:56
百度太强了,从1970年就开始关注互联网了,哈哈
还好没什么太大的影响。
2008-4-5 17:34:41
个人认为是这些网站服务器中毒了,而不是百度服务器中毒了,百度会分析服务器时间然后进行创造网页快照,突然有一个意想,那么我们创建一个老网站是不是就很简单了.
4 Flymorn
2008-4-5 19:14:26
呵呵,有传闻说百度快照时间抓取的是网页生成时间……
5 寒冰
2008-4-6 11:38:45
老大,我想加入dush,但是现在论坛已经不能注册了.
你可以帮我注册一个账号么?
谢谢.我的邮箱是asp_admin@163.com
6 Flymorn
2008-4-6 11:57:19
寒冰,可以找点石版主,你可以把你的理由写的详细点,直接发EMAIL到zanhui@gmail.com(ZAC)或wzwmail@gmail.com(樂思蜀),并写上你希望注册的用户名和密码。
7 º®±ù
2008-4-10 19:47:24
谢谢你.十分感谢
8 寒冰
2008-4-10 20:00:21
在建站的过程中,我遇到了一个问题.
网站的URL优化
例如有www.abc.com/html/20080403/125.html
www.abc.com/html/WoGaBuDeWenZhangBiaoTi/index.html
我的网站里的内容页的URL我都是以第二种形式生成URL的.
网站被BAIDU收录的还不错.但是关键词排名真的不行.
网站的关键词来路都是首页的,几乎没有内页的.
是不是我的URL太长的原因.
谢谢你..
9 Flymorn
2008-4-10 21:35:55
寒冰,url所起的作用只是搜索引擎众多排名因素的一小分子,作用并不大,关键是优质的内容;
另外,我个人认为www.abc.com/FenLei/WenZhangBiaoTi.html这样的形式更有利于排名。
10 康泰网
2008-4-15 14:26:39
我的系统就被改了时间,具体什么时间忘记了,种了磁碟机病毒,没有2000年-2010的时间 哈哈哈
2008-4-17 22:25:25
回访来了~~
您的文章技术性太强了,实在找不到能看懂的东西,就这个还不错。
估计是百度的蜘蛛出问题了~1970年中国还没互联网吧
12 欧阳
2008-6-18 23:39:19
百度也出错?
2010-5-12 16:18:28
今天百度又出现这个问题了 啊哈
发表评论
名称(*必填)
邮件(选填)
网站(选填)

记住我,下次回复时不用重新输入个人信息
© 2007-2010 飘易博客 Www.Piaoyi.Org 原创文章版权由飘易所有 渝ICP备07006361号