飘易博客(作者:Flymorn)
订阅《飘易博客》RSS,第一时间查看最新文章!
飘易首页 | 留言本 | 关于我 | 订阅Feed

我和自动发帖机的斗争过程:终于屏蔽垃圾信息了

Author:Flymorn Source:飘易博客
Categories:Asp编程 PostTime:2008-4-12 10:54:12
正 文:
    关于如何屏蔽自动发帖机发帖,我在飘易博客里写过一篇文章《如何防止网站垃圾留言评论的肆略》,在这篇文章里讨论了一些防止机器自动发帖的方法。然而,时至近日,仍然有一些垃圾信息堂而皇之的出现在我眼前,这岂不是公然挑衅么!

    所谓魔高一尺,道高一丈。机器发帖和反机器发帖一直都是场硝烟弥漫的豪华战争。前阵子我从别人手里接过重庆二手网(www.cq2sw.com),然后上传了一套自己编写的asp网站程序,自网站开放之日起,这个垃圾信息就没有消停过,而且这个垃圾发帖的时间都有一定的规律,一般是从上午9点、10点的时候开始,到下午下班前这段时间,是发帖机发动的时候,看的出来,发帖机的操作者也是一个正常上班的“好同志”。

    从发帖机发布的信息来看,操作者也刻意优化了下信息内容,以免信息过于垃圾,直接导致发帖被屏蔽而失败;有时候,我看着这些内容,还真为这些操作者们拍案叫绝,因为连我差点都被这些机器发的帖子给迷惑住了。但是,从连续的几个帖子发布的时间间隔来看,有的竟然是同一秒钟发布出来的!只要你真的是个人在发贴,发一个帖子就打几个汉字怎么着也要几十秒吧。

    很多时候,我不得不佩服这些发帖机的开发者们,有些发帖机的确够强悍,像伪造来路,伪造cookie等对他们来说是小case一桩,而且有的还会自动跟踪你网站的修改,自动调整。牛。

    从地域来看,广东的垃圾信息真是太多了,像广州,深圳,东莞尤其厉害,我站上的大部分垃圾信息都是来自这些区域。看的出来,广东的经济发展的确很拽,但这里您要注意了,这些垃圾帖子的内容绝大部分是关于走私、水货产品什么的,您可以自己联想了,为什么广东会有这么多的垃圾信息了。

    如果你的网站是采用简单防御垃圾信息的方法,可要注意了,看我分解:

    1、采用来路判别 == 失败
    很多网站对于机器发帖的第一步便是验证是否有合适的来路信息,然而稍微懂点程序的人都知道,无论是asp,php还是.net,jsp伪造来路信息是轻而易举。所以这招基本失效。但有总比没有好。有这个验证还是能防范一些低级发帖机的。

    2、采用发帖时间判断 == 失败
    从发布页(如add.asp)获得一个当前系统时间,然后用户提交信息(如提交到addok.asp)时计算用户在这个页面上的停留时间,如果过短,比如小于30秒钟,则判断为机器发帖。这招也失败了,发帖机根本不访问add.asp发布页,它直接post一个当前虚假的时间,使得这个时间远远大于30秒,所以这个方法也失效了。

    3、采用cookie限制发帖次数 == 失败
    程序员们知道,cookie是客户端的信息,也是可以被伪造的。比如,你采用每次发帖成功后,采用程序使得某个cookie的值加1,当这个cookie值累加到N,就拒绝在当天继续发帖。发帖机如何破解这个方法呢?其实很简单,发帖机要做的就是伪造这个cookie,使这个cookie的值永远为1,也就永远不会超过限制了。

    4、使用自身的反垃圾信息过滤系统 == 有作用
    把垃圾信息的关键字屏蔽掉,的确可以有效遏制机器发布恶意的垃圾帖子。但这个方法局限性很大。它只能屏蔽那些信息内容已经包含了恶意关键字的帖子,而对于伪装的帖子不起作用。

    5、同一IP当日发帖数量限制 == 有作用
    采用基于IP的技术防止发帖机器发帖,是有作用的,而且经过了检验。具体方法就是:判断当天发布的帖子里相同IP下所发布的帖子数量,如果这个数量大于一个数值,就限制其继续发帖。

    那有人说了,不能换个IP再发啊,是的,发帖机是可以换IP发布,但是,换一次IP,就意味着它要掉一次线,而一般发帖机是多线程的,它这样做其他进程也同样无法发布了。

    综上所述,防止发帖机发布垃圾信息,不能仅仅采用一种方法,如果把以上的5种方法综合利用,在防止垃圾信息横行的动作上是富有成效的。大家还可以根据第三点把cookie改造称session,这样第三个方法也能起到有效的防范作用;这样,后面三种方法一结合,就可以搭建一个比较强健的反垃圾信息系统了。如果您有其他的想法,欢迎与我交流,请留下您的评论。
作者:Flymorn
来源:飘易博客
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。
上一篇:百奥谷的走红:我看“百奥谷”SEO大赛
下一篇:恢复“快速启动栏”里丢失的“显示桌面”图标
23条评论 “我和自动发帖机的斗争过程:终于屏蔽垃圾信息了”
2008-5-18 21:07:39
不错。。。。。学习了。。我已经向你QQ了。。你不在线??
我的QQ是285305740
2 四月山寺
2008-5-26 9:31:57
那请问在发帖子的时候加上验证码怎么样?
3 四月山寺
2008-5-28 18:52:52
最好的办法是,在发帖子的时候加上验证码,我试过了,很好用的.
2008-7-8 12:05:13
其实一个好的验证码就可以防止几乎所有的灌水机。
什么是好的验证码?ASP程序好的生成图片的验证码不多,本人试过好几款相对比较难识别的图片验证码,效果一般,但采用随机纯文本需要人眼识别的验证码,或是需要计算的那些纯文本验证码反而有效。
2008-7-8 12:06:50
加上需要计算的纯文本验证码即可屏蔽绝大多数灌水机的垃圾信息
2008-7-29 18:18:44
采用discuz的动态验证码,或者采用验证码欺骗手段就可以了
7 扬帆
2009-1-5 18:32:45
我加了验证码,还是不行。也进行了来路判断。看来要对IP判断才行,我再去试试。
路过,学点知识,谢谢!
8 电脑辐射
2009-2-3 19:25:51
的确很难缠,呵呵
9 冰点30
2009-3-9 23:16:34
重新写一个动态 form 让机器不知道提交哪个表单http://www.ku30.com
2009-3-23 12:16:09
其实大家都听不容易的
2009-5-13 21:45:13
主要任务:
负责推广精英学校 (http://www.elite-school.com) 的网站, 使得网站排名尽快靠前.

推广内容:
精英学校指定的广告词.具体如下:

http://www.elite-school.com/campus/topic-t4.html
目前所有课程的招生简章

推广手段:
人工,工具发贴为主. 其余手段为辅.要求发贴数不少于10000个.

衡量方法:
依据 Alexa 报告 (http://www.elite-school.com/aboutus/alexa.html) 作为衡量方法.

目标:
Alexa 报告的所有数字都有显著的提升.
2009-6-17 16:16:02
你这个评论系统防刷新吗?
13 flymorn
2009-6-17 18:13:00
to:12楼,评论需要审核才能显示。spam评论无用。
14 冰冰
2009-7-30 14:43:33
路过~~~
2010-4-10 11:39:07
我的站佛山网www.myhome138.com也给别人发了很垃圾信 怎么办
2010-4-17 9:08:17
哎这种情况真是麻烦 我的http://www.qxbanzheng.com和http://www.cxbanzheng1.com 何曾不是呢
17 dkljf
2010-7-19 1:21:09
http://www.ptp6.com/ 每天都有人刷评论烦死
18 alexander
2010-9-24 11:31:15
鼎鼎膜拜 ,学习了,另外十五字十五字
2011-1-16 17:25:41
我的网站一上线就有发帖机分分钟都在发帖,搞的我删都删不赢,我不懂技术咋办嘛?有没有简单的方法,,这个倒可以看的,http://www.gy2sh.com未成年人勿点击
2011-2-24 12:26:58
其实很简单的。博主所提示的办法是有一定效果。但要彻底根治很难。参考我的整站垃圾信息专题
http://hi.baidu.com/cqxuanboy/blog/item/2b8f73563d3d47c8b745ae97.html
专业供应:轮盘机,模拟机,娱乐机,等价格实惠,欢迎选购!!。联系电话:13416365134 qq987739463    email:987739463@qq.com  http://www.wym2.com/
2011-10-14 5:33:09
博主很高明啊 这些技术确实不错
3366单机小游戏下载基地
http://www.youxi68.com
2012-9-3 14:38:20
这东西就像小广告一样无孔不入 野火烧不尽 春风吹又生
发表评论
名称(*必填)
邮件(选填)
网站(选填)

记住我,下次回复时不用重新输入个人信息
© 2007-2010 飘易博客 Www.Piaoyi.Org 原创文章版权由飘易所有 渝ICP备07006361号