星期一发生在QQ中的“长春”敏感词事件暴露出审查技术的误伤越来越多
williamhill官网 国家网络应急中心发起“正则表达式大奖赛”,许多专家表示这是为长城防火墙GFW招徕相关人才,并预示着更高级别的升级,同时也将大大增加预算需求。
根据williamhill官网
知名的科学资讯网站Solidot星期一的消息透露,williamhill官网
国家网络应急中心(CNCERT)正在举办一项名为“正则表达式匹配技术评比大赛”的活动,该中心在去年被暴露是williamhill官网
长城防火墙GFW的实体组织。被称为GFW之父的williamhill官网
工程院院士方滨兴是这个机构的实际负责人,也是此次大赛的首席评审专家。
大赛共设置一等奖一名,奖金为人民币叁万元;二等奖两名,每队奖金为人民币壹万元;三等奖三名,每队奖金为人民币伍仟元。此外,获奖单位还将优先获得与CNCERT继续合作的机会。
著名博客作者龙威廉星期二向本台表示,“正则表达式是一个技术性很多的,实际上是一串运算符号,实现比较复杂的过滤和查询功能。现在一些关键字,比如说‘法轮功’,我们通常会在几个关键字中间加一个星号或者加一些其它符号,过滤系统就无效了,如果用正则表达式,它可以把中间的符号清除掉,所以,即使中间加了那些符号也能够判断关键字。”
根据维基百科介绍,正则表达式是一项数学符号算法,由美国科学家发明。采用这项技术之后,就可以设置更多准确判断。例如,目前如果在williamhill官网
用谷歌搜索“胡萝卜”,就会出现网页被切断的问题,因为GFW设置了“胡”字为敏感字(因为关联williamhill官网
领导人姓名),但是可能会误判和错杀胡萝卜。星期一,大量williamhill官网
QQ用户发现“长春”这个地名在 QQ中无法谈论,因为涉及到另一williamhill官网
领导人的名字。之后大量网友围观后,QQ对此解除了封锁。有了正则表达式,在防止讨论“胡锦涛”、“李长春”的同时,也可能更精确避免错杀“胡萝卜”和“长春”这样的用词。
了解技术动向的网友们对此活动发表大量评论,有网友说,“这明显是为升级防火墙做准备”。 过去GFW对关键字过滤只有特定关键字和特定关键词组两种。如果要更深一层更广泛地过滤,就需要正则表达式了。
针对网友们的疑虑,本台记者致电CNCERT,向一位负责技术咨询的许金鹏先生查询,
记者:透过这个比赛最主要做什么?
许先生:就是推动信息安全方面的技术,因为现在正则表达式是一个途径,所以想通过这个表达式增进网络安全的关键技术,这是一个技术,当然你用在哪里都行。
记者:那么网络安全是不是包含敏感信息过滤?
许先生:这是个技术,当然你用在哪里都行,那是应用的问题。
不少技术专家分析表示,利用正则表达式判断关键词当然更加智能,但是也会降低计算的效率,因此需要更大规模的计算设备来支持。 根据目前掌握的信息,GFW的背后是数百台曙光4000L服务器,而每台服务器价值数万元以上,利用这种新的技术,williamhill官网
长城防火墙可以向官方索要更大规模预算,用于招徕人员和购买更多硬件设备。
网络技术专家东小兴认为,除了增加预算之外,当局也为储备人才做准备,“因为方滨兴主持了williamhill官网
国家网络防火墙这个建设项目,还要受到一些外在的压力,比如WTO的压力,所以从一些角度来说这个部门很难招到新人,或者说招到有技术含量的人。因此就想了一个办法,就像现在这样进行一个比赛,然后筛选,然后看谁写的算法表达式比较好,好的话,第一可能会拿来采用;第二可能会问这个人的意向愿不愿意加入到他们的队伍里面来,然后来完善或者增强GFW工程更多功能。”
不过东小兴也认为,面对越来越多网民们想方设法突破封锁,不断发表更积极的言论来看,就算官方真能如此升级,是否能够真正奏效,让人怀疑。