很多美国大学都有类似计划,他们的目的是解决互联网搜索的爆炸性增长,以及该领域出现的其它复杂问题。
伯克利分校曾培养出了搜索方面的先驱人物Inktomi ,而且Google的CEO Eric Schmidt也是在这里获得计算机科学博士学位。
据研究中心主任Robert Wilensky 介绍,现在他们已经集结了大约20名各学科的教师,共同研究搜索技术。研究主要集中在这样几个方面:个人隐私,欺诈行为,多媒体搜索和个性化。
Wilensky是伯克利的计算机科学和信息管理系的教授,他说:" 我们要解决的问题正是搜索取得成功之后所产生的。" 尽管研究中心的大楼还在图纸上,但是Wilensky说几个月内就会完成建筑设计,明年初中心就会开放。他还跟Google等搜索公司谈了合作事宜。
他说:" 如果有20名对搜索感兴趣的研究人员,那么让他们一起工作,交流想法,取得的成就会远大于每个人单独成就之和。这就像引发核反应。" Google拒绝对此发表评论。
搜索广告每年的业务额高达50亿美元,引起了各方面对网络研究和开发的兴趣。这项业务不光为雅虎和Google这样的巨头每年带来数十亿美元的收入,还吸引了数以百计的网络新贵投身搜索领域。
要寻找下一代技术?最好去大学里看看,眼下最成功的搜索公司就是从大学发迹的。
风险资本家Geoff Yang说:" 大学是新思想的一个主要来源"。在斯坦福大学,有两对研究生相隔六年,几乎是在同一间宿舍里,分别创建了雅虎和Google。
Lycos 也曾是搜索技术的领导者,它脱胎于卡内基梅隆大学(CMU)。该学校的Raul Valdes - Perez 教授还研究出了一种集群搜索工具----Vivisimo。
今天的搜索问题跟五年前已是大不相同。现在网络上不光有书籍、论文,还有数字化的电视节目,这就要求搜索技术比以前更加优秀。人们希望找到可以信赖的信息,希望搜索工具可以对更加复杂的问题进行搜索。
CMU 的语言技术学会主席Jaime Carbonell 说,他的研究小组正在研究一种个性化搜索技术,这将有助于解决一些隐私问题,比如大规模搜集姓名和查询历史等敏感数据。
CMU 的项目跟雅虎及Google已经测试的软件有相同的功能,不过后两者利用各自的网络搜集和存储搜索历史,而CMU 开发了一种插件程序,人们可以下载到PC中使用。用户可以维护和修改个性化的信息,比如查询历史、偏好和喜爱的网站等,并记录到一个文件中。
经过专门设计的搜索引擎会查询这个文件,并结合用户的检索项,对每次的搜索结果做出取舍,这样个人信息就保留在用户的电脑中,不会流失到网上。
Carbonell 透露,这种技术一年内就会问世,CMU 可能会把它作为开源软件免费发行,也可能向公司授权使用。
CMU 还在进行一项由政府资助的长期项目,它的代号为" 标枪" ,旨在研究问答式搜索技术。对于词语定义或者“洛杉矶的人口是多少” 之类的百科知识,Google、MSN 、Ask Jeeves等公司已经可以作出快捷的回答。
但是对于更复杂的查询,比如“从旧金山到伦敦最便宜的航班是哪个?”或者“哪个大学的计算机科学系最大?”目前还很难搜索到有效的答案。
Carbonell 说:" 这是个动态的信息,你必须分析问题,在多个地方找到答案,然后进行比较。这需要许多步骤。我们研究如何把它化为一步,并且把中间过程提交给用户。" 他认为,要想达到政府以及网络用户期望的功能和效率,可能还需要四五年的时间。
得克萨斯大学和宾夕法尼亚大学也在研究类似的问题。
斯坦福继续扮演着搜索技术孵化基地的角色。自从2003年以来,Google已经从斯坦福购买了至少两项研究成果----其中一个是个性化搜索工具Kaltix,另一项成果则出自斯坦福计算机科学系的合作研究机构。
斯坦福的副教授Andrew Ng 致力于人工智能技术的研究,他希望从检索索引中提取出信息。
还有一些人凭借研究项目创办了新公司。searchfox 就是这样的网络公司,它由斯坦福教授James Gibbons 和前任工程学院院长共同创建。这家私人持股的公司发明了一种联合搜索引擎,可以让用户分享喜欢的链接,创建个性化的搜索索引。
斯坦福大学、麻省理工学院和其他的许多大学都在着手解决未来的图书馆面临的问题----大规模的数字化。筛选和组织数以亿计的数字化文件,需要新的搜索技术支持。
麻省理工学院已经跟万维网协会合作开展一项代号为Simile的计划,研究使用" 语义" 网络的下一代搜索技术。
一名参与该计划的MIT 研究生开发了一款叫做Piggybank 的工具软件,可以嵌入到Firefox 浏览器中。利用Piggybank ,人们在浏览网页的时候可以用关键字进行标记,创建一个经过注释的本地收藏夹,并发表到一个叫做"the bank"的网站。
这样,它就变成了一个" 语义浏览器" ,用户可以更好的理解网页上的信息。
在一次演示中,Piggybank 整合了从电影站点Boston.com和Google maps 获得的资料,得出了饭店和电影院附近的咖啡店分布图。用户还可以把这些信息保存到一个数据库档案中(不仅仅是书签),以后就可以根据它的属性或者指定关键字进行搜索。
麻省理工学院准备向师生们推广这些先进的技术。
在伯克利的研究中心,Wilensky开展了一项雄心勃勃的计划----他要解决" 大" 搜索面临的问题。大搜索指的是分析和组织各种形式的信息(包括图像、视频和电子商务信息),帮助人们合成这些信息并从中提取情报。
一个主要的应用领域将是可信度和隐私。比如,你从Google上搜索的内容由多大的可信度?如何判断一名eBay卖家是否值得信赖?
Wilensky说他的团队研究证明,eBay卖家的信用评价受报复性评价的影响,从而发生偏移。有不良记录的用户会换一个名字再次出现,变成没有任何纪录。
Wilensky说,因此他的团队开发了一种叫做"EM trust"的算法,它采用了一种评估在线卖家诚实度的统计模式。这项成果有可能用于网站。
伯克利无线技术研究中心也准备开展相关研究,而且它还有大型的移动公司作为后盾。它将吸纳伯克利电机系的教授Jitendra Malik,以及计算机科学系的教授David Forsyth ,这两者都从事计算机视觉研究。
(文章仅代表作者个人立场和观点)
短网址: 版权所有,任何形式转载需本站授权许可。 严禁建立镜像网站.
【诚征荣誉会员】溪流能够汇成大海,小善可以成就大爱。我们向全球华人诚意征集万名荣誉会员:每位荣誉会员每年只需支付一份订阅费用,成为《看williamhill官网 》网站的荣誉会员,就可以助力我们突破审查与封锁,向至少10000位williamhill官网 大陆同胞奉上独立真实的关键资讯,在危难时刻向他们发出预警,救他们于大瘟疫与其它社会危难之中。