人民网:IBM宣布八所大学参与沃森计算机开发
发布人:一全科技 来源:人民网 发布于:2011-02-17 23:02:42 浏览:734

IBM近日宣布,有八所大学与 IBM 研究人员正在合作推动沃森计算机系统背后“问答”技术的开发,该系统在2月14-16日播出的智力竞赛节目Jeopardy! 《危险边缘》中与人类一较高下。

麻省理工学院(MIT)、德州大学奥斯汀分校、南加州大学(USC)、伦斯勒理工学院(RPI)、纽约州立大学阿尔巴尼分校(UAlbany)、特兰托大学(意大利)、马萨诸塞大学安姆斯特分校以及卡内基梅隆大学正在与 IBM 合作开发首个使研究人员能够有效地就底层问答功能进行合作,然后将其应用于 IBM沃森计算机系统的的同类首个开放式架构。

沃森的问答技术使用突破性的分析工具来理解问题,对大量数据进行分析,然后根据它发现的证据给出最佳答案。今天宣布的这项持续性研究合作将帮助促进沃森转变企业和社会运作方式的能力,并促进如医疗卫生、银行、政府等行业的变革。

“我们很高兴与这些在其各自领域表现优异的大学和专家们进行合作,他们可帮助推动作为 IBM沃森系统的支柱的问答技术的进步”,IBM沃森项目组负责人 David Ferrucci 博士表示,“《危险边缘》Jeopardy! 挑战的成功将突破与计算技术的处理和理解人类语言的能力有关的障碍,并将对科学、技术和商业带来深远的影响。”

以下大学正在帮助 IBM 开发用以支持沃森系统的问答技术的功能:

卡内基梅隆大学:来自卡内基梅隆大学,由计算机科学学院语言技术研究所教授 Eric Nyberg 带领的一支研究队伍帮助 IBM 制定“公开推进问题回答技术进步”计划的架构和方法论。CMU 卡内基梅隆大学还对沃森系统做出了两个直接贡献:一是来源扩展算法,用于确定用来回答关于既定主题的问题的最佳文本资源,一是答案评分算法,该算法增进了沃森用来判断某个候选答案在何时可能正确的能力。

麻省理工学院:来自麻省理工学院,由计算机科学及人工智能实验室首席研究科学家 Boris Katz 带领的一个研究团队开创了一个名为 START 的在线自然语言问题回答系统,该系统能够使用来自半结构化和结构化信息存储库的信息来非常准确地回答问题。对沃森系统的根本贡献是将问题细分成简单的子问题,以便迅速收集相关回答,然后将这些回答汇合起来形成最终答案的能力。沃森系统的架构还利用了由麻省理工学院开创的对象-属性-值数据模型,该模型支持对半结构化数据源中的信息进行有效的检索,以回答自然语言问题。

南加州大学:来自南加州大学维特比工程学院,由维特比工程学院信息科学研究所人类语言技术部门主任带领的一个研究团队致力于大规模信息提取、分析和知识推理技术,目的是将大量国际来源的资料转化为该系统的一般知识资源,并利用这些知识进行推理,以发现矛盾和差异之处。

德州大学奥斯汀分校:德克萨斯大学奥斯汀分校计算机科学系教授兼系主任 Bruce Porter 25年来一直从事自动推理和自动问答技术方面的教研工作。他的德州大学研究团队(包括研究科学家 Ken Barker 博士)正在致力于扩展沃森系统的功能,重点关注大量的常识性知识。研究目标是通过开发常识性知识的计算资源来帮助该系统回答问题。德克萨斯大学奥斯汀分校计算机科学系教授 Raymond Mooney 25年来一直从事自然语言处理和机器学习方面的教研工作。他的研究团队从事文本处理计算方法的开发,重点是通过自动学习来将语言映射成其意义的逻辑表示的系统。特别是,他们已经开发出用于学习从文本中提取知识的方法,这是对沃森系统的一个关键要求。

伦斯勒理工学院:来自伦斯勒理工学院,由计算机科学系助理教授 Barbara Cutler 带领的一个研究团队正在研究和开发一个可视化组件,用以向外部观众显示其对沃森计算机系统所采取的用来对问题进行细分和形成可与人脑媲美的快速、精确回答的大规模并行分析技术。

纽约州立大学阿尔巴尼分校:来自纽约州立大学阿尔巴尼分校的 Tomek Strzalkowski 教授和他的研究团队开发出了一项用于持续研究的交互式问答功能。在研究一个复杂的主题时,你很少能够通过只问一个问题就获得你需要的答案,相反,你需要提出一连串的问题才能确定最终解答。这一技术进展使计算机系统能够记住全部交互过程,而不是将每个问题当作第一个问题来对待,这是对真实对话的仿真。虽然该技术由于智力测验形式的性质而不适用于具体的《危险边缘》挑战,但 IBM 正在与纽约州立大学阿尔巴尼分校进行合作,以便将来把这一功能集成进 沃森系统,因为该功能非常适用于诸如医疗卫生、政府、金融服务等许多行业情景。

特兰托大学(意大利):来自特兰托大学,由 Giuseppe Riccardi 教授和 Alessandro Moschitti 教授带领的一个研究团队致力于机器学习、问题回答和对话代理人方面的研究工作。该团队与 IBM 间的持续合作的目标是研究高级机器学习技术以及基于语法和语义结构的富文本表示,以便对 IBM 沃森系统进行优化。该团队已在统计学习理论(如核方法)最新成果的基础上开发出了应用于自然语言理解的技术。该技术增强了沃森系统从它被问到的问题中进行学习的能力(如自动化的《危险边缘》 提示分类)。处理在从由沃森系统的搜索算法发现的答案中选择最佳答案时的不确定性(例如对答案清单进行排名)也其是主要研究方向之一。

马萨诸塞大学安姆斯特分校:来自马萨诸塞大学的 James Allan 教授和他的研究团队致力于信息检索(或称文本搜索)的研究。问答技术的这一重要功能是研究的第一步:寻找和检索最可能包含准确答案的文字。然后,该系统的深度语言处理功能对返回的信息进行分析,以便在文字中寻找实际答案。

“将问答技术应用于实时 Jeopardy! 问题对该领域是一个重要挑战,因为这要求系统更迅速和以更高可信度做出回答,到目前为止这一点还停留在可能性上”,卡内基梅隆大学教授 Eric Nyberg 表示,“《危险边缘》 要求相当复杂的推理形式,包括对隐喻、双关语和谜题的使用,这超出了对语言的基本理解的范围。作为一个挑战问题,《危险边缘》将会充分发挥这方面的最高技巧。”

问答计划由 IBM 和卡内基梅隆大学在 2008 年发起,旨在为加快自动问题回答领域的研究合作提供基础性架构和方法论。通过对开发用于支持和标准化同时研究实验的架构的长期承诺,问答计划正在加快 问答 技术的进步速度。

最新的问答成果包括一个开源软件,用作更好地帮助学生和其他参与者参与问答增强工作的平台。