问答系统

信息检索系统的高级形式
1
2
问答系统(question -answering system)是指允许用户以自然语言问句的形式提供自己的需求,系统根据用户的输入,返回能以准确、简洁的答案回答用户问题的新型信息检索系统[1]。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。

发展历史

早在计算机诞生不久的1950年,Alan Turing就提出了著名的图灵测试。该测试的目的并不是为了获取信息,而是用于测试计算机是否具有智能,但是过程是相似的。图灵测试是把计算机和人都藏在用户看不见的地方,用户提出一系列的询问,计算机或者人给出问题的解答,如果用户分不清是人在回答还是计算机在回答问题,那么该计算机就具有了智能。为了鼓励进行图灵测试的研究,1991年Hugh Loebner设立了一个Loebner Prize,奖金10万美元,用于奖励第一个通过图灵测试的系统,遗憾的是,迄今为止,尚没有个人或者组织能够获此殊荣。除了大奖以外,比赛还每年拿出2000美元奖励当年表现最出色的系统。十多年来,出现了PC Therapist,Albert等优秀的聊天机器人系统,它们提出的一些技术,很值得开放域问答系统所借鉴。
早期还有一些基于知识库的问答系统研究(Hendfix et a1. 1978,Woods 1973),包括基于本体的问答系统,受限语言的数据库查询系统,问答式专家系统等。这些系统虽然能在特定的领域中达到比较好的性能,但是它们大多是受限的。首先是语言受限,即只能使用少数几种问题语言模式,一旦采用比较随意的语言,质量就会明显下降。其次是知识受限,一般只能够回答某一个特定领域中的专业性问题。
为了推动开放域问答系统的发展,信息检索评测组织(Text REtrieval Conferenee,TREC)自1999年开始,设立了开放域问答的评测任务,是TREC中历时最长的评测任务。其他的一些著名评测组织(如NTCIR和CLEF)也设置了问答系统评测的任务。目前,关于问答系统的研究已在领域内受到强烈的关注。