AI在阅读理解领域开始“跑分”,这个“人类好帮手”还能去哪炫技

  • 日期:08-27
  • 点击:(1050)


硅谷秘密特工2天前我想分享

“三长一短选择最短,三短一长选择最长,不均匀C无敌。”

你还记得在学年期间在“学校”中流传的所谓的阅读魔法吗?

当然,这只是对人渣的心理安慰。阅读理解作为一种考察学生理解能力和思辨能力的问题类型,不仅可以通过一个口解决,而且还需要大量的练习和不断的尝试。

无论如何,我相信每个人都有共识:阅读和理解这件事当然是人类的一个特殊项目。

然而,事实上,最近,斯坦福大学推出了SQAD,这是机器阅读理解领域的顶级事件。阿里巴巴开发的人工智能模型得分高达82.44,超过了人类平均82.304。这是该机器首次在此类测试中得分超过人类,微软的AI模型得分为82.650,排名第一。

人工智能开始在阅读理解领域“运行点”,人工智能能够理解全文,这已成为人工智能世界的一件大事。在这一点上,我们必须面对的第一个问题是,当AI能够比人类更快,更准确地回答文本中的信息时,AI是人类的替代者还是帮助者?人工智能阅读理解将来如何?这些问题看似简单,但有很多地方值得讨论。

人工智能阅读理解技术思维

总的来说,我们认为我们至少可以考虑这两点。

人工智能阅读理解只是自然语言处理(NLP)的演变

虽然人工智能阅读理解最近才引起人们的关注,但人工智能阅读理解技术在语义分析和语音识别之后仍然是自然语言处理技术的突破。

(图来自Yiou.com)

自然语言处理很早就发展了。计算机最初发明后,人们开始研究自然语言处理。机器翻译是最早的NLP研究之一。当时的NLP研究基于规则或基于专业知识。阅读理解技术是如何发展的?受图像识别和语音识别结果的启发,人们逐渐开始深入学习做NLP研究,因此阅读理解技术应运而生。

这种技术也面临许多挑战。具体来说,它包括:

如何用知识学习 - 有效地使用知识,包括语言知识,领域知识;

如何从环境中学习 - 通过加强学习来提高系统的性能;

如何从上下文中学习 - 使用上下文来进一步增强处理当前句子的能力;

如何使用用户的肖像来反映个性化。

每个链接的任何偏差都可能导致不准确的结果。

2,AI阅读理解缺乏真实的思考

让我们首先看一下语言测试中常见的阅读理解问题 -

为什么作者描述的“幕布”是蓝色的?

学生回答:“因为窗帘是蓝色的。”

老师说:“错了!蓝色的'窗帘'有一种挥之不去的含义,表达了作者当时的情绪低落.

这种阅读理解对每个人来说都很熟悉。目前,在短答案类型的汉语阅读理解中,没有关于AI表现的具体数据。值得一提的是,百度即将组织一次中文阅读理解比赛。比赛将于2018年3月1日正式开放注册频道。但对于这类问题,人类已经提出了一套回答技术,更不用说收集大量数据文本的机器了?在为AI建立模型时,可以实现词汇用于刺激AI相应响应的程度。例如,上面的“蓝色”对应于“惆怅,困”,而“字母”对应于“思考”等等。然而,在这种操作下,AI阅读理解不是“理解”,而是在做问题时“路由”;因为机器没有“思考”,只有“操作”。

你为什么这么说?我们可以在AI阅读和理解过程中找到答案:

嵌入层(相当于人类词汇级别的阅读知识):一般使用的是外部大规模数据(如手套等)的预训练词矢量,并基于循环神经网络或卷积神经网络从字符到单词的单词向量(表示),以便可以获得文章段落中每个单词的问题和与上下文无关的表示。

编码层:多层循环神经网络通常用于获得问题的每个单词的依赖于上下文的表示以及文章的通过。

匹配图层(相当于阅读带问题的段落):获取问题中的单词与文章中的段落文字之间的对应关系(或匹配)。基本上,它是由注意机制实现的。常见的是基于Match-LSTM和Co-attention,因此可以获得文章中每个单词的问题相关表示。

自匹配层(相当于人们重新阅读以进行验证):基于与问题相关的单词表示,自我关注机制用于进一步改善段落中单词的表示。

AnswerPointerLayer(相当于人类综合线索定位答案):预测文章段落中的每个单词作为答案的开头和答案结束的概率,从而计算出答案概率最高的子串输出文章段落作为答案。

所谓的千名读者有一千个哈姆雷特。当我们理解一篇文章时,我们人类经常会带来自己的主观色彩,每个人都会产生自己的观点。那AI怎么样?除问题外,您能否生成不同的文章视图?

AI疯狂的“跑点”,结果是成为人类更好的帮手

大家之所以认为人工智能阅读理解超越人类,是因为从技术原理出发,人工智能阅读理解超越人性是一件非常合理的事情。

首先,人工智能“阅读”的能力日益提高,自然语言处理技术的突破可能取代人类的“理解”。其次,深度神经网络模型可以模拟人们在阅读理解问题时的一些行为,包括结合章节内容试题,反复阅读文章与问题,避免阅读中的遗忘和谈判。因此,自然语言处理技术和深度神经网络模型的结合使得AI可以在人类之外执行阅读理解,这似乎是理所当然的。

很多人开始思考,人工智能阅读理解是否取代了对手动完成的规则,对话和服务信息的相关理解?事实上,这种想法只是在理论上确立,但在实际应用中仍存在许多问题。

首先是过度简化阅读理解。阅读理解的主题分为精确匹配和模糊匹配。前者是难以理解的,即,看到一段文本提取相应的信息,并进行简单的处理以获得直观的信息;后者是通过一段文字或一篇文章。这篇文章结合文本背后的背景信息以及社会,人文背景和读者在现实世界中的经验,通过逻辑和“明智”的思考得到了理解和感受。换句话说,阅读理解是一项全面的工作,涉及语境理解,人类理解和对内容的熟悉。这些显然是AI无法替代的。

件,如在确定的问题库和测试时间,只有成人的平均理解水平。为了进一步推动阅读理解技术的发展,有必要将问题的难度设定为无人驾驶汽车评分测试,逐步增加难度,建立各级培训和评估集。

简而言之,拥有超越人性的理解是今天人工智能无法做到的事情。这也意味着AI更适合作为人类帮助者,而不是替代品。将两者结合起来的最佳方式是AI应该是基本过程,人类使用AI来提高工作效率。这种人机交互关系可以在大多数可能被AI取代的“工作岗位”中找到。

这种阅读理解“跑步大师”也可以帮助人类

我们可以从以下两个方面一瞥一两个。

1.接近真实需求并帮助人机交互

在购买家用电器时,您是否对那些无聊的“用户手册”感到头疼?您只能在各种软件下载中点击“用户协议”中的“我同意”。使用AI阅读理解技术,所有这些都有更好的解决方案。

例如,在智能客户服务中,机器可以自动读取文本文档(例如用户手册,产品描述等)或帮助客户服务回答用户问题。

在搜索引擎中,机器阅读理解技术可用于为用户搜索(尤其是基于问题的查询)提供更智能的答案。目前,R-NET技术已成功应用于微软的Bing搜索引擎。我们通过阅读和理解整个互联网的文档,直接向用户提供准确的答案。同时,这也是微软Cortana等移动方案中个人助理的直接应用。

在办公领域,机器阅读理解技术也具有良好的应用前景,如利用机器阅读理解技术处理个人邮件或文件,然后使用自然语言查询获取相关信息。

2.友好的嵌入式环境,“技术”成为“帮助者”

协助律师或法官判断案件,了解医疗领域的医疗信息,帮助患者咨询,并从金融领域的非结构化文本(如新闻)中提取财务相关信息。

正如阿里巴巴研究所自然语言处理的首席科学家西罗在一份公告中所说,机器给出的答案的准确性对于诸如“为什么下雨?”等客观问题会很高。根据该公告,该技术可以逐步应用于广泛的实际应用,如客户服务,博物馆指南,在线回答患者医疗问题等,从而以前所未有的方式减少对人力输入的需求。

更重要的是,机器可读的理解技术可以变成一种通用功能,发布给第三方以构建更多应用程序。

[概要]

微软团队负责人周明先生在接受采访时表示,“超越人类不能成为媒体报道。当我们看到技术进步时,我们应该冷静地思考模型的不断改进和技术的应用。这是一种生态学。所有行业同事都必须健康地竞争并克服现阶段面临的困难,而不是停留在游戏的第一个喜悦阶段。“

阅读理解是人类智能中最关键的能力之一。 AI阅读理解技术具有广泛的应用前景。它可能远或近,但AI应该比人类更可能成为人类的帮助者。即使它在许多人类定义的规则项目中“赢得”人性,真正“超越人类”的是人类。

更多精彩,请关注硅谷洞察官方网站(收集报告投诉)