主页 > IT发布 >西北大学新系统在智力测试中超越 75% 美国人,人类的推理能力也不及 AI 了? >

西北大学新系统在智力测试中超越 75% 美国人,人类的推理能力也不及 AI 了?

2020-08-03


西北大学新系统在智力测试中超越 75% 美国人,人类的推理能力也不及 AI 了?

你听过瑞文氏标準推理测验(Raven’s Progressive MatriCES)吗?上面这张图就是一道标準的瑞文氏测验题目,是不是很眼熟?在公务员考试、一般的智力测试中我们经常看到它。

那幺问题来了,你知道图中这道题的答案吗?如果不知道,也用不着沮丧,因为有 75% 的美国人大概也不知道。但坏消息是:电脑可能知道。

近日,美国西北大学的科研团队研发了一个全新的计算模型,在瑞文氏标準推理测验中达到或超越了 75% 美国普通大众的表现,被媒体誉为人工智慧史上的又一里程碑。

根据 2016 年的数据显示,一般 18 岁成年人的平均智商为 97,6 岁儿童的平均智商为 55.5,相比之下 Google 人工智慧系统的智商则为 47.3,微软小冰是 24.5,人工智慧的智商还不及 6 岁儿童的平均水平。

团队负责人,来自西北大学 McCormick 工程学院的 Ken Forbus 教授对此表示:「模型在智力测试中的表现优于 75% 的美国大众,这意味着人工智慧的逻辑推理能力已经高于人类的平均水平,起码在测试题中如此。另外,由于对人来说很难的题目对模型来说通常也很难,这表示该模型已经可以表现出一些人类认知系统中特有的重要属性。」

西北大学新系统在智力测试中超越 75% 美国人,人类的推理能力也不及 AI 了?

 Ken Forbus 教授

实力这幺强,这个模型到底是如何工作的呢?

据悉,该模型建立在一个名为 CogSketch 的「草图」(sketch)理解系统之上,该系统同样是 Ken Forbus 团队的研究成果。这里「草图」是指人们在思考问题或表达观点时,自然而然在纸上画下来的说明性图样,特别是面对有关空间理解和地理学的相关问题时,尤其必要。CogSketch 系统可以利用草图进行空间建模和逻辑推理,再配合此次最新研发的计算模型,因而能够在瑞文氏标準推理测验中脱颖而出。

Ken Forbus 教授认为类比推理是解决视觉问题的核心,团队正是在这一核心思想的指导下研发了最新的计算模型。所谓类比推理即结构映射的过程,是在不同对象之间透过逐个匹配,寻找它们在结构上的相似点,进而透过图式归纳(即关係结构表徵)把源问题中元素之间的关係要素提取出来,用于靶问题的解决。也就是说,先要形成基于源问题的图式归纳,再基于源问题和靶问题之间的结构映射将图式归纳应用到靶问题的解决。在新的计算模型中,团队成员利用了结构映射理论来对比不同的图像,通过标记两张图像中发现的相同结构,辨识出其中的相同点和不同点。值得一提的是,结构映射是由心理学家 Dedre Gentner 于 1983 年提出的一个理论,他也是西北大学的教授。

针对西北大学的这项研究,雷锋网随机採访了两位相关专业的在读研究生,他们表达了自己的看法。

钟超杰是来自北京林业大学的硕士在读生,曾参与车载镜头的行人检测计画。他认为,虽然模型的智力测试成绩超过了 75% 的美国人,但这并不能说明电脑的智力真的就超过了人类。因为除了推理,智力的含义应该更複杂,比如还包括学习能力、数学计算能力等。而且他觉得如果模型建得好,经过一定资料量的训练,电脑处理这类问题的能力一般是可以超过人类的,但超出这类问题的範畴应该就不行了。

周志敏是来自浙江大学的研二在读生,了解机器学习领域的各种演算法,包括 svm、神经网路等。他认为这是人工智慧针对特定任务的又一项成功应用,跟人类的类比、推理能力并不一样。西北大学的模型之所以表现出超过 75% 普通民众的推理能力,是因为它经过了大量类似资料的训练,如果让它做图形之外的工作应该就不行了。

当前,人工智慧系统对图像和语音的辨识能力已经相当出色,但对于语义和图像含义的理解、推理能力仍有待提高。西北大学的团队表示,在许多场景中除了对数据源进行辨识,对其含义的推理和解释也至关重要,这也是他们研发全新的计算模型并对其展开瑞文氏标準推理测验的原因。他们希望这项研究成果可以为电脑视觉领域今后的发展提供一些技术参考。



上一篇:
下一篇: