我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:2019跑狗图高清彩图 > 智力处理 >

解决人工智能超越人类智慧的四个困难

归档日期:08-18       文本归类:智力处理      文章编辑:爱尚语录

  解决人工智能超越人类智慧的四个困难_计算机硬件及网络_IT/计算机_专业资料。解决人工智能超越人类智慧的四个困难

  解决人工智能超越人类智慧的四个困难 本世纪以来,随着互联网大数据的兴起,信息的爆炸式增长,深 度学习等机器学习算法在互联网领域的广泛应用, 人工智能再次进入 快速发展的时期。与此同时,不同领域的科学家,企业家如物理学家 霍金, 微软创始人比尔盖茨等人, 纷纷对人工智能的未来表达了担心, 提出人工智能的快速发展可能对人类本身产生威胁, 由于这些科学家, 企业家具有很强的影响力,人工智能威胁论因此得到广泛传播。 在人工智能威胁论热度日益高涨的情况下, 人工智能领域科学家 对人工智能威胁论也提出了反驳意见。这其中就包括 Facebook 人工 智能实验室主任, NYU 计算机科学教授 Yann LeCun, 百度首席科学家, 斯坦福大学计算机科学系和电子工程系副教授吴恩达, 中国科学院自 动化所教授,人工智能领域专家王飞跃等 应该说人工智能威胁论引发争论背后, 本质上是人工智能的智力 发展水平能不能定量评测的问题。对于这个问题,前人研究者已经做 出大量工作。例如 1950 年,图灵提出了著名的图灵实验,采用提问 和人类裁判的方法,判断一台计算机是否具有同人相当的智力。 2015 年 3 月 Stuart Geman, Donald Geman 等研究在 National Acad Sciences 发 表 论 文 ?Visual Turing test for computer vision systems?,提出的视觉图灵测试?Visual Turing test?,目的是 测试计算机能否能像人类那样描述一张图片。 除此之外,2015 年 1 月,在德克萨斯州召开的美国人工智能大 会(AAAI-15)上,学者专门组织了研讨会(Beyond Turing Test), 1 对图灵测试进行深入的讨论,并对智能的评测标准提出了新的建议。 总体上,这些测试还存在分析范围单一,或无法定量分析的问题。我 们首先看一下图灵测试。 一.图灵测试的先天不足 测试人工智能系统是否具有智能最著名的方法是?图灵测试?。 1950 年,图灵发表论文《Computing Machinery and Intelligence》 提出了?机器思维?的概念, 提出一位测试者在与被测试者相互隔离 不能进行直接交流的情况下,通过信息传输,和被测试者进行一系列 的问答,在经过一段时间后,测试者如果无法根据获取的信息判断对 方是人还是计算机系统, 那么就可以认为这个系统具有同人类相当的 智力能力,也就是说这台计算机是有思维能力的,这就是著名的?图 灵测试?(Turing Testing)。图灵在论文中这样定义图灵测试: ?我们称下面这个问题为?模仿游戏?。 游戏参与者包括一个男 人,一个女人,以及一个任意性别的询问者。询问者与另两个人待在 不同的房间里,并通过打字的方式与他们交流,以确保询问者不能通 过声音和笔迹区分二者。两位被询问者分别用 X 和 Y 表示,询问者事 先只知道 X 和 Y 中有且仅有一位女性, 而询问的目标是正确分辨 X 和 Y 中哪一位是女性。另一方面,两位被询问者 X 和 Y 的目标都是试图 让询问者认为自己是女性。也就是说,男性被询问者需要把自己伪装 成女性, 而女性被询问者需要努力自证。 现在我们问: 如果我们把?模 仿游戏?中的男性被询问者换成计算机, 结果会怎样?相比人类男性, 计算机能否使询问者更容易产生误判??。 2 图灵测试并没有定义智能的范畴, 而只能作为一个人工智能的充 分条件,关于这一点,图灵在论文中写道: ?机器能否拥有智能, 为了回答这个问题我们应该首先定义‘机 器’和‘智能’。 一种可能性是根据大多数普通人的日常理解去定义 这两个概念, 但这样做是危险的。 在这里我并不打算定义这两个概念, 可能有人会说这项测试对机器而言过于严格——毕竟人类也无法反 过来成功伪装成机器,这只需检查算术的速度和正确度即可辨别。难 道被认为拥有智能的机器就不能表现出和人类不同的行为么?这是 一个很有力的反对意见,但至少不管怎样,假如我们有能力制造出一 个可以成功通过测试的机器的话,也就无需为这个反对意见烦恼 了。? 图灵测试与人工智能的关系可以用集合的概念进行阐述, 如上图 所示。 从图中可以看到?所有人类行为?对应的集合?和所有智能行 为?对应的集合有交集但又互有不同。 虽然?在全部智能行为?中有 部分能力是人类靠自身力量无法完全实现, 但人类可以被认为是有智 能标准体,因此,能达到?人类水平?的部分— 也就是两个集合交 集的那个部分—就应该被认作是?拥有智能?的特征。而且,人类的 所有行为并不总是和智能相关。 图灵测试要求机器全面模拟?所有人 类行为?,其中既包括人类?智能?的部分,也包括人类的?非智能? 3 行为,由此可得出结论通过图灵测试是 ?拥有智能?的一个有效的 充分条件,而非必要条件或充要条件。 作为最被广泛应用的人工智能测试方法, 图灵测试经常用来检验 机器是否具备人的智能,但总体看,图灵测试的方法受人为因素干扰 太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没 有得到严格验证的情况下宣称其程序通过图灵测试,例如 2014 年 6 月英国雷丁大学客座教授凯文 ?沃维克宣称一款名为?尤金 ?古特曼 (Eugene Goostman)?的计算机软件通过了测试,但是测试结果充满 争议,例如机器人只要能够通过 30%的评判标准即可被判定通过图灵 测试,另外这个计算机软件通过扮演一名年仅 13 岁,且第二外语为 英语的男孩让参与测试的裁判大幅度降低了测试难度。 中国科学院自动化所研究员王飞跃在?关于人工智能九个问题? 中也对图灵测试存在的问题进行了讨论,他的意见主要有以下两点: (1)第一点是人类的智能并不是一个单一的对象,而是有多个 类别组成,同样人工智能对应也是多类别组成。图灵测试究竟测试的 那些类别并不明确,从实践上看,目前图灵测试仅仅局限在语言智能 等特定小领域里,不具备代表性。 (2)图灵测试并不是考官对一台计算机测试后就可以宣布其是 否拥有智能, 图灵测试的本意是指一个广义的人类做个为整体的考官, 其测试的时间段也不是具体的一段时间而是广义的时间段, 即所有的 人类在所有时间都分辨不出人与机器之后, 才算其人类智能与人工智 能等价。 4 从上述讨论可以看出, 图灵实验只对人工智能系统是否具有人类 智能回答?是?或?否?, 并不对人工智能系统的发展水平进行定量 分析,而且测试的智能或智力种类还过于单一;在测试方法上存在漏 洞, 容易被测试者找到漏洞从而产生作弊行为, 从上述存在的问题看, 图灵实验目前还无法承担定量分析智能系统智力发展水平的需求。 二,解决人工智能威胁论争论的四个困难 总体看, 目前包括图灵测试在内的各种方案中还存在无法定量分 析人工智能发展水平的问题, 只能定性的判断一个人工智能系统是否 和人一样拥有同等水平的智力。但这个系统和人类智慧进行对比,高 低程度如何,发展速度与人类智慧发展速度比率如何,上述中研究没 有涉及到可具体执行的思路和方案。我们认为这些问题长时间存在, 主要与下面提到的四点困难有关。 (1)第一个困难是没有统一的模型和测试方法对不同的人工智 能系统进行测试。 人工智能无论从理论研究还是从应用实践都存在众 多分支和发展方向。在理论上人工智能分为三大学派,如符号主义 (Symbolicism) 或计算机学派 (Computerism) ;连结主义或生理学派 (Physiologism) ; 行 为 主 义 (Actionism) 或 控 制 论 学 派 (Cyberneticsism)等。在应用实践上,人工智能可以应用的方向包括 符号计算、模式识别、机器翻译、机器学习、问题求解、逻辑推理与 定理证明、自然语言处理、分布式人工智能、计算机视觉、智能信息 检索、专家系统等等。 5 每种具体的人工智能系统往往只具备一个或若干上述提到的功 能。例如 IBM 的深蓝强于计算能力,在国际象棋方面可以与人类对手 一决高下;沃森系统拥有庞大知识库系统,因此可以在常识问答比赛 中击败人类选手。因为没有统一的模型可以涵盖这些人工智能系统, 就无法形成统一的测试方法进行测试和比较。如图 1.2 所示,人工智 能系统 A 在计算能力上得分为 100,人工智能系统 B 在计算机视觉识 别上得分为 80,人工智能系统 C 在机器翻译测试得分为 90 分,我们 仍然无法得出结论 A 的智力能力高于 C, C 的智力能力高于 B 的结论。 (2)第二个困难是没有统一的模型和测试方法,能够同时对人 工智能系统和人类进行测试, 这也是当前人工智能威胁论产生最重要 的原因之一。 因为没有人工智能系统和人类智能水平统一的测量方法, 人工智能威胁论宣扬者往往将计算机或软件系统表现强大的领域作 为标准,例如计算能力,历史,地理等常识的掌握能力等,而忽略诸 6 如图像识别能力,创新创造的能力,发现规律的能力等,对于这个原 因产生的问题, 人工智能威胁论反驳者往往无法拿出定量的数字结果 进行反驳。 目前虽然针对人类智力能力的评测方法已经非常成熟,但过去 100 多年的发展和改进过程中,这些方法并没有考虑到人工智能系统 的特点和发展水平, 因此很难将人类的智商测试方法拿来测试人工智 能系统。 例如目前绝大多数人工智能系统就无法完成图 1.3 所示题目, 因为测试者需要首先识别图像中的问题, 并与图中的各个图形特征关 联起来。做不到这一点,回答问题就无法进行下去。 图 1.4 所示的人类智商测试的题目需要测试者运用铅笔, 钢笔等 工具绘制图形。用手操作物体完成任务,解决问题是人类普通的能力 [11] ,但对大多数人工智能系统因为没有相应输出系统或操控设备,于 是无法完成图 1.4 所示的测试。 7 (3)第三个困难是人工智能系统没有形成智力发展水平测试的 标准输入输出接口。例如如图灵测试的问题问答,IBM 深蓝与国际象 棋大师的比赛,沃森系统与人类选手进行知识比赛等时,研究人员就 需要研发不同的输入输入接口以满足测试需求。 对于更多人工智能系 统,在设计时往往由于只考虑到满足工作需求,而没有设计和开发与 测试系统进行完整交互的能力,如图 1.5 所示。这个问题如果没有得 到解决,对于发展新的统一的人工智能测试也将带来困难。 8 (4) 第四个困难是没有关于人工智能智力发展水平的历史测试 统计数据。由于针对人工智能系统一直没有产生定量分析方法,这个 问题在今天依然存在。因为历史数据的缺失,研究者就无法绘制类似 图 1.6 所示的人工智能系统智力水平的发展示意图, 也无法将人工智 能系统与人类智力发展水平进行比较。 因此很难定量的对未来发展趋 势进行预测。 上文我们提到 Facebook 人工智能实验室主任 Yann LeCun 在反驳人工智能威胁论时虽然给出了相关发展趋势图, 但因为不是通 过历史数据预测得来,因此说服力大打折扣。 9

本文链接:http://kathala.net/zhilichuli/569.html