AI:人工智能的本质与未来_【英】玛格丽特·博登_AZW3_MOBI_EPUB_PDF_电子书(无页码)_【英】玛格丽特·博登

内容节选

反向传播、大脑和深度学习 PDP的追随者们认为,人工神经网络比符号人工智能更接近大脑。PDP的设计灵感确实来自大脑,一些神经学科学家确实用它来模拟神经机能。然而,人工神经网络还是与大脑中的东西有很大差异。 (大多数)人工神经网络和大脑之间的一个区别是反向传播或BP。BP是一个学习规则,或者说是一类通用学习规则,经常用于PDP。1974年,保罗·韦伯斯(Paul Werbos)首次使用BP,20世纪80年代初,杰弗里·辛顿(Geoffrey Hinton)以更有效的方式定义BP,它解决了信用分配问题。 所有类型的人工智能都面临信用分配问题,系统不断变化的时候尤其如此。假定有一个复杂的人工智能系统很成功,那么它的哪些部分最有可能促成了它的成功?在进化人工智能中,信用通常由“桶队列”算法分配(见第5章)。在具有确定(非随机的)单元的PDP系统中,信用通常由BP分配。 BP算法从输出层到隐藏层追溯系统成功的原因,并辨识一些需要被调整的个体单元(更新权重以将预测误差降至最低)。当网络给出正确答案时,BP算法需要知道输出层的确切状态(因此BP是监督式学习)。在该示范性输出和从网络中实际获得的输出之间进行逐个单元比较。输出单元的状态在两种情况下的任何差异都被视为误差。 算法假定,一个输出单元的误差由与其连接的单元中所出现的误差引起。算法在整个系统中进行反向推算,依据隐藏层中的单元与输出单元之间的连接权重,确定第一个隐藏层中的每个单元所产生的具体误差量。对于上述输出单元的误差,由与该单元连接的所有隐藏单元分摊责任(如果一个隐藏单元连接到多个输出单元,那就把它的所有单个责任相加,作为该隐藏单元的责任)。然后对隐藏层和前一层之间的连接按比例改变权重。 “前一层”可以是另一个(和另一个……)隐藏层,但最终它会成为输入层,权重将不再变化。该过程一直重复,直到输出层的误差降至最低。 多年来,BP算法仅用于只有一个隐藏层的网络。多层网络很罕见,它们很难分析,甚至很难做实验。不过最近因为出现了深度学习,BP算法被用在了多层网络上,并引起了人们的巨大兴奋,还有一些不负责任的炒作。这里的系统学习深入到一个域的结构,而不只是表面模式。换句话说,它发现了多层而非单层的知识表示。 深度学习令人兴奋的原因是它至少为人工神经网络处理层级保驾护航。自20世纪80年代初以来,辛顿和杰夫·埃尔曼(Jeff Elman)等联结主义者为了表示层级——曾将集中式表示和分布式表示结合,还定义过递归神经网络(递归网络实际上是执行一系列离散步骤。利用深度学习,最新版本的递归网络有时能够预测句子中的下一个单词,甚至是段落中的下一个“想法”)。但是他们取得的成就有限(人工神经网络仍然不适合表示精确定义的层级或演绎推理)。 深度学习也出现在了20世纪80年代[由于尔根·施密德胡贝(Jürgen Schmidhuber)发起]。但是,直到最近辛顿提供了一种让多层网络在多个层级上发现关系的有效方法后,这个领域才有了进一步发展。他的深度学习系统由在六个层级上“受限制的”玻尔兹曼机(没有横向连接)组成。首先,所有层级进行非监督式学习。它们利用模拟退火算法逐一接受训练。一层的输出用作下一层的输入。当最后一层稳定以后,整个系统由BP微调,向下通过所有层级,为它们适当分配信用。 认知神经科学家和人工智能技术人员一样对深度学习感兴趣。因为它规定的“生成模型”能够学习预测网络输入的(可能会发生的)原因——模拟了亥姆霍兹在1867年提出的观点:“知觉为无意识推论。”也就是说,知觉不是指被动地接收来自感官的输入,它包含主动理解,甚至提前预测。简而言之,眼睛/大脑不是相机。 辛顿于2013年加入谷歌公司,所以BP也会频繁亮相。谷歌公司已经在许多应用中用到了深度学习,包括语音识别和图像处理。此外,它于2014年收购英国人工智能公司DeepMind。DeepMind公司的DQN算法结合深度学习和强化学习(见第2章),征服了经典的Atari游戏。IBM公司也对深度学习颇感兴趣:它不仅用在了沃森上,还被许多专家应用程序借用(见第3章)。 然而,虽然深度学习很实用,但这并不代表对它的理解就很到位。大量实验探索了不同的多层学习规则,但理论分析仍十分混乱。 其中一个问题就是是否有足够的深度来获得近乎人类的表现(第2章中提到的猫的脸部单元是由一个九层系统产生的)。例如,人类视觉系统有7个解剖层,但是大脑皮层中的计算到底增加了多少层?因为人工神经网络受到了大脑的启发(在深度学习炒作中不断强调的点),所以这个问题必然会被问到,但它貌似不是很切题。 BP算法是计算层面取得的一项胜利,但不是生物学上的突破。BP算法过程不会产生大脑中猫的脸部“祖母细胞”(见第2章),但深度学习可以。真正的突触纯粹是前馈:它们不进行双向传播。大脑包含不同方向的......

  1. 信息
  2. 01 什么是人工智能
  3. 虚拟机
  4. 人工智能的主要类型
  5. 人工智能的预言
  6. 人工智能的起源
  7. 控制论
  8. 计算机建模者们分道扬镳
  9. 02 强人工智能:人工智能领域的圣杯
  10. 只有超级计算机还远远不够
  11. 启发式搜索
  12. 人工智能领域中的规划
  13. 数学简化
  14. 知识表示
  15. 基于规则的程序
  16. 框架、词向量、脚本、语义网络
  17. 逻辑和语义网
  18. 计算机视觉
  19. 框架问题
  20. 智能体和分布式认知
  21. 机器学习
  22. 通用系统
  23. 梦想复兴
  24. 缺失的方面
  25. 03 语言、创造力和情感
  26. 语言
  27. 创造力
  28. 人工智能与情感
  29. 04 人工神经网络
  30. 人工神经网络更广泛的含义
  31. 分布式并行处理
  32. 神经网络学习
  33. 反向传播、大脑和深度学习
  34. 网络丑闻
  35. 连接不是一切
  36. 混合系统
  37. 05 机器人和人工生命
  38. 情境机器人和有趣的昆虫
  39. 进化人工智能
  40. 自组织
  41. 06 强人工智能会有真正的智能吗
  42. 图灵测试
  43. 意识的很多问题
  44. 机器意识
  45. 人工智能和现象意识
  46. 虚拟机和身心问题
  47. 意义和理解力
  48. 神经蛋白是必要条件吗
  49. 不只是大脑,身体也很重要
  50. 道德社区
  51. 道德、自由和自我
  52. 心智和生命
  53. 巨大的哲学分歧
  54. 07 奇点
  55. 奇点的预言家
  56. 竞争的预测
  57. 为怀疑论辩护
  58. 全脑仿真
  59. 我们应该担心什么
  60. 我们为此做了些什么
  61. 译者后记