人工智能时代的降临

The Beginning

　　去年以来关于人工智能（AI）的讨论非常火热，最近读到一篇这个主题的文章觉得非常不错，翻译过来分享下。这不是一篇烧脑的关于人工智能技术文，而是一篇开阔的思辨性文章。

　　下面是原文：

　　是的，数百万低报酬、低技能的工作岗位将面临风险，但人工智能革命还是会带来很多好处的。

　　周二，白宫发布了一份关于人工智能与经济的令人寒心的报告。报告以如下推断开头：“可以预计机器将在越来越多的任务上达到甚至超越人类的表现。”，之后它警告了大量人工岗位的消失。

　　然而，为了应对这种威胁，政府做出了一个可能听起来很荒谬的建议：我们必须加大对人工智能的投资。美国生产力和竞争优势的风险实在太高，以至我们不得不加倍投入。

　　这个方法不仅有意义，而且是唯一有意义的方法。担忧数百万的工作职位，像小车或卡车司机，将会被自动驾驶革新，这是有道理的，但我们也有巨大的需求鸿沟需要机器学习来帮助填平。我们的医疗系统是有深度缺陷的，智能终端可以在更多的地方向更广的人群传播更实惠的、支付得起的更高质量医疗服务。我们的基础教育设施还不足以覆盖以让学生准备好面对阴然逼近的经济动荡。在这方面，人工智能系统可以切入到教师力量薄弱的地区。我们也可能通过开发更智能的基础设施来获得能源独立性，就像 Google 子公司 DeepMind 为其母公司的电力使用所做的事一样（译注：DeepMind 利用人工智能技术使得 Google 数据中心制冷消耗的电力账单降低了 40%）。这里面的机会实在大到不能忽视。

　　更重要的是，我们必须超越这种狭隘的思考方式 —— 受到人工智能威胁的工作岗位。因为今天的人工智能领导者（在 Google 这样的公司或其他地方）已经为一个更加雄心勃勃的愿景（曾经幻想的通用人工智能）奠定了基础。

　　要探访人工智能降临的前沿阵地，那就去观察机器学习系统在狭窄的受限领域是如何完败人类的。今年，最瞩目的人工智能与人类的对决就来自 Google。三月份，世界级围棋选手（李世?h九段）对决 DeepMind 的 AlphaGo 遭遇屈辱的惨败。DeepMind 的研究人员还制作了一个可以针对视频读唇的系统，其精确度相对人类而言一骑绝尘。几周前，Google 的计算机科学家和医学研究人员合作推出了一个算法，该算法可以像眼科医生一样通过眼睛图像检测发现糖尿病性视网膜病变。这是许多公司目前正在追逐的目标 —— 通过自动分析医疗扫描来帮助医生 —— 的一个早期步骤。

　　也是在今年秋天，微软公布了一个可以转录人类语音的系统，相比专业的速记员它的准确度高的多。语音识别是 Cortana（微软）、Alexa（亚马逊）和 Siri（苹果）这些语音助手系统的基础，并且在这项任务中达到人类的表现水准已是数十年的目标。对于微软首席语音科学家黄学东（XD Huang）来说：“这本身就像一个梦，在三十年后变成了现实。”

　　然而，人工智能在 2016 年碾压人类的一系列胜利仅仅是个开始。最新研究表明，我们很快将从这些“狭义”（受限于特定领域，应用范围相对窄）人工智能转变到“广义”（更丰富和复杂的应用领域）的人工智能。虽然离一个真正的通用人工智能至少还有几十年，但因为这些人工智能系统不断扩张的应用领域，社会仍将见证巨变。这就是为什么白宫（好吧，至少奥巴马还在位时）没有缩减投入人工智能的预算。我们正在发展一种强大的力量来彻底改变曾经我们创造的一切。

　　忽略这种趋势，而非积极投身其中去理解、塑造和监控它，很可能是一个国家所能犯的最大错误。

　　之前提及的那些成功的人工智能产品选择的工具都是深度学习。人工智能技术的竞争进入白热化，它的特殊性体现了我们为什么处在通用人工智能的边缘。（译注：深度学习模拟的是人脑的思维过程，所以作者才特别提及它和过去方法相比的特殊性）

　　虽然我们已经能够训练人工智能来完成任务数十年了，但是专家们不得不煞费苦心的为每一个应用手工打造许多定制组件。例如，在让人工智能识别图像中的物体这件事上，人类耗费了数年的工作积累，但在面对解析转录声音的问题时这些积累却毫无用处。换句话说，我们不得不预先咀嚼喂给人工智能的食物，一次，又一次，再一次。（译注：形象的形容过去训练人工智能的工作过程）

　　过去四年的教训是，这类枯燥乏味的“预咀嚼”过程，从目前来看在很大程度上是不相关的。取而代之的是，本质上存在一个算法（包含很多微变量）可以直接从你喂给它的任意大小数据集开始，通过调整自身的结构来解决问题。结果带来的不仅是表现更好的系统，而且能更快的进行实验。“许许多多曾经让我们竭尽全力但却困顿不前的问题，如今，六个月内将迎刃而解。” Google 副总裁与工程师 Fernando Pereira 如是说。

　　然而，与人类相仿的语音识别，唇读和图像标记质量一样令人印象深刻，深度学习是否是伟大而全能的人工智能的基石，这在目前并非显而易见。它稍微有点像你的孩子带回家的成绩单，其中涉及了像英语（母语课）、织袜子（手工课）、闪避球（体育课）和计算三角斜边（数学）的各类科目。你可能想知道这个聪明的孩子是否能够在这些领域之间建立联系，并成为一个批判性的思想家吗？那么，深度学习确定走在能够挑战真正人类智能的道路上吗？（译注：作者这段把人工智能比作小孩，其应用的各种领域就像孩子上学的各个科目）

　　OpenAI 联合创始人兼研究主管 Ilya Sutskever 说：“我们目前所见的人工智能系统，之所以应用在非常窄的领域，是因为它们非常有用。良好的翻译是非常有用的，良好的癌症筛查是非常有用的，这正是人们所追求的。”

　　但他补充说道：“尽管今天的人工智能系统看起来应用领域狭窄，但我们已经开始看到了通用智能的种子。原因是底层技术本质上是同一概念在不同应用领域上略有差异的反复重演。这些想法就像粘土一样可揉捏组合，你只需去混合和搭配它们就能工作起来。”

　　通过揉捏组合今天这些狭窄领域的系统，我们将会登陆更宽广的明天 —— 一种更明显的智能。

　　一个早期的诱人例子，更高级的智能看起来可能最终会出自 Google 的翻译研究。九月 Google 宣称，通过使用其神经机器翻译系统（GNMT：Google Neural Machine Translation，后文将使用这个英文简写），翻译的效果取得了巨大提升。Google 的 Pereira 称：“翻译质量获得了飞跃，我从未想过会在此生的工作中得以见到。”（译注：Pereira 就是前文提及的 Google 副总裁，另外，至少目前在中文翻译上貌似也还是不行，要不我也不用这么辛苦的手打翻译了，嘿嘿:-)）

　　他补充道：“曾经我们一直在稳步的前进，但现在这不再是稳步前进，而是突飞猛进。”。

　　新的翻译系统在从一门语言到另一门语言之间逐步铺开，一些「谷歌人」决定更进一步。他们想知道是否可以构建一个单一的翻译系统来同时应对许多语言，并潜在的展现出人类智能的标志性能力 —— 转移学习。转移学习是一种应用一种技能（比如，弹钢琴）来加速习得另一种技能（比如，指导学习管弦乐或另一种乐器）的能力。

　　通晓音乐基础可以帮助一个钢琴家弹起尤克里里琴（一种四弦琴），这似乎是显然的，但对于语言的翻译而言却并非如此。在 GNMT（Google 神经机器翻译系统）中，一种深度学习系统必须吸收数百万从德语到英语的翻译，教会自己如何吃进 “der rote Hund”（这句是德语）并吐出「红狗」。一个孤立的系统独立学习如何在另一个方向上翻译，如从英语到德语。同样，从法语到英语，英语到法语，韩语到日语等等，每对语言都使用自己的独立系统，这就像翻译行为每次都被重新发明一样。为了支持 100 种语言之间的翻译，你最终可能得训练近 10,000 个独立的系统。这很费时。

　　这些研究人员想知道是否他们可以针对多语言构建一个单一的模型，相对那些孤立的一次性系统保留自己的模型。首先，这样可能更有效率。而且把所有这些语言和词汇放在一个单一架构的内部相互碰撞，也许一些更有趣的事便会发生。

　　他们从小处着手，用一个神经网络训练葡萄牙语和英语，以及英语和西班牙语。到目前为止还不错，这个单一的多语言系统做得很好，几乎和最先进的基于 GNMT 特定语言模型（从英语到西班牙或葡萄牙语）的翻译系统一样好。然后他们想知道，这个算法是否也可以用在西班牙和葡萄牙语之间的翻译？—— 即使它从未学习过任何一例从葡萄牙到西班牙语的翻译。

　　正如他们在十一月份报道的，他们得到的结果是“符合预期且不错的质量” —— 还未到惊人的完美，但是对一个新手来说已不错了。然而当他们给机器喂了一小组从葡萄牙到西班牙语的句子对 —— 一些数据开胃菜，系统突然就表现的和基于葡萄牙到西班牙特定语言模型的 GNMT 一样好了。而且它也适用于其他语言包。正如 Google 的作者们在论文中所写道的：“这是我们第一次认识到，真正的转移学习的一种形式体现在了机器翻译的工作中。”

　　我们很容易忽略这里面的不同寻常之处。这个神经网络教会了自己使用间接信息这种非常原始的（相对人类）新技能。它几乎没有学习过从葡萄牙到西班牙语的翻译，然而现在它处理起这项工作时却非常得心应手。在系统深处的某些地方，系统作者似乎看到了一些词汇共同本质的迹象，这可是意义的要领所在。

　　Google 的 Pereira 这样解释道：“这个模型有一个共同层，用于从任意一门语言翻译到任意另一门语言。这个共同层代表了许多文本的含义，独立于语言，这可是我们从来没有见过的东西。”。

　　当然，目前这个算法的推理能力还非常有限。它不知道企鹅是一种鸟，或者巴黎是在法国。但是它体现了一个即将到来的迹象：基于一套不完整的例子可以使认知产生飞跃的新兴智能。如果今天深度学习在你所在乎的某项技能上还没能击败你，别慌，等等，它终究会的。

　　训练一个系统来做许多事正是开发一个通用智能所需的，并且积极促进这个过程正是如今人工智能的热心拥趸们的核心关注点。本月早些时候 OpenAI，Elon Musk（都认识吧，硅谷钢铁侠，特斯拉 CEO）和 Sam Altman（Y Combinator 新任总裁）创造的研究联盟，发布了「宇宙」（Universe）—— 这是一个训练系统环境，它不仅仅完成单一任务，而是在不同活动之间跳跃转变，以让系统变得适应多样化的任务活动。

　　正如 OpenAI 的另一位联合创始人 Sustkever 所说：“如果你期待看到我们所指的真正意义上的「智能」，它绝不仅仅解决一个问题，而是解决大量的问题。但是对于一个通用终端，到底什么才算是好且智能的？这些还不是那么完全明确的问题。”

　　所以他和他的团队设计了「宇宙」这个系统来帮助其他人，将其作为度量通用人工智能终端解决问题能力的一种方式。系统里包含了上千的雅达利，Flash 游戏和浏览器任务。如果你正在构建的人工智能想要在「宇宙」的训练场中输入任何东西，它会配备和人类操纵计算机同样的工具：一个观察动作的屏幕，以及一组虚拟键盘和鼠标。

　　它的目的是让人工智能在一个「宇宙」环境 —— 例如，游戏《银河飞将3》（Wing Commander III）—— 中漫游学习，然后快速应用习得的经验加速在另一个环境 —— 例如，另一个游戏《粘粘世界》（World of Goo）或者一些不同类型的东西，如 Wolfram Mathematica（Wolfram 公司的一个现代技术计算系统） —— 的学习。一个成功的人工智能终端将会展示一些转移学习能力，并具有一定程度的敏捷性和推理能力。

　　这个方法并非没有先例。在 2013 年，DeepMind 公司透露了一个他们自己发现的单一深度学习算法，从七个雅达利游戏中挑了六个来进行“如何玩”的测试。在其中三个游戏里 —— Breakout（小时候玩过的打砖块游戏），Enduro（一个赛车游戏）和 Pong（乒乓游戏）—— 该算法的表现超越了人类专家级玩家。而「宇宙」系统正是 DeepMind 成功案例的一个升级版本。

　　随着「宇宙」的成长，人工智能受训者们可以开始学习无数有用的计算机相关技能。毕竟，它本质上是进入现代桌面电子处理工作世界的门户。「宇宙」环境的多样性甚至给了人工智能终端见识一些更广阔知识天地的可能，而在其他地方是很难收获这些知识的。

　　从 Flash 和雅达利游戏的冠军到提升医疗服务质量的智能终端，这是一个鸿沟，但这是因为我们的人工智能系统还在幼儿园阶段。过去许多年，人工智能从未取得像今天这样的进步。现在它正走在通往一年级、中学以及最终的高级学位的道路上。

　　是的，结果依然不确定。是的，这让我们害怕。但是如今我们有一个选择。我们可以尝试关闭这个我们既不能完全控制也不能预测的阴暗未来，并且冒着技术自发渗透和觉醒的风险，并引发大规模的替代潮。或者我们可以尝试积极的引导它走向社会效益的最大化，并鼓励促成我们想要看见的未来。

　　在这一点上我站在白宫这边。一个深度学习推动的世界即将来临，我们也许可以赶紧跳进去。

THE END

TAG:软件人工智能百科标签

猜你喜欢

相关文章