DeepMind的工作人员正在推进他们的方法,朝着像孩子一样自主学习的机器的梦想又迈进了一步。

这家总部位于伦敦的公司是Alphabet的子公司,今天正式发表了这项研究自然不过,去年11月,该公司曾以一笔收购预印出来了。不过,直到现在,其影响才变得清晰起来:DeepMind已经在研究现实世界的应用。

DeepMind2016年成名AlphaGo是一个强化学习系统,在经过数百万次大师级比赛的训练后击败了围棋。2018年,公司跟进AlphaZero训练自己击败围棋、国际象棋和将棋,所有这些都无需求助于大师游戏或建议。现在出现了MuZero,它甚至不需要显示游戏规则。

新系统先尝试一个动作,然后再尝试另一个动作,了解规则允许什么,同时注意到在国际象棋中提供的奖励,通过将死;在《吃豆人》中,吞下一个黄色的点。然后,它会改变自己的方法,直到找到一种更容易赢得奖励的方法——也就是说,它会改进自己的玩法。这种通过观察来学习的方式对于任何面临难以明确问题的人工智能来说都是理想的。在混乱的现实世界中——除了游戏的抽象纯粹——这样的问题比比皆是。

“我们正在探索MuZero在视频压缩方面的应用,这是AlphaZero无法做到的,”他说托马斯·休伯特是该研究的十几位合著者之一自然篇文章。

“这是因为用AlphaZero来做这件事非常昂贵,”另一位合著者朱利安·施里特维泽(Julian Schrittwieser)补充道。

其他正在讨论的应用包括自动驾驶汽车(Alphabet的自动驾驶汽车由其子公司Waymo负责)和蛋白质设计(蛋白质折叠的姐妹程序)AlphaFold最近掌握了).这里的目标可能是设计一种基于蛋白质的药物,它必须作用于某种本身就是行动者的东西,比如病毒或细胞表面的受体。

通过同时学习规则和提高棋艺,MuZero在经济使用数据方面超越了DeepMind的前辈。在雅达利游戏《吃豆人女士》中,当MuZero每次移动只能考虑六到七次模拟时——正如DeepMind在一份声明中指出的那样,“这个数字太小,无法涵盖所有可用的动作”——它仍然表现得相当不错。

该系统需要相当数量的计算能力来训练,但一旦训练完毕,它只需很少的处理就能做出决定,以至于整个操作可能都可以在智能手机上进行管理。“甚至连培训都不是那么多,”他说Schrittwieser。“一个在一个GPU上训练一款雅达利游戏需要2-3周的时间。”

精益运营的一个原因是,MuZero只对环境(游戏或世界)的那些方面进行建模,这些方面与决策过程有关。DeepMind在一份声明中指出:“毕竟,知道一把雨伞能让你保持干燥,比知道空气中雨滴的模式更有用。”

知道什么是重要的是重要的。国际象棋知识讲述了这样一个故事:一位著名的宗师被问及他能看到前面还有几步棋。“只有一个,”冠军吟诵道,“但它总是最好的。”当然,这是一种夸张,但它包含了一个真理的核心:强大的棋手通常只检查跨越几十个位置的分析线,但他们一眼就知道哪些是值得研究的。

孩子们可以通过接触很少的实例来学习一般的模式——就像从一滴水推断尼亚加拉瀑布一样。这种惊人的归纳能力吸引了几代心理学家;语言学家诺姆·乔姆斯基(Noam Chomsky)曾提出,孩子们必须牢牢掌握语法的基本知识,否则“缺乏刺激”就不可能让他们学会说话。现在,这个想法是问题来了;也许孩子们真的能从极少的东西中学到很多东西。

也许机器也正处于学习如何以这种方式学习的早期阶段。提示的鲨鱼的音乐

对话(0)

仿生手军备竞赛

义肢行业过于专注于复杂、昂贵且通常不切实际的高科技假肢

12分钟读取
水平
一张照片上,一位年轻女子坐在一张白色的桌子旁,她有着棕色的眼睛和染成玫瑰金色的齐肩长发。她一手拿着碳纤维机械臂和机械手。她的另一只手臂在肘部附近。她的短袖衬衫上有手的图案。

作者Britt Young抱着她的Ottobock仿生仿生手臂。

加芙Hasbun。化妆:Maria Nguyen for MAC cosmetics;发型:Joan Laqui为Living Proof设计
DarkGray

在儒勒·凡尔纳1865年的小说中从地球到月球在美国,虚构的巴尔的摩枪支俱乐部的成员都是残疾的内战退伍军人,他们焦躁不安地寻找一个新的敌人来征服。他们在战争中不断创新更致命的武器。战争结束时,“四个人只有一条胳膊,六个人只有两条腿”,这些自学成才的截肢武器匠决定将他们的技能用于一种新的投射物:火箭船。

巴尔的摩枪支俱乐部将自己推向月球的故事讲述了老兵非凡的男性力量,他们不仅仅是“克服”了自己的残疾;他从中获得权力和野心。他们的“拐杖、木腿、人工手臂、钢钩、橡胶下巴、银色头盖和铂金鼻子”在他们的个性中不起主导作用——它们只是身体上的工具。这些零碎的人不太可能是发明的十字军战士,肩负着更不可能的使命。然而,还有谁比被技术改造的人更适合设计下一次技术上的巨大飞跃呢?

继续阅读↓ 显示更少
Baidu