公众号
关注微信公众号
移动端
创头条企服版APP

DeepMind为AI打造出一个「元宇宙」,XLand到底有多牛?

5610
钛媒体 App 2021-08-05 16:58 抢发第一评

文丨锌财经,作者丨陈伊婷,编辑丨大风

DeepMind推出最新泛用型游戏XLand,冷不丁丢出一个重磅炸弹。这意味着,在零样本且不需要事先知道规则的情况下,就可以打造出一个全新的、堪比AlphaGo的人工智能。

一直以来,AI强化学习苦于泛化能力差,只能针对单个任务来从头开始学习。

5年前,AlphaGo打败世界围棋冠军李世石,举世惊呼。自AlphaGo之后,Deepmind又推出能通学西洋棋、将棋、围棋的AlphaZero。

AlphaZero非常强大,在三大棋领域中「打遍天下无敌手」。但问题在于,AlphaZero若想能够在不同游戏中「称霸天下」,还得在每个游戏「从零训练」后才能够实现。

XLand的出现则弥补了这个缺陷。如果说AlphaZero是「下棋的手」,那么XLand则创造出了「一个人」。

它的强大之处,在于它高度泛化的能力。简单的说就是触类旁通,好比人类学会用筷子夹米饭,就能学会用筷子夹菜。而DeepMind打造XLand的目的,则是为了让自家通过强化学习训练的AI,能够玩遍「全宇宙的游戏」。

这个世界的任务由游戏、世界、玩家构成。根据三要素的不同关系,来决定任务的复杂度。复杂度则由竞争性,平衡性,可选项,探索难度这4个维度评判。

从简单到复杂的游戏,AI智能体通过第一人称视角去感知游戏中环境,并且不断尝试、碰撞游戏规则,从中累积庞大数据来训练自己完成游戏目标。

简单的比如「靠近紫色立方体」,复杂一点的比如「靠近紫色立方体或将黄色球体放在红色地板上」。长此以往,AI智能体从新手小白成长为屠龙勇士,吃鸡、捉迷藏都难不倒它们。

基于此,一个由任务空间组成的、超大规模的「元宇宙」XLand就诞生了,几何地球只是其中的一个小角落。我们或许可以提出这样一个设想,人类是外星人创造的AI,而地球是外星人创造的XLand。

经过5代训练,AI智能体在XLand的4000个独立世界中玩大约70万个独立游戏,涉及340万个独立任务的结果,最后一代的每个智能体都经历了2000亿次训练步骤。

目前,AI智能体已经能够顺利参与几乎每个评估任务,除了少数连人类也无法完成的任务。

从AlphaGo走到现在XLand,DeepMind展示了无监督式机器学习的高度潜力,也向世界证明未来训练AI的成本跟门槛将会越来越低,直至普及全球。

未来的某一天,当AI也能够在「元宇宙」中自己学习演化,赛博朋克的世界是否会真的到来?

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
阿里云创新中心
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP