AlphaStar是如何掌握游戏的

你消失的踪迹
精选回答

2022年1月28日整理发布:DeepMind 能够成功打破无约束规则,很大程度上得益于其母公司庞大的计算资源。目前,成功的人工智能模型是那些 可以随着数据和计算的可用性而扩展的模型。因此,如果您可以在问题上投入更多的匹配和更强大的处理器,您可能会看到新的更好的结果。

DeepMind 还 为每种不同的种族类型创建了一个神经网络。实际上,这意味着它正在为每场比赛训练一个单独的 AI 模型。同样,谷歌庞大的 TensorFlow 处理器库使这成为可能。

但驱动 AlphaStar 新版本的 AI 算法也有一些有趣的创新。AlphaStar 使用自我对弈,这是一种强化学习技术,其中 AI 代理自己多次扮演代理。自我 对弈是 DeepMind 的巨大围棋 AI AlphaZero使用的技术。自我游戏使 AI 代理能够快速学习,而无需人工输入,这可能是昂贵的(您将从哪里获取数亿玩过的游戏的数据?)。

然而,自我游戏也有其缺点。建立在自我游戏基础上的人工智能模型往往会发展出不合逻辑的行为。它们也变得非常脆弱,在特定条件下表现最佳,并随着环境的最轻微变化而破裂。DeepMind 使用多个 AI 代理,其目标不仅是为了获胜,而且通过发现对手的缺陷来变得更强大。这种技术使人工智能能够开发出更普遍的行为。

AlphaStar 还使用模仿学习,观察人类回放来发展探索星际争霸复杂环境的行为。

关于 AlphaStar 的一些注意事项和注意事项

在介绍 AlphaStar 新版本的博客文章中,DeepMind 的人工智能研究人员表示,“最终,这些结果提供了强有力的证据,证明通用学习技术可以扩展人工智能系统,使其在涉及多个参与者的复杂、动态环境中工作。”

虽然新版本的 AlphaStar 非常出色,但我不会将其称为通用人工智能的突破。它更类似于我们近年来看到的渐进式进步。

一方面,与 AlphaZero 在人类零输入的情况下掌握围棋不同,AlphaStar 仍然严重依赖人类数据。人工智能研究人员在论文的几个部分中明确表示,AlphaStar 需要来自人类游戏的数据。这很重要,因为它表明当前的人工智能技术仍然缺乏探索开放环境的能力。

此外,人工智能研究人员没有明确说明游戏接收信息的格式。根据博文和随附的论文,人工智能使用“类似相机的界面”来分析游戏地图。但这并不意味着 AlphaStar 可以看到与人类相同的复杂图形。处理这种数据需要在 计算机视觉方面付出额外的努力。

相反,AlphaStar 获取原始游戏数据,但仅限于通过摄像头查看时所看到的数量。 我不会完全称之为作弊。就像我们不能指望人类通过盯着原始游戏数据表来玩星际争霸一样,我们也不应该指望人工智能一定会通过盯着为人类视觉系统量身定制的图形来掌握游戏。

然而,它确实突出了 当代人工智能和人类智能之间的明显差异。如果 AlphaStar 一直在通过处理其游戏内的图形来学习玩星际争霸,它就必须解决各种新的挑战。例如,单位颜色或形状的最轻微变化都会使 AI 无法检测到它们。AlphaStar 将不得不针对图形的不同变化进行额外的训练周期。

此外,AlphaStar 可能能够击败世界上少数几位最好的玩家,但它仍然缺乏星际争霸新手玩家所拥有的许多技能。例如,任何玩过星际争霸 II 到中等水平的人都可以跳入类似的游戏,例如魔兽争霸或命令与征服,并很快适应游戏环境。但对于 DeepMind 的超强 AI 来说,每一个新游戏都是一个新的挑战,需要数百万次训练匹配。

AI 研究员和认知科学家 Gary Marcus 发布了一组用于评估 AI 行为的测试。这些将是对 AlphaStar 和类似 AI 模型的未来迭代进行评分的有用基准。

总之,我想说 AlphaStar 是人工智能领域的杰出成就,尤其是强化学习。游戏人工智能研究的结果肯定会在机器人和资源管理等领域有所帮助。总部位于旧金山的 OpenAI 使用类似的 AI 技术来开发 尖端的机器人手。DeepMind 的 AlphaStar 也将很快找到其真实世界的用例。

但是,虽然 AlphaStar 向我们展示了我们仍然可以突破人工智能的极限,但它也提醒我们要复制人类大脑这一自然界最复杂的产品必须克服的挑战。

忘记过去 2023-08-16 15:27:40

相关推荐

电脑如何添加域

先点击计算机,然后单击右键,选择属性项,更改设置选择更改。计算机名字更改为使用者名字,这样是为了区分域中的计算机,域填写需要加进去的域名,点击确定,弹出对话框,填写域管理员的账号密码。点击计算机,然后单击右键,...
展开详情

雾莲要不要去皮

莲雾不需要去皮。莲雾是可以连皮一起食用的水果,但前提是要将其洗干净。从市场买回来的莲雾可先用流水冲洗一遍,再将其放入有少量食盐的清水中浸泡15分钟左右,再用清水冲洗1-2遍即可食用。雾莲雾莲一般指洋蒲桃,也叫莲...
展开详情

茂县有多少人口

茂县,在2015年末,户籍人口为11.16万;茂县,隶属于四川省阿坝藏族羌族自治州。位于四川省西北部、阿坝藏族羌族自治州东南部的青藏高原东南边缘,地跨岷江和涪江上游高山河谷地带,属高原性季风气候;全县总面积39...
展开详情

板式家具设计需要学习哪些软件

CAD:主要绘制工具,此软件是家具设计师的重点学习软件。3DMAX:产品建模,场景建模主要展示出产品的特质构造。Vray:配合3DMAX,渲染出产品展示产品三维和各种材质的特点。Coreldraw:产品包装图纸...
展开详情

如何带好一支优秀的幼儿教师团队

实行人为管理,充分尊重和信任教师。实行人性化管理,让每一位教师都参与到管理中去。切实关心教师的生活,解决教师的后顾之忧。尊重和信任教师。善于用人,充分发挥团队的力量。注重教师培训,提高业务水平。按计划定期让老师...
展开详情

精选推荐更多>

太阳主要内容

《太阳》主要介绍了太阳相关的一些知识以及太阳跟人类有着非常密切的关系。文章分为两大部分,一部分从“远”、“大”、“热”三个方面介绍了太阳的有关知识,而第二部分讲的就是太阳跟人类有着密切的关系。
《太阳》是一篇常识性说明文,它介绍了太阳的特点,讲述了太阳和地球及人类的关系。这两部分相互关联,正因为太阳很大,温度很高,离我们很远,才能给地球送来温暖和光芒。用原文的话说就是没有太阳,就没有我们这个美丽可爱的世界。

可可被我收养后有什么变化呢你从这些变化中读出了什么

可可被“我”收养后,从长期所受的精神虐待中恢复过来,变得活泼而神采奕奕,并且对我恋恋不舍。通过可可的这些变化,可以看出“我”对生命的热爱和对生命的尊重。出自《动物笑谈》。
《动物笑谈》以作者自己的观察来描写几种动物,并由此获得自我“可笑”的感受(而不是动物蠢笨可笑),这是十分独特的写作视角,充满对动物的喜爱和爱护之情。
《动物笑谈》句子赏析:
1、“要是这时我不继续叫唤,它们就要尖声地哭了。好像只要我不出声,它们就以为我死了,或者以为我不再爱它们了。这真是值得大哭特哭的理由呢!”用风趣的语言写出了小鸭对母亲的需索不休和“我”哭笑不得的心理。
2、“我跑到犯罪现场一看,果然,可可不但把这位老教授身上的扣子全咬下来了,而且还整整齐齐地排在地上。”活化出鹦鹉可可聪明、调皮的形象,令人忍俊不禁。

类比推理是什么意思

类比推理亦称“类推”,是推理的一种形式,根据两个对象在某些属性上相同或相似,通过比较而推断出它们在其他属性上也相同的推理过程。它是从观察个别现象开始的,因而近似归纳推理。但它又不是由特殊到一般,而是由特殊到特殊,因而又不同于归纳推理。分完全类推和不完全类推两种形式。完全类推是两个或两类事物在进行比较的方面完全相同时的类推;不完全类推是两个或两类事物在进行比较的方面不完全相同时的类推。
以关于两个事物某些属性相同的判断为前提,推出两个事物的其他属性相同的结论的推理。如声和光有不少属性相同--直线传播,有反射、折射和干扰等现象;由此推出:既然声有波动性质,光也有波动性质。这就是类比推理。类比推理具有或然性。如果前提中确认的共同属性很少,而且共同属性和推出来的属性没有什么关系,这样的类比推理就极不可靠,称为机械类比。科学家常根据类比推理得出重要结论。

有志者事竟成的全句

“有志者事竟成”的全句:“有志者事竟成,破釜沉舟,百二秦关终属楚;苦心人天不负,卧薪尝胆,三千越甲可吞吴。”这是一副自勉联,作者是蒲松龄。意思是指有志向的人,做事终究会成功。告诉我们人生要自己去拼搏、去奋斗,在风雨中百折不挠勇往直前。
由来:
东汉时,耿弇是汉光武帝刘秀手下的一员名将。有一回,刘秀派他去攻打地方豪强张步,战斗非常激烈。突然,耿弇的大腿被一支飞箭射中,他抽出佩剑把箭砍断,又继续战斗,终于耿弇打败敌人。汉光武帝表扬了耿弇。并且感慨地对他说:“将军以前在南阳时提出攻打张步,平定山东一带,当初还觉得计划太大,担心难于实现。现在我才知道,有志气的人,事情终归是能成功的。”
常见热点问答
热点搜索
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200
作文大全
1-20
21-40
41-60
61-80
81-100
101-120
121-140
141-160
161-180
181-200