让alpha GO挑战星际争霸2?现在或许还为时尚早

爱玩网百万稿费活动投稿,作者 HUSH,未经授权请勿转载!

前言

在去年11月的暴雪嘉年华上,暴雪公司曾与alpha GO的出品方、世界最前沿的人工智能企业DeepMind达成协议,双方将在《星际争霸》系列游戏中进行深度合作。8月9日,DeepMind与暴雪共同发布了协议计划的第一个成果:基于《星际争霸2》的人工智能研究环境——SC2LE。

也许早先alpha GO在传统竞技娱乐项目中的骄人成绩令很多玩家认为“人工智能打游戏”不过是小菜一碟。但从日前公布的研究成果来看,让alpha GO与人类玩家在《星际争霸》中一较高下还为时尚早。

与其说人工智能要挑战《星际争霸2》,倒不如说是后者在主动请战

电脑玩家与人工智能

对于人工智能,相信很多玩家都会抱有一个疑惑:包括alpha GO在内的人工智能在电子游戏中的表现与我们常见的电脑玩家到底有什么不同呢?

所以,在探讨“人工智能的星际水平”之前,让我们先来聊聊人工智能与电脑玩家。

由于某些历史原因,我们习惯性地将游戏中的电脑玩家或游戏角色称之为AI(人工智能缩写),然而事实上,电脑玩家与人工智能在游戏中的工作原理是截然不同的。(下文出现的AI皆指人工智能而非传统意义上的电脑玩家)。

真正“冷酷”的不是AI,而是游戏

在大部分电子游戏中,电脑玩家与人类玩家之间的竞争在游戏信息的掌握上是非对称的。以即时战略类游戏为例:对战中,电脑玩家对于游戏全局全知全能,“战争迷雾”的概念也形同虚设。电脑无时无刻不在洞悉玩家的动向,并能依照设定难度的不同,对玩家的行为予以对应强度的反馈。尽管电脑玩家会在游戏中表现出某些人类化的行为,甚至产生看似偶然的失误,但这不过是在结合了各种信息之后,刻意做出的“放水行为”。从本质上来讲,电脑玩家并非“玩家”,而是游戏自身的一部分。

相比之下,AI则在信息的获取与反馈上与人类玩家完全对等,它在游戏中需要遵从人类玩家的游玩规则。简而言之,AI同样需要“一台显示器、一副键盘与鼠标”。虽然这套设备在很多情况下甚至并不具有实体,仅仅通过函数编程来实现,但AI与它们的互动模式却与我们并无二致。AI可以像我们一样对屏幕内显示的信息予以判断和处理,并根据可视区域内的情况及时按下键盘与鼠标进行操作才能与游戏环境进行交互。而直到现在,“如何让AI有效地使用这套显示器与键鼠设备”依然是项目研究的难点之一。

人工智能眼中的《星际争霸2》

DeepMind到底做了啥?

本次公布的SC2LE(《星际争霸2》学习环境)让研究者可以在Linux系统下接入游戏API(应用程序编程接口),开展自己的人工智能研究。这项技术实现了程序语言与玩家游戏操作的互通,研究者通过编程指令让AI模拟人类玩家的信息处理习惯与游玩方式,让AI通过不断地学习与调整获得更强的处理能力。

在DeepMind看来,人类玩家所擅长的领域对于AI性能的评判来说是至关重要的基准。因此,研究AI在电子游戏中的实际应用对于人工智能技术的发展来说具有非凡意义。

DeepMind在公布研究结果的同时狠狠吹了一把《星际争霸2》……

本次公布的SC2LE是一个在《星际争霸2》中加速AI研究的工具集,简单来说,它大致包括了以下几个部分:

由暴雪开发的机器学习 API,可以让研究者与开发者进入游戏内部环境;

匿名游戏录像的数据集以供AI学习参考;

一个开源版本的工具箱(名为PySC2),可以让AI轻松地获取游戏中抽象化的地图信息(使AI像人类玩家一样“观察”地图,获取所需信息);

一系列简单的强化学习小游戏,包括:操作农民移动到特定地点、采集水晶与气矿、建造兵营等,允许研究者测试AI在具体任务上的性能。

SC2LE为广大人工智能研究者提供了一个公共的竞技场,让所有人工智能爱好者都可以更加便捷地进入游戏环境,参与人工智能的创作与训练。与此同时,可以预见的是,在正式挑战人类之前,AI作者们之间的争锋较量也将会更加激烈。

工具箱中提供的强化学习小游戏

为什么选择《星际争霸》?

众所周知,《星际争霸》是史上最成功的即时战略类游戏之一。系列游戏早早进入了电竞化,各类竞技赛事也持续了20年以上。

同大多数游戏一样,《星际争霸》的取胜条件是击败对手,但在即时战略的规则之下,玩家需要在游戏中顾及、平衡战力以外的多项信息指标,比如:收集水晶、气矿资源、通过建造建筑提高人口上限等。同时,一场《星际争霸》比赛的时间从几分钟到数小时不等,这也意味着游戏中即时进行的操作并不会立刻获得可见的收益。另外由于“战争迷雾”的存在,人工智能在游戏过程中必须要结合历史记忆与长期规划。

“战争迷雾”为双方玩家提供了保护伞

《星际争霸》具有极其丰富的多层次游戏机制,并且由于数量庞大的玩家群体,研究者可以轻易获取大量的游戏记录数据以供AI学习参考。另一方面,大量的人类玩家也为AI提供了优秀的竞争对手。于是,对于人工智能研究来说,《星际争霸》是再理想不过的环境。

《星际争霸》初代也曾为人工智能及机器学习研究者所关注,AAAI人工智能与交互式数字娱乐年度会议(AIIDE)每年也都会举办《星际争霸 母巢战争》的AI对战比赛。在比赛的最后,会议主办方还会安排一场优秀AI与人类玩家的比赛,而从近年的比赛结果来看,AI要战胜人类顶尖玩家还有很长的路要走。

今年的AIIDE将于10月5——9日在美国犹他州雪鸟滑雪场举办

人工智能打“星际”也手残?

在《星际争霸》之前,DeepMind曾设计了很多AI,并在各种环境下测试这些AI的表现,从专门设计的实验性游戏再到现有的围棋以及简单的Atari游戏集,以此来培养人工智能对于复杂问题的解决能力。

相比Atari游戏中屈指可数的操作选择,《星际争霸》的单位操作空间则包含多达300种以上选项。在简单的“上下左右”等基础之上,《星际争霸》中的行为是更加层级化的,它涉及到复数单位的选择控制,并需要即时对操作进行调整与增强。即使是在一个84*84像素的小区域中,也大概存在着1亿种可能的行为。

《星际争霸》中的细微操作极尽复杂,顶级高手之间的对决非常考验基本功

顶尖的人类星际玩家手速可以高达数百APM(每分钟操作的次数),但AI则可以轻松上万,因此,很多玩家认为AI在操作速度上的优势足以奠定其在电子游戏中的胜局,但事实上并非如此简单。《星际争霸2》WCS世界锦标赛冠军Byun Hyun Woo(Byun)在今年5月接收媒体采访时表示——在他的有生之年,人工智能绝不是自己的对手。

ByuN的信心来源于《星际争霸》与围棋的显著差别。在围棋对弈中,棋盘上所有棋子的状态公开透明,双方选手可以无差别地了解棋盘上的所有信息;而在《星际争霸》里,由于“战争迷雾”的存在,玩家无法看到整个战场,因此会在构思策略时受到各种信息的限制。

人类在围棋领域的失利并未让星际选手却步

在ByuN看来,“信息”主导了玩家的资源管理、探索巡逻、建筑布局以及战斗计划等一系列即时策略。而人工智能则难以处理突发事件,也并不擅长对诸多未知与变数做出迅速反应。对于任何一个人工智能专家来说,想要设计一个同时擅长短期操作与长期策略的AI非常困难。ByuN在接受采访时甚至立刻想到了对策:“我会采取非常规的策略和战术来迷惑AI。我会阻挡它的探测单位,防止它得知我的建筑,如果我的基地被发现,我会选择立刻改变所有的建筑计划。”

ByuN对战胜人工智能很有信心

在一篇名为《Where are StarCraft bots weak?》(星际争霸机器人的弱点在哪里?)的文章中,作者也仔细分析了人工智能在《星际争霸》中的弱势所在:

人工智能在《星际》里的策略选择具有很强的规律性,因此可以轻易受到诱骗。其中提到了一个案例:玩家注意到AI总是会用初期兵种去追他的小狗,于是他就用小狗不停地去吸引AI的单位来拖延时间,直到升级出高级兵种直接碾压对方。

其次,在游戏前后期的策略转化上,人类在一开始会采取某种初期战术,一旦失败就立刻会根据对手的状态转换战术来在后期博得主动。尽管AI在多线程与APM方面可以完败人类,但是在侦察环节仍然不可能做到天衣无缝,仅仅是使用简单的兵种克制就可以有效限制侦察单位的行动,这是任何高超的操作也难以突破的极限。

除此以外,AI在建筑学等细节操作方面也很难以效仿人类随机应变的能力。

本次DeepMind所公布的研究成果依然印证了上述分析。在DeepMind研究人员的调查中,AI在一些独立的强化学习小游戏中表现良好,在人工智能的操控下,人类农民可以出色地完成移动、建造、采集资源等分项操作。但是在完整内容的游戏中,即便是性能出色的AI也难以在简单的游戏中取胜(没错,现在的人工智能可能连“简单电脑”都打不过……)。

简单电脑:听说你还想跟人打?

结语

DeepMind本次公布的阶段成果在于向全球人工智能研究者提供更加有效的研发工具,借用全世界人工智能爱好者之力,挑战人类自身的又一个极限。作为玩家,我们经常以电子游戏的艺术性引以为傲,也总爱将“第九艺术”的美名挂在嘴边。然而如今,人类科学技术的最前沿——人工智能也要向电子游戏与玩家拜师学艺,在担心人工智能有能力向星际选手发起挑战之前,开展这项研究本身也许就够我们吹上一阵子了。

其实说白了,DeepMind觉得《星际2》太TM难了,大家一起来搞吧!

P.S.在本文完成的当天,由人工智能研究组织“OpenAI”训练的AI在《DOTA2》的1v1比赛中战胜了人类顶尖选手之一——Dendi。

编辑/冬晨

欢迎参加——爱玩网百万稿费活动:当金牌作者,开网易专栏,领丰厚稿费,得专属周边!

详情请看这里

游戏专栏投稿信箱:otaku@vip.163.com

欢迎订阅爱玩APP的《百万投稿每日精选》,更多精彩等着你!

本文来源:查尔星港 责任编辑:黄东晨_N7338