在与AI的电竞交锋中,人类是不是还可以挣扎一下?

豪猪

0 发布时间:2018-08-28 11:52:21
# 游戏江湖事 #

这个月OpenAI的表现可以总结为:在吊打了被绑住双手的民间高手后,转头却又被顶尖战队“教做人”的故事。对于“跌落凡尘”的OpenAI,我们有五个问题。

大约半个多月前,DOTA圈发生了一件不大不小的事情:在一次公开赛事中,人工智能OpenAI在现场数千名观众以及直播频道数十万人的围观下,直落两盘轻松战胜由半职业选手组成的战队,人类仅在最后一盘通过“无耻的”刁难才扳回一局。这一天让人们回想起了2017年初横空出世的阿尔法狗(AlphaGo)吊打棋界的恐怖。赛后,OpenAI遭遇了不小的争议,有质疑比赛规则的,有质疑AI是否“作弊”的,总而言之就是两字:“不服”。

对此,OpenAI的团队则表示将在月底DOTA2总决赛TI8上挑战顶尖的职业战队以证明自己。随着8月底连续2“人机大战”,人类选手们用自己实力让OpenAI明白了“还未够班”的道理,OpenAI与人类孰强孰弱的争论也暂告段落,但由此引发的诸多疑问还未解答。

OpenAI在8月的两次交锋为何先赢后输?

8月初的比赛里,OpenAI面对的是平均分6500分以上,由4个半职业选手+1名现役职业选手的组合(最低天梯排名也有1000名),在第一局比赛前5分钟人类选手击杀数就以0:5落后,13分钟的时候人类更是被全面碾压并“干脆利落”的输掉比赛。第二局战况稍好一些,人类选手们足足“抵抗”了近30分钟才败下阵来。

到了8月底TI8的这轮交锋上,形势则完全逆转。在顶尖高手娴熟的配合下,AI成了被吊打的“小朋友”。尽管这几场比赛OpenAI不乏一些精彩的亮点,比如微操依然犀利,对小规模战斗的击杀判定依然精准,开局抱团推进的策略选择颇为有效等等。但总体而言,AI在8月初就暴露的问题依然没能解决。比如,当着对手面开雾后继续补兵、开局基地插眼、对胜率判断存在重大BUG、无法识别“隐刀”这个道具的作用(哪怕人类选手当着AI面隐身)以及对线补兵的问题等。

为何两次对抗的结局如此不同?

第一个原因是心理素质。

观众衡量选手水平时往往会以其高光时刻为对照,却经常低估心理因素的影响。要知道,不管职业还是半职业选手,他们是活生生的人,面对微操已经足以打爆顶尖选手的AI,人类选手从开局起就面临着源源不断的心理压力。这种情况下非职业选手很容易产生明显的情绪波动,进而影响到后续发挥,特别是团战失利之后,半职业选手就明显给人感觉进退失据了。

反观职业选手,因为综合训练强度大,经历的各种大赛多,所以面对这些问题都有足够的心理应对。所以,在第二轮交锋中,尽管有不少顶尖选手遭遇被AI“秀一脸”的“侮辱”,但他们的发挥依然稳定,并没有受到太大影响。

第二个原因是实力差距。

8月初与AI交锋的人类选手已经算得上“路人大神”,不过与职业战队相比最大的短板在于没有长时间训练带来的团队默契与战术选择。由此带来的问题就是团队缺乏默契,以及不同情况下团队与战术的选择——比如团战配合问题,在路人看来无关紧要的小失误,在行动精准的AI面前就是一个致命的漏洞。这些问题经过AI的放大,呈现在我们面前的当然是选手们“菜鸡”般的表现。

随着这些短板被职业战队补上,AI在策略选择上的短板就暴露无遗了。

在第一天比赛日,尽管前30分钟AI表现很强势,可随着25-30分钟的关键团战失利之后,AI突然像是不会玩了一样,不仅出现开大招打野的昏招,而且控制的英雄到处乱逛,最终被人类轻松战胜。

第二日的比赛,虽然中国传奇教练队在微操上不如其巅峰状态,但多年职业生涯的战术素养和大局观还在,特别是B神宝刀未老的强大刷钱实力,让AI吃足了苦头。换句话说,在执行力和战术选择更高明的顶尖人类选手面前,一旦AI判定的高胜率套路被人类破解后,人工智能缺乏应变能力的弱点自然就清晰的展现在我们面前。

两次“不公平”的交锋意义何在?

坦白讲,这两轮交锋对人类选手而言都不算公平。

首先是比赛的规则的不公平。

区区18个可选英雄且不能BP就不说了,还有不允许使用幻象和召唤类的英雄与道具等限制,而且8月初的比赛甚至给AI配备了5个无敌信使。

其次是AI信息获取与反应速度的不公平。

无论是上轮交锋人类神牛跳刀被AI光速变羊,还是本轮交锋斧王跳刀吼的连招被AI各种秀,这种反应速度哪怕顶尖人类选手都做不到。也难怪有人质疑:斧王跳刀吼只有0.3秒延迟,AI基本都能以“0.2”反应速度让斧王的跳吼落空,这还是“模拟”人类的反应速度吗?

如果我们从商业的角度看待这两场交锋,很多疑问都能有合理的解释。OpenAI团队用这样不公平的方式展示自家产品,那点“小心思”我们也能理解:融资的时候向投资人介绍产品时用“AI可以在特定情况下战胜人类”明显比“AI虽然被吊打,但不乏有若干亮点”更有说服力。

对赛事方来说,这是一个很好的曝光机会,还有什么比“AI大战人类”这样的噱头更能吸引主流媒体的目光呢?对观众而言,看到一场别开生面的比赛既有话题性,又能满足新奇感。

唯一不爽的,估计只有职业选手了:在这样的规则下交锋,赢了没意义——打败这样的对手有何“荣誉”可言?输了那更不甘心,以后还怎么在江湖上“混”?

倒是AI在信息获取与反应速度上的特点被一片“AI作弊”声中被忽略了,事实上,笔者认为这值得一提:人类选手在面对巨大信息流时,大脑会针对不同信息进行优先级区分,并且多数情况下会主动屏蔽一些自己觉得无效的信息。比如在DOTA团战中,玩家经常会死追着一个目标打,从而忽略了自身可能身处险境——俗称“上头”。而AI不同,它会对战局所有信息都进行综合处理,而且凭借着256Tesla P100强大算力的支持,这些信息都可以在规定时间内处理完成。这种对信息的全局过滤与计算,才是AI强于人类的地方——而AI秒羊,断吼的“神操作”只不过是其中一部分罢了。

当然,这两次交锋对AI的重要意义不止于此。在此前的访谈中,OpenAI的团队曾提到,AI每天进行200万局的对战——这相当于 职业选手180年的训练量 换成1名普通玩家这么练18年,不敢说媲美顶尖选手,最起码对游戏各种机制和英雄都烂熟于心了,可AI只学会18个英雄不说,居然还有基地插眼,开雾补刀这样的低级操作。这至少证明了一点:如此量级的训练看似惊人,可就凭目前AI“算法”,学习的“效率”实在太低。

可从某种程度上讲,AI学习更像是一个“黑盒子”,研究人员只能告诉AI基本的游戏规则和学习的方式(算法),剩下就只能靠AI在不断学习中自行“领悟”。至于领悟过程中有没有出现BUG,研究人员很难判断(数量太多,鬼知道哪场比赛出现过)。因此,通过更高强度的对抗以挖掘AI的不足是一条必由之路。

从采访透露的信息看,两次交锋AI团队都有不小的收获:

第一次交锋暴露出的不少问题已经为团队指明了方向,其中一项成果显而易见:AI“学会”了如何共用一只普通信使而不是五只无敌信使。

第二次的交锋结束,但AI暴露出的胜率计算,胡乱插眼等问题同样影响深远——尤其是AI胜率预测的BUG,别看只是一组数字,但这往往决定了AI比赛过程中的策略选择,明明胜率这么高,结果实际遭遇战/团战的信息反馈又截然相反,很容易让AI进退失据——解决了这个问题,也许下一次亮相,AI的整体实力又会有一次巨大的飞跃。

为什么DeepMind失败而OpenAI“成功”呢

相比阿尔法狗OpenAI的游戏之路似乎过得顺风顺水,从20173月OpenAI第一个可运行版本正式诞生,到去年8月份TI7总决赛现场正式亮相,OpenAI凭借一手让人惊艳的影魔,在中路1V1单挑中完胜顶级职业选手Dendi,从而实现了开门红。经过11个月的训练与算法优化,第一版的OpenAI Five就可以在一定规则限制下5VS5击败6000分左右的路人队伍。到8月初,OpenAI Five已经学会了18个英雄的使用方法,与6000分左右的路人队伍打的有来有回了;而8月底AI的表现也算得上可圈可点,让人对它的未来充满信心。

反观阿尔法狗(DeepMind),从宣布和暴雪合作挑战星际2以来就悄无声息,结果9个月后突然宣布放弃星际2项目更是让玩家大感意外。同样是研究人工智能,阿尔法狗背后甚至有谷歌站队,无论是资金还是技术在理论上都比OpenAI团队要强上不少,为何两者的“命运”截然不同呢?

首先是两者开局的“难度”不同。

星际2与DOTA2在单局比赛信息的复杂程度完全不可同日而语,前者要明显高出一个数量级;这还不算,DeepMind还尝试着直接使用图像识别地图上各元素的方式来替代使用游戏API接口直接获取游戏各种数据,这无疑极大增加了难度(而且最终效果不佳)。而OpenAI直接使用了V社提供的API接口,可以比选手更直观的获得地图内各种信息。换句话说,DeepMind试图直接绕过了AI发展的正常流程(由简单到复杂,由弱到强),直接挑选了需要强AI才可以搞定的星际2(当然,DOTA2在某种程度上也属于属于次一级的强AI),失败是大概率的事件——事实上,DeepMind团队在解释失败原因时也提到了开发过程中所面临的难题都比想象的要更棘手,目前深度学习算法的瓶颈等问题。

其次,两者面临资源需求不同。电子游戏与围棋虽然同属游戏,但从AI决策的角度看,两者所需的资源(主要是算力)没有可比性。

第一,棋局呈现出的信息是有限的,每一步落子有多少后续可能性“一目了然”;

第二,像先手、提子、打劫这些规则都是明明白白,对弈双方任何行动都清晰可见;

第三,有明确达成目标的标准,没有模糊的空间。有了这些前提,AI面临的唯一的障碍就是围棋理论上拥有的近乎天文数字般的落子可能,而这AI恰恰可以通过远超人类的算力“穷举”所有可能,再这个基础上再通过关键算法的优化帮助(深度学习),才使得AI得以称霸围棋。

如果按这三个标准套入星际2和DOTA2这两款游戏,你会发现AI面临的难度上升到了一个新的层级。除了胜利目标是明确的外,其他两个特征都不具备:

特征一,两款游戏虽然都有“战争迷雾”,但迷雾背后隐藏的信息量差别极大。

DOTA2迷雾背后的信息量相对是“有限”的:对方只可能有5个英雄,野区的怪物刷新时间固定而且可以提供的金钱数量可以预计。哪怕对方英雄全不在视野里,能做的事情也非常有限(不在线上补兵经济和等级都受限)。而在星际2里,迷雾背后可以做的事情太多了,对手是不是偷鸡了?有没有开矿?是攀科技还是暴兵?每一个决定背后又衍生无数的分支,对AI而言每一个决策背后的逻辑链条太长,使它们很难理解对手特定行为背后意义所在。而现阶段DeepMind的算法无法帮助AI提高学习效率,甚至让AI看人类选手比赛的录像都比瞎练要有效率,可以想象,对9个月才学会“飞基地”的AI而言,以现在的效率等它战胜简单电脑恐怕要好几年了。

特征二,相比于围棋3的361次方的落子可能,星际2与DOTA2战局的复杂性增加了一个数量级。

DOTA2目前庞大的英雄池以及BP所产生的英雄组合变化OpenAI就搞不定,要不怎么一年多了才“学会”使用18个英雄?可以想象,随着英雄池进一步扩大,OpenAI的算法不改进,学习速度只会越来越慢。相比之下,星际2难度更高,别的不说,单论星际2的单位不仅组合繁多而且数量庞大,甚至同样兵种组合数量配比不同战力都大相径庭,在这种情况下AI还怎么决策?这个 量级的算力已经不是目前AI所能承受的了。像这次TI8的表演赛,OpenAI256台高性能设备已经占了很大的空间了,再 堆算力在算法没改进前投入和产出比实在太低,而且也违背了AI设计初衷(成本)。

最后,OpenAI更懂得宣传和自我包装。从1对1开始到路人5V5再到半职业队,OpenAI的每一步走的都很稳健,为人类战队设置的诸多限制在引发争议的同时,也成功的塑造了OpenAI“飞速进化”的形象。相比之下,DeepMind团队就要实诚的多,直接就把AI放在地狱难度的环境里摸爬滚打,愣是看着AI被虐了9个月,眼见情况始终没有好转就干脆利落的宣布放弃。要按OpenAI的揍性,DeepMind在星际2里不还得从地图全开,单一兵种限定开始?

AI为什么老跟游戏过不去

从深蓝到阿尔法狗再到OpenAI,从国际象棋到围棋再到DOTA2,每一次人工智能名声大噪都伴随着一款游戏的“沦陷”,这不由的让人好奇:为什么AI老跟游戏过不去?

一大原因当然是宣传的需要,AI技术并不是近几年才突然出现的,在突破性的深度学习算法出现之前,AI技术已经在实验室里待了40多年。事实上,一项新技术从诞生到广泛应用,最艰难的不仅是技术瓶颈的突破,还在于漫长研发过程中海量资源的持续投入。考虑到不是每一个决策者/投资者都对AI技术门儿清(甚至在最终成果出现前,连科学家都说不清楚自己研究的方向是不是正确的)。那么,总得有一个让大众能理解的载体展现AI技术的进展吧?按这个标准,游戏就很合适:一来它广为人知,哪怕完全不懂的人,通过文章简单的科普也能了解一二;二来其玩法也有一定的复杂性,能很好的展现AI的实力。

其次是游戏本身的特性决定。从人类出现的那一刻起,吃饭睡觉之外的“娱乐”活动就已经牢牢占据了我们生活的一部分,连动物都懂得嬉戏玩闹何况人乎?人类通过发达的大脑,发明出诸多规则不同的复杂娱乐,棋牌、电子游戏在内游戏类别正是其中的佼佼者。别小看这些游戏,它们在某种程度上可以是现实中人类社会规则的投射与具现。比如棋牌游戏的策略博弈,网络游戏的团队合作与集体决策等等。同时,这些游戏大多有一个“最终目标”,使得科学家可以非常直观的看到AI行为产生的后果并进行相应的调试,从而达到提升AI决策能力的目的,整个过程不会产生任何负面的影响——虽然对那些被血虐的玩家而言游戏体验可能差了一点。

第三原因是游戏的信息量与风险是可控的。从信息量的角度讲,不管游戏有多复杂,其信息量多少还是可以估算和预测大致范围的,而现实中其他AI可涉足的领域,信息不但繁杂且隐蔽,AI根本不可能完全获悉。最近上映的一部电影《西虹市首富》就有这么个场景:主角为了花光10亿现金,专门到股市砸钱购买那些没人要的垃圾股,结果股价反而因为这笔天量资金的涌入迅速上涨,最终让主角狠赚了一笔。像电影主角这样突然心血来潮的行为,AI从何得知缘由又如何判断其中的风险呢?所以,通过游戏的训练AI掌握人类的思维方式总比冒着巨大的风险让AI给病人看病、炒股、制定政策要好。

我们应该如何看待AI?

每一次AI在游戏内的进步都会引发玩家的担忧,悲观者认为照这个趋势下去AI迟早会统治世界,到时候别说一些技术含量不高的岗位被AI替代了,连人类都可能沦为AI的奴隶。这个论调看上去有点道理:像围棋这样棋牌游戏,职业棋手的水平本来就是随着时间的推移不断提高的,可现在AI的横空出世直接告诉所有人类“你们都别折腾了,我就是围棋的天花板”,这让人如何不心生绝望?本来AI的计算能力就远超人类,现在决策都比人类要强了,除了少数从事创意和科研的人类外,绝大多数人类有何存在的价值呢?

事实上,把AI在游戏领域的成就当成是“毁灭游戏”的人往往低估了人类心(阿)理(Q)素(精)质(神)的强大。你AIB是吧?我不跟你玩不行吗?游戏开发商难道还会丧心病狂到强行安排AI虐玩家吗?再说,AI强不强跟绝大多数人有何关系?难道没有AI,我们的围棋水平就可以达到世界第一吗?难道没有AI,我们星际2,DOTA2的天梯排名就可以俯瞰众生吗?既然做不到,那么在我们头顶的是某位人类大神还是AI有什么区别呢?

另一个误区是,AI在游戏领域“血虐”人类只是手段而不是目的。正如前文所说,AI选择游戏领域持续发力,最终目的还是为了学习模仿人类的决策与预测能力,从而帮助人类进行决策——请注意,是辅助,而不是替代。

不过要实现这一目标,AI还有很长的路要走,尤其在样本数量极少的情况下,AI如何通过“海量”的训练来模拟人类基于经验和直觉的决策呢?比如在游戏领域,一些职业选手可能可以根据捕捉到的蛛丝马迹判断对手的战术,可AI就得不停的进行自我训练积累数据,一旦数据库里没有对手这种战术,AI就会“犯傻”。投资领域也是如此,当腾讯、阿里巴巴这样的企业在上市时,AI如何判断其价值?通过历史上同类企业的情况进行分析?可在腾讯和阿里巴巴独此一家别无分店,哪来的历史资料?苹果、微软、谷歌都是唯一的数据样本,如何预测这些企业未来发展前景?这要换成投资大师还用多想吗?

至于AI替代人类工作一事,其实更没必要惊慌,要知道现在已经有大量机器人应用于一些流水线生产的行业了(比如富士康),也没见对劳动力市场产生太大的影响(真要让在座诸位去工厂上班怕是没几个人愿意),毕竟现在已经是劳动力匮乏的时代了,买一个扫地机器人总比请专职保洁员要便宜吧。

招募野生写手!寻找游戏达人!快来参加爱玩百万稿费活动吧

游戏专栏投稿信箱:otaku@vip.163.com