AlphaGo Zero创造者:星际争霸2比围棋更具挑战性


查尔星港独家整理报道,转载请注明出处!

北京时间19日,AlphaGo 再次登上《自然》杂志。这次谷歌 DeepMind 团队带来的是最新版 AlphaGo ,它的代号为“AlphaGo Zero”。我们都知道 AlphaGo 曾打败围棋世界冠军,它是God,是神,是史上最强的围棋“选手”,但这次公布的 AlphaGo Zero 却更为凶悍:凭借新型的强化学习技术, AlphaGo Zero 以100:0的比分击败了之前的世界冠军 AlphaGo。

AlphaGo Zero 抛弃了此前 AlphaGo 基于人类围棋比赛的训练方式,完全“自学成才”,通过随机下棋的方式来自己学习围棋。“不使用人工数据或人工专长,我们就可以真正突破人类知识的限制,”DeepMind 公司首席研究员、伦敦大学学院教授大卫·西尔佛(David Silver)说,“它能运用基本原理自行创造知识。

Zero 100:0 AlphaGo,AlphaGo 18次击败李世石,如果以1Go为战力数值的话,求解柯洁有几Go?

那么问题来了,《星际争霸2》作为 DeepMind 的下一个挑战对手,RTS版本的“AlphaGo”能否通过这样自我学习的方式打败星际争霸2呢?从谷歌目前的测试AI连简单电脑都难以击败,进而无奈开放《星际争霸2》研究环境与调度暴雪天梯战报来看,这项新型强化学习技术或许还难以在星际争霸2项目上实现。

AlphaGo Zero Starting from scratch (来源:网易)

今日 AlphaGo Zero 团队的其中一研发人员也谈到了关于《星际争霸2》的问题,这位名为 Julian Schrittwieser 的 AlphaGo 创造者代表在 Reddit 上进行了网友答问活动。

网友:你们觉得围棋与《星际争霸II》谁的研究难度更大?最大的潜在技术障碍是什么?我们期待的正式更新什么时候能出来?

Julian Schrittwieser:我们开放《星际争霸II》的研究环境才过了几个星期,所以现在还处于早期阶段。星际争霸的行动空间毫无疑问要比围棋更具挑战性,而且需要观测的空间也要大得多。从技术角度而言,我认为最大的难点区别就是围棋是一个处于在完全的信息展示环境下的游戏,而星际争霸由于有着战争迷雾,所以信息情报并不完美。

依照研究人员所说,《星际争霸II》的AI尚处在早期阶段,它的研发难度比围棋更大。而在 AlphaGo Zero 诞生后,我们希望谷歌能以此为契机,在《星际争霸II》AI研究上再做突破。

本文来源:查尔星港 责任编辑:黄东晨_N7338