AlphaGo二代？暴雪将开放《星际争霸2》作为AI实验室

AlphaGo二代？暴雪将开放《星际争霸2》作为AI实验室

2021-01-26 00:07 浏览:3

　　AlphaGo在战胜柯洁之后便正式宣布退役了，成为围棋界一道难以跨越的屏障。而AlphaGo退役后，并不意味着结束，其缔造者DeepMind公司早就为人工智能准备好了下一个目标：：《星际争霸2》（StarCraft）。

　　《星际争霸2》是由暴雪娱乐（Blizzard Entertainment）在2010年推出的即时战略游戏，游戏剧情主要讲述了在遥远未来，一场围绕银河系中心的种族之战。由于游戏极其考验玩家对资源的运营策略，因此也被视为AI研究的突破点之一。

▲《星际争霸2》游戏画面，图片来源：YouTube

　　DeepMind科学家奥利奥尔·温雅尔斯（Oriol Vinyals）就曾是顶级的《星际争霸》玩家之一，他曾提出这样一个观点：

　　玩《星际争霸》的AI需要有效地利用记忆力，能够进行长期战略规划，并根据新的信息不断做出调整。如果我们开发的AI系统能掌握如此复杂多变的技能，那么最终这些技术也将被用于服务现实世界。

　　因此，早在2016年11月份，DeepMind就宣布与暴雪娱乐合作，将针对《星际争霸2》展开一系列的研究实验。而到了2017年8月9日，暴雪与DeepMind公开了这个项目的初步研究成果，将开放《星际争霸2》作为AI研究环境。这个人工智能环境包将包括：

　　在游戏中为开发者和研究员加入了人工智能API，并且首次支持Linux环境

　　新增一个匿名游戏回放数据库，并且在未来的几周里，游戏回放数据将从65000份增加到50万份

　　加入DeepMind开源工具集PySC2，让研究员可以轻松地调用暴雪底层的功能API

　　新增一系列的RL迷你游戏，从而让研究员能够测试AI在特定任务下的性能

　　……

　　实际上，《星际争霸》游戏里一直都有不同难度的AI存在，只不过这些AI是通过访问游戏后台、采集全局数据来与玩家作斗争，玩家和AI一开始就不在同一条起跑线上。而DeepMind的最终目的，是训练一个能在同等条件下与人类进行竞争的AI，这才是该项目最具挑战性的地方。

　　一些人类习以为常的动作，要让AI来做就得经过不断地训练。在接受The Verge采访时，DeepMind科学家奥利奥尔举过这么一个例子：

　　在游戏中有一个名为「战争迷雾」的机制，黑雾笼罩了整个地图，玩家需要经过不断地探索才能找出敌人。因此，对于AI来说，它必须记住「我曾在这里见过某个单位，但现在这个单位不见了，所以我要回去侦查一下，看看附近有没有敌人的基地」。

　　对于人类选手来说，这是一个常识。但对于人工智能来说，这是一个值得学习的挑战。这是《星际争霸》与国际象棋最不同的地方，玩国际象棋的时候，双方的环境一目了然，但在《星际争霸》里，玩家无论何时都要了解自己周边的环境。

▲AI眼中的《星际争霸2》，图片来源：DeepMind

　　目前，人工智能对《星际争霸》的探索还处在非常早期的阶段，不仅需要训练各种「常识」，而且在面临突发情况时的应变能力也有所不足（AlphaGo就曾经下棋下到崩溃）。这也就难怪24岁的顶级《星际争霸2》电竞选手 Byun Hyun Woo 敢大放厥词了：

　　至少在我的有生之年，我不认为AI能够打败职业玩家。

　　AlphaGo用了一年的时间超越柯洁，那么人工智能打败职业玩家，问鼎《星际争霸2》世界冠军，需要多久呢？