对战6亿用户竞技手游:聚焦复杂游戏中的多智能体博弈


对战6亿用户竞技手游:聚焦复杂游戏中的多智能体博弈
文章图片

文章图片

2021年11月 , 全球首届“ AI《球球大作战》:Go-Bigger多智能体决策智能挑战赛”已正式开赛 。作为面向全球技术开发者和在校学生的科技类竞赛活动 , 本次比赛旨在推动决策智能相关领域的技术人才培养 , 打造全球领先、原创、开放的决策AI开源技术生态 。
在比赛之际 , 雷锋网&AI科技评论对话了本次竞赛的核心设计团队成员刘宇和周航 , 他们二人 , 一个为商汤科技研究总监 , 也是OpenDILab项目负责人;一个为前星际职业选手iA , 目前任商汤决策智能游戏AI组高级研究员;殊途而同归 , 他们如何通过 「游戏 × 决策」方式走到一起 , 他们会更看中什么样的“策略高手”?
在现实之外 , 还有另一个世界 , 游戏世界 。它将人情世故、弱肉强食、情义背叛、谋略运筹挪于方寸之间 , 功成名就 , 皆在俯仰间 。以游戏世界之有涯 , 演绎人际种种浮沉 。古人制蛊王 , 今人造脑王 , 科技的进步 , 将对抗的秘密搬上台面 。
而今这场竞技 , 被命名为Go-Bigger多智能体决策智能挑战赛 。比赛由OpenDILab主办 , 上海人工智能实验室作为学术指导 , 商汤决策智能团队和巨人网络等多元化组织联合打造。灵感来自于巨人网络自主研发的一款超火爆休闲竞技手游《球球大作战》 , 多方共同开启全球首届AI版《球球大作战》 。

对战6亿用户竞技手游:聚焦复杂游戏中的多智能体博弈
文章图片

文章图片

Go-Bigger游戏环境:https://github.com/opendilab/GoBigger
AI球球大作战采用了类似《球球大作战》的物理引擎设计 , 具有相对较大的地图 , 球球具有分裂、吐孢子、中吐等高阶动作空间 , 但是提供了适合强化学习或行为树AI编写的抽象接口 。
刘宇说到 , “Go-Bigger并不像星际争霸或Dota2这种重型游戏环境 , 我们对它的定位是人人可以参加的中型游戏AI竞技环境 , 推动学术界关注更大一些的决策问题 。相比学术界用的最多的Atari、Mojoco、SMAC要大不少 , 但又可以在小型的实验室中完成——一台机器、一块GPU就能训练起来 。它面向大众、学生、研究员 , 更适合用 「学术比赛」来描述它 。”
从参与筹办比赛的各方来看 , 学术价值 , 在Go-Bigger身上非常明显 。它由上海人工智能实验室作为学术指导 , 商汤科技、巨人网络、上汽集团人工智能实验室联合主办 , 全球高校人工智能学术联盟、浙江大学上海高等研究院、上海交通大学清源研究院联合协办 , OSCHINA、深度强化学习实验室作为支持 。
从产业出发 , 关注底层技术 , 并进一步拢合各大高校和实验室 , 其实就是商汤的原创基因 。一、Go-Bigger比拼决策战术
周航和刘宇都说到 , “球球大作战的门槛很低 , 但是上限很高 。”
与风靡全球的agar.io、《球球大作战》等游戏类似 , 在Go-Bigger中 , 每局比赛十分钟 , 大球吃掉小球而获得更大重量和体积 , 但同时要避免被更大的球吃掉 。当球达到足够大时 , 玩家(AI)可使其分裂或融合 , 和同伴完美配合来输出博弈策略 。每个队伍都需和其他队伍对抗 , 总重量更大的团队获胜 。
Go-Bigger游戏环境演示图
游戏中有四类小球 , 分别为分身球、孢子球、食物球、荆棘球 , 挑战不同决策路径 。
分身球是玩家在游戏中控制移动或者技能释放的球 , 可以通过覆盖其他球的中心点来吃掉比自己小的球 。
孢子球由玩家的分身球发射产生 , 会留在地图上且可被其他玩家吃掉 。