DeepMind AI「AlphaStar」对战《星际争霸 II》职业高手,取得十胜一败成绩

  • 时间:
  • 浏览:299

  

  AlphaStar 的训练和其他类似的 AI 系统一样,都是先由观看无数的人类对战视频,来产生一个模型,再由这模型产生一大堆类似但不完全相同的「分身」,再让这些分身下去对打,直到决胜出最厉害的五个 AI「选手」为止。在一个月的虚拟对战中,AlphaStar 的诸多分身份进行了等同于现实时间 200 年的对战时长,最后选出的五个代表每个都有不同的游戏风格,并且是 DeepMind 认为最有获胜机会的。就是这五个代表被推上去与 TLO 和 MaNa 各对战了一次(避免风格重复被看破,同时 MaNa 面对的 AlphaStar 更有经验一点),并取得了十战全胜的成绩。

  

  至于最后一场呢?原来这是个「实验版」的 AlphaStar,拿掉了上面提到的那个「隐藏优势」,让模型必需和人类一样时不时地检查一下地图的各个角落,自然也就有错漏重要信息的可能。虽然也有着一个礼拜的训练时间,但 DeepMind 团队未能让它先与人类选手「切搓」一下,因此与 MaNa 在直播上的对战是它与人类面对面的初战,可惜输给了对方。

  当然,对我们一般人来说,就是真正具备高度挑战性的游戏 AI 已经不再是个梦想,即使是即时战略这样没有明确的胜败因素、没有完整的信息、而且需要长远的概念的游戏,AI 都有打败人类的潜力了。有兴趣的话 DeepMind 自己的博客上有 AlphaStar 与两位人类的对战视频,可以去看看 AlphaStar 采取的各种奇怪的战略啰。