四川在线记者 唐泽文
4月8日,首届腾讯STAC科创联合大会上,王者荣耀执行制作人、腾讯天美L1工作室总经理黄蓝枭在接受记者专访时表示,王者荣耀的AI技术将有望用到包含社会治理在内的更广泛领域中去。
“举个简单例子,游戏中我们会用AI技术抓取用户消极游戏等不良行为,而这些技术完全可以复制到现实生活中如抓取不遵守交通规则等类似不良行为的应用中去。”他说。
进一步分析,他表示王者荣耀是多智能体延伸的环境。游戏里角色的AI技术,是自主决策的自主启动,共同协作形成具有挑战的目标。“现实生活中有很多类似的场景,比如足球运动、球场上多人分工协同,根据自己和对手的情况独立决策,相互配合取得对自己最有力的结合。这就是典型的多智能体技术。”
这也意味着,王者荣耀中的英雄控制AI技术,可以应用到如智慧物流、智慧交通、车路协同、车车协同、无人驾驶的应用中去。“比如智能制造、智能电网,他们都能智能协作,形成共同具有挑战的目标。”
他认为,这些应用的具体落地,目前还面临着如下具体困难:
第一、环境不确定性。单个智能体做决定的时候,其他智能体也在发生变化。环境的变化带来很多不确定性。
第二、智能体获取信息的局限性。单个智能体获取信息是局部的如何基于局部信息,做出对全局最后的判断,这对模型建设提出极大的挑战。
第三、个体目标和全局目标一致性问题。个智能化提出与多智能体的全局汇报是否保持一致,这是一个很大的挑战。
第四、高算力的要求。在大规模多智能多体系的过程中,会涉及多维的空间和运动空间。对于模型表达和算力要求都很高。这些现实导致多智能体门槛很高,如果缺乏合适的研究环境,研究平台很难以开展。
“王者荣耀中,视野非全局性,敌我双方的信息非理想透明,游戏测试环境中,能够提供丰富的数据、模拟的场景为模仿研究提供了很好的保障。天然的层次结构,非常适合层次强化学习研究。”他说。
据介绍,王者荣耀的比赛,每一秒钟产生100K的数据,每一局平均15分钟,每一天有几千万局的比赛,每天产生的数据是非常惊人的海量数据,这给人工智能提供重要的支撑和保障。
现在王者荣耀AI到底有多厉害?之前的实验显示,王者AI训练30小时达到王者段位,如果训练70小时达到职业玩家的水平。在此前举行的7276万局挑战中,最高难度人类玩家的胜率仅为3.8%。
“未来我们将把这个AI平台提供给其他有需要的研究机构,来进行更贴近工业化场景的研究。我们期望这些研究成果可以落到其他产业环境之中,为产业升级提供更好的支撑。”