集微网消息,《王者荣耀》作为当下最火爆的游戏之一,受到的关注自然也是非常大的,最近王者荣耀可以说是又扬眉吐气了一回,因为前不久王者荣耀再次被央视点名表扬(上一次是因为亚运会冠军),而这一次则是因为WCG王者荣耀夺冠。
而在王者荣耀中,也是与人工智能息息相关的!现有的DQN(Deep Q-Network)算法是DeepMind团队通过结合深度学习和增强学习来学习实时游戏Atari操作策略的算法。针对游戏领域中,DQN算法可以使用卷积神经网络(CNN)来直接处理游戏画面,进而预测下一步最佳的操作策略,并通过Q-Learning算法调整优化目标。通过测试可知,当将DQN算法应用在49个Atari游戏中时,有29个Atari游戏超过了人类选手的表现。
今天要带来的就是腾讯自家的一项人工智能游戏操作方法,早在16年9月8日,腾讯就申请了一项名为“应用于游戏的人工智能操作方法和装置”的发明专利(申请号:201610815030.7),申请人为科技新闻(深圳)有限公司。
根据目前公开的专利资料,让我们一起来解读一下这项人工智能游戏操作方法吧。
如上图所示为应用于游戏的人工智能操作方法的硬件环境示意图。其中包括终端和服务器两大部分,终端包括手机以及PC。
终端中安装有客户端,安装有客户端的终端向服务器发送客户端的状态信息,其中,客户端的状态信息用于指示客户端在当前时刻的当前游戏状态。服务器在获取到状态信息之后,将根据建立的模型获取用于指示当前游戏状态下的下一个动作的动作指示信息。服务器在获取到动作指示信息之后,将获取到的动作指示信息发送至客户端所在的终端。
上述客户端可以为任意游戏的客户端,例如,“ 王者荣耀”游戏的客户端。当用户在终端中运行该游戏时,会向游戏服务器发送当前游戏状态。例如:发送的当前游戏状态为“ 电脑角色受到玩家攻击”。游戏服务器在获取到“ 电脑角色受到玩家攻击”这条状态信息之后,根据建立的模型获取用于指示“ 电脑角色受到玩家攻击”之后的下一个动作的动作指示信息。
接下来我们再来了解一下具体的操作流程。
如上图为应用于游戏的人工智能操作方法流程图。
首先,接收客户端发送的状态信息,其中,状态信息用于指示客户端的当前游戏状态。例如,“ 王者荣耀”的客户端。服务器获取到的状态信息用于指示客户端当前游戏状态。
其次,通过建立的模型获取动作指示信息,其中,动作指示信息用于指示当前游戏状态下的下一个动作,模型通过客户端中的多个动作组合训练得到,每个动作组合包括多个先后执行的动作在对CNN进行大量训练之后,就可以采用该模型获取用于指示当前游戏状态下的下一个动作的动作指示信息。服务器在获取到动作指示信息之后,就可以执行下一步。
最后,将动作指示信息发送给客户端。在获取到客户端的当前游戏状态之后,通过建立的模型获取用于指示当前游戏状态下的下一个动作的动作指示信息,并将动作指示信息发送给客户端,以便客户端中的电脑角色可以执行上述动作指示信息所指示的下一个动作。这样,通过预先训练得到的模型,可以使得在获取电脑角色所执行的下一个动作的过程中采用的策略更接近人类玩家的策略,提高了对游戏操作策略的规划能力,进而解决了现有技术中人工智能操作算法对游戏操作策略的规划能力较差的技术问题。
以上就是利用人工智能来操作游戏的方法。在大家熟知的游戏王者荣耀中会有人机对战模式,为什么电脑人有时候会做出和人一样的战略决策,就是因为这样的智能技术!或许,随着电脑人不断的学习,有一天甚至会超越人类玩游戏的水平呢!