04计算机苏博览:游戏和AI的现状及未来

2018-09-13|校友走访

校友:苏博览

者:王天

  

随着2016AlphaGo的横空出世,人工智能(AI)以前所未有的速度进入公众视野,棋牌是其最先攻克的游戏领域。在完胜人类棋手后,AlphaGo的缔造者DeepMind公司宣布与暴雪公司合作,为人工智能准备了下一个待征服的游戏目标:《星际争霸2》(StarCraft)。更多的游戏公司,也纷纷开始了AI的布局。

  

游戏和AI,究竟会擦出怎样的火花?

  

我们请到了腾讯互动娱乐的游戏AI高级研究员,复旦大学计算机系校友苏博览学长。

  

* * *

(一)游戏AI的使命

  

理想的游戏AI是足够真实的,让你觉得它像一个人,而不是一个AI

  

记者:游戏与AI的结合是游戏发展的最新潮流。您觉得AI在游戏中应该发挥怎样的作用?

  

苏:游戏AI最重要的任务就是在游戏中利用人工智能的方式,来让玩家体验感更好。

第一,要让玩家在游戏里有一定的沉浸感,就是要让他觉得这个世界是真实的,他才能继续去玩;第二就是要让玩家觉得有成就感。玩家总是希望受到更多的正向刺激,而不是负向刺激,就是你经常还是能赢,虽然或者能输,但是不能输太多,你要一直输可能就不玩了。所以我们就希望用人工智能来做这件事情。理想的游戏AI是足够真实的,让你觉得它像一个人,而不是一个AI

另外一个方面,我也希望AI在游制作的程中可以帮助生一些内容。比如,游很多构、人物形象等等,我们现在需要专门的策划和美工慢慢做出来。我希望将来可以用人工智能来去自完成些任。当然游本身的内容设计也是可以交AI的,这样附带的是可以大批量地生举个例子,我们最近在做的一个游戏叫斗地主残局,你可以尝试一下。就是腾讯游戏里面的欢乐斗地主,有一个残局闯关。给你两副牌,一一的,明牌,玩家需要思考怎么出才能够赢下来。肯定是能的,但是并不是那么好,可能得仔想一下。以前这个得让员工来挑残局,看看哪一局是谁赢这样效率很低。我用人工智能技每天可以生大量的残局,并且在个上面去做一些筛选与分类,自的分出不同度,再分不同水平的玩家。

  

记者:您说的这个例子很有意思,回去试一下(笑)。目前市面上游戏有很多种类,棋牌只是其中一种,对于不同的游戏种类,是否AI的应用也有不同?

  

苏:其实应该把棋牌分开来,棋类是比较简单。因为他们规则都已经定下来了,信息是透明的。牌难一点,我们把棋类称作是完美信息,牌类的话,是非完美信息。完美信息就是说,我们参与双方都知道所有的信息,非完美信息互相之间有一部分的信息是对方不知道的。

  

记者:那射击类游戏,比如说像CS之类,也是非完美信息了。

  

苏:对。但射击类的话,又有它的特殊性,就是它的非完美信息,对决策的影响会小一点。打个比方,我们玩射击可能大概知道哪边没有人,我就可以去了。更重要的是,我虽然判断形势可能没你那么厉害,但我如果每一枪都能爆头,走位精准无比,你一出现我就能把你打到,那其实也是非常厉害的了。其实你可以这样理解,游戏越考验操作,对电脑来说反而越是容易的;越考验信息的判断与决策,对电脑来说就越难。因此,赛车啊射击啊这种操作至关重要的游戏,AI反而相对容易胜任。

  

记者:刚才我们说的其实都是一种对抗式的游戏AI,有没有其他的游戏AI类型?

  

苏:对,一种是对抗,一种是陪伴。网游里有一些线上的NPC,就是很好的例子。这些AI其实都比较厉害了,需要在自然语言处理方面有一定的突破。再比如说,王者荣耀之前出过一个语音的助手,叫妲己,用妲己的语音和大家进行交互,这是要有一定的语音识别和理解能力的,这种陪伴式的AI也是一个未来的方向。

  

(二)智能的边界

  

记者:我之前也玩过一些带有AI的游戏,比如帝国时代,但当时我总觉得它们还是不够智能的。您觉得AI在游戏中究竟能做到怎样的智能?

  

苏:其实你们如果了解的话,游戏AI最早就是一些规则。在编程上来说,就相当于一些if语句,这是最早的。然后后面大概比较出名的是微软出的那个光晕(Halo),一个第一人称射击游戏。他们搞出了一些新东西,叫行为树。行为树的话,会比之前的if规则更模块化一点。就类似说我做决策,这个决策上面就有一系列的模块,比如说碰到敌人那我就要做躲避,然后反击,然后逃跑。然后在这种逃跑下面,又可以细分下来各种各样的模块。这样子下来,整个决策过程比较模块化,然后在模块化的这些里面还可以加入一定的随机性,比如说你可以用概率来选择,你有一定的概率来逃跑,一定概率反击等等。现在大量的游戏AI,基本都是基于行为树写的。直到近几年人工智能有了新发展,有深度学习和强化学习这两个方法加进来之后,很多游戏公司,才开始做基于深度学习和强化学习的游戏AI研究,包括我们现在做的也是基于这种方法来做的。应该说,现在还没有大的突破,但是我估计近期会有突破。

  

记者:您觉得游戏AI发展受到的限制在什么地方?

  

苏:这个其实是人工智能技术本身的难点。我们正常一个玩游戏,是有很多先验知识的。比如我拍了这个桌子,我知道它是安全的。比如说我看见那个五角星,或者宝石这些东西,我能知道这个就是一个好的东西,我要去拿到它;这里是个悬空的,我掉下去就会死掉了;我看到一个长的很凶恶的东西,我就觉得这是个怪物,我要去打它。这些东西,都是电脑是不知道的,所以电脑要做这些东西,要进行很多的尝试。游戏的规则很多很多,也很复杂,这是第一个难点,你很难把这种先验的东西放进去。

第二个就是比如像星际争霸这种即时对抗的游戏,它允许的反应时间是很短的。那就不像围棋,下一步几秒钟,或者几分钟都没问题,即时对抗的游戏等不及。这是一个所谓对支撑的要求,同时这种还是一个之前提到的非完全信息机制,这就有些棘手。

  

记者:其实现在每年学术界都有大量的论文发表,相关算法也是日新月异。这对突破瓶颈能否起到很大的推动作用?

  

苏:技术肯定是在不断发展,但学术界和工业界不完全相同。我们判断AI的好坏,很多时候就是看你这个技术能不能比人好。在实验室上大家觉得可用和真正技术上可用可能会有一个区别。比如说一个算法识别的准确率有70%-80%,这或许可以发论文了,但从工业的角度说,这个技术必须确定地可行,否则它的应用可能就会特别狭窄。

  

(三)游戏AI的发展之道

  

记者:除了腾讯,越来越多的游戏公司也纷纷开始了AI的布局。那对于未来10年到20年之内的游戏AI行业,您设想的变化会是怎样的?

  

苏:10年到20年的话,因为现在AI芯片的技术在发展,如果AI芯片可以做到每个人的手机上,相当于这个计算性能给大家服务提高了,那我们可以把很多复杂的东西放到手机里面。在上面我们应该可以做到一些更好的AI,在游戏中可以陪玩家玩,可以跟玩家交互,然后我们作为管理者可以更好的分析玩家的行为。我们现在做的一个事情,就是分析玩家比较初级的行为,比如买道具,长到了多少级,跟游戏中谁一起组队了这种信息。

但如果我们有一个更强的技术,我们可以分析到一个更犀利的问题。比如玩家在打副本的过程中,什么人在什么地方在做什么,我们可以基于这个来修改这个游戏,或者说更好的适应这个从而给每个玩家不同的难度,当然是能够符合你水平的,让玩的很过瘾,但也不要太难,要不然你就直接放弃了。类似的我们可以做的更精细,让游戏玩家的行为变得更可预测,然后反过来也让游戏玩家的体验能够变得更好。

  

记者:这是从技术层面来说的。那如果从一个公司经营的角度来说,过去一般游戏开发是游戏开发,然后人工智能研发又是另外一块,这两个本来是泾渭分明的。而且游戏开发本身,就能获得很大的这种盈利,而人工智能反而是要花费大量的经费是进行研发的。所以公司会出于怎样的动力,将人工智能的研发引入到游戏当中呢?

  

苏:开源、节流,这是两个方面。第一,节约成本,原来每个工程师设计一个游戏地图,要20天,可能要加入人工智能帮助,只要10天,或者甚至一天就完成了。更加高级一点,按以前的速度,设计一个AI,我要一个一个模块的写,写完了这个游戏,我下一个新游戏还是得从头开始写。但我现在可能只有一开始的前面几个游戏需要做一下,调试出一个很好的模型出来,那后面我们就可以基于这种模型来复用了。这是一个很大的节约成本。

  

记者:您的意思就是说,会有一种专门用来设计游戏的AI吗?

  

苏:也不是说设计游戏,就是相当于我们如果说,能够基于深度学习和强化学习这种方式来做AI的话,那实际上我们以后的AI相当于只是一个模型,它其实是一个神经网络而已,这一套网络其实是可以复用的。像之前的行为树那种,它就是一些模块,模块里面到最根本的还是一些if语句,这些if语句都是针对特定场景的,那自然是没办法复用的。你比如说你到了一个新的场景,你最多可能一两个模块你在用,比如王者里面设计的很多东西,你拿到吃鸡里面可能就没有办法用了。

  

记者:在不同的这种场景当中切换,这个模型本身是不是也要重新训练?

  

苏:是重新训练,但重新训练的话,其实花的是机器的时间。不是花的人的时间。对于程序员来说,我必须得了解这些人在干什么;但是对于模型来说,这个游戏那个游戏,其实差不多,无非是输入输出的差别。也就是说,只要把一个模型设计好了,就可以用它训练不同的东西出来,可能做一些微调就好。

刚才是从成本的角度上讨论。而从增加收入的角度就是说,如果我们有一些人工智能的技术,其实我们可以更好的分析玩家行为。我们现在其实不知道有些玩家为什么会想放弃某个游戏。比如有些人玩王者荣耀玩着玩着突然间把它删掉了,这是为什么呢?我们现在其实是不知道的,我们只能通过某些方式,比如给你发一些信息啊说送一点什么东西,看你能不能回来。那如果我们引入人工智能的技术,我可能大概知道,你是因为觉得最近常玩的这个英雄被削弱了,你就玩着很不爽。那我们可能会针对性处理,如果大部分玩家真的都是因为这个英雄被削弱,我们就可以调整,让整个玩家的离开概率更低。然后另外一点是促使玩家更好地付费。只要你能够更了解玩家行为,你肯定可以让玩家更好的沉浸在游戏中去,游戏的生命周期就会变长,从而能够带来更多的收入。

  

(四)对游戏AI的期待

  

记者:您梦想的终极游戏AI是怎样的?

苏:其实终极的肯定是一个通用的AI。不玩这个游戏,都能使用。比如我玩王者玩的很好,去到吃鸡游戏,稍微了解一下其实我也能玩的很好,那么能不能有个AI也是这样呢?它某个游戏玩的很好,但能够切换到另外的游戏,也不需要从头开始训练,稍微给一定的小样本就可以。所谓的迁移学习的就是一种思路,但是迁移学习现在也是一个比较新的方向,还有很多不确定的东西。

本质上来说,我所设想的其实就是一个通用人工智能的概念。所有做AI的人,都希望能够做出一个通用的AI。这种真的做出来,其实已经不限于游戏。这个是一件还没有解决的事,大家正在想方设法解决的事。


最新文章