
就像上面演示的这样,AI控制的索尼克在游戏中找到了一些特殊的“捷径”来让自己更快的达成目标,这些捷径都是通过类似于“卡Bug”的方式实现的。
这样的方式大大出乎研究人员的意料。最开始,研究人员希望AI能通过所提供的人类玩家数据来模仿人类的操作和行为,最终完成游戏目标。
但通过机器学习的人工智能对游戏显然有自己的一套理解,除了在游戏中寻找能让自己快速通关的Bug以外,它们还会做许多在研究人员眼里匪夷所思的事情。
古哥Deepmind AI项目的研究人员维多利亚·克拉科夫纳就搜集了大量像索尼克这样的例子。
比如在一个《海岸赛艇》的小游戏里,AI操纵的船只沉迷于利用Bug不断地撞击奖励目标以达到更高的分数,顺利到达终点这件事已经不在它的计划之内了。
另一个研究人员试图让AI玩一款经典的像素游戏《Q伯特》,同样,AI在游戏里找到了一个无限刷分的严重Bug并在时间结束之前达到了最高分。不仅如此,当它发现敌人会跟着Q伯特一起掉下悬崖后,AI甚至采取了自杀的方式来获得更高的分数。
就连《俄罗斯方块》这样的游戏,AI也能找到自己的另类玩法。由于每增加一个掉落的方块都会使AI的评分略微升高,所以它采取了完全错误的游戏方式——尽可能快的落下每一个方块并在快要Game Over时暂停游戏以确保自己不会输。
好像听上去还蛮智能的……