会作弊的AI拥有如生命体般的创造力(下)

原创 H与生活  2020-06-17  阅读 826views 次
會作弊的AI擁有如生命體般的創造力(下)

你有想过AI居然会在游戏中作弊吗?而让他们能有这个能力的原因竟是原先人们认为只会发生在生物中的「演化」。古猿经历的千万年演化出人类,地球上现存的近千万物种也是经过演化的漫漫长路而来,使得物种间充满各式惊奇可能性,总会找到出路的生命往往展现千奇百怪的创造力。然而,以演化算法开发人工智慧竟可以拥有生物演化的能力,不论是在游戏中耍奥步、找出系统漏洞、执行新决策,甚至是艺术创作「它」都可以做到。或许人类会因此对AI的力量感到畏惧,但若能了解它们的运作方式,我们将可以与之合作,带领整个系统一起排除万难。

AI的决策方式

「现今演算法还只能根据人类开发者所说做出反应,并不懂人类真正表达的意义」,所以机器人会选择以最轻鬆的方式学习玩Qbert游戏,而非脚踏实地正确破关。Alphabet的DeepMind部门的研究科学家Victoria Krakovna专门搜集了解AI漏洞案例,到目前为止,已经有三十多个演化算法在其原始程序中发现漏洞或攻击原环境的事件,前述提到的Qbert游戏也是其中之一。一般来说,研究员常使用「游戏」来模拟机器学习人类行为的情境,以强化学习方法给予机器奖励促使它基于当下环境状态完成任务,再透过演化算法观察机器每一代的改变,在研究上当两者合併使用时往往能更有效率地达成实验目的。因此,给定人工智慧明确的目标指令,它可以学习掌握複杂的任务,例如击败世界围棋冠军的Alphago。但是更多时候即使逻辑参数正确,实际上单接收指令的机器人会开发出其认为最佳的解题捷径,却不一定能解决人类所希望处理的问题。教机器学习捕鱼,它有可能选择排光湖中所有的水;告诉负责管理电网的神经网络需要节省能源,它可能会切断所有电力供应。所以人类在训练人工智慧的时候,要提供完整的目标设定让它理解,才有办法藉由机器演化的创意最佳化决策方法。

在Krakovna的其中一个案例中,有两个AI机器人互相对决井字游戏,其中一方採用「奥步」击溃另一个机器对手。这一个游戏设定与我们平常玩的不大相同。一行中只有五格,但有无限多行,可以是个无限宽广的大矩阵。其中一个演化过的聪明机器人总是挑选非常遥远的格子,导致其机器对手无法记载如此大量的数据,利用对手先天记忆体限制的缺陷获得胜利。

从前述的两个游戏中来看,人工智慧看似作弊的行为都帮助研究者找到原始游戏系统的缺陷,它们就像人类社会的律师总是在寻找法律漏洞。反向利用人工智慧的创意与能力,不仅能找寻设定漏洞,还可能会产生有趣又实用的结果。

演化的人工智慧系统

用来表现AI的其中一种常用形式是Braitenberg自驾车(Braitenberg vehicle),而在Clune及Krakovna的蒐集清单中都有提到演化机器人产生有别于Braitenberg形式的开车模式。此辆搭载两个推进器的二轮车在车头左、右边各配一个光感应器,让机器人接受环境光线刺激,自动移动到远方的光源发射处,在前进的过程中会因为左右光感应器接收到的光亮不同而改变行进方向、速度。在研究一开始教导机器人以Braitenberg形式驾驶,就是一格一格阶梯式走法,然而在演化后发展出相较于原始且效果更好的方法「走一段直线再绕圈转弯」。此驾驶方式比起原始接近直角的转弯走法来说,新方法车速更快,也让车子左右轮变得容易平衡。

会作弊的AI拥有如生命体般的创造力(下)

图三、一开始Braitenberg形式的驾驶路径(左)。演化后速度较快的驾驶路径(右)。(Lehman et al, 2018)

另一个数码演化案例更惊为天人,最终世代结果与真实生物的移动方式非常相像。起初以一组拮抗肌肉、柔软组织、骨干组成一个方块,让方块学习快速走路,以演化算法让其发展到700多代子代后在单位时间内可移动距离最长,而且此速度后机器方块及未来再更进化。研究者发现在此时的最佳速度下,方块移动方式由前脚肌肉带动整个躯体快速移动,不仅奔跑样态跟「马」极为相似之外,肌肉骨骼组织结构也很类似。

这两个例子充分展现演化的多元性,从生物演化到数码演化都充满各种可能性,且不论是生物体亦或是人工智慧机器,它们都是尽可能在现有环境下进化成最佳状态。前面的车子演化方向逐渐偏离原始,但提供了一个更好的解决方案;后面的弹性方块则恰巧地趋同演化(convergent)成马儿奔跑型态,数码演化的能力超乎人类想像。

会作弊的AI拥有如生命体般的创造力(下)

会作弊的AI拥有如生命体般的创造力(下)

图四、机器方块的演化过程,从左上到右下的马奔驰样态。(Lehman et al, 2018)

机器演化的惊人创造力

2015年怀俄明大学与康乃尔大学的研究团队创造出创新引擎(Innovation Engine)AI系统让机器学习知识并且从事艺术创作,将其作品展示于校内博物馆,证明AI具备创新、创意、再创造的能力。

建立在生物演化基础上的数码演化,保有选择、变异、遗传的原则,在一代一代的变化中适应给定环境,创造出最佳解法。儘管在人类设定的环境中人工智慧仍有不恰当表示的时候,不过可以反向利用此能力优化原始环境系统;还能藉由严谨的机器逻辑思维找出最佳决策,帮助人类在实务上做判断;同时能够从数码演化在反推回生物演化,模拟假想演化环境,辅助生物研究。

文中的两位学者在面对到AI疑似出错、作弊的情况下,都尝试搜集案例再了解背后的成因、AI的决策思维模式,而不非一昧地避之唯恐不及。综合所有前人的研究来看,人类应正视人工智慧的创造力,善用人工智慧方法,两者互相合作共同提出最好的解决方案。

数码演化的其他特殊案例

杀婴:在生存模拟当中,一种AI物种进化为依靠吃掉自己的孩子而活。太空战:演算法利用银河游戏Elite Dangerous的规则缺陷来发明强大的新武器。身体黑客:四只脚的机器人应藉由背部揹着球挑战顺利平衡行走。然而,它将球卡在腿关节之间,并像以前一样蹒跚而行。尊崇金髮姑娘原则(Goldilocks)的电力系统:软体演化出控制电力信号能力,但该电路设计仅在执行该研究的实验室之特定温度才可运作。视错觉:人类训练机器人抓住一颗球,但它利用摄影机的拍摄角度,来让人类认爲即使在它不接球的情况仍然看起来成功。

编译来源

Tom Simonite, “When Bots Teach Themselves to Cheat“, WIRED, 2018.

参考资料

上一篇:
下一篇:
相关文章