骑猪兜风

越活越没自信 人工智能开始用小霸王练脑

骑猪兜风 2015-12-08 19:11:45    200801 次浏览

冒着暴露年龄的风险我也要说,我知道这东西对你意义非凡:

越活越没自信 人工智能开始用小霸王练脑

红白机电视游戏是一代人的回忆,也许是不甘心让它们就此永远沉寂,研究人工智能(AI)的专家们找到了机会让它们焕发第二春——拿给AI玩

Google在英国剑桥有个附属机构DeepMind,他们给AI玩雅达利公司(Atari,美国最大的电视游戏机公司)的游戏,想让它们在玩游戏的过程中学会如何与真实世界互动。这些AI软件非常喜欢电视游戏,而且不断练习会比人类玩的还好

越活越没自信 人工智能开始用小霸王练脑
现在,AI也在玩小蜜蜂、打砖块和弹珠台

游戏世界与真实世界似乎风马牛不相及,但实际上,学习的过程和解决问题的逻辑都是一样的:

观察→状态判断→行动→反馈→观察……

让AI玩游戏的,除了Google还有一家名为Osaro的公司。Osaro公司开发的AI基于神经网络(neural networks)和增强学习(reinforcement learning)设计。AI的神经网络类似于人类大脑的神经网络,理论上讲,如果给AI提供了足够多的照片,它就能通过这些已知信息辨识出某一张照片中的所有东西。这种情况应用在游戏中,能让AI搞清楚目前的游戏是什么状态。

除此之外,Osaro公司特别研发的循环神经网络(recurrent neural networks)可以让AI拥有类似于人类的短期记忆:将短暂的过去与现在进行比较,能够更好地判断出环境状态的变化和未来发展趋势。

越活越没自信 人工智能开始用小霸王练脑

观察结束后,增强学习用于调整行动:如果行动结果是正向的,下次就还会这样做,反之则摒弃这种做法。游戏世界很单纯,分数奖励就像刺激人类大脑的多巴胺。如果一项行动能让分数增加,AI下次就会更倾向于这样做或者选择类似的做法

将这种学习方法应用到现实场景,才是Google和Osaro的最终目的:例如如果机器人成功把杯子放到指定位置就能得到奖励,把杯子打碎了就会受到惩罚。如此一来,它就会懂得人类想要的是什么结果,而不再是机械地执行命令。

其实AI就像小孩子,不断在游戏中试错,最终就会找到所有通关技巧。虽然现实世界的复杂程度是游戏所无法比拟的,但让AI玩游戏更像“授之以渔”——学会“如何学习”比“学到了什么”更加重要。

现在回想起来,当年那个单纯幼稚的你,是不是也曾在玩游戏时悟出什么朦胧的道理?

越活越没自信 人工智能开始用小霸王练脑

内容加载中