越活越沒自信 人工智能開始用小霸王練腦

冒着暴露年龄的风险我也要说，我知道这东西对你意义非凡：

越活越没自信人工智能开始用小霸王练脑

红白机电视游戏是一代人的回忆，也许是不甘心让它们就此永远沉寂，研究人工智能（AI）的专家们找到了机会让它们焕发第二春——拿给AI玩。

Google在英国剑桥有个附属机构DeepMind，他们给AI玩雅达利公司（Atari，美国最大的电视游戏机公司）的游戏，想让它们在玩游戏的过程中学会如何与真实世界互动。这些AI软件非常喜欢电视游戏，而且不断练习会比人类玩的还好。

越活越没自信人工智能开始用小霸王练脑
现在，AI也在玩小蜜蜂、打砖块和弹珠台

游戏世界与真实世界似乎风马牛不相及，但实际上，学习的过程和解决问题的逻辑都是一样的：

观察→状态判断→行动→反馈→观察……

让AI玩游戏的，除了Google还有一家名为Osaro的公司。Osaro公司开发的AI基于神经网络（neural networks）和增强学习（reinforcement learning）设计。AI的神经网络类似于人类大脑的神经网络，理论上讲，如果给AI提供了足够多的照片，它就能通过这些已知信息辨识出某一张照片中的所有东西。这种情况应用在游戏中，能让AI搞清楚目前的游戏是什么状态。

除此之外，Osaro公司特别研发的循环神经网络（recurrent neural networks）可以让AI拥有类似于人类的短期记忆：将短暂的过去与现在进行比较，能够更好地判断出环境状态的变化和未来发展趋势。

越活越没自信人工智能开始用小霸王练脑

观察结束后，增强学习用于调整行动：如果行动结果是正向的，下次就还会这样做，反之则摒弃这种做法。游戏世界很单纯，分数奖励就像刺激人类大脑的多巴胺。如果一项行动能让分数增加，AI下次就会更倾向于这样做或者选择类似的做法。

将这种学习方法应用到现实场景，才是Google和Osaro的最终目的：例如如果机器人成功把杯子放到指定位置就能得到奖励，把杯子打碎了就会受到惩罚。如此一来，它就会懂得人类想要的是什么结果，而不再是机械地执行命令。

其实AI就像小孩子，不断在游戏中试错，最终就会找到所有通关技巧。虽然现实世界的复杂程度是游戏所无法比拟的，但让AI玩游戏更像“授之以渔”——学会“如何学习”比“学到了什么”更加重要。

现在回想起来，当年那个单纯幼稚的你，是不是也曾在玩游戏时悟出什么朦胧的道理？

越活越没自信人工智能开始用小霸王练脑

越活越没自信 人工智能开始用小霸王练脑

相关推荐

越活越没自信人工智能开始用小霸王练脑