游客

OpenAI开源《侠盗猎车手》,开发者有哪些可以关注的地方?

游客 2017-01-18 12:28:48    201208 次浏览

OpenAI 的开源人工智能测试平台迎来一位新成员——《侠盗猎车手 5》(GTA V),它由 Craig Quite 的 DeepDrive 项目搭建和维护。你只需要购买正版游戏,然后 Universe 代理就可以在一个高保真的虚拟世界开始驾驶汽车了。雷锋网(公众号:雷锋网)此前也做过相关的覆盖和报道。

那么开发者需要注意哪些地方呢?一起和雷锋网来看看吧!

开始游戏

首先,打开 GTA V 服务器。然后你需要将 Universe 的 Python 库装好(如果已经事先安装了,就不需要升级了)。现在,你可以通过运行下面的程序挂载代理。除了键盘和鼠标,代理还可以使用虚拟摇杆。

import gym

import universe # register Universe environments into Gym

from universe.spaces import joystick_event

env = gym.make ('gtav.SaneDriving-v0')

env.configure (remotes='vnc://$host:$port') # point to the GTA V Universe server

observation_n = env.reset ()

while True:

steer = joystick_event.JoystickAxisXEvent (-1) # turn right

throttle = joystick_event.JoystickAxisZEvent (-1)# go in reverse

# Alternatively, use WASD to steer: ('KeyEvent', 'w', True)

action_n = [[steer, throttle] for _ in observation_n]

observation_n, reward_n, done_n, info = env.step (action_n)

env.render ()

OpenAI开源《侠盗猎车手》,开发者有哪些可以关注的地方?

DeepDrive

DeepDrive 是一个平台,用于建立开放式自动驾驶汽车的 AI。DeepDrive 通过使用建模框架和内存检测技术来重新调整 GTA V,使其成为一个自动驾驶汽车的模拟器;除此之外,他可以提供预训练的自动驾驶汽车代理和数据库来训练。现有的 DeepDrive 环境和代理现在编译在 Universe 最上层。

DeepDrive 的起源比 Universe 早,因此,通过它可以很好的看出在 Universe 出现前和出现后,现代游戏上特别鲜明的对比。最早的 DeepDrive 必须使用 Windows 操作系统的电脑并且需要一整天的时间打开游戏和游戏代理。而现在,打开只需 20 分钟,操作系统也可支持 Linux 或者 OS X,还与旧版本的 Universe 代理兼容(不过,如果要实现最好的效果,还是需要使用虚拟摇杆,而不是传统的键盘和鼠标)。

本次开源发布的内容包括:

1.   GTA V 环境的源代码和 AMI;

2.   一个预训练的驱动代理,具有 Caffe 和 TensorFlow 实现案例。

集成以上两者能够支持选择摄像头机号和视场偏移,还包括通过强化学习训练实现奖赏功能,能够让代理学会避免碰撞,计算目的地距离和停留在路上。

环境改变

在 Universe 出现之前,DeepDrive 使用 DirectX 按键来捕获屏幕并且需要使用 C 与 Caffe 对接来写代理。现在的游戏则运行在 windows 平台下的网络虚拟机上,并和 Websockets 和 VNC 进行通讯。因此,代理可在 Linux 或者 Mac 的平台上跑,并且可以实现在任何 ML 框架的写动作。

Universe 通过 VNC 传输像素,鼠标和键盘数据,通过 Websocket 传输其他数据。为了实现摇杆的方向和节流阀的控制,我们将摇杆的动作通过 Websockets 传给环境数据。(图片 via Craig Quiter)OpenAI开源《侠盗猎车手》,开发者有哪些可以关注的地方?

就如同 Universe 发布说明中提到的,客户端在公有云上最多使用 20fps。GTA V 为研究人员提供了访问一个丰富多彩多样性的环境在测试和开发 AI 的环境。GTA V 的岛屿设置大小几乎是洛杉矶市的1/5,并且给开发者提供了广泛的场景进行系统测试。另外,系统提供 257 种不同的汽车、7 种类型的自动驾驶车和 14 种天气,在单个模拟器里使用这些数据进行排列组合,可以实现大量不同的虚拟场景。 

OpenAI开源《侠盗猎车手》,开发者有哪些可以关注的地方?

GTA V 中 49 平方英尺的岛屿 San Andreas 为研究人员提供了培训 AI 穿过熙熙攘攘的大都市地区,蜿蜒的山路,平坦的沙漠,和高速公路的能力。

在 GTA V Universe 环境下也可以收集大量的标记数据:你可以用下面的 GTA V 引擎收录 2D 或 3D 模拟的块状信息、汽车、行人、自动驾驶车、动物、路面、交通标志分割标签,或任何一个 GTA V 的其他 7000 对象。环境通过真实世界的车辆,MODS 的道路建设,甚至也可以延伸到整个城市。

预训练代理

这次开源包含基础代理,是通过模仿学习 21 小时(约 60 万图像)游戏画面进行驾驶训练的 AI (内置的游戏 AI 是很好的初始目标:它的性能优于一个典型的人,因为它可以访问内部游戏状态,虽然 AI 仍然会犯错误,如在高速公路上进行U转弯)。基础代理在各种不同的天气条件下驾驶,对交通作出反应并保持其车道。这种预训练的代理是我们最终目标的起始点!

其他科研人员的研究成果已经展现了通过对 GTA V 中的可视系统进行训练从而对现实世界中的图像进行分类的可行性。GTA V 与 Universe 融合则使得通过增强学习技术实现虚拟自驾使变得更加简单。

GTA V 与 Universe 的集成自动继承了 Universe 为了可比性和共享性而提供的所有工具和语义,能够很简单地对 GTA V 上的代理进行性能基准测试。Universe GAT V 可以单独使用,也可以作为使用 Universe 代理访问的一个环境。雷锋网也期待在未来,能有更多像 GTA V Universe 这样的社区所提供的环境。

Via GTA-V-plus-Universe

内容加载中