深心开源Lab2D,一个用于创建机器学习2D环境的系统

0
2261
Source: //github.com/deepmind/lab2d

深心最近开源了一个名为 Lab2D。 Lab2D旨在支持为人工智能和机器学习研究创建2D环境。 

深心团队指出,与3D环境相比,2D环境自然比3D环境更易于理解,但表达能力却有所下降。研究人员说,即使是一个简单的游戏Pong,它由黑色背景上的三个移动矩形组成,也可以捕捉到有关乒乓球真实游戏的主要知识。从表面上看,这种抽象使掌握人工智能中问题和概念的性质变得更加简单。

研究人员断言,像3D一样,可以轻松地研究2D中伴随着众多维度的深度复杂性。此外,二维环境的运行资源消耗明显减少,并且通常不需要专门的硬件(例如GPU)来获得可接受的性能。 2D环境已成功用于研究各种问题,例如社会复杂性,导航,不完善的信息,抽象推理,探索等。

广告Coursera Plus标语,包含约翰·霍普金斯大学,谷歌和密歇根大学的课程,突出显示数据科学职业发展的内容

Lab2D促进了2D分层,离散的“网格世界”环境的创建,每个棋子(类似于国际象棋棋子)都在其中移动。该系统是专为多主体强化学习量身定制的。它支持多个玩家同时在相应的环境中进行交互。这些播放器可以是人为控制的,也可以是计算机控制的。每个玩家都可以拥有显示某些信息的自定义世界视图。可以建立可能会被玩家隐藏的全局视角,并包括特定的细节。这可用于不共享信息的不完美信息游戏,以及在情节进行过程中实验者可以观察环境的全球状况的人类行为测试。

//arxiv.org/pdf/2011.07027.pdf

Lab2D提供了许多用于揭示内部环境信息的机制。最简单的形式之一就是观察,使研究人员能够从每个步骤的环境中添加特定信息。第二种方法是通过事件。这些不受时间级别限制,而是在特定条件下触发。最终,属性API提供了一种读写环境参数的方法。

基于强化学习的人工智能研究正逐渐发展成为一门学科。研究工作流花费大量时间来创作游戏环境和智力测试,添加分析方法等等。这些活动对于企业的成功至关重要。但是,它们并不像应该扩展的那样简单明了。该团队指出,DeepMind Lab2D是朝着强大的仿真平台迈出的一步,该平台可能有助于大规模学习,技能获取和AI系统测量。

Lab2D在DeepMind上推广并推广了流行的内部系统,该系统支持广泛的研究项目。在涉及具有重大环境方面重复性的工作流的多主体研究中,它广受欢迎。该团队发现,DeepMind Lab2D可促进研究人员在学习环境和智力测验计划中的创造力。他们渴望见证研究社区将来使用它构建的内容。

Github: //github.com/deepmind/lab2d

纸: //arxiv.org/pdf/2011.07027.pdf

参考: //venturebeat.com/2020/11/16/deepmind-open-sources-lab2d-a-grid-based-environment-for-reinforcement-learning-research/

广告

发表评论

请输入您的评论!
请在这里输入您的名字

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据 .