@lsmn 2016-04-29T23:58:38.000000Z 字数 1197 阅读 5051

OpenAI发布开源人工智能研究工具集OpenAI Gym

开源 AI 人工智能 强化学习

摘要

近日，由InfoSys和Amazon Web Services创建的非营利性人工智能研究企业OpenAI发布了OpenAI Gym的Beta版本。Gym是一个基于Python的工具集，用于开发和对比强化学习（RL）算法，遵循MIT许可协议。

正文

和许多企业一样，在过去几年中，InfoSys见证了从“大数据”到越来越重视机器学习和AI研究这一重大转变。但和他们的竞争者不同，InfoSys断定，合作是更有效方式，而不是大力投资专有解决方案，比如微软的Azure Machine Learning Studio。

这一决策的结果就是OpenAI，一家非营利性的人工智能研究企业。自2015年12月正式成立以来，该研究组织已经从InfoSys、Amazon Web Services和多个私人捐助者那里获得了10亿美元的资金。

我们在这里谈论OpenAI，是因为他们近日发布了OpenAI Gym的公开测试版本。该工具集用于开发和对比强化学习（RL）算法，这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因：

RL是通用算法，适应所有涉及一系列决策的问题：例如，控制机器人的电动机，让它跑跑跳跳，做出业务决策，如价格和库存管理，或者玩视频游戏和棋盘游戏。RL甚至适用于产生序列化或结构化输出的监督学习问题。

在许多不同的环境中，RL算法已经开始取得很好的成果。RL有很长的历史，但在深度学习取得最新进展之前，它都需要针对特定问题进行大量的设计。DeepMind的Atari成果、来自Pieter Abbeel研究小组的BRETT以及AlphaGo都使用了深度RL算法，并且没有对它们的应用环境做太多的假设，因此可以应用在其他场合。

目前，RL研究的发展受到了限制，它需要更好的基准测试，而且“出版物中缺少标准化的环境”。不难想象，当另一位科学家的研究论文假定你可以使用一套专有的工具集，你就很难再现他的结果。更糟糕的是，一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本，还因为没有一个共同的环境，比较两个算法就没有意义。因此，OpenAI Gym提供了这些开箱即用的环境：Classic control、Toy text、Algorithmic、Atari （基于Arcade学习环境）、棋盘游戏和2D/3D机器人（最后一项需要一个MuJoCo物理引擎许可。）

目前，OpenAI Gym在Linux和OSX上支持Python 2.7。如果大家有足够的兴趣，他们也会考虑支持Python 3和Windows。该工具集的代码遵循MIT许可协议。

查看英文原文：Open Sourcing Artificial Intelligence Research

OpenAI发布开源人工智能研究工具集OpenAI Gym

摘要

正文

内容目录

选择主题