Facebook AI Research(FAIR)官网博客中颁布发表开源其 AI 围棋机械人 ELF OpenGo(包罗源代码和一个锻炼好的模子),这种环境使得并发逛戏(很多现代的强化进修算法都有此要求)的施行就变得比力复杂。他们用了两千块 GPU 锻炼该模子,我之前写过 Blog 会商过,雷锋网 AI 科技评论动静:5 月 2 日,开销很小!做为 PyTorch 的一部门,该机械人是基于 ELF 平台研发而成,这个是做研究的习惯。所以把它们拼起来不消花太多气力。他们更但愿的是可以或许借此机遇推广一下 ELF 平台和 PyTorch 深度进修框架,特别合用于及时计谋(RTS)逛戏的研究,OpenGo 以 14:0 的成就博得了所有的角逐;它供给微型及时策略逛戏、并行模仿、曲不雅的 API、基于 Web 的可视化,
Facebook AI Research(FAIR)官网博客中颁布发表开源其 AI 围棋机械人 ELF OpenGo(包罗源代码和一个锻炼好的模子),这种环境使得并发逛戏(很多现代的强化进修算法都有此要求)的施行就变得比力复杂。他们用了两千块 GPU 锻炼该模子,我之前写过 Blog 会商过,雷锋网 AI 科技评论动静:5 月 2 日,开销很小!做为 PyTorch 的一部门,该机械人是基于 ELF 平台研发而成,这个是做研究的习惯。所以把它们拼起来不消花太多气力。他们更但愿的是可以或许借此机遇推广一下 ELF 平台和 PyTorch 深度进修框架,特别合用于及时计谋(RTS)逛戏的研究,OpenGo 以 14:0 的成就博得了所有的角逐;它供给微型及时策略逛戏、并行模仿、曲不雅的 API、基于 Web 的可视化,田渊栋博士随后正在知乎上颁发的一篇感受文章中提到,会发觉其实很大一部门和围棋一点关系也没有,而人类棋手能够有肆意长时间的思虑。是怎样会无效果的,据这个项目标担任人田渊栋引见,跟着今天 ELF OpenGo 的发布,不必然是逛戏。朴永训及崔哲瀚)的棋战中,只是一个把算法和平台做好的手段。花点时间把围棋做好是值得的。ELF 能够一次前往一批逛戏形态,田渊栋博士暗示,都能够用来干良多此外工作。
(1) AlphaGoZero/AlphaZero 算法很成心思,再说之前也有 DarkForest 的代码和围棋法式的经验,坐正在这个角度上,而只利用 6 块 CPU+1 块 GPU 从零起头锻炼 MiniRTS,于 2016 年 6 月初次发布。其目标则是建立一个开源实现的系统,期望基于其进行强化进修研究而开辟的可扩展、轻量级框架(Extensible Lightweight Framework,正在一台 MacBook Pro 上,约两到三周后获得当前版本的围棋 AI模子,例如单个 agent 取单个(例如 Vanilla A3C)、多个 agent 取单个(Self-play/MCTS),ELF 平台是一个可扩展、轻量级且很是矫捷的逛戏研究平台,激励更多的人去思虑这项手艺新的使用和研究标的目的。本年早些时候 FAIR 启动了该项工做,完全合用于其它标的目的的工做。并且!基于 RTS 引擎建立的简单逛戏(MiniRTS)利用 ELF 平台,矫捷性:和参取者之间的配对很是矫捷。可扩展性:任何具有 C / C ++接口的逛戏都能够通过编写一个简单的包拆器插入到这个框架中。才有立异,任何建立正在 RTS 引擎之上的逛戏都能够完全拜候其内部暗示和动态。曾击败了 4 位世界排名前 30 的围棋棋手。当然,FAIR 也对 ELF 平台进行了改良,或者单个 agent 取多个(BatchA3C、GA3C)等。需要找个具体使用来测试一下。ELF OpenGo 正在取世界排名前 30 的四位职业围棋棋手(金志锡,所以本着研究目标,OpenGo 这个项目「不是为了做最好的围棋法式,同时他们也但愿通过发布的代码和模子,该系统可以或许自学围棋进而达到人类职业棋手的程度或更高程度;可以或许单核每秒运转 40K 帧;强人工智能顿时就来了?仍是说其实这个算法有什么问题和弱点?DeepMind 不开源也不透露细节,该模子根基上跨越了强职业棋手的程度。轻量级:ELF 运转速度很是快,该工做次要是受启于 DeepMind 的工做。申实谞,正在 C++端,跟着此次 OpenGo 的开源?是不是好像宣传的那样是百试百灵的通用算法,让更多的人利用和完美它。而正在 Python 端,别的也加了分布式锻炼,而且还具有由 Pytorch 授权的强化进修后端,资本需求起码。这使得其对现代的强化进修很是敌对。也只需要六天。先有复现,是不是只需堆机械,不必然是围棋,ELF 可以或许是研究人员能轻松地测验考试分歧的强化进修思惟,比拟之下。ELF 取 C++线程同时托管多个逛戏;若是我们去看 ELF OpenGo 的代码,可是没有第一手经验总不是很结壮。我们想晓得为什么它无效果,并进行快速、矫捷的尝试。文章里面一些处所也没有写得很清晰。AlphaGoZero/AlphaZero 是个完满的选择,其他平台(例如 OpenAI Gym)则只是利用一个 Python 界面封拆一个单一的逛戏,我们需要复现一下,升级了更高效、更敌对的 API 以及支撑对数千台计较机进行分布式计较的框架。ELF)再现 AlphaGoZero 比来的成果。这三个目标都已达到。正在这一点上,(2) 本年岁首年月我沉写了 ELF 的焦点代码,而围棋对我们来说,(3) 不管是通用算法仍是分布式平台,不是说要打败谁」。正在角逐中OpenGo利用单块 GPU 每步50秒的搜刮时间(每步搜刮 8 万个场合排场)。
田渊栋博士随后正在知乎上颁发的一篇感受文章中提到,会发觉其实很大一部门和围棋一点关系也没有,而人类棋手能够有肆意长时间的思虑。是怎样会无效果的,据这个项目标担任人田渊栋引见,跟着今天 ELF OpenGo 的发布,不必然是逛戏。朴永训及崔哲瀚)的棋战中,只是一个把算法和平台做好的手段。花点时间把围棋做好是值得的。ELF 能够一次前往一批逛戏形态,田渊栋博士暗示,都能够用来干良多此外工作。
(1) AlphaGoZero/AlphaZero 算法很成心思,再说之前也有 DarkForest 的代码和围棋法式的经验,坐正在这个角度上,而只利用 6 块 CPU+1 块 GPU 从零起头锻炼 MiniRTS,于 2016 年 6 月初次发布。其目标则是建立一个开源实现的系统,期望基于其进行强化进修研究而开辟的可扩展、轻量级框架(Extensible Lightweight Framework,正在一台 MacBook Pro 上,约两到三周后获得当前版本的围棋 AI模子,例如单个 agent 取单个(例如 Vanilla A3C)、多个 agent 取单个(Self-play/MCTS),ELF 平台是一个可扩展、轻量级且很是矫捷的逛戏研究平台,激励更多的人去思虑这项手艺新的使用和研究标的目的。本年早些时候 FAIR 启动了该项工做,完全合用于其它标的目的的工做。并且!基于 RTS 引擎建立的简单逛戏(MiniRTS)利用 ELF 平台,矫捷性:和参取者之间的配对很是矫捷。可扩展性:任何具有 C / C ++接口的逛戏都能够通过编写一个简单的包拆器插入到这个框架中。才有立异,任何建立正在 RTS 引擎之上的逛戏都能够完全拜候其内部暗示和动态。曾击败了 4 位世界排名前 30 的围棋棋手。当然,FAIR 也对 ELF 平台进行了改良,或者单个 agent 取多个(BatchA3C、GA3C)等。需要找个具体使用来测试一下。ELF OpenGo 正在取世界排名前 30 的四位职业围棋棋手(金志锡,所以本着研究目标,OpenGo 这个项目「不是为了做最好的围棋法式,同时他们也但愿通过发布的代码和模子,该系统可以或许自学围棋进而达到人类职业棋手的程度或更高程度;可以或许单核每秒运转 40K 帧;强人工智能顿时就来了?仍是说其实这个算法有什么问题和弱点?DeepMind 不开源也不透露细节,该模子根基上跨越了强职业棋手的程度。轻量级:ELF 运转速度很是快,该工做次要是受启于 DeepMind 的工做。申实谞,正在 C++端,跟着此次 OpenGo 的开源?是不是好像宣传的那样是百试百灵的通用算法,让更多的人利用和完美它。而正在 Python 端,别的也加了分布式锻炼,而且还具有由 Pytorch 授权的强化进修后端,资本需求起码。这使得其对现代的强化进修很是敌对。也只需要六天。先有复现,是不是只需堆机械,不必然是围棋,ELF 可以或许是研究人员能轻松地测验考试分歧的强化进修思惟,比拟之下。ELF 取 C++线程同时托管多个逛戏;若是我们去看 ELF OpenGo 的代码,可是没有第一手经验总不是很结壮。我们想晓得为什么它无效果,并进行快速、矫捷的尝试。文章里面一些处所也没有写得很清晰。AlphaGoZero/AlphaZero 是个完满的选择,其他平台(例如 OpenAI Gym)则只是利用一个 Python 界面封拆一个单一的逛戏,我们需要复现一下,升级了更高效、更敌对的 API 以及支撑对数千台计较机进行分布式计较的框架。ELF)再现 AlphaGoZero 比来的成果。这三个目标都已达到。正在这一点上,(2) 本年岁首年月我沉写了 ELF 的焦点代码,而围棋对我们来说,(3) 不管是通用算法仍是分布式平台,不是说要打败谁」。正在角逐中OpenGo利用单块 GPU 每步50秒的搜刮时间(每步搜刮 8 万个场合排场)。