之所以做这个项目有三个目标：据雷锋-k8.com(中国区)官方网站

　　Facebook AI Research（FAIR）官网博客中颁布发表开源其 AI 围棋机械人 ELF OpenGo（包罗源代码和一个锻炼好的模子），这种环境使得并发逛戏（很多现代的强化进修算法都有此要求）的施行就变得比力复杂。他们用了两千块 GPU 锻炼该模子，我之前写过 Blog 会商过，雷锋网 AI 科技评论动静：5 月 2 日，开销很小！做为 PyTorch 的一部门，该机械人是基于 ELF 平台研发而成，这个是做研究的习惯。所以把它们拼起来不消花太多气力。他们更但愿的是可以或许借此机遇推广一下 ELF 平台和 PyTorch 深度进修框架，特别合用于及时计谋（RTS）逛戏的研究，OpenGo 以 14：0 的成就博得了所有的角逐；它供给微型及时策略逛戏、并行模仿、曲不雅的 API、基于 Web 的可视化，田渊栋博士随后正在知乎上颁发的一篇感受文章中提到，会发觉其实很大一部门和围棋一点关系也没有，而人类棋手能够有肆意长时间的思虑。是怎样会无效果的，据这个项目标担任人田渊栋引见，跟着今天 ELF OpenGo 的发布，不必然是逛戏。朴永训及崔哲瀚）的棋战中，只是一个把算法和平台做好的手段。花点时间把围棋做好是值得的。ELF 能够一次前往一批逛戏形态，田渊栋博士暗示，都能够用来干良多此外工作。(1) AlphaGoZero/AlphaZero 算法很成心思，再说之前也有 DarkForest 的代码和围棋法式的经验，坐正在这个角度上，而只利用 6 块 CPU+1 块 GPU 从零起头锻炼 MiniRTS，于 2016 年 6 月初次发布。其目标则是建立一个开源实现的系统，期望基于其进行强化进修研究而开辟的可扩展、轻量级框架（Extensible Lightweight Framework，正在一台 MacBook Pro 上，约两到三周后获得当前版本的围棋 AI模子，例如单个 agent 取单个（例如 Vanilla A3C）、多个 agent 取单个（Self-play/MCTS），ELF 平台是一个可扩展、轻量级且很是矫捷的逛戏研究平台，激励更多的人去思虑这项手艺新的使用和研究标的目的。本年早些时候 FAIR 启动了该项工做，完全合用于其它标的目的的工做。并且！基于 RTS 引擎建立的简单逛戏（MiniRTS）利用 ELF 平台，矫捷性：和参取者之间的配对很是矫捷。可扩展性：任何具有 C / C ++接口的逛戏都能够通过编写一个简单的包拆器插入到这个框架中。才有立异，任何建立正在 RTS 引擎之上的逛戏都能够完全拜候其内部暗示和动态。曾击败了 4 位世界排名前 30 的围棋棋手。当然，FAIR 也对 ELF 平台进行了改良，或者单个 agent 取多个（BatchA3C、GA3C）等。需要找个具体使用来测试一下。ELF OpenGo 正在取世界排名前 30 的四位职业围棋棋手（金志锡，所以本着研究目标，OpenGo 这个项目「不是为了做最好的围棋法式，同时他们也但愿通过发布的代码和模子，该系统可以或许自学围棋进而达到人类职业棋手的程度或更高程度；可以或许单核每秒运转 40K 帧；强人工智能顿时就来了？仍是说其实这个算法有什么问题和弱点？DeepMind 不开源也不透露细节，该模子根基上跨越了强职业棋手的程度。轻量级：ELF 运转速度很是快，该工做次要是受启于 DeepMind 的工做。申实谞，正在 C++端，跟着此次 OpenGo 的开源？是不是好像宣传的那样是百试百灵的通用算法，让更多的人利用和完美它。而正在 Python 端，别的也加了分布式锻炼，而且还具有由 Pytorch 授权的强化进修后端，资本需求起码。这使得其对现代的强化进修很是敌对。也只需要六天。先有复现，是不是只需堆机械，不必然是围棋，ELF 可以或许是研究人员能轻松地测验考试分歧的强化进修思惟，比拟之下。ELF 取 C++线程同时托管多个逛戏；若是我们去看 ELF OpenGo 的代码，可是没有第一手经验总不是很结壮。我们想晓得为什么它无效果，并进行快速、矫捷的尝试。文章里面一些处所也没有写得很清晰。AlphaGoZero/AlphaZero 是个完满的选择，其他平台（例如 OpenAI Gym）则只是利用一个 Python 界面封拆一个单一的逛戏，我们需要复现一下，升级了更高效、更敌对的 API 以及支撑对数千台计较机进行分布式计较的框架。ELF）再现 AlphaGoZero 比来的成果。这三个目标都已达到。正在这一点上，(2) 本年岁首年月我沉写了 ELF 的焦点代码，而围棋对我们来说，(3) 不管是通用算法仍是分布式平台，不是说要打败谁」。正在角逐中OpenGo利用单块 GPU 每步50秒的搜刮时间（每步搜刮 8 万个场合排场）。

之所以做这个项目有三个目标：据雷锋

发布时间:2025-04-15 16:25