V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
withablink
V2EX  ›  AlphaGo

《28 天自制你的 AlphaGo》,正在写的一个系列(已经可以真正与自制小狗对弈了)

  •  1
     
  •   withablink · 2017-01-15 13:31:35 +08:00 · 3020 次点击
    这是一个创建于 2878 天前的主题,其中的信息可能已经有所发展或是发生改变。
    大家好,我正在写一个《 28 天自制你的 AlphaGo 》系列,已经写到可以真正训练神经网络,并且与自制小狗对弈了。会玩编程的朋友可以看看:


    https://zhuanlan.zhihu.com/p/24885190


    如果看完有收获,点个赞吧~(如果公众号或网站希望转载,请先联系我,谢谢)。

    下面黑棋是自制小狗,可以看到会开局(不过它目前是纯感觉下棋,没有搜索,不会死活,所以一战斗就崩):
    第 1 条附言  ·  2017-01-16 14:38:10 +08:00
    各位收藏之后可以回复一下...否则很快就潜下去了。
    第 2 条附言  ·  2017-01-18 23:06:21 +08:00
    更新了第 4 篇,包括对于策略网络的独家深入分析(以及它的弱点所在):
    https://zhuanlan.zhihu.com/p/24939269

    收藏的朋友记得回复一下!~
    17 条回复    2017-01-16 14:37:37 +08:00
    fffflyfish
        1
    fffflyfish  
       2017-01-15 14:12:04 +08:00 via iPad
    我以为楼主是要全部自制,包括模型搭建,代码编写,看了一圈还是在跑写好的代码。。。
    withablink
        2
    withablink  
    OP
       2017-01-15 14:44:23 +08:00
    @fffflyfish 一篇篇来,后续要全部搭,但一开始能让学习者马上看到一个小结果很重要。
    toowangziyi
        3
    toowangziyi  
       2017-01-15 15:15:11 +08:00 via Android
    mark
    kn007
        4
    kn007  
       2017-01-15 15:33:15 +08:00
    关注
    liujun3712
        5
    liujun3712  
       2017-01-15 15:37:43 +08:00 via Android
    mark
    tigerstudent
        6
    tigerstudent  
       2017-01-15 16:06:33 +08:00
    坐等楼主横扫 QQ 游戏大厅怒砍 80 连胜
    WildCat
        7
    WildCat  
       2017-01-15 16:20:19 +08:00 via iPhone
    怎么第一篇是 MXNet 第二篇就成了 Tensorflow ?
    fffflyfish
        8
    fffflyfish  
       2017-01-15 16:33:26 +08:00
    @withablink 可以可以,收藏了
    htfy96
        9
    htfy96  
       2017-01-15 17:05:43 +08:00
    趁机安利一下最近写的 ai https://github.com/sjtu-ai-go/go-ai ,介绍 https://intmainreturn0.com/2017/01/01/bakago/
    作为期末 Project 弄的一个东西,训练部分代码之后会整理一下。除了 GTP 以外的部分都是自己写的。最后的结果 policy net accu = 52%,能够打赢单机版 Darkforest Go ( 15s )

    find . -type f | grep -Ev 'vendor|cmake-build|build|virtualenv' | grep -E '(cpp|hpp)$' | xargs wc -l
    4438 total
    withablink
        10
    withablink  
    OP
       2017-01-15 19:10:34 +08:00
    @WildCat 后文会用 MXNet ,不过网上大部分人是用 TensorFlow ,所以两个都装了吧。
    withablink
        11
    withablink  
    OP
       2017-01-15 19:11:40 +08:00
    @htfy96 是不是网络有问题,估计 Darkforest Go ( 15s ) 应该没那么弱吧?
    withablink
        12
    withablink  
    OP
       2017-01-15 19:14:45 +08:00
    @htfy96 应该要能完虐 pachi 才说明搭对了......

    可以连到这里玩玩 http://www.yss-aya.com/cgos/19x19/standings.html
    vicluo96
        13
    vicluo96  
       2017-01-15 19:16:13 +08:00 via Android
    @withablink 其实 df 原始单机版很弱,因为自带模型 accu 很低,即使换成更高 accu(~40%)的 model 也打不过这个 AI 。然而这个 AI 对 pachi 胜率很低,因为 MCTS 写的很菜…
    vicluo96
        14
    vicluo96  
       2017-01-15 19:17:32 +08:00 via Android
    这个 AI 可以完虐 df 单机(10+目),但是经常小负 pachi 。而 df 单机又能赢 pachi …
    livc
        15
    livc  
       2017-01-15 20:04:41 +08:00
    withablink
        16
    withablink  
    OP
       2017-01-15 21:03:59 +08:00
    @vicluo96 那看来是 df 作者故意没有摆上去好的模型,正常现在大家都到 55-60%了
    withablink
        17
    withablink  
    OP
       2017-01-16 14:37:37 +08:00
    各位收藏之后可以回复一下...否则很快就潜下去了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5516 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 09:04 · PVG 17:04 · LAX 01:04 · JFK 04:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.