《28 天自制你的 AlphaGo》,正在写的一个系列(已经可以真正与自制小狗对弈了)

2017-01-15 13:31:35 +08:00
 withablink
大家好,我正在写一个《 28 天自制你的 AlphaGo 》系列,已经写到可以真正训练神经网络,并且与自制小狗对弈了。会玩编程的朋友可以看看:


https://zhuanlan.zhihu.com/p/24885190


如果看完有收获,点个赞吧~(如果公众号或网站希望转载,请先联系我,谢谢)。

下面黑棋是自制小狗,可以看到会开局(不过它目前是纯感觉下棋,没有搜索,不会死活,所以一战斗就崩):
3046 次点击
所在节点    AlphaGo
17 条回复
fffflyfish
2017-01-15 14:12:04 +08:00
我以为楼主是要全部自制,包括模型搭建,代码编写,看了一圈还是在跑写好的代码。。。
withablink
2017-01-15 14:44:23 +08:00
@fffflyfish 一篇篇来,后续要全部搭,但一开始能让学习者马上看到一个小结果很重要。
toowangziyi
2017-01-15 15:15:11 +08:00
mark
kn007
2017-01-15 15:33:15 +08:00
关注
liujun3712
2017-01-15 15:37:43 +08:00
mark
tigerstudent
2017-01-15 16:06:33 +08:00
坐等楼主横扫 QQ 游戏大厅怒砍 80 连胜
WildCat
2017-01-15 16:20:19 +08:00
怎么第一篇是 MXNet 第二篇就成了 Tensorflow ?
fffflyfish
2017-01-15 16:33:26 +08:00
@withablink 可以可以,收藏了
htfy96
2017-01-15 17:05:43 +08:00
趁机安利一下最近写的 ai https://github.com/sjtu-ai-go/go-ai ,介绍 https://intmainreturn0.com/2017/01/01/bakago/
作为期末 Project 弄的一个东西,训练部分代码之后会整理一下。除了 GTP 以外的部分都是自己写的。最后的结果 policy net accu = 52%,能够打赢单机版 Darkforest Go ( 15s )

find . -type f | grep -Ev 'vendor|cmake-build|build|virtualenv' | grep -E '(cpp|hpp)$' | xargs wc -l
4438 total
withablink
2017-01-15 19:10:34 +08:00
@WildCat 后文会用 MXNet ,不过网上大部分人是用 TensorFlow ,所以两个都装了吧。
withablink
2017-01-15 19:11:40 +08:00
@htfy96 是不是网络有问题,估计 Darkforest Go ( 15s ) 应该没那么弱吧?
withablink
2017-01-15 19:14:45 +08:00
@htfy96 应该要能完虐 pachi 才说明搭对了......

可以连到这里玩玩 http://www.yss-aya.com/cgos/19x19/standings.html
vicluo96
2017-01-15 19:16:13 +08:00
@withablink 其实 df 原始单机版很弱,因为自带模型 accu 很低,即使换成更高 accu(~40%)的 model 也打不过这个 AI 。然而这个 AI 对 pachi 胜率很低,因为 MCTS 写的很菜…
vicluo96
2017-01-15 19:17:32 +08:00
这个 AI 可以完虐 df 单机(10+目),但是经常小负 pachi 。而 df 单机又能赢 pachi …
livc
2017-01-15 20:04:41 +08:00
withablink
2017-01-15 21:03:59 +08:00
@vicluo96 那看来是 df 作者故意没有摆上去好的模型,正常现在大家都到 55-60%了
withablink
2017-01-16 14:37:37 +08:00
各位收藏之后可以回复一下...否则很快就潜下去了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/334701

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX