最近有一个同学实现了一个利用 DQN + CNN 的 Java 版增强学习 Flappybird:
作者自己手写了一个Java 版的 Flappybird,然后+ DJL 纯 Java 深度学习框架。
目前训练了 300 万步,鸟可以自己玩到 380 多分。训练好的模型已经在 repo 里面了,可以直接用来继续训练或者用 agent 跑跑看。
参考项目:
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.