这个周末看了一篇文章deep reinforcement learing: an overview,这篇文章把深度增强学习的目前的研究领域总结的很全面了。
Section2介绍了深度学习和增强学习的背景,以及测试平台的介绍。
Section3介绍了DQN以及相关的扩展
Section4介绍了异步方法,比如A3C
Section 5介绍了策略相关的优化算法,例如DDPG、TRPO和GPS等等
Section6介绍了reward
Section7介绍了planning
Section 8介绍了attention和memory,比如DNC
Section9介绍了非监督学习,代表是unreal
Section 10介绍了学习如何学习,比如迁移学习,多任务学习等等
Section11介绍各种游戏
Section12专门介绍了AlphaGo
Section13介绍了机器人
Section 14介绍了对话系统
Section 15 介绍了翻译系统
Section 16 介绍了文本预测
Section17介绍了神经网络设计
Section 18 介绍网站服务
Section 19介绍健康相关
Section 20介绍了金融
Section 21 介绍了音乐相关
Section 22 给了一堆的todo
我还没有看完,但是看到增强学习和GAN以及Inverse、以及非监督学习一块的联系,感觉还是非常有意思,还要多看一些论文,多涨涨见识。一些思路其实非常简单,只是人类一直找不到合适的表达方法而已,找到办法还得有办法收敛才行。