查看“增强学习-入门导读”的源代码
←
增强学习-入门导读
跳转至:
导航
、
搜索
因为以下原因,你没有权限编辑本页:
您刚才请求的操作只对以下1个用户组开放:
用户
。
您可以查看并复制此页面的源代码:
=增强学习入门= ==教材== 增强学习 or 强化学习经典教材 #Richard S. Sutton, Andrew Barto, An Introduction to Reinforcement Learning, MIT Press, 1998. [http://webdocs.cs.ualberta.ca/~sutton/book/the-book.html Intro_RL] #Csaba Szepesvari, Algorithms for Reinforcement Learning, Synthesis lectures on artificial intelligence and machine learning 4, no. 1, pp.1-103, 2010. [http://www.ualberta.ca/~szepesva/papers/RLAlgsInMDPs.pdf RLAlgsInMDPs] ==研究== ===<B>AlphaGo计算机围棋</B>=== 蒙特卡洛树搜索(Monte-Carlo tree search) :Bandit based monte-carlo planning, ecml 2006. :Efficient Selectivity and Backup Operators in Monte-Carlo Tree Search, CG 2006. :Combining Online and Offline Knowledge in UCT, ICML 2007. *Monte-Carlo tree search and rapid action value estimation in computer Go, artificial intelligence, Elsevier 2011. 神经网络 :Mimicking Go Experts with Convolutional Neural Networks, ICANN 2008. *Training Deep Convolutional Neural Networks to Play Go, icml 2015. 进展 :Achieving Master Level Play in 9 × 9 Computer Go, AAAI 2008. :The grand challenge of computer Go Monte Carlo tree search and extensions, cacm 2012. *Mastering the game of Go with deep neural networks and tree search, nature 2016.
返回
增强学习-入门导读
。
导航菜单
个人工具
创建账户
登录
名字空间
页面
讨论
变种
查看
阅读
查看源代码
查看历史
操作
搜索
导航
首页
实践教学
个性化3D设计与实现
人工智能实践教学
区块链技术及应用
虚拟现实技术与内容制作
超越学科界限的认知基础课程
电子工艺实习
Nand2Tetris Engine Curriculum
TULLL Creative Learning Group
Wiki上手说明
Wiki账户创建
最近更改
工具
链入页面
相关更改
特殊页面
页面信息