更改

增强学习-入门导读

添加232字节2017年3月19日 (日) 13:04
/* 卷积网络下围棋 */
# Mimicking Go Experts with Convolutional Neural Networks, ICANN 2008.
# '''Training Deep Convolutional Neural Networks to Play Go, ICML 2015.'''
 
在用3千万5dan以上的选手的棋局训练卷积网路,其中机器也会把人类选手下的昏招或者臭招也学会了。但是可以用自我博弈出的棋局数据来训练,这样就可以稀释掉这些昏招。
== 历史性进展 ==
行政员管理员
6,105
个编辑