本站内容主要从网络公开试题中整理。

2022专技天下

当前位置:首页 > 2022专技天下

基于蒙特卡罗的强化学习方法

基于蒙特卡罗的强化学习方法

    蒙特卡罗方法(Monte Carlo method),就是统计模拟的方法,蒙特卡洛的实现绝对比听起来要容易的多,最简单的例子就是当事件服从0-1分布时,我们反复去做n次实验,其中m次成功,根据大数定律,v(s) → vπ(s)asN(s) → ∞,那么就认为事件成功的概率为m/n。

相关内容

点击排行

猜你喜欢