自适应动态规划(关于自适应动态规划部分内容简述)
2022-11-28 19:40:12
导读 大家好,今天小方来说说一篇关于自适应动态规划,关于自适应动态规划部分内容简述的文章,那么现在就为大家来简单介绍下,希望对各位小伙伴
大家好,今天小方来说说一篇关于自适应动态规划,关于自适应动态规划部分内容简述的文章,那么现在就为大家来简单介绍下,希望对各位小伙伴们有所帮助。
1、 自适应动态规划(Adaptive/Approximate Dynamic Programming,ADP),又叫近似动态规划,是人工智能和控制领域发展而交汇形成的新兴学科。
2、 ADP方法主要包括三种基本类型:启发式动态规划(Heuristic Dynamic Programming,HDP),双启发式动态规划(Dual Heuristic Programming,DHP)和全局双启发式动态规划(Globalized Dual heuristic Programming,GDHP)。这三种类型都包含三个模块,如果每个模块都用神经网络来代替,这样我们也称这三个模块为三个网络,即评价网络(Critic Network)、模型网络(Model Network)和执行网络(Action Network)。如果我们省略了模型网络,使得执行网络直接与评价网络相连接,这样的结构称为它们的动作依赖(Action-Dependent)形式,即ADHDP,ADDHP,ADGDHP。
文章到此就分享结束,希望对大家有所帮助。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
- 12-28
- 12-28
- 12-28
- 12-28
- 12-28
- 12-28
- 12-28
- 12-28