9连续型随机分布.avi
14-举例说明从连续型和离散型变量中寻找最佳条件.mp4
6-PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy.mp4
1-DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic.mp4
9-代码实战_A3C_定义Worker计算loss的逻辑_针对连续型的action提高actor探索性.mp4
本站仅提供网盘搜索,不保存任何资源。
2010-2024 技术支持:8miu