强化学习 — 马尔科夫决策过程(MDP) 1、强化学习介绍 ​ 强化学习任务通常使用马尔可夫决策过程(Markov Decision Process,简称MDP)来描述,具体而言:机器 ...

关注我们的公众号

微信公众号