强化学习 1 — 马尔科夫决策过程详解(MDP)

强化学习 — 马尔科夫决策过程(MDP) 1、强化学习介绍 ​ 强化学习任务通常使用马尔可夫决策过程(Markov Decision Process,简称MDP)来描述,具体而言:机器处在 … Continue reading 强化学习 1 — 马尔科夫决策过程详解(MDP)