一. 增强学习简介 1.1 什么是增强学习? 机器学习的算法可以分为三类:监督学习,非监督学习和增强学习。 增强学习也称为强化学习。 增强学习就是将情况映射为行为,也就是去最...
一. 增强学习简介 1.1 什么是增强学习? 机器学习的算法可以分为三类:监督学习,非监督学习和增强学习。 增强学习也称为强化学习。 增强学习就是将情况映射为行为,也就是去最...
七. 泛化和函数近似 问题:目前为止,我们假设值函数的估计都是用一个表,如Q-table.但是,这个表有局限,因为它局限于状态数和行为数较少的例子。因为如果状态数和行为数较大...
准备工作 一只 Root 过的安卓智能手机(例如 Smartisan T1), 非 root 的可以使用 Termux 下载并安装 busybox.apk 、 Linux D...