16.1任务与奖赏 其中: policy:策略决定了agent在特定时间的行为,将当前环境的状态state映射为行动action,对应于心理学中...
15.1基本概念 规则学习是从训练数据中学习一组能用于对未见示例进行判别的规则。 规则可分为两类:命题规则和一阶规则 命题规则由原子命题和逻辑连...
这一部分没有参考资料,自己看书的时间也比较短,对于一些概念也比较模糊,参考了很多人的学习笔记,整理摘抄。。。。。。。 -------------...
13.1 未标记样本 让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learnin...
计算学习理论(computational learning theory)是通过“计算”来研究机器学习的理论,简而言之,其目的是分析学习任务的本...
NP问题 什么是P问题? P是英文单词多项式(Polynomial)的第一个字母。如果一个问题可以找到一个能在多项式的时间里解决它的算法,那么这...
我们将属性称为“特征”,对当前学习任务有段的属性称为“相关特征”。 特征选择是一个重要的“数据预处理”过程 第一个环节是“子集搜索”问题,说通俗...
这一章内容感觉有点难,涉及到很多关于矩阵运算的内容,书中对KNN的内容没有过多的描述,在笔记中先将矩阵运算的一些公式进行搬运,而后直接从第二部分...
文章内容主要摘自 https://blog.csdn.net/u011826404/article/details/70991604,吴恩达老师...
文集作者