Learning with different output space
机器学习按照输出的结果,可以分为四类(老师讲了四类,可能不止):
- binary classification: 前面PLA做的就是这类问题,输出是或者否的二分类问题;
- multiclass classification: 多种分类问题,例如平时做的单选题,要求从四个选项中输出一个选项;
- regression: 回归问题,返回实数区间中的一个实数;
- structured learning: 结构分类,但是它的选择区间是可数多个的,区间中的每个元素可能代表某一种结构。
Learning with different data label
机器学习按照数据集是否给出 y_n,划分成了三类:
- 监督学习:所有的y_n都给出;
- 非监督学习:不给出y_n;
- 半监督学学习:给出部分的y_n;
- 强化学习:对于一个输入,如果机器返回的是我们想要的结果,就给予奖励,反之惩罚。强化学习是真正意义上的“教师”监督学习,并且在某种意义上很像是online learning。
Learning with different protocol
机器学习按照资料给与的形式,分为了以下几类:
- batch: 把资料一股脑地全部塞给机器,对应“填鸭式教学”;
- online:把资料一笔一笔地告诉机器,机器一次次改进 g;
- active: 当机器能自行判断时,自行做出结果;当机器不能进行判断,有疑惑时,像监督人进行询问;
Leaning with different space x
- concrete feature: 数据集中的 X 是具体的,信息丰富的,被人所加工过的数据,it's easy learning.
- raw feature: X 是粗糙的、原始的,信息看起来不那么“显然”,需要人去转化成具体的;
- abstract feature:数据抽象,没经过任何处理,需要转化到raw feature甚至concrete feature。