Yan, V. X., Soderstrom, N. C., Seneviratna, G. S., Bjork, E. L., & Bjork, R. A. (2017). How should exemplars be sequenced in inductive learning? Empirical evidence versus learners’ opinions. Journal of Experimental Psychology: Applied, 23(4), 403.
摘要
学习一个分类或者概念的时候,学习材料呈现的顺序其实很重要。比如学习10种不同风格的画作,你觉得是一个风格先学习完再学下一个(blocked)比较好呢,还是全部混在一起学(interleaved)比较好?直觉上我们会觉得是前者,但实验室研究发现其实是后者的学习效果更好(e.g., Kornell & Bjork, 2008)。
前人认为blocked可以让人更好地学习类内的共性,而interleaved能更好地学习类间的差异。这篇文章探究了如果把这两种形式混合会怎么样。结果发现,mini- blocks , blocked-to-interleaved和纯interleaved差不多,blocked还是最差的。
文章还调查了被试自己的学习形式偏好,发现interleaved是最差的。即被试在实际学习效果差不多甚至更差的情况下,倾向于选择blocked的学习形式。
问题背景
不论是从实践经验来看,还是凭个人体验,似乎在学习分类的时候,一个个类别学好再学下一个是比较好也比较通用的做法。作为学生来说,比起全部混在一起学,也会更加偏好一类类学这种方法。
- 鸟类分类(Tauber, Dunlosky, Rawson, Wahlheim, & Jacoby, 2013)
- 画家风格分类(Kornell & Bjork, 2008; Yan, Bjork, & Bjork, 2016)
- 钢琴旋律学习(Abushanab & Bishara, 2013)
“Spacing is the friend of recall, but the enemy of induction” (1977, personal communication, as reported in Kornell & Bjork, 2008)。很多实验室结支持了这个思想,他们认为对比的过程对于学习,迁移和形成更深的关系网络有着重要意义(Gentner & Namy, 1999; Gentner, Loewenstein, Thompson, & Forbus, 2009; Gick & Holyoak, 1983; Oakes & Ribar, 2005; Rittle-Johnson & Star, 2011)。
Kornell and Bjork (2008)。画家风格学习,每个画家6幅作品。发现interleaved更好。评价标准是在没看过的图片上对画作进行分类的正确率。这个研究被大量重复,在不同学习材料上都是一致的结果。
为什么Interleave学习效果更好呢?
有几种理论:
- interleave有助于检测类间差异,block有助于检测类内共性
- 对于已有研究中的测试任务来说检测类间差异更重要
Birnbaum et al. (2013) 发现如果在interleaved呈现形式下在图片间插入一些无关的问题要回答,会干扰被试进行对比的过程。
Kang and Pashler (2012) 的实验表明,在interleaved的情况下,一次呈现一张(中间又间隔时间)和一次呈现3张图片的效果一样好。
Day, Goldstone, and Hills (2010)学的是两种容易混淆的任务。Taylor and Rohrer (2010) demonstrated学的是四种数学问题。都得出一致的结论interleaved更好。
也有反面的证据。Carvalho and Goldstone (2014)认为学习的类本身如果很相似,类间的差异就更重要,更需要interleave。但如果类内不太相似,共性很难找,就更需要block。他们的实验是学习灯泡形状的刺激分类。一组类内类间差距小,一组差距大。前者interleave效果更好,后者block效果更好。
Zulkiply and Burt (2013)也发现如果类间差异小,interleave更好,vice versa。
混合型的学习形式会不会更好呢?
混合型的设计可以吸收两者的优点,会不会对学习效果更好呢?
如果不考虑效率的话,学习者会更喜欢哪一种形式呢?
Kornell and Bjork (2008)发现虽然Interleave在成绩上又更好的表现,但学习者们普遍认为他们用block学的更好。后面很多研究也重复出了一致的结果。
Tauber et al. (2013) 的鸟类分类实验中,让被试在每个试次之后都自主选择下一个试次(想看哪个分类的图片)。直到他们觉得都学会了。在4个不同的学习任务中,有78-100%的被试在一半的试次中连续选择同类的刺激材料3次以上。
在这些实验中,被试认为自己学的最好的方式,和实际上最好的方式刚好相反。但是有一种可能性是,在这些研究中范式和编码方式会影响被试的策略。比如Tauber et al. (2013)中被试平均连续选择类内的次数是3.7次,也就是他们采用了一种混合型的策略进行学习,这种学习会不会更好呢?
如果这种学习并不会更好,被试选择它的原因会不会是因为不知道interleave更好,如果告诉他们了是不是能改进他们的元认知呢。
因此在这篇文章的实验1和2中,作者首先探究了一下混合策略和单纯的block和interleave相比效果怎么样。在实验3和4中,考察了当类别中样例个数变化时被试策略的变化。
实验1和2
实验组设置
全组间,每组30多个人。
- Blocked
- Mini-blocks 几个类内的样例为一组,然后穿插呈现
- Blocked-to-interleaved 先以block的形式呈现,再变成interleaved
- Interleaved-to-blocked 先Interleaved再blocked
-
interleaved
实验材料和流程
The new artists were found using www.dailypainters.com。
12 artists 每个14张画。
实验1用了6 examplars per artist,测试随机选没学过的4张。
实验2 用了12 examplars per artist,测试用剩下的2张。
注意:所有的画都不会repeat
测试前会玩45秒俄罗斯方块,应该是为了降低近因效应。
测试就是看图片选对应的画家名字。
测试完之后还有个报告,就是告诉被试有这五种学习方法,他们认为哪种最好。
实验结果
主要结论1 mini-blocks和blocked-to-interleaved这两个组和interleaved的效果一样好。
这个结论和Proteau, Bladin, Alain, and Dorion (1994) 的运动学习实验的结果是一致的,这篇文章发现block学得更快,interleave学的更好,但是mini-block学的又快又好。(有点迷惑这里怎么可以比较两个学习时间不一样的组)
主要结论2 被试对interleave的学习效果的判断很不准确,但是对mini-blocks和blocked-to-interleaved的学习效果判断还比较准确。
如果只提供给被试两个选项,84%的被试都会选block。但是增加了混合选项之后,只有24%的被试选block,60%都选择了hybrid。
实验3
这个实验的目的是探索被试自己的学习策略,即认为什么学习序列是更好的。
实验材料和设计
一开始所有的材料用flashcard的形式呈现出来,被试根据自己的偏好可以对这些flashcard进行重新的排列。flashcard有6组,每组6张,上面只写了作者的名字没有画。初始有两种随机状态,一种是便于改成blocked(每组6张是相同的作者),一种便于改成interleaved(每组6张是6个不同的作者)。以平衡被试想快点结束实验造成的偏差。(为啥不直接用完全随机)
被试要按照自己认为比较好的学习顺序给这些卡排序。做完之后完成一个事后调查,报告自己组合卡的策略,然后从主试提供的一些学习顺序里面选择自己觉得最好的。
实验结果
主要结论1 在卡牌排列中,24/29的被试都选择了完全的blocked。
主要结论2 在事后调查中,42%的被试选择了blocked-to-interleaved,29%选择了blocked。
实验4
作者认为,手动组织卡片的策略和事后报告认为最优的策略产生不一致,可能是因为6个画家太少了,被试觉得在少量的时候没比要那么混合。因此实验4改成20个画家,并且不再用卡片,而是直接在纸上写的形式进行卡片排序。
结果还是和实验3类似的,但是采取纯block的比例从83%降到了33%。
但是作者也觉得有两种可能性导致被试在给排序的时候没有用hybrid的策略。1)在排卡片的时候没想到;2)太麻烦了
但是在报告自己为什么要这么排列的时候,被试反映出的对block和interleaved的认识和科学家所提出的假设是一致的。
有18%的被试认为interleaved是一种比较好的自测的形式。
讨论
有可能在学习difference之前,应该先学习commonality。
混合的学习会让相同画家的画之间有spacing,相当于复习,不然后面就忘了。但是应该不是复习造成的差异,因为interleaved比block-to-interleaved复习次数要多很多但是并没有明显比它好。(也可能本来b2i有别的因素更好,因为复习次数拉低了)
未来应该在别的刺激形式上看这个现象是不是能重复。以及看一下长期来看这种优势会不会有变化。
很多被试在学习的后期用interleave来测试自己的学习效果,这个可能也是巩固的一种方式。
几个有意思的点
看正确率的话,在这人的实验中,interleave是50%,block是38%
机器学习,以Zeng et al.(2018) Context-dependent continual learning给出的数据为例,SGD-resnet152-imagenet,interleave (concurrent training) 是78%,block (continual)是4%。
- 人的实验可能还没学到比较好的状态,学好了会不会不一样呢?(再关注一下元分析)
- 为什么人会主观产生block这种倾向呢,明明学习结果没有更好。会不会因为单幅图片其实已经做了特征提取了,多个图是要确认这些特征是不是重要的,先把不重要的扔掉,不然存了太多了会觉得负担更重。
- 神经网络里面怎么体现提取共性的过程呢。