Khosla, A., Raju, A. S., Torralba, A., &Oliva, A. (2015). Understanding and predicting image memorability at a largescale. InProceedings of the IEEE International Conference on Computer Vision(pp. 2390-2398).
研究提出了一种新颖的实验程序来客观地测量人类的记忆力,从而使得研究者能够构建迄今为止最大的带标注的图像记忆性数据集LaMem(60,000张图像)。
实验程序包括以可变的时间间隔显示目标重复(图像的第二次出现)。记忆性分数随着重复之间的时间间隔的函数而可预测地变化,而记忆性等级在很大程度上得到保留,即,如果显示目标和其重复之间的时间增加,则所有图像的记忆性分数减少相似的量,从而保持等级排序。
模型和数据:http://memorability.csail.mit.edu
Salient Object Detection Model
一个显着的对象检测模型应该首先检测场景中引人注意的显着对象,然后对整个对象进行分割。 通常,模型的输出是显着图,其中每个像素的强度代表其属于显着对象的概率。这个问题本质上是一个图形/背景分割问题,目标是仅从背景中分割出显着的前景对象。
测量模型预测和人类标注之间的一致性的方法:1评估标记的区域与模型预测之间的重叠;2评估带有对象边界的绘制形状的准确性;3同时考虑边界和形状。
Borji, A., Cheng, M. M., Jiang, H., & Li, J. (2015). Salient object detection: A benchmark. IEEE transactions on image processing, 24(12), 5706-5722.
为了对基准目标检测和分割方法进行基准测试,研究在七个数据集上,对41个最先进的模型(29个显著目标检测、10个注视预测、1个目标和1个基线)进行了广泛的、定性的和定量的比较。研究发现,专门为显着对象检测而设计的模型通常比密切的相关领域中的模型工作得更好。研究还分析了中心偏差和场景复杂性对模型性能的影响。
数据集:1)MSRA10K, 2)THUR15K, 3)ECSSD, 4)JuddDB, 5)DUT-OMRON, 6)SED2, 7)PASCAL-S
Hou, Q., Cheng, M. M., Hu, X., Borji, A., Tu,Z., & Torr, P. H. (2017). Deeply supervised salient object detection withshort connections. InProceedings of the IEEE Conference on Computer Vision and Pattern Recognition(pp. 3203-3212).
研究介绍了一种基于区域对比度的显着对象检测算法,该算法同时评估全局对比度差异和空间加权相干分数。所提出的算法简单,高效,自然地是多尺度的,并产生了全分辨率,高质量的显着图。使用传统的显著目标检测数据集以及更具挑战性的网络图像数据集对算法进行了广泛评估。实验结果表明,该算法始终优于15种现有的显着对象检测和分割方法,具有更高的精度和更好的召回率。
Bylinskii, Z., Isola, P., Bainbridge, C., Torralba, A., & Oliva, A. (2015). Intrinsic and extrinsic effects on image memorability.Vision research,116, 165-178.
研究了影响图像记忆的内在和外在因素之间的相互作用。首先,记忆性的内在差异比以前记录的更细微。
其次,测试两个外在因素:(1)图像上下文和观察者行为。基于先前的发现——与上下文有关的图像可以更好地被记住,提出了图像独特性的信息论模型。该模型可以自动预测背景的变化如何改变自然图像的记忆性。(2)研究了观察者在记忆图像时所看的地方。事实证明,眼动提供了额外的信息,可以在每次试验的基础上预测一幅图像是否会被记住。
Modifying Memorability
Khosla, A., Bainbridge, W. A., Torralba, A., & Oliva, A. (2013). Modifying the memorability of face photographs. In Proceedings of the IEEE International Conference on Computer Vision (pp. 3200-3207).
提供了一种方法(基于AAMs),可以在保持个人身份和其他面部特征(例如年龄,吸引力和情感强度)不变的同时,修改个人面部图像的记忆性。
Khosla, A., Xiao, J., Isola, P., Torralba, A., & Oliva, A. (2012). Image memorability and visual inception. In SIGGRAPH Asia 2012 Technical Briefs (pp. 1-4).
讨论了通过识别图像区域的记忆性来修改图像的记忆性的可能性。此外,研究介绍并提供视觉启动现象的证据(图1):我们能让人们相信他们看到了他们没有看到的图像吗?
修改图像记忆性得两个主要步骤:(1)识别不同图像区域的记忆性;(2)修改适当的图像区域,根据要求(例如增加或减少记忆性)、延展性(即图像中应该保持不变的比例,是否应该添加新对象)或图像蒙版(即指定不应该修改的区域)。