工作原理:
使用 rgb Histogram 计算特征向量,并利用 lsh 建立索引,具体流程如下:
1. 特征生成
2. 索引建立
lsh 原理简介:
我们通常认为,在高纬度相邻的两个物体,投影到低纬度后通常也相邻。而高维不相邻的,投影到低维有较大概率不相邻,如下图所示
上面四个点在球面空间上(高维),通过不同角度的平面投影得到 a、b 两图(低维)。
我们将高维的图片特征投影到低维,并在低维空间上以间距 W 进行切分后放入hash桶中。如果要找相似图片,那么只需要将目标图片的特征向量拿来投影,看它能落入哪个hash桶中,那么该hash桶中所有图片就可以认为是目标图片的相似图片。为了增加可信度,可以增加投影的的数量。