vlad
局部聚合向量(vector of locally Aggregated Descriptors,VLAD)
一种编码方法,广泛用于基于音频的人脸识别、动态场景识别、头部姿态分类等。
(1) 欧式空间的VLAD:
具有非常高的辨别能力
仅利用常规的VLAD能够使用初始向量的加法和减法。
常规的欧式空间上的VLAD:
分 给定一个局部描述子集合,假设他们是高斯混合模型
和VLAD有关的只有关于均值的梯度部分,可以写成下面形式:
(1)
在VLAD中,输入空间被K个码本划分成K部分(给定码书C)
1.通过KDtree找到与x最近的码本赋值给u.
2.计算每个区域(共K个区域的累计残差)
(2)
VLAD框架就是FV算法的一个简化版本。(VLAD是FV的一个特例)
从(1)和(2)中我们可以看出,VLAD的特点:
1) VLAD利用hard assignment scheme(硬分配方法)
2) VLAD混合部分的协方差矩阵是对角的,而且是固定的。
(2)扩展到黎曼流形上
给定局部描述子
相关阅读
1.1 vlad基础概念 VLAD是vector of locally aggregated descriptors的简称,是由Jegou et al.在2010年提出,其核心思想是aggregate