专利一种改进的核相关滤波跟踪算法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210595354.X (22)申请日 2022.05.29 (71)申请人北京工业大学地址 100124 北京市朝阳区平乐园10 0号 (72)发明人王波涛　宋宝玉　 (74)专利代理机构北京思海天达知识产权代理有限公司 1 1203 专利代理师刘萍 (51)Int.Cl. G06V 20/52(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称一种改进的核相关滤波跟踪算法 (57)摘要一种改进的核相关滤波跟踪算法涉及图像跟踪领域。本发明引入CN颜色特征并进行特征融合，增强目标的特征表达能力；其次引入尺度池并进行划分，设计了新的尺度搜索策略；通过平均峰值相关能量作为跟踪置信度指标区分目标是否处于异常状态，判断模型是否更新，再使用旁瓣检测对状态细分，判断是否启用重检测步骤。本发明对核相关滤波跟踪算法进行全方面的改进，使用C++算法编写，建立了基于视觉的改进核相关滤波跟踪算法，以解决旧算法目标尺度固定与易产生模型漂移的问题。权利要求书2页说明书4页附图3页 CN 115019249 A 2022.09.06 CN 115019249 A 1.一种改进的核相关滤波跟踪算法，其特征在于： (1)CN特征融合；核相关滤波跟踪算法使用单目摄像头采取彩色图像，通过选定任意目标进行FHOG特征提取； FHOG在划分区间时，分别进行了无符号划分与有符号划分， FH OG特征划定每个细胞元为4×4像素，每个细胞元能分别生成一个9维的无符号特征与18维的有符号特征； FOHG特征再将9维无符号特征来与其周围8个细胞元进行归一化与截断，归一化与截断为一个过程，即当前细胞元分别与其左上、右上、右下、左下包含当前细胞元的四个细胞元的特征进行叠加，形成一个4 ×9的特征矩阵；后将4 ×9的特征矩阵每行每列分别相加，得到4+9＝13维特征向量，最后形成13+18＝31 维特征向量；通过将CN特征与FHOG特征进行特征向量的拼接，以求取更明显的目标特征表达；在此过程中，对FHOG特征进行进一步改进，即不再使用9维的无符号特征向量，而仅使用18维的有符号特征向量，将18维有符号特征来进行归一化与截断，形成一个4 ×18的特征矩阵，后将4×18的特征矩阵每行每列分别相加，得到4+18＝22维特征向量最后再将其与11维的CN 特征向量进行拼接，最终形成4+18+11＝33维的特征向量；拼接的方式为 11维的CN特征向量直接连接在2 2维的FHO G特征向量尾部形成一个特征向量； (2)尺度自适应；目标尺度大部分落在[0.9， 1)、 (1， 1.1]两个区间，超出[0.9， 1.1]区间的尺度绝大部分不超过原尺度的1.25倍，最小尺度则不低于原尺度的0.75倍；提供了四个尺度区间，分别为 [0.75， 0.9)、 [0.9， 1)、 (1， 1.1]、 (1.1， 1.25]，并对这四个区间进行了划分；尺度落在[0.9， 1)、 (1， 1.1]这两个区间的概率最大，给每个区间划分为4个尺度；尺度落在另外两区间的概率较小，给每个区间划分了3个尺度；最终形成3+4+1+3+4＝15维的尺度池S＝{0.75， 0.8， 0.85， 0.9， 0.925， 0.9 5， 0.975， 1， 1.025， 1.05， 1.075， 1.1， 1.15， 1.2， 1.25}尺度池由公式表示，式中m＝7， n ＝4，‑m＝‑7，‑n＝‑4； S＝{t‑m，…， t‑n‑1， t‑n，…， t‑1， t， t1…， tn， tn+1，…， tm} 目标在视频序列中尺度的变化具有短时一致性，即在一定的帧数内目标尺度会向同一个方向变化，记录此信息起到辅助选取尺度的作用；具体的方法为：选取10帧为一个周期，分别记录10帧内每帧目标尺度的变化情况；为每一帧定义一个变量myScale,为myScale定义不同的数值来表示尺度的变化情况： myScale＝(2：尺度变大， 0：尺度不变， ‑2：尺度变小)；同时维护一个变量mySum用来统计每10帧myScale的和；式中i 代表当前帧数， N代表视频总帧数； mySum的值需在尺度开始搜索之前计算出来； mySum的值代表不同的含义，其和大于0代表近10帧中出现目标尺度变大的情况多，当前帧目标尺度变大的概率越大，优先搜索；若mySum小于0，代表当前帧目标尺度变小的概率较大；当mySum等于0时，目标的尺度可能一直未发生变化，也可能表示在近10帧中出现尺度变大与变小的帧数相等；结合当前帧尺度变化的概率，实现尺度的预测，降低计算量；先确定尺寸变化方向，再验证尺寸是否突变，最后确定最佳尺寸；具体表述为：首先分别计算f(t)、 f(t1)、 f(t‑1)的值， f()表示计算响应,f(t)代表尺度池s中尺度为1时的响应权　利　要　求　书 1/2 页 2 CN 115019249 A 2值， f(t1)代表尺度池s中尺度为1.025时的响应值， f(t‑1)代表尺度池s中尺度为0.975时的响应值,t的下标代表尺度池中对应尺度值；更具体表示为：步骤1： f(t)>f(t1)且f(t)>f(t‑1)此时确定目标尺寸没有发生变换步骤2：当f(t1)>f(t)时，确定目标尺寸变大；此时再计算f(tn)的值并比较f(t1)与f (tn),若f(t1)>f(tn)则代表目标最佳尺寸在(1， 1.1]，从t2升序搜索；若f( t1)<f(tn)且f (tn)‑f(t1)>r(r取0.2),则代表目标尺寸存在变化，此时从tn+1升序搜索获得最佳尺寸，反之则表明最佳尺寸在(1， 1.1]区间内并距离tn较近，从tn‑1降序搜索快速求得最佳尺寸；步骤3：当f(t‑1)>f(t)时，确定目标尺寸变小； (3)模型更新策略与重检测机制；模型更新策略采用每一帧皆线性加权的方式，公式如下；其中а代表更新后的模型， аt‑1 代表历史模板， аt代表当前帧模型， η为学习因子， η＝0.012；学习因子是模型更新过程中最重要的参数，学习因子的值越大，模型中历史信息越少； α ＝(1‑η )αt‑1+ η αt 通过判断响应图的波动情况确定目标跟踪状态的好坏，使用APCE作为判断响应图的波动情况， Fmax， Fmin，表示响应矩阵中的最大值与最小值， Fw,h表示响应矩阵中(w,h)位置对应的响度值，当APCE的值大于等于其历史平均值的0.7倍时，代表响应图的波动较小，此时更新跟踪模型，即η值不变；而当AP CE的值小于其历史平均值的0.7倍时，代表响应图的波动较大，表明目标可能被遮挡或者丢失，此时需要进行遮挡与丢失的判断；使用旁瓣峰检测区分遮挡与丢失状态， Fmax表示响应最大值， Fsp表示局部最大值即旁瓣峰， R代表响应矩阵， k代表惩罚因子， k取0.4；若响应矩阵中存在局部最大值且该值大于等于Fmax乘以比例k时，认为目标丢失；当目标丢失，需进行重检测；否则目标被遮挡，模型不更新，即 η置为1；通过重检测来重新确定目标位置，以丢失的目标框为中心，扩大采样区域，扩大后的采样区域为算法原来采样区域的两倍，并通过双线性插值的方式将其尺度变换到初始采样区域的大小后计算其响应值f(tnew)，得到最大响应对应的坐标后再通过双线性差值的方式进行反变换，即得到最终位置；模型更新策略与重检测机制如下表示：当APCE大于其历史平均值的0.7倍时，此时断定跟踪状态良好，模型更新；反之，此时再判断是否存在Fsp并且该值大于Fmax一定比例k，若成立，则认为目标被遮挡，模型不更新，若不成立，则认为目标丢失；当判定为丢失状态时，开启重检测模块，计算重检测后最大响应值f(tnew)并与当前响应值f(t)比较，如果f(tnew)>f(t)，代表重检测到目标，此时将新模型纳入更新，反之产生误判，模型不予更新。权　利　要　求　书 2/2 页 3 CN 115019249 A 3

专利 一种改进的核相关滤波跟踪算法

专利一种改进的核相关滤波跟踪算法