全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210595354.X (22)申请日 2022.05.29 (71)申请人 北京工业大 学 地址 100124 北京市朝阳区平乐园10 0号 (72)发明人 王波涛 宋宝玉  (74)专利代理 机构 北京思海天达知识产权代理 有限公司 1 1203 专利代理师 刘萍 (51)Int.Cl. G06V 20/52(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种改进的核相关滤波跟踪算法 (57)摘要 一种改进的核相关滤波跟踪算法涉及图像 跟踪领域。 本发明引入CN颜色特征并进行特征融 合, 增强目标的特征表达能力; 其次引入尺度池 并进行划分, 设计了新的尺度搜索策略; 通过平 均峰值相关能量作为跟踪置信度指标区分目标 是否处于异常状态, 判断模型是否更新, 再使用 旁瓣检测对状态细分, 判断是否启用重检测步 骤。 本发明对核相关滤波跟踪算法进行全方面的 改进, 使用C++算法编写, 建立了基于视觉的改进 核相关滤波跟踪算法, 以解决旧算法目标尺度固 定与易产生模型漂移的问题。 权利要求书2页 说明书4页 附图3页 CN 115019249 A 2022.09.06 CN 115019249 A 1.一种改进的核相关滤波跟踪算法, 其特 征在于: (1)CN特征融合; 核相关滤波跟踪算法使用单目摄像头采取彩色图像, 通过选定任意目标进行FHOG特征 提取; FHOG在划分区间时, 分别进 行了无符号划分与有符号划分, FH OG特征划定每个细胞元 为4×4像素, 每个细胞元能分别生 成一个9维的无符号特征与18维的有符号特征; FOHG特征 再将9维无符号特征来与其周围8个细胞元进行归一化与截断, 归一化与截断为一个过程, 即当前细胞元分别与其左上、 右上、 右下、 左下包含当前细胞元的四个细胞元的特征进行叠 加, 形成一个4 ×9的特征矩阵; 后将4 ×9的特征矩阵每行每列分别相加, 得到4+9=13维特 征向量, 最后形成13+18=31 维特征向量; 通过将CN特征与FHOG特征进行特征向量的拼接, 以求取更明显的目标特征表达; 在此 过程中, 对FHOG特征进行进一步改进, 即不再使用9维的无符号特征向量, 而仅使用18维的 有符号特征向量, 将18维有符号特征来进行归一化与截断, 形成一个4 ×18的特征矩阵, 后 将4×18的特征矩阵每行每列分别相加, 得到4+18=22维特征向量最后再将其与11维的CN 特征向量进行拼接, 最终形成4+18+11=33维的特征向量; 拼接的方式为 11维的CN特征向量 直接连接在2 2维的FHO G特征向量尾部形成一个特 征向量; (2)尺度自适应; 目标尺度大部分落在[0.9, 1)、 (1, 1.1]两个区间, 超出[0.9, 1.1]区间的尺度绝大部分 不超过原尺度的1.25倍, 最小尺度则不低于原尺度的0.75倍; 提供了四个尺度区间, 分别为 [0.75, 0.9)、 [0.9, 1)、 (1, 1.1]、 (1.1, 1.25], 并对这四个区间进行了划分; 尺度落在[0.9, 1)、 (1, 1.1]这两个区间的概率最大, 给每个区间划分为4个尺度; 尺度落在另外两区间的概 率较小, 给每个区间划分了3个尺度; 最终形成3+4+1+3+4=15维的尺度池S={0.75, 0.8, 0.85, 0.9, 0.925, 0.9 5, 0.975, 1, 1.025, 1.05, 1.075, 1.1, 1.15, 1.2, 1.25}尺度池由公式表 示, 式中m=7, n =4,‑m=‑7,‑n=‑4; S={t‑m,…, t‑n‑1, t‑n,…, t‑1, t, t1…, tn, tn+1,…, tm} 目标在视频序列中尺度的变化具有短时一致性, 即在一定的帧数内目标尺度会向同一 个方向变化, 记录此信息起到 辅助选取尺度的作用; 具体的方法为: 选取10帧为一个周期, 分别记录10帧内每帧目标尺度的变化情况; 为每一帧定义一个 变量myScale,为myScale定义不同的数值来表示尺度的变化情况: myScale=(2: 尺度变大, 0: 尺度不变, ‑2: 尺度变小); 同时维护一个变量mySum用来统计每10帧myScale的和; 式中i 代表当前帧数, N代 表视频总帧数; mySum的值需在尺度开始搜索之前计算出来; mySum的值代表不同的含义, 其和大于0代表近10帧中出现目标尺度变大的情况多, 当 前帧目标尺度变大的概率越 大, 优先搜索; 若mySum小于0, 代表当前帧目标尺度变小的概率 较大; 当mySum等于0时, 目标的尺度可能一直未发生变化, 也可能表 示在近10帧中出现尺度 变大与变小的帧数相等; 结合当前帧尺度变化的概 率, 实现尺度的预测, 降低计算 量; 先确定尺寸变化方向, 再验证尺寸是否突变, 最后确定最佳尺寸; 具体表述为: 首先分 别计算f(t)、 f(t1)、 f(t‑1)的值, f()表示计算响应,f(t)代表尺度池s中尺度为1时的响应权 利 要 求 书 1/2 页 2 CN 115019249 A 2值, f(t1)代表尺度池s中尺度为1.025时的响应值, f(t‑1)代表尺度池s中尺度为0.975时的 响应值,t的下 标代表尺度池中对应尺度值; 更 具体表示 为: 步骤1: f(t)>f(t1)且f(t)>f(t‑1)此时确定目标尺寸没有发生变换 步骤2: 当f(t1)>f(t)时, 确定目标尺寸变大; 此时再计算f(tn)的值并比较f(t1)与f (tn),若f(t1)>f(tn)则代表目标最佳尺寸在(1, 1.1], 从t2升序搜索; 若f( t1)<f(tn)且f (tn)‑f(t1)>r(r取0.2),则代表目标尺寸存在变 化, 此时从tn+1升序搜索获得最 佳尺寸, 反之 则表明最佳尺寸在(1, 1.1]区间内并距离tn较近, 从tn‑1降序搜索快速求得最佳尺寸; 步骤3: 当f(t‑1)>f(t)时, 确定目标尺寸变小; (3)模型更新策略与重检测机制; 模型更新策略采用每一帧皆线性加权的方式, 公式如 下; 其中а代表更新后的模型, аt‑1 代表历史模板, аt代表当前帧模型, η为学习因子, η=0.012; 学习因子是模型更新过程中最 重要的参数, 学习因子的值越大, 模型中历史信息越少; α =(1‑η )αt‑1+ η αt 通过判断响应图的波动情况确定目标跟踪状态的好坏, 使用APCE作为判断响应图的波 动情况, Fmax, Fmin, 表示响应矩阵中的最大值与最小值, Fw,h表示响应矩阵中(w,h)位置对应 的响度值, 当APCE的值大于等于其历史平均值的0.7倍时, 代表响应图的波动较小, 此时更 新跟踪模 型, 即η值不变; 而当AP CE的值小于其历史平均值的0.7倍时, 代表响应图的波动较 大, 表明目标 可能被遮挡或者丢失, 此时需要 进行遮挡与丢失的判断; 使用旁瓣峰检测区分遮挡与丢 失状态, Fmax表示响应最大值, Fsp表示局部最大值即旁瓣 峰, R代表响应矩阵, k代表惩罚因子, k取0.4; 若响应矩阵中存在局 部最大值且该值大于等 于Fmax乘以比例k时, 认 为目标丢失; 当目标丢失, 需进 行重检测; 否则目标被遮挡, 模型不更 新, 即 η置为1; 通过重检测来重新确定目标位置, 以丢失的目标框为中心, 扩大采样区域, 扩大后的采 样区域为算法原 来采样区域的两倍, 并通过双线性插值的方式将其尺度变换到初始采样区 域的大小后计算其响应值f(tnew), 得到最大响应对应的坐标后再通过双 线性差值的方式进 行反变换, 即得到最终位置; 模型更新策略与重检测机制如下表示: 当APCE大于其历史平均 值的0.7倍时, 此 时断定跟踪状态良好, 模型更新; 反之, 此 时再 判断是否存在Fsp并且该值大于Fmax一定比例k, 若成立, 则认为目标被遮挡, 模型不更新, 若 不成立, 则认为目标丢失; 当判定为丢失状态 时, 开启重检测模块, 计算重检测后最大响应 值f(tnew)并与当前响应值f(t)比较, 如果f(tnew)>f(t), 代表重检测到目标, 此时将新模型 纳入更新, 反 之产生误判, 模型不予更新。权 利 要 求 书 2/2 页 3 CN 115019249 A 3

PDF文档 专利 一种改进的核相关滤波跟踪算法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种改进的核相关滤波跟踪算法 第 1 页 专利 一种改进的核相关滤波跟踪算法 第 2 页 专利 一种改进的核相关滤波跟踪算法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。