全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211208332.X (22)申请日 2022.09.30 (71)申请人 长江大学 地址 434023 湖北省荆州市荆州区南环路1 号 (72)发明人 王同喜 许子民 肖一烽 向华  何黎霞  (74)专利代理 机构 北京知艺互联知识产权代理 有限公司 16137 专利代理师 孙一方 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/52(2022.01) G06V 40/16(2022.01) G06T 7/246(2017.01) (54)发明名称 一种多模态目标重识别方法 (57)摘要 本发明公开了一种多模态目标重识别方法, 通过目标检测模型、 目标跟踪模型、 行为识别模 型、 属性识别模 型以及人脸检测模 型对监控视频 数据库SL进行转换和识别形成多模态目标信息 集MIS, 同时将 目标的特征信息、 属性信息、 行为 信息和时间信息关联在一起, 在目标重识别时, 当进行目标重识别时, 将目标图像输入到特征提 取模块中, 得到待检索目标的特征矩阵WTF, 再对 MIS的特征信息列进行检索, 计算MIS中各目标与 WTF之间的相似度, 确定是否存在对应目标ti, 当 不存在对应目标时, 将待检索目标的多模态信息 作为输入从中MIS检索。 采用上述结构的一种多 模态目标重识别方法, 可 以对海量的视频、 图像 资源进行标准化处理, 降低视频存储的资源消 耗, 有效提高检索效率, 降低人力消耗。 权利要求书1页 说明书3页 附图2页 CN 115527147 A 2022.12.27 CN 115527147 A 1.一种多模态目标重识别方法, 其特 征在于, 具体步骤如下: 步骤S1: 通过多个摄像头采集不同场景下的监控视频, 得到监控视频数据库SL, 利用SL 训练目标检测模型、 目标跟踪模型、 行为识别模型、 属性识别模型以及人脸检测模型; 步骤S2: 通过目标检测模型得到目标序列O={o1,o2,...,on}, 同时对检测到的目标oi通 过目标跟踪模型进行跟踪, 直到目标oi超出摄像头的监控范围, 得到目标oi出现的时间范围 得到所有目标在监控视频中出现的时间序列T={t1,t2,...,tn}; 步骤S3: 通过 行为识别模型 得到监控视频中各个目标的行为序列B={b1,b2,...,bn}; 步骤S4: 将步骤S2中的目标序列O输入到属性识别 模型中得到各个目标的属性序列A= {a1,a2,...,an}; 步骤S5: 通过特征提取模块将O中各个目标从图像转换成特征矩阵F={f1,f2,...,fn}, 并将每个目标的特征信息、 属性信息、 行为信息和时间信息关联在一起, 形成目标的多模态 信息集MIS={I1,I2,...,In}, 其中Ii={fi,a2bi,ti}, 当目标为人时, 检测目标通过人脸检测 模型得到面部特 征FF={ffi,ff2,...,ffi}, Ii={fi,a2bi,ffi,ti}; 步骤S6: 当进行目标重识别时, 将目标图像输入到特征提取模块中, 得到待检索目标的 特征矩阵WTF, 再对MIS的特征信息列进行检索, 计算MIS中各目标与WTF之间的相似度, 确定 是否存在对应目标ti, 当不存在对应目标时, 将待检索目标的多模态信息作为输入从中MIS 检索。 2.根据权利要求1所述的一种多模态目标重识别方法, 其特征在于: 在步骤S2中, 在目 标检测过程中, 对于模糊度高于设定阀值的目标不加入目标序列中, 目标检测模型将场景 中检测到的目标裁 剪出来形成一个图像库, 并将图像库转换为特 征矩阵进行存 储。 3.根据权利要求2所述的一种多模态目标重识别方法, 其特征在于: 在步骤S6中, 在进 行特征提取前, 当图像的模糊度高于设定值时, 通过图像的多模态信息进行作为输入从中 MIS检索, 当图像的模糊度小于等于设定值时, 进行 特征提取, 得到目标的特 征矩阵WTF。 4.根据权利要求3所述的一种 多模态目标重识别方法, 其特征在于: 所述多模态信 息为 目标属性信息或行为信息或其组合。权 利 要 求 书 1/1 页 2 CN 115527147 A 2一种多模 态目标重识别方 法 技术领域 [0001]本发明涉及安防监控技 术领域, 尤其是 涉及一种多模态目标重识别方法。 背景技术 [0002]计算机视觉是一门研究如何使机器 “看”的科学, 更进一步的说, 就是指用摄影机 和电脑代替人眼对目标进 行检测、 识别和跟踪等机器视觉, 并进一步做图形 处理, 用电脑处 理成为更适 合人眼观察或传送给仪器 检测的图像。 [0003]在智能安防、 视频监控等领域, 目前的视频监控技术主要以人工分析为主, 这就造 成了消耗大、 效率低的问题, 因此, 实现智能视频监控已是迫切需求。 智能视频监控利用模 式识别和计算机视觉技术对海量监控视频数据进行处理和分析时, 资源消 耗大, 检索效率 低。 发明内容 [0004]本发明的目的是提供一种多模态目标重识别方法, 可以对海量的视频、 图像资源 进行标准化处理, 降低视频存 储的资源消耗, 有效提高检索效率, 降低人力消耗。 [0005]为实现上述目的, 本发明提供了一种多模态目标重识别方法, 具体步骤如下: [0006]步骤S1: 通过多个摄像头采集不同场景下的监控视频, 得到监控视频数据库SL, 利 用SL训练目标检测模型、 目标跟踪模型、 行为识别模型、 属性识别模型以及人脸检测模型; [0007]步骤S2: 通过目标检测模型得到目标序列O={o1,o2,...,on}, 同时对检测到的目 标oi通过目标跟踪模 型进行跟踪, 直到目标oi超出摄像头的监控范围, 得到目标oi出现的时 间范围 得到所有目标在监控视频中出现的时间序列T={t1,t2,...,tn}; [0008]步骤S3: 通过行为识别模型得到监控视频中各个目标的行为序列B={b1,b2,..., bn}; [0009]步骤S4: 将步骤S2中的目标序列O输入到属性识别模型中得到各个目标的属性序 列A={a1,a2,...,an}; [0010]步骤S5: 通过特征提取模 块将O中各个目标从图像转换 成特征矩阵F={f1,f2,..., fn}, 并将每个目标的特征信息、 属性信息、 行为信息和时间信息关联在 一起, 形成目标的多 模态信息 集MIS={I1,I2,...,In}, 其中Ii={fi,a2bi,ti}, 当目标为人时, 检测目标通过人脸 检测模型 得到面部特 征FF={ffi,ff2,...,ffi}, Ii={fi,a2bi,ffi,ti}; [0011]步骤S6: 当进行目标重识别时, 将目标图像输入到特征提取模块中, 得到待检索目 标的特征矩阵WTF, 再对MIS的特征信息列进行检索, 计算MIS中各目标与WTF之间的相似度, 确定是否存在对应目标ti, 当不存在对应目标时, 将待检索目标的多模态信息作为输入从 中MIS检索。 [0012]优选的, 在步骤S2中, 在目标检测过程中, 对于模糊度高于设定阀值的目标不加入 目标序列中, 目标检测模型将场景中检测到的目标裁剪出来形成一个图像库, 并将图像库 转换为特 征矩阵进行存 储。说 明 书 1/3 页 3 CN 115527147 A 3

PDF文档 专利 一种多模态目标重识别方法

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多模态目标重识别方法 第 1 页 专利 一种多模态目标重识别方法 第 2 页 专利 一种多模态目标重识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:08:51上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。