全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210323060.1 (22)申请日 2022.03.29 (71)申请人 上海商汤科技 开发有限公司 地址 201306 上海市中国 (上海) 自由贸易 试验区临港新片区环湖西二路888号C 楼 (72)发明人 江心雨 田茂清 刘建博 伊帅  (74)专利代理 机构 北京中知恒瑞知识产权代理 事务所(普通 合伙) 11889 专利代理师 吴迪 (51)Int.Cl. G06V 10/25(2022.01) G06V 10/44(2022.01) G06V 10/56(2022.01) G06V 10/774(2022.01)G06V 10/82(2022.01) (54)发明名称 一种目标检测方法、 装置、 电子设备及存储 介质 (57)摘要 本公开提供了一种目标检测方法、 装置、 电 子设备及存储介质, 其中, 该方法包括: 获取待检 测图像; 对待检测图像进行特征提取, 得到待检 测图像的图像特征; 基于图像特征对待检测图像 进行目标检测, 得到针对待检测图像的初始对象 检测框; 基于图像特征对初始对象检测框进行修 正, 得到修正对象检测框, 并基于图像特征对修 正对象检测框进行目标类别检测, 确定修正对象 检测框所指示目标对象 的类别信息。 本公开可以 基于图像特征进行检测框的修正, 修正得到的检 测框能够更好的逼近目标对象所处的图像坐标 范围, 从而提升后续进行定位的准确度, 在定位 的准确度比较高的情况下, 后续进行类别检测的 准确度也得以提升 。 权利要求书3页 说明书12页 附图2页 CN 114627284 A 2022.06.14 CN 114627284 A 1.一种目标检测方法, 其特 征在于, 包括: 获取待检测图像; 对所述待检测图像进行 特征提取, 得到所述待检测图像的图像特 征; 基于所述图像特征对所述待检测图像进行目标检测, 得到针对所述待检测图像的初始 对象检测框; 基于所述图像特征对所述初始对象检测框进行修正, 得到修正对象检测框, 并基于所 述图像特征对所述修正对象检测框进 行目标类别检测, 确定所述修正对象检测框所指示目 标对象的类别 信息。 2.根据权利要求1所述的方法, 其特 征在于, 所述方法通过目标检测网络实现。 3.根据权利要求2所述的方法, 其特征在于, 所述目标检测网络包括预先训练好的回归 层, 所述基于所述图像特 征对所述初始对象检测框进行修 正, 得到修 正对象检测框, 包括: 从所述图像特 征中选取与所述初始对象检测框对应的第一目标图像特 征; 利用预先训练好的回归层对所述第 一目标图像特征进行偏移量预测, 确定所述初始对 象检测框对应的坐标偏移量; 基于所述初始对象检测框对应的坐标偏移量对所述目标检测框进行修正, 得到修正对 象检测框 。 4.根据权利要求3所述的方法, 其特征在于, 所述目标检测网络还包括第 一特征特征解 耦层, 所述第一特征解耦层与所述回归层连接; 所述利用预先训练好的回归层对所述第一 目标图像特 征进行偏移量预测, 确定所述初始对象检测框对应的坐标偏移量, 包括: 通过所述第一特征解耦层学习得到的针对每个特征通道的第一注意力权重对所述第 一目标图像特 征进行解耦操作, 得到解耦后的第一目标图像特 征; 利用预先训练好的回归层对所述解耦后的第 一目标图像特征进行偏移量预测, 确定所 述初始对象检测框对应的坐标偏移量。 5.根据权利要求2至4任一所述的方法, 其特征在于, 所述目标检测网络包括预先训练 好的分类层, 所述基于所述图像特征对所述修正对 象检测框进行目标类别检测, 确定所述 修正对象检测框所指示目标对象的类别 信息, 包括: 从所述图像特 征中选取与所述 修正对象检测框对应的第二目标图像特 征; 利用预先训练好的分类层对所述第 二目标图像特征进行目标类别检测, 确定所述修正 目标对象检测所指示目标对象的类别 信息。 6.根据权利要求5所述的方法, 其特征在于, 所述目标检测网络还包括第二特征解耦 层, 所述第二特征解耦层与所述分类层连接; 所述利用预先训练好的分类层对所述第二 目 标图像特征进行目标类别检测, 确定所述修正 目标对象检测所指示 目标对象的类别信息, 包括: 通过所述第二特征解耦层学习得到的针对每个特征通道的第二注意力权重对所述第 二目标图像特 征进行解耦操作, 得到解耦后的第二目标图像特 征; 利用预先训练好的分类层对所述解耦后的第 二目标图像特征进行目标类别检测, 确定 所述修正目标对象检测所指示目标对象的类别 信息。 7.根据权利要求2至6任一所述的方法, 其特征在于, 按照如下步骤训练所述目标检测 网络:权 利 要 求 书 1/3 页 2 CN 114627284 A 2获取图像样本, 以及针对所述图像样本中的目标对象的类别标注结果; 基于所述目标检测网络包括的特征提取层对所述待检测图像进行特征提取, 得到所述 图像样本的图像样本特征, 并基于所述图像样本特征对所述图像样本进行目标检测, 得到 针对所述图像样本的初始样本对象检测框; 从所述图像样本特征中选取与所述初始样本对象检测框对应的第一目标图像样本特 征, 并利用所述目标检测网络包括的回归层对所述第一目标图像样本特征进行偏移量预 测, 得到所述回归层输出的坐标偏移量; 基于所述坐标偏移量以及所述初始样本对象检测框, 确定修正样本对象检测框; 以及, 从所述图像样本特征中选取与所述修正样本对象检测框对应的第二目标图像样本特征, 并 利用所述目标检测网络包括的分类层对所述第二目标图像样本特征进 行目标类别检测, 得 到所述分类层输出的预测结果; 在所述分类层输出的预测结果与针对所述图像样本中的目标对象的类别标注结果不 匹配的情况下, 对所述目标检测网络包括的特征提取层、 回归层、 分类层中至少一者的网络 参数值进行调整, 直至 达到网络迭代截止条件。 8.根据权利要求7所述的方法, 其特征在于, 所述目标检测网络还包括与所述 回归层连 接的第一特 征解耦层、 以及与所述分类层连接的第二特 征解耦层; 所述利用所述目标检测网络包括的回归层对所述第一目标图像样本特征进行偏移量 预测, 得到所述回归层输出的坐标偏移量, 包括: 将所述第一目标图像样本特征输入至所述第 一特征解耦层, 得到所述第 一特征解耦层 输出的针对每 个特征通道的第一注意力权 重; 将所述第一目标图像样本特征以及所述第一注意力权重的第一乘积结果输入到所述 目标检测网络包括的回归层, 得到所述回归层输出的坐标偏移量; 所述利用所述目标检测网络包括的分类层对所述第二目标图像样本特征进行目标类 别检测, 得到所述分类层输出的预测结果, 包括: 将所述第二目标图像样本特征输入至所述第 二特征解耦层, 得到所述第 二特征解耦层 输出的针对每 个特征通道的第二注意力权 重; 将所述第二目标图像样本特征以及所述第二注意力权重的第二乘积结果输入到所述 目标检测网络包括的分类层, 得到所述分类层输出的预测结果。 9.根据权利要求8所述的方法, 其特征在于, 所述第 一特征解耦层和所述第 二特征解耦 层为结构相同的特征解耦层, 所述特征解耦层 包括依次连接的池化层、 第一仿射变换层、 激 活层以及第二仿射变换层。 10.一种目标检测装置, 其特 征在于, 包括: 获取模块, 用于获取待检测图像; 提取模块, 用于对所述待检测图像进行 特征提取, 得到所述待检测图像的图像特 征; 第一检测模块, 用于基于所述图像特征对所述待检测图像进行目标检测, 得到针对所 述待检测图像的初始对象检测框; 第二检测模块, 用于基于所述图像特征对所述初始对象检测框进行修正, 得到修正对 象检测框, 并基于所述图像特征对所述修正对 象检测框进行目标类别检测, 确定所述修正 对象检测框所指示目标对象的类别 信息。权 利 要 求 书 2/3 页 3 CN 114627284 A 3

PDF文档 专利 一种目标检测方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种目标检测方法、装置、电子设备及存储介质 第 1 页 专利 一种目标检测方法、装置、电子设备及存储介质 第 2 页 专利 一种目标检测方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。