(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210620670.8
(22)申请日 2022.06.02
(71)申请人 杭州电子科技大 学
地址 310018 浙江省杭州市钱塘新区白杨
街道2号大街1 158号
申请人 中电数据服 务有限公司
(72)发明人 张继勇 姚嘉琦 周晓飞 李世锋
周振 何帆
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 10/44(2022.01)
G06N 3/04(2006.01)
(54)发明名称
一种注意力引导的伪装目标检测方法
(57)摘要
本发明公开一种注意力引导的伪装目标检
测方法, 包括如下步骤: S1、 通过深度特征提取网
络对初始伪装目标区域特征图进行特征提取;
S2、 将提取的特征进行搜索; S3、 通过注意力机制
增强进一步增强特征; S4、 通过识别模块获得最
终的伪装目标区域特征图; S5、 最终的伪装目标
区域特征图通过解码模块获取最终的伪装目标
区域预测图。 该方法将注意力机制引入到图像处
理中, 同时利用多种注意力机制相互配合, 其中
搜索注意力机制是以sigmoid函数激活后的初始
伪装目标区域预测图作为引导, 对 经过空间注意
力机制与通道注意力机制增强特征后的中层特
征做进一步的增强, 同时应用感受野模块对特征
进行合并融合, 能有效利用多种注 意力机制的配
合来实现对伪装目标的检测。
权利要求书2页 说明书5页 附图2页
CN 115019140 A
2022.09.06
CN 115019140 A
1.一种注意力引导的伪装目标检测方法, 其特 征在于, 包括如下步骤:
S1、 通过深度特 征提取网络对初始伪装目标区域特 征图进行 特征提取;
S2、 将提取的特 征进行搜索, 并通过解码模块 生成初始伪装目标区域预测图;
S3、 通过注意力机制增强进一 步增强特 征;
S4、 通过识别模块获得最终的伪装目标区域特 征图;
S5、 通过解码模块获取最终的伪装目标区域预测图。
2.根据权利要求1所述的注意力引导的伪装目标检测方法, 其特征在于, 所述深度 特征
提取网络为ResNet ‑50网络。
3.根据权利要求1所述的注意力引导的伪装目标检测方法, 其特征在于, 所述深度 特征
提取网络的方法为: 提取{x0,x1,x2,x3,x4}五层特征, 分别表示最低层特征、 低层特征、 中
层特征、 高层特征和最高层特征, 其中{x0,x1 }所表示的最低层特征和低层特征属于视觉层
特征, 所述视觉层特征包括轮廓、 边缘、 纹理和形状空间信息, {x2 }所表示的中层特征属于
对象层特征, 包含了图像属性特征状态信息, {x3,x4}所表 示的高层特征和最高层特征属于
概念层特 征, 包含了图像表达出的最接 近人类理解的东西, 即语义信息 。
4.根据权利要求3所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S2的
方法为: 将提取的{x1,x2,x3,x4}四组特征分别 通过模仿人类视觉系统的RF模块进行拼接
融合, 并整体输入进ReLU函数以获得特征rfk, 再将特征rfk传递到解码模块, 生 成初始伪装
目标区域预测图。
5.根据权利要求4所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S3的
方法为: 首先将之前提取到的中层特征x2依 次输入到通道注意力模块与空间注意力模块,
再将其输出结果rfk2与sigmoid函数激活后的初始伪装目标区域预测图一起输入到搜索注
意力模块中进一 步增强特 征。
6.根据权利要求5所述的注意力引导的伪装目标检测方法, 其特征在于, 所述搜索注意
力模块的特征增强方法为: 将sigmoid函数激活后的初始伪装目标区域预测图作为注意力
权重, 与rfk2逐 元素相乘, 对rfk2进一 步增强特 征, 得到特 征rfk3。
7.根据权利要求5所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S3
中, 通过通道注意力模块聚合空间信息, 其具体方法为: 使用平均池化和最大池化操作, 得
到两个通道上下文描述符, 代表平均池化和最大池化特征, 然后将这两个通道描述符传递
到共享网络中, 以此产生通道注意力映射MC∈RC*1*1,包含隐藏层的多层感知机组成了共享
网络, 隐藏的激活大小设置为
其中r是约简比率, 共享网络应用到每个描述符后再进
行逐元素求和, 将输出 特征向量合并。
8.根据权利要求5所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S3
中, 通过空间注意力模块对通道注意力进 行补充, 其具体方法为: 首先沿着通道轴应用最大
池化和平均池化, 再通过把它们连接合并, 得到特征描述符,然后再在特征描述符上应用卷
积层, 生成空间注意力图MS∈RH*W,用来表示在何处进行强调或抑制,具体操作是通过两个
池化操作, 聚合特征图的通道信息, 生成跨通道的平均池化特征映射和 跨通道的最大池化
特征映射,再把上述映射连接起 来并通过 卷积操作, 产生 一个二维的空间注意力图。
9.根据权利要求6所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S4权 利 要 求 书 1/2 页
2
CN 115019140 A
2中, 识别模块的识别方法为: 将rfk3通过 1x1、 3x3卷积运算后, 生 成高层特征图x3 ′与x4′, 同
时通过感受野 对{rfk3,x3 ′,x4′}三张特征图合并特 征得到伪装目标区域特 征图。
10.根据权利要求9所述的注意力引导的伪装目标检测方法, 其特征在于, 所述步骤S2
和步骤S5中的解码模块为同一解码模块, 其解码方法为: 将步骤S2和步骤S4得到的特征视
为特征
并逐元素相乘, 缩小相邻特征差距, k∈[m, …,M], 当k=M时,
当k<M
时, 其为:
其中UP(·)是以2j‑k为倍率的上采样函数, Bconv( ·)是卷积与ReLU激活函数, k∈
[m,…,M‑1]。权 利 要 求 书 2/2 页
3
CN 115019140 A
3
专利 一种注意力引导的伪装目标检测方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:06:36上传分享