专利一种注意力引导的伪装目标检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210620670.8 (22)申请日 2022.06.02 (71)申请人杭州电子科技大学地址 310018 浙江省杭州市钱塘新区白杨街道2号大街1 158号申请人中电数据服务有限公司 (72)发明人张继勇　姚嘉琦　周晓飞　李世锋　周振　何帆　 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06N 3/04(2006.01) (54)发明名称一种注意力引导的伪装目标检测方法 (57)摘要本发明公开一种注意力引导的伪装目标检测方法，包括如下步骤： S1、通过深度特征提取网络对初始伪装目标区域特征图进行特征提取； S2、将提取的特征进行搜索； S3、通过注意力机制增强进一步增强特征； S4、通过识别模块获得最终的伪装目标区域特征图； S5、最终的伪装目标区域特征图通过解码模块获取最终的伪装目标区域预测图。该方法将注意力机制引入到图像处理中，同时利用多种注意力机制相互配合，其中搜索注意力机制是以sigmoid函数激活后的初始伪装目标区域预测图作为引导，对经过空间注意力机制与通道注意力机制增强特征后的中层特征做进一步的增强，同时应用感受野模块对特征进行合并融合，能有效利用多种注意力机制的配合来实现对伪装目标的检测。权利要求书2页说明书5页附图2页 CN 115019140 A 2022.09.06 CN 115019140 A 1.一种注意力引导的伪装目标检测方法，其特征在于，包括如下步骤： S1、通过深度特征提取网络对初始伪装目标区域特征图进行特征提取； S2、将提取的特征进行搜索，并通过解码模块生成初始伪装目标区域预测图； S3、通过注意力机制增强进一步增强特征； S4、通过识别模块获得最终的伪装目标区域特征图； S5、通过解码模块获取最终的伪装目标区域预测图。 2.根据权利要求1所述的注意力引导的伪装目标检测方法，其特征在于，所述深度特征提取网络为ResNet ‑50网络。 3.根据权利要求1所述的注意力引导的伪装目标检测方法，其特征在于，所述深度特征提取网络的方法为：提取{x0,x1,x2,x3,x4}五层特征，分别表示最低层特征、低层特征、中层特征、高层特征和最高层特征，其中{x0,x1 }所表示的最低层特征和低层特征属于视觉层特征，所述视觉层特征包括轮廓、边缘、纹理和形状空间信息， {x2 }所表示的中层特征属于对象层特征，包含了图像属性特征状态信息， {x3,x4}所表示的高层特征和最高层特征属于概念层特征，包含了图像表达出的最接近人类理解的东西，即语义信息。 4.根据权利要求3所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S2的方法为：将提取的{x1,x2,x3,x4}四组特征分别通过模仿人类视觉系统的RF模块进行拼接融合，并整体输入进ReLU函数以获得特征rfk，再将特征rfk传递到解码模块，生成初始伪装目标区域预测图。 5.根据权利要求4所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S3的方法为：首先将之前提取到的中层特征x2依次输入到通道注意力模块与空间注意力模块，再将其输出结果rfk2与sigmoid函数激活后的初始伪装目标区域预测图一起输入到搜索注意力模块中进一步增强特征。 6.根据权利要求5所述的注意力引导的伪装目标检测方法，其特征在于，所述搜索注意力模块的特征增强方法为：将sigmoid函数激活后的初始伪装目标区域预测图作为注意力权重，与rfk2逐元素相乘，对rfk2进一步增强特征，得到特征rfk3。 7.根据权利要求5所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S3 中，通过通道注意力模块聚合空间信息，其具体方法为：使用平均池化和最大池化操作，得到两个通道上下文描述符，代表平均池化和最大池化特征，然后将这两个通道描述符传递到共享网络中，以此产生通道注意力映射MC∈RC*1*1,包含隐藏层的多层感知机组成了共享网络，隐藏的激活大小设置为其中r是约简比率，共享网络应用到每个描述符后再进行逐元素求和，将输出特征向量合并。 8.根据权利要求5所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S3 中，通过空间注意力模块对通道注意力进行补充，其具体方法为：首先沿着通道轴应用最大池化和平均池化，再通过把它们连接合并，得到特征描述符,然后再在特征描述符上应用卷积层，生成空间注意力图MS∈RH*W,用来表示在何处进行强调或抑制,具体操作是通过两个池化操作，聚合特征图的通道信息，生成跨通道的平均池化特征映射和跨通道的最大池化特征映射,再把上述映射连接起来并通过卷积操作，产生一个二维的空间注意力图。 9.根据权利要求6所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S4权　利　要　求　书 1/2 页 2 CN 115019140 A 2中，识别模块的识别方法为：将rfk3通过 1x1、 3x3卷积运算后，生成高层特征图x3 ′与x4′，同时通过感受野对{rfk3,x3 ′,x4′}三张特征图合并特征得到伪装目标区域特征图。 10.根据权利要求9所述的注意力引导的伪装目标检测方法，其特征在于，所述步骤S2 和步骤S5中的解码模块为同一解码模块，其解码方法为：将步骤S2和步骤S4得到的特征视为特征并逐元素相乘，缩小相邻特征差距， k∈[m, …,M]，当k＝M时，当k＜M 时，其为：其中UP(·)是以2j‑k为倍率的上采样函数， Bconv( ·)是卷积与ReLU激活函数， k∈ [m,…,M‑1]。权　利　要　求　书 2/2 页 3 CN 115019140 A 3

专利 一种注意力引导的伪装目标检测方法

专利一种注意力引导的伪装目标检测方法