全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211032537.7 (22)申请日 2022.08.26 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区黄桷垭崇文路2 号 (72)发明人 李国权 郭豆豆 吴建 林金朝  庞宇 朱宏钰  (74)专利代理 机构 北京同恒源知识产权代理有 限公司 1 1275 专利代理师 方钟苑 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于注意力机制的X光安检图像危险物品检 测方法 (57)摘要 本发明涉及一种基于注 意力机制的X光安检 图像危险物品检测方法, 属于图像目标检测技术 领域。 该方法是在YOLOv3 ‑SPP架构上融合MSE模 块和MFGA模块, 首先将特征提取网络提取的特征 与MSE提取的通道信息融合, 得到具备通道全局 性的语义特征; 然后将M FGA模块设置在各个检测 网络分支, 有效地融合深层特征的通道及空间信 息, 使多尺度特征具备三维全局性。 本发明能有 效地增强输入特征图中用于检测危险物品的细 节信息, 提高模 型对中等目标和大目标的检测性 能。 权利要求书2页 说明书8页 附图3页 CN 115393796 A 2022.11.25 CN 115393796 A 1.一种基于注意力机制的X光安检图像危险物品检测方法, 其特征在于, 在YOLOv3 ‑SPP 架构上融合MSE模块和MFGA模块, 构建AFN网络; 其中MSE是多压缩激活, MFGA是多 融合全局 注意力, AFN是注意力融合网络; 利用所述注意力融合网络进 行X光安检图像危险物品检测, 具体包括以下步骤: S1: 输入待检测行李的X光安检图像, 经过YOLOv3 ‑SPP主干网络获得特征图后将其输入 MSE模块, 得到具 备通道全局性的语义特 征; S2: 利用SPP模块进行多尺度特征融合后再经过MSE模块, 使得融合后的局部特征和全 局特征精细化, 增强 获取的多尺度语义信息; 其中, S PP是空间金字塔池化; S3: 串联通道分支和空间分支构成MFGA模块, 并将该模块放在每一个检测分支的分类 器之前; 每一个 检测分支分别针对X光 安检图像中的小、 中、 大目标进行 预测。 2.根据权利要求1所述的X光安检图像危险物品检测方法, 其特征在于, 所述MSE模块的 具体结构为: 首先是将给定的输入映射到特征图X∈RC×H×W上, 其中H、 W、 C分别对应特征图的 高度、 宽度和通道维度, MSE模块在压缩操作中通过全局平均池化和最大池化, 将生成的特 征描述符在通道上拼接; 其次是激活操作, 全连接层通过膨胀率参数对通道进 行降维, 之后 再恢复通道维度; 最后是特征重标定, 将 激活操作后得到的C ×1×1的向量与输入 特征在通 道上进行权 重的相乘。 3.根据权利要求2所述的X光安检图像危险物品检测方法, 其特征在于, 所述MSE模块的 权重w计算公式为: w=σ(gex{w1,w2}([gavg(X); gmax(X)])) 令f=[gavg(X); gmax(X)], 得到gex{w1,w2}(f)=w2ReLU(w1f), 其中, gavg(·)、 gmax(·)分 别表示全局平均池化和最大池化, σ 表示激活函数, w1表示(C/r) ×C参数矩阵, w2表示C×(C/ r)参数矩阵, r表 示膨胀率; 式中激活操作先使用标准卷积对拼接后的特征进 行通道上的降 维。 4.根据权利要求1所述的X光安检图像危 险物品检测方法, 其特征在于, 所述MFGA模块 具体结构为: 基于HD C框架, 使用三个膨胀率大小不同的3 ×3卷积核来扩 大感受野; 将 CAM模 块和SAM模块 顺序放置; 其中, HDC是混合 膨胀卷积, CAM是通道 注意力, SAM是空间注意力。 5.根据权利要求4所述的X光安检图像危险物品检测方法, 其特征在于, 所述SAM模块的 具体结构为: 首先, 采用一组膨胀率为r =[1,2,5 ]的卷积核 大小为K的膨胀卷积对输入的特 征图进行操作; 其次, 将全局平均池化和最大池化生成的特征描述符在通道上进行拼接来 聚合特征图上的通道信息; 然后, 通过卷积核大小为K=3, 膨胀率为r =2的膨胀卷积对通道 降维; 最后, 通过Sigmo id函数生成最终的空间注意力图。 6.根据权利要求5所述的X光安检图像危险物品检测方法, 其特征在于, 根据HDC框架对 SAM进行修改时需遵守两个原则: (1)Mn≤K, K是卷积核的内核大小, Mn指两个非零值之间最 大距离; (2)一个组内, 膨胀率之间不能具有公因子 。 7.根据权利要求1所述的X光安检图像危险物品检测方法, 其特征在于, 所述CAM模块的 具体结构为: 首先, 通过池化操作来聚合特征图的全局空间信息, 其中, 全局平均池化的作 用是聚合信息, 最大池化用于将生成的通道注意力精细化; 其次, 将聚合后的信息输入共享 网络中以生成通道注意力图, 其中共享网络由多层感知器组成; 使用标准卷积对通道上拼 接后的特 征进行降维。权 利 要 求 书 1/2 页 2 CN 115393796 A 28.根据权利要求7所述的X光安检图像危险物品检测方法, 其特征在于, 所述CAM模块的 计算过程 为: 其中, MC表示CAM模块生成的一维通道注意力, 表示卷积核大小为1的一维卷积操 作, fMLP表示具有一个隐藏层的多感知器, σ 表示Sigmo id函数。权 利 要 求 书 2/2 页 3 CN 115393796 A 3

PDF文档 专利 基于注意力机制的X光安检图像危险物品检测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于注意力机制的X光安检图像危险物品检测方法 第 1 页 专利 基于注意力机制的X光安检图像危险物品检测方法 第 2 页 专利 基于注意力机制的X光安检图像危险物品检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:29上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。