全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210620648.3 (22)申请日 2022.06.02 (71)申请人 中南大学 地址 410083 湖南省长 沙市岳麓区麓山 南 路932号 (72)发明人 赵于前 王辉 张帆 阳春华  桂卫华  (51)Int.Cl. G06V 10/46(2022.01) G06V 10/44(2022.01) G06V 10/20(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于递归解码器的显著性检测方法 (57)摘要 本发明公开了一种基于递归解码器的显著 性检测方法, 主要解决现有技术显著性检测结果 准确率低, 显著性主体判断错误与边缘模糊的问 题。 其实施方案为: 1)获取数据集与检测标签; 2) 构建检测模型; 3)构建损 失函数; 4)训练检测模 型; 5)推理并获得检测结果。 本发明构建的显著 性检测模型, 通过多次全尺度特征融合与边缘强 化, 实现了多尺度特征的充分利用与解码结果的 细节补充, 有效提升了显著性检测结果的准确 率, 避免了检测结果中显著性主体判断错误的发 生, 解决了解码结果存在边 缘模糊的问题。 权利要求书3页 说明书10页 附图3页 CN 114937154 A 2022.08.23 CN 114937154 A 1.一种基于递归解码器的显著性检测方法, 其特 征在于包括以下步骤: (1)获取数据集与检测标签: 获取显著性检测公开数据集及对应的检测标签; (2)构建检测模型, 该模型由特征提取器、 递归解码器RD ‑1和RD‑2、 边缘强化模块ER ‑1 和ER‑2、 整体注意力模块HA构成, 具体构建过程包括以下步骤: (2‑a)构建特征提取器, 以ResNet ‑50作为特征提取器 的基础网络; 所构建的特征提取 器共分五层: 第一层, 即Res1, 由单层卷积模块构成; 第二层, 即Res2, 由一个池化层和三层 残差模块构成; 第三层, 即Res3, 由四层残差模块构成; 第四层包括Res4 ‑1和Res4‑2, 二者拥 有相同的结构, 都由六层残差模块构成, 第五层包括Res5 ‑1和Res5‑2, 二者也拥有相同的结 构, 都由三层残差模块构成; 第四层和第五层为双分支结构, 其中第四层的Res4 ‑1和第五层 的Res5‑1串联构成第一个分支, 第四层的Res4 ‑2和第五层的Res5 ‑2串联构成第二个分支; 输入图像经过Res1处理, 获得三维特征图f1_1、 f1_2和f1_3, 且f1_1=f1_2=f1_3; f1_3输入Res2获 得三维特征图f2_1、 f2_2和f2_3, 且f2_1=f2_2=f2_3; f2_3输入Res3获得三维特征图f3_1、 f3_2和 f3_3, 且f3_1=f3_2=f3_3; f3_3依次经过第一个分支的Res4 ‑1和Res5‑1处理后分别获得三维特 征图f4_1和f5_1; f3_3与整体注 意力模块HA的输出结果通过逐像素相乘实现加权, 加权结果依 次经过第二个分支的Res4 ‑2和Res5‑2处理后分别获得三维特征图f4_2和f5_2; HA由单层卷积 构成, 它以递归解码器RD ‑1的输出结果作为输入; (2‑b)构建递归解码器RD ‑n, 该解码器由长依赖模块LRDM、 感受野模块RFB、 子解码器1、 子解码器2、 子解码器3和卷积模块Conv2构成; 将步骤(2 ‑a)获取的特征图f2_n、 f3_n、 f4_n和 f5_n分别作为递归解码器RD ‑n的输入1、 输入2、 输入3和输入4, n=1,2; fi_n依次经过LRDM与 RFB处理后得到 其中i=2,3,4,5; 将 和 作为子解码器1的输入, 得 到输出结果mask1_n, 将mask1_n和 作为子解码器2的输入, 得到输出 结果mask2_n, 将mask2_n和 作为子解码器3的输入, 得到输出结果 mask3_n, 将mask3_n作为卷积模块Conv2的输入, 得到粗特征图mapn, 即为递归解码器RD ‑n的 输出结果; 该步骤中的长依赖模块 LRDM和子解码器分别构建如下: (2‑b‑1)构建长依赖模块LRDM; 以步骤(2 ‑a)获得的特征图fi_n作为输入, 经该模块的通 道维度自适应均值池化层处理并进行特征展开后, 获得一维特征, 将一维特征输入全连接 层后, 经过激活函数与特征逆展开处理, 再与特征图fi_n进行逐像素相乘操作, 得到LRDM的 输出; 其中i =2,3,4,5, n =1,2; (2‑b‑2)构建子解码器, 三个子解码器都具有相同的结构, 由递归池化模块RP、 递归上 采样模块 RU、 上采样模块Up、 通道注 意力模块CA、 卷积模块Conv1和拼接层构成; 其中递归池 化模块RP由池化层、 卷积层和激活层构成, 递归 上采样模块 RU由上采样层、 卷积层和激活层 构成; 在子 解码器1、 2、 3中, 分别以直接输入 到拼接层的特征 为基准特征, RP和RU分别对来 自RFB的输入特征进行以基准特征尺寸为参考的尺度归一化; 归一化后的 特征与基准特征拼接后, 再与上采样模块Up的输出结果通过逐像素相乘运算实现加权, 加 权结果依次输入CA和Co nv1后, 得到 子解码器的输出;权 利 要 求 书 1/3 页 2 CN 114937154 A 2子解码器1中RP的输入为 与 RU和Up的输入都为 子解码器2中RP的输入为 RU的输入为 与 Up的输入为子解码器1的输出; 子解码器3中RP的输入为零, RU 的输入为 与 Up的输入为子解码器2的输出; (2‑c)构建边缘强化模块ER ‑n, 该模块由卷积块1和卷积块2构成, 其中卷积块1由三层 残差模块构成, 卷积块2由五层卷积构成; 将步骤(2 ‑a)得到的特征图f1_n经卷积块 1处理后, 与步骤(2 ‑b)得到的粗特征图mapn进行逐像素相加, 再经卷积块2处理后, 得到显著性检测 图, 其中n =1,2; (3)构建损失函数: 构建如下混合损失函数Lmix: Lmix=LBCE+LMSSIM+LDice 其中LBCE为二元交叉熵损失, LMSSIM为平均结构相似性损失, LDice为Dice损失, 分别定义 如下: 其中P表示预测图, Gt表示标签图, 二者尺寸相同, H表示图的高, W表示图的宽, Pi, j和 Gti,j分别表示P和Gt中(i, j)点的像素值, 且Pi, j∈(0, 1), Gti,j为整数且Gti,j∈[0, 1], log表 示求自然 对数, 表示逐像素相加操作, 表示逐像素相乘操作, C1与C2为实数常量, 且C1、 C2 ∈(0, 0.1); M表示将标签图Gt以及对应的预测图P划分成子图对的个数, 为预测图P第k 个子图的均值, 为标签图Gt第k个子图的均值, 为预测图P第k个子图的方差, 为 标签图Gt第k个子图的方差, 为预测图P的第k个子图和标签图Gt的第k个子图之间的 协方差; |·|表示求取图像中所有像素的和; 对模型的两个分支的显著性检测图分别计算 混合损失函数, 以这两个混合损失函数之和作为模型的总损失函数, 定义如下: Ltotal=Lmix‑1+Lmix‑2 其中, Lmix‑1和Lmix‑2分别表示第一和第二分支的显著性检测图与标签之间的混合损失, Ltotal表示模型的总损失函数; (4)训练检测模型: 利用步骤(1)得到的数据集训练步骤(2)构建的检测模型, 模型中的特征提取器使用预 训练模型进行参数初始化; 使用混合损失函数Lmix‑1和Lmix‑2分别衡量第一和第二分支的显 著性检测图与标签之间的相似性; 训练过程中使用Adam算法更新模型参数, 并通过L ‑2正则 化作为约束, 直到损失值 不再下降, 得到训练好的显著性检测模型; (5)推理并获得检测结果: 将测试图像经过归一化处理之后, 输入至训练好的显著性检测模型, 该模型第二分支 得到的显著性检测图即为 最终的显著性检测结果。权 利 要 求 书 2/3 页 3 CN 114937154 A 3

PDF文档 专利 一种基于递归解码器的显著性检测方法

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于递归解码器的显著性检测方法 第 1 页 专利 一种基于递归解码器的显著性检测方法 第 2 页 专利 一种基于递归解码器的显著性检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。