全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210577112.8 (22)申请日 2022.05.25 (71)申请人 西安建筑科技大 学 地址 710055 陕西省西安市碑林区雁塔路 13号 (72)发明人 徐胜军 詹博涵 韩九强 刘光辉  孟月波 吕红强 钟德星  (74)专利代理 机构 西安通大专利代理有限责任 公司 6120 0 专利代理师 贺小停 (51)Int.Cl. G06V 10/26(2022.01) G06V 10/42(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) (54)发明名称 一种基于编解码结构的区域注意力语义分 割方法及系统 (57)摘要 本发明提供的一种基于编解码结构的区域 注意力语义分割方法及系统, 包括以下步骤: 将 获取的待分割的图像输入至预构建得到的基于 编解码结构的区域注意力网络模 型中, 得到分割 图; 其中, 所述预构建得到的基于编解码结构的 区域注意力网络模型结构 包括特征提取网络、 区 域注意力模块和多尺度跳接特征融合模块; 本发 明方法不仅有效地解决遮挡物体误分割问题, 而 且还可以提升待分割物体边缘特征的准确表达, 从而提高了分割精度, 实现对物体的精准分割。 权利要求书1页 说明书5页 附图3页 CN 114943839 A 2022.08.26 CN 114943839 A 1.一种基于编解码结构的区域注意力语义分割方法, 其特 征在于, 包括以下步骤: 将获取的待分割的图像输入至预构建得到的基于编解码结构的区域注意力网络模型 中, 得到分割图; 其中, 所述预构建得到的基于编解码结构的区域注意力网络模 型结构包括 特征提取网络、 区域注意力模块和多尺度跳 接特征融合模块。 2.根据权利要求1所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述特 征提取网络为Resnet5 0网络。 3.根据权利要求1所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述区域注意力模块包括多个卷积层、 上采样层和损失函数, 每个卷积层后都有批归一 化层BN和非线性激活函数ReLu。 4.根据权利要求3所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述上采样层使用双线性插值; 损失函数采用交并比损失。 5.根据权利要求1所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述多尺度跳接特征融合模块包括 1×1卷积层和上采样, 1 ×1卷积层由卷积、 批归一化 层BN和非线性激活函数ReLu组成。 6.根据权利要求5所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述上采样层使用双线性插值。 7.根据权利要求1所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述多尺度跳接特征融合模块的输出连接卷积层, 所述卷积层的输出连接上采样层, 上 采样层输出为基于编解码结构的区域注意力网络的分割结果。 8.根据权利要求1所述的一种基于编解码结构的区域注意力语义分割方法, 其特征在 于, 所述预构建得到的基于编解码结构的区域注意力网络模型的总损失函数为: Loss=IoUloss+Corssloss 其中, IoU loss为交并比损失, Cors s loss为交叉熵损失。 9.一种基于编解码结构的区域注意力语义分割 系统, 其特 征再回, 包括: 数据预处 理模块, 用于将获取的数据集进行 预处理, 得到预处 理后的数据集; 网络模块, 用于预构建得到的基于编解码结构的区域注意力网络模型; 分割模块, 用于将 获取的待分割的图像输入至预构建得到的基于编 解码结构的区域注 意力网络模型中, 得到分割图。权 利 要 求 书 1/1 页 2 CN 114943839 A 2一种基于编解码结构的区域注意力语 义分割方 法及系统 技术领域 [0001]本发明属于物体检测技术领域, 具体涉及 一种基于编解码结构的区域注意力语义 分割方法及系统。 背景技术 [0002]物体检测技术作为机器人视觉系统的重要组成部分, 其主要任务是对采集的图像 进行处理, 提取出物体所在区域和类别信息, 根据这些信息控制机器人进行抓取。 因此, 物 体检测技术在机器人视 觉系统中显得 尤为重要。 [0003]在工业机器人装配作业中, 对抓取精度要求很高, 抓取出现偏差直接导致装配作 业失败。 传统的物体抓取方法根据图像处理技术得到零件和背景 的分割图, 再对零件的分 割图使用边缘检测得到零件的最小外接矩形框, 通过矩形框的四个顶点计算出零件的抓取 点。 [0004]传统的图像处理方法容易受环境因素的影响不能保证完整分割零件和背景, 这直 接导致根据分割图计算出来的抓取点出现偏差, 使得抓取 出现误差 。 发明内容 [0005]本发明的目的在于提供一种基于编解码结构的区域注意力语义分割方法及系统, 接了现有的图像处 理方法存在误差大的缺陷。 [0006]为了达到上述目的, 本发明采用的技 术方案是: [0007]本发明提供的一种基于编解码结构的区域注意力语义分割方法, 包括以下步骤: [0008]将获取的待分割的图像输入至预构建得到的基于编解码结构的区域注意力网络 模型中, 得到 分割图; 其中, 所述预构建得到的基于编解码结构的区域注意力网络模型结构 包括特征提取网络、 区域注意力模块和多尺度跳 接特征融合模块。 [0009]优选地, 所述特 征提取网络为Resnet5 0网络。 [0010]优选地, 所述区域注意力模块包括多个卷积层、 上采样层和损失函数, 每个卷积层 后都有批归一 化层BN和非线性激活函数ReLu。 [0011]优选地, 所述上采样层使用双线性插值; 损失函数采用交并比损失。 [0012]优选地, 所述多尺度跳接特征融合模块包括1 ×1卷积层和 上采样, 1 ×1卷积层由 卷积、 批归一 化层BN和非线性激活函数ReLu组成。 [0013]优选地, 所述上采样层使用双线性插值。 [0014]优选地, 所述多尺度跳接特征融合模块的输出连接卷积层, 所述卷积层的输出连 接上采样层, 上采样层输出为基于编解码结构的区域注意力网络的分割结果。 [0015]优选地, 所述预构建得到的基于编解码结构的区域注意力网络模型的总损失函数 为: [0016]Loss=IoU loss+Corss loss [0017]其中, IoU loss为交并比损失, Cors s loss为交叉熵损失。说 明 书 1/5 页 3 CN 114943839 A 3

PDF文档 专利 一种基于编解码结构的区域注意力语义分割方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于编解码结构的区域注意力语义分割方法及系统 第 1 页 专利 一种基于编解码结构的区域注意力语义分割方法及系统 第 2 页 专利 一种基于编解码结构的区域注意力语义分割方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。