全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261125.0 (22)申请日 2022.10.14 (71)申请人 深圳职业 技术学院 地址 518000 广东省深圳市西丽 街道西丽 湖镇西丽湖畔 (72)发明人 施连焘 李正国 王玉峰 李建阳  (74)专利代理 机构 深圳瑞天谨诚知识产权代理 有限公司 4 4340 专利代理师 高雁飞 (51)Int.Cl. G06T 7/00(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06T 3/40(2006.01) G06T 5/50(2006.01)G06T 7/11(2017.01) (54)发明名称 息肉图像分割方法、 计算机可读存储介质及 计算机设备 (57)摘要 本申请提供了一种息肉图像 分割方法、 计算 机可读存储介质及计算机设备, 包括: 将待分割 的息肉图像输入到多尺度语义融合模 型, 得到语 义信息图像, 再将语义信息图像经过下采样得到 下采样后的语义信息图像, 重新将下采样后的语 义信息图像输入到多尺度语义融合模型后再进 行下采样, 多次重复, 获得高维的语义信息图像; 将高维的语义信息图像输入到上下文感知金字 塔聚合模型, 输出融合后的特征图, 将融合后的 特征图进行上采样后再通过卷积提取特征, 重新 将特征提取后的特征图进行上采样后再通过卷 积提取特征, 多次重复, 直到获得与所述待分割 的息肉图像通道尺寸相同的最终的特征图。 可以 适应息肉变化实现精准息肉分割。 权利要求书3页 说明书6页 附图5页 CN 115439470 A 2022.12.06 CN 115439470 A 1.一种息肉图像分割方法, 其特 征在于, 包括: 获取待分割的息肉图像; 将待分割的息肉图像输入到多尺度语义融合模型, 得到语义信息 图像, 再将语义信息 图像经过下采样得到下采样后的语义信息图像, 重新将下采样后的语义信息图像输入到多 尺度语义融合模型后再进 行下采样, 多次重复, 获得高维的语义信息图像; 所述多尺度语义 融合模型为将待分割的息肉图像通过特征提取得到与待分割的息肉图像尺寸相同的初始 特征图, 将初始特征图分成4个通道数量相等的特征图, 选择其中3个特征图经由卷积和批 量正则化算法后与剩余的一个特征图依次以通道维度进行拼接, 经由残差连接拼接后得到 的特征图再与待分割的息肉图像进行融合, 得到语义信息图像; 将高维的语义信息 图像输入到上下文感知金字塔聚合模型, 输出融合后的特征图, 将 融合后的特征图进行上采样后再通过卷积提取特征, 重新将特征提取后的特征图进行上采 样后再通过卷积提取特征, 多次重复, 直到获得与所述待分割的息肉图像通道尺寸相同的 最终的特 征图; 所述上下文感知金字塔聚合模型为将输入的高维的语义信息图像进行多个不同尺度 的池化操作, 提取四个通道数不变、 分辨率不同的特征图, 将四个特征图降维后再依次进 行 上采样, 得到与高维的语义信息图像尺寸相同的上采样后的特征图, 将上采样后的特征图 以通道维度进行拼接, 得到拼接后的特征图; 将拼接后的特征图采用卷积进行通道维度的 降维, 再利用Sigmoid激活函数得到注 意力权重图, 将注 意力权重图进 行注意力矩阵乘法运 算, 重塑拼接后的特征图的权值, 得到基于空间注意力机制的特征图; 将拼接后的特征图进 行特征提取后输入到通道注意力机制中, 得到通道权重, 得到基于通道注意力机制的特征 图; 将基于空间注意力机制的特征图与基于通道注意力机制的特征图进行融合, 得到融合 后的特征图。 2.如权利要求1所述的息肉图像分割方法, 其特征在于, 所述多尺度语义融合模型的具 体流程为: 定义待分割的息肉图像 X为: X∈RC×H×W, 将待分割的息肉图像通过W1(·)进行特征提取, 得到一个与待分割的息肉图像尺寸相同的初始特 征图X′为: X′∈RC×H×W; 所述W1(·)包括1×1的卷积、 批量 正则化算法和ReLU非线性激活函数; 根据通道维度将初始特征图X ′∈RC×H×W分成4个通道数量相同的特征图 将其中3个特征图X1, X2, X3经由W2(·)进行转变, 将转变后的特征图W2(X1),W2(X2),W2 (X3)与剩余的一个特征图X0依次以通道维度进行拼接, 得到与待分割的息肉图像通道数量 一致的拼接后的特 征图XCat, 即: XCat=CONCAT(W2(X1),W2(X2),W2(X3),X0); 所述W2(·)包括3×3卷积和批量 正则化算法; 由残差连接拼接后的特征图, 再与待分割的息肉图像进行融合, 输出语义信息图像 XOut, 即: 其中, R代表三维数组图像, C, H和W分别表示图像的通道数, 长度和宽度; 表示像素级权 利 要 求 书 1/3 页 2 CN 115439470 A 2别的加法求和运算, CONCAT表示通道维度上的拼接; W3(·)包括1×1的卷积、 批量正则化算 法和ReLU非线性激活函数。 3.如权利要求1所述的息肉图像分割方法, 其特征在于, 所述上下文感知金字塔聚合模 型包括上 下文感知融合模型和注意力校正模型。 4.如权利要求3所述的息肉图像分割方法, 其特征在于, 所述上下文感知融合模型的具 体操作流 程为: 定义输入的高维的语义信息图像D为D∈RC×H×W, 使用多个不同尺度的池化操作, 提取 四 个通道数不变、 分辨率不同的特征图, 分别为: D0∈RC×6×6, D1∈RC×3×3, D2∈RC×2×2和D3∈RC ×1×1; 将四个特征图经过1 ×1的卷积、 批量正则化算法和ReLU非线性激活函数分别进行降 维, 将通道数压缩至四分之一, 即: 和 再将降维后的特征图进行上采样, 得到与高维的语义信息 图像D尺寸相同的上采样后 的特征图D″i, 即: D″i=(Up(Di′, βi)); 将上采样后的特 征图以通道维度进行拼接, 得到拼接后的特 征图DCat, 即: DCat=CONCAT(D ″0,D″1,D″2,D″3); 其中, i代表自然数, βi表示相关系数, Up为常规的双线性插值上采样, CONCAT为 通道维度上的拼接 。 5.如权利要求4所述的息肉图像分割方法, 其特征在于, 所述注意力校正模型的具体操 作流程为: 将拼接后的特征图采用1 ×1卷积进行通道维度的降维, 再经过Sigmoid激活函数得到 注意力权重图, 将注意力权重图进行注意力矩阵乘法运算, 重塑拼接后的特征图的权值, 建 模空间注意力机制, 得到基于空间注意力机制的特 征图DSpatial, 即: 其中, 表示注意力矩阵的乘法运算, σ( ·)是Sigmiod激活函数, S0代表1×1卷积操作, α 是与S0相关的系数; 将拼接后的特征图进行特征提取得到提取后的特征图, 将提取后的特征图输入到通道 注意力机制中, 得到通道权 重, 和基于通道 注意力机制的特 征图, 即: 其中, FAdaptive(·)能采用不同的卷积核大小局部地实现跨通道信息交互, G( ·)表示全 局平均池化 H′, W′指的是像素空间坐标, Dchannel代表通 道维度注意力机制, i, j代 表自然数, θ 是G( ·)的相关系数; 将基于空间注意力 机制的特征图与基于通道注意力 机制的特征图进行融合, 得到 融合 后的特征图DOut, 即: 权 利 要 求 书 2/3 页 3 CN 115439470 A 3

.PDF文档 专利 息肉图像分割方法、计算机可读存储介质及计算机设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 息肉图像分割方法、计算机可读存储介质及计算机设备 第 1 页 专利 息肉图像分割方法、计算机可读存储介质及计算机设备 第 2 页 专利 息肉图像分割方法、计算机可读存储介质及计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:35:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。