全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211172502.3 (22)申请日 2022.09.26 (71)申请人 中国科学院合肥物质科 学研究院 地址 230031 安徽省合肥市蜀山区蜀山湖 路350号 (72)发明人 高会议 张翔 万莉 贺露  (74)专利代理 机构 合肥天明专利事务所(普通 合伙) 34115 专利代理师 苗娟 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 基于双池化通道注意力和空洞卷积的图像 识别方法及系统 (57)摘要 本发明的一种基于双池化通道注意力和空 洞卷积的图像识别方法及系统, 其方法包括: 获 取待识别图像、 图像进行相应预处理、 图像输入 到深度卷积神经网络浅层中提取细 节特征(第一 阶段)、 空洞卷积扩展网络深层的有效感受野, 双 池化通道注意力联合整体和局部响应对特征进 行重标定, 本发 明提取出更具有识别性的关键语 义特征(第二阶段)、 采用softmax函数对提取出 的特征进行分类, 采用对称交叉熵 函数作为损失 函数。 本发 明构建了一种双阶段的基于双池化通 道注意力和空洞卷积的深度卷积神经网络, 可以 进一步提高深度卷积神经网络对于细粒度分类 的分类精度, 并且对称交叉熵 函数可以增强模型 的标签鲁棒性。 权利要求书2页 说明书7页 附图3页 CN 115546506 A 2022.12.30 CN 115546506 A 1.一种基于双池化通道注意力和 空洞卷积 的图像识别方法, 其特征在于, 包括以下步 骤, 步骤1、 获取待识别图像, 预处 理后输入到深度卷积神经网络中; 步骤2、 处 理后的待测试图像输入网络 浅层进行细节特 征的提取; 步骤3、 浅层特征输入到网络深层, 通过空洞卷积和双池化通道注意力机制进行关键语 义特征提取; 步骤4、 特征输入到分类器进行分类, 将分类分数的最大值作为图像的分类结果, 采用 对称交叉熵函数作为损失函数进行训练。 2.根据权利要求1所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 步骤1中, 预处 理包括: 调整到网络需要的尺寸大小、 像素 标准化、 旋转。 3.根据权利要求1所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 步骤2中特征提取网络采用卷积神经网络, 是传统的直筒式的网络结构VGG、 轻量级网 络结构Mobi leNet、 多路结构Go ogLeNet、 残差结构ResNet任意 一种。 4.根据权利要求1所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 步骤2中待测试图像输入网络 浅层进行细节特 征的提取, 包括如下步骤: 步骤2.1构造浅层特征提取网络, 具体为resnet50, resnet50由5个Stage组成, 其中 Stage 0是卷积加激活函数加池化叠加而成具体为卷积提取局部特征、 激活函数增加模型 非线性拟合能力、 池化操作进 一步聚合特征, 后4个Stage都由Bottleneck组成, Bottleneck 是一种残差结构, 在卷积之间加上短接, 以学习残差, 4个Stage分别包括3、 4、 6、 3个 Bottleneck; 步骤2.2将浅层特征图保存; 若深层特征提取网络与浅层特征提取网络不是同一个架 构, 则对浅层特 征进行相应的处 理。 5.根据权利要求4所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 所述步骤3中, 浅层特征输入到网络深层, 通过空洞卷积和双池化通道注意力机制进 行关键语义特 征提取, 具体步骤如下: 步骤3.1、 将resnet50的后两个Stage中的标准卷积替换为空洞卷积, 空洞率设置为1、 2、 3、 1、 2、 3. ....这种齿轮式的结构; 步骤3.2、 构造双池化通道注意力模块, 并将此模块嵌入到resnet50后两个Stage的每 两个残差的中间; 步骤3.3、 将空洞卷积和双池化 通道注意力与resnet5 0的残差模块进行 结合。 6.根据权利要求5所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 步骤3.2中的双池化通道注意力模块由两个部分组成: 压缩和提取; 在压缩操作中, 通 过联合全局最大池化GMP和全局平均池化GAP来丰富特 征的输入; 在提取操作中, 首先用两个全连接层学习不同通道之间的相互依存关系, 同时减少参 数数量; 再使用sigmo id函数生成归一 化权重, 给特征进行重加权 。 7.根据权利要求5所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 步骤4特征输入到分类器进行分类, 将分类分数的最大值作为图像的分类结果, 采用 对称交叉熵函数作为损失函数进行训练, 具体包括:权 利 要 求 书 1/2 页 2 CN 115546506 A 2步骤4.1, 将步骤3中提取好的特征保存, 输入到分类器中; 采用将特征展平, 输入到全 连接层中, 构造特征空间到类别空间的映射关系; 再用softmax函数对每一个类别进行打 分, 分数最高的为分类的结果; 步骤4.2神经网络训练的误差需要反向传播, 以不断更新参数, 最终达到收敛效果; 分 类任务采用交叉熵损失函数(Lce),Lce的定义如下: 其中, q为真实的概 率, p为模型 预测的概 率。 8.根据权利要求7所述的基于双池化通道注意力和空洞卷积的图像识别方法, 其特征 在于: 还包括加入一个以模型 预测为基点的损失部分Lrce和Lsl, Lrce和Lsl的定义如下: q为真实的概 率, p为模型 预测的概 率。 9.一种基于双池化通道注意力和 空洞卷积 的图像识别系统, 其特征在于: 包括如下模 块, 原始图像输入 模块: 通过相机拍摄、 本地存 储、 服务器获取 方式获得原 始的输入图像; 图像预处 理模块: 对图像进行 预处理; 模型转换及调用模块: 对存储在服务器或本地的模型进行语言转换, 使能够被不同的 终端调用; 浅层特征提取模块: 通过构建浅层的卷积神经网络, 对图像的细节特 征进行提取; 深层特征提取模块: 包含空洞卷积和双池化通道注意力的卷积块, 对图像的语义特征 进行提取; 分类结果模块: 将特 征输入到分类 器进行分类。 10.一种计算机可读存储介质, 存储有计算机程序, 所述计算机程序被处理器执行时, 使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115546506 A 3

PDF文档 专利 基于双池化通道注意力和空洞卷积的图像识别方法及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于双池化通道注意力和空洞卷积的图像识别方法及系统 第 1 页 专利 基于双池化通道注意力和空洞卷积的图像识别方法及系统 第 2 页 专利 基于双池化通道注意力和空洞卷积的图像识别方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。