全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165540.6 (22)申请日 2022.09.23 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦二层 (72)发明人 王兆玮 杨叶辉 武秉泓 王晓荣  黄海峰  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 张润 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 10/44(2022.01) G06V 10/42(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像分类模型的训练方法、 图像 分类方法和 装置 (57)摘要 本公开提供了一种图像分类模型的训练方 法、 图像分类方法和装置, 涉及人工智 能技术领 域, 具体涉及图像处理、 深度学习等技术领域。 具 体实现方案为: 利用第一图像分类模 型中的第一 特征提取网络, 确定样本图像的第一特征图像, 并将样本图像的掩码图像输入到第二图像分类 模型中的第二特征提取网络, 以得到与第一特征 图像尺寸相同的第二特征图像, 并根据第一特征 图像和第二特征图像对第二图像分类模型的第 二特征提取网络进行训练。 由此, 通过借助第一 图像分类模型实现第二图像分类模型地自监督 训练, 在降低了第二图像分类模 型的训练成本的 同时, 可使得所训练出的第二图像 分类模型达到 良好的分类效果。 权利要求书3页 说明书14页 附图9页 CN 115457329 A 2022.12.09 CN 115457329 A 1.一种图像分类模型的训练方法, 包括: 确定样本图像的掩码图像; 利用第一图像分类模型中的第一特 征提取网络, 确定所述样本图像的第一特 征图像; 将所述掩码图像输入到第 二图像分类模型中的第 二特征提取网络, 以得到第 二特征图 像, 其中, 所述第一特 征图像和所述第二特 征图像的尺寸相同; 根据所述第一特 征图像和所述第二特 征图像对所述第二特 征提取网络进行训练。 2.根据权利要求1所述的方法, 其中, 所述方法还 包括: 利用所述第 一图像分类模型中的分类网络对所述第 一特征图像进行分类, 以得到所述 样本图像的第一类型 标签信息; 将所述样本图像输入到所述第 二图像分类模型, 以得到所述样本图像的第 二类型标签 信息; 根据所述第 一类型标签信 息和所述第 二类型标签信 息, 对所述第 二图像分类模型进行 训练。 3.根据权利要求2所述的方法, 其中, 所述方法还 包括: 获取所述样本图像的类型 标注数据, 其中, 所述类型 标注数据包括第三类型 标签信息; 根据所述第 三类型标签信 息和所述第 一类型标签信 息, 对所述第 一图像分类模型进行 训练。 4.根据权利要求2所述的方法, 其中, 所述根据所述第 一类型标签信 息和所述第 二类型 标签信息, 对所述第二图像分类模型进行训练, 包括: 根据所述第一类型 标签信息和所述第二类型 标签信息, 确定蒸馏损失值; 根据所述蒸馏损失值, 对所述第二图像分类模型的模型参数进行调整, 以实现训练。 5.根据权利要求1所述的方法, 其中, 所述根据所述第 一特征图像和所述第 二特征图像 对所述第二特 征提取网络进行训练, 包括: 确定所述第一特 征图像和所述第二特 征图像之间的均方误差损失; 根据所述均方误差损失, 对所述第二特 征提取网络进行训练。 6.根据权利要求2所述的方法, 其中, 所述方法还 包括: 获取所述样本图像的类型 标注数据, 其中, 所述类型 标注数据包括第三类型 标签信息; 根据所述第 三类型标签信 息和所述第 二类型标签信 息, 对所述第 二图像分类模型进行 训练。 7.根据权利要求1所述的方法, 其中, 所述第一特征提取网络为卷积神经网络, 所述第 二特征提取网络为基于自注意力机制的转换t ransformer网络 。 8.根据权利要求1 ‑7中任一项所述的方法, 其中, 所述确定样本图像的掩码图像, 包括: 对所述样本图像进行划分, 以得到所述样本图像的多个图像块; 对所述多个图像块中的部分图像块进行掩码处 理, 以得到所述样本图像的掩码图像。 9.一种图像分类方法, 包括: 获取待处 理图像; 将所述待处理图像输入到第 二图像分类模型中的第 二特征提取网络, 以得到所述待处 理图像的第三特征图像, 其中, 所述第二特征提取网络是基于第一特征图像和第二特征图 像训练得到的, 其中, 所述第一特征图像是利用第一图像分类模型中的第一特征提取网络权 利 要 求 书 1/3 页 2 CN 115457329 A 2对样本图像进 行特征提取得到的, 所述第二特征图像是利用所述第二特征提取网络对所述 样本图像的掩码图像进行 特征提取得到的; 利用所述第二图像分类模型中的分类网络, 对所述第三特征图像进行分类, 以得到所 述待处理图像的类型 标签信息 。 10.根据权利要求9所述的方法, 其中, 所述第 一特征提取网络为卷积神经网络, 所述第 二特征提取网络为基于自注意力机制的转换t ransformer网络 。 11.一种图像分类模型的训练装置, 包括: 第一确定模块, 用于确定样本图像的掩码图像; 第二确定模块, 用于利用第一图像分类模型中的第一特征提取网络, 确定所述样本 图 像的第一特 征图像; 特征提取模块, 用于将所述掩码图像输入到第二图像分类模型中的第二特征提取网 络, 以得到第二特 征图像, 其中, 所述第一特 征图像和所述第二特 征图像的尺寸相同; 第一训练模块, 用于根据所述第 一特征图像和所述第 二特征图像对所述第 二特征提取 网络进行训练。 12.根据权利要求1 1所述的装置, 其中, 所述装置还 包括: 第一分类模块, 用于利用所述第 一图像分类模型中的分类网络对所述第 一特征图像进 行分类, 以得到所述样本图像的第一类型 标签信息; 第二分类模块, 用于将所述样本 图像输入到所述第二图像分类模型, 以得到所述样本 图像的第二类型 标签信息; 第二训练模块, 用于根据所述第一类型标签信息和所述第二类型标签信息, 对所述第 二图像分类模型进行训练。 13.根据权利要求12所述的装置, 其中, 所述装置还 包括: 第一获取模块, 用于获取所述样本图像的类型标注数据, 其中, 所述类型标注数据包括 第三类型 标签信息; 第三训练模块, 用于根据所述第三类型标签信息和所述第一类型标签信息, 对所述第 一图像分类模型进行训练。 14.根据权利要求12所述的装置, 其中, 所述第二训练模块, 具体用于: 根据所述第一类型 标签信息和所述第二类型 标签信息, 确定蒸馏损失值; 根据所述蒸馏损失值, 对所述第二图像分类模型的模型参数进行调整, 以实现训练。 15.根据权利要求1 1所述的装置, 其中, 所述第一训练模块, 具体用于: 确定所述第一特 征图像和所述第二特 征图像之间的均方误差损失; 根据所述均方误差损失, 对所述第二特 征提取网络进行训练。 16.根据权利要求12所述的装置, 其中, 所述装置还 包括: 第二获取模块, 用于获取所述样本图像的类型标注数据, 其中, 所述类型标注数据包括 第三类型 标签信息; 第四训练模块, 用于根据所述第三类型标签信息和所述第二类型标签信息, 对所述第 二图像分类模型进行训练。 17.根据权利要求11所述的装置, 其中, 所述第一特征提取网络为卷积神经网络, 所述 第二特征提取网络为基于自注意力机制的转换t ransformer网络 。权 利 要 求 书 2/3 页 3 CN 115457329 A 3

PDF文档 专利 图像分类模型的训练方法、图像分类方法和装置

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像分类模型的训练方法、图像分类方法和装置 第 1 页 专利 图像分类模型的训练方法、图像分类方法和装置 第 2 页 专利 图像分类模型的训练方法、图像分类方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。