全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210315075.3 (22)申请日 2022.03.28 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 谭资昌 杨智超 郭国栋  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/42(2022.01) G06V 10/44(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 对象分类方法、 深度学习模型的训练方法、 装置和设备 (57)摘要 本公开提供了一种对象分类方法, 涉及人工 智能技术领域, 尤其涉及深度学习、 图像识别和 计算机视觉技术领域。 具体实现方案为: 根据目 标图像的初始向量特征图, 得到局部特征图和全 局特征图; 根据局部特征图和全局特征图, 得到 融合特征图; 以及根据融合特征图, 对目标图像 中的目标对象进行分类, 得到分类结果。 本公开 还提供了一种对象分类方法、 深度学习模型的训 练方法、 装置、 电子设备和存 储介质。 权利要求书3页 说明书12页 附图7页 CN 114663952 A 2022.06.24 CN 114663952 A 1.一种对象分类方法, 包括: 根据目标图像的初始向量特 征图, 得到局部特 征图和全局特 征图; 根据所述局部特 征图和所述全局特 征图, 得到融合特 征图; 以及 根据所述融合特 征图, 对所述目标图像中的目标对象进行分类, 得到分类结果。 2.根据权利要求1所述的方法, 其中, 所述根据目标图像的初始向量特征图, 得到局部 特征图和全局特 征图包括: 对所述初始向量特 征图执行卷积操作, 得到所述局部特 征图。 3.根据权利要求1所述的方法, 其中, 所述根据目标图像的初始向量特征图, 得到局部 特征图和全局特 征图包括: 对所述初始向量特 征图执行第1级卷积 操作, 得到第1级局部特 征图; 对所述初始向量特 征图执行第1级特 征提取操作, 得到第1级全局特 征图; 所述根据所述局部特 征图和所述全局特 征图, 得到融合特 征图包括: 根据所述第1级局部特 征图和所述第1级全局特 征图, 得到第1级融合特 征图。 4.根据权利要求3所述的方法, 其中, 所述根据目标图像的初始向量特征图, 得到局部 特征图和全局特 征图还包括: 对第n‑1级局部特征图执行第n级卷积操作, 得到第n级局部特征图, 其中, n为大于1的 整数; 对第n‑1级融合特 征图执行第n级特 征提取操作, 得到第n级全局特 征图; 所述根据所述局部特 征图和所述全局特 征图, 得到融合特 征图包括: 根据所述第n级局部特 征图和所述第n级全局特 征图, 得到第n级融合特 征图。 5.根据权利要求1至4任一项所述的方法, 其中, 所述根据所述局部特征图和所述全局 特征图, 得到融合特 征图包括: 将所述局部特 征图与所述全局特 征图相拼接, 得到拼接特 征图; 根据所述全局特 征图, 得到多个第一特 征; 根据所述 拼接特征图, 得到多个第二特 征和多个第三特 征; 根据所述多个第 一特征、 所述多个第 二特征和所述多个第 三特征, 得到注意力特征; 以 及 根据所述注意力特 征和所述 拼接特征图, 得到所述融合特 征图。 6.根据权利要求1所述的方法, 其中, 所述目标对象包括面部, 所述分类结果包括真实 面部和伪造面部 。 7.一种深度学习模型的训练方法, 包括: 根据样本图像的初始向量特 征图, 得到局部特 征图和全局特 征图; 根据所述局部特 征图和所述全局特 征图, 得到融合特 征图; 根据所述融合特 征图, 对所述样本图像中的样本对象进行分类, 得到分类结果; 以及 根据所述分类结果与 所述样本图像的标签之间的差异值, 对所述深度 学习模型进行训 练。 8.根据权利要求7所述的方法, 其中, 所述深度学习模型包括级联的N级卷积模块以及 级联的N级特征融合模块, N为大于1的整数; 所述根据样本图像的初始向量特征图, 得到局 部特征图和全局特 征图包括:权 利 要 求 书 1/3 页 2 CN 114663952 A 2利用第n级卷积模块, 对第n ‑1级卷积模块输出的第n ‑1级局部特征图进行卷积, 得到第 n级局部特 征图, n为大于1的整数, 且n 为小于或等于N的整数; 以及 利用第n级特征融合模块对第n ‑1级特征融合模块输出的第n ‑1级融合特征图进行处 理, 得到第n级融合特 征图。 9.根据权利要求8所述的方法, 其中, 第1级局部特征图是利用第1级卷积模块对所述初 始向量特征图进行卷积得到的; 以及第1级融合特征图是利用第1级 特征融合模块对所述初 始向量特 征图进行处 理得到的。 10.根据权利要求8 或9所述的方法, 其中, 所述特征融合模块包括特征提取子模块和特 征融合子模块; 所述利用第n级特征融合模块对第n ‑1级特征融合模块输出的第n ‑1级融合 特征图进行处 理, 得到第n级融合特 征图包括: 将所述第n ‑1级融合特 征图输入第n级特 征提取子模块, 得到第n级全局特 征图; 以及 将所述第n级局部特征图和所述第n级全局特征图输入第n级特征融合子模块, 得到所 述第n级融合特 征图。 11.根据权利要求10所述的方法, 其中, 第1级全局特征图是利用第1级特征提取子模块 对所述初始向量特 征图进行处 理得到的。 12.根据权利要求10所述的方法, 其中, 所述将所述第 n级局部特征图和所述第 n级全局 特征图输入第n级特 征融合子模块, 得到所述第n级融合特 征图包括: 将所述第n级局部特 征图和所述第n级全局特 征图相拼接, 得到第n级拼接特 征图; 根据所述第n级全局特 征图, 得到多个第n级第一特 征; 根据所述第n级拼接特 征图, 得到多个第n级第二特 征和多个第n级第三特 征; 根据所述多个第 n级第一特征、 所述多个第n级第 二特征和所述多个第n级第三特征, 得 到第n级注意力特 征; 以及 根据所述第n级注意力特 征和所述第n级拼接特 征图, 得到所述第n级融合特 征图。 13.根据权利要求8至12任一项所述的方法, 其中, 所述根据所述分类结果与样本 图像 的标签之间的差异值, 对所述深度学习模型进行训练包括: 确定所述分类结果与所述样本图像的标签之间的差异值; 以及 调整所述 N级卷积模块的参数和所述 N级特征融合模块的参数, 使得 所述差异值收敛。 14.一种对象分类装置, 包括: 第一获得模块, 用于根据目标图像的初始向量特 征图, 得到局部特 征图和全局特 征图; 第二获得模块, 用于根据所述局部特 征图和所述全局特 征图, 得到融合特 征图; 以及 第一分类模块, 用于根据 所述融合特征图, 对所述目标图像中的目标对象进行分类, 得 到分类结果。 15.一种深度学习模型的训练装置, 包括: 第三获得模块, 用于根据样本图像的初始向量特 征图, 得到局部特 征图和全局特 征图; 第四获得模块, 用于根据所述局部特 征图和所述全局特 征图, 得到融合特 征图; 第二分类模块, 用于根据 所述融合特征图, 对所述样本图像中的样本对象进行分类, 得 到分类结果; 以及 训练模块, 用于根据所述分类结果与所述样本 图像的标签之间的差异值, 对所述深度 学习模型进行训练。权 利 要 求 书 2/3 页 3 CN 114663952 A 3

PDF文档 专利 对象分类方法、深度学习模型的训练方法、装置和设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对象分类方法、深度学习模型的训练方法、装置和设备 第 1 页 专利 对象分类方法、深度学习模型的训练方法、装置和设备 第 2 页 专利 对象分类方法、深度学习模型的训练方法、装置和设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。