全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210596637.6 (22)申请日 2022.05.30 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518044 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 蔡焕洽 龚丽君 李志鋒 刘威  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 朱佳 (51)Int.Cl. G06T 7/11(2017.01) G06T 7/194(2017.01) G06V 10/42(2022.01) G06V 10/44(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种训练图像分割模型的方法、 装置、 设备 及存储介质 (57)摘要 本申请提供一种训练图像 分割模型的方法、 装置、 设备及存储介质, 可 以应用于人工智 能领 域或智能交通领域等, 用于解决针对与音乐、 视 频或语音相关的推广图像的图像分割准确性和 可靠性较低的问题。 该方法至少包括: 对获得的 样本推广图像进行特征提取, 获得初始全局特 征; 从所述初始全局特征中, 提取边缘子特征和 位置子特征, 其中, 所述边缘子特征表征所述至 少一个推广目标的边缘界限, 所述位置子特征表 征所述至少一个推广目标与所述样本推广图像 之间的相对位置; 基于所述初始全局特征、 所述 边缘子特征和所述位置子特征的融合全局特征, 获得所述至少一个推广目标的预测分割区域。 从 三个不同角度限定推广目标所在区域, 提高了图 像分割准确性和可靠性。 权利要求书3页 说明书18页 附图17页 CN 114926480 A 2022.08.19 CN 114926480 A 1.一种训练图像分割模型的方法, 其特 征在于, 包括: 获得样本推广图像集合, 其中, 每个样本推广图像包含至少一个推广目标及其对应的 分割标注; 基于所述样本推广图像集合, 对待训练的图像分割模型进行多轮迭代训练, 获得已训 练的目标图像分割模型, 在每 轮迭代训练过程中, 至少执 行以下操作: 对获得的样本推广图像进行 特征提取, 获得初始全局特 征; 从所述初始全局特征中, 提取边缘子特征和位置子特征, 其中, 所述边缘子特征表征所 述至少一个推广目标的边缘界限, 所述位置子特征表征所述至少一个推广目标与所述样本 推广图像之间的相对位置; 基于所述初始全局特征、 所述边缘子特征和所述位置子特征的融合全局特征, 获得所 述至少一个推广目标在所述样本推广图像中的预测分割区域, 并基于所述预测分割区域, 与所述至少一个推广目标对应的分割标注之间的误差, 调整 所述待训练的图像分割模型的 模型参数。 2.根据权利要求1所述的方法, 其特 征在于, 所述获得样本推广图像集 合, 包括: 获取各个推广视频; 分别将所述各个 推广视频的封面图像, 作为所述样本推广图像; 基于预设的分割策略, 对每个样本推广图像包含的至少一个推广目标进行分割, 获得 相应的分割标注; 基于各个样本推广图像及其对应的分割标注, 建立样本推广图像集 合。 3.根据权利要求1所述的方法, 其特征在于, 所述对获得的样本推广图像进行特征提 取, 获得初始全局特 征, 包括: 对获得的样本推广图像进行多尺度特征提取, 获得多个 中间全局特征, 其中, 每个中间 全局特征对应不同的分辨率, 各分辨率中的最大分辨率与所述样本推广图像的分辨率相 同; 基于所述最大分辨率, 对所述多个中间全局特征进行多尺度融合处理, 获得所述初始 全局特征, 其中, 所述初始全局特 征对应的分辨 率为所述最大分辨 率。 4.根据权利要求1~3任一项所述的方法, 其特征在于, 所述基于所述初始全局特征、 所 述边缘子特征和所述位置子特征的融合全局特征, 获得所述至少一个推广目标在所述样本 推广图像中的预测分割区域, 包括: 基于所述初始全局特征, 对所述样本推广图像进行图像分割, 获得针对所述至少一个 推广目标的初始分割区域; 从所述初始全局特 征中, 提取与所述初始分割区域相关联的区域局部特 征; 基于所述区域局部特 征, 对所述初始全局特 征进行局部特 征调整, 获得整合全局特 征; 对所述整合全局特征、 所述边缘子特征和所述位置子特征进行特征融合, 获得所述融 合全局特征, 并基于所述融合全局特征, 获得所述至少一个推广目标在所述样本推广图像 中的预测分割区域。 5.根据权利要求4所述的方法, 其特征在于, 所述基于所述区域局部特征, 对所述初始 全局特征进行局部特 征调整, 获得整合全局特 征, 包括: 从所述初始全局特征中, 分别提取所述样本推广图像包含的各个像素各自对应的像素权 利 要 求 书 1/3 页 2 CN 114926480 A 2特征; 分别确定各个 像素特征, 与所述区域局部特 征之间的关联度; 基于获得的各个关联度, 对所述各个像素特征进行像素特征调整, 获得所述整合全局 特征。 6.根据权利要求5所述的方法, 其特征在于, 所述基于获得的各个关联度, 对所述各个 像素特征进行像素 特征调整, 获得 所述整合全局特 征, 包括: 将所述各个关联度分别作为相应的像素特征的权重, 分别对所述区域局部特征, 与所 述初始分割区域包 含的各像素 特征进行加权融合, 获得相应的区域像素融合特 征; 对获得的各区域像素融合特征和所述各个像素特征进行特征融合, 获得所述整合全局 特征。 7.根据权利要求1~3任一项所述的方法, 其特征在于, 每个分割标注包括区域标注、 边 缘标注和位置标注; 所述基于所述预测分割区域, 与所述至少一个推广目标对应的分割标注之间的误差, 调整所述待训练的图像分割模型的模型参数, 包括: 基于所述边缘子特征, 获得所述至少一个推广目标在所述样本推广图像中的预测边缘 界限; 基于所述位置子特征, 获得所述至少一个推广目标与 所述样本推广图像之间的相对位 置; 基于所述预测边缘界限与 所述至少一个推广目标对应的边缘标注之间的边缘误差, 以 及所述相对位置与所述至少一个推广目标对应的位置标注之间的位置误差, 以及所述预测 分割区域与所述至少一个推广目标对应的区域标注之 间的区域误差, 调整 所述待训练的图 像分割模型的模型参数。 8.根据权利要求1~3任一项所述的方法, 其特征在于, 在基于所述样本推广图像集合, 对待训练的图像分割模型进行多轮迭代训练, 获得已训练的目标图像分割模型之后, 还包 括: 获取无标注推广图像集 合, 其中, 每 个无标注推广图像包 含至少一个无 标注推广目标; 采用所述目标图像分割 模型, 分别对各无标注推广图像包含的至少一个无标注推广目 标进行图像分割, 获得相应的目标分割区域; 基于所述无标注推广图像集合, 以及获得的各个目标分割区域, 对所述目标图像分割 模型进行多轮迭代训练, 获得已训练的终极图像分割模型。 9.根据权利要求8所述的方法, 其特征在于, 所述基于所述无标注推广图像集合, 以及 获得的各个目标分割区域, 对所述 目标图像分割模型进行多轮迭代训练, 获得已训练的终 极图像分割模型, 包括: 基于预设的置信度评估策略, 确定获得的每个目标分割区域的置信度, 其中, 所述置信 度用于表征相应的目标分割区域的分割准确度; 将各个目标分割区域中, 置信度大于预设置信度阈值的目标分割区域, 作为相应的无 标注推广图像的分割标注; 基于获得的各个具有分割标注的无标注推广图像, 对所述目标图像分割 模型进行多轮 迭代训练, 获得 所述终极图像分割模型。权 利 要 求 书 2/3 页 3 CN 114926480 A 3

PDF文档 专利 一种训练图像分割模型的方法、装置、设备及存储介质

文档预览
中文文档 39 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共39页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种训练图像分割模型的方法、装置、设备及存储介质 第 1 页 专利 一种训练图像分割模型的方法、装置、设备及存储介质 第 2 页 专利 一种训练图像分割模型的方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:06:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。