全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211140564.6 (22)申请日 2022.09.19 (71)申请人 京东方科技 集团股份有限公司 地址 100015 北京市朝阳区酒仙桥路10号 (72)发明人 胡玉兰 张翠芳  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 苟冬梅 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/771(2022.01) G06V 10/22(2022.01) G06V 10/54(2022.01) G06V 10/40(2022.01)G16B 40/00(2019.01) G16B 25/00(2019.01) (54)发明名称 分类模型获取方法、 表达类别确定方法、 装 置、 设备及 介质 (57)摘要 本公开提供了一种分类模型获取方法、 表达 类别确定方法、 装置、 设备及介质, 所述 分类模型 获取方法包括: 针对样本对象的肿瘤区域, 获取 肿瘤区域的多个影像组学特征和多个体素特征; 基于第一筛选因子对多个影像组学特征进行筛 选, 得到多个影像组学特征样本; 以及基于第二 筛选因子对多个体素特征进行筛选, 得到多个体 素特征样本; 其中, 第一筛选因子和第二筛选因 子均包括样 本对象的目标基因的表达类别标签; 基于多个影像组学特征样本和多个体素特征样 本, 构建训练样本; 以训练样本为输入, 对预设模 型进行训练, 得到分类模型, 分类模型用于预测 目标基因的表达 类别。 权利要求书4页 说明书22页 附图4页 CN 115457361 A 2022.12.09 CN 115457361 A 1.一种分类模型获取 方法, 其特 征在于, 所述方法包括: 针对样本对象的肿瘤区域, 获取 所述肿瘤区域的多个 影像组学特征和多个 体素特征; 基于第一筛选因子对多个所述影像组学特征进行筛选, 得到多个影像组学特征样本; 以及基于第二筛选因子对多个所述体素特征进行筛选, 得到多个体素特征样 本; 其中, 所述 第一筛选因子和所述第二筛 选因子均包括所述样本对象的目标基因的表达类别标签; 基于多个所述影 像组学特征样本和多个所述体素 特征样本, 构建训练样本; 以所述训练样本为输入, 对预设模型进行训练, 得到所述分类模型, 所述分类模型用于 预测所述目标基因的表达类别。 2.根据权利要求1所述的方法, 其特征在于, 所述获取所述肿瘤区域的多个影像组学特 征, 包括: 从所述肿瘤区域的图像样本中提取属于肿瘤非增强区的第 一亚区图像、 属于肿瘤增强 区的第二 亚区图像, 以及属于肿瘤周围水肿区的第三 亚区图像; 分别对所述第一亚区图像、 所述第二亚区图像以及所述第三亚区图像进行特征提取, 得到多个所述影 像组学特征。 3.根据权利要求1或2所述的方法, 其特征在于, 所述获取所述肿瘤区域的多个影像组 学特征, 包括: 获取所述肿瘤区域的多种类型的图像样本, 所述多种类型包括T1加权类型、 T2加权类 型、 对比度增强的T1加权类型和T2流体衰减期转恢复类型; 分别对每种类型的图像样本进行 特征提取; 将提取到的所述每种类型的图像样本各自对应的影像组学特征进行组合, 得到多个所 述影像组学特征。 4.根据权利要求1所述的方法, 其特征在于, 所述肿瘤区域为大脑中的胶质瘤区域, 所 述方法还 包括: 基于所述胶质瘤区域的图像样本, 确定所述胶质瘤区域对应的位置信息; 获取所述位置信息对应的位置特征; 其中, 所述位置信息包括所述胶质瘤区域所属的 大脑区域, 和/或所述胶质瘤区域在所述大脑中的位置坐标; 基于多个所述影 像组学特征样本和多个所述体素 特征样本, 构建训练样本, 包括: 基于所述位置特征、 多个所述影像组学特征样本和多个所述体素特征样本, 构建所述 训练样本 。 5.根据权利要求1所述的方法, 其特征在于, 所述第 一筛选因子包括所述表达类别标签 和所述肿瘤区域的肿瘤分级标签; 所述基于第一筛选因子对多个所述影像组学特征进 行筛 选, 得到多个 影像组学特征样本, 包括: 基于每个所述影像组学特征与所述表达类别标签之间的第 一关系值, 对多个所述影像 组学特征进 行筛选, 得到多个第一影像组学特征; 其中, 所述第一关系值用于表征所述影像 组学特征与所述目标基因的突变之间的关联程度; 基于每个所述影像组学特征与所述肿瘤 分级标签之间的第 二关系值, 对多个所述影像 组学特征进 行筛选, 得到多个第二影像组学特征; 其中, 所述第二关系值用于表征所述影像 组学特征与所述肿瘤分级之间的关联程度; 对多个所述第 一影像组学特征和多个第 二影像组学特征进行去重, 得到多个所述影像权 利 要 求 书 1/4 页 2 CN 115457361 A 2组学特征样本。 6.根据权利要求1 ‑5任一所述的方法, 其特征在于, 包括多个所述样本对象, 所述方法 还包括: 针对全部所述样本对象所包括的全部影像组学特征, 基于第 三筛选因子对所述全部影 像组学特征进 行筛选, 得到补充性影像组学特征样本; 其中, 所述第三筛选因子包括多个所 述样本对象各自对应的临床数据; 基于多个所述影 像组学特征样本和多个所述体素 特征样本, 构建训练样本, 包括: 基于多个所述影像组学特征样本、 多个所述体素特征样本和多个所述补充性影像组学 特征样本, 构建所述训练样本 。 7.根据权利要求6所述的方法, 其特征在于, 所述针对全部所述样本对象所包括的全部 影像组学特征, 基于第三筛选因子对所述全部影像组学特征进行筛选, 得到补充性影像组 学特征样本, 包括: 获取影像组学特征矩阵以及临床数据矩阵; 其中, 所述影像组学特征矩阵包括多个样 本对象各自对应的多个影像组学特征, 所述临床数据 矩阵包括多个样本对象各自对应的临 床数据; 基于所述影像组学特征矩阵和所述临床数据特征矩阵, 获取互信息系数矩阵, 所述互 信息系数矩阵包括每个影像组学特征与所述临床数据之 间的互信息系数, 所述互信息系数 用于表征 所述影像组学特征与所述临床数据之间的关联程度; 基于所述互信 息系数矩阵, 对所述影像组学特征矩阵所包括的全部影像组学特征进行 筛选, 得到多个所述补充性影 像组学特征样本。 8.根据权利要求1所述的方法, 其特征在于, 所述第二筛选因子包括所述表达类别标 签, 所述基于第二筛 选因子对多个所述体素 特征进行筛 选, 得到多个 体素特征样本, 包括: 获取每个所述体素特征的方差, 将方差大于第一方差阈值的体素特征保留, 得到多个 候选体素 特征; 以所述表达类别标签为预测标签, 以多个所述候选体素特征为输入, 利用线性回归模 型从多个所述 候选体素 特征中筛选出多个所述体素 特征样本。 9.根据权利要求1所述的方法, 其特征在于, 所述基于第 一筛选因子对多个所述影像组 学特征进行筛 选, 得到多个 影像组学特征样本之前, 所述方法还 包括: 确定每个所述影像组学特征对应的方差, 并将方差大于第 二方差阈值的影像组学特征 保留, 得到多个候选影 像组学特征; 所述基于第 一筛选因子对多个所述影像组学特征进行筛选, 得到多个影像组学特征样 本, 包括: 基于第一筛选因子对多个所述候选影像组学特征进行筛选, 得到多个影像组学特征样 本。 10.根据权利要求1所述的方法, 其特征在于, 所述获取所述肿瘤区域的多个影像组学 特征, 包括: 获取所述肿瘤区域的图像样本的小 波图像和L oG图像; 分别对所述肿瘤区域的图像样本、 所述小波图像和所述LoG图像进行多尺度特征提取, 得到所述肿瘤区域的一阶统计量特 征、 纹理特征和形态特 征;权 利 要 求 书 2/4 页 3 CN 115457361 A 3

PDF文档 专利 分类模型获取方法、表达类别确定方法、装置、设备及介质

文档预览
中文文档 31 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共31页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 分类模型获取方法、表达类别确定方法、装置、设备及介质 第 1 页 专利 分类模型获取方法、表达类别确定方法、装置、设备及介质 第 2 页 专利 分类模型获取方法、表达类别确定方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。