全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210406155.X (22)申请日 2022.04.18 (71)申请人 河海大学 地址 211100 江苏省南京市江宁区秣陵街 道佛城西路8号河海大 学江宁校区 (72)发明人 钱奂奂 李臣明  (74)专利代理 机构 北京中政联科专利代理事务 所(普通合伙) 11489 专利代理师 邵娟 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/70(2018.01) G06F 21/62(2013.01) (54)发明名称 一种基于数据挖掘的脑卒中疾病预测方法 (57)摘要 本发明公开一种基于数据挖掘的脑卒中疾 病预测方法, 将数据集中的患病人群的数据指标 和未患病人群的数据指标通过数据清洗、 数据处 理、 数据规约、 数据变换, 将数据输入模型, 从而 挖掘其中隐藏的规律和有效信息。 提出一种混合 神经网络模型(1DMSCNN+SENET+GRU), 实验结果 表明, 算法的评价指标准确率、 精确度、 召回率与 传统的网络模 型相比均有明显的提高。 通过构建 脑卒中疾病风险的预测模型, 可以辅助医生对脑 卒中疾病风险的早期预测, 尽早干预, 也对脑卒 中风险预测的智慧医疗具有一定的意 义。 权利要求书2页 说明书3页 附图3页 CN 114822815 A 2022.07.29 CN 114822815 A 1.一种基于数据 挖掘的脑卒中疾病预测方法, 其特 征在于, 包括以下步骤: a)数据采集: 样本数据的采集和选取, 由于研究是基于江苏省苏州市某医院患者的真 实数据, 因此根据 《区域健康信息数据平台数据采集接口标准》 采集数据, 采用的是SQL   Server数据库, 同时由于医疗数据的特殊性, 某些数据携带有患者的 隐私, 因此要对 数据进 行一定的脱密处 理之后才能继续进行 数据分析和预处 理的相关工作; b)数据预处理: 数据分析和处理, 由于病人隐私, 对于体检数据存在个体信息缺失、 病 历无记录、 数据量纲和单位差异较大等问题, 将很大程度的影响模型的训练结果, 因此要对 相关指标进 行数据清洗, 缺失值处理和异常值分析, 从而规范数据, 转化成符合模型的输入 数据, 为输入模型作准备, 又 由于患者的体检数据繁杂, 涉及 几十项指标, 但是不同的指标 对于结果的权重不一样, 所以要通过数据特征选择和降维进一步确定导致脑卒中发病风险 的影响因素, 筛 选模型的输入数据, 降低无效、 错 误数据对建模的影响, 提高建模的准确性; c)建模: 预测模型的建立, 针对脑卒中的风险预测问题, 将疾病辅助 预测视为特征分类 问题, 选取数据挖掘技术中的神经网络分类算法, 并在之基础上进行不同神经网络的混合 来提取数据特征, 并调节参数, 提高模型的准确率; d)模型评估: 模型的评估, 建立模型后, 结果的评价直接关系着模型的价值, 混淆矩阵 可以通过矩阵的形式来呈现算法性能的可视化效果, 通过混淆矩阵, 可以得到分类预测模 型的分类准确率, 分类精确率, 召回率, 以及F1分数, 因此, 通过准确率、 精确率、 召回率、 F1 分数四个指标来评估 模型, 并通过对照模型实验来验证模型的有效性。 2.如权利要求1所述的一种基于数据挖掘的脑卒中疾病预测方法, 其特征在于, a)数据 采集方法: 根据 《区域健康信息数据 平台数据采集接口标准》 采集数据, 包括数据查询, 数据 集成等。 3.如权利要求1所述的一种基于数据挖掘的脑卒中疾病预测方法, 其特征在于, b)预处 理方法: 数据预处理主要的过程是清洗数据、 数据集成、 数据规约和数据变换, 数据清理主 要包括对于缺失值和异常数据的处理; 数据集成是对多个来源的数据进行集成, 并处理数 据不一致和冗余性的问题, 数据规约则是指对原始数据的压缩和简化, 小波变换和主成分 分析是数据压缩即数据降维技术, 属 性子集选择是指去掉不相关的属 性, 获取更有用的属 性, 但不损失原数据的信息价值, 减少数据挖掘过程中的数据负担; 数据变换是针对属性的 单位或者量纲等问题, 把数据转换成更加 适合数据挖掘和建模的数据形式, 有效的高质量 数据价值比庞大的数据集更 具有研究意 义。 4.如权利要求1所述的一种基于数据挖掘的脑卒中疾病预测方法, 其特征在于, c)建模 算法: 选取算法的标准往往要从两方面来进 行, 第一个方面是数据挖掘的实际目的, 进行数 据的挖掘的目的是对疾病进行风险预测, 那么便可以总 结是一个分类 问题, 通过将数据输 入模型, 期望输出是否具有患病风险, 即期望呈现的结果有两类: 有风险、 无风险, 因此算法 要选择合适的分类算法, 另一个方面是数据本身的特点和性质, 针对 数据来说, 由于体检数 据具有高维、 时序性等特点, 选取算法要考虑在提取不同维度特征 的基础上不能丢失时序 性特征。 5.如权利要求1所述的一种基于数据挖掘的脑卒中疾病预测方法, 其特征在于, d)模型 评估: 通过模型评估来看模型的好坏程度, 但是模 型评估的指标往往都是一堆数字, 并没有 直接意义的表达, 因此需要完成对模型评估结果的可视化解释, 通过实现数据可视化来大权 利 要 求 书 1/2 页 2 CN 114822815 A 2大提高结果的可读性, 从而真正将数据 挖掘的有效结果应用于实 践。权 利 要 求 书 2/2 页 3 CN 114822815 A 3

PDF文档 专利 一种基于数据挖掘的脑卒中疾病预测方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据挖掘的脑卒中疾病预测方法 第 1 页 专利 一种基于数据挖掘的脑卒中疾病预测方法 第 2 页 专利 一种基于数据挖掘的脑卒中疾病预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。