全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211033769.4 (22)申请日 2022.08.26 (71)申请人 江苏警官 学院 地址 210000 江苏省南京市浦口区石佛寺 三宫48号 (72)发明人 谢文伟 印杰 梁广俊  (74)专利代理 机构 芜湖思诚知识产权代理有限 公司 34138 专利代理师 房文亮 (51)Int.Cl. H04L 9/40(2022.01) G06K 9/62(2022.01) G06N 20/20(2019.01) (54)发明名称 一种用于概念漂移检测和自适应的方法及 IoT安全框架 (57)摘要 本发明公开了一种用于概念漂移检测和自 适应的方法及IoT安全框架, 涉及物联网技术领 域, 包括数据准备、 训练模型候选、 模型选 择及预 测输出四个步骤, 本发明针对物联网攻击和恶意 流量识别等安全问题, 提出一种面向概念漂移检 测和自适应的方法及相应的IoT安全框架, 通过 验证物联网流量对数据漂移 检测的有效性, 对AI 模型性能进行评估, 从而选择最佳的AI模型。 通 过对比实验, 验证了该框架和自适应方法在实际 中的可行性, 以及在对IoT安全流量识别性能的 提升作用。 权利要求书3页 说明书10页 附图2页 CN 115412337 A 2022.11.29 CN 115412337 A 1.一种用于概念漂移检测 和自适应的方法, 其特 征在于, 包括如下步骤: S1.数据准备 准备IoT数据集DataSet用来训练模型, 对数据集DataSet进行有放回抽样, 经过采样 后, 得到M个子训练集DataSet1,DataSet2,...,DataSetM; S2.训练模型候选 在模型准备阶段, 在每个训练集上, 训练出分类器作为候选模型, 并使用直方图对训练 集的特征分布进行表征, 同时记录每 个特征对模型的重要程度; S3.模型选择 在模型选择阶段, 使用直方图对待预测数据的特征分布进行表征, 然后, 根据直方图的 相似度, 在候选模型中, 寻找到最相似的训练集, 并使用该训练集上训练的模型最为决策模 型; S4.预测输出 通过相似度对直方图表征的比较, 寻找到最相似的训练集, 并使用该训练集上训练的 模型最为决策模型。 2.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步 骤S1中采用ba gging抽样方法, 使用不同正负 样本配比, 选择5%的原 始数据样本 。 3.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步 骤S2中具体方法如下: 训练baseline模型: 使用M个训练集, N个特征, 在每个训练集上, 生成一个直方图矩阵 H, 训练出一个分类器E和对应权重序列K, 这样共得到M个直方图(H1,H2,…HM), M个分类器 (E1,E2,…EM)和M个权 重序列(K1,K2,…KM); 每个训练集的直方图H生成方法如下: 对某一个特征X而言, 假设X的特征值为一个序列x1,x2,…xT, T表示该特征值序列的长 度, i表示特征值序列中的位置, 将特征值序列中的元素按大小分成若干个范围, 每个范围 称为一个bin, hj表示该特征值在第j个bi n中出现的次数, hj的计算方法如公式(1)所示: 其中Ii为指示函数, 计算方法如公式(2)所示: 通过公式(1)和(2)可计算出特征X的直方图h=h1,h2,…,hC, 使用同样的方法, 为每个 特征计算出直方图, 得到直方图矩阵h'如公 式(3)所示, C为直方图中bin的数量, N为特征的 数量: 将直方图矩阵h'转换为 一维, 得到该训练集的直方图H如公式(4)所示:权 利 要 求 书 1/3 页 2 CN 115412337 A 2H=h1,1,h1,2,…,h1,C,h2,1,h2,2,…,h2,C,…,hN,1,hN,2,…,hN,C      (4) 在每个训练集上的生成分类 器E和权重序列K的方法如下: 选择分类器模型, 并使用训练集中的样本对模型进行训练, 通过训练得到分类器, 在训 练同时, 记录每个特征对模型的重要程度, 并使用序列k1,k2, θ,kN进行表示, N为特征的数 量, 称序列k1,k2,…,kN为权重序列K。 4.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步 骤S3中采用了Self ‑adaption  EMD的相似度的度量方法, 该方法首先使用步骤S3中的直方 图生成方法, 为待预测数据生成直方图H', 然后分别计算H'与每个训练集直方图H的相似 度。 5.根据权利要求4所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步 骤S3中, 令H=P, H'=Q, 即P和Q分别表示训练样本和待预测数据的直方图, Pi和Qi分别表示 各自的直方图某个bi n值, 表示Pi的权重, 表示Qi的权重, 如公式(5)和(6)所示: 定义流动量矩阵F, 如公式(7)所示, 其中, fij表示从Pi到Qi的流动数量; F=[fij]              (7) 定义dij为从Pi到Qi的距离, 代价函数如公式(8)所示, 其中, K表示权重序列, A表示训练 集直方图bin的数量, B表 示待预测数据直方图bin的数量, g(i)为训练集直方图中, 第i个元 素对应的特 征在权重序列K中的值; 通过线性规划, 计算出当公式(8)取最小值时, 流动量矩阵F的取值, 计算方法如公式 (9)所示, 其中, 为代价函数, s.t.表示约束条件; 在使用公式(9)计算出流动量矩阵F后, 再使用公式(10)计算出待预测数据直方图Q和权 利 要 求 书 2/3 页 3 CN 115412337 A 3

PDF文档 专利 一种用于概念漂移检测和自适应的方法及IoT安全框架

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于概念漂移检测和自适应的方法及IoT安全框架 第 1 页 专利 一种用于概念漂移检测和自适应的方法及IoT安全框架 第 2 页 专利 一种用于概念漂移检测和自适应的方法及IoT安全框架 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:05:47上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。