(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211033769.4
(22)申请日 2022.08.26
(71)申请人 江苏警官 学院
地址 210000 江苏省南京市浦口区石佛寺
三宫48号
(72)发明人 谢文伟 印杰 梁广俊
(74)专利代理 机构 芜湖思诚知识产权代理有限
公司 34138
专利代理师 房文亮
(51)Int.Cl.
H04L 9/40(2022.01)
G06K 9/62(2022.01)
G06N 20/20(2019.01)
(54)发明名称
一种用于概念漂移检测和自适应的方法及
IoT安全框架
(57)摘要
本发明公开了一种用于概念漂移检测和自
适应的方法及IoT安全框架, 涉及物联网技术领
域, 包括数据准备、 训练模型候选、 模型选 择及预
测输出四个步骤, 本发明针对物联网攻击和恶意
流量识别等安全问题, 提出一种面向概念漂移检
测和自适应的方法及相应的IoT安全框架, 通过
验证物联网流量对数据漂移 检测的有效性, 对AI
模型性能进行评估, 从而选择最佳的AI模型。 通
过对比实验, 验证了该框架和自适应方法在实际
中的可行性, 以及在对IoT安全流量识别性能的
提升作用。
权利要求书3页 说明书10页 附图2页
CN 115412337 A
2022.11.29
CN 115412337 A
1.一种用于概念漂移检测 和自适应的方法, 其特 征在于, 包括如下步骤:
S1.数据准备
准备IoT数据集DataSet用来训练模型, 对数据集DataSet进行有放回抽样, 经过采样
后, 得到M个子训练集DataSet1,DataSet2,...,DataSetM;
S2.训练模型候选
在模型准备阶段, 在每个训练集上, 训练出分类器作为候选模型, 并使用直方图对训练
集的特征分布进行表征, 同时记录每 个特征对模型的重要程度;
S3.模型选择
在模型选择阶段, 使用直方图对待预测数据的特征分布进行表征, 然后, 根据直方图的
相似度, 在候选模型中, 寻找到最相似的训练集, 并使用该训练集上训练的模型最为决策模
型;
S4.预测输出
通过相似度对直方图表征的比较, 寻找到最相似的训练集, 并使用该训练集上训练的
模型最为决策模型。
2.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步
骤S1中采用ba gging抽样方法, 使用不同正负 样本配比, 选择5%的原 始数据样本 。
3.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步
骤S2中具体方法如下:
训练baseline模型: 使用M个训练集, N个特征, 在每个训练集上, 生成一个直方图矩阵
H, 训练出一个分类器E和对应权重序列K, 这样共得到M个直方图(H1,H2,…HM), M个分类器
(E1,E2,…EM)和M个权 重序列(K1,K2,…KM);
每个训练集的直方图H生成方法如下:
对某一个特征X而言, 假设X的特征值为一个序列x1,x2,…xT, T表示该特征值序列的长
度, i表示特征值序列中的位置, 将特征值序列中的元素按大小分成若干个范围, 每个范围
称为一个bin, hj表示该特征值在第j个bi n中出现的次数, hj的计算方法如公式(1)所示:
其中Ii为指示函数, 计算方法如公式(2)所示:
通过公式(1)和(2)可计算出特征X的直方图h=h1,h2,…,hC, 使用同样的方法, 为每个
特征计算出直方图, 得到直方图矩阵h'如公 式(3)所示, C为直方图中bin的数量, N为特征的
数量:
将直方图矩阵h'转换为 一维, 得到该训练集的直方图H如公式(4)所示:权 利 要 求 书 1/3 页
2
CN 115412337 A
2H=h1,1,h1,2,…,h1,C,h2,1,h2,2,…,h2,C,…,hN,1,hN,2,…,hN,C (4)
在每个训练集上的生成分类 器E和权重序列K的方法如下:
选择分类器模型, 并使用训练集中的样本对模型进行训练, 通过训练得到分类器, 在训
练同时, 记录每个特征对模型的重要程度, 并使用序列k1,k2, θ,kN进行表示, N为特征的数
量, 称序列k1,k2,…,kN为权重序列K。
4.根据权利要求1所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步
骤S3中采用了Self ‑adaption EMD的相似度的度量方法, 该方法首先使用步骤S3中的直方
图生成方法, 为待预测数据生成直方图H', 然后分别计算H'与每个训练集直方图H的相似
度。
5.根据权利要求4所述的一种用于概念漂移检测和自适应的方法, 其特征在于, 所述步
骤S3中, 令H=P, H'=Q, 即P和Q分别表示训练样本和待预测数据的直方图, Pi和Qi分别表示
各自的直方图某个bi n值,
表示Pi的权重,
表示Qi的权重, 如公式(5)和(6)所示:
定义流动量矩阵F, 如公式(7)所示, 其中, fij表示从Pi到Qi的流动数量;
F=[fij] (7)
定义dij为从Pi到Qi的距离, 代价函数如公式(8)所示, 其中, K表示权重序列, A表示训练
集直方图bin的数量, B表 示待预测数据直方图bin的数量, g(i)为训练集直方图中, 第i个元
素对应的特 征在权重序列K中的值;
通过线性规划, 计算出当公式(8)取最小值时, 流动量矩阵F的取值, 计算方法如公式
(9)所示, 其中,
为代价函数, s.t.表示约束条件;
在使用公式(9)计算出流动量矩阵F后, 再使用公式(10)计算出待预测数据直方图Q和权 利 要 求 书 2/3 页
3
CN 115412337 A
3
专利 一种用于概念漂移检测和自适应的方法及IoT安全框架
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:05:47上传分享