(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211049325.X
(22)申请日 2022.08.30
(71)申请人 南京邮电大 学
地址 210023 江苏省南京市仙林大 学城文
苑路9号
申请人 安徽晶奇网络科技股份有限公司
(72)发明人 李鹏 牛胜杰 徐鹤 王汝传
张玉杰 朱枫 程海涛 李友涛
张结魁 陈莉莉
(74)专利代理 机构 南京经纬专利商标代理有限
公司 32200
专利代理师 王美章
(51)Int.Cl.
H04L 9/40(2022.01)
H04L 67/12(2022.01)G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
一种基于改进生成对抗网络的物联网协议
模糊测试方法
(57)摘要
本发明提出基于改进生成对抗网络的物联
网协议模糊测试方法, 解决了传统协议模糊测试
中需要掌握协议格式进而生成满足目标系统要
求的测试用例的问题。 在测试用例的接受率、 漏
洞的检出率指标上, 本发明方法与传统方法相比
具有显著的优越性, 采用本发明所生成的测试用
例具有正确的协议格式, 并且保持其多样性。
权利要求书2页 说明书6页 附图2页
CN 115549971 A
2022.12.30
CN 115549971 A
1.一种基于改进生成对抗网络的物联网协议模糊测试方法, 其特征在于, 包括以下步
骤:
S1、 收集物联网 网络报文并对其进行 数据预处 理;
S2、 针对物联网协议模糊测试的问题抽象;
S3、 改进Ran kGAN模型的构造; 具体包括以下子步骤:
S3.1、 结合批标准化处理的生成器构造: 在改进后的RankGAN模型中, 生成器用到LSTM
网络, 当生成器收到Ranker的得分信息后, 利用反馈及时调整其参数, 进而生成下一个数
据;
S3.2、 结合自注意力机制的Ranker: 为提高模型的训练速度, 选择CNN作为基础网络实
现Ranker, 改进后的Ranker结构包括输入层、 嵌入层、 4个conv ‑1d层、 4个自注意力层、 池化
层;
S4、 改进Ran kGAN模型的训练。
2.根据权利要求1所述的基于改进生成对抗网络的物联网协议模糊测试方法, 其特征
在于, 步骤S1包括以下子步骤:
S1.1、 按照数据帧长度构造,
S1.2、 按照数据类别构造, 利用PAM算法将复杂的数据集按照不同的协议特征进行分
类, 通过协议特 征信息构造数据集实现对各协议功能进行 “单点”测试;
S1.3、 混合构造, 结合步骤S1.1和步骤S1.2上述两种构造方式, 将数据长度相同的报文
和协议特征相似的报文进行随机混合, 符合真实网络流量的报文分布特点, 以增加 生成器
的输出类别, 增强 发现漏洞的能力。
3.根据权利要求1所述的基于改进生成对抗网络的物联网协议模糊测试方法, 其特征
在于, 步骤S2中从网络流量中获取的数据是以序列的形式存在, 问题抽象为M(1: n)=(s1,s2,
L,sn), si∈S, M(1: n)∈M*, 其中,
S表示十六进制的字符集, 即S={0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f},
M*表示所有的原 始报文数据。
4.根据权利要求1所述的基于改进生成对抗网络的物联网协议模糊测试方法, 其特征
在于, 步骤S3.1中, 所述改进的RankGAN模型中, 分别对生成器的tanh激活函数和sigmoid激
活函数添加了批标准化操作。
5.根据权利要求1所述的基于改进生成对抗网络的物联网协议模糊测试方法, 其特征
在于, 步骤S3.2中, 所述改进的Ran ker中使用放缩点积自注意力机制加以优化。
6.根据权利要求1所述的基于改进生成对抗网络的物联网协议模糊测试方法, 其特征
在于, 步骤S4中, 设词汇集 为V, 在t时刻已生成的序列为:
s1:t‑1=(x0,x1,L,xt‑1), 其中,
xi∈V, i∈[0,t ‑1], 下一个tokenxt是策略πθ(xt|s1:t‑1)的动作采样, 当生成一个完整的
序列后会发送给R anker, 根据比较集C和参考集U获得排名奖励RΦ(s|U,C), 采用蒙特卡罗搜
索 的 方 式 计 算 中 间 状 态 的 排 名 得 分 ,中 间 状 态 的 r e w a r d 由 公 式 :
计算得出, 其中,
s1:t‑1为已生成序列,权 利 要 求 书 1/2 页
2
CN 115549971 A
2U为参考集,
表示x从Gθ分布中获取的期望算子,
RΦ(x|U,C+,s1:t‑1)为当前输入的排名得分,
C+表示从真实数据集经 过预采样得到的真实数据集;
原始token(x0,x1,L,xt‑1)是固定的, 剩下的(T ‑t)个token是按Gθ连续采样的结果, 重复
抽样n个不同的采样并计算各自的排名得分, 求其平均后用于近似当前部分序列的预期奖
励; 当计算出中间奖励后, 便得到生成器Gθ的目标函数梯度:
其中,
是偏微分算子, 开始状态s0为第一个生成的to kenx0,
表示基于当前生成器参数θ在一个小批量内对所有抽样完整句子的平均值,
πθ(xt|s1:t‑1)为当前采样策略,
Vθ,Φ(s1:t,U)为中间状态的reward;
Ranker的目标函数为:
其中,
表示x从Preal(x)
分布中获取的期望算子,
表示x从Gθ分布中获取的期望算子,
x~Preal(x)表示x来自真实数据,
x~Gθ表示输入 x来自生成数据,
C‑、 C+表示对不同输入 x的比较集;
在实际训练过程中, 通过最小化logRΦ(x|U,C+), 代替最大化log(1 ‑RΦ(x|U,C+)), 加快
模型收敛速度。权 利 要 求 书 2/2 页
3
CN 115549971 A
3
专利 一种基于改进生成对抗网络的物联网协议模糊测试方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:05:39上传分享