全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211030388.0 (22)申请日 2022.08.26 (71)申请人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 顾晓丹 黄茜 杨明 兰威  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 许小莉 (51)Int.Cl. H04L 9/40(2022.01) H04L 43/04(2022.01) H04L 43/0876(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种面向多页面的Web站点指纹攻击方法 (57)摘要 本发明公开一种面向多页面的Web站 点指纹 攻击方法, 该方法提供Web站点指纹攻击服务。 首 先构建单页面/多页面分类模型, 实现对未知混 淆流量的区分。 接下来针对单页面流量, 使用基 于深度学习的Web站点指纹攻击方法进行识别。 而 针 对 识 别 出 的 多 页 面 流 量 ,先 基 于 BalanceCascade算 法设计分割点识别方法, 对 其 进行分割。 随后对分割出的尾端缺失流量序列以 及前端重叠流量序列, 分别构建基于残差网络以 及多头自注 意力机制的指纹识别模 型, 最终实现 对多页面的识别。 发明通过利用残差网络和多头 自注意力机制提高对多页面的识别准确率, 进而 提高了Web站点指纹攻击的实用性。 权利要求书2页 说明书6页 附图2页 CN 115378726 A 2022.11.22 CN 115378726 A 1.面向多页面的Web站点指纹攻击方法, 其特 征在于, 该 方法包括: (1)单页面/多页面区分: 首先将网络流量以Tor信元时间方向序列表示, 利用该时间序 列特征, 使用卷积神经网络识别未知流 量是由访问单个或多个页面产生; (2)单页面识别: 对于识别出的单页面流量, 利用基于深度学习的Web站点指纹攻击方 法进行识别; (3)多页面分割点识别: 对于识别出的多页面流量, 首先针对上行数据包提取相关特 征, 设计模型识别出流量分割点, 从而将多页面流量分割为尾端流量缺 失的站点A流量序列 以及前端流 量重叠的站点B流 量序列; (4)尾端缺失流量序列识别: 分割出的站点A流量序列中不含有其他页面的流量数据 包, 但是缺失了一部分尾端流量数据包; 相对于完整的流量序列, 站点A的流量序列长度更 短, 所能提取的有效特征更少, 因此通过增加网络深度来学习更深层次的特征, 并引用残差 网络来解决梯度消失的问题; (5)前端重叠流量序列识别: 站点B流量序列前端含有一部分上一页面的尾端流量数 据, 因此, 首先对流量特征序列进 行分组, 利用多头注 意力机制, 对每个组计算注意力权重, 最后将注意力权重与原始流量特征序列相乘生成新的流量特征并进行识别, 以此提高对站 点B流量序列的识别准确率。 2.根据权利 要求1所述的面向多页面的Web站点指纹攻击方法, 其特征在于: 步骤(1)所 述单页面/多页面区分具体包括 其具体流 程为: (11)将TCP数据报文还原成Tor信元数据, 进一步将流量序列以Tor信元时间方向序列 表示; (12)使用含有三个卷积组的卷积神经网络构建单页面/多页面识别模型, 并使用 sigmoid函数作为激活函数, 二分类交叉熵函数作为损失函数; (13)将网络流 量时间序列输入单页面/多页面识别模型并获得最终的分类结果。 3.根据权利 要求1所述的面向多页面的Web站点指纹攻击方法, 其特征在于: 步骤(2)所 述单页面识别具体包括: (21)对于识别出的单页面 流量, 将流量序列以Tor信元 方向序列表示; (22)基于深度学习构建单页面识别模型, 模型通过四个卷积组的叠加完成搭建, 并在 每个卷积组中加入Dr oppout层缓解过拟合的发生, 使用sigmoid函数作为激活函数, 类交叉 熵函数作为损失函数; (23)将单页面 流量方向序列输入单页面识别模型并获得第一个站点的识别结果。 4.根据权利 要求1所述的面向多页面的Web站点指纹攻击方法, 其特征在于: 步骤(3)所 述多页面分割点识别具体包括: (31)对于识别出的多页面流量, 将流量中访问站点B的第一个HTTP请求数据包标记为 真分割点, 其 余上行数据包标记为 假分割点; (32)提取分割点前后所有数据包的时间特 征和数量特 征; (33)将上行包数据集分为真分割点数据集P以及假分割点数据集N, 将P、 N以及迭代次 数T作为参数输入到算法中, 利用P与N的大小计算分类器应该达到的FPR 阈值f, 即把假分割 点误分类为真 分割点的概 率, 如下式所示:权 利 要 求 书 1/2 页 2 CN 115378726 A 2(34)从假 分割点数据集N中随机挑选出与 P大小相同的子集Ni, 与P合并生成平衡数据集 Di, 利用平衡数据集Di训练生成XGBoost基分类器, 并调整参数θi控制XGBoost基分类器的 FPR阈值f, 然后将所有判断正确的假分割点样本从数据集 N中删除; (35)重复步骤(34)过程T ‑1次, 最终生成的分割点识别模型是由多个基分类器集成而 得到的, FPR阈值f的确 定使得在经过T ‑1次迭代后, 假分割 点数据集N中的样本个数如下式 所示: (36)利用步骤(35)得到的分割点识别 模型得到每个点是分割点的概率, 选择概率最大 的点作为流量的分割点, 在该分割点所对应的数据包之前的流量片段为尾端流量缺 失的站 点A流量序列, 在该分割点之后的流 量片段则为前端流 量重叠的站点B流 量序列。 5.根据权利 要求1所述的面向多页面的Web站点指纹攻击方法, 其特征在于: 步骤(4)所 述尾端缺失流 量序列识别具体包括: (41)通过交替添加恒等 块以及卷积块的方式构建尾端缺失序列识别模型; (42)将尾端缺失流量的方向序列输入步骤(41)构建的模型得到该序列属于每个站点 的概率, 最终选择概 率最大的站点作为预测结果。 6.根据权利要求1所述的面向多页面的Web站点指纹攻击方法, , 其特征在于: 步骤(5) 所述前端重 叠流量序列识别具体包括: (51)将前端重 叠流量的方向序列输入残差网络得到特 征序列; (52)将步骤(51)中生成的特征序列按列展平为一维张量, 并将其拆分成长度相同的特 征块; (53)利用多头注意力机制, 计算特征块与特征块之间的注意力权重, 将每个组的特征 块乘以注意力权 重, 最终利用Softmax分类 器进行分类。权 利 要 求 书 2/2 页 3 CN 115378726 A 3

PDF文档 专利 一种面向多页面的Web站点指纹攻击方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向多页面的Web站点指纹攻击方法 第 1 页 专利 一种面向多页面的Web站点指纹攻击方法 第 2 页 专利 一种面向多页面的Web站点指纹攻击方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:05:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。