全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211035597.4 (22)申请日 2022.08.26 (71)申请人 广州鑫景信息科技 服务有限公司 地址 510000 广东省广州市海珠区鼎新路 108号1501室 (72)发明人 李亚平 唐磊 伍泳潮 黄壮强  (74)专利代理 机构 广州立诚聚凡专利代理事务 所(普通合伙) 44905 专利代理师 郑义千 (51)Int.Cl. H04L 9/40(2022.01) (54)发明名称 一种基于TLS和webrtc的深度反爬方法、 系 统、 设备、 及 介质 (57)摘要 本发明涉及一种基于TLS和webrtc的深度反 爬方法、 系统、 设备、 及介质, 其技术方案要 点是: 所述方法包括: 获取携带有用户信息的TCP握手 请求; 根据所述TCP握手请求生成对应的TLS指 纹; 将TLS指纹和用户信息与redis指纹库进行数 据比对, 判断是否为恶意访问, 若为是, 则拒绝访 问; 根据TCP握手请求返回用于检测环境的 JavaScript文件, 获取用户返回的画布信息、 字 体信息、 音频指纹和即时通信地址; 判断即时通 信地址与TCP握手请求的IP信息是否一致, 若不 一致, 则拒绝访问; 获取与画布信息、 字体信息、 音频指纹或即时通信地址完全一致的请求的访 问频率, 根据访问频率和预设访问频率进行比 对, 若访问频率大于预设访问频率, 则拒绝访问; 本申请具有能够防止数据被 爬虫抓取的优点。 权利要求书2页 说明书9页 附图3页 CN 115396213 A 2022.11.25 CN 115396213 A 1.一种基于TLS和WebRTC的深度反爬方法, 其特 征在于, 包括: S1、 获取携带有用户信息的TCP握 手请求; S2、 根据所述TCP握 手请求生成对应的TLS 指纹; S3、 将TLS指纹和用户信息与redis指纹库进行数据比对, 判断是否为恶意访问, 若为 否, 则执行S4, 若为是, 则拒绝访问; S4、 根据TCP握手请求返回用于检测环境的JavaScript文件, 获取用户返回的画布信 息、 字体信息、 音频指纹和即时通信地址; S5、 判断所述即时通信地址与TCP握手请求的IP信息是否一致, 若一致, 则执行S6; 若不 一致, 则拒绝访问; S6、 获取与画布信息、 字体信息、 音频指纹或即时通信地址完全一致的请求的访问频 率, 根据该访问频率和预设访问频率进 行比对, 若 该访问频率大于预设访问频率, 则拒绝访 问并在封禁该即时通信地址或音频指纹。 2.根据权利 要求1所述的方法, 其特征在于, 所述根据所述TCP握手请求生成对应的TLS 指纹, 包括: 根据所述TCP握 手请求获取对应的TLS信息; 将所述TLS信息中的version、 Cipher  Suites、 Extension  length、 Extension: elliptic_curves和Exten sion:ec_pooint_formats进行组合并通过MD5算 法进行加密生成 TLS指纹。 3.根据权利 要求2所述的方法, 其特征在于, 所述将TLS指纹和用户信息与redis指纹库 进行数据比对, 包括: 获取所有浏览器指纹及其对应的用户代理; 将各个浏览器指纹作为 值, 对应的用户代理作为键存 储到redis指纹库中; 将所述TLS指纹与所述redis指纹库 中的各个浏览器指纹进行比对; 若所述redis指纹 库存在与TLS指纹相同的浏览器指纹, 则将该浏览器指纹对应的用户代理与TLS指纹对应的 用户信息进 行比对, 若 该浏览器指纹对应的用户代理与TLS指纹对应的用户信息一致, 则判 定不是恶意访问; 若 该浏览器指纹对应的用户代理与TLS指纹对应的用户信息不一致, 则判 定为恶意访问; 若redis指纹库不存在与TLS 指纹相同的浏览器指纹, 则判定为恶意访问。 4.根据权利要求3所述的方法, 其特征在于, 所述JavaScript文件用于对用户进行画布 信息、 字体信息和音频指纹检测, 与用户进行WebRTC以获取用户的即时通信地址; 所述获取用户返回的画 布信息、 字体信息、 音频指纹和即时通信地址包括: 通过JavaScript文件获取用户的画 布信息、 字体信息和音频指纹; 通过WebRTC获取用户的即时通信地址 。 5.根据权利 要求1所述的方法, 其特征在于, 在所述将TLS指纹和用户信息与redis指纹 库进行数据比对之后, 还 包括: 通过混淆工具对JavaScript文件进行混淆。 6.根据权利要求5所述的方法, 其特征在于, 在所述判断所述即时通信地址与TCP握手 请求的IP信息是否一 致, 若一致, 则执行S6之后, 还 包括: 将用户返回的画 布信息、 字体信息、 音频指纹和即时通信地址存 储到redis中间件中。 7.根据权利要求5所述的方法, 其特征在于, 所述根据该访问频率和预设访问频率进行权 利 要 求 书 1/2 页 2 CN 115396213 A 2比对, 还包括: 若该访问频率小于预设访问频率, 则将redis中间件中的数据存储到redis中用于认证 接口; 返回安全参数令牌。 8.一种基于TLS和webr tc的深度反爬系统, 其特 征在于, 包括: 请求获取模块, 用于获取携带有用户信息的TCP握 手请求; 指纹生成模块, 用于根据所述TCP握 手请求生成对应的TLS 指纹; 指纹比对模块, 用于将TLS指纹和用户信息与redis指纹库进行数据比对, 判断是否为 恶意访问, 若为否, 则执 行下一步骤, 若为是, 则拒绝访问; 环境检测模块, 用于根据TCP握手请求返回用于检测环境的JavaScript文件, 获取用户 返回的画 布信息、 字体信息、 音频指纹和即时通信地址; IP比对模块, 用于判断所述即时通信地址与TCP握手请求的IP信息是否一致, 若一致, 则执行下一步骤; 若不 一致, 则拒绝访问; 频率判断模块, 用于获取与画布信 息、 字体信 息、 音频指纹或即时通信地址完全一致的 请求的访问频率, 根据该访问频率和预设访问频率进行比对, 若该访问频率大于预设访问 频率, 则拒绝访问并在封禁该即时通信地址或音频指纹。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115396213 A 3

PDF文档 专利 一种基于TLS和webrtc的深度反爬方法、系统、设备、及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于TLS和webrtc的深度反爬方法、系统、设备、及介质 第 1 页 专利 一种基于TLS和webrtc的深度反爬方法、系统、设备、及介质 第 2 页 专利 一种基于TLS和webrtc的深度反爬方法、系统、设备、及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:05:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。