全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211060121.6 (22)申请日 2022.09.01 (71)申请人 李海龙 地址 710000 陕西省西安市雁塔区北沈 新 世纪南区 (72)发明人 李海龙  (74)专利代理 机构 西安西达专利代理有限责任 公司 61202 专利代理师 第五思军 (51)Int.Cl. H04L 9/40(2022.01) H04L 67/02(2022.01) H04L 67/562(2022.01) H04L 69/08(2022.01) (54)发明名称 针对匿名通信系统内web服务的信息采集系 统及方法 (57)摘要 一种针对匿名通信系统内web服务的信息采 集系统, 包括有采集模块、 代理模块; 所述采集模 块, 通过控制浏览器的方式采集目标web服务所 提供的内容; 所述代理模块, 通过端口映射或协 议转换的方式接入目标web服务所使用的匿名通 信系统; 利用针对匿名通信系统内web服务的信 息采集系统采集信息的方法, 包括以下步骤: 步 骤S1, 使用采集模块, 接收外部任务, 将 任务解析 为具体请求, 发送至代理模块; 步骤S2, 使用代理 模块, 接收上述采集模块的请求, 通过匿名通信 系统桥接 器获取所请求的资源。 权利要求书2页 说明书4页 附图2页 CN 115442118 A 2022.12.06 CN 115442118 A 1.针对匿名通信系统内web服务的信息采集系统, 其特征在于, 包括有采集模块、 代理 模块; 所述采集模块, 通过控制浏览器的方式采集目标web服务所提供的内容; 所述代理模 块, 通过端口映射或协议转换 的方式接入使用的匿名通信系统; 匿名通信系统通常为建立 在Internet之上综合利用数据转 发、 内容加密、 流量混淆、 点对点通信多种技术隐藏通信实 体关系和内容的覆盖网络, 用于向普通用户提供Internet匿名访问功能以掩盖其网络通信 源和目标, 向服 务提供商提供隐藏 服务机制以实现匿名化的网络服 务部署。 2.根据权利要求1所述的针对匿名通信系统内web服务的信息采集系统, 其特征在于, 所述的采集模块包括: 1) 浏览器, 用于访问web服 务; 2) 浏览器控制器, 通过模拟输入或与浏览器API交互的方式, 对浏览器进行控制, 实现 截图或文本信息的提取; 3) 任务接收器, 通过消息队列、 API接口、 数据库传递消息方式, 接收并调用上述浏览器 控制器处 理外部任务。 3.根据权利要求1所述的针对匿名通信系统内web服务的信息采集系统, 其特征在于, 所述的代理模块包括: 1) 匿名通信系统桥接器, 桥接普通网络和匿名通信系统, 使桥接器自身可访 问匿名通 信系统; 2) 请求接收器, 用于通过socks代理、 VPN、 端口转发方式接收用户的请求, 通过桥接器 进行转发, 实现用户无需安装或使用特殊网络接入器也可以访问特殊网络转换器, 处理接 收器的请求。 4.利用针对匿名通信系统内web服务的信 息采集系统采集信 息的方法, 其特征在于, 包 括以下步骤: 步骤S1, 使用采集模块, 接收外 部任务, 将任务 解析为具体请求, 发送至代理模块; 步骤S2, 使用代 理模块, 接收上述采集模块的请求, 通过匿名通信系统桥接器获取所请 求的资源。 5.根据权利要求4所述的利用针对匿名通信系统内web服务的信息采集系统采集信息 的方法, 其特 征在于, 所述的步骤S1, 又包括以下步骤: 步骤S1.1, 通过消息队列、 API接口、 数据库传递消息方式, 接收外部系统或用户的信息 采集任务; 步骤S1.2, 解析任务, 调用浏览器控制器, 控制浏览器将任务解析为具体的请求后, 对 代理模块发起该请求; 步骤S1.3, 等待代理模块返回匿名通信系统对请求的响应; 步骤S2.4, 根据设置采取屏幕截图或渲染后HTML另存为图片的方式, 将采集到的信息 进行存储。 6.根据权利要求4所述的利用针对匿名通信系统内web服务的信息采集系统采集信息 的方法, 其特 征在于, 所述的步骤S2, 又包括以下步骤: 步骤S2.1, 请求接收模块 通过socks代理、 ht tp代理、 VPN 等方式, 接收采集模块请求; 步骤S2.2, 请求接收模块通过判断接收到请求的接入点、 接入方式、 请求内容等特征, 按照系统设置将 请求转发至对应的匿名通信系统桥接器;权 利 要 求 书 1/2 页 2 CN 115442118 A 2步骤S2.3, 匿名通信系统桥接器将匿名通信系统的响应进行返回。权 利 要 求 书 2/2 页 3 CN 115442118 A 3

PDF文档 专利 针对匿名通信系统内web服务的信息采集系统及方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 针对匿名通信系统内web服务的信息采集系统及方法 第 1 页 专利 针对匿名通信系统内web服务的信息采集系统及方法 第 2 页 专利 针对匿名通信系统内web服务的信息采集系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:05:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。