全网唯一标准王
中国信息通信研究院技术与标准研究所 华为技术有限公司 2025年9月 基于智能 IP广域网 (AI WAN)的存算分离与 云边协同训推技术研究报告 (2025年) 版权声明 本报告版权属于 中国信息通信研究院、华为技术有限公 司,并受法律保护 。转载、摘编或利用其它方式使用 本报告 文字或者观点的,应 注明“来源:中国信息通信研究院、华 为技术有限公司” 。 违反上述声明者, 编者将追究其相关法律 责任。 前 言 智能时代加速到来,企业模型训练、推理算力需求爆炸式增长。 对于企业来说, 采用第三方云上智算资源是降低资本支出的最佳选择, 但在数据入算、模型微调、推理输出等过程中可能面临数据、模型泄 漏的问题。对于企业和行业用户来说,一方面要降低算力成本,同时 又要保障训练、推理过程中的数据安全、用算安全。本报告研究面向 政企模型微调训练、推理等业务场景,围绕企业安全用算需求,基于 智能 IP广域网( AI WAN)研究并提出了存算分离与云边协同训推技 术方案,满足企业原始数据不出域、安全租用云端算力、降低企业用 算成本的需求。 在存算分离模型微调训练场景下,针对企业敏感数据园区外“不 落盘”需求,采用精准流控、自动流级调度技术实现用户私有存储与 远端算力中心之间的高效无损传输,可保障拉远 100KM、400KM达 到97%以上高算效,满足拉远训练需求。 在云边协同推理场景下,通过企业侧部署一体机提供少量算力, 利用模型拆分学习技术、精准流控和自动流级调度技术,实现推理性 能95%以上高算效,满足企业推理数据不出域的安全推理诉求。 本报告中同步给出了实验室环境下的测试验证, 希望为业界提供 企业安全用算、灵活用算的技术参考。 目 录 一、 概述 ................................ ................................ ................................ ...................... 1 (一)背景 ................................ ................................ ................................ ............. 1 (二) AI大模型训练与推理技术应用 ................................ ............................... 2 二、 大模型微调训推场景面临的挑战 ................................ ................................ ...... 4 三、 基于智能 IP广域网( AI WAN)的存算分离与云边协同训推技术方案 ..... 6 (一)方案总体架构 ................................ ................................ ............................. 6 (二)模型拆分学习技术 ................................ ................................ ..................... 8 (三)精准流控技术 ................................ ................................ ........................... 11 (四)自动流级调度技术 ................................ ................................ ................... 14 四、 关键技术典型场景实验 ................................ ................................ .................... 17 (一)存算分离拉远算效 ................................ ................................ ................... 17 (二)云边协同推理安全性 ................................ ................................ ............... 18 (三)云边协同算力资源配置优化 ................................ ................................ ... 19 五、 总结展望 ................................ ................................ ................................ ............ 22 图 目 录 图 1 当前企业大模型微调训推场景算力解决方案示意图 ................................ ..... 4 图 2 存算分离与云边协同训推技术方案 ................................ ................................ . 6 图 3 模型拆分学习技术工作机制 ................................ ................................ ............. 9 图 4 Transformer 模型架构 ................................ ................................ ....................... 10 图 5 租户级拥塞导致整体算效下降示意图 ................................ ........................... 12 图 6 租户级拥塞不会导致拥塞扩散示意图 ................................ ........................... 12 图 7 精准流控技术工作机制 ................................ ................................ ................... 13 图 8 现有流级调度技术 ................................ ................................ ........................... 14 图 9 自动流级调度技术工作机制 ................................ ................................ ........... 15 图 10 实验室验证组网示意图 ................................ ................................ ................. 17 图 11 集中式推理网络抓包示意图 ................................ ................................ ......... 19 图 12 云边协同推理网络抓包示意图 ................................ ................................ ..... 19 图 13 集中式推理算力利用率 ................................ ................................ ................. 20 图 14 云边协同推理算力利用率 ................................ ................................ ............. 20 表 目 录 表1 典型行业 AI训推技术应用情况表 ................................ ................................ .... 3 表2 各类网络训推技术方案安全性对比 ................................ ................................ 22 基于智能 IP广域网( AI WAN)的存算分离与云边协同训推技术研究报告( 2025年) 1 一、概述 (一)背景 近年来,我国人工智能创新成果持续涌现,技术加速与实体经济 深度融合, 从自动驾驶汽车、 智能医疗诊断, 到人机交互、 智能家居、 智能教育等场景, 人工智能的广泛应用不仅为人们生活带来诸多便

.pdf文档 信通院 基于智能IP广域网 AI WAN 的存算分离与云边协同训推技术研...

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
信通院 基于智能IP广域网 AI WAN 的存算分离与云边协同训推技术研... 第 1 页 信通院 基于智能IP广域网 AI WAN 的存算分离与云边协同训推技术研... 第 2 页 信通院 基于智能IP广域网 AI WAN 的存算分离与云边协同训推技术研... 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-10-07 00:06:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。