梯度 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

电子行业AI+系列专题：边缘AI，大语言模型的终端部署，推动新一轮终端需求-20230531-国信证券-25页

资料来源：ChatGPT，Google，国信证券经济研究所整理大模型训练对硬件的挑战：算力、内存和通信内存方面，大模型训练的内存可以大致理解为参数、优化器状态、激活、梯度四部分的和。它们大致分为两类：静态内存和动态内存。参数、优化器状态较为固定，属于静态内存，激活和梯度等中间变量属于动态内存，是最主要的内存占用原因，动态内存通常是静态内存的数倍。图9：静态内存图10：动态内存资料来源：知乎，国信证券经济研究所整理 2 个字节，参数和优化器状态合计占用内存 1635G。而动态内存，根据不同的批量大小、并行技术等结果相差较大，通常是静态内存的数倍。更简洁的估算方法，可以假设典型的 LLM 训练中，优化器状态、梯度和参数所需的内存为 20N 字节，其中 N 是模型参数数量，则 1750 亿参数的 GPT3 大概需要 3.2TB 内存。推理所需内存则较小，假设以 FP16 存储，175B 参数的 GPT3 推理大约需要内存 80G A100，如果以 FP32 运算，则需要 10 张。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 9 表2：大语言模型的计算公式注释模型参数优化器内存梯度内存激活重计算模型训练内存需求模型推理内存需求资料来源：Eleutherai，国信证券经济研究所整理图11：模型大小与设备内存的增长示意图资料来源：NVIDIA，国信证券经济研究所整理

10 积分 | 25 页 | 2.20 MB | 1 年前
3
人机对话技术及动态（57页PPT）

(2015) ACL benbe n Wh o 27 a m I 更好地建模多轮对话历史的语义 • 动机：利用 Attention 获取多轮对话历史语义信息，避免循环式神经网络的梯度衰减问题 Wei-Nan Zhang, Yiming Cui,Yifa Wang, Qingfu Zhu, Lingzhi Li, Lianqiang Zhou, Ting Liu. Context-Sensitive

20 积分 | 56 页 | 4.34 MB | 6 月前
3
“十五五”时期我国制造业发展形势研判及思路建议

CCID CCID CCID CCID CCID CCID CCID CCID C 8 政策和行动计划，推动构建产业、科技、金融、人才高水平循环的集群产业生态。二是有序推动产业梯度转移。按照市场导向、政府引导、自愿合作方式，引导劳动密集型产业重点向中西部劳动力丰富地区转移，促进技术密集型产业向中西部和东北地区中心城市转移。三是建设产业大后方。以备战备灾谋复兴为方向，以事关国家经济稳定、产业安全、民

20 积分 | 9 页 | 329.18 KB | 6 月前
3
2025年超节点发展报告-华为&中国信通院

“规模定律”不断演进，从预训练扩展到覆盖预训练、后训练、逻辑推理的全流程，其参数与集群规模实现“双万” 跨越，行业模型落地需求专业化。传统的服务器集群架构在这场变革中瓶颈愈发明显。千亿级模型一次梯度同步产生的 TB 级数据让传统以太网带宽难以承受；同时，伴随算力规模扩大，万级处理器带来的故障常态化，对自动化运维与 RAS 能力提出了更高要求。在这样的背景下，超节点的出现成为了面向大模型未来发展的必器的范围时，会产生大量且不可避免的跨节点网络通信。因此在这一阶段，跨服务器节点的通信带宽成为决定整体训练效率的核心瓶颈。正是这种瓶颈的演变，最终凸显了传统服务器集群架构面临的三重系统性挑战。首先是通信墙，千亿级模型一次梯度同步即 TB 级数据，传统以太网难以承受。其次是功耗与散热墙，为破通信墙而提升密度，促使液冷、48V 供电成为标配。第三是复杂度墙：万级处理器带来故障常态化，从业界模型 GPT-3 (175B)

20 积分 | 31 页 | 4.79 MB | 6 月前
3
Deepseek在药企研发领域的本地化部署和应用场景

考虑最小生物效应水平，建议最低剂量为 0.5 mg/kg 7 。安全性与有效性平衡 · 啮齿类试验： · 急性毒性：最高剂量建议为 100 mg/kg ( 参考 RPT193 的耐受性数据 )1 . 重复始药：设置梯度剂量 (5 、 15 、 50 mg/kg), 重点关注 50 mg/kg 组的肝肾功能变化 910 . 非啮齿类试验： A 临床前毒理试验设计于多物种模型 ( 小鼠、大鼠、犬、食蟹猴 ) 开展，推荐剂量设计如下： · 啮齿类：急性毒性试验最高剂量 100 mg/kg, 重复给药试验梯度剂量 5-50 mg/kg; · 非啮齿类：长期毒性试验剂量 2-2 0mg/kg; ● 临床起始剂量： 0.29 mg/kg(NOAEL 法 ) 或 0.5 mg/kg(MABEL

10 积分 | 33 页 | 2.29 MB | 1 年前
3
未来网络发展大会：2025分布式算力感知与调度技术白皮书

在联合推理模式下，患者原始影像块仅在本地进行 DICOM 去标识和压缩编码，随后通过加密隧道传输特征张量至云推理服务器；对联邦学习而言，GPU 工作站根据本地标签数据训练梯度，调度器按“通信带宽×梯度稀疏度”优化同步顺序，确保大规模医院联盟在不共享原始影像的前提下快速收敛。区块链-可信执行环境用于记录任务调度日志、模型版本与推理结果，保障诊断过程的全链路可追溯与不可篡改。语料，并执行庞大的矩阵运算，对 GPU/TPU 的浮点性能、显存容量以及存储带宽形成高压。大规模生成式模型的训练与推理对算力提出了 “高并行度、长持续、高带宽”三重要求：训练阶段需要数百到上千颗 GPU 进行同步梯度聚合，推理阶段则要在全球多地为 API 调用提供快速响应，同时保证模型权重版本一致。因此，分布式算力感知与调度能够在大模型分布式训推场景中得到广泛应用。分布式算力感知与调度首先利用资源探针实时采集各数据中心

20 积分 | 73 页 | 2.15 MB | 6 月前
3
大模型时代的AI教育：思考与实践2024

任务：判别、预测，通过学习数据分布规律 2. 边界：有规律、可以数字化，属于经验科学 3. 要素：机器学习-深度学习 • 模型：神经网络模型（分层；单向） • 策略：损失函数定义 • 算法：反向传播+梯度下降  从感知智能到认知智能 1. 专用任务模型：NLP、CV、Gaming…… 2. 通用任务模型：AIGC • Diffusion、transformer ◼ 从NLU+NLG到LLM（大语言模型）

10 积分 | 36 页 | 4.04 MB | 1 年前
3
2026年我国数字经济发展形势展望

、理解力局限等瓶颈，加速在实际场景中落地，“数据+模型+场景”协同部署将推动数字仿真设计、柔性生产线、精准供应链、人机协作智能体等应用走向成熟示范，催生新企业新业态形成。三是数字产业集群梯度培育将深入探索，在数字技术赋能下，“数据+技术”深度嵌入数字产业集群活动，推动集群发展模式走向数据化共享、网络化协作、平台化运营、链群化共治，京津冀、长三角、粤港澳大湾区等区域将布局形成一

10 积分 | 17 页 | 5.71 MB | 2 月前
3
未来网络发展大会：算力城域网白皮书（2025版）

（4）收敛组网技术在跨集群协同训练场景下，城域网络需要承载多个 AIDC 间的大规模参数面数据并发同步。算力城域网需具备收敛组网能力，有效缓解多 AIDC 协同训练时数据并发和突发对网络的影响：通过分层梯度聚合算法重构集合通信流程，有效减少跨数据中心通信的算卡数量，实现网络带宽的初步收敛；再采用“突发缓存+队列调度”的双重机制，利用高速缓存吸收流量冲击，并通过优先级调度确保 GPU 控制

20 积分 | 42 页 | 7.16 MB | 6 月前
3
全国内部审计数智化转型发展研究报告

不同规模单位中，开展审计数智化转型的单位占比 ...................... 11 图 6 各行业内部审计数智化成熟度三级分布及单位数量占比 .................. 13 图 7 不同梯度行业四维能力对比 .......................................... 14 图 8 不同规模单位四维能力对比 .......................... 对完善，数据资源积累和模型应用体系初见成效，新技术仅初步尝试，占比约为 7.8%；其余高校、烟草、医院等行业处于不同程度的起步期，在平台、数据、模型、AI 能力等方面能力单一，尚未形成完整发展体系。图 7 不同梯度行业四维能力对比全国内部审计数智化转型发展研究报告（2025） 15 图 8 不同规模单位四维能力对比由图 8 数据可见，单位人员规模同样是数智化能力建设的核心决定因素。从“50 人

20 积分 | 99 页 | 22.28 MB | 2 月前
3

共 15 条前往

页

分类

语言

格式

电子行业AI+系列专题：边缘AI，大语言模型的终端部署，推动新一轮终端需求-20230531-国信证券-25页

人机对话技术及动态（57页PPT）

“十五五”时期我国制造业发展形势研判及思路建议

2025年超节点发展报告-华为&中国信通院

Deepseek在药企研发领域的本地化部署和应用场景

未来网络发展大会：2025分布式算力感知与调度技术白皮书

大模型时代的AI教育：思考与实践2024

2026年我国数字经济发展形势展望

未来网络发展大会：算力城域网白皮书（2025版）

全国内部审计数智化转型发展研究报告