全球计算联盟GCC:2025年异构算力协同白皮书算力基础软硬件产业格局中继续扮演“头雁”角色,搭建开放生态,形 成“芯片一框架一集群一应用”的四级闭环,已支持建造多个万卡级集群,2025 年推出 384 卡超节点新形态,最大算力可达 300 PFLOPS,48 TB 高速内存,配备创新的高速互联总线, 实现 384 卡一台计算机运行,大幅提升大模型训推效率。 (2)昆仑芯三代 XPU-R,自研 XPU-Link 全互联架构,搭建“芯片—XPU-Lite 路线,一般基于自研总线定制,以厂商私有方案为主,具备成熟产品,英伟达去年发布的 NVL72 超节点产品,基于 NVLink 5.0 整合 72 颗 GPU,华为发布昇腾超节点,实现目前业 界最大规模的 384 卡高速总线互联,由 AMD、Astera Labs、亚马逊、思科等厂商联合组建 UALINK 联盟,目前 UALINK 1.0 选择推进计算总线型的开放解决方案。二是起步较晚的以 太总线路线,10 积分 | 31 页 | 1.21 MB | 4 月前3
2025年云计算研究白皮书-中国电信业实践,从硬件基础设施、软件平 台能力两个方向梳理年度标志性事件与技术跃迁路径。 全球云计算硬件基础设施正加速向高性能、异构化与资源池化方向演进。例如华为发布的 CloudMa- trix 384 超节点架构成为年度最具影响力的硬件创新之一。该架构采用全对等互联与全栈协同设计,集成 了自研鲲鹏 CPU、Ascend 910C NPU 及高速统一总线 UB(Unified Bus)网络,构建了总算力达 学等团队 [383] 在智能运维方向提出 KPI 联合预测与异常检测框架,构筑可观测云的感知基石; • Transformer 与大模型: Google 和 OpenAI 等团队 [365, 384, 385] 基于自注意 力机制奠定了大规模预训练范式;北航和清华大学等团队 [386, 387] 利用该架 构统一长跨度时序建模,实现流量与能效的高精度预测;Microsoft 和阿里等团 队 接、相 互支撑的两大技术体系:一方面聚焦于欧式空间数据,技术脉络从早期的卷积神经网络 [363] 与循环神经 网络 [378],逐步演进至以 Transformer 与大语言模型 [365, 384, 385] 为代表的统一时序建模与语义理解框 架;另一方面则面向非欧式图结构数据,形成了以图神经网络及 Graph Transformers [443, 444] 为核心的 技术路线,实现对系10 积分 | 140 页 | 11.65 MB | 1 月前3
中国新型储能发展报告2025-国家能源局兵团新型储能装机超过百万千瓦。 2024 年,全国共有 11 个省(区)新型储能新增装机超过百万千 瓦,其中,江苏、新疆、浙江和内蒙古新型储能装机增长超过 300 万 千 瓦, 分 别 新 增 486 万 千 瓦、384 万 千 瓦、353 万 千 瓦 和 305 万千瓦。 图 3 2024 年底新型储能装机超过百万千瓦省份装机情况(单位:万千瓦) ���� ��� ��� ��� ��� ��� ���20 积分 | 54 页 | 1.38 MB | 5 月前3
2025年智慧养老产业发展白皮书-头豹研究院上游攀升趋势明显。 中国集成电路进出口数量及均价(2020-2024年) 出口额 进口额 贸易逆差 2,698 3,107 2,734 2,678 2,981 5,435 6,355 5,384 4,796 5,492 2020 2021 2022 2023 2024 出口数量 进口数量 0.45 0.49 0.56 0.51 0.54 0.64 0.68 0.77 0.73 010 积分 | 35 页 | 2.06 MB | 4 月前3
上海科学智能研究院:2025年科学智能白皮书632, 594-602 (2024). 1. Bengio, Y. et al. Managing extreme AI risks amid rapid progress. Science 384, 842-845 (2024). 2. 邬江兴 . 论网络空间内生安全问题及对策 . 中国科学 : 信 息科学 52, 1929-1937 (2022). 3. Ma, X. et al. Safety Strieth-Kalthoff, F. et al. Delocalized, asynchronous, closed-loop discovery of organic laser emitters. Science 384, eadk9227 (2024). 第四章 物质科学 4. 能源 4.1 背景 随着全球能源需求不断增长以及环保压 力的加剧,传统科研模式在提升效率和推动 能源材料创新面临巨大挑战。现有的能源材20 积分 | 29 页 | 2.74 MB | 9 月前3
迈向智能世界白皮书2025-韧性DC白皮书-华为力卡规模;多种算力单元带来组件异构性和多样性,各组件来源多样、架 构多样、协议多样,形成高度异构的技术环境,为运维带来新的技术挑 战。例如,根据公开信息显示,Meta在训练LLaMA3(4050亿参数)过程 中,使用了16,384张算力卡,平均3小时发生一次故障,54天内经历419 次故障,其中55.4%的训练、推理中断是因为硬件问题。 AI时代多样算 力、海量器件带 来运维挑战 Agentic AI运维可提升故障10 积分 | 53 页 | 7.03 MB | 2 月前3
共 6 条
- 1
