pdf文档 【技术文件】《全国一体化算力网 算力中心能力评估要求》 VIP文档

577.32 KB 15 页 4 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
概览
TC609 全国一体化算力网 算力中心能力评估要求 National integrated computing power network—Assessment requirements for capability assessment of computing power centers 全 国 数 据 标 准 化 技 术 委 员 会 发 布 2025-08-29 发布 2025-08-29 实施 全 国 数 据 标 准 化 技 术 委 员 会 技 术 文 件 TC609-6-2025-09 I 目 次 前言 .................................................................................. II 1 范围 ................................................................................. 1 2 规范性引用文件 ....................................................................... 1 3 术语和定义 ........................................................................... 1 4 缩略语 ............................................................................... 2 5 总则 ................................................................................. 2 5.1 概述 ............................................................................. 2 5.2 评估对象 ......................................................................... 2 5.3 评估框架 ......................................................................... 3 5.4 参考评估方式 ..................................................................... 3 6 评估指标 ............................................................................. 4 6.1 算力投入 ......................................................................... 4 6.2 算力供给 ......................................................................... 5 6.3 算力应用 ......................................................................... 7 6.4 算电协同 ......................................................................... 9 6.5 算网安全 ........................................................................ 11 II 前 言 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国数据标准化技术委员会(SAC/TC609)提出并归口。 本文件起草单位:鹏城实验室、国家信息中心、中国移动通信有限公司研究院、中国联合网络通信 集团有限公司、中国信息通信研究院、紫金山实验室、曙光智算信息技术有限公司、中国科学院计算技 术研究所、中国电信集团有限公司、北京邮电大学、国家数据发展研究院、中国电子技术标准化研究院、 中移(苏州)软件技术有限公司、联通数字科技有限公司、江苏未来网络集团有限公司、曙光信息产业 股份有限公司、中科南京信息高铁研究院、天翼云科技有限公司、京东科技信息技术有限公司、中国信 息协会算力网专业委员会、中关村视听产业技术创新联盟、浪潮电子信息产业股份有限公司、北京市通 信与互联网协会、联想(北京)信息技术有限公司、江西省大数据中心、芜湖市大数据建设投资运营有 限公司、联通智能制造科技产业(广东)有限公司、深圳市尚数网科技有限公司、商周(河南)算力技 术有限公司、广东国腾量子科技有限公司。 1 全国一体化算力网 算力中心能力评估要求 1 范围 本文件规定了全国一体化算力网体系下算力中心的能力评估要求,包括评估对象、评估框架与评估 指标。 本文件适用于支持算力中心的规划、建设及运行相关工作,为算力中心的能力评估提供参考和依据。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 41867-2022 信息技术 人工智能 术语 GB 50174-2017 数据中心设计规范 GB/T 22240-2020 信息安全技术 网络安全等级保护定级指南 GB/T 40690-2021 信息技术 云计算 云际计算参考架构 TC609-6-2025-03 全国一体化算力网 算力算效衡量技术要求 3 术语和定义 下列术语和定义适用于本文件。 3.1 算力 computing power 综合数据处理能力,从处理能力的分类可划分为通算算力、智算算力、超算算力、量子算力等。 3.2 算力资源 computing power resources 计算资源、存储资源以及节点内部网络资源等集合,通过该节点的管控系统/运营平台进行抽象并 对外提供算力资源服务。 3.3 算力网 computing power network 支撑数字经济高质量发展的关键基础设施,可通过网络连接多源异构、海量泛在算力,实现资源高 效调度、设施绿色低碳、算力灵活供给、服务智能随需。 3.4 算力中心 computing power center 2 或称为计算中心,为多用户提供计算服务的设施,可分为通算中心、智算中心、超算中心及混合算 力中心等不同类型。用户可通过对计算设备及辅助软硬件的操作,结合计算中心人员服务完成业务需求。 3.5 数据中心 data center 一种能够提供容纳、互联和操作的结构或结构组。它使用信息技术、电信网络设备提供的数据存储、 处理、迁移服务及其它所有功能,并集成能量供应、环境控制和为保证服务可用性而制定的必要的韧性、 安全性级别定义。 4 缩略语 下列缩略语适用于本文件: AI:人工智能(Artificial Intelligence) BOPS:每秒可完成的基本操作数(Basic Operations Per Second) CE:算效比(Computational Efficiency) CPU:中央处理器(Central Processing Unit) FP16:半精度浮点数(Half Precision Floating Point) FP32:单精度浮点数(Single Precision Floating Point) FP64:双精度浮点数(Double Precision Floating Point) GPU:图形处理器(Graphics Processing Unit) IB:无限带宽网络(InfiniBand) IOPS:每秒进行读写操作的次数(Input/Output Operations Per Second) MTBF:平均无故障时间(Mean Time Between Failure) NPU:神经处理器(Neural Processing Unit) OPS:每秒可执行操作数(Operations Per Second) PUE:电能利用效率(Power Usage Effectiveness) QPU:量子处理器(Quantum Processing Unit) RoCE:基于融合以太网的远程直接内存访问(RDMA over Converged Ethernet) SSD:固态驱动器(Solid State Drive) WUE:水资源利用效率(Water Usage Effectiveness) 5 总则 5.1 概述 本文件作为全国一体化算力网中基于算力监测开展相关算力中心能力评估的技术文件,旨在对全国 一体化算力网中各类型算力中心能力评估方法进行规范。 5.2 评估对象 本文件规范的能力评估对象是算力中心,根据提供算力类型的不同可以分为通算中心、智算中心、 超算中心和混合算力中心。 3 通算中心,即通用算力中心,主要由基于CPU芯片的服务器提供通用计算资源,能够满足一般企业 和个人的计算需求。该类中心侧重于提供广泛的计算能力,满足各种不同类型的计算需求,通常用于基 础通用计算,如移动计算、物联网等。通算中心的建设主体以互联网、运营商等企业为主。 智算中心,即人工智能计算中心,是提供人工智能应用所需算力服务、数据服务和算法服务的一类 算力基础设施。该类中心由基于GPU、NPU等AI加速芯片的计算平台提供智能计算资源,主要用于人工智 能的训练和推理计算,可以应用于计算机视觉、自然语言处理、机器学习等领域。 超算中心,即超级计算中心,是基于超级计算机或者大规模计算集群的算力中心,提供超级计算资 源。该类中心能够支持大规模计算、存储和网络服务等功能,广泛应用于航天、国防、石油勘探、气候 建模和基因组测序等场景。超算中心侧重于科学计算等计算密集型任务,面向科研人员和科学计算场景 提供支撑服务,通常采用并行计算的方式,将任务分配给多个计算节点进行计算,以解决一些需要大量 计算资源的问题。 混合算力中心是融合了多种算力资源的算力中心,可包括智能计算、超级计算和通用计算等多种算 力资源类型。该类中心可根据不同计算需求灵活调配各类算力资源,满足多样化的计算任务。 5.3 评估框架 图 1 算力中心能力评估框架 算力中心能力评估框架见图1,主要分为算力投入、算力供给、算力应用、算电协同和算网安全五 个维度,通过这些维度的指标来评估算力中心不同方面的能力情况: a) 算力投入:评估算力中心工程建设和项目投资方面; b) 算力供给:评估算力中心设施规模、上架率、计算能力、存储能力、算力服务、传输能力方 面; c) 算力应用:评估算力中心算力运营、算力运行和算力维护方面; d) 算电协同:评估算力中心电力容量、电力消耗和能效水平方面; e) 算网安全:评估算力中心国产化率和安全服务方面。 5.4 参考评估方式 本文件仅提供算力中心能力评估要求的评估框架与各维度评估指标,不限定能力评估的具体方法, 在能力评估具体实施过程中可根据实际情况与需求进行设计与调整。判定依据可综合算力中心能力评估 框架中各维度评估指标进行组合计算或综合分析,也可根据需求选取相关指标定量或定性分析评估。 本章基于评估框架提供算力中心能力的参考评估方式示例。参考评估方式示例侧重算力中心服务能 力的评定,主要用于衡量算力中心在服务、运营及运维等方面的先进性与可靠性。 4 参考模型重点关注算力供给维度中计算能力、存储能力、算力服务、传输能力等部分,算力应用维 度中算力运营、算力运行、算力维护部分,算电协同维度中电力消耗、能效水平等部分,算网安全维度 中国产化率、安全服务部分。 对于只具备基础运营及运维能力,仅可对外提供机房、机架及裸金属服务器租赁业务的算力中心, 可定义为“基础级”。 对于具备相对完善运营及运维能力,可提供云化平台或虚拟化资源服务的算力中心,可定义为“优 秀级”。 对于具备领先运营及运维能力,可提供多样化算力服务并支持在全国一体化算力网体系下多中心云 际协同服务的算力中心,可定义为“示范级”。 6 评估指标 6.1 算力投入 6.1.1 工程建设 工程建设方面指标包含项目状态、通算设备占比、智算设备占比和超算设备占比,见表1。 表 1 工程建设方面指标 指标名称 单位 数据格式 描述 项目状态 不涉及 字符,取值范围:在建、 部分投产、已投产 算力中心现行建设状态。 在建:指已启动建设工作,未具备提供服务能力。 部分投产:指已基本完成建设工作,仅提供部分服务能力。 已投产:指已完成全部建设工作,可提供正式服务能力。 通算设备占比 不涉及 百分数,保留两位小数 算力中心已建通用计算设备占已建总计算设备的比例。 计算公式:通算设备占比=已建通用计算设备数量(台)/已 建总算力设备数量(台) 智算设备占比 不涉及 百分数,保留两位小数 算力中心已建智能计算设备占已建总计算设备的比例。 计算公式:智算设备占比=已建智能计算设备数量(台)/已 建总算力设备数量(台) 超算设备占比 不涉及 百分数,保留两位小数 算力中心已建超级计算设备占已建总计算设备的比例。 计算公式:超算设备占比=已建超级计算设备数量(台)/已 建总算力设备数量(台) 6.1.2 项目投资 项目投资方面指标包含总投资金额、已投资金额、算力设备投资金额、通算设备投资金额、智算设 备投资金额和超算设备投资金额,见表2。 表 2 项目投资方面指标 指标名称 单位 数据格式 描述 总投资金额 亿元 非负数,保留四位小数 算力中心建设计划总投资金额。 已投资金额 亿元 非负数,保留四位小数 算力中心建设已投资金额。 5 算力设备投资金额 亿元 非负数,保留四位小数 算力中心建设已投资的算力设备涉及金额。 通算设备投资金额 亿元 非负数,保留四位小数 算力中心建设已投资的通用计算设备涉及金额。 智算设备投资金额 亿元 非负数,保留四位小数 算力中心建设已投资的智能计算设备涉及金额。 超算设备投资金额 亿元 非负数,保留四位小数 算力中心建设已投资的超级计算设备涉及金额。 6.2 算力供给 6.2.1 设施规模 设施规模方面指标包含机架总量、低密机架数量、中密机架数量、高密机架数量、超高密机架数量 和算力密度,见表3。 表 3 设施规模方面指标 指标名称 单位 数据格式 描述 机架总量 架 非负数 算力中心包含的标准机架总数,根据单机架功率不同,统一折算为2.5kW标 准机架数。 计算公式:机架总量=(单机架功率(kW)/2.5kW)*该类型机架数量(架) 低密机架数量 架 非负整数 单机架功率小于5kW/架(按实际建设情况)的机架总数。 中密机架数量 架 非负整数 单机架功率大于等于5kW/架,小于15kW/架(按实际建设情况)的机架总数。 高密机架数量 架 非负整数 单机架功率大于等于15kW/架,小于25kW/架(按实际建设情况)的机架总数。 超高密机架数量 架 非负整数 单机架功率大于等于25kW/架(按实际建设情况)的机架总数。 算力密度 台/平 方米 非负数, 保留两位 小数 平均1平方米中服务器数量。 计算公式:算力密度=算力中心服务器总数(台)/算力中心占地面积(平方 米) 6.2.2 上架率 上架率方面指标包含物理上架率和功率使用率,见表4。 表 4 上架率方面指标 指标名称 单位 数据格式 描述 物理上架率 不涉及 百分数,保 留两位小数 算力中心已使用机架与已建成机架物数量比值。 计算公式:上架率=已使用机架数(架)/已建成物理机架数(架) 功率使用率 不涉及 百分数,保 留两位小数 算力中心上架设备配备总功率与已建成机架设计功率的比值。 计算公式:功率使用率=已上架设备功率(kW)/已建成机架总功率(kW) 6.2.3 计算能力 计算能力方面指标包含算力总规模、通用计算规模、智能计算规模、超级计算规模、可调度计算规 模、CPU核心数、AI加速卡卡数和内存规模,见表5。 6 表 5 计算能力方面指标 指标名称 单位 数据格式 描述 算力总规模 PBOPS 非负整数 已建成的通用、智能、超级计算资源的总量,采用《全国一体化算力网 算 力算效衡量技术要求》技术文件中BOPS算力度量单位进行归一化处理。 计算公式:算力总规模=通用计算资源规模(BOPS)+智能计算规模(BOPS)+ 超级计算规模(BOPS) 通用计算规模 POPS@ FP32 非负整数 通用计算资源总规模(FP32)。 智能计算规模 POPS@ FP16 非负整数 智能计算资源总规模(FP16)。 超级计算规模 POPS@ FP64 非负整数 超级计算资源总规模(FP64)。 可调度计算规模 PBOPS 非负整数 可纳入全国一体化算力网用于协同调度的总算力规模,包含通用、智能、超 级计算资源,采用《全国一体化算力网 算力算效衡量技术要求》技术文件 中BOPS算力度量单位进行归一化处理。 计算公式:可调度计算规模=接入调度的通用计算资源规模(BOPS)+接入调 度的智能计算规模(BOPS)+接入调度的超级计算规模(BOPS) CPU核心数 核 非负整数 算力中心所有算力设备包含的CPU总核数。 AI加速卡卡数 张 非负整数 算力中心所有算力设备包含的AI加速卡总数。 内存规模 TB 非负数, 保留四位 小数 算力中心所有算力设备包含的内存总容量。 6.2.4 存储能力 存储能力方面指标包含可提供存储规模、在用存储规模、先进存储规模和存储系统IOPS值,见表6。 表 6 存储能力方面指标 指标名称 单位 数据格式 描述 可提供存储规模 PB 非负数, 保留四位 小数 算力中心存储服务可提供的存储总容量,包括但不限于文件存储、对象存 储等。可以是理论峰值。存储能力的数据采集主要面向建设成熟的算力中 心,可提供相关数据;对于提供机房和机架租赁的数据中心,如无法采集 可不提供该数据 。 在用存储规模 PB 非负数, 保留四位 小数 算力中心存储服务实际在用存储容量。 先进存储规模 PB 非负数, 保留四位 小数 采用先进存储技术的存储容量,包含但不限于闪存阵列、SSD、分布式存储 架构、智能分层存储、存储虚拟化等。 存储系统IOPS值 IO/s 非负数, 保留四位 小数 算力中心存储系统IOPS值,衡量存储系统性能指标。 7 6.2.5 算力服务 算力服务方面指标包含是否可以提供机房租赁服务、机柜租赁服务、物理机租赁服务、云主机租赁 服务、机时租赁服务、云际协同服务和支持实例类型,见表7。 表 7 算力服务方面指标 指标名称 单位 数据格式 描述 机房租赁服务 不涉及 字符,取值范围:可提供、不提供 客户租赁整个机房,用于部署服务器和网络设备。 机柜租赁服务 不涉及 字符,取值范围:可提供、不提供 客户租赁
下载文档到本地,方便使用
共 15 页, 还有 2 页可预览, 继续阅读
文档评分
请文明评论,理性发言.