电力人工智能多模态大模型创新技术及应用方案(35页 PPT)强解 释性但泛化 能力 弱。 基于海量数据与 大规模预训练; 代表算法: DeepSeek 系列 Qwen 系列 GPT 系列 通过模型组合提升 预测精度; 代表算法: 随机森林 梯度提升决策树 神经网络 ) 深度学习机器学习人工智 能 4/37 在人工智能领域,数据、算力与算法构成发展基石——数据驱动模型训练,算力支撑复杂计算,算法优化 技术路径,三者协同推动人工智能向更高阶形态演进。 利用模型、仿真生成 虚拟现实 自动驾驶 生态 PyTorch TensorFlow MindScope 训练算法 无监督预训练 强化学习 前沿探索阶段 底层计算库: CUDA 、 CANN( 华为 ) 有监督微调 对比学习 * 互联网爬取、规模大 LLM 预训练 多维并行算法 状态监测、任务调度 语言通用模型: 通用模型是当下研究热点与未来趋势; 研究高效训练算法具有重要创新意义。 如何提高数据的规模与质量 是当前人工智能领域的关键问题。 5/37 早期的深度学习受限于计算能力和数据规模,难以发挥优势。随后多层感知机与卷积神经网络结合反向传 播算法,显著提升了模型的学习能力。随后,基于注意力机制的 Transformer 架构改变了自然语言处理 的范式,使大规模预训练成为可能。近年来,大模型凭借10 积分 | 35 页 | 7.61 MB | 22 天前3
智能算网_AI Fabric2_0_研究报告-中国信通院&华为逐包负载均衡技术 24 23 目录 4.2.3 拥塞控制技术 26 4.2.3.1 端网协同拥塞控制技术 4.2.3.2 FlexBuffer拥塞控制技术 28 26 4.2.3.3 拉远训练精准流控技术 29 4.2.3.4 AI ECN 2.0技术 30 4.2.4 在网计算技术 31 4.2.5 在网存储技术 31 4.2.6 高稳韧性技术 33 4.2.6.1 故障恢复技术 的目标, 2.1 数据中心网络产业发展趋势 2 3 并阐述了算力内网络高性能传输调度要求,以及无损网络技术应用要求。数据中心 网络连接算力,其性能直接决定了整个数据中心的实际算力水平。以大模型训练为 例,需要同时协调数千张甚至数万张算力卡资源,数据吞吐量成为AI计算的关键瓶 颈,需要高效的数据流水线支持,对网络的带宽、时延和可靠性都提出了极高要求。 因此,要提升数据中心算力服务能力,就必须进一步提升数据中心网络性能。根据 性运营枢纽”的跃迁,谁就将在未来激烈的数字化和智能化竞争中占据先机。 2.3 智算数据中心网络发展趋势与挑战 AI产业正迎来前所未有的快速发展期,呈现出几大显著趋势变化。 1)大模型规模指数级增长,头部OTT大模型持续摸高,大模型训练带动网络发展 模型性能竞赛白热化: 2025年上半年,OpenAI的GPT-4.5、Google的Gemini 2.5 Pro、Anthropic的Claude 4等模型在复杂推断能力上持续突破。例如,Gemini10 积分 | 50 页 | 2.72 MB | 22 天前3
2025新型电力系统需要人工智能(58页 PPT 中国南方电网)算法,可自动读取实时和历史数据,实现对关键设备的精准诊断。 ■ 算力与算法优化:硬件采用全国产 GPU 算力集群,提升大模型训练效率;软件层面构建 电 力行业调度知识库,采用“大小模型”协同机制,即“大模型 + 机理模型”融合方式,发挥 二者优势。 ■ 物理 - 数据混合驱动:将电力系统物理方程嵌入大模型训练,提升可解释性和泛化能力。 ■…… 模型技术不断创新和突破 中国南方电网 CHINA SOUTHERN ,具备意图识别、多轮对话等能力。 应用场景日益丰富 中国南方电网 CHINA SOUTHERN POWER GRID 24 1. 行业专用大模型 · 从通用大模型向电力垂直领域深化,构建“预训练 + 微调”的行业底座 ( 如“电力 GPT”) 。 2. 多智能体协同 · 大模型作为调度中枢,协调发电、储能、用户等多元主体,支撑新型电力系统“源网荷 储”互动。 3. 数字孪生集成 源的“无条件”接入创造无限可能。 电力人工智能的研究和思考 中国南方电网 CHINA SOUTHERN POWER GRID 28 关键技术 电力系统 高维向量表征 ( 数字数据系统 ) 电力大模型 训练和推理 多领域知识融合的 电力智能应用 电力人工智能系统 AI EPS 核心成果 电力人工智能系统 技术挑战 信息 表征 算法 基础 知识 融合 智能 决策 电力人工智能的研究和思考10 积分 | 58 页 | 9.37 MB | 22 天前3
AI可信数据空间(54页 WORD)· 挑战三、高质量语料稀缺 政府、金融、医疗、制造等行业大模型专业语料稀缺, 海量多模态数据(文本、图像、传感器)待标注数 据占比高,高质量语料转化率低(语义缺失、时效 滞后等),无法满足行业大模型训练推理阶段对行 业标注数据的诉求。 · 挑战四、安全能力参差不齐 数据流通涉及数据提供方、使用方、服务运营方等 众多参与主体,不同主体的网络安全、传输安全、数 据安全等防护水平差异较大,容易成为攻击者突破的 具身智能大模型的语料演进 当前大模型技术正经历从弱人工智能(机器学习、神经网络、大语言模型)向通用人工智能(Agent、多模态、 具身智能)的范式跃迁。这不仅对于模型架构的设计理念进行了重构,同时也对大模型各阶段的训练语料提出 全新要求。 1942 1956 2022 2025 模拟人脑 神经元素 达特茅斯 会议 chatGPT 发布 openAI O3 发布 Deepseek R1 发布 图 2 据求思咨询报告分析,全球 AI 语料市场 规模预计在 2025 年突破 109 亿元。并且数据合成 成为当前突破 现在数据规模的主流路径,预计 2025 年合成数据在 AI 训练中占比将达 40%,例如工业数字孪生场景中, 合成图像替代率从 30% 升至 65%。 同时语料数据的内容可信度保障面临更高要求。多 模态语料的质检需建立跨模态的数据质量检验流程 机 “10 积分 | 55 页 | 4.11 MB | 22 天前3
基于DeepSeek AI大模型量化交易可信数据空间设计方案(249页 WORD)深度学习与传统机器学习...................................................................................87 5.2 模型训练与验证................................................................................................ 系统的部署意愿,特 别是在需要严格合规的二级市场交易场景中。 为解决这些根本性问题,我们提出基于可信计算框架的端到端 解决方案。该方案通过三层验证体系构建技术闭环:在数据层引入 区块链赋能的溯源机制,确保训练数据的时效性与真实性;在模型 层部署可解释 AI(XAI)技术,使策略决策过程满足 FINRA 第 2210 条合规要求;在交易层采用联邦学习架构,实现跨市场数据 的隐私保护与协同优化。瑞士信贷银行的实测数据显示,该方案使 Learning)架构确保模型适应市场机制变化。 通过概念漂移检测技术,系统可在 30 秒内完成模型参数热更新, 应对极端行情时的策略失效风险。分布式计算框架(如 Ray)支持 千级并发因子的实时再训练。 这些技术方案已在头部对冲基金实现工业化部署,例如使用 Transformer 架构的阿尔法捕捉系统在 2023 年 H1 实现年化收益 29.8%,最大回撤 4.3%。关键成功要素在于构建闭环的10 积分 | 261 页 | 1.65 MB | 22 天前3
可信数据空间AI大模型服务平台建设方案(69页 WORD)................44 5.1 大模型选择与部署.........................................................44 5.2 模型训练与优化.............................................................46 5.3 模型生命周期管理................... 学习模型提供高质量的训练数据;知识图谱构建要将 分散的数据关联起来,形成结构化的知识体系,为智 能应用提供知识支撑。 通过这些功能,形成高质量的公共数据集,为大 模型和智能体的训练和应用提供可靠的数据基础。 2.2.2 模型管理 平台要具备强大的模型管理功能,能够实现对 DeepSeek、通义千问等通用大模型的统一管理。包 括模型的导入、部署、更新、版本控制等。要支持模 型的训练和优化,能够根据政务领域的语料和知识, 384 超节点(500P FLOPS)和 Atlas 800I A2 推理服务 器(808 Tokens/s 吞吐率),支持混合精度计算。 这些设备能够提供强大的算力支持,满足平台对各类 大模型训练和推理的算力需求。同时,要建立算力调 度机制,根据不同的应用场景和任务优先级,合理分 配算力资源,提高算力利用率。 存储系统:采用分布式文件系统(如 Ceph)和 对象存储,总容量≥100PB,支持冷热数据分级存储。10 积分 | 70 页 | 71.01 KB | 22 天前3
厦门大学 景锐:人工智能在电力需求侧仿真与预测中的若干应用(18页 PPT)门控循环单元 GRU 为 LSTM 的 简化 变体,将遗忘门与输入门合并为更 新门,将输出门替换为重置门,可 对前序信息进行记忆或遗忘,兼顾 负荷序列时序性与非线性,进一步 减少参数需求,降低训练难度 GRU h- hi Transformer 由多个编码器 和 解码器组成,核心在于多头自 注意力机制,捕捉输入序列中 人 t 是 LSTM 保留 RNN 的 隐 含层传递关系,加入 遗忘门、输入门和输 出门,解决 RNN 在 时间序列训练时的梯 度消失与梯度爆炸 L Q saly M⁹ 简化结构,模型 参数更少,训练 速度更快 2017 Vaswani 等在论文《 Attention Is All You Need 》中提出 2014 Kyunghyun network TimeGAN Random noise ● 极端天气 ( 如热浪、寒潮 ) 和新型负 荷 ( 如氢能、数据中心 ) 缺乏历史数据, 导致学习困境 · 小样本训练的模型在面对新场景时,泛 化能力差 负荷预测的小样本问题 Recovery network Embedding network Real data 1 7 1 5 1 著 #420 积分 | 18 页 | 30.09 MB | 22 天前3
新材料行业可信数据空间建设方案(132页 WORD)基于内存计算, 具有更高的处理速度和更灵 活的编程模型 , 能够支持实时数据分析 、交互式查询和机 器学习算法的快速 迭代。在进行新材料性能预测模型训练 时,Spark 能够将训 练数据存储在内存中, 实现快速的数 据读取和计算, 加速模 型训练过程 。同时, Spark 还提供 了丰富的机器学习库 (MLlib) 和图计算库 (GraphX), 方便对新材料数据进 行 深入的挖掘和分析, 。例如, 利用随机森林算法构建新材料 性能预 测模型, 将材料的成分 、制备工艺参数等作为输入 特征, 将 材料的力学性能 、热学性能 、电学性能等作为输 出标签, 通 过对大量实验数据的训练, 实现对新材料性能 的准确预测 。 在深度学习算法方面, 运用卷积神经网络 (CNN) 、循环神 经网络 ( RNN) 、长短时记忆网络 ( LSTM) 等算法, 对材 料的微观结构图像、时间序列数据等 进行智能预测和分析, 为研发人员提供创新思路和决策支 持。 在模型构建过程中, 采用先进的机器学习和深度学习算 法, 如 Transformer 架构 、生成对抗网络 (GAN) 等, 对海 量 数据进行训练和优化,提高模型的准确性和泛化能力。例 如, 研发人员在设计新型材料时, 可以将材料的目标性能 、应用 领域等信息输入到大模型中 ,模型通过对大量数据 的学习和 分析, 预测出可能的材料成分和制备工艺,10 积分 | 133 页 | 216.08 KB | 22 天前3
迈向智能世界白皮书2025-韧性DC白皮书-华为储载体演进为支撑企业业务连续性与数字化转型的关键 基础设施。在智能电网等关系国计民生的关键行业中,韧性数据基础设施对系统的稳定运行、风险抵御与未 来演进具有至关重要的作用。数据中心不仅承载着AI训练与推理,更支撑着实时分析、自动化决策等电网核 心需求,其韧性建设直接关系到电网的可靠性、安全性与可持续性。本白皮书指出,“数据中心的每一次升 级换代,背后都在回应数字经济对于更高性能、更高安全、 心的韧性升级具有积极意义。 ——华为ICT Marketing与解决方案销售总裁 刘康 ——中国信息通讯研究院云计算与大数据研究所所长 何宝宏 在信息化、智能化时代,算力中心作为支撑大模型训练推理等海量计算的基础设施,已深度融入生产生活、 政府管理、民生服务等各方面,其稳定运行不仅关乎信息技术服务的可靠与连续,更直接影响经济社会体系 的韧性与安全。《韧性DC白皮书》率先从业务永续、确定性安全、弹性自适应、Agentic 行与国家竞争力的方方面面,作为其底层算力支撑 的数据中心,已跃升为全球数智化进程不可或缺的 数据中心的边界在哪里?数字经济的边界在哪里?这两者正在无限趋同。 “神经中枢”。它不仅承载着生成式AI的模型训练 与推理任务,还支撑着各行各业对实时处理、自动 化决策和大规模数据分析的需求。 正是在这一背景下,数据中心的边界不断扩展、责 任不断加重。它们从“被动承载”走向“主动驱 动”,从单点服务设施跃升为支撑数字社会全要素10 积分 | 53 页 | 7.03 MB | 22 天前3
大模型赋能智慧城市建设的路径与策略研究大模型的定义与核心特征 “大模型”是指基于海量多模态数据预训练、具有 巨量参数规模(通常在百亿至万亿级别) 的深度学习 模型,能够处理复杂语言理解与生成任务,并展现出强 大的泛化、推理和上下文学习能力。 大模型的核心特 征包括以下 4 方面 [5-6]。 其一,巨量参数:模型复杂度和能力的物理基础。 其二,预训练+微调范式:利用大规模无标注数据 预训练获得通用知识,再通过特定领域标注数据微调 适应下游任务。 实现大模型能力的集约化 建设、规范化应用和场景化落地。 4. 1 一个基础底座(算力+数据+算法) 算力基础设施:建设或整合高性能智算中心、云计 算资源,提供充足、普惠、绿色的算力支撑,满足大模型 训练和推理的庞大需求。 数据要素体系:在保障安全和隐私前提下,推动公 共数据、行业数据安全有序开放共享与融合治理,构建 高质量、多模态的“ 语料库”,为大模型提供优质“ 燃 料”;建立数据确权、流通、交易机制。10 积分 | 7 页 | 1.13 MB | 22 天前3
共 34 条
- 1
- 2
- 3
- 4
