Scaling - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

虚拟电厂规模化发展观察：成功部署的实际经验-Insights into Scaling Virtual Power Plants Real-World Findings for Successful Deployment

1 Insights into Scaling Virtual Power Plants Real-World Findings for Successful Deployment January 2025 Angela Long (Rockcress Consulting) Ryan Long (Rockcress Consulting) Smith, Puget Sound Energy 5 5 REAL-WORLD FINDINGS FOR SUCCESSFUL DEPLOYMENT Insights into Scaling Virtual Power Plants Executive Summary Introduction Leadership Investments Planning Case Studies Introduction Leadership Investments Planning Case Studies Appendices Introduction This project, Scaling VPPs: Insights, Profiles and Inventory, seeks to overcome several challenges of accelerating the

10 积分 | 113 页 | 8.01 MB | 22 天前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

的作用 ➢ 从文本模态到多模态 ➢ 其他讨论：Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展：Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全：形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展：DeepSeek-V3 Post-Training 时代下的RL新范式：后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念，并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力？ ➢ 得益于纯大规模强化学习，DeepSeek-R1 具备强大推理事实性推断任务 Simple-QA上表现突出 5 回顾：Pre-Training Scaling Law ➢ Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象，协调了计算量C、模型参数量N和数据大小D之间的关系 6 回顾：Post-Training Scaling Law ➢ Post-Training 阶段，随着训练时计算量（来自RL的Training阶段）和

10 积分 | 76 页 | 8.39 MB | 7 月前
3
北大：DeepSeek-R1及类强推理模型开发解读

的作用从文本模态到多模态其他讨论： Over-Thinking 过度思考等未来方向分析探讨模态穿透赋能推理边界拓展： Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱强推理下的安全：形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment Outline Post-Training 时代下的 RL 新范式：后训练扩展律 Post-Training Scaling Law DS-R1 独立发现了一些通往 o1 路上的核心理念，并且效果还好到受到了 OpenAI 的认可如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力？得益于纯大规模强化学习， DeepSeek-R1 具备强大 4 Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象，协调了计算量 C 、模型参数量 N 和数据大小 D 之间的关系回顾： Pre-Training Scaling Law

10 积分 | 76 页 | 6.72 MB | 7 月前
3
2025年DeepSeek手册：DeepSeek给我们带来的创业机会

DeepSeek出现之前我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判之一传统AGI发展步伐在放慢需要寻找新方向  Scaling Law边际效应递减  人类训练数据接近枯竭  合成数据无法创造新知识  推理能力难以泛化，成本高昂全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 25 颠覆式创新的四种方式政企、创业者必读 DeepSeek-R1突破了大模型Scaling Law瓶颈导致大模型悲观论认为大模型的能力无法进一步得到质的提升开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后，继续增大参数规训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26 政企、创业者必读  预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够

10 积分 | 76 页 | 5.02 MB | 7 月前
3
金融-DeepSeek银行部署加速，AI金融应用迎来跃迁

性能：蒸馏小型模型展现 Test-time Scaling ，可支持多项基础业务场景资料来源： s1: Simple test-time scaling ，中泰证券研究所 9 模型展现出随推理时间增加准确度增加的 Test time Scaling S1 仅使用 1000 个微调示例就达到了类似 r1 的准确度资料来源： s1: Simple test-time scaling ，中泰证券研究所图表：各模型微调示例数与准确度对比图表：各模型微调示例数与准确度对比图表： s1 表现出的 Test time Scaling n DeepSeek 可以通过 API 接口或者数据中台架构，实现与传统银行技术系统的数据交互，从而实现各类业务高效高质的无缝对接，有望释放海量私域数据价值。 Post-Train 阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力，不再依赖传统提示工程。根据 DeepSeek 的官方使用指南，多模态理解和视觉生成表现资料来源： Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling ，中泰证券研究所 11 多模态： Janus-Pro 等开源多模态模型有望进一步提升应用能力理解金融应用的“降本增效 - 价值创造 - 决策赋能”三个层次 2 n 我们认为金融行

10 积分 | 25 页 | 1.44 MB | 1 月前
3
2024年中国人工智能产业研究报告

www.iresearch.com.cn 中国人工智能产业技术环境（2/2） Scaling Law是否失效？思维链、强化学习、后训练可提升模型训练ROI 来源：艾瑞咨询研究院自主研究绘制。 AI技术动态 Scaling Law 演进：Scaling未到尽头，各家仍在积极探索，探索大模型能力边界思维链 CoT 优化：强化学习完成推理侧优化，在复杂计算、科学研究等方向持续加强研究等方向持续加强跨模态响应：将大语言模型、视觉理解模型及和视觉生成模型等能力实现高阶融合 • 大模型Scaling Law表示，增加计算量、模型参数量或数据大小都可能会提升模型性能，但是提升效果会随着这些因素的增加而递减。虽然 Scaling Law原理给大模型能力演进限制了阈值空间，但仍有头部厂商在加大模型参数、数据规模和算力资源的投入，延续大力出奇迹的大模型训练之路。2025年2月，OpenAI推出GPT 逻辑性、有意识 • 推理模型加强推理思考能力，思考形态往系统二倾斜 95% 5% 自大模型发布以来，Scaling Law成为模型层发展迭代共识，国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 2024年，随着大模型的训练脚步变缓，人们也开始关注讨论Scaling Law是否存在失效风险。而以国内外头部厂商的技术动态为标杆，我们可以看到大模型的参数规模与数据跨度仍有提

10 积分 | 51 页 | 3.35 MB | 7 月前
3
2024年中国人工智能产业研究报告

www.iresearch.com.cn 中国人工智能产业技术环境（2/2） Scaling Law是否失效？思维链、强化学习、后训练可提升模型训练ROI 来源：艾瑞咨询研究院自主研究绘制。 AI技术动态 Scaling Law 演进：Scaling未到尽头，各家仍在积极探索，探索大模型能力边界思维链 CoT 优化：强化学习完成推理侧优化，在复杂计算、科学研究等方向持续加强研究等方向持续加强跨模态响应：将大语言模型、视觉理解模型及和视觉生成模型等能力实现高阶融合 • 大模型Scaling Law表示，增加计算量、模型参数量或数据大小都可能会提升模型性能，但是提升效果会随着这些因素的增加而递减。虽然 Scaling Law原理给大模型能力演进限制了阈值空间，但仍有头部厂商在加大模型参数、数据规模和算力资源的投入，延续大力出奇迹的大模型训练之路。2025年2月，OpenAI推出GPT 逻辑性、有意识 • 推理模型加强推理思考能力，思考形态往系统二倾斜 95% 5% 自大模型发布以来，Scaling Law成为模型层发展迭代共识，国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 2024年，随着大模型的训练脚步变缓，人们也开始关注讨论Scaling Law是否存在失效风险。而以国内外头部厂商的技术动态为标杆，我们可以看到大模型的参数规模与数据跨度仍有提

0 积分 | 51 页 | 3.35 MB | 7 月前
3
Rand兰德：2024年评估人工智能对国家安全和公共安全的影响报告（英文版）

2 ables, thresholds for dangerous AI capabilities, and voluntary risk management policies for scaling AI capabilities. The workshop proceedings synthesize insights from these sessions, outline the methodology seeks to continuously measure dangerous model capabili- ties, allowing for the development of scaling laws and appropriate mitigations. Unlocking AI Capabilities Regarding unlocking model capabilities dialogues, and considering the insights and innovations of the private sector. Responsible Capability Scaling Gradient of Risks and Benefits This dialogue examined the feasibility and implica- tions of establishing

0 积分 | 12 页 | 211.27 KB | 4 月前
3
华为昇腾DeepSeek解决方案

Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法，同等算力规模可以探索更强的模型能力 • 在竞争背景下，头部玩家仍将追逐 Scaling Law ，坚定 AI 算力的战略投资，加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑，但远未达到 AI 终点 AI 模型算法： GPT 、互联技术：灵衢 AI 芯片：昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级，模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据重新定义 Scaling Law 延续智能涌现的方向 2017 谷歌发布首个 Transformer 架构模 Distribution DeepSeek 9 大模型从技术摸高走向技术摸高 + 工程创新并行，训练需求持续增长 ① 技术摸高：头部玩家将战略坚定投入预训练基础模型创新，丰富模型组合，追逐 Scaling Law ，加速探索 AGI ② 工程创新：新的范式降低后训练和蒸馏门槛，模型效果大幅提升，出现平权现象，引发新一波的“百模千态” 2012 2013 2014 2015

0 积分 | 32 页 | 2.52 MB | 7 月前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

■ 2, 计算次数 C≈ 6* N * D ■ 万亿模型计算次数 C≈ 6* N * D 1 ≈ .5*1025 OpenAI."Scaling Laws for Neural Language Models",2020 ■ 万亿大模型预训练系统成本估计 ■ 条件：计算量 C≈ 6 * N * D ≈1.5*1 025 ■ 最低时间、成本估计算力 L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖数据集模型参数量 7 6 5 4 3 ---- 2+ 10-9 Dataset Size tokens Parameters non-embedding

10 积分 | 23 页 | 7.53 MB | 7 月前
3

共 67 条前往

页

分类

语言

格式

虚拟电厂规模化发展观察：成功部署的实际经验-Insights into Scaling Virtual Power Plants Real-World Findings for Successful Deployment

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

北大：DeepSeek-R1及类强推理模型开发解读

2025年DeepSeek手册：DeepSeek给我们带来的创业机会

金融-DeepSeek银行部署加速，AI金融应用迎来跃迁

2024年中国人工智能产业研究报告

2024年中国人工智能产业研究报告

Rand兰德：2024年评估人工智能对国家安全和公共安全的影响报告（英文版）

华为昇腾DeepSeek解决方案

浙江大学-DeepSeek模型优势：算力、成本角度解读2025