积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(27)人工智能(24)解决方案(10)前沿探索(9)技术趋势(9)行业赋能(7)人工智能(7)维度学堂(6)白皮书(5)大模型技术(4)

语言

全部中文(简体)(64)

格式

全部PDF文档 PDF(50)PPT文档 PPT(11)DOC文档 DOC(6)
 
本次搜索耗时 0.052 秒,为您找到相关结果约 67 个.
  • 全部
  • 研究报告
  • 人工智能
  • 解决方案
  • 前沿探索
  • 技术趋势
  • 行业赋能
  • 人工智能
  • 维度学堂
  • 白皮书
  • 大模型技术
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 虚拟电厂规模化发展观察:成功部署的实际经验-Insights into Scaling Virtual Power Plants Real-World Findings for Successful Deployment

    1 Insights into Scaling Virtual Power Plants Real-World Findings for Successful Deployment January 2025 Angela Long (Rockcress Consulting) Ryan Long (Rockcress Consulting) Smith, Puget Sound Energy 5 5 REAL-WORLD FINDINGS FOR SUCCESSFUL DEPLOYMENT Insights into Scaling Virtual Power Plants Executive Summary Introduction Leadership Investments Planning Case Studies Introduction Leadership Investments Planning Case Studies Appendices Introduction This project, Scaling VPPs: Insights, Profiles and Inventory, seeks to overcome several challenges of accelerating the
    10 积分 | 113 页 | 8.01 MB | 22 天前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展:DeepSeek-V3 Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 具备强大推理 事实性推断任务 Simple-QA上表现突出 5 回顾:Pre-Training Scaling Law ➢ Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象,协调了计算量C、模 型参数量N和数据大小D之间的关系 6 回顾:Post-Training Scaling Law ➢ Post-Training 阶段,随着训练时计算量(来自RL的Training阶段)和
    10 积分 | 76 页 | 8.39 MB | 7 月前
    3
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    的作用 从文本模态到多模态 其他讨论: Over-Thinking 过度思考等 未来方向分析探讨 模态穿透赋能推理边界拓展: Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱 强推理下的安全:形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment Outline Post-Training 时代下的 RL 新范式:后训练扩展律 Post-Training Scaling Law DS-R1 独立发现了一些通往 o1 路上的核心理念,并且效果还好到受到了 OpenAI 的认可 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大 4 Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象,协调了计算量 C 、 模 型参数量 N 和数据大小 D 之间的关系 回顾: Pre-Training Scaling Law
    10 积分 | 76 页 | 6.72 MB | 7 月前
    3
  • pdf文档 2025年DeepSeek手册:DeepSeek给我们带来的创业机会

    DeepSeek出现之前 我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向  Scaling Law边际效应递减  人类训练数据接近枯竭  合成数据无法创造新知识  推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立 政企、创业者必读 15 DeepSeek出现之前的十大预判 25 颠覆式创新的四种方式 政企、创业者必读 DeepSeek-R1突破了大模型Scaling Law瓶颈 导致大模型悲观论 认为大模型的能力无法进一步得到质的提升 开辟强化学习新范式 从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的 预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 • 通过后训练算力和推理算力,在不增加 预训练算力前提下,大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26 政企、创业者必读  预训练模型如GPT——疯狂读书,积 累知识,Scaling law撞墙  预训练模型思考深度不够
    10 积分 | 76 页 | 5.02 MB | 7 月前
    3
  • ppt文档 金融-DeepSeek银行部署加速,AI金融应用迎来跃迁

    性能:蒸馏小型模型展现 Test-time Scaling ,可支持多项基础业务场 景 资料来源: s1: Simple test-time scaling ,中泰证券研究所 9 模型展现出随推理时间增加准确度增加的 Test time Scaling S1 仅使用 1000 个微调示例就达到了类似 r1 的准 确度 资料来源: s1: Simple test-time scaling ,中泰证券研究 所 图表:各模型微调示例数与准确度对比 图表:各模型微调示例数与准确度对比 图表: s1 表现出的 Test time Scaling n DeepSeek 可以通过 API 接口或者数据中台架构,实现与传统银行技术系统的数据交互,从而实现各类业务高效高质的无 缝对接,有望释放海量私域数据价值。 Post-Train 阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力, 不 再依赖传统提示工程。根据 DeepSeek 的官方使用指南, 多模态理解和视觉生成表现 资料来源: Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling ,中泰证券研究所 11 多模态: Janus-Pro 等开源多模态模型有望进一步提升应用能 力 理解金融应用的“降本增效 - 价值创 造 - 决策赋能”三个层次 2 n 我们认为金融行
    10 积分 | 25 页 | 1.44 MB | 1 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    www.iresearch.com.cn 中国人工智能产业技术环境(2/2) Scaling Law是否失效?思维链、强化学习、后训练可提升模型训练ROI 来源:艾瑞咨询研究院自主研究绘制。 AI技术动态 Scaling Law 演进:Scaling未到尽头,各家仍在积极探索,探索大模型能力边界 思维链 CoT 优化:强化学习完成推理侧优化,在复杂计算、科学研究等方向持续加强 研究等方向持续加强 跨模态响应:将大语言模型、视觉理解模型及和视觉生成模型等能力实现高阶融合 • 大模型Scaling Law表示,增加计算量、模型参数量或数据大小都可能会提升模型性能,但是提升效果会随着这些因素的增加而递减。虽然 Scaling Law原理给大模型能力演进限制了阈值空间,但仍有头部厂商在加大模型参数、数据规模和算力资源的投入,延续大力出奇迹的大 模型训练之路。2025年2月,OpenAI推出GPT 逻辑性、有意识 • 推理模型加强推理思考能力, 思考形态往系统二倾斜 95% 5% 自大模型发布以来,Scaling Law成为模型层发展迭代共识,国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 2024年,随着大模型的训练脚步变缓,人们也开始关注讨论Scaling Law是否存在失效风险。而以国内外头部厂商的技术动态为标杆,我 们可以看到大模型的参数规模与数据跨度仍有提
    10 积分 | 51 页 | 3.35 MB | 7 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    www.iresearch.com.cn 中国人工智能产业技术环境(2/2) Scaling Law是否失效?思维链、强化学习、后训练可提升模型训练ROI 来源:艾瑞咨询研究院自主研究绘制。 AI技术动态 Scaling Law 演进:Scaling未到尽头,各家仍在积极探索,探索大模型能力边界 思维链 CoT 优化:强化学习完成推理侧优化,在复杂计算、科学研究等方向持续加强 研究等方向持续加强 跨模态响应:将大语言模型、视觉理解模型及和视觉生成模型等能力实现高阶融合 • 大模型Scaling Law表示,增加计算量、模型参数量或数据大小都可能会提升模型性能,但是提升效果会随着这些因素的增加而递减。虽然 Scaling Law原理给大模型能力演进限制了阈值空间,但仍有头部厂商在加大模型参数、数据规模和算力资源的投入,延续大力出奇迹的大 模型训练之路。2025年2月,OpenAI推出GPT 逻辑性、有意识 • 推理模型加强推理思考能力, 思考形态往系统二倾斜 95% 5% 自大模型发布以来,Scaling Law成为模型层发展迭代共识,国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 2024年,随着大模型的训练脚步变缓,人们也开始关注讨论Scaling Law是否存在失效风险。而以国内外头部厂商的技术动态为标杆,我 们可以看到大模型的参数规模与数据跨度仍有提
    0 积分 | 51 页 | 3.35 MB | 7 月前
    3
  • pdf文档 Rand兰德:2024年评估人工智能对国家安全和公共安全的影响报告(英文版)

    2 ables, thresholds for dangerous AI capabilities, and voluntary risk management policies for scaling AI capabilities. The workshop proceedings synthesize insights from these sessions, outline the methodology seeks to continuously measure dangerous model capabili- ties, allowing for the development of scaling laws and appropriate mitigations. Unlocking AI Capabilities Regarding unlocking model capabilities dialogues, and considering the insights and innovations of the private sector. Responsible Capability Scaling Gradient of Risks and Benefits This dialogue examined the feasibility and implica- tions of establishing
    0 积分 | 12 页 | 211.27 KB | 4 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    Distribution 2 训练资源 • 随着 DeepSeek 提供了一种高效率训练的方法,同等 算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer 架 构 模 Distribution DeepSeek 9 大模型从技术摸高走向技术摸高 + 工程创新并行 ,训练需求持续增 长 ① 技术摸高:头部玩家将战略坚定投入预训练基础模型创新,丰富模型组合,追逐 Scaling Law ,加速探索 AGI ② 工程创新:新的范式降低后训练和蒸馏门槛,模型效果大幅提升, 出现平权现象,引发新一波的“百模千态” 2012 2013 2014 2015
    0 积分 | 32 页 | 2.52 MB | 7 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    ■ 2, 计算次数 C≈ 6* N * D ■ 万亿模型计算次数 C≈ 6* N * D 1 ≈ .5*1025 OpenAI."Scaling Laws for Neural Language Models",2020 ■ 万亿大模型预训练系统成本估计 ■ 条件:计算量 C≈ 6 * N * D ≈1.5*1 025 ■ 最低时间、成本估计 算 力 L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖 数据集 模型参数量 7 6 5 4 3 ---- 2+ 10-9 Dataset Size tokens Parameters non-embedding
    10 积分 | 23 页 | 7.53 MB | 7 月前
    3
共 67 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
前往
页
相关搜索词
虚拟电厂规模规模化发展观察成功部署实际经验InsightsintoScalingVirtualPowerPlantsRealWorldFindingsforSuccessfulDeployment2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告北大R1手册我们带来创业机会金融银行加速AI应用迎来跃迁2024中国人工智能人工智能产业研究Rand兰德评估国家安全公共公共安全影响英文文版英文版华为解决方案解决方案浙江大学浙江大学优势算力成本角度
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩