积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(5)技术工具(5)

语言

全部中文(简体)(5)

格式

全部PDF文档 PDF(3)PPT文档 PPT(2)
 
本次搜索耗时 0.013 秒,为您找到相关结果约 5 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 对推理链的质量进行细致的评估,并通过奖励机制引导模型生成更加合理、准确的推理过程。 ➢ 多目标优化:兼顾推理性能、帮助性和安全性; ➢ 蒸馏的潜力:蒸馏可以帮助将更大模型通过RL发现的高阶推理范式蒸馏到小模型中,这比用小 模型直接使用大规模RL发现的推理范式要更加有效; ➢ 基于群组的相对策略优化 (GRPO) :通过构建多个模型输出的群组,并计算群组内的相对奖励来 估计基线,从而避免了传统策略优化算法中需要使用与策略模型大小相同的评论模型 技能。 ➢ DeepSeek 利用蒸馏R1的手段获得了一系列小模型,表现非常突出。这很大程度得益于R1模型足够强大,发 现了很多高阶推理范式,而这些高阶推理范式是小模型直接利用大规模强化学习难以发现的(可以认为是由 于预训练知识不足),因此这些蒸馏得到的小模型表现比较突出,甚至超过了基于大规模RL的方法。 38 技术对比讨论:蒸馏 vs 强化学习 ➢ 在提升模型强推理能力的努力上,蒸馏和强化学习被社区广泛探索
    10 积分 | 76 页 | 8.39 MB | 7 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    认证”,关键决策需展示推理路径 4.共生之道:人类文明的升维指南 在 AI 时代保持竞争优势,需掌握三大核心能力: ①元认知能力 ⚫ 批判性思维:能识别 AI 建议中的逻辑漏洞(如发现商业方案中的“合成数据偏 差”) ⚫ 价值判断:在 AI 提供的 100 种方案中选择最符合伦理的路径 ②智能协作力 ⚫ 混合智能:医生结合 AI 诊断与临床经验,使误诊率降低至 达到“超人类智能”时,人类需回答三个根本问题: ①创造力边界 ⚫ 艺术领域:AI 生成画作拍出 430 万美元,但“情感共鸣度”仍低于人类作品 ⚫ 科学突破:DeepSeek 辅助发现“高温超导新材料”,但理论框架仍依赖人类 ②存在价值重构 意义经济学:人类工作价值从“劳动产出”转向“情感连接” 案例: ⚫ 手写信件服务价格暴涨 10 倍 ⚫ 线下脱口秀票房超过
    10 积分 | 21 页 | 1.01 MB | 7 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务 , 相当于 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 旨在通过自动化操作提升日常生活和工作效率 。 它还可以一边 在 Stub Hub 搜索勇士队比赛门票 ,一边处理网球场预订、寻找清洁服务和 DoorDash 订餐 , 实现多任务并行处理 6. 基于大模型的智能 体 发现矛盾时 , 自动回溯、 验证 ,调整推理路径 2025 年 2 月 3 日 , OpenAI 发布了一款新的智能体产品—— Deep Research 。 Deep Research 由 OpenAI 显著提升科研写作效率。 此外 , DeepSeek 还可以根据提供 的数据 和要求 , 生成专业的报告框架和内容 ,为科研人员提供有力支持 通过深度学习和机器学习算法 , DeepSeek 能够发现隐藏在数据中的信息 , 帮助用户发现新的 机 会和趋势。 在医学科研中 , DeepSeek 能够从大量实验数据中提取有价值的信息 , 发掘潜 在的研 究方向和生物标志物 对于有特定需求的用户 , DeepSeek
    10 积分 | 123 页 | 15.88 MB | 7 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    察市场需求,预测未来趋势,精准定位产品的设计与 迭代方向。 • 优化研发流程管理:基于当前项目状态和历史数据建 立预测模型,预测每项任务的完成时间,并评估整个 项目的完成时间,有助于提前发现潜在延迟风险,让 团队合理分配时间和其他资源,保证项目按时或提前 完成。 • 自动化代码编写与优化:AI 编程助手利用深度学习 算法和大量代码数据训练模型,通过分析代码的结构 和模式,并根据开发者的需求,自动生成函数、类、 在设备运维管理方面,利用机器学习算法,对部署在 设备上的温度、压力、振动等各种传感器给出的监测 数据进行处理分析,实时监控设备运行状态,并可通 过模式识别算法检测数据中的异常,预测可能出现的 故障或发现故障甚至给出修复建议,便于运维人员及 时实施预测性维护或故障修复,减少停机时间,提高 设备的可靠性和生产效率。 • 质量管理:产品缺陷检测是质量管理的重要一环,尤 其是对于金属等高反光产品、薄膜产品的划痕、裂 生产参数,并合理地分配人力、设备、物料等生产资 源,提高资源利用率,确保生产线始终保持在最佳工 作状态,提高生产效率。 在生产过程监控和优化方面,AI 算法通过分析生产 线上的各种运行状态反馈数据和工艺参数,能够预 测及发现潜在问题,并自动调整参数,优化产线运 行状态。 • 生产安全管理:通过智能视频分析技术分析从生产现 场采集的视频,进行行为识别与违规监测,如自动识 别生产线上的工人是否穿了防护服、佩戴安全帽,是
    0 积分 | 82 页 | 5.13 MB | 7 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    speculative decoding ,加速解码过程,降低整体时延 7 Huawei Proprietary - Restricted Distribution 关键 发现 ① 细粒度的计算通信并行 • 将 PP stage 拆分为更细的模块 ,提升模块交替编排的灵活度 • 参考 ZeroBubble ,反向传递中的权重更新和梯度传递独立操作 • 经过细粒度的拆分和编排之后
    0 积分 | 32 页 | 2.52 MB | 7 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告AI跃迁基础完全指南赋能高校教学科研英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版华为解决方案解决方案
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩