积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(22)人工智能(11)区域研究(4)技术趋势(3)企业案例(2)教育医疗(2)

语言

全部中文(简体)(18)

格式

全部PDF文档 PDF(18)PPT文档 PPT(4)
 
本次搜索耗时 0.017 秒,为您找到相关结果约 22 个.
  • 全部
  • 研究报告
  • 人工智能
  • 区域研究
  • 技术趋势
  • 企业案例
  • 教育医疗
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放

    学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens
    0 积分 | 4 页 | 269.47 KB | 6 月前
    3
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜 力 在长文本依赖任务如 FRAMEs 和 事实性推断 任务 Si l QA 上表现突出 得益于强大的推理能力与长文本思考能力 , DeepSeek R1 在复杂任务上表现卓越,成为开源领域的 又 一里程碑,标志着开源社区在与闭源大模型(如
    10 积分 | 76 页 | 6.72 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek赋能自智网络高阶演进评测报告

    �������������������� 5 � � DeepSeek�V3 � R1 ������������������������ ������������������·���������AISWare�AN� Evo1��� DeepSeek�V3�R1 模���������� DeepSeek ����� �����务����������������������������� ������ ���������������������� � 6-1 ���������� ����� 1 �������撰��������� 2 ���� DeepSeek R1�DeepSeek V3 ������������ 800 �模����������� 3 �研������������������������ 6.1.2 �������������� 业 务 智 能 编 排 准 确 性 业 务 智 能 编 排 完 整 性 业 务 智 能 编 排 识 别 率 业 务 智 能 编 排 语 义 一 致 性 �������� DeepSeek R1 DeepSeek V3 模型C 模型D 模型E 95.00% 96.00% 91.20% 89.00% 89.00% 91.60% 93.00% 94.00% 94.40% 90
    10 积分 | 40 页 | 16.72 MB | 5 月前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。  风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及
    0 积分 | 23 页 | 2.65 MB | 6 月前
    3
  • pdf文档 北京大学-DeepSeek原理和落地应用2025

    2025年03月01日 厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理 落地应用 目 录 C O N T E N T S 人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø 发展历程 大语言模型(LLM) 的创新应用 投资者背景与市 场定位 里程碑 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比 比较方面 生成模型(V3) 推理模型(R1) 设计初衷 想要在各种自然语言处理的任务中都 能表现好,更通用 重点是为了搞定复杂的推理情况,比如 深度的逻辑分析和解决问题 性能展现 在数学题、多语言任务还有编码任务 里表现不错,像Cmath能得90 等等,能给企业提供高效的AI方案, 满足好多领域的需求 适合学术研究、解决问题的应用和决策 支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火:能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能”
    10 积分 | 57 页 | 9.65 MB | 5 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    o系列,通过大规模强化学习算法让模型在数据 高效训练过程中学会更好应用内部思维链(CoT,Chain of Thoughts), 在解决复杂问题时表现更加出色,但彼时尚未公开技术细节。而2025年初, DeepSeek开源R1系列推理思考模型,将思维链过程开放公开,极大推动 全产业推理思考模型的技术进步,也让人们对AI能力有了更深刻感知。 系统一 直觉和本能 系统二 理性 • 快思考:快速、自动、 直觉性、无意识 理应用爆发,长久来看高性能算力仍处于高需求状态。智算中心建设需协调好地区产业资源规划,从软硬件角度优化算力利用率及平台运 行质效,稳健支撑上层AI产业发展。2025年初,随着DeepSeek V3及R1模型的开源及产品破圈,英伟达股价单日下跌幅达到近20%。在 美国对中国实施芯片出口管制的背景下,DeepSeek模型通过算法优化,如结构化稀疏注意力、混合专家系统等技术,显著降低了模型训 练成本,极 来进行模型调整。 数据集的结构、质 量对模型训练结果 影响至关重要。 数据获取 数据清洗 在预训练大模型基 础上可进行后训练 或增量预训练,针 对性提升模型基础 能力。如GPT o系 列、DeepSeek R1 等都是以基模为基 础进行后训练得到。 数据预处理 增量预训练 后训练 监督微调SFT、强化 学习RL、RLHF、偏 好优化对齐等 注入领域知识,优 化特定任务或领域 基于预训练模型,通
    0 积分 | 51 页 | 3.35 MB | 5 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    o系列,通过大规模强化学习算法让模型在数据 高效训练过程中学会更好应用内部思维链(CoT,Chain of Thoughts), 在解决复杂问题时表现更加出色,但彼时尚未公开技术细节。而2025年初, DeepSeek开源R1系列推理思考模型,将思维链过程开放公开,极大推动 全产业推理思考模型的技术进步,也让人们对AI能力有了更深刻感知。 系统一 直觉和本能 系统二 理性 • 快思考:快速、自动、 直觉性、无意识 理应用爆发,长久来看高性能算力仍处于高需求状态。智算中心建设需协调好地区产业资源规划,从软硬件角度优化算力利用率及平台运 行质效,稳健支撑上层AI产业发展。2025年初,随着DeepSeek V3及R1模型的开源及产品破圈,英伟达股价单日下跌幅达到近20%。在 美国对中国实施芯片出口管制的背景下,DeepSeek模型通过算法优化,如结构化稀疏注意力、混合专家系统等技术,显著降低了模型训 练成本,极 来进行模型调整。 数据集的结构、质 量对模型训练结果 影响至关重要。 数据获取 数据清洗 在预训练大模型基 础上可进行后训练 或增量预训练,针 对性提升模型基础 能力。如GPT o系 列、DeepSeek R1 等都是以基模为基 础进行后训练得到。 数据预处理 增量预训练 后训练 监督微调SFT、强化 学习RL、RLHF、偏 好优化对齐等 注入领域知识,优 化特定任务或领域 基于预训练模型,通
    10 积分 | 51 页 | 3.35 MB | 6 月前
    3
  • pdf文档 Manus在AI Agent领域实现技术突破,AI驱动智算中心升级-中原证券

    预测 2025 年全球 云基础设施服务支出将达到 19%。2025 年,我国 AI 初创企业 DeepSeek 发布 DeepSeek R1,DeepSeek R1 以极低成本实现接 近 GPT-4o 级别的性能。头部云厂商迅速响应,将 DeepSeek R1 集成至其云平台,以抢占市场先机。 ⚫ 2024 年我国企业级 ICT 市场同比增长 11.7%,出海、云计算、AI 及算力部署成为市场增长核心引擎。企业视角下,2024 亿美元扩建数据中心。谷歌预计 2025 年资本支出将达到 750 亿美元。2025 年 1 月,我国 AI 初创企业 DeepSeek 发布 DeepSeek R1, DeepSeek R1 以极低成本实现了接近 GPT-4o级别的性能。头部云厂商迅速响应,将DeepSeek R1 集成至其云平台,以抢占市场先机。 第7页 / 共28页 通信 本报告版权属于中原证券股份有限公司 何时候不应视为对特定投资者关于特定证券 或投资标的的推荐。 本报告具有专业性,仅供专业投资者和合格投资者参考。根据《证券期货投资者适当性管 理办法》相关规定,本报告作为资讯类服务属于低风险(R1)等级,普通投资者应在投资 顾问指导下谨慎使用。 本报告版权归本公司所有,未经本公司书面授权,任何机构、个人不得刊载、转发本报告 或本报告任何部分,不得以任何侵犯本公司版权的其他方式使用。未经授权的刊载、转发,
    0 积分 | 28 页 | 2.98 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek手册:DeepSeek给我们带来的创业机会

     算力见顶,变成少数巨头游戏 预训练大模型 推理大模型 预训练大模型难以通往AGI之路  推理模型如R1——通过逻辑链条推导答案, 分解规划,自我反思  预训练范式像是记忆和模仿,强化学习范 式更像探索实践  记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种 预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考 政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha Zero时刻 • Alpha Go采用监督学习, 使用人类棋谱训练 • Alpha Zero采用强化学习, 自己跟自己对弈 ChatGPT时刻 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升 用起来更像真人,写作能力更强,想象力更丰富 31 政企、创业者必读 DeepSeek-R1用户体验改善的作用  R1在零广告投入下7天增长1亿用户,创最快应用破亿里程碑  把人工智能从不可用、凑合用,变成大家都能用、都爱用  推动市场加速发展,在中国用户、企业和政府彻底普及了一次AI  中国可能成为全球AI普及率、渗透率最高的国家,
    10 积分 | 76 页 | 5.02 MB | 5 月前
    3
  • ppt文档 智能金融:AI驱动的金融变革(45页 PPT)

    (强推理模型) DeepSeek-V3 (基础模型) 面向全场景的强化学习 (规则奖励 + 奖励模型) 纯强化学习训练 多阶段增强训练 R1-Zero 生成的 长思维链数据 综合性能 更强 R1 蒸馏 版 1.5B~32B 对 V3 模 型 监督 微调 混合数据 监督微调 60 万条 推理数据 模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的模型压缩技术 算法共振与羊群效应 OpenAI :推理增强会明显减少幻觉! DeepSeek R1 实测:推理增强后幻觉率增加! 过度延展的推理机制 训练数据的奖励偏差 解决方案? 面临挑战 3 :创造力与幻觉率悖论? 根据 Vectara 的测试, R1 的幻觉率 14.3% ,显著高于其前身 V3 的 3.9%
    20 积分 | 45 页 | 4.10 MB | 2 天前
    3
共 22 条
  • 1
  • 2
  • 3
前往
页
相关搜索词
电子DeepSeekR1加速AI进程看好应用潜力释放北大及类推理模型推理模型开发解读2025赋能自智网络高阶演进评测报告行业电子行业深度推动平权关注终端及算力领域北京大学北京大学原理落地2024中国人工智能人工智能产业研究ManusAgent实现技术突破驱动智算中心升级中原证券手册我们带来创业机会金融变革45PPT
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩