电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens10 积分 | 4 页 | 269.47 KB | 1 年前3
电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens0 积分 | 4 页 | 269.47 KB | 1 年前3
2025年DeepSeek赋能自智网络高阶演进评测报告�������������������� 5 � � DeepSeek�V3 � R1 ������������������������ ������������������·���������AISWare�AN� Evo1��� DeepSeek�V3�R1 模���������� DeepSeek ����� �����务����������������������������� ������ ���������������������� � 6-1 ���������� ����� 1 �������撰��������� 2 ���� DeepSeek R1�DeepSeek V3 ������������ 800 �模����������� 3 �研������������������������ 6.1.2 �������������� 业 务 智 能 编 排 准 确 性 业 务 智 能 编 排 完 整 性 业 务 智 能 编 排 识 别 率 业 务 智 能 编 排 语 义 一 致 性 �������� DeepSeek R1 DeepSeek V3 模型C 模型D 模型E 95.00% 96.00% 91.20% 89.00% 89.00% 91.60% 93.00% 94.00% 94.40% 9010 积分 | 40 页 | 16.72 MB | 1 年前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。 AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及10 积分 | 23 页 | 2.65 MB | 1 年前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。 AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及0 积分 | 23 页 | 2.65 MB | 1 年前3
北京大学-DeepSeek原理和落地应用20252025年03月01日 厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理 落地应用 目 录 C O N T E N T S 人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø 发展历程 大语言模型(LLM) 的创新应用 投资者背景与市 场定位 里程碑 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比 比较方面 生成模型(V3) 推理模型(R1) 设计初衷 想要在各种自然语言处理的任务中都 能表现好,更通用 重点是为了搞定复杂的推理情况,比如 深度的逻辑分析和解决问题 性能展现 在数学题、多语言任务还有编码任务 里表现不错,像Cmath能得90 等等,能给企业提供高效的AI方案, 满足好多领域的需求 适合学术研究、解决问题的应用和决策 支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火:能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能”10 积分 | 57 页 | 9.65 MB | 1 年前3
民生证券-DeepSeek系列报告之AI+教育系列报告之 AI+教育 2025 年 02 月 12 日 ➢ DeepSeek 发布开源大模型 R1,迅速出圈月活破 3000 万。2025 年 1 月 20 日,DeepSeek 正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek- R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 言推理等任务上,性能比肩 OpenAI o1 正式版。自 1 月 20 日 DeepSeek 发布 R1 模型,该模型的用户数 实现了飞速增长,根据 AI 产品榜的数据,截至 1 月末 DeepSeek 的月活数量达 到 3370 万,迅速成为国内第二位。 ➢ 海外 AI+教育龙头 Duolingo 借助 AI 实现业绩持续增长。多邻国 (Duolingo)是一家全球领先的语言学习平台,2024 1.1 DeepSeek 重塑中国 AI 竞争力,国产大模型百花齐放 DeepSeek 发布开源模型 R1,性能比肩 OpenAI 的 o1 模型。2025 年 1 月 20 日,DeepSeek 正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek- R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极 大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩0 积分 | 15 页 | 2.14 MB | 1 年前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 ➢ DeepSeek R1-Zero 和 R1的出现再次证明了强化学习的潜力所在: ➢ R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调(SFT); ➢ 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek R1在复杂任务上表现卓越,成为开源领域的又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAI o1 系列)的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成绩,略高于OpenAI-o1-1217。在MATH-500上,获得9710 积分 | 76 页 | 8.39 MB | 1 年前3
AI跃迁派:2025年DeepSeek零基础完全指南索人工智能 公司研发,定位为“认知智能引擎”。简单来说,它是一个能像人类一样思考、学习和解 决问题的超级 AI 工具。 核心能力: ⚫ 复杂推理:像学霸解数学题一样处理逻辑难题(R1 模型) ⚫ 多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频) ⚫ 超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: 知识管家:自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译:支持 42 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: ⚫ 思维链可视化:像老师写板书一样展示推理步骤(如解方程时先分解条件再推 导) ⚫ 反事实推演:模拟“如果特斯拉降价 10%”对产业链的 at.deepseek.com` 特点: ⚫ 无需下载,支持文件上传(PDF/Word/图片) ⚫ 功能齐全,包含普通模式(V3)、深度思考(R1)、联网搜索 操作提示:登录后点击输入框下方按钮切换功能模式,例如开启 R1 模式处理复杂数学 题 ②手机 APP(移动办公神器) 下载方式: ⚫ iOS:AppStore 搜索"DeepSeek"(蓝色鲸鱼 LOGO)10 积分 | 21 页 | 1.01 MB | 1 年前3
2024年中国人工智能产业研究报告o系列,通过大规模强化学习算法让模型在数据 高效训练过程中学会更好应用内部思维链(CoT,Chain of Thoughts), 在解决复杂问题时表现更加出色,但彼时尚未公开技术细节。而2025年初, DeepSeek开源R1系列推理思考模型,将思维链过程开放公开,极大推动 全产业推理思考模型的技术进步,也让人们对AI能力有了更深刻感知。 系统一 直觉和本能 系统二 理性 • 快思考:快速、自动、 直觉性、无意识 理应用爆发,长久来看高性能算力仍处于高需求状态。智算中心建设需协调好地区产业资源规划,从软硬件角度优化算力利用率及平台运 行质效,稳健支撑上层AI产业发展。2025年初,随着DeepSeek V3及R1模型的开源及产品破圈,英伟达股价单日下跌幅达到近20%。在 美国对中国实施芯片出口管制的背景下,DeepSeek模型通过算法优化,如结构化稀疏注意力、混合专家系统等技术,显著降低了模型训 练成本,极 来进行模型调整。 数据集的结构、质 量对模型训练结果 影响至关重要。 数据获取 数据清洗 在预训练大模型基 础上可进行后训练 或增量预训练,针 对性提升模型基础 能力。如GPT o系 列、DeepSeek R1 等都是以基模为基 础进行后训练得到。 数据预处理 增量预训练 后训练 监督微调SFT、强化 学习RL、RLHF、偏 好优化对齐等 注入领域知识,优 化特定任务或领域 基于预训练模型,通10 积分 | 51 页 | 3.35 MB | 1 年前3
共 61 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7
