R1 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

电子：DeepSeek-R1加速AI进程，看好AI应用端潜力释放

学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力，其在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。并且，DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型，进一步促进技术的开源和共享，用户可通过官网或 App 调用 DeepSeek-R1 完成各类推理任务。此外，DeepSeek-R1 API 服务定价为每百万输入 tokens

10 积分 | 4 页 | 269.47 KB | 1 年前
3
电子：DeepSeek-R1加速AI进程，看好AI应用端潜力释放

学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力，其在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。并且，DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型，进一步促进技术的开源和共享，用户可通过官网或 App 调用 DeepSeek-R1 完成各类推理任务。此外，DeepSeek-R1 API 服务定价为每百万输入 tokens

0 积分 | 4 页 | 269.47 KB | 1 年前
3
北大：DeepSeek-R1及类强推理模型开发解读

com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新： GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways ： Train-Time Scaling 提升模型的推理能力？得益于纯大规模强化学习， DeepSeek-R1 具备强大推理能力与长文本思考能力，继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在： R1-Zero 从基础模型开始构建，完全依赖强化学习，而不使用人类专家标注的监督微调（ SFT ）；随着训练步骤增加，模型逐渐展现出长文本推理及长链推理能力； Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜力在长文本依赖任务如 FRAMEs 和事实性推断任务 Si l QA 上表现突出得益于强大的推理能力与长文本思考能力， DeepSeek R1 在复杂任务上表现卓越，成为开源领域的又一里程碑，标志着开源社区在与闭源大模型（如

10 积分 | 76 页 | 6.72 MB | 1 年前
3
2025年DeepSeek赋能自智网络高阶演进评测报告

�� 5 � � DeepSeek�V3 � R1 �� ·��AISWare�AN� Evo1�� DeepSeek�V3�R1 模�� DeepSeek �� 务�� 6-1 �� 1 ��撰�� 2 �� DeepSeek R1�DeepSeek V3 �� 800 �模�� 3 �研�� 6.1.2 �� 业务智能编排准确性业务智能编排完整性业务智能编排识别率业务智能编排语义一致性 �� DeepSeek R1 DeepSeek V3 模型C 模型D 模型E 95.00% 96.00% 91.20% 89.00% 89.00% 91.60% 93.00% 94.00% 94.40% 90

10 积分 | 40 页 | 16.72 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

和自编程能力（自动模块设计、代码编写、测试用例）。 " 恨聪明但没那么听话 " DeepseekV3 Deepseek R1 Deepseek r1 鞅的证明 Deepseek r1 Roy 安全准则组合模型推理 Deepseek r1 推理玻尿酸配方 DeepSeek 提示词工程提示词工程 Deepseek 十类提示词 • 1. 内容生成类：文本生成、代码生成、创和 Qwen 蒸馏的 DeepSeek - R1 推理模型，涵盖多种不同参数规模，适合想在本地运行模型的用户。 • 第三方 UI 客户管接入服务：可通过 Anything LLM 、 Cherry Studio 、 Chatbox 等选择 API 接入。 • 秘塔 AI 搜索：接入满血版 DeepSeek - R1 推理模型，无广告且搜索结果直达。以学习 JDK21 2000 万 Tokens ，提供多个基于 DeepSeek - R1 蒸馏训练的模型，如 DeepSeek - R1 - Distill - Llama - 70B 等，在推理能力上表现出色。 • 阿里云百炼：提供多个 DeepSeek 系列模型，如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等，

10 积分 | 79 页 | 6.52 MB | 1 年前
3
面向审计行业DeepSeek 大模型操作指南（27页 WORD）

”就可以使用。图 2 DeepSeek 官方网站主界面不过需要注意，那就是如何选择 V3 还是 R1 模型，可以参考下图。此外还 “ 可根据需要，选择是否勾选联网搜索 ”。图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用手机版的使用和电脑版基本一样，根据需要是否激活 R1 即可。唯一不同的是需要在手机安装对应的 App 。安装方法如下：方法 1 ：进入 DeepSeek 。这些非官方渠道提供了三类模型选择： DeepSeek-V3 模型、完整版 DeepSeek-R1 模型（671B 参数）、轻量级 DeepSeek- R1 模型（参数规模从 1.5B 到 70B 不等）。其中，完整版 R1 模型保留了全部 671B 参数，能发挥出最佳性能，但对计算资源要求较高，通常需要支付一定费用。轻量级模型则通过知识蒸馏技术，在保持核心功能的同时大幅降低了参数在普通算力环境下流畅运行，为用户提供了更灵活的选择。 4.2.1 硅基流动&华为云硅基流动与华为云团队联合首发并上线了基于华为云昇腾云服务的 DeepSeek R1/V3，推理服务目前支持 V3 和 R1 大模型，以及多款 R1 蒸馏小模型。在硅基流动的一站式大模型云服务平台 SiliconCloud 上（网址为： https://siliconflow

0 积分 | 27 页 | 829.29 KB | 6 月前
3
电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

Llama-3.1-405B 等开源模型，并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet不分伯仲，训练成本约为558万美元。1月20日， DeepSeek开源R1模型，后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，性能比肩OpenAI o1正式版，不仅极大提升了模型推理能力，也大幅降低了训练成本。同时，DeepSeek-R1蒸馏了6个快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机：苹果国行AI功能渐行渐近，三星国行S25 系列搭载智谱Agentic GLM，而华为、荣耀、OPPO等多家国产终端近期亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其中我国出货量同增4.9%，增速好于全球市场，除了受AI加持外，国补政策落地也将促进用户换机。AI耳机：字节、Cleer、讯飞等多家品牌密集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩，四大科技巨头Q4资本开支合计同比大幅增长77%，主要支持云计算、AI等基础设施建设。同时后续资本开支指引积极，海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐，反而加大相关投入，而国内 CSP为了保持竞争优势亦有望跟进，增加AI领域相关投入。同时AI应用场景加速普及，也将反哺算力需求。  风险提示：终端需求不及预期；技术推进不及预期；资本开支投入不及

10 积分 | 23 页 | 2.65 MB | 1 年前
3
电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

Llama-3.1-405B 等开源模型，并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet不分伯仲，训练成本约为558万美元。1月20日， DeepSeek开源R1模型，后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，性能比肩OpenAI o1正式版，不仅极大提升了模型推理能力，也大幅降低了训练成本。同时，DeepSeek-R1蒸馏了6个快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机：苹果国行AI功能渐行渐近，三星国行S25 系列搭载智谱Agentic GLM，而华为、荣耀、OPPO等多家国产终端近期亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其中我国出货量同增4.9%，增速好于全球市场，除了受AI加持外，国补政策落地也将促进用户换机。AI耳机：字节、Cleer、讯飞等多家品牌密集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩，四大科技巨头Q4资本开支合计同比大幅增长77%，主要支持云计算、AI等基础设施建设。同时后续资本开支指引积极，海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐，反而加大相关投入，而国内 CSP为了保持竞争优势亦有望跟进，增加AI领域相关投入。同时AI应用场景加速普及，也将反哺算力需求。  风险提示：终端需求不及预期；技术推进不及预期；资本开支投入不及

0 积分 | 23 页 | 2.65 MB | 1 年前
3
北京大学-DeepSeek原理和落地应用2025

2025年03月01日厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理落地应用目录 C O N T E N T S 人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具（国内） Ø 发展历程大语言模型(LLM) 的创新应用投资者背景与市场定位里程碑 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比比较方面生成模型（V3）推理模型（R1）设计初衷想要在各种自然语言处理的任务中都能表现好，更通用重点是为了搞定复杂的推理情况，比如深度的逻辑分析和解决问题性能展现在数学题、多语言任务还有编码任务里表现不错，像Cmath能得90 等等，能给企业提供高效的AI方案，满足好多领域的需求适合学术研究、解决问题的应用和决策支持系统等需要深度推理的任务，也能拿来当教育工具，帮学生锻炼逻辑思维常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火：能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能”

10 积分 | 57 页 | 9.65 MB | 1 年前
3
DeepSeek消费电子行业大模型新型应用最佳实践分享

核心收益长上下文 (64~128K) 超大模型启动加速独享 GPU 算力集群私有 API 服务调用高并发、高可用企业级鉴权流控算力投入持续降低 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时蒸馏后模型多模式精调 • 全参 +LoRA 双模式 • 低至 1 卡 A10 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 全系大语言模型支持 SFT 快速直观 R1 推理结果生成 R1 推理服务调用构造蒸馏数据集清洗 R1 推理结果灵活、易扩展基于 TI 平台精调工具链，迁移 R1 高级推理能力至小尺寸模型，以更低推理成本满足垂直场景下的业务需求内置 R1 模型一键部署快速选择并精调目标模型评估对比模型效果 R1 模型部署效果评估蒸馏模

10 积分 | 28 页 | 5.00 MB | 1 年前
3

共 109 条前往

页

分类

语言

格式

电子：DeepSeek-R1加速AI进程，看好AI应用端潜力释放

电子：DeepSeek-R1加速AI进程，看好AI应用端潜力释放

北大：DeepSeek-R1及类强推理模型开发解读

2025年DeepSeek赋能自智网络高阶演进评测报告

山东大学：DeepSeek 应用与部署

面向审计行业DeepSeek 大模型操作指南（27页 WORD）

电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

北京大学-DeepSeek原理和落地应用2025

DeepSeek消费电子行业大模型新型应用最佳实践分享