积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(35)解决方案(26)研究报告(22)前沿探索(17)人工智能(11)行业赋能(8)党建政务(5)能源双碳(5)大模型技术(5)技术工具(5)

语言

全部中文(简体)(81)英语(1)

格式

全部PDF文档 PDF(47)PPT文档 PPT(30)DOC文档 DOC(9)
 
本次搜索耗时 0.014 秒,为您找到相关结果约 86 个.
  • 全部
  • 人工智能
  • 解决方案
  • 研究报告
  • 前沿探索
  • 人工智能
  • 行业赋能
  • 党建政务
  • 能源双碳
  • 大模型技术
  • 技术工具
  • 全部
  • 中文(简体)
  • 英语
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放

    学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens
    0 积分 | 4 页 | 269.47 KB | 6 月前
    3
  • pdf文档 电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放

    学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens
    10 积分 | 4 页 | 269.47 KB | 5 月前
    3
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜 力 在长文本依赖任务如 FRAMEs 和 事实性推断 任务 Si l QA 上表现突出 得益于强大的推理能力与长文本思考能力 , DeepSeek R1 在复杂任务上表现卓越,成为开源领域的 又 一里程碑,标志着开源社区在与闭源大模型(如
    10 积分 | 76 页 | 6.72 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek赋能自智网络高阶演进评测报告

    �������������������� 5 � � DeepSeek�V3 � R1 ������������������������ ������������������·���������AISWare�AN� Evo1��� DeepSeek�V3�R1 模���������� DeepSeek ����� �����务����������������������������� ������ ���������������������� � 6-1 ���������� ����� 1 �������撰��������� 2 ���� DeepSeek R1�DeepSeek V3 ������������ 800 �模����������� 3 �研������������������������ 6.1.2 �������������� 业 务 智 能 编 排 准 确 性 业 务 智 能 编 排 完 整 性 业 务 智 能 编 排 识 别 率 业 务 智 能 编 排 语 义 一 致 性 �������� DeepSeek R1 DeepSeek V3 模型C 模型D 模型E 95.00% 96.00% 91.20% 89.00% 89.00% 91.60% 93.00% 94.00% 94.40% 90
    10 积分 | 40 页 | 16.72 MB | 5 月前
    3
  • pdf文档 DeepSeek洞察与大模型应用-人工智能技术发展与应用实践

    2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- • R1推出后,追平GPT-o1,迅速出圈海外。从 DeepSeek在美国下载排名从1月22日的201名,迅速 在1月27日登顶第一名;截止1月30日,DeepSeek在 168个国家位居下载榜第一名 • 而然地出现了许多强大而有趣的推理行为;但是,遇到 了可读性差和语言混合等挑战 • DeepSeek-R1:为了解决这些问题并进一步提高推理 性能,DeepSeek团队引入了 R1,它在RL之前结合了 多阶段训练和少量冷启动数据。R1在推理任务上实现 了与OpenAI-o1-1217相当的性能 DeepSeek-R1(对标GPT-o1)于2025年1月 20日推出,随后DeepSeek进一步出圈 DeepSeek-R1 更新日期:2025-2-11 n DeepSeek-V3和R1进入到国际顶尖模型行列 n DeepSeek-R1是综合效果最好的开源模型, 排在众多优秀的开源和闭源模型前面 n Qwen2.5-Max、GLM-4-Plus、Step-2- 16K-Exp等国产模型也有不俗的表现 -6- DeepSeek模型效果 (2/2) n DeepSeek-V3和R1相对于700亿以下开源模型(以千问720亿
    10 积分 | 37 页 | 5.87 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    和自编程能力(自动模块设计、 代码编 写、 测试用例) 。 " 恨聪明 但没那么听话 " DeepseekV3 Deepseek R1 Deepseek r1 鞅的证 明 Deepseek r1 Roy 安全准则组合模型推 理 Deepseek r1 推理玻尿酸配 方 DeepSeek 提示词工 程 提示词工程 Deepseek 十类提示 词 • 1. 内容生成类 :文本生成、代码生成、创 和 Qwen 蒸馏 的 DeepSeek - R1 推理模型 ,涵盖多种不同参数规模 ,适合想在本地运行模型的用户。 • 第三方 UI 客户管接入服务: 可通过 Anything LLM 、 Cherry Studio 、 Chatbox 等选择 API 接入。 • 秘塔 AI 搜索: 接入满血版 DeepSeek - R1 推理模型 , 无广告且搜索结果直达。 以学习 JDK21 2000 万 Tokens ,提供多个基于 DeepSeek - R1 蒸馏训练的模型 ,如 DeepSeek - R1 - Distill - Llama - 70B 等 ,在推理能力上表现出色。 • 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 ,
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • word文档 面向审计行业DeepSeek 大模型操作指南(27页 WORD)

    ”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活 R1 即可。唯一不同 的 是需要在手机安装对应的 App 。安装方法如下: 方法 1 :进入 DeepSeek 。 这些非官方 渠道提供 了 三类模型选择: DeepSeek-V3 模型、完整版 DeepSeek-R1 模型(671B 参数)、轻量级 DeepSeek- R1 模型(参数规模从 1.5B 到 70B 不等)。其中,完整版 R1 模型保留了全部 671B 参数,能发挥出最佳性能,但对计算资源要求较高,通常需要支付一定费 用。轻 量级模型则通过知识蒸馏技术,在保持核心功能的同时大幅降低了参数 在普通算力环境下流畅运行,为用户提供了更灵活的选择。 4.2.1 硅基流动&华为云 硅基流 动与 华 为云 团 队联合 首 发 并 上 线 了基 于 华 为云 昇腾云服 务 的 DeepSeek R1/V3,推理服务目前支持 V3 和 R1 大模型,以及多款 R1 蒸馏小模 型。 在 硅 基 流 动 的 一 站 式 大 模 型 云 服 务 平 台 SiliconCloud 上(网 址 为 : https://siliconflow
    0 积分 | 27 页 | 829.29 KB | 1 天前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。  风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及
    0 积分 | 23 页 | 2.65 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。  风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及
    10 积分 | 23 页 | 2.65 MB | 5 月前
    3
  • pdf文档 北京大学-DeepSeek原理和落地应用2025

    2025年03月01日 厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理 落地应用 目 录 C O N T E N T S 人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø 发展历程 大语言模型(LLM) 的创新应用 投资者背景与市 场定位 里程碑 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比 比较方面 生成模型(V3) 推理模型(R1) 设计初衷 想要在各种自然语言处理的任务中都 能表现好,更通用 重点是为了搞定复杂的推理情况,比如 深度的逻辑分析和解决问题 性能展现 在数学题、多语言任务还有编码任务 里表现不错,像Cmath能得90 等等,能给企业提供高效的AI方案, 满足好多领域的需求 适合学术研究、解决问题的应用和决策 支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火:能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能”
    10 积分 | 57 页 | 9.65 MB | 5 月前
    3
共 86 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 9
前往
页
相关搜索词
电子DeepSeekR1加速AI进程看好应用潜力释放北大及类推理模型推理模型开发解读2025赋能自智网络高阶演进评测报告洞察人工智能人工智能技术发展实践山东东大大学山东大学部署面向审计行业操作指南27WORD电子行业深度推动平权关注终端及算力领域北京北京大学原理落地
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩