面向审计行业DeepSeek 大模型操作指南(27页 WORD)”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活 R1 即可。唯一不同 的 是需要在手机安装对应的 App 。安装方法如下: 方法 1 :进入 DeepSeek 。 这些非官方 渠道提供 了 三类模型选择: DeepSeek-V3 模型、完整版 DeepSeek-R1 模型(671B 参数)、轻量级 DeepSeek- R1 模型(参数规模从 1.5B 到 70B 不等)。其中,完整版 R1 模型保留了全部 671B 参数,能发挥出最佳性能,但对计算资源要求较高,通常需要支付一定费 用。轻 量级模型则通过知识蒸馏技术,在保持核心功能的同时大幅降低了参数 在普通算力环境下流畅运行,为用户提供了更灵活的选择。 4.2.1 硅基流动&华为云 硅基流 动与 华 为云 团 队联合 首 发 并 上 线 了基 于 华 为云 昇腾云服 务 的 DeepSeek R1/V3,推理服务目前支持 V3 和 R1 大模型,以及多款 R1 蒸馏小模 型。 在 硅 基 流 动 的 一 站 式 大 模 型 云 服 务 平 台 SiliconCloud 上(网 址 为 : https://siliconflow0 积分 | 27 页 | 829.29 KB | 2 天前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 2 天前3
2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)Linux 、macOS 和 Windows。在安装前,请确保你的操作系统满足最低要求,见表 3-1。 14 表 3-1DeepSeek R1 系列模型硬件配置需求 模型名称 CPU 要求 内存要求 硬盘要求 显卡要求 DeepSeek - R1 - 1.5B 最低 4 核,建议采 用 Intel 或 AMD 多 核处理器 8GB 及以 上 3GB 如 GTX 1650 DeepSeek - R1 - 7B 8 核及以上,推荐使 用现代多核 CPU 16GB 及 以上 8GB 以 上 建议配备 8GB 及以上显存 的显卡,例如 RTX 3070 或 4060 DeepSeek - R1 - 8B 硬件要求与 DeepSeek - R1 - 7B 相近,但各项性能要 求略高 10 显存要求略高于 8GB,性 能上要求比 DeepSeek - R1 - 7B 对应的显卡略高 DeepSeek - R1 - 14B 12 核及以上 32GB 及 以上 15GB 以 上 需 16GB 及以上显存的显 卡,如 RTX 4090 或 A5000 DeepSeek - R1 - 32B 16 核及以上,例如 AMD Ryzen 910 积分 | 59 页 | 1.06 MB | 2 天前3
2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)并 表 自身模型的迭代。 • Meta 成立四个专门研究小组来分析 DeepSeek R1 的工 作 此改进其大模型 Llama 。 • 英伟达、微软 、亚马逊等国际巨头纷纷接入 DeepSeek 。 DeepSeek 颠覆出圈 , 霸榜热 议 DeepSeek R1 引 发 全 球 关 注 DeepSeek 发 展 节 点 2 0 2 3 年 7 月 D e e “算力降维打击” ,在相同算力下支持更 大参数规模 ,显著提升模型效率。 训练优化 通过低比特 FP8 训练技术、强化学习策略 ( DeepSeek R1 完全依赖 RL 而非人工标 注数据)和通信优化 ,降低训练成本至 550 万美元 ,仅为 GPT-4 的 1/4-1/6 。 性能对标 推理能力比肩 ChatGPT GPT-4 的千分之一。 自主试错优化 R1 采用纯强化学习( RL )训练,跳过 SFT ,让模型通过自主试错和优化来学习, 减少对标注数据依赖,降低训练复杂度。 在实际应用中, R1 在数学和编程任务中表现优于 OpenAI o1 。 自适应调整 极简单的奖励规则,让大模型自我博弈、不断顿悟与自适应调整,实现深度思 考。比如, R1 会深入思考多种解题路径,评估优劣后选择数学难题的最优解,10 积分 | 33 页 | 2.82 MB | 2 天前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升 ,超越人类专 家 开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素? 在数学和代码推理任务上的卓越表现 • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较 强 小结一: 推理模型和思维链 (Chain of Thought20 积分 | 61 页 | 13.10 MB | 2 天前3
DeepSeek在教育中的应用(72页 PPT)DeepSeek 的 4 种方法 ① 通过青岛教育 e 平台 APP 访问: https://www.pgyer.com/cZfT 二、 APP 端使用 DeepSeek 的 2 种模型 推理模型( R1 ) 联网搜索模式( REG ) 通用模型 ( V3 ) 在传统的大语言模型基础 上 , 强化推理 、 逻辑分析 Markdown 分部分 ,每部分不超过 300 字。 DeepSeek 高效 巧 推理模型 提示语只需明确 和需求 ,无需逐步指 导 DeepSeek R1 (推理 提示语过于详细,反倒限制其发挥 我要写一个青岛基础教育三年优质资源倍增的宣传文案 ,要给第一次接触的用 户看 ,希望能让 级 AI 演示: 一句话生成互动课件 尚未 出现 “ 手脑协同” ChatGPT DeepResearch 、 智谱 AutoGLM 、 Manus ? “ 超级大脑” DeepSeek R1 、 ChatGPT o1 “ 对话工具” GPT 大多数国产大模型 根据智能程度 ,人工智能可分为 5 级, 当前主要由 2 级(推理者) 向 3 级(智能体)迈进。 不同于 2 级的“动脑动口不动手”,20 积分 | 72 页 | 10.26 MB | 2 天前3
智能金融:AI驱动的金融变革(45页 PPT)(强推理模型) DeepSeek-V3 (基础模型) 面向全场景的强化学习 (规则奖励 + 奖励模型) 纯强化学习训练 多阶段增强训练 R1-Zero 生成的 长思维链数据 综合性能 更强 R1 蒸馏 版 1.5B~32B 对 V3 模 型 监督 微调 混合数据 监督微调 60 万条 推理数据 模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的模型压缩技术 算法共振与羊群效应 OpenAI :推理增强会明显减少幻觉! DeepSeek R1 实测:推理增强后幻觉率增加! 过度延展的推理机制 训练数据的奖励偏差 解决方案? 面临挑战 3 :创造力与幻觉率悖论? 根据 Vectara 的测试, R1 的幻觉率 14.3% ,显著高于其前身 V3 的 3.9%20 积分 | 45 页 | 4.10 MB | 2 天前3
北京大学:DeepSeek在教育和学术领域的应用场景与案例二、DeepSeek与AI认知 此部分从DeepSeek的历史开始,逐步讲解AI的演进及认知: 1. DeepSeek解密:详细介绍DeepSeek技术历程、核心优势及其算法在理解、推理、知识应用上的提升。解析V3、R1等模 型特性,旨在为听众构建对这一前沿技术价值的坚实理解基础。 2. AI技术演进与认知框架:梳理AI从规则系统到大模型的技术演进,探讨AI时代的认知升级与人才观变革。为教育者提供认 知框架, DeepSeek推出对标OpenAI GPT-4o的语言模型DeepSeek V3,随后在美国AI行 业内部引起轰动。 n 2025年1月20日, DeepSeek发布对标OpenAI o1 的DeepSeek R1大语言模型,并于1月24日引起美 国投资界KOL关注。 n 2025年1月26日,关于DeepSeek颠覆了大模型的商 业模式(堆算力、拼资本),引发英伟达股价大跌, DeepSeek首先在美国出圈,引发国际社会讨论。 生产办公系统:目前多数为定制开发(RAG、Agent等) Ø 对话机器人:目前多数为标准产品,使用云服务 • 免费:DeepSeek、豆包、Kimi、元宝、Monica、秘塔搜索、问小白、Molly R1等 • 收费(月费;充值):文小言、通义、可灵、即梦、Vidu、Liblib、ChatGPT等 系统组成20 积分 | 251 页 | 26.07 MB | 2 天前3
ABeam:智变中国-2025科技趋势洞察报告2024-04-12 70 4.3.1 [1] ◼ 2023 6 Vision Pro 3499 50 Apple Vision Pro ◼ Apple Vision Pro M2+R1 R1 3D 12ms Micro-OLED 8K Vision OS Vision OS ✓ ✓ ✓ ✓ ✓ ✓ ✓ ✓ * ABeam * ABeam 71 4.320 积分 | 97 页 | 11.51 MB | 2 天前3
疾控工作者应该怎么利用DeepSeek等AI大模型三降 智能评估 智能随访 家庭医生专注于诊断和治疗服 务 慢病筛 查 生活干预 人均管理 成本下降 管理率提升 家庭医生 脑卒中 治疗 诊断 CDC 疾控人 据介绍, R1 模型在技术上实现了重要突破——用纯深度学习方法让 AI 自发涌现出推理能力, 在数学、代码、自然语言推理等任务上, 性能比肩 OpenAl 的 01 模型正式版,且训练成本仅 为 一腾讯元宝 微信 Al 搜索 一腾讯 ima 个人知识库 · Al 搜索 秘塔搜索 > 纳 米 Al 搜索 > 知 乎 直 答 · 其它接入 DeepSeek-R1 的产品 >Molly R1 ( 向量智能 ) 问 小 白 六、 DeepSeek 简 介 cDC 疾控 人 sn . 6 .9 接入 DeepSeek-R1 第三方服务的厂家 · 互联网大厂: · 腾讯:腾讯元宝、20 积分 | 78 页 | 20.76 MB | 14 天前3
共 27 条
- 1
- 2
- 3
