面向审计行业DeepSeek 大模型操作指南(27页 WORD)”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活 R1 即可。唯一不同 的 是需要在手机安装对应的 App 。安装方法如下: 方法 1 :进入 DeepSeek 。 这些非官方 渠道提供 了 三类模型选择: DeepSeek-V3 模型、完整版 DeepSeek-R1 模型(671B 参数)、轻量级 DeepSeek- R1 模型(参数规模从 1.5B 到 70B 不等)。其中,完整版 R1 模型保留了全部 671B 参数,能发挥出最佳性能,但对计算资源要求较高,通常需要支付一定费 用。轻 量级模型则通过知识蒸馏技术,在保持核心功能的同时大幅降低了参数 在普通算力环境下流畅运行,为用户提供了更灵活的选择。 4.2.1 硅基流动&华为云 硅基流 动与 华 为云 团 队联合 首 发 并 上 线 了基 于 华 为云 昇腾云服 务 的 DeepSeek R1/V3,推理服务目前支持 V3 和 R1 大模型,以及多款 R1 蒸馏小模 型。 在 硅 基 流 动 的 一 站 式 大 模 型 云 服 务 平 台 SiliconCloud 上(网 址 为 : https://siliconflow0 积分 | 27 页 | 829.29 KB | 3 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 3 月前3
DeepSeek银行部署加速,AI金融应用迎来跃迁(25页 PPT)训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到 了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方 大规模跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所 资料来源:木尧,中泰证券研究所 5 性能: DeepSeek 推理架构优化,可适配银行高并行、高响应的业务场 景 n 以 DeepSeek R1 为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源 80% 以上能 力,就足以压缩闭源的生存空间。 DeepSeek 能力能够比肩 OpenAIo1 ,开源使各行业机构能够轻松获取前沿模型能力,10 积分 | 25 页 | 1.44 MB | 1 月前3
2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)Linux 、macOS 和 Windows。在安装前,请确保你的操作系统满足最低要求,见表 3-1。 14 表 3-1DeepSeek R1 系列模型硬件配置需求 模型名称 CPU 要求 内存要求 硬盘要求 显卡要求 DeepSeek - R1 - 1.5B 最低 4 核,建议采 用 Intel 或 AMD 多 核处理器 8GB 及以 上 3GB 如 GTX 1650 DeepSeek - R1 - 7B 8 核及以上,推荐使 用现代多核 CPU 16GB 及 以上 8GB 以 上 建议配备 8GB 及以上显存 的显卡,例如 RTX 3070 或 4060 DeepSeek - R1 - 8B 硬件要求与 DeepSeek - R1 - 7B 相近,但各项性能要 求略高 10 显存要求略高于 8GB,性 能上要求比 DeepSeek - R1 - 7B 对应的显卡略高 DeepSeek - R1 - 14B 12 核及以上 32GB 及 以上 15GB 以 上 需 16GB 及以上显存的显 卡,如 RTX 4090 或 A5000 DeepSeek - R1 - 32B 16 核及以上,例如 AMD Ryzen 910 积分 | 59 页 | 1.06 MB | 3 月前3
2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)并 表 自身模型的迭代。 • Meta 成立四个专门研究小组来分析 DeepSeek R1 的工 作 此改进其大模型 Llama 。 • 英伟达、微软 、亚马逊等国际巨头纷纷接入 DeepSeek 。 DeepSeek 颠覆出圈 , 霸榜热 议 DeepSeek R1 引 发 全 球 关 注 DeepSeek 发 展 节 点 2 0 2 3 年 7 月 D e e “算力降维打击” ,在相同算力下支持更 大参数规模 ,显著提升模型效率。 训练优化 通过低比特 FP8 训练技术、强化学习策略 ( DeepSeek R1 完全依赖 RL 而非人工标 注数据)和通信优化 ,降低训练成本至 550 万美元 ,仅为 GPT-4 的 1/4-1/6 。 性能对标 推理能力比肩 ChatGPT GPT-4 的千分之一。 自主试错优化 R1 采用纯强化学习( RL )训练,跳过 SFT ,让模型通过自主试错和优化来学习, 减少对标注数据依赖,降低训练复杂度。 在实际应用中, R1 在数学和编程任务中表现优于 OpenAI o1 。 自适应调整 极简单的奖励规则,让大模型自我博弈、不断顿悟与自适应调整,实现深度思 考。比如, R1 会深入思考多种解题路径,评估优劣后选择数学难题的最优解,10 积分 | 33 页 | 2.82 MB | 3 月前3
AI赋能资产配置:DeepSeek对国信多元资配框架的优化训练阶段 应用阶段 在 python 中调用 DeepSeek 接口(可选 V3 、 R1 等) 初始化 自 然 语 言 数 据 懂资配框架 的 DeepSeek 资料来源: DeepSeek ,国信证券经济研究所整 理 基于 Xgboost 模型 DeepSeek 接入:通过 API 将 DeepSeek 接入 Python 环境,实现变量和数据框的 AI 加工与动态输出。采用硅基流动基于华为昇腾云的 DeepSeek R1 & V3 推理服务,确保稳定高效的模型训练与推理调用 • 指令的输入:①输入不同时间段的宏观变量和五大短期模型最优权重,助力 AI 掌握模型逻辑与数据映射(静态学习);②输入实际股 债强弱与“先验权重”的偏差,要求 大模型的选择:目前接入的为 DeepSeek-V3 模型,尚未使用推 理能力更强的 DeepSeek-R1 。接入更高性能的大模型有望进一步 优化当前配置。(核心问题:现阶段采用硅基流动基于华为昇腾云 的 DeepSeek R1 & V3 推理服务,受 TPM 限制(每分钟 Token 数量 不超过 15000 ),导致 AI 输出耗时较长。未来通过本地部署大模 型,或可在本地构建知识库以提升响应速度和优化能力) 指令的优化:10 积分 | 33 页 | 2.86 MB | 3 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升 ,超越人类专 家 开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素? 在数学和代码推理任务上的卓越表现 • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较 强 小结一: 推理模型和思维链 (Chain of Thought20 积分 | 61 页 | 13.10 MB | 3 月前3
DeepSeek在教育中的应用(72页 PPT)DeepSeek 的 4 种方法 ① 通过青岛教育 e 平台 APP 访问: https://www.pgyer.com/cZfT 二、 APP 端使用 DeepSeek 的 2 种模型 推理模型( R1 ) 联网搜索模式( REG ) 通用模型 ( V3 ) 在传统的大语言模型基础 上 , 强化推理 、 逻辑分析 Markdown 分部分 ,每部分不超过 300 字。 DeepSeek 高效 巧 推理模型 提示语只需明确 和需求 ,无需逐步指 导 DeepSeek R1 (推理 提示语过于详细,反倒限制其发挥 我要写一个青岛基础教育三年优质资源倍增的宣传文案 ,要给第一次接触的用 户看 ,希望能让 级 AI 演示: 一句话生成互动课件 尚未 出现 “ 手脑协同” ChatGPT DeepResearch 、 智谱 AutoGLM 、 Manus ? “ 超级大脑” DeepSeek R1 、 ChatGPT o1 “ 对话工具” GPT 大多数国产大模型 根据智能程度 ,人工智能可分为 5 级, 当前主要由 2 级(推理者) 向 3 级(智能体)迈进。 不同于 2 级的“动脑动口不动手”,20 积分 | 72 页 | 10.26 MB | 3 月前3
智能金融:AI驱动的金融变革(45页 PPT)(强推理模型) DeepSeek-V3 (基础模型) 面向全场景的强化学习 (规则奖励 + 奖励模型) 纯强化学习训练 多阶段增强训练 R1-Zero 生成的 长思维链数据 综合性能 更强 R1 蒸馏 版 1.5B~32B 对 V3 模 型 监督 微调 混合数据 监督微调 60 万条 推理数据 模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的模型压缩技术 算法共振与羊群效应 OpenAI :推理增强会明显减少幻觉! DeepSeek R1 实测:推理增强后幻觉率增加! 过度延展的推理机制 训练数据的奖励偏差 解决方案? 面临挑战 3 :创造力与幻觉率悖论? 根据 Vectara 的测试, R1 的幻觉率 14.3% ,显著高于其前身 V3 的 3.9%20 积分 | 45 页 | 4.10 MB | 3 月前3
人形机器人生态报告2025-上海财经大学本体、数据、端到端基础模型及场景解决⽅案全栈⾃研。 星海图核⼼产品涵盖星海图 R1 系列(含 R1 基础版、R1 Pro 进阶版)⼈形机器 ⼈,主打“⼈形本体+专业化机械臂+具⾝智能系统”的⼀体化产品形态,可实现精密抓 取、⼯具操作、物料装配等多样化作业,单臂负载与操作精度能满⾜ 3C 电⼦、新零 售、实验室⾃动化等细分场景的实操要求。在智能参数层⾯,R1 系列搭载的具⾝智能 ⼤模型⽀持 20+种⼯业⼯具的⾃主10 积分 | 20 页 | 2.65 MB | 1 月前3
共 47 条
- 1
- 2
- 3
- 4
- 5
