DeepSeek消费电子行业大模型新型应用最佳实践分享核心收益 长上下文 (64~128K) 超大模型启动加速 独享 GPU 算力集群 私有 API 服务调用 高并发、高可用 企业级鉴权流控 算力投入持续降低 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时 蒸馏后模型多模式精调 • 全参 +LoRA 双模 式 • 低至 1 卡 A10 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 全系大语言模型支持 SFT 快速 直观 R1 推理结果 生成 R1 推理服务调用 构造蒸馏数据 集 清洗 R1 推理结果 灵活、易扩展 基于 TI 平台精调工具链,迁移 R1 高级推理能力至小尺寸模型,以更低推理成本满足垂直场景下的业务需 求 内置 R1 模型一键部 署 快速 选择并精调目标模型 评估对比模型效果 R1 模型部署 效果评 估 蒸馏模10 积分 | 28 页 | 5.00 MB | 1 年前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 6 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升 ,超越人类专 家 开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素? 在数学和代码推理任务上的卓越表现 • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较 强 小结一: 推理模型和思维链 (Chain of Thought20 积分 | 61 页 | 13.10 MB | 6 月前3
DeepSeek AI大模型在工程造价上的应用方案变化 等)生成多个预算方案,供决策者参考。 审核反馈机制:建立预算审核的反馈机制,确保审核意见能够 及时传达并落实。 为了进一步优化预算编制与审核的效率,可以利用 DeepSeek- R1 大模型的多维数据分析功能,结合以下表格展示不同方案的对 比情况: 方案编 号 预算总额(万 元) 材料成本(万 元) 人工成本(万 元) 工期 (天) 风险评 估 方案 2023 年:材料单价为 150 元/吨,波动范围为±10%。 基于这些数据,模型可以预测未来一年内该材料的价格可能上 涨至 160 元/吨,并提供相应的预算调整建议。此外,DeepSeek- R1 还能够通过对比不同项目中相似工程的成本构成,发现预算编 制中的常见问题。例如,通过对五项类似工程的历史数据分析,模 型总结出以下规律: 机电安装工程中的设备采购成本占比平均为 35%,但在某一 总之,用户满意度调查不仅验证了 DeepSeek-R1 大模型在工 程造价领域的应用价值,也为模型的持续改进提供了宝贵的用户视 角和实际数据支持。通过不断迭代和优化,我们相信 DeepSeek- R1 将在未来的工程造价工作中发挥更加重要的作用。 11. 风险管理与应对措施 在 DeekSeek-R1 大模型应用于工程造价的过程中,风险管理 与应对措施的制定是确保项目顺利实施的关键。首先,模型在预测0 积分 | 138 页 | 252.70 KB | 11 月前3
共 4 条
- 1
