R1 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek洞察与大模型应用-人工智能技术发展与应用实践

2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- • R1推出后，追平GPT-o1，迅速出圈海外。从 DeepSeek在美国下载排名从1月22日的201名，迅速在1月27日登顶第一名；截止1月30日，DeepSeek在 168个国家位居下载榜第一名 • 而然地出现了许多强大而有趣的推理行为；但是，遇到了可读性差和语言混合等挑战 • DeepSeek-R1：为了解决这些问题并进一步提高推理性能，DeepSeek团队引入了 R1，它在RL之前结合了多阶段训练和少量冷启动数据。R1在推理任务上实现了与OpenAI-o1-1217相当的性能 DeepSeek-R1（对标GPT-o1）于2025年1月 20日推出，随后DeepSeek进一步出圈 DeepSeek-R1 更新日期：2025-2-11 n DeepSeek-V3和R1进入到国际顶尖模型行列 n DeepSeek-R1是综合效果最好的开源模型，排在众多优秀的开源和闭源模型前面 n Qwen2.5-Max、GLM-4-Plus、Step-2- 16K-Exp等国产模型也有不俗的表现 -6- DeepSeek模型效果 (2/2) n DeepSeek-V3和R1相对于700亿以下开源模型（以千问720亿

10 积分 | 37 页 | 5.87 MB | 9 月前
3
DeepSeek消费电子行业大模型新型应用最佳实践分享

核心收益长上下文 (64~128K) 超大模型启动加速独享 GPU 算力集群私有 API 服务调用高并发、高可用企业级鉴权流控算力投入持续降低 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时蒸馏后模型多模式精调 • 全参 +LoRA 双模式 • 低至 1 卡 A10 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 全系大语言模型支持 SFT 快速直观 R1 推理结果生成 R1 推理服务调用构造蒸馏数据集清洗 R1 推理结果灵活、易扩展基于 TI 平台精调工具链，迁移 R1 高级推理能力至小尺寸模型，以更低推理成本满足垂直场景下的业务需求内置 R1 模型一键部署快速选择并精调目标模型评估对比模型效果 R1 模型部署效果评估蒸馏模

10 积分 | 28 页 | 5.00 MB | 9 月前
3
金融-DeepSeek银行部署加速，AI金融应用迎来跃迁

其通过对训练方式、算法架构和推理方法的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果，有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次：降本增效，价值创造与决策赋能。在实际银行落地应用中，可能包括： 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推理助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法， R1-Zero 版本模型使用纯强化学习方法。随训练过程推进，模型展现出了推理能力的扩展（高准确率和 long-CoT 能力涌现等）。图表：随步数提升跨节点专家并行（ Expert Parallelism ， EP ）来优化通信开销，尽可能实现负载均衡。图表： DeepSeek R1 架构图图表： DeepSeek R1 训练方法资料来源： DeepSeek ，中泰证券研究所

10 积分 | 25 页 | 1.44 MB | 3 月前
3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率横空出世： OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升，超越人类专家开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的？是单纯的规模扩展结果，还是有其他关键因素？在数学和代码推理任务上的卓越表现 • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率横空出世： OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较强小结一：推理模型和思维链 (Chain of Thought

20 积分 | 61 页 | 13.10 MB | 3 月前
3
DeepSeek AI大模型在工程造价上的应用方案

变化等）生成多个预算方案，供决策者参考。  审核反馈机制：建立预算审核的反馈机制，确保审核意见能够及时传达并落实。为了进一步优化预算编制与审核的效率，可以利用 DeepSeek- R1 大模型的多维数据分析功能，结合以下表格展示不同方案的对比情况：方案编号预算总额（万元）材料成本（万元）人工成本（万元）工期（天）风险评估方案 2023 年：材料单价为 150 元/吨，波动范围为±10%。基于这些数据，模型可以预测未来一年内该材料的价格可能上涨至 160 元/吨，并提供相应的预算调整建议。此外，DeepSeek- R1 还能够通过对比不同项目中相似工程的成本构成，发现预算编制中的常见问题。例如，通过对五项类似工程的历史数据分析，模型总结出以下规律：  机电安装工程中的设备采购成本占比平均为 35%，但在某一总之，用户满意度调查不仅验证了 DeepSeek-R1 大模型在工程造价领域的应用价值，也为模型的持续改进提供了宝贵的用户视角和实际数据支持。通过不断迭代和优化，我们相信 DeepSeek- R1 将在未来的工程造价工作中发挥更加重要的作用。 11. 风险管理与应对措施在 DeekSeek-R1 大模型应用于工程造价的过程中，风险管理与应对措施的制定是确保项目顺利实施的关键。首先，模型在预测

0 积分 | 138 页 | 252.70 KB | 8 月前
3

共 5 条前往

页

分类

语言

格式

DeepSeek洞察与大模型应用-人工智能技术发展与应用实践

DeepSeek消费电子行业大模型新型应用最佳实践分享

金融-DeepSeek银行部署加速，AI金融应用迎来跃迁

从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

DeepSeek AI大模型在工程造价上的应用方案