驱动 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

技术对比探讨 ➢ STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o-series) ➢ 蒸馏 vs. 强化学习驱动：国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论：Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ Zero: 无需监督微调SFT，纯强化学习驱动的强推理模型 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL 大规模推理为中心的强化学习，提升模型数学代码能力 RL驱动下自然涌现长文本推理能力 9 DeepSeek-R1 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT，纯强化学习驱动的强推理模型 ➢ 奖励建模：基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是

10 积分 | 76 页 | 8.39 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

边缘 AI 驱动，助力新质生产力英特尔® 工业人工智能白皮书 2025 年版 Intel® Industrial AI Playbook 2025 Edition 编委会：主编：刘俊、马小龙、朱永佳编委：方辛月、高畅、高杨帆、胡杨、刘波、吕晓峰、邱丽颖、单娜、张恒、张心宇 * 编辑按姓名首字母排序人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮，通用大模型的出现让的市场需求预测模型能快速分析消费者需求趋势，辅助设计/生产软件能基于历史数据和现有数据加速新产品设计，优化生产管理流程，快速上市新产品。更加个性化、智能化、功能强大的手机、PC 等消费电子产品，是驱动消费电子产品更新换代和市场复苏的关键因素。消费电子产品将是大模型部署的新阵地。围绕用户的个性化需求，包括不同的使用场景和使用习惯等，大模型的部署需要根据用户特征对模型进行差异化增强。为了炫™ 3 系列，可拥有最高 8 颗 X e 核心和 6 GB GDDR6 显存，满足了边缘应用对于低功耗和小尺寸形态的要求，满足 AI 推理能力的需求。英特尔® X e -HPG 微架构驱动边缘 AI 工作负载英特尔锐炫™ 显卡采用了英特尔® X e -HPG 微架构，凭借其全新的X e 内核，满足边缘 AI 工作负载对计算效率与性能的要求。 X e 内核是英特尔® GPU

0 积分 | 82 页 | 5.13 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

增强交互性提高准确性 5.1.5 AIGC 大模型的提示词使用提示词需要注意一些技巧，这样可以从大模型获得更加符合我们预期要求的结果简洁明确示例驱动考虑受众明确角色分解复杂任务遵守规则使用肯定性指令自然语言回答通用模型 n 需显式引导推理步骤（如通过“思维链” 提示），否则可能跳过关键的思维方式和行为模式，为用户提供更加精准、个性化且高效的信息检索服务。 A I 搜索通过收集和分析用户的历史搜索数据和行为模式，构建用户画像，从而实现更加精准的个性化搜索服务。这种数据驱动的智能决策机制，使得 AI 搜索能够不断自我优化，提升用户体验。纳米 AI 搜索是 360 公司在 2024 年 12 月推出的全新 AI 搜索应用，结合了自然语言处理、机器学习以及专家协同助手型工具（例如 siri 、小度、小愛音箱），只完成和人之间的问答会话 6. 基于大模型的智能体智能体更像是一个拥有自主意识的智能员工，它以大语言模型为驱动，具备自主理解、感知、规划、记忆和使用工具的能力。它可以根据目标任务，进行智能规划与决策，自动执行复杂的任务。比如在智能办公场景中， AI Agent 可以根据用户的日程安排，自动预订会议

10 积分 | 123 页 | 15.88 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

多头潜在注意力：像多线程处理信息，显存占用降低 50%，适合普通电脑运行 ⚫ MoE 混合专家系统：遇到问题自动召唤“专业团队”，比如数学题找数学专家模块，写诗找创意模块 ⚫ 强化学习驱动：通过“试错+奖励”机制自我进化，类似游戏 AI 自学通关 2.划时代意义：中国 AI 的破局之战 DeepSeek 的诞生不仅是技术突破，更是国家战略级的里程碑：成本革命：

10 积分 | 21 页 | 1.01 MB | 1 年前
3
华为昇腾DeepSeek解决方案

效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法： DeepSeek 国家战略清晰技术创新依赖资本投入 NLP 自然语言处理双轮驱动互锁战略坚定 + 技术创新 CV 计算机视觉 3 Huawei Proprietary - Restricted Distribution 下一代 AI 技术 Mamba

0 积分 | 32 页 | 2.52 MB | 1 年前
3

共 5 条前往

页

分类

语言

格式

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

英特尔-工业人工智能白皮书2025年版

DeepSeek大模型赋能高校教学和科研2025

AI跃迁派：2025年DeepSeek零基础完全指南

华为昇腾DeepSeek解决方案