2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告技术对比探讨 ➢ STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL 大规模推理为中心的强化学习,提升模型数学代码能力 RL驱动下自然涌现长文本推理能力 9 DeepSeek-R1 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero: 无需监督微调SFT,纯强化学习驱动的强推理模型 ➢ 奖励建模:基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是10 积分 | 76 页 | 8.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版边缘 AI 驱动, 助力新质生产力 英特尔® 工业人工智能白皮书 2025 年版 Intel® Industrial AI Playbook 2025 Edition 编委会: 主编:刘 俊、马小龙、朱永佳 编委:方辛月、高 畅、高杨帆、胡 杨、刘 波、吕晓峰、邱丽颖、单 娜、张 恒、张心宇 * 编辑按姓名首字母排序 人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮,通用大模型的出现让 的市场需求预测模型能快速分析消费者需求趋势,辅助设计/生产软件能基于历 史数据和现有数据加速新产品设计,优化生产管理流程,快速上市新产品。 更加个性化、智能化、功能强大的手机、PC 等消费电子产品,是驱动消费电子产品更新换代和市场复苏的关键 因素。 消费电子产品将是大模型部署的新阵地。围绕用户的个性化需求,包括不同的使用场景和使用习惯等,大模型的部 署需要根据用户特征对模型进行差异化增强。为了 炫™ 3 系列,可拥 有最高 8 颗 X e 核心和 6 GB GDDR6 显存,满足了边缘应用对于低功耗和小尺寸形态的要求,满足 AI 推理能力的需求。 英特尔® X e -HPG 微架构驱动边缘 AI 工作负载 英特尔锐炫™ 显卡采用了英特尔® X e -HPG 微架构,凭借其全新的X e 内核,满足边缘 AI 工作负载对计算效率与性能的要求。 X e 内核是英特尔® GPU0 积分 | 82 页 | 5.13 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025增强交互性 提高准确性 5.1.5 AIGC 大模型的提示词 使用提示词需要注意一些技巧 , 这样可以从大模型获得更加符合我们预期要求的结 果 简洁明确 示例驱动 考虑受众 明确角色 分解复杂任务 遵守规则 使用肯定性指令 自然语言回答 通用模型 n 需显式引导推理步骤(如通过“思 维链” 提示) ,否则可能跳过关键 的思维方式和行为模式 ,为用户提供更加精准、 个性化且高效的信息检索服务。 A I 搜索通过收集和分析用户的历史搜索数据和行为模式 ,构建用户画像 ,从而实现更加精准的个性化搜索服务。 这 种数据驱动的智能决策机制 ,使得 AI 搜索能够不断自我优化 ,提升用户体验。 纳米 AI 搜索是 360 公司在 2024 年 12 月推出的全新 AI 搜索应用 ,结合了自然语言处理、 机器学习以及专家协同 助手型工具 (例如 siri 、小度、小愛音箱) ,只完成和人之间 的问答会话 6. 基于大模型的智能 体 智能体更像是一个拥有自主意识的智能员工 ,它以大语言模型为驱动 ,具备自主理解、感知、规划、记忆和使用工具的能力。它可以根据 目 标任务 ,进行智能规划与决策 , 自动执行复杂的任务。比如在智能办公场景中 , AI Agent 可以根据用户的日程安排 , 自动预订会议10 积分 | 123 页 | 15.88 MB | 6 月前3
AI跃迁派:2025年DeepSeek零基础完全指南多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 AI 自学通关 2.划时代意义:中国 AI 的破局之战 DeepSeek 的诞生不仅是技术突破,更是国家战略级的里程碑: 成本革命:10 积分 | 21 页 | 1.01 MB | 6 月前3
华为昇腾DeepSeek解决方案效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法: DeepSeek 国家战略清晰 技术创新依赖资本投入 NLP 自然语言处理 双轮驱动互锁 战略坚定 + 技术创新 CV 计算机视觉 3 Huawei Proprietary - Restricted Distribution 下一代 AI 技术 Mamba0 积分 | 32 页 | 2.52 MB | 5 月前3
共 5 条
- 1
