2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告➢ DeepSeek-R1 Zero 的问题:长推理过程可读性差、语言混合,帮助性低 ➢ Research Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1; ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 拒绝采样和全领域SFT 600k 推理数据 (Rule-based+Generative 奖励) 200k 通用数据 (Writing \ Role-Play etc.) Stage II: 通用能力&安全性 DeepSeek-R1 全领域RL All-Scenarios RL 推理任务 – 规则奖励 (Rule-based Reward) 通用任务 – 偏好建模 (Reward Model) ➢ 成效:使模型在推理能力不减的前提下,语言表现更为自然, 适应性更为广泛。 ➢ 全领域RL RL for all Scenarios ➢ 进一步提升除了reasoning 能力之外帮助性和安全性 ➢ 对于reasoning data, 可以用基于规则的奖励 ➢ 对于general data, 可以用奖励模型来建模人类偏好意图 ➢ 成效:最终版本的 R1 不仅在推理和对话能力上达到了高水平,10 积分 | 76 页 | 8.39 MB | 1 年前3
山东大学:DeepSeek 应用与部署Ollama ,如果本地已通过 Ollama 部署了 DeepSeek 等模型, AnythingLLM 会自动检测。这意味着模型和聊天记录仅在运行 Ollama 模型的机器上可访问 ,保证了数据的安全性和隐 私 性。 • Embedding Preference (嵌入偏好):使用 AnythingLLM Embedder 嵌入工具 ,文档文本会在 AnythingLLM 的 实例上私密嵌入 ,不会泄露给第三方。 • Vector Database (向 量数据库):使用 LanceDB 作为向量数据库, 向量和文档文本都存储在 AnythingLLM 实例上 ,进一步确保数据的私密性和安全性。 • 接入 DeepSeek 模型 • 通过 Ollama 接入:先在本地通过 Ollama 部署 DeepSeek 模型 ,然后在 AnythingLLM 中选择 O llama 作为语言模型推理后端10 积分 | 79 页 | 6.52 MB | 1 年前3
英特尔-工业人工智能白皮书2025年版汽车零部件和整车的性能,不仅关乎驾驶性能和体验,更关乎生命安全。因此,必须保证汽车零部件完好无缺陷, 整车装配高度精准可靠,确保每一个部件都符合严格的安全标准。 例如,轮毂是汽车的重要组成部分,其质量直接关系到汽车的安全性和使用寿命。在轮毂的生产制造中,容易产生 划痕、擦伤、气孔、毛刺、喷涂不到位、黑点等外观缺陷。缺陷的多样性、表面反光的干扰以及生产线上的实时检 测要求,使得效率和准确率低下且容易漏检的人工质检和 漏检偏高等问题, 无法满足生产的精度和节拍要求。将深度学习算法与高精度成像系统相结合,更快速地识别出产品图像中的缺陷及 种类,满足生产线对检测精度和速度的要求。 锂电池的质量直接关乎电动车的安全性,因此锂电对质检要求严苛。锂电生产过程中的检测工序繁多,包括原料生 产中的隔膜缺陷检测,前段工序中的极片表面缺陷检测、涂布外观缺陷检测,中段工序中的密封钉焊道缺陷检测、 电池包蓝膜后缺陷检测,后段工序中的 算与数据库构建、分子生成模型和高通量筛选策略等步骤,能从数百万种材料中,快速筛选出具有高能效潜力的材 料,缩短新材料的发现周期。 高效能材料的发现,直接关系着电池的能量密度、性能表现、使用寿命、安全性和成本等关键指标。电池企业正在 材料筛选及研发上积极探索 AI 技术的深入应用。 在锂电池设计方面,利用 AI 高效仿真模型,可以在原子、分子、颗粒、电极和电芯等多个尺度上进行仿真模拟, 让研0 积分 | 82 页 | 5.13 MB | 1 年前3
具身智能科技前瞻探索(第3期):多任务操作、第一人称世界模型、低光照与模糊感知原文摘要 : 摘要 : 在当前人机协作场景中 , 为实现机器人更安全、更智能的 任务执行 , 在视觉信息之外融合多源传感器数据已成为行业研究 的重要方向。尽管热数据对于提升机器人操作安全性与运行效率具 有关键作用 , 但现有研究对其在机器人决策体系中的融合应用仍 关注不足。本文提出了一种全新的视觉 - 语言 - 动作 (VLA) 框 架 , 将热感知信息融入机器人任务执行全流程。该系统以视觉语言 使机器人能够感知物体物理属性 , 并主动实现环境安全 防护。真实世界任务场景的实验结果验证了所提框架的可行性 , 结果表明 , 与现有纯视觉系统相比 , 该框架可有效提升任务成功 率与操作安全性。 6.2 ThermoAct VLA 《具身智能科技前瞻探索》 第 3 期 21 22 / 技术研发进度不及预期风险10 积分 | 25 页 | 1.12 MB | 18 天前3
DeepSeek大模型赋能高校教学和科研2025,为学科交叉创新发展提供有力支撑 4.2 国产 AI 大模型 DeepSeek 走入高 校 本地部署 大模型 4.3 为什么需要本地部署大模 型 离线与高效使用 成本与资源优化 数据隐私与安全性 避免使用限制 定制化与灵活性 模型微调技术特点 ( 1 )领域针对性强: 经过微调的 模 型在特定领域的表现会有显著提 升 , 能够更好地理解和处理该领域 的专业 问题; ( 2 )模型适应性优化:10 积分 | 123 页 | 15.88 MB | 1 年前3
共 5 条
- 1
