北大:DeepSeek-R1及类强推理模型开发解读RL 驱动下自然涌现长文本推理能力 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL DeepSeek-R1-Zero DeepSeek-v3-Base (671B) 奖励建模: 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + ,纯强化学习驱动的强推理模型 DeepSeek-R1 技术剖析: DeepSeek-R1 Zero 9 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖 励 推理为中心大规模强化学习:组相对策略优化( GRPO ) + 瞄准 Reasoning 推理任务 自我迭代提升 上训练)(基座模型知识帮助突破推理上界,也有 一些 工作利用小模型复现 Aha Moment 得益于大规模 RL 和高质量推理数据); 大规模强化学习加持: GRPO 对于强化学习训练的优化; 规则化奖励: 绕过奖励攻陷问题,但是得益于推理问题可以进行自动化标记和验证 ( Self-Automated Verification and Annotation) ,这是与一般聊天和写作请求任务不同的;10 积分 | 76 页 | 6.72 MB | 5 月前3
2025具身机器人行业未来展望报告基于人类制定规则进行执行 的能力,需要人类监督 基于人类指定的规则及训 练的成果进行一定的自主 运行的能力,复杂情况下 仍需人工监督 基于人类指定的规则及训练 的成果进行一定的自主运行 的能力,少量人工监督,具 有自成长能力 无需人类监督,能够在人类 规则下自主智能化运行,并 且具有自成长能力,具有情 感化交流能力 对于大脑能力的需求 解析指令,执行指令 感知环境,解析规则,自动 化执行 化执行 多模态感知理解,解析规 则,自动化解析执行复杂 的运动 多模态感知理解,解析规则, 自动化解析执行复杂的运动, 自主迭代优化能力 多模态感知理解及执行,自 主迭代,情感化交流能力, 成为机器与AI Agent的结合 体 信息/指令获取端口 遥控器,控制器 遥控器,指令集,摄像头、 雷达等传感器 遥控器,指令集,文本, 摄像头,雷达,麦克风等 各类传感器 遥控器,指令集,文本,摄0 积分 | 31 页 | 3.33 MB | 5 月前3
智驾地图市场研究报告(2025)-32页智驾地图与传统导航地图的区别 特征 传统导航地图 智驾地图 主要目的 人类驾驶员路径规划、导航指引 服务自动驾驶系统 (机器),辅助感知、规划与决策 核心要素 道路网络、兴趣点(POI)、基本交通规则 按需提供车道拓扑、关键语义要素、精确道路属性等 精度要求 道路级别 (典型精度5-10米) 按需达到车道级或更高精度 (如信号灯等关键要素位 置,<50cm) 更新频率 相对较低 要求高,强依赖众源数据实现近实时或高频更新 提供更适合自动驾驶系统执行的路径(如车道级、 考虑曲率/坡度/可通行性),在高阶自动驾驶中始终是地图的核心能力。 决策支撑 (规 则/拓扑) ★ ★★ ★★★️ ★★★ ★★★️ 核心价值,高阶关键: 提供复杂的交通规则(如潮汐车道、特殊路口通 行)、道路拓扑关系,是实现安全、合规、高效智能驾驶决策的基础,重 要性随级别升高而凸显。 ODD 定义/验 证 N/A ★★ ★★★️ ★★★ ★★★ 高阶功能关键: ★★★️ ★★ ★★ ★ 重要性逐步下降: 早期高精定位依赖地图特征,未来多传感器融合定位 技术成熟后,对地图几何特征的依赖性降低。 趋势:从依赖几何精度 (L2+/高速) 转向依赖语义、拓扑、规则和优化规划能力 (城市NOA及以上),并成为重要训练数据源。 主要作用 核心价值 智驾地图在不同自动驾驶等级中的作用演变 资料来源:泰伯智库制作 版权声明:本报告版权归泰伯智库所有,未经授10 积分 | 32 页 | 5.32 MB | 5 月前3
国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代分析师:陈烨尧 执业证书编号:S0020524080001 邮箱:chenyeyao@gyzq.com.cn 智能驾驶行业研究 请务必阅读正文之后的免责条款部分 目录 2 1.端到端发展进入加速期,基于规则长期护航 1.1 端到端的定义、发展历程、实现方法及挑战 1.2 自动驾驶产业支持充足,标志性政策落地 1.3 车企抢滩DeepSeek,AI行业与智能驾驶共振 1.4 10万级别智驾落地推动行业进入智驾平权 轴汽车底盘 控制系统供应商 3.4.8 线控转向:L4级及以上自动驾驶必备,尚处市场导入期 4.投资建议 5.风险提示 请务必阅读正文之后的免责条款部分 3 端到端发展进入加速期,基于 规则长期护航 1 请务必阅读正文之后的免责条款部分 图1:端到端与模块化自动驾驶 资料来源:电动车公社,国元证券研究所 4 端到端的定义:基于数据驱动的深度学习 在广义语境中,端到端是一种研 从大量驾驶数据中自动学习复杂的驾驶模式和场景特征。 传统智驾系统的感知层、决策规划层和控制执行层之间 相互独立,信息传递容易积累误差,且智驾方案依赖于 工程师通过代码制定的规则,难以处理所有复杂场景, 边际效应随着智驾能力的提升呈现几何式骤减。与基于 规则的传统自动驾驶算法结构相比,端到端算法基于数 据驱动,可以实现信息的无损传递。同时,端到端架构 将感知、预测和规划结合为一个可以共同训练的单一模 型,10 积分 | 95 页 | 6.54 MB | 5 月前3
2025年以DeepSeek为代表的AI在能源行业的应用前景预测报告4五、案例--2024年国网电力市场发展状况 23 ◼ 国网市场存在问题: 5.储能发展: -储能的大规模发展对系统调度运行、电力市场设计等方面提出新的要求。 -需要通过完善市场机制和调度规则,激励储能的灵活调节能力,提高储能的利用效率和经济效益。 6.新型经营主体: -微电网、虚拟电厂、负荷聚合商等新型经营主体参与市场面临认定、计量、结算等问题。 -需要通过明确市场主体地位、完善 4五、案例--2024年国网电力市场发展状况 ◼ 国网市场存在问题: 9.省间省内市场衔接: -省间与省内市场、中长期与现货市场、电能量市场与辅助服务市场等市场衔接机制仍需进一步完善。 -需要通过加强市场规则设计、优化市场运营机制、提升市场协同能力等手段,实现各市场之间的有效衔接和协同运行,提高市场 整体效率和效益。 10.电力市场技术标准: -计量、结算等关键技术标准规范仍需进一步完善。 -需10 积分 | 29 页 | 2.37 MB | 5 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会重塑经济图景 解决复杂问题 7 政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业 政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 等带来巨大改进,降低成本和算力要求 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题 政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43 政企、创业者必读 人工智能的目标是星辰大海,是为了让人类在科技上有突破 基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型10 积分 | 76 页 | 5.02 MB | 5 月前3
2025腾讯云城市峰会·上海站——从智能营销到智能制造传统机器人不智能, 应答效果差 客户诉求 产品示例 人工校验入库 在售前/售后服务领域:腾讯乐享帮助打造一站式智慧售前/服务社区 乐享讲好品牌故事,传播好企业文化,让工业企业和零售户感受到有规则,有公平,有信心 Deepseek 大模型引擎 结合物联网和人工智能打造的勘探/安装/巡检一体化平台, 节约人力成本,降低安全风险,提高工作效率 当前拍摄 未来拍摄 屋顶四周对角 各处细节+视频10 积分 | 16 页 | 16.40 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025Ø 多模态模型 Ø …… l 行业模型(垂直模型、垂类模型) Ø 教育、医疗、金融等 大模型的前世今生 •人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能) •运算推理:规则核心;自动化 •知识工程:知识核心;知识库+推理机 •机器学习:学习核心;数据智能(统计学习方法,数据建模) •常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,….. •人工神10 积分 | 57 页 | 9.65 MB | 5 月前3
信通院:“机器人+人工智能”工业应用研究报告2025进一步推动了算力需求的激增。当前,软硬件协同的方法正在不断提 升大规模智算训练效率。在硬件方面,高性能 GPU、专用 AI 芯片、 高速互联网络、大容量高速存储等技术,实现了大规模的算力供给, 为处理复杂、不规则的计算任务(如自然语言处理的长序列数据、计 算机视觉的多尺度图像特征)创造了条件;在软件方面,分布式训练 框架、预训练大模型、多模态数据处理等技术也通过精细化算力管理 提升了大模型的训练和推理速度,为机器人的大规模应用提供了基础 来看,机器学习对于数据和算力的需求较小,训练时间也相对较短, 而深度学习、强化学习则需要高性能的 GPU、TPU 等算力支撑,数据 需求也增长至百万量级。从应用场景来看,机器学习能够广泛用于各 类分类、回归、聚类、关联规则任务,帮助机器人实现物品分类、平 面移动和故障诊断等功能,但不具备决策能力;而深度学习则聚焦图 像、文本和语音等复杂任务的处理,能够帮助机器人实现缺陷检测、 知识问答、人机对话等功能,具有一定的决策能力。0 积分 | 37 页 | 2.06 MB | 5 月前3
爱分析:2025年流程智能化应用实践报告义基础,确保机器可理解与执行。其次,企业需要实现战略与执行的动态映射。基于业务架构与流 程架构的贯通,将战略目标拆解为可执行的流程组件,确保 AI 与价值创造路径精准对齐。第三,企 业需要建立数据治理底层规则。通过明确数据采集点、流转路径及质量标准,形成"数据-流程-决策 "闭环治理框架。第四,识别流程熵增的优化靶点。企业通过拓扑关系分析揭示跨系统断点与冗余环 节,为 AI 提供明确的优化约束与决策10 积分 | 24 页 | 8.61 MB | 5 月前3
共 23 条
- 1
- 2
- 3
