北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : RL 加持下的长度泛化 \ 推理范式的涌现 DeepSeek-R1 社会及经济效益 技术对比探讨 STaR-based Methods vs. RL-based \ o- series) 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及 Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 过度思考等 未来方向分析探讨 模态穿透赋能推理边界拓展: Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱 强推理下的安全:形式化验证 Formal10 积分 | 76 页 | 6.72 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告\ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证10 积分 | 76 页 | 8.39 MB | 5 月前3
2025年基于LTE-V2X预警类应用的功能安全分析白皮书本研究基于 LTE-V2X 直连通信技术,对预警类应用的功能安全进行了系统分析。研究背景指出, 传统的功能安全分析方法主要针对单车系统,近年来 V2X 技术逐渐发展,智能网联汽车应用不断 增加,但缺乏系统性的功能安全分析方法。本研究选取前向碰撞预警(FCW)、交叉路口碰撞预警 (ICW)和闯红灯预警(RLVW)三个典型应用场景,对基于 LTE-V2X 预警类应用的功能安全分 析进行了技术探索。 5GAA 的 STiCAD 项目、中国汽 车工程学会的 T/CSAE 53 标准、汽标委的预警类应用技术要求和试验方法,以及 C-NCAP 2024 版 测试规程中的相关场景。本研究还对 V2X 预警类应用进行了分类,分为安全类和效率类应用,并 指出安全类应用与功能安全的相关性更大,因此本研究以安全类的三个典型应用场景为目标展开 分析。 在功能安全分析方法论部分,本研究基于 GB/T 34590 闯红灯预警(RLVW)应用,分别进行了相关项定义、潜在危害识别、ASIL 分析等工作,提出了 针对安全目标的功能安全要求。 在总结及展望部分,建议以本研究为开端,将 GB/T 34590 的功能安全分析方法拓展至 V2X 系统。 本研究的主要结论为:QM 级别的功能安全设计能够满足 V2X 预警类应用的需求。 2 / 32 Executive Summary This study conducts a systematic10 积分 | 34 页 | 3.26 MB | 5 月前3
2025大模型时代:类脑智能赋能电力应用场景的新模式研究报告10 积分 | 51 页 | 4.48 MB | 5 月前3
智慧水利行业实践及理解华为智慧水利行业实践及理解 2 Huawei Confidential 华为是全球领先的 ICT 基础设施和智能终端提供商 我们致力于把数字世界带入每个人、每个家庭、每个组织, 构建万物互联的智能世界 我们在通信网络、 IT 、智能终端和云服务等领域为客户提供有竞争力、安全可信赖的产品、解决方案与服务, 与生态伙伴开放合作,持续为客户创造价值,释放个人潜能,丰富家庭生活,激发组织创新。 研发员工 9 万 世界 500 强排名 72 国家和地区 170+ 品牌排名 68 员工 19.4 万 3 Huawei Confidential 聚焦 ICT 技术,面向三类客户群,提供产品解决方案和服务 消费者业务 全球标志性的科技品牌 运营商业务 客户最佳战略合作伙伴 企业业务 数字化转型的使能者 和最佳合作伙伴 云业务 做客户稳定可靠、安全可信、持续创 水利发展经过工程水利、资源水利、生态水利发展阶段,治水进入水利现代化阶段。通过优化、调整人类生产生活方式, 综合解决水多、水少、水脏、水混等水问题,实现减灾与兴利之间的动态平衡。 水利系统定位及职责使命经过强化提升,已从单一水工程建设运维,全面转向水工程运维、水资源供给、水生态补偿、 调蓄、水安全防护(水质保护、防汛应急)综合水资源治理。 工程水利 资源水利 生态水利 除害兴利 防洪抗旱、排涝、灌溉20 积分 | 21 页 | 17.17 MB | 4 月前3
智能体应用现状挑战及建议智能体应用现状挑战及建议 中国电子信息产业发展研究院 无线电管理研究所(未来产业研究中心) 二 O 二五年四月 ID CCID CCID CC ID CCID CCID CC CCID CCID CCID CCID CC ID CCID CCID CCID CCID 1 一、智能体概述 二、智能体发展现状 三、智能体发展动向与挑战 四、推动智能体发展的路径 等外部 信息 • 定义:智能体( AI Agent )是基于人工智能技术理解外部环境刺激并生成有意义动作的交互系统 ,涵盖环境感知、决策规划、 自主学习、 多 模态 交互及任务执行等关键技术。 自主学习和适应 智能体能够通过增强学习和迁移学习等方法从过往经验中学习并调整决策制定和行动过程 ID CCID CCID CC ID CCID CCID CC CCID 大语言模型先驱 ,持续优化智能体文本处理能力并推出 GPT Store ,拓展应用场景和商业模式。 IBM : 老牌技术领先公司 ,依托稳固客户关系推动 WatsonX 平台及智 能体发展 ,提供深度洞察并支持多云环境集成 ,助力企业构建 定制化智能体。 亚马逊云: 专注人工智能和云服务 ,通过智能体技术提升商业价值 ,更新 Bedrock 平台支持多种模型10 积分 | 9 页 | 1.03 MB | 1 天前3
数字创新园区建设及运维方案” 数字创新园区“ 建设及运维方案 目 录 01 园区智慧化建设背景 02 “ 数字创新园区”建设方案 03 “ 数字创新园区”运维方案 智能 运营 园区竞争 力和吸引 力增强 园区产业 服务水平 提升 园区运营管 理水平提升 大数据 移动 互联网 AI 人工智能 GIS IOT 物联网 BIM + 园区运营 成本降低 街景地图、 及雨雪、日升日落 天气特效展现。 ⚫ 园区突发事件模拟,应急辅助 分析研判、启动预案、处置资 源分析、联动等。 园区管理 -3- 综合态势管控系统 基于 CIM 的综合安防管理, AI+ 视频融合,杜绝安全隐患 ✓ 设备 分布 及基础信息 ✓ 视频访问 ✓ AI 视频分析 ✓ 人员出入统计 ✓ 告警及统计 略,根据运行的需要进行空间优化,帮助管 理者实现品质、成本和资产的精细化管理 ➢ 通过 BIM 模型实现对重要设备数据管理, 属 性查阅,维修、维护计划制定,智能告警, 设备 定 位,系统联动 园区及设施数字化,用能状况可视化 运维数据互通,能源智慧管控 基于数据分析,实现能源优化, 资产升级 园区管理20 积分 | 34 页 | 5.42 MB | 4 月前3
园区ESG及绿色运营白皮书10 积分 | 102 页 | 11.83 MB | 4 月前3
水泥产业智能制造相关技术探讨及应用Ltd. 中材国际(南 • 水泥产业智能制造及智能化水泥工厂 • 智能化水泥工厂与数字化智能型控制 • 智能化水泥工厂的元数据与数字化工厂 • 智能化水泥工厂的工业互联网架构探讨及案例分享 水泥产业智能制造相关技术探讨及应用 Sinoma International Engineering Co., Ltd. 中材国际(南 水泥产业智能制造及智能化水泥工厂 Sinoma International 整体规划 数据中心 及 数据分析 网络及 安全规划 与主体 专业的 规划设计 数字化 工厂 规划设计 智能应用 移动应用 智能分析 智能服务 三维工厂 智能设备 智能 决策层 经营 大数据中心 … 质量 大数据中心 制造 大数据中心 采购管理 实现智能化水泥工厂整体架构及功能设计 实现工厂的数字化设计 实现网络联通、数据互通及业务打通,消 除信息孤岛 除信息孤岛 完成生产过程数据及相关管理数据的采集 奠定大数据分析的基础条件。 Sinoma International Engineering Co., Ltd. 中材国际(南 智能 生产 控制 层 经营 管控层 设备管理 能源管理 智能物流 智能质控 安全环保 财务管理 人力资源 管理 销售管理 OA 协同 电子 商务 设备资产 管理 智能矿山 智能生产0 积分 | 46 页 | 4.94 MB | 3 月前3
人机对话技术及动态(57页PPT)张伟男 哈尔滨工业大学 计算机科学与技术学院 社会计算与信息检索研究中心 人机对话关键技术及挑战 本科生 对话理解与对话生成 对话主导 朱才海 冯梓娴 推荐主导 胡景雯 一致性 张家乐 张开颜 连贯性 个性化 多样性 朱庆福 马龙轩 宋皓宇 刘元兴 李凌志 多轮建模 朱泽圻 风格化 Conversational Intelligence (CI) 张伟男副教授 确认状态跟踪 澄清状态跟踪 词法、句法、语义分析 拒识回复 确认及澄清回复 多领域用户对话意图识别 多领域对话状态跟踪 上下文建模 情感回复 个性化回复 风格化回复 . . . 对话质量评估 情感分析 拒识、确认、澄清、隐式反 馈 ... TTS 领域内分析及处理 ASR 多领域对话状态分布 自然语言理解 文本或语音 文本或语音 (2018) ACL Li et al. (2018) NAACL Fu et al. (2018) AAAI 风格化回复: 一个初步的尝 试 • 首次利用迁移学习进行风格化回复生成 • 首次提出类图灵测试的回复风格人工评价方 法 42 VS 任务型对话(任务执行) ( Task-oriented Dialogue ) 典型应 能助手 人机对话主要技术方向 特定域内输入和输出的空间有限20 积分 | 56 页 | 4.34 MB | 1 天前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100
