2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告\ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证10 积分 | 76 页 | 8.39 MB | 9 月前3
2025年基于LTE-V2X预警类应用的功能安全分析白皮书本研究基于 LTE-V2X 直连通信技术,对预警类应用的功能安全进行了系统分析。研究背景指出, 传统的功能安全分析方法主要针对单车系统,近年来 V2X 技术逐渐发展,智能网联汽车应用不断 增加,但缺乏系统性的功能安全分析方法。本研究选取前向碰撞预警(FCW)、交叉路口碰撞预警 (ICW)和闯红灯预警(RLVW)三个典型应用场景,对基于 LTE-V2X 预警类应用的功能安全分 析进行了技术探索。 5GAA 的 STiCAD 项目、中国汽 车工程学会的 T/CSAE 53 标准、汽标委的预警类应用技术要求和试验方法,以及 C-NCAP 2024 版 测试规程中的相关场景。本研究还对 V2X 预警类应用进行了分类,分为安全类和效率类应用,并 指出安全类应用与功能安全的相关性更大,因此本研究以安全类的三个典型应用场景为目标展开 分析。 在功能安全分析方法论部分,本研究基于 GB/T 34590 闯红灯预警(RLVW)应用,分别进行了相关项定义、潜在危害识别、ASIL 分析等工作,提出了 针对安全目标的功能安全要求。 在总结及展望部分,建议以本研究为开端,将 GB/T 34590 的功能安全分析方法拓展至 V2X 系统。 本研究的主要结论为:QM 级别的功能安全设计能够满足 V2X 预警类应用的需求。 2 / 32 Executive Summary This study conducts a systematic10 积分 | 34 页 | 3.26 MB | 9 月前3
2025大模型时代:类脑智能赋能电力应用场景的新模式研究报告10 积分 | 51 页 | 4.48 MB | 9 月前3
电碳市场环境下新能源及储能的发展新机遇及潜力预测10 积分 | 26 页 | 7.73 MB | 1 月前3
园区ESG及绿色运营白皮书10 积分 | 102 页 | 11.83 MB | 8 月前3
我国智慧养老服务发展的现状 困境及对策10 积分 | 4 页 | 722.87 KB | 3 月前3
智慧工地技术的现状及发展趋势智慧工地技术的现状及发展趋势 马智亮 博士、教授、博士生导师 清华大学土木工程系 交流大纲 1 引言 2 智慧工地技术现状 3 智慧工地技术发展趋势 4 结语 1 引言 ·什么是智慧工地 有智慧的工地 工地 智慧:百度百科 本身不拥有智慧 它是生物所具有的基于神经器官 运作依赖于人的智慧 (物质基础)一种高级的综合能 力,包含有:感知、知识、记忆、 工地+信息技术 理解、联想、情感、逻辑、瓣别、 广联达:BIM5D 编制与模拟 3 基于BIM的资源计划 BIM 广联达:土建算量软件,钢筋算量软件, BIM5D 基于BIM的施工方案 BIM Autodesk公司:NavisworksManage 及工艺模拟 10 中国核建 摘自《行业发展报告:智慧工地应用与发展》 基于BIM的场地布置效果图 11 十际进 用暴示网格 8元 星示生工阶段 巨动人 关于 显示能工阶段 网格 材盛 所有材料类别: 出处 序号 材料名称 规格型号 单位 不含税市场价 含税市场价 平均价 报价时间 备 黑色及有色金属 信 1 热轧圆钢 6.5-8 t 2480 2900 2016-11-15 水泥及混凝土制品 信 2016年05月 至 2016年11月 最近3期 最近6期 除税价 含税价 X 木材及木制品 价格(元) 提示:双击可载入价格 不含税市场价的趋势图 砖、瓦、灰、砂石 玻璃 260010 积分 | 43 页 | 6.35 MB | 3 月前3
运营商智算中心建设思路及方案开放科学(资源服务)标识码(OSID): 摘 要: 人工智能训练的计算复杂度逐年猛增,所需的智能算力从每秒千万次运算增加 到数百亿次,甚至进入千亿级别,促进了大规模智算中心的建设。智算中心主 要满足智算算力的需求,其布局、建设及维护方案与传统的云资源池存在较大 差异,当前运营商对智算中心的布局以及详细方案并没有统一的建议和参考。 分析了大模型发展带来的算力、存储、组网的需求挑战,对运营商智算布局以及 算力、存储、网络、维护管理等提出了相应的策略和方案建议。 Artificial intelligence;Intelligent computing center;Infrastructure;Construction ideas 运营商智算中心建设思路及方案 Construction Ideas and Plans for Operator Intelligent Computing Centers 童俊杰 1,申 佳 2,赫 罡 1,张 奎 Zhengzhou Branch,Zhengzhou 450007,China) 引用格式:童俊杰,申佳,赫罡,等. 运营商智算中心建设思路及方案[J]. 邮电设计技术,2024(9):68-73. 童俊杰,申 佳,赫 罡,张 奎 运营商智算中心建设思路及方案 数据通信 Data Commuincation 68 邮电设计技术/2024/09 策略和方案建议。 1 大模型的发展趋势和需求分析10 积分 | 6 页 | 3.64 MB | 3 月前3
各国低空经济政策及低空发展模式比较亚马逊、优步(Uber)等服务商开始布局物流与空中出租车,从运营与服务端切入低空经济。在各 类低空企业不断展开竞争,争夺行业龙头地位的同时,低空网络攻击、低空空域管理冲突、低空监 视合法性、适航认证程序与标准等问题接踵而至。为解决低空经济发展过程中产生的具体问题,美 国众议院和参议院先后通过了《先进空中交通协调及领导力法案》(Advanced Air Mobility Coordination and 美国的低空经济发展模式凸显出从商业竞争促进政策落地的特点。低空产业在商业竞争中不断发 展,在技术持续迭代、低空产品应用范围不断扩大、产业链不断延长的同时,低空领域的监管逐步 受到挑战。当低空经济领域的商业竞争带来混乱时,法律法规及各项行政命令的出现便可以及时将 低空领域的发展拉入正轨,从而在低空经济蓬勃发展的同时兼顾该领域发展的规则与秩序。 三、欧洲的低空经济发展模式 欧洲的低空发展模式则展现出了“区域联动”的特点。依托欧盟一体化的大背景,欧盟通过“地平线10 积分 | 4 页 | 328.94 KB | 1 月前3
智慧停车发展及智慧停车系统白皮书智慧停车发展及智慧停车系统 白皮书 全国智能建筑及居住区数字化标准化技术委员会智能网联基础设施 标准工作组(SAC/TC426/WG8) 2022 年 7 月 智慧停车发展及智慧停车系统白皮书 致 谢 在住房和城乡建设部主管部门的指导下,全国智能建筑及居住区数字化标准化 技术委员会智能网联基础设施标准工作组(SAC/TC426/WG8)开展了《智慧停车发展 及智慧停车 关行业内领导和专家的悉心指导,并给予了建设性的意见和建议,在此致以衷心的感 谢。 指导专家 张永伟 马 虹 陈山枝 曾 澜 马春野 葛雨明 指导单位 全国智能建筑及居住区数字化标准化技术委员会(SAC/TC426) 主编单位 中国电动汽车百人会、华为技术有限公司 参编单位(排名不分先后) 国汽(北京)智能网联汽车研究院有限公司;北京百度智行科技有限公司;中国信 晋 李松哲 高 杰 耿庆官 王 偲 毛 旭 郝建霞 智慧停车发展及智慧停车系统白皮书 前 言 当前,我国正处于城市加速发展和社会经济的转型时期,2021 年末常住人口城 镇化率已达到 64.72%,城市数量达 687 个。一些城市迅猛增长的汽车保有量引发城 市交通拥堵、商业区及居民区停车难等问题,影响正常的交通道路通行和城市建设。 其中,停车资源不足便是主要问10 积分 | 43 页 | 1.73 MB | 9 月前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100
