北大:DeepSeek-R1及类强推理模型开发解读在非恶意数据集上微调对齐的语言模型可能会削弱模型的安全机制; 不仅限于安全,这种“假象对齐”表明模型可能会内在执行对齐的逆操作。大模型存在会逆转或撤 销对齐过程的可能性,这一概念我们称之为逆向对齐( Inverse Alignment ) 。我们进一步探究了: 语言模型的参数是否表现出弹性,从而抗拒对齐? Dothe parameters of language models exhibit 散度刻画; 弹力 F :对齐后的模型抗拒发生分布改变,产生恢复预训练分布的“弹力”; 类似于胡克定律,我们发现大模型也存在弹性:对模型施加微调时,模型倾向 于 保持原有预训练分布,抗拒对齐分布,使得“逆向对齐”更加容易。 从最简单的弹簧系统建模,探究大模型内在抗拒对齐的机理 大模型存在弹性:模型在预训练阶段经过大数据、 大更新产生了具备通用能力的稳定分布 pθ, 而经 过对齐阶段的“小数据、小更新”表现出由对齐分 表明模型弹性随预训练数据量增多而增强。 正向对齐 (Forward Alignment) vs. 逆 向对齐 (Inverse Alignment) 在帮助性、无害性和诚实性 (3H) 标准下,逆向对 齐 (Path A) 相较于正向对齐 (Path B) 均更加容易。 模型弹性 (Elasticity) 的分 析 模型弹性的实验验证 (a) Elasticity Increase10 积分 | 76 页 | 6.72 MB | 1 年前3
成都市建筑机器人选用导则(2025版)-成都市住房和城乡建设局供坚实的数据基础。 5.2.2 三维测量机器人应用场景 第 7 页 三维机器人广泛用于勘察、施工、验收等各阶段。如土建施工阶段:混凝土、砌体、 抹灰阶段的实测实量(开间、进深、垂直度、平整度、极差等),逆向建模生成 BIM 模型, 用于施工纠偏与设计优化;装饰装修阶段:精装房分户验收。装配式装修排版算量,基于 扫描数据生成材料下单方案;桥梁隧道施工阶段:危险区域替代人工测量。 5.2.3 三维测量机器人导入要点 操作进行测量,所有的测量结果会在后台自动计算,自动生成三维模型及测量结果;路径 规划:按房间或梁柱分割空间,测量员进行设备的挪动测量。 (3)数据处理:扫描完成后自动输出三维模型与爆点等高线图;导出模型至 BIM 软 件进行正逆向比对,或通过 CAD 插件生成装饰排版方案。 (4)数据上传:返回项目部后上传扫描结果至云端平台,除现场自动生成的实测实量 结果,平台可自动生成各项数据分析,并自动生成各类数据报表。 (5)收10 积分 | 34 页 | 729.38 KB | 5 月前3
国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代图31:理想汽车与极佳科技等联合推出ReconDreamer世界模型 资料来源:汽车之心,51CTO,国元证券研究所 理想:双系统并行,VLM规范端到端模型下限 32 世界模型是端到端自动驾驶的闭环仿真系统, 可视为VLM的逆向工程,通过文字提示生成视 频。它与端到端模型可以协同工作——世界模 型生成的视频输入车端大模型,车端大模型规 划并执行动作,动作产生新场景和视角,再由 世界模型生成新数据,形成闭环测试。世界模10 积分 | 95 页 | 6.54 MB | 1 年前3
共 3 条
- 1
