北大:DeepSeek-R1及类强推理模型开发解读可以进一步将这种思路扩展到思考过程是搜索过程的特例,比如 rStar-Math, SoS 都可以用类似的思路来理解。 本质上, STaR 一类的方法是希望模型能够学习到 MetaCoT, 即问题到答案 映射 过程背后的深入规律 但是对于问题的结构要求性高,对于复杂数学推理任务可能难以自我 迭代 难以融入 Rule-Based Reward for RL 训练 PureRL 加持下,业界的技术实践更多 Focus 直接利用 SFT 蒸馏可以学习到数据中的推理范式,虽然在推理分数上的表现有所提升,但是更多是去拟合 数 据中的 Pattern, 很难学习到数据背后的数学规律和 MetaCoT 强化学习则是通过试错和尝试,鼓励模型在最大化奖励过程中学习到推理背后的规律,获得的泛化性和推 理 表现上界更高 SFT 主要负责记忆而很难进行 OOD 泛化,基于 ORM 的 RL 泛化能力较好 [1] SFT 规范模型输出格式,使得后续的 统下 的安全 ,并不保证多智能体系统安全 \AI 系统伪装已被“安全对齐”,行为欺骗监管 随着 VLA \ Agent 等模型下游和赋能应用兴起,确保模型 AI 系统准确应对不确定性,考虑物理规律下 的人 类价值观对齐至关重要 在复杂动态环境中不仅要短期安全,还要确保长期行为的安全性,例如对操作环境造成影响。 通过形式化验证和 RL ,提升 AI 系统的可靠性与处理复杂推理问题的能力。通过构建形式化数学数据库,10 积分 | 76 页 | 6.72 MB | 7 月前3
2025企业智能化转型 2.0 时代 指南智能化转型是一个系统性和复杂性的工程,不仅要具有行业 普适性,还要符合企业自身发展的规律和模式。 由于不同行业、不同企业在数据 治理、经营模式、技术应用、组织结构、人才积累等方面存在显著差异, 且在智 能化发展水平上呈现出整体差距,因此企业在进行智能化转型时还受到规模、 资 源投入、业务范围等内在因素的影响。基于此,企业智能化转型框架必须在普遍 规律和企业特性相结合的基础上,建立起系统性、 客观性、可迭代、且具备量化 交通、能源、建筑、金融、流通、医疗卫生、专业服 务、个人消费服务、媒体、 电信、互联网在内的 13 大行业, 开展了基于年比年 历史数据的演进观测和分析, 以期寻找穿越周期、持续跃升的智能化转型和发展 规律。 2024 年,是企业集团连续第三年发布该系列报告。 基于 "企业智能化转型框 架" 四大维度和 "企业智能化成熟度模型" 五级划分标准和体系, 并结合 2022 年、2023 年、2024 AI 深度学 习, 结合多种融合分析模型和算法, 自主识别光棒生产过程能力的薄弱环节, 靶向探查不稳定的生产要素, 对控制计划中识别的特性进行过程能力分析, 分 析生产过程中各项指标,找到共性规律及工艺优化改进点。 借助多层神经网络 算法的 AI 大数据模型, 实现工艺参数的精准优化和动态匹配。 更多干货请关注公众号“管理技术化平台” 57 图 4-5 烽火科技 A I 平台 【转型成效)10 积分 | 72 页 | 1.95 MB | 7 月前3
2025年以DeepSeek为代表的AI在能源行业的应用前景预测报告可再生能源资源评估与开发: 除了在新能源开发的设计阶段提供支持外,Deepseek还可以对可再 生能源资源(如风能、太阳能、水能等)进行更精确的评估和分析。 例如,分析不同地区的风能资源分布和变化规律,为风电场的选址 和建设提供更科学的依据;评估太阳能资源的时空分布,优化太阳 能光伏电站的布局和设计,提高可再生能源的开发效率和利用水平。 4五、案例--2024年国网电力市场发展状况 (一)10 积分 | 29 页 | 2.37 MB | 7 月前3
算力基础设施高质量发展行动计划优势,进一步释放工业、金融等重点行业对算力应用的需求潜 力,激发智能算力、边缘算力等全场景应用创新活力,推动算 力与实体经济融合发展。 创新驱动,汇聚合力。坚持创新驱动,遵循技术、标准、 产业和应用渐次导入的规律,推动核心技术攻关。充分发挥科 研院所、高校和企业在技术攻关、成果转化中的创新主体作用, 形成技术产业发展合力。 绿色低碳,安全可靠。坚持绿色低碳发展,全面提升算力 设施能源利用效率和算力碳效(CEPS)水平。统筹发展与安全,0 积分 | 18 页 | 309.59 KB | 1 月前3
清华:AI驱动政务热线发展研究报告(2025)政府资源配置与民众切实需要之间的精准匹配和有效对接。另一方面,政务热线 数智化以数据融通和智慧服务为主要特征,大模型能够促进医疗、教育等多种社 会服务平台的信息互通,同时通过对大数据等信息技术分析数据的动态演变规律, 及时对社会问题和社会风险进行甄别监测,将问题化解在基层,风险防控在事前, 真正实现政府风险感知、风险预测和风险防控能力的提升。 最后,大模型优化服务流程,进一步提升数字政府督办考核能力。 技 9 术,透过政务热线直达基层,从而实现对民生民意的实时理解和准确把握。二是 时空穿越,数智化转型使得政府能够基于热线数据,实现对任一时点、任一区域 进行分析和比较,探究群众诉求的时空分布规律。三是颗粒缩放,政府在数智化 技术的支撑下可以实现对特定区域的“放大”和“缩微”(譬如点位、小区、社 区、街道、市辖区、全市,甚至是跨区域),从而更加精细和精准地理解社会治 理问题的集聚和离散状态。0 积分 | 58 页 | 1.68 MB | 7 月前3
备份 清华:AI驱动政务热线发展研究报告(2025)政府资源配置与民众切实需要之间的精准匹配和有效对接。另一方面,政务热线 数智化以数据融通和智慧服务为主要特征,大模型能够促进医疗、教育等多种社 会服务平台的信息互通,同时通过对大数据等信息技术分析数据的动态演变规律, 及时对社会问题和社会风险进行甄别监测,将问题化解在基层,风险防控在事前, 真正实现政府风险感知、风险预测和风险防控能力的提升。 最后,大模型优化服务流程,进一步提升数字政府督办考核能力。 技 9 术,透过政务热线直达基层,从而实现对民生民意的实时理解和准确把握。二是 时空穿越,数智化转型使得政府能够基于热线数据,实现对任一时点、任一区域 进行分析和比较,探究群众诉求的时空分布规律。三是颗粒缩放,政府在数智化 技术的支撑下可以实现对特定区域的“放大”和“缩微”(譬如点位、小区、社 区、街道、市辖区、全市,甚至是跨区域),从而更加精细和精准地理解社会治 理问题的集聚和离散状态。0 积分 | 58 页 | 1.70 MB | 7 月前3
人形机器人标准化白皮书(2024版)调多个关节之间的运动关系,进行运动规划和轨迹生成。比如在人形 机器人行走时,全身控制要规划好腿部各关节以及胯部、腰部等相关 关节的配合,生成从起始姿态到目标姿态的连续运动轨迹,使得行走 动作自然流畅且符合运动学和动力学规律。模型控制更多地从机器人 整体行为和任务角度出发,基于感知到的环境信息以及预设的任务需 求做出宏观的运动决策。 目前,人形机器人在运动控制方面也取得了显著进展。通过先进 的步态生成算法和平衡 腿、头部、灵巧手等;集群包括多机器人组合、人机混合等。 5.2 标准体系框架图 人形机器人涉及众多模块以及复杂的软件系统协同工作。标准体 系的编制依据相关的科学技术原理、工程实践经验等,准确反映其内 在的技术逻辑和发展规律,以系统科学的理论和方法为基础,运用标 准化的工作原理,不断优化标准之间的关系,避免了标准间不配套、 不协调及组成不合理等问题;同时建立了动态更新机制,能够根据产 业发展的新情况、新变化及时对标准进行修订、补充和完善,保持标0 积分 | 93 页 | 3.74 MB | 6 月前3
北京金融科技产业联盟:2025年数字孪生技术金融应用研究报告孪生模型、保证数字孪生模型与对应物理实体实现有效闭环 的核心技术之一。 3.数据孪生技术 数据孪生作为金融领域数字孪生底层的关键技术,该技 术通过机器学习模型对一组业务数据的分布进行学习,从中 找到相应规律,进而生成与之相类似的数据,实现业务数据 的仿真模拟。为实现数据的高质量仿真,需要使用机器学习 领域的生成式模型,主流的生成模型包括生成式对抗网络 ( Generative adversarial10 积分 | 53 页 | 2.07 MB | 7 月前3
备份 中培伟业:2025年数字化转型与人才体系建设指南报告. 20250428 13-08-57养分为数字化认证和数字化实战技能两大类别,培养“高含金量证书+硬核技能”的全方位人 才,课程内容涵盖了数字化转型、业务流程梳理、企业数据资产管理、企业数字化管理及中小 企业数字化转型五大模块。 根据数字化管理人才的成长和认知规律,基于行动导向,构建岗位胜任力模型,开展高效 的教学。业内大咖讲师将企业数字化转型管理理论与实践融合教学,以企业数字化转型成功为 目标的知识讲解、教学做一体化的参与式实践及企业真实案例分享讨论,促进数字化管理者的10 积分 | 53 页 | 6.10 MB | 7 月前3
2024年中国人工智能产业研究报告AI产品及服务的优点多于缺点 我对使用AI产品服务的公司和对其他 公司同样相信 我很了解AI是什么 而在调研中,有超过半数的人认为“AI产品及服务让我更加焦虑”。AI 技术的发展应用进一步对社会中重复性、规律性强的工作岗位带来 威胁,相较于自动化浪潮对蓝领的冲击,一些初级专业人士和技术人员等职业,如工厂流水线工人、数据分析员、财务法律专员、客户服 务等职业可能会被数字员工、AI Agent所取代。此外,10 积分 | 51 页 | 3.35 MB | 7 月前3
共 12 条
- 1
- 2
