北大:DeepSeek-R1及类强推理模型开发解读FRAMEs 和 事实性推断 任务 Si l QA 上表现突出 得益于强大的推理能力与长文本思考能力 , DeepSeek R1 在复杂任务上表现卓越,成为开源领域的 又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAIo1 系列)的竞争中迈出了关键性一步。 DeepSeek-R1 在数学代码任务上表现突出 Deepseek R1 在 AIME2024 上获得了 79.8% 的成绩,略高于 Pipeline 总览 200k 通用数据 ( Writing \ Role-Play etc. ) 18 Pure RL to Develop Reasoning Capabilities: 社区的复现都涉及蒸馏和搜索,而 DS-R1 Zero 跳过监督微调 SFT 阶段,展现出大规模强 化学 习的潜力,这也得益于以下几点: 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) DS-R1 Zero 长度涌现现象 DeepSeek-R1 长度泛化复现: https://zhuanlan.zhihu.com/p/212904108 31 同语言编码是否有不同优势? 社区复现结果 2 社区复现结果 1 GRPO 核心思想是通过构建多个模型输出的群组,并计算群组内的相对奖励来估计基线,从而避免 了传统策略优化算法中需要使用与策略模型大小相同的评论模型。 大幅度降低10 积分 | 76 页 | 6.72 MB | 5 月前3
清华:AI驱动政务热线发展研究报告(2025)乡吹哨、部门报到”改革给予了充分肯定,对推进党建引领基层治理体制机制创 新提出了明确要求。该阶段尚未将政务热线纳入改革,而是将与群众生活直接相 关的街乡镇作为问题的发现者,通过街乡镇吹哨上级职能部门,推动后者下沉基 层,与街乡镇、社区等基层治理主体协同开展治理。 二是“接诉即办”阶段。2019 年起,北京市提出“市民的诉求就是哨声”, 并将 12345 市民服务热线(以下简称 12345 热线)引入改革,推动“吹哨报到” 项民生大类事项作为改革重点, 持续深化改革。 二是在促进协同治理方面。在改革过程中,北京市形成了党委领导、政府负 责、民主协商、社会协同、公众参与、法治保障、科技支撑的工作体系,建立起 市委统一领导,各区、街乡镇、社区村和各部门各单位闻风而动、接诉即办的群 众诉求快速响应机制。一方面,在顶层设计上,北京市坚持党建引领,于 2021 年市委深改委增设“接诉即办”改革专项小组,负责全市接诉即办改革工作的统 筹谋 年以来,“接诉即办”改革积极运用大 数据辅助科学决策和社会治理。改革通过 12345 热线建立了统一、规范的民意诉 求数据库,汇集入库 3400 多万件群众反映记录、240 余万条企业法人数据和 7000 多个社区(村)点位信息。改革综合运用了大数据分析、定量分析、案例分析、 类型学分析、可视化技术等研究方法,挖掘热线工单的“数据富矿”,建设以诉 求量分析、类别分析、地域分析、考核排名、城市问题台账为主要内容的大数据0 积分 | 58 页 | 1.68 MB | 5 月前3
备份 清华:AI驱动政务热线发展研究报告(2025)乡吹哨、部门报到”改革给予了充分肯定,对推进党建引领基层治理体制机制创 新提出了明确要求。该阶段尚未将政务热线纳入改革,而是将与群众生活直接相 关的街乡镇作为问题的发现者,通过街乡镇吹哨上级职能部门,推动后者下沉基 层,与街乡镇、社区等基层治理主体协同开展治理。 二是“接诉即办”阶段。2019 年起,北京市提出“市民的诉求就是哨声”, 并将 12345 市民服务热线(以下简称 12345 热线)引入改革,推动“吹哨报到” 项民生大类事项作为改革重点, 持续深化改革。 二是在促进协同治理方面。在改革过程中,北京市形成了党委领导、政府负 责、民主协商、社会协同、公众参与、法治保障、科技支撑的工作体系,建立起 市委统一领导,各区、街乡镇、社区村和各部门各单位闻风而动、接诉即办的群 众诉求快速响应机制。一方面,在顶层设计上,北京市坚持党建引领,于 2021 年市委深改委增设“接诉即办”改革专项小组,负责全市接诉即办改革工作的统 筹谋 年以来,“接诉即办”改革积极运用大 数据辅助科学决策和社会治理。改革通过 12345 热线建立了统一、规范的民意诉 求数据库,汇集入库 3400 多万件群众反映记录、240 余万条企业法人数据和 7000 多个社区(村)点位信息。改革综合运用了大数据分析、定量分析、案例分析、 类型学分析、可视化技术等研究方法,挖掘热线工单的“数据富矿”,建设以诉 求量分析、类别分析、地域分析、考核排名、城市问题台账为主要内容的大数据0 积分 | 58 页 | 1.70 MB | 5 月前3
北京金融科技产业联盟:2025年数字孪生技术金融应用研究报告供产业经营的全景数据,辅助贷款审核与发放。此外,数字 孪生技术还可以构建虚拟养老社区,为行动不便的老年人提 供便捷交流沟通、个性化线上财务管理等服务。 2.解决业务问题 (1) 提供更加便捷的金融服务 随着积极应对人口老龄化逐渐上升为国家战略,适老化 改造成为各行各业的重要发展方向,金融领域也在不断探索 新型养老金融服务模式,通过数字孪生技术构建线上虚拟养 老社区,能够让老年人足不出户享受远程医疗咨询、在线社 采 集,获取机构场地、设施、入住等各类信息。通过仿真模拟 构建孪生体,生成虚拟养老社区,在获取养老机构运营情况 辅助贷款发放的同时,在虚拟养老社区中提供线上支付、财 富管理类金融服务,实现虚拟孪生场景中的存贷联动,大幅 提升养老金融服务的覆盖范围(见图9)。 32 图9 数字孪生技术构建虚拟养老社区 33 四、机遇与挑战 (一)数字孪生带来的机遇 数字孪生技术作为数字化转型中的重要驱动力,凭借其10 积分 | 53 页 | 2.07 MB | 5 月前3
2024年中国人工智能产业研究报告2024年中国人工智能产业图谱 AI基础数据服务 数据集 向量数据库 数据治理 AI算法框架 AI模型架构 AI开放平台 人工智能大模型层与工具层 Models for AI AI开源社区 通用基础大模型 垂直行业/领域大模型 智能服务器 智算软件平台 闭源 开源 大语言模型 多模态大模型 视觉大模型 语音大模型 智能体开发平台 模型平台/模型服务 大模型开放平台 及部分工程代码开放出来,吸引开源社区的参与者形成正向循 环,未来有机会构建更强大的生态壁垒。 来源:艾瑞咨询研究院自主研究及绘制。 DeepSeek开源策略与关键创新 模型权重 DeepSeek开源内容 技术论文和 训练细节 部分工程代码 DeepSeek V3:工程优化 DeepSeek R1:范式创新 DeepSeek主导模型开发 开源社区参与 推理、再训练和微调 开放生态 开放生态 吸引开发者贡献代码,利 用社区反馈改进模型性能, 形成技术反哺 DeepSeek V3 Base 第一阶段:训练DeepSeek R1 Zero DeepSeek R1 Zero DeepSeek R1 采用GRPO(组相对策略优化) 进行强化学习训练 • 准确性奖励:评估模型输出内 容是否正确 • 格式奖励:评估模型是否使用 标准化格式输出推理过程和最 终答案 DeepSeek0 积分 | 51 页 | 3.35 MB | 5 月前3
2024年中国人工智能产业研究报告2024年中国人工智能产业图谱 AI基础数据服务 数据集 向量数据库 数据治理 AI算法框架 AI模型架构 AI开放平台 人工智能大模型层与工具层 Models for AI AI开源社区 通用基础大模型 垂直行业/领域大模型 智能服务器 智算软件平台 闭源 开源 大语言模型 多模态大模型 视觉大模型 语音大模型 智能体开发平台 模型平台/模型服务 大模型开放平台 及部分工程代码开放出来,吸引开源社区的参与者形成正向循 环,未来有机会构建更强大的生态壁垒。 来源:艾瑞咨询研究院自主研究及绘制。 DeepSeek开源策略与关键创新 模型权重 DeepSeek开源内容 技术论文和 训练细节 部分工程代码 DeepSeek V3:工程优化 DeepSeek R1:范式创新 DeepSeek主导模型开发 开源社区参与 推理、再训练和微调 开放生态 开放生态 吸引开发者贡献代码,利 用社区反馈改进模型性能, 形成技术反哺 DeepSeek V3 Base 第一阶段:训练DeepSeek R1 Zero DeepSeek R1 Zero DeepSeek R1 采用GRPO(组相对策略优化) 进行强化学习训练 • 准确性奖励:评估模型输出内 容是否正确 • 格式奖励:评估模型是否使用 标准化格式输出推理过程和最 终答案 DeepSeek10 积分 | 51 页 | 3.35 MB | 6 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会与企业业务流程、组织、系统打通 L3 L5 L4 多个Agent的相互协作 L6 64 政企、创业者必读 示例:斯坦福医疗预约中心的AI化改造 智能体应用案例:定义角色、分解流程 社区医生手工填写患者病历 并传真到斯坦福预约中心 传统人工预约流程 AI辅助预约流程 传真识别智能体 接到传真,人工查看病历 利用多模态大模型,识别传真病历, 并自动录入数据库 数字人打电话给患者,预约就诊时间 大模型查询保险知识库,自动生成理赔申请, 提交保险公司 就诊预约智能体 保险报告生成智能体 人工打电话给患者,预约就诊时间 病人到医院就诊 人工填写理赔申请,提交保险公司 病人到医院就诊 社区医生将患者病历传真到斯坦福预约中心 65 政企、创业者必读 2023年是大模型之年 2024年是专业大模型之年 2025年是AI应用之年 AI应用= DeepSeek+场景+智能体+知识库10 积分 | 76 页 | 5.02 MB | 5 月前3
2025年人形机器人应用场景洞察白皮书-工业场景篇… 单一工序、长链条任务衔接 ✓ 组装 ✓ 接线 ✓ … 多工序、多任务衔接 ✓ 配合产线节拍 ✓ 与工业机器人/AGV协同 ✓ 与人协同 ✓ … 家庭服务 单一动作执行 ✓ 语音交互 ✓ 社区娱乐 ✓ … 多动作组合+单形式交互 ✓ 递送物品 ✓ 搬运物品 ✓ … 长链条任务+多形式交互 ✓ 平面清洁 ✓ 衣物餐品洗涤 ✓ … 复杂任务、多形式交互 ✓ 餐饮制作 ✓ 照料护理 ✓ 维修 组搬运…) (物品拿取、收取 快递…) (理货拿取、餐 饮递送…) (安装质检、来 料检验…) (血氧血压监测…) (迎宾、导览…) (商业演出…) (结账、导购…) (灌溉、叠衣…) (社区表演…) (“最后10m”柔性物流…) (螺丝紧固、组装…) Source: M2研究 & 分析;全球人形机器人企业专家访谈;转载引用内容请标明来源 M2 2025 Proprietary10 积分 | 33 页 | 2.38 MB | 5 月前3
2025腾讯云城市峰会·上海站——从智能营销到智能制造需要跟传统机器人结合大模型增强,传统机器人无法回答时, 大模型对汽车专业词汇精准理解回复 传统机器人不智能, 应答效果差 客户诉求 产品示例 人工校验入库 在售前/售后服务领域:腾讯乐享帮助打造一站式智慧售前/服务社区 乐享讲好品牌故事,传播好企业文化,让工业企业和零售户感受到有规则,有公平,有信心 Deepseek 大模型引擎 结合物联网和人工智能打造的勘探/安装/巡检一体化平台, 节约人力成本,降低安全风险,提高工作效率10 积分 | 16 页 | 16.40 MB | 5 月前3
2025汽车行业的人工智能(AI)机遇研究报告数据处理与使用 数据管理 中心:数据/人工智能合规性与指导原则,数据标准/目录 发言人:数据质量保证、数据管理员、数据访问管理 法规和政策 意识和沟通 能力 并且文化 中心:基础培训、最佳实践分享、社区建设 发言人:能力发展和特定于业务单元/功能的培训 培训 工具 技术 中心节点: 基础设施与平台/工具提供,技术与合作伙伴关系 发言人:具体的技術要求定義,具體工具操作 平台与基础设施10 积分 | 12 页 | 1.49 MB | 5 月前3
共 15 条
- 1
- 2
