北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 推理范式的涌现 DeepSeek-R1 社会及经济效益 技术对比探讨 STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o- series) 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及 Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 27 K1.5 专注于用长文本 CoT 解决推理时 Scaling 问题 利用 RL 探索: Kimi k1.5 的核心思想是利用强化学习,让模型通过试错(探索)来学习解决问题 的能 力,而不是仅仅依赖于静态数据集。 长文本 CoT 的 RL :将 RL 应用于长文本10 积分 | 76 页 | 6.72 MB | 5 月前3
2025中国储能行业全球化市场布局与高价值商业模式研究报17%� �研��������EqualOcean�� 2.2.3��������������� ���� ���� 2024�12��������45�������1.564�����务1.5���������������2820MWh�����690.2MW���648���� ���������88.35MW���591.27MWh����� 2023�7������������2 45���������1.564 �����务1.5����� 35�������� 1. ��2820MWh���� ��690.2MW���� 2. 648�����10��� ���� 3. ��88.35MW���� 591.27MWh������ 2023�7��������� ��������够���2.8 ���� 1. �务��������� 1.5���������� 757MW/3GWh������ ������������� �� ���千 ����千 �� �� ��� �� �� ��� �����C� 2� 1.5� 2� 2� 2.5� 3� 3� 2� �����A� 2� 2.5� 2� 2� 2.5� 2� 2� 2� �����G� 3� 1.5� 2� 2� 3� 2� 3� 3� �����E� 3� 2� 2� 2.5� 2.5� 3� 3� 2� 0 10 积分 | 65 页 | 4.34 MB | 5 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页73.40 12,950 12.0 8.1 8.9 1.5 1.4 1.3 2.0 1.3 1.4 -0.8% 12.0 8.0 7.6 1.7 1.6 1.5 0.9 0.9 0.8 -23.7% 20 HK Equity 商汤科技 13.5 0.8 0.7 0.6 1.7 1.5 1.5 4.6% 603296 CH Equity 华勤技术 57.19 5810 积分 | 40 页 | 2.60 MB | 6 月前3
5G +AI投资策略研究报告射频端:需求增加、技术升级、集成度提升 1.2 摄像头:5G智能化时代最核心传感器,持续升级 1.3 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.4 设备和材料:国产替代加速进行 1.5 AI:安防、汽车和IoT将是率先爆发的三个场景 2 安防行业:需求逐渐回暖、AI加速、海外拓展 2.1 智能汽车:5G+AI促进无人驾驶加速落地 2.2 IoT:技术逐渐突破,巨头加速布局 1.2 射频端:需求增加、技术升级、集成度提升 1.3 摄像头:5G智能化时代最核心传感器,持续升级 1.4 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.5 设备和材料:国产替代加速进行 7 从4G换机周期看5G:国内4G换机周期效应明显 -60% -40% -20% 0% 20% 40% 60% 80% 0% 10% 20% 1.2 射频端:需求增加、技术升级、集成度提升 1.3 摄像头:5G智能化时代最核心传感器,持续升级 1.4 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.5 设备和材料:国产替代加速进行 12 5G对终端射频器件影响:需求增加、技术升级、集成度提升 新频段 • 滤波器需求倍增 • 频谱重新划分增加射频前端复杂性 高频率 • BAW将成为滤波器主流10 积分 | 206 页 | 10.47 MB | 5 月前3
罗戈研究:2025中国低碳供应链&物流创新发展报告资料来源:联合国环境规划署《2024年排放差距报告》 ◼ 不论是控制升温1.5℃还是2℃,2030年和2035年碳 排放与巴黎协定目标差距仍然存在。 将变暖限制在2°C以内: • 2030年的年碳排放量需要减少14亿吨CO2e,低于 当前无条件NDCs(国家自主贡献)声明 • 2035年的年碳排放量需要减少14亿吨CO2e 将变暖限制在1.5°C以内: • 2030年的年碳排放量需要减少18亿吨CO2e 2e • 2035年的年碳排放量需要减少29亿吨CO2e 为实现巴黎协定的2℃和1.5℃温控目标,2035年全 球温室气体排放需较2019年水平分别减少 37% 和 57% 。 01 严峻的减碳压力 • • 01 02 03 04 • • • 01 严峻的减碳压力 • • 01 严峻的减碳压力 • • • • • ◼ ◼ 01 严峻的减碳压力 • • 资料来源:《极兔速递环球有限公司2024年度报告》 2024 12 3,800 4,700 1:2.4 2023 2023 15% 4,401 1.5 LNG ➢ LNG 2024 12 1,327 LNG LNG 26% ➢ LNG 106 2024 B5 06 绿色实践案例 • •20 积分 | 113 页 | 22.17 MB | 4 月前3
十五五”时期我国推进新型工业化的路径研究40 高技术制造业占规模以上工业增加值比重(%) 装备制造业占规模以上工业增加值比重(%) 0.44 0.81 1.06 2.04 3.45 4.45 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.00 0.20 0.40 0.60 0.80 1.00 1.20 2021 2022 2023 “新三样”产品出口额(万亿元) 先进制造业集群实力显著增强。 重点产品和关键核心技术取得新突破。企业 创新主体地位不断提高。产业科技创新平台 布局进一步优化。 1.1 1.5 2.1 8.2 9.3 8.3 7.6 7.8 8 8.2 8.4 8.6 8.8 9 9.2 9.4 0 0.5 1 1.5 2 2.5 “十二五”末 “十三五”末 2023 图表标题 规模以上工业企业R&D经费(万亿元) 规模以上工业企业R&D经费增长率(%)0 积分 | 12 页 | 4.29 MB | 5 月前3
2024电力市场化改革与电价体系洞察:面向市场参与者的十大趋势场出清7。同时按照虚拟电厂调节能力,山西适当放宽了其中长期交易成交量约束和金融套利约 束。2023年8月1日,山西风行虚拟电厂正式入市,其聚合了建材、铸造、钢铁、商业楼宇、分布 式光伏、储能、充电桩等资源,当日累计申报负荷1.5万千瓦、7个小时,预计通过负荷调节共减少 用电量18,000千瓦时、可获利7,500元,该红利会传导到其代理的零售用户8。 2� 山东核电参与现货市场:自2023年11月起,山东海阳核电1、2号机组,装机容量共计250万千 进一步完善 分时电价机 制有关事项 的通知 (2023年9 月起执行) 其余季节 100千伏安及以上的 工商业用户 0.5 1 1.5 1 0.5 1 1.5 1 0.5 夏季、冬季 (1,7,8,12 月) 0.5 1 1.5 1 0.5 1 1.5 1.875 1.5 1 0.5 (c) 江苏省发展 改革委关于 进一步完善 分时电价政 策的通知 (2023年7月 起执行) 所有月份 单一制,315千伏安 65 1 重大节假日 (春节、劳动 节、国庆节) 大工业用户 0.2 春秋季(2-6 月,9-11月) 一般工商业用户 0.45 1.5 0.45 1.5 1 夏冬季(1、7 、8、12月) 一般工商业用户 0.38 1.5 1.65 0.38 1 1.65 1.5 1 重大节假日 (春节、劳动 节、国庆节) 一般工商业用户 0.2 浙江省发展 改革委关于 进一步完善 我省分时电 价政策有关10 积分 | 54 页 | 1.78 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火:能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能” 为核心基础,叠加:开源开放、超低成本、 国产自主研发三大优势,不仅实现技术代际 跨越,更推动AI技术普惠化与国产化生态繁 • vLLM部署:生产、开发、垂直领域私有化部署,精度可控,更专业 • 其它 Model Base Model 特点 DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-1.5B 蒸馏模型,能力稍弱 实际上是增加了推理能力的Qwen模型和Llama模型 DeepSeek-R1-Distill-Qwen-7B Qwen2.5-Math-7B De10 积分 | 57 页 | 9.65 MB | 5 月前3
B400G以太网助力智算中心光互联(20页PPT-移动)PMD xAUI PHYSec or 探索新层次:将传统密码学思想应用到以太网物理层— PHYSec ,解决现有技术方案的安全漏洞与性能瓶颈,具 有 极低开销、时延以及低功耗和成本等优势 L1.5 层 PHYSec :基于“ 64B/66B 码块”的 PHY 芯片实现 MAC (Preamble+Padding+FCS) RS AM Deskew AM Lock RS-FEC 64B/66B 400GE 400GE 400GE 400G OTN 64B/66BGMPOTU OTUGMP64B/66B L1.5-PHYSec PHY 芯 片 Serdes 光模块 光模块 PHY 芯 片 Serdes 400GE L1.5-PHYSec L1 层 PHYSec :基于“比特流”的光模块实现 MAC (Preamble+Padding+FCS) RS30 积分 | 20 页 | 1.87 MB | 4 月前3
低碳园区评价指南(TQDSF 012—2022)分 投入规划 10 规划政策 每五年制定一次低碳规划政策 满足得 2 分, 否则 0 分 低碳环保投入占园区投入比 重 ≥4.5% 4 [3%,4.5%) 2 [1.5%,3%) 1 绿色产业增加值比重 ≥30% 4 [20%,30%) 2 [10%,20%) 1 低碳生产/ 服务 50 能源节约 16 单位工业增加值综合能耗 低碳规划 30 设施建设 24 绿化覆盖率 ≥40% 6 [35%,40%) 4 [30%,35%) 2 场地、道路设施 A.6 中列项 6 分,满足一 项得 1.5 分 园区建筑环境健康度 100% 6 [75%,100%) 4 [50%,75%) 2 [25%,50%) 1 绿色建筑比重 见表 5(满分 6 分) 投入规划 投入规划 6 规划政策 每五年制定一次低碳规划政策 满足得2 分, 否则 0 分 低碳环保投入占园区投入 比重 ≥4.5% 4 [3%,4.5%) 2 [1.5%,3%) 1 低碳生产/ 服务 50 能源节约 20 可再生能源消费比重 ≥15% 10 [10%,15%) 6 单位 GDP 能耗降低率 ≥5% 10 [3.5%10 积分 | 20 页 | 1.13 MB | 5 月前3
共 157 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16
