2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)DeepSeek-R1-Zero (强推理模型) 推理导向强化学习 (准确率奖励+格式奖励) 纯强化学习训练 低可控:生成文本可 读性差、语言混乱 高探索自由度 => 推理能力自我觉醒 (更长的思维链、更深层次的 推理路径) DeepSeek-V3 (基础模型) 监督微调 强化学习 图源自《ReFT: Reasoning with Reinforced Fine-Tuning》10 积分 | 45 页 | 7.21 MB | 4 月前3
全球重点区域算力竞争态势分析报告(2025年)-中国通信工业协会数据中心委员会基石。 算力发展历程是人类技术革新与产业升级的集中体现,从原始计算工具的萌芽到完 整产业生态的形成,历经多阶段系统性演进,最终成为支撑全球经济社会智能化转型的 核心引擎。 在萌芽期,计算意识觉醒与基础工具革新,为算力产业奠定原始基础。从远古草 绳、石头计数,到算筹、算盘等手工计算工具的普及,标志着人类对高效计算的初步探 索。随着电子技术突破与算力形态革新,算力从工具属性向技术能力跨越,为产业形成10 积分 | 114 页 | 8.80 MB | 2 月前3
共 2 条
- 1
