金融-DeepSeek银行部署加速,AI金融应用迎来跃迁性能:蒸馏小型模型展现 Test-time Scaling ,可支持多项基础业务场 景 资料来源: s1: Simple test-time scaling ,中泰证券研究所 9 模型展现出随推理时间增加准确度增加的 Test time Scaling S1 仅使用 1000 个微调示例就达到了类似 r1 的准 确度 资料来源: s1: Simple test-time scaling ,中泰证券研究 所 图表:各模型微调示例数与准确度对比 图表:各模型微调示例数与准确度对比 图表: s1 表现出的 Test time Scaling n DeepSeek 可以通过 API 接口或者数据中台架构,实现与传统银行技术系统的数据交互,从而实现各类业务高效高质的无 缝对接,有望释放海量私域数据价值。 Post-Train 阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力, 不 再依赖传统提示工程。根据 DeepSeek 的官方使用指南, 多模态理解和视觉生成表现 资料来源: Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling ,中泰证券研究所 11 多模态: Janus-Pro 等开源多模态模型有望进一步提升应用能 力 理解金融应用的“降本增效 - 价值创 造 - 决策赋能”三个层次 2 n 我们认为金融行10 积分 | 25 页 | 1.44 MB | 1 月前3
基于大模型的具身智能系统综述ALOHA2[58] TidyBot[49], VIMA[50], Instruct2Act[51], VoxPoser[52], VilA[30] RoboGen[42], Mimicgen[43], Scaling up and distilling down[44], DrEureka[45], Omnigrasp[46], Meta-World[47], BEHAVIOR-1K[48] ALOHA[37] 含适当空间配置的物体及资产的模拟环境; 然后, 将高级任务分解成子任务, 选择最优学习方式 (强 化学习、运动规划或轨迹优化), 生成训练监督; 最 终, 学习获取新技能的策略. 类似地, Scaling up and distilling down[44] 提出 了一个在模拟器中进行学习的框架, 使用大语言模 型指导高层规划, 并利用基于采样的机器人规划器 (如运动或抓取采样器) 生成多样化和丰富的操作轨 the 7th Conference on Robot Learning. Atlanta, USA: PMLR, 2023. 43 Ha H, Florence P, Song S. Scaling up and distilling down: Lan- guage-guided robot skill acquisition. In: Proceedings of the 7th Conference20 积分 | 19 页 | 10.74 MB | 1 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)Gemini 2.0 Flash Thinking 经过训 练后,可以生成模 型在回答问题时 经历的思考过程。 推理大模型 :通过测试时拓展( Test-Time Scaling ) 、强化学习、蒸 馏 等技术,大模型的推理能力不断增强。 o3 通过模拟推理技术,能够暂停并反思自 身内部的思考过程,从而在回答问题前进 行更深入的推理,类似于人类的思考方式。20 积分 | 61 页 | 13.10 MB | 1 月前3
基于AI大模型Agent智能体商务应用服务设计方案(141页 WROD)优化算法和数据处理流程,减少不必要的计算开销。 使用微服务架构,将复杂系统拆分为多个独立服务,便于单独 优化和扩展。 在技术选型方面,云服务提供商的弹性计算资源是确保可扩展 性的关键。例如,利用 AWS 的 Auto Scaling 或 Google Cloud 的 Managed Instance Groups,可以根据需求自动调整服务器数量, 避免资源浪费并确保系统的高可用性。此外,容器化技术如 Docker10 积分 | 141 页 | 647.35 KB | 1 月前3
共 4 条
- 1
