DeepSeek银行部署加速,AI金融应用迎来跃迁(25页 PPT)训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到 了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方 大规模跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所 资料来源:木尧,中泰证券研究所 5 性能: DeepSeek 推理架构优化,可适配银行高并行、高响应的业务场 景 n 以 DeepSeek R1 为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源 80% 以上能 力,就足以压缩闭源的生存空间。 DeepSeek 能力能够比肩 OpenAIo1 ,开源使各行业机构能够轻松获取前沿模型能力,10 积分 | 25 页 | 1.44 MB | 1 月前3
人形机器人生态报告2025-上海财经大学本体、数据、端到端基础模型及场景解决⽅案全栈⾃研。 星海图核⼼产品涵盖星海图 R1 系列(含 R1 基础版、R1 Pro 进阶版)⼈形机器 ⼈,主打“⼈形本体+专业化机械臂+具⾝智能系统”的⼀体化产品形态,可实现精密抓 取、⼯具操作、物料装配等多样化作业,单臂负载与操作精度能满⾜ 3C 电⼦、新零 售、实验室⾃动化等细分场景的实操要求。在智能参数层⾯,R1 系列搭载的具⾝智能 ⼤模型⽀持 20+种⼯业⼯具的⾃主10 积分 | 20 页 | 2.65 MB | 1 月前3
迈向智能世界白皮书2025-韧性DC白皮书-华为大面积延误;数家医院的AI辅助诊断工具临时 宕机,非紧急手术被迫延期;某证券交易平台 的实时行情服务停滞,影响高频交易执行。 事故 海量需求与洪峰流量冲击 2025年1月27日,DeepSeek公司发布大模型 R1版本后,用户单日访问量激增至 4900万 次,远超服务器并发承载极限,导致大量用户 无法使用服务。 韧性的本质:故障即常态、恢复即本能 美国软件工程研究所(SEI)提出,系统韧性表现 为对 DC 白皮书 45 44 一份给 CIO 规划建设数据中心的参考 DC1 DC2 消费方A 应用R1 单元分区e01 存储双活 01-32 65-96 33-64 97-128 01-32 65-96 33-64 97-128 存储 存储 同步复制 <100公里 应用R1 存储双活 单元分区e03 负载均衡 消费方B 存储 存储 负载均衡 城市1 康探活实现单元路由和异地人工接管。 33-64 DC3 DC4 负载均衡 负载均衡 应用R1 应用R1 双活 <100公里 01-32 65-96 33-64 97-128 存储 数据库 城市2 存储 存储 DC1 DC2 消费方A 消费方B 负载均衡 负载均衡 应用R1 应用R1 单元分区e01 单元分区e02 单元分区e03 单元分区e04 强一致同步 近地A10 积分 | 53 页 | 7.03 MB | 22 天前3
【案例】工业大模型赋能的新型流程工业智能工厂核心工业软件体系方案ChatGPT 的大语言模型, 视觉模型、多模态模型、专业领域模型等不同类型的模型在工业中都 进行了一定程度的概念验证和应用 [33]. 2025 年, 由中国深度求索公司开源的 DeepSeek R1, DeepSeek V3 大语言模型在自适应建模与零样本学习、数据整合与加工、特征提取与逻辑推理、深层次的模式挖 掘与决策优化等能力方面展现出显著的进步, 使得结合检索增强生成 (retrieval-augmented 开发基于大语言模型的工业大模型, 分为以下 3 个层次, 首先是模型底座层, 其次是公共能力层, 最后是业务应用层 [31,36,37], 整体架构如图 3 所示. 模型底座层采用 DeepSeek R1, DeepSeek V3, Qwen 等大语言模型, 公共能力层提供了处理工业业务所需要具备的多模态能力, 包括时序数据能力、图像 数据能力、文本数据能力. 在业务应用层, 需要结合具体业务场景开发智能体 (如阿里 巴巴) 提供的按 Token 计费的 LLM API, 也可选择在企业内部本地部署开源或商用模型, 保障数据隐 私安全. 以下详细列举了可以本地化部署的开源大语言模型, 如 DeepSeek R1, DeepSeek V3, Qwen 等. ChatGLM-6B (清华大学 KEG 实验室) [38]: ChatGLM-6B 是由清华大学知识工程实验室推出的 开源大语言模型, 拥有 60 亿参数10 积分 | 18 页 | 11.31 MB | 1 月前3
企业竞争图谱:2025年智能物流车 头豹词条报告系列2015-01-01~2019-01-01 2015年底:Starship Technologies推出第一台配送机器人; 2016年7月:开始送货服务试点; 2018年1月:Nuro.ai推出第一代送货机器 人R1,12月投入试点; 2019年:亚马逊Scout、联邦快递Roxo项目启动。 海外企业主导技术突破,产品初步商业化试点。 规模化发展期 2020-01-01~2022-01-01 4 智能物流车行业产业链上游为核心零部件供应环节10 积分 | 18 页 | 5.05 MB | 1 月前3
热电联产虚拟电厂两阶段分布鲁棒优化调度难问题,求解较为困难, 需要利用拉格朗日对偶的方法将第二阶段模型的 内层转化为一个确定性的凸半定规划问题,然后 再与外层结合,得到实时阶段问题的决策值: min { } Q1 t q1 t r1 t η1 t Q2 t q2 t r2 t η2 t ∑ t = 1 T (rt + ηt ) rt ≥ Ft - Pun t ΤQt Pun t -10 积分 | 13 页 | 2.70 MB | 2 月前3
【案例】医药行业大型集团企业数字化转型解决方案(108页 PPT)价格安全性 价目表 价格公式 最低限价 折扣 应计返利 买赠促销 条款升级 运费 附加费 价格应用规则 在设置基础价格时,通过选择的渠 道 来区分价格类型,如高 / 低开 ( R1 国产、 R2 进口、 R3 自营、 R4 高开代理、 R5 低开代理、 R6 普 药) ** 案例 ** 交流使用 69 灵活的 销售政策管理: 返利管理 返利管理,对于加强公司与各级经销商之间的10 积分 | 108 页 | 11.06 MB | 1 月前3
重庆市商业会计学会:2025年企业外汇风险数智化转型白皮书保策略选择合适的交易策 略、交易组合。 2.2.3 AI智能中枢层:AI 算法驱动的决策能力升级 外汇风险管理系统以AI为驱动,构建起多层协同架构。首先,模型及算力层以 DeepSeek—R1为推理引擎,结合LSTM算法处理金融数据,依托分布式云架构实现高频 数据处理与安全隔离,形成数据与策略反馈闭环。其次,智能体Agent层通过RAG检索 企业知识库并微调模型,各Agent分工完成外汇业务流程,配合权限代理网关保障交易10 积分 | 37 页 | 11.69 MB | 1 月前3
智慧园区整体解决方案(162页)可将查询情况打印成各种表格,如:情况总表 巡更事件表、巡更遗漏表等。 D4 r a In oGrote□ ot 出 7 题 概 平 a u UJ 6l tt 17 11 r1 - 吧下二 R 4 四 R 9 6 度 W l o rc n d 60 5Ina! P n 0 秀 门禁系统 门禁系统采用标准通讯接口建立与 InteBASE 通讯。30 积分 | 162 页 | 36.04 MB | 1 月前3
AI可信数据空间(54页 WORD)也对大模型各阶段的训练语料提出 全新要求。 1942 1956 2022 2025 模拟人脑 神经元素 达特茅斯 会议 chatGPT 发布 openAI O3 发布 Deepseek R1 发布 图 2 大模型技术发展演进阶段 09 公开数 2c 现象级应 首先,对多模态关联的复杂语料需求日益迫切。针对 大模型语料质量,传统纯文本数据已经无法支撑多 模态与具身大模型联合建模的需求。业界实践表10 积分 | 55 页 | 4.11 MB | 22 天前3
共 13 条
- 1
- 2
