2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero10 积分 | 76 页 | 8.39 MB | 9 月前3
DeepSeek大模型赋能高校教学和科研2025DeepSeek 每个人都可以读懂的大模型科普报告(高校篇) DeepSeek 大模型赋能高校教学和科 研 厦门大学大数据教学团队作品 2025 年 2 月 25 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 PPT 步骤 4 : 登录 KIMI 平台。在浏览器地址栏中输 入 “https://kimi.moonshot.cn/” 网址, 进入“ KIMI 平台 ”,登录成功后,点击平 台左侧的“ kimi+ ” 后选择 PPT 助手功能 步骤 6 : 一键生成 PPT 并选择适合的 PPT 模 板和风格 步骤 7 : 编辑和确认生成的 PPT 内容, 无 误后下载 PPT □使用腾讯智影生成数字人播报视频(用于制作教学视 频) Vidu 生数科技联合清华大学发布 , 是中 国首个长时长、 高一致性、 高动态 性视频大模型 , 支持一键生成 16 秒 高清视频 ,性能对标国际顶尖水 平。 即梦 AI 即梦 A I 是字节跳动旗下剪映团队开 发的一站式 A I 创意创作平台。 支 持 文生图、 图生图、10 积分 | 123 页 | 15.88 MB | 9 月前3
AI跃迁派:2025年DeepSeek零基础完全指南推理速度提升 3 倍,生成文字速度从 20 字/秒提升至 60 字/秒 行业重塑: ⚫ 迫使国际巨头降价(如 AnthropicClaude 降价 30%) ⚫ 首款登顶全球 140 国应用榜的国产 AI 模型 国家战略: ⚫ 突破“卡脖子”技术:仅用 2000 块国产昇腾芯片完成训练 ⚫ 构建自主技术生态:带动华为昇腾、寒武纪等国产芯片产业发展 3.功能定位:你的全能数字助手 佛教国家禁止 AI 讨论轮回转世 4.国家战略:数字时代的国力较量 DeepSeek 正在重塑国际竞争格局: ①技术主权争夺 芯片突围: ⚫ 华为昇腾 910B 芯片性能追平英伟达 A100 ⚫ 国产光子芯片突破 7nm 制程 ⚫ 标准制定权:中国主导制定 AI 伦理国际标准 ②数字丝绸之路 ⚫ 技术输出:在非洲建设“AI 赋能中心”培训百万数字人才10 积分 | 21 页 | 1.01 MB | 9 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025反斜面坑道 ( 战术穿插 ) 范弗利特弹药量 ( 地毯轰 炸 ) 大资金、大算力、大模型 “ 大模型” 》 上 甘 岭 ” 国 际 国 内 发布时间 G P U 时 ( 小 时 ) 训练成本 ( 美元 ) Llama 3.1 2024 年 7 月 3.1*107 6.2*107 DeepSeek v3 2024 年 12 华为等算力公司提供高算力密度 ■ 个人预测 Al 竞赛结果 ■ 以中国的工业化水平,站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话” DeepSeek V3 未来 展望10 积分 | 23 页 | 7.53 MB | 9 月前3
英特尔-工业人工智能白皮书2025年版至强® 6 性能核处理器 英特尔® 至强® 6900 系列 处理器 旗舰级 采用全新的英特尔® 服务器平 台设计,非常适合云计算、 AI、科学计算、软件即服务 (SaaS) 和基础设施即服务 (laaS) 等工作负载。 高端级 对现有的英特尔® 服务器平 台进行了大幅升级。面向企 业 IT、数字服务提供商和电 信的主流边缘协同服务器。 非常适合 AI、科学计算、网 可选多槽位 PCIe/PCIl 扩展 AK6215A2-2A1E 阿普奇弹匣式智能控制器 AK6 系列是专为机器视觉和边缘计算应 用而设计的超紧凑型工业计算机,搭载英特尔 ADL-U/RPL-P 平 台处理器,板载两口千兆网卡,6 个 USB 高速接口,支持大容量 高速 DDR5 内存,可支持 PCIE 扩展,确保流畅的多任务处理, 提供高效计算能力,同时可自由增加、更换高速扩展的主弹匣或0 积分 | 82 页 | 5.13 MB | 9 月前3
华为昇腾DeepSeek解决方案更复杂的模型及数据切分 更大规模 / 更复杂的组 网 网络控制器 18 Huawei Proprietary - Restricted Distribution AI 调 度 平 台 超长序列 NPU NPU 4 、动态路径调整 数据并行、流水并行 模 型 并 行 算子深度融合 “ 工序合并”减少计算数据搬入 搬出的时间及内存开销 计算与通信融合0 积分 | 32 页 | 2.52 MB | 9 月前3
共 6 条
- 1
