华为昇腾DeepSeek解决方案计算与通信优化,性能提升 30% GRPO :群体进化的智慧筛选器 自我验证机制: AI 的 " 错题本系 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% 推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 双向管道训练 ,需要存两份参数来进行训练( Parameter 2x ) • 模型总参数量 671B ,每个卡上 4 个 routed expert 对应 26.8B , 同时 考虑到 PP-16 和 FP8 量化 ,每个卡上显存占用为 1.675GB 参考 DualPipe 技术,基于 MindSpeed 训练加速框架以及昇腾硬件特性,针 对 性地设计高效率流水并行技术,提升整体训练性能 降低学习复杂度 简化强化学习流程 降低后训练复杂度 推理优化 单次推理效率倍级提升 一次预测多个 token 推理倍级提升 FP16/BF16 1 前 1 后单流水 需要裁判模型评估 1 次 1token 预测 MHA/GQA 分组共享减少缓存 GPT4 16 专家选 2 FP8 混合精度 双向流水并行 新老策略组队评估 1 次多 Token 预 测 MLA 低秩压缩减少缓存 DeepSeekMoE0 积分 | 32 页 | 2.52 MB | 7 月前3
英特尔-工业人工智能白皮书2025年版...................................................................................................16 2.1.3 英特尔® 至强® Max 系列 & 英特尔® 至强® 6 处理器 ........................................................ 发 行版 OpenVINO™ 工具套件,加速 AI 推理工作负载 管理与安全 • 英特尔® vPro 平台适用于特定 SKU • 英特尔® 融合安全管理引擎 (Intel® CSME) 版本 16 操作系统支持 • Windows 10 IoT 企业版 2021 长期服务频道 (LTSC) • 支持 EFLOW • Linux 内核覆盖,可轻松采用物联网功能 • Celadon (Android)(社区支持) 英特尔® vPro® Enterprise B ME16 ME16 英特尔® 酷睿™ i7- 12800HE 处理器 14 6 8 20 24 MB 高达 4.6 高达 3.5 2.4 (@45W) 1.6 (@35W) 1.8 1.35 是 企业 消费者 英特尔 锐炬® X e 显卡 D 96 2 16 (CPU) 12 (PCH) DDR5- 48000 积分 | 82 页 | 5.13 MB | 7 月前3
山东大学:DeepSeek 应用与部署蒸馏、微调、 RAG DeepSeek 本地部 署 1. GPU 要求 推荐 NVIDIA 显卡( RTX 3090/4090/A100 等) 显存要求: ■ 7B 模型: 至少 16GB 显存 ■ 13B/20B 模型: 至少 24GB 显存 ■ 70B 模型: 需多卡并行(如 2xA100 ) 支持 CUDA 11.7+ 和 cuDNN Studio 本地部署 • 前期准备: 确保设备满足一定硬件要求 , 显卡需 GTX 1060 ( 6GB ) 及以上 , 推荐 RTX3060 及以上; 内存 8GB 及以上 , 推荐 16GB 及更高; C 盘剩余 20GB 空间 , 建议 使用 NVMe 固态硬盘 。 • 安装 LM Studio 客户端: 在官网 lmstudio.a i 下载对应操作系统的安装包 ,双击 运10 积分 | 79 页 | 6.52 MB | 7 月前3
DeepSeek大模型赋能高校教学和科研2025,包括问题回答、 摘要生成、 翻译、 字幕生成、 情感分析等任务。 然而 , 由于其 复杂 性和黑箱性质 , Gemini 的可解释性仍然是一个挑战 3.6.1 国外的大模型产 品 2024 年 2 月 16 日 , OpenAI 再次震撼全球科技界 ,发布了名为 Sora 的 文本 生成视频大模型 ,只需输入文本就能自动生成视频。 这一技术的诞生, 不仅标志着人工智能在视频生成领域的重大突破 ,更引发了关于人工智 □使用腾讯智影生成数字人播报视频(用于制作教学视 频) Vidu 生数科技联合清华大学发布 , 是中 国首个长时长、 高一致性、 高动态 性视频大模型 , 支持一键生成 16 秒 高清视频 ,性能对标国际顶尖水 平。 即梦 AI 即梦 A I 是字节跳动旗下剪映团队开 发的一站式 A I 创意创作平台。 支 持 文生图、 图生图、 文生视频、 致力于打破传统搜索引擎的局限 ,提供智能化、 多样化的搜索体验。 多模态搜索 支持文字、语音、拍照、视频 等多种输入方式 ,满足不同 场 景下的需求 ,实现“一切皆可 搜索” 智能工具集成 内置 16 款顶尖大模型 ,如豆包、 文心一言等 ,为用户提供一站 式 AI 智慧体验。 慢思考模式 通过专家协同和多模型协作 , 深入分析复杂问题 ,提供更 专 业、更全面的答案。10 积分 | 123 页 | 15.88 MB | 7 月前3
从智慧教育到智慧课堂:理论、规范与实践多终端访问 支持任何常用终端设备无缝 连接到各种教育信息系统, 无缝获取学习资源与服务 联接社群 学习者的多个学习终 端之间实现数据同步、 无缝切换,学习过程 实现无缝迁移 具体 体现 16 全向交 互 • 自然交互 • 深度互动 • 过程记录 17 智能管 控 教育环境、资源、管理与服务的智能管理是智慧教 育的核心特征。 智能控制 智能诊断 智能分析10 积分 | 74 页 | 10.39 MB | 7 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1; ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 推理为中心的大规模强化学习 (GRPO) Large-Scale10 积分 | 76 页 | 8.39 MB | 7 月前3
共 6 条
- 1
