16 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

计算与通信优化，性能提升 30% GRPO ：群体进化的智慧筛选器自我验证机制： AI 的 " 错题本系统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA ：空间压缩术训练框架加速： 16 到 3 的量化压缩，通信降低 89% 推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质双向管道训练，需要存两份参数来进行训练（ Parameter 2x ） • 模型总参数量 671B ，每个卡上 4 个 routed expert 对应 26.8B ，同时考虑到 PP-16 和 FP8 量化，每个卡上显存占用为 1.675GB 参考 DualPipe 技术，基于 MindSpeed 训练加速框架以及昇腾硬件特性，针对性地设计高效率流水并行技术，提升整体训练性能降低学习复杂度简化强化学习流程降低后训练复杂度推理优化单次推理效率倍级提升一次预测多个 token 推理倍级提升 FP16/BF16 1 前 1 后单流水需要裁判模型评估 1 次 1token 预测 MHA/GQA 分组共享减少缓存 GPT4 16 专家选 2 FP8 混合精度双向流水并行新老策略组队评估 1 次多 Token 预测 MLA 低秩压缩减少缓存 DeepSeekMoE

0 积分 | 32 页 | 2.52 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

...................................................................................................16 2.1.3 英特尔® 至强® Max 系列 & 英特尔® 至强® 6 处理器 ........................................................ 发行版 OpenVINO™ 工具套件，加速 AI 推理工作负载管理与安全 • 英特尔® vPro 平台适用于特定 SKU • 英特尔® 融合安全管理引擎 (Intel® CSME) 版本 16 操作系统支持 • Windows 10 IoT 企业版 2021 长期服务频道 (LTSC) • 支持 EFLOW • Linux 内核覆盖，可轻松采用物联网功能 • Celadon (Android)（社区支持）英特尔® vPro® Enterprise B ME16 ME16 英特尔® 酷睿™ i7- 12800HE 处理器 14 6 8 20 24 MB 高达 4.6 高达 3.5 2.4 (@45W) 1.6 (@35W) 1.8 1.35 是企业消费者英特尔锐炬® X e 显卡 D 96 2 16 (CPU) 12 (PCH) DDR5- 4800

0 积分 | 82 页 | 5.13 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

蒸馏、微调、 RAG DeepSeek 本地部署 1. GPU 要求推荐 NVIDIA 显卡（ RTX 3090/4090/A100 等）显存要求： ■ 7B 模型：至少 16GB 显存 ■ 13B/20B 模型：至少 24GB 显存 ■ 70B 模型：需多卡并行（如 2xA100 ）支持 CUDA 11.7+ 和 cuDNN Studio 本地部署 • 前期准备：确保设备满足一定硬件要求，显卡需 GTX 1060 （ 6GB ）及以上，推荐 RTX3060 及以上；内存 8GB 及以上，推荐 16GB 及更高； C 盘剩余 20GB 空间，建议使用 NVMe 固态硬盘。 • 安装 LM Studio 客户端：在官网 lmstudio.a i 下载对应操作系统的安装包，双击运

10 积分 | 79 页 | 6.52 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

，包括问题回答、摘要生成、翻译、字幕生成、情感分析等任务。然而，由于其复杂性和黑箱性质， Gemini 的可解释性仍然是一个挑战 3.6.1 国外的大模型产品 2024 年 2 月 16 日， OpenAI 再次震撼全球科技界，发布了名为 Sora 的文本生成视频大模型，只需输入文本就能自动生成视频。这一技术的诞生，不仅标志着人工智能在视频生成领域的重大突破，更引发了关于人工智 □使用腾讯智影生成数字人播报视频（用于制作教学视频） Vidu 生数科技联合清华大学发布，是中国首个长时长、高一致性、高动态性视频大模型，支持一键生成 16 秒高清视频，性能对标国际顶尖水平。即梦 AI 即梦 A I 是字节跳动旗下剪映团队开发的一站式 A I 创意创作平台。支持文生图、图生图、文生视频、致力于打破传统搜索引擎的局限，提供智能化、多样化的搜索体验。多模态搜索支持文字、语音、拍照、视频等多种输入方式，满足不同场景下的需求，实现“一切皆可搜索” 智能工具集成内置 16 款顶尖大模型，如豆包、文心一言等，为用户提供一站式 AI 智慧体验。慢思考模式通过专家协同和多模型协作，深入分析复杂问题，提供更专业、更全面的答案。

10 积分 | 123 页 | 15.88 MB | 1 年前
3
从智慧教育到智慧课堂：理论、规范与实践

多终端访问支持任何常用终端设备无缝连接到各种教育信息系统，无缝获取学习资源与服务联接社群学习者的多个学习终端之间实现数据同步、无缝切换，学习过程实现无缝迁移具体体现 16 全向交互 • 自然交互 • 深度互动 • 过程记录 17 智能管控教育环境、资源、管理与服务的智能管理是智慧教育的核心特征。 智能控制 智能诊断 智能分析

10 积分 | 74 页 | 10.39 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

安全性？例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1； ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 推理为中心的大规模强化学习 (GRPO) Large-Scale

10 积分 | 76 页 | 8.39 MB | 1 年前
3

共 6 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

英特尔-工业人工智能白皮书2025年版

山东大学：DeepSeek 应用与部署

DeepSeek大模型赋能高校教学和科研2025

从智慧教育到智慧课堂：理论、规范与实践

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告