山东大学:DeepSeek 应用与部署DeepSeek 应用与部 署 听听真我数字人讲 DeepSeek AIGC 发展历 程 AIGC 2014-2024 自然语言处理与语言模型 大语言模型 LLM : 2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention )10 积分 | 79 页 | 6.52 MB | 1 年前3
华为昇腾DeepSeek解决方案工程创新:新的范式降低后训练和蒸馏门槛,模型效果大幅提升, 出现平权现象,引发新一波的“百模千态” 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 训练的算力需求将持续增长,算力结构从“预训练为主” 走向0 积分 | 32 页 | 2.52 MB | 1 年前3
共 2 条
- 1
