2019 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

Size tokens Parameters non-embedding Test Loss 101 OpenAl 商业模式 ( 循环以下四步 ) ■ 1, 华尔街融资 ■ 例子： 2019-21 年融资 20 亿美元 2, 购买最新 GPU ■ 例子：购买 2.5 万 A100 GPU ( 英伟达挣钱 ) ■ 3, 用最新 GPU 训练性能领先的大模型 ■ 例子：

10 积分 | 23 页 | 7.53 MB | 1 年前
3
华为昇腾DeepSeek解决方案

工程创新：新的范式降低后训练和蒸馏门槛，模型效果大幅提升，出现平权现象，引发新一波的“百模千态” 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026 训练的算力需求将持续增长，算力结构从“预训练为主” 走向 “预训练 + 后训练

0 积分 | 32 页 | 2.52 MB | 1 年前
3

共 2 条前往

页

浙江大学浙江大学 DeepSeek 模型优势算力成本角度解读 2025 华为解决方案解决方案