浙江大学-DeepSeek模型优势:算力、成本角度解读2025公开的单次极低预训练成 本 DeepSeek 全部训练单次成本: 5,576,000 美 元 单张 H800 GPU 每小时租赁成本: 2 美 元 泛大 模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama 3.1 发布时间 2024 年 1 月 2024 年 6 月 2024 年 12 月 2024 年 7 月 训练 Token 2 T10 积分 | 23 页 | 7.53 MB | 5 月前3
共 1 条
- 1
