32 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

完成，从而解决 R1-Zero 可读性差、多种语言混合问题本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模型（ Qwen/LLaMa 1.5B 7B 14B 32B 70B ） DeepSeek-R1 以 DeepSeek-V3 Base （ 671B ）为基础模型，使用 GRPO 算法作为 RL 框架来提升 Reasoning 性能 Huawei 兼顾成本与性能的蒸馏 / 微调方案 • 便捷的部署、敏捷业务上线 DeepSeek-V3-671B DeepSeek-R1-671B DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-1.5B （蒸馏后较原模型能力提升 10%+ ） BERT-Large Transformer ● 2 工程创新新一轮百模千态 DeepSeek R1 - √ DeepSeek Janus-Pro-1B/7B √ √ DeepSeek R1-Distill-Llama-70B - √ DeepSeek R1-Distill-Qwen-32B - √ DeepSeek R1-Distill-Llama-8B DeepSeek R1-Distill-Qwen-1.5B/7B/14B √ √ 配套版本上线昇腾社区： https://www

0 积分 | 32 页 | 2.52 MB | 5 月前
3
山东大学：DeepSeek 应用与部署

，通过图形化界面即可轻松配置和使用 https://chatboxai.app/zh#downl oad DeepSeek 模型。 DeepSee k DeepSeek-R1 - Ditill-Qwen-32B DeepSeek-R1 - Ditill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-14B DeepSeek-R1 - Distill-Ollama-7B R1 蒸馏模型。 • 云原生构建：登录腾讯云，云原生构建相关服务，一键体验 DeepSeek ，无需等待下载，支持 1.5b/7b/8b/14b/32b 多款模型。 • TI 平台：登录腾讯云 TI 平台，提供专属算力、多种尺寸模型、 0 代码模型部署等功能。 • HAI ：登录腾讯云 HAI 控制台，新建 DeepSeek - R1 DeepSeek 模型的搜索功能。腾讯云 API 调用开发者首选， DeepSeek 部署简单、直观、高效！ HAI 提供 GPU 算力和 o llama 环境，支持 1.5B, 7B, 8B, 32B 等多个 DeepSeek-R1 蒸馏模型。企业级首选， DeepSeek 部署稳定、安全、易用！腾讯云智能全栈 AI 服务上架 DeepSeek 系列模型创建应用华为云

10 积分 | 79 页 | 6.52 MB | 5 月前
3
英特尔-工业人工智能白皮书2025年版

...................................................................................................32 2.2.3 英特尔® Geti™ 平台 ............................................................................. 512 GB 英特尔® 至强® CPU Max 9460 处理器 40 2.2 2.7 3.5 97.5 350 2S 4800 128 GB 英特尔® 至强® CPU Max 9462 处理器 32 2.7 3.1 3.5 75 350 2S 4800 128 GB 22 02 英特尔 ® 技术方案 1. 有关工作负载和配置的信息，请访问：intel.com/performanc 条，可以支持重要的 I/O 附加组件，包括加速器、网络适配器、存储控制器和存储。 • 多达 64 条 Compute Express Link (CXL) 2.0 通道，每条通道的数据传输速率高达 32 GT/s，支持 CXL 功能，包括内存扩展和共享（包括 Type 3 设备）。数据 • 英特尔® 数据保护与压缩加速技术（Intel® QuickAssist Technology，英特尔®

0 积分 | 82 页 | 5.13 MB | 5 月前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

) ■ 1000 张 H800(2.5 亿 ):1 .5*107 秒 (174 天 ) 算力 ( 每秒 ) 显存运力生态政策风险成本华为 910B 320T=3.2*101 4 32GB 240 GB/s 较好无 12 万英伟达 H800 1000T=1015 80GB 900 GB/s 好有 25 万人工智能计算平台成本估计算力存力运力 ■

10 积分 | 23 页 | 7.53 MB | 5 月前
3
从智慧教育到智慧课堂：理论、规范与实践

智慧教育：促进智慧学习 31 智慧教学的智慧教学是教师在智慧教学环境下，利用各种先进信息化技术和丰富的教学资源开展的教学活动。特征高效开放多元互通深度交互 32 常规 ( 课堂 ) 智慧教学过程智慧学习智慧学习是在智慧环境中开展的完全以学习者为中心的学习活动。基本特征培养技能认知创造内省交际个性化高效率沉浸性持续性

10 积分 | 74 页 | 10.39 MB | 6 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

CoT 模型。 ➢ Long2short RL：在标准 RL 训练后，使用长度惩罚对模型进行微调，进一步提高短文本 CoT 模型的效率。技术对比讨论：Kimi K1.5 Moonshot 32 技术对比讨论：Kimi K1.5 vs. DeepSeek-R1 Comparison Kimi K1.5 Main Result DS-R1 Main Result ➢ 二者都关注RL的方法带来的提升，MCTS 个问题）可以显著提升推理性能，尤其是在数学任务中，展现了 Long-COT 调优即便在数据量较少的情况下依然具有强大的推理能力。 ➢ 更大规模和专业化模型提升性能：更大规模的模型（如 14B、32B）以及经过专业预训练的模型（如数学预训练和上下文长度扩展）在 Long-COT 训练中表现更佳，优于较小规模的模型（如 7B）在保持正确推理路径和处理复杂任务的能力。 ➢ 任务与语言之间的正迁移：Long-COT

10 积分 | 76 页 | 8.39 MB | 6 月前
3
DeepSeek大模型赋能高校教学和科研2025

系列大模型正在对接学校统一身份认证平台，近期将面向全校师生开放试用同时，将根据学校各学科具体需求与硬件条件，以具体化、针对性、私有化、学科专用或实验室专用的方式将进一步将 70B 、 32B 、 14B 、 8B 、 7B 等不同版本的 DeepSeek-R1 大模型部署到学科内部，并接入本地知识库（如学术资源、课程资源、实验数据等），后期学校将根据具体需求及资源占用情况提供差异化服务

10 积分 | 123 页 | 15.88 MB | 6 月前
3

共 7 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

山东大学：DeepSeek 应用与部署

英特尔-工业人工智能白皮书2025年版

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

从智慧教育到智慧课堂：理论、规范与实践

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek大模型赋能高校教学和科研2025