华为昇腾DeepSeek解决方案教育 医疗 电力 油气 制造 硬件 + 社区 一体机 钉钉一体机 电信息壤一体机 昇腾社区 新致金融一体机 同花顺一体机 …… …… 诸多厂家推出一体化方案对 外提供服务 / 自用 硬件 + 开源模型 模型蒸馏 - 模型小型化 主流算力、主流社区 均已支持 DeepSeek 行业大模型 Huawei Proprietary - Restricted Distribution TO BE 云服务 AS IS 魔乐社区 昇腾 11 …… 模型服务商 潞晨科技 已上线 硅基流动 已上线 清昴 R1-Distill-Qwen-1.5B/7B/14B √ √ 配套版本上线昇腾社区: https://www.hiascend.com/software/modelzo o/models/detail/678bdeb4e1a64c9dae51d35 3d84ddd15 配套版本上线魔乐社区: https://modelers.cn/models/MindIE/deeps0 积分 | 32 页 | 2.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告4 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek R1在复杂任务上表现卓越,成为开源领域的又 一里程碑,标志着开源社区在与闭源大模型(如 OpenAI o1 系列)的竞争中迈出了关键性一步。 ➢ DeepSeek-R1 在数学代码任务上表现突出 ➢ Deepseek R1在AIME2024上获得了79.8%的成 (Reward Model) 19 DeepSeek-R1 Takeaways 技术亮点总结:Part I ➢ Pure RL to Develop Reasoning Capabilities: ➢ 社区的复现都涉及蒸馏和搜索,而DS-R1 Zero 跳过监督微调SFT阶段,展现出大规模强化学 习的潜力,这也得益于以下几点: ➢ 需要足够强的基座模型:基座模型 (DeepSeek-V3 Base) 系列更快;PPO训练稳定但是慢) ➢ 多语言可能是因为预训练数据是多语言的,“一视同仁”被 Tokenization,不同的领域的不 同语言编码是否有不同优势? DS-R1 Zero 长度涌现现象 社区复现结果 1 社区复现结果 2 DeepSeek-R1 长度泛化复现:https://zhuanlan.zhihu.com/p/21290410831 22 DeepSeek-R1 技术剖析:GRPO 赋能RL-Scale10 积分 | 76 页 | 8.39 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践 利用数据分析和在线工具,促进教师对学生绩 效产生新的理解。 从利用技术帮助学习,转变为利用技术回答问 题:学生学习到了什么?我可以为他提供什么 帮助? 利用开放式学习工具对资源社区进 行管理 教师能够更加关注学习结果。 教育者开发并使用工具。 降低成本 集中化设施更加易于维护; 软件易于升级维护 基本可以放弃桌面端的支持需求。 提高可靠性、利用性和产出。10 积分 | 74 页 | 10.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版• Windows 10 IoT 企业版 2021 长期服务频道 (LTSC) • 支持 EFLOW • Linux 内核覆盖,可轻松采用物联网功能 • Celadon (Android)(社区支持) • 支持 Ubuntu、Red Hat Enterprise、Wind River Linux 和 Wind River VxWorks 7 15 02 英特尔 ® 技术方案 和其他加速器)之间重用代码, 并为特定架构进行优化。基于 SYCL,oneAPI 定义了一套广泛的规范和库 API,以满足跨行业和计算以及 AI 使用案例的编 程领域需求。此外,oneAPI 提供一个开发者社区和开放论坛,以推动统一的 API,为统一的行业宽多架构软件开发平台, 并鼓励生态系统合作。 2.2 软件 2.2.1 英特尔® oneAPI 工具包 — 跨架构性能加速 图:oneAPI 图示(来源:https://www0 积分 | 82 页 | 5.13 MB | 5 月前3
共 4 条
- 1
