华为昇腾DeepSeek解决方案DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据 重新定义 Scaling Law 延续智能涌现的 方向 2017 谷歌发布首个 Transformer 架 构 模 型 2023 ChatGPT 模型能力突破 开启 NLP 时代 2012 AlexNet 模型能力突破 开启 CV 时代 1998 LeNet 首个 CNN 架构模型 Huawei Proprietary - Restricted Distribution 下一代 AI 技术 Mamba 、空间智能 等 算力 x 数据 x 思 考 模 型 效 果 低成本完美对标 OpenAI O1 ,突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 以 DeepSeek-V3 Base ( 671B )为基础模型, 使 用 GRPO 算法作为0 积分 | 32 页 | 2.52 MB | 7 月前3
山东大学:DeepSeek 应用与部署本地部署蒸馏小模型 第三方 UI 客户管接入服务 云端网站接入服 务 Deepseek 模型及蒸馏模 型 Chatbox API 及网络调 用 Chatbox API 及网络调 用 API 及蒸馏模 型 API 及蒸馏模 型 本地网络调用 API 接 入 DeepseeK 替代部署方案 • 本地部署蒸馏小模型: 可通过 o llama 平台、 LM DeepSeek DeepSeek-R1 - Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下 DeepSeek - R1 蒸馏模型。 • 云原生构建:登录腾讯云 ,云原生构建相关服务 HAI 提供 GPU 算力和 o llama 环境 ,支持 1.5B, 7B, 8B, 32B 等多个 DeepSeek-R1 蒸馏模 型。 企业级首选 , DeepSeek 部署稳定、 安全、 易用! 腾讯云智能全栈 AI 服务上架 DeepSeek 系列模 型 创建应用 华为云 +silconflow 邀请码: z0sI0urY 邀请链接: https://cloud.siliconflow10 积分 | 79 页 | 6.52 MB | 7 月前3
DeepSeek大模型赋能高校教学和科研202525 日 厦门大学 林子雨 副教授 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 , 11 年专注于大数据教学 团队特点: 眼光前瞻、 紧跟技术、 创新实干、 执行力 强 影响力高: 多项指标在国内高校大数据教学领域领 先 • ziyulin@xmu.edu.cn 厦门大学大数据教学团队 1. 人工智能发展简史 2. 人工智能思维 3. 大模型: 人工智能的前沿 4. 高校本地部署 DeepSeek 大模 型 5. AIGC 应用与实践 6. 基于大模型的智能体 7. AI 赋能高校科研 8. AI 赋能高校教学 目录 厦门大学大数据教学团队作品 2025 年 2 月 1.1 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程10 积分 | 123 页 | 15.88 MB | 7 月前3
英特尔-工业人工智能白皮书2025年版人工智能 (AI) 技术的快速发展掀起了新一轮工业革命浪潮,通用大模型的出现让 AI 技术从专用化迈向 了通用化。AI 技术正在步入工业领域的千行百业,帮助企业实现从传统的劳动密集型、资源密集型企 业,向技术密集型、知识密集型的高端化、智能化、绿色化方向转型升级,打造依托于人工智能、大 数据、云计算等现代信息技术的新质生产力。 工业 AI 和大模型的应用,已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预 利用机器学习和统计模型对数据进行分析,并依据数据分析结果辅助决策,帮助企业优化资源配置,提质增效,节省成本。 具体来看,AI 技术在工业领域的应用主要在以下几大方面: 研发与规划 • 需求分析与预测:基于历史数据和机器学习算法,构 建预测模型,通过分析大量用户数据和市场趋势,洞 察市场需求,预测未来趋势,精准定位产品的设计与 迭代方向。 • 优化研发流程管理:基于当前项目状态和历史数据建 立预测模型,预测每项任务的完成时间,并评估整个 产效率、优化资源配置、增强质量控制和实现生产过程 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在0 积分 | 82 页 | 5.13 MB | 7 月前3
从智慧教育到智慧课堂:理论、规范与实践学生通过电子书包 等终端随时随地享 受云端的各种学习 服务 云学习环境 • 保证学习数据的永 不丢失,为学习分 析提供数据支持 存储学习过程 数据 28 泛在网 络 泛在网络是通信网、互联 网、物联网的高度协同和 融合,将实现跨网络、跨 行业、跨应用、异构多技 术的融合和协同。 29 泛在网 络 创 新 学习、生活与工作的连通 学校教育、家庭教育和社会教育的 连通; 手机、平板、 课室黑板:绿色板 智慧课堂的类型 实用型未来教室 指在传统教室基础上,改进优化教室的物理环境,增添适量数字 化设备,初步实现传统教室的数字化、多功能化的一种未来教室 类型。 优势 环境简易变革,实现教学理念及方式大幅改进 低投入,高产出 使用简单,师生能够快速适应新环境 小步子逐步实施,保证教育生态平衡发展 互动型未来教室 构建基于一对一的教学环境,学习者能够有序开展小组合作 学习、项目学习等多样互动的学习方式。教师可基于教学环 境开展深度互动教学,引导学习者创造性学习、体验做中学 的乐趣。 优势 教学内容富媒体呈现 创设适应性虚拟学习环境 个性化学习环境 大数据学习分析 智慧型未来教室 在充足的空间内利用虚拟现实等技术,创造虚拟的学习情境 和教学资源扩展平台,为老师和学生提供适应性的自主学习 平台与资源,提供各种可视化的教学设备,运用教学平台的 及时交互与展示,为学生提供更多的学习资源,更好的自主10 积分 | 74 页 | 10.39 MB | 7 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告Simple-QA上表现突出 5 回顾:Pre-Training Scaling Law ➢ Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象,协调了计算量C、模 型参数量N和数据大小D之间的关系 6 回顾:Post-Training Scaling Law ➢ Post-Training 阶段,随着训练时计算量(来自RL的Training阶段)和 Test-Time 回顾:Post-Training Scaling Law 为什么我们需要后训练 Scaling-Law ? ➢ 随着模型尺寸逐渐增大,预训练阶段参数 Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参 在不同模态下保持一致的文本处理能力。 通过将文本文档、代码片段和结构化数据转换为图像,确保模型无论接收的是纯文本输入还是截图或照片中的 文本,都能提供一致的响应。这也有助于增强模型在处理文本密集型图像(如截图、表格、公式等)时的能力。 ➢ Long2Short 方法 ➢ 模型融合:将长文本 CoT 模型和短文本 CoT 模型的权重进行平均,得到一个新的模型。 ➢ 最短拒绝采样;Short10 积分 | 76 页 | 8.39 MB | 7 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读202512 月 2024 年 7 月 训练 Token 2 T 8.1 T 14.8 T 15T 模型规模 7B 、 67B 236B/ 激活 21B 671B/ 激活 37B 405B MoE 模 型 稠密 MoE 2+160 MoE 1+256 稠密 注意力技术 GQA MLA MLA N.A 上下文长度 4K 128K 128K 128K 训练成本 (GPU Hours) 300 concotenatel ](q 同 fopply RoPE Latent cO 0 OO00 1 ■ DeepSeek V3 模 型 参 数 ? 671B 参数 (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激 活 3 7B 参数 (~5.5%), 降低计算 量 MoE: 1 共享专家10 积分 | 23 页 | 7.53 MB | 7 月前3
AI跃迁派:2025年DeepSeek零基础完全指南APP(移动办公神器) 下载方式: ⚫ iOS:AppStore 搜索"DeepSeek"(蓝色鲸鱼 LOGO) ⚫ 安卓:应用商店搜索下载或官网直接获取安装包 核心功能: ⚫ 语音输入:长按麦克风图标口述问题(适合通勤场景) ⚫ 离线缓存:断网时可查看历史对话记录 避坑指南:若遇安装失败,检查存储空间是否充足,或关闭杀毒软件后重试 ③微信小程序(轻量化入口) 获取路径: 优势:无需注册,微信一键登录,适合快速查询天气、新闻等简单任务 ⚫ 限制:高峰期可能响应延迟,建议复杂任务切换至 APP 或网页版 ④电脑版(专业场景必备) 下载安装: 1.访问官网选择 Windows/macOS/Linux 版本 2.解压安装包后按向导完成部署(建议默认路径) 高阶功能: ⚫ API 接入:开发者可调用接口集成至办公系统(需申请密钥) ⚫10 积分 | 21 页 | 1.01 MB | 7 月前3
共 8 条
- 1
