华为昇腾DeepSeek解决方案DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% 推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 降本 技术创新 硬件级、算法级、架构级、工程级、开 源生态 5 大技术创新,轰动全球 .. 应用使能 应用使能套件 / SDK AI 计算框架 PyTorch / TensorFlow / Caffe...... NV 系列硬件 模组 / 加速卡 / 服务器 / --> 集 群 NV 处理器 Ampere 系列 / Hopper 系列 ... 英 伟 达 AI 基 础 软 硬 件 架 构 ModelArts 应用使能 训练平台 / 推理引擎 / 模型套件 /0 积分 | 32 页 | 2.52 MB | 10 月前3
英特尔-工业人工智能白皮书2025年版化方向转型升级,打造依托于人工智能、大 数据、云计算等现代信息技术的新质生产力。 工业 AI 和大模型的应用,已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预 测性维护、供应链优化、创新服务、绿色制造、智能客服等众多环节,它通过处理和分析海量工业数 据,帮助企业在上述各个环节中做出最优的智能化决策,从而在多个环节全方位实现提质、增效、降 本,增强竞争力。 在日趋激烈的 ....................................................................................47 3.2 美的楼宇科技美控:楼宇 AI 节能解决方案 ............................................................................49 3.3 利珀:晶硅电池隐裂检测产品 拟产品的各种实际应用场景,如正常操作、极限性 能、潜在故障等,预测产品性能表现,进一步指导 设计改进。 1.2 工业 AI 的应用范畴 04 01 工业人工智能 (AI) 行业观察 生产过程管控 在生产过程管控方面,AI 技术的应用主要集中在提高生 产效率、优化资源配置、增强质量控制和实现生产过程 的自动化与智能化。具体包括: • 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的0 积分 | 82 页 | 5.13 MB | 10 月前3
DeepSeek大模型赋能高校教学和科研2025月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概 念 训练数据量大 计算资源需求高 参数数量庞大 大模型的设计和训练旨在提供更强大、 更准确的模型性能 , 以应对更复杂、 更庞大的数据集或任务。 大模型通常能够学习 到 更细微的模式和规律 ,具有更强的泛化能力和表达能力 学习能力强 大模型可以从大量的数据中学习, 并利用学到的知识和模式来提供 更精准的答案和预测 。这使得它 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理模 型是在回答之前进行思考 , 并在回复用户 之前 ,在内部生成一长串的思维链过程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前 , 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 跨语言翻译)、问答系统(能够回答用户提出的问题)、情感 分析 (用于判断文本中的情感倾向)、语言生成(如聊天机器 人)等 大模型的应用领域非常广泛 ,涵盖了自然语言处理、 计算机视觉、 语音识别、 推荐系统、 医疗健康、 金融风控、 工业制造、 生物信息学、 自动驾驶、 气候研究等多个领域 3.7 大模型的应用领 域 ( 4 )推荐系统 大模型可以用于个性化推荐、广告推荐等任务。通过分析用户的历史 行为和兴趣偏好 ,大模型可以为用户提供个性化的推荐服务10 积分 | 123 页 | 15.88 MB | 10 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告R1的出现再次证明了强化学习的潜力所在: ➢ R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调(SFT); ➢ 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; ➢ 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; 4 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力,DeepSeek 标注的数据来让模型 初步掌握某种能力(如对话或者语言风格),然后再用RL来进一步优化性能 ➢ DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 ➢ 无需构建和维护高质量的SFT数据集,而是让模型直接在RL环境中进行探索 ➢ 类比:初学者在没有老师指导的情况下,通过不断的尝试和错误来掌握一门新的技能。 ➢ 这种自主学习的方式,不仅节省了大量的标注成本; ➢ 更重要的是,它让模 Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1; ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero10 积分 | 76 页 | 8.39 MB | 10 月前3
AI跃迁派:2025年DeepSeek零基础完全指南“quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: ⚫ 思维链可视化:像老师写板书一样展示推理步骤(如解方程时先分解条件再推 导) ⚫ 反事实推演:模拟“如果特斯拉降价 10%”对产业链的 6 级影响 实战场景: ⚫ 医疗诊断:输入症状自动关联相似病例,生成检查建议(需医生复核) ⚫ 投资分析:对比财报数据→预测企业风险→生成可视化报告 商业分析:“假设你是麦肯锡顾问,分析新能源汽车充电桩市场的三大风险点,用 SWOT 框架呈现” ⚫ 创意写作:“用鲁迅杂文风格,写一篇讽刺 AI 过度依赖现象的短文,结尾需反转升 华” ③思维链可视化 指令设计:要求展示推理过程(如“先分解条件再推导”) 应用场景: ⚫ -解数学题时自动展示公式推导步骤 ⚫ -分析商业案例时生成因果逻辑图 2.行业专用模板:拿来即用的生产力工具 GPT-4 生成问卷文案,最后 用 Claude 整理数据图表” 效率提升:全流程时间缩短 70% ③批判性训练 ⚫ 逆向推演:“假设我的奶茶店三个月后倒闭,请逆向分析失败原因链” ⚫ 跨界迁移:“参考迪士尼排队管理策略,优化咖啡店高峰时段服务流程” 5.官方推荐模板(简化版) 1.代码优化: “下面这段 Python 代码运行缓慢,请解释问题并提供两种优化方案”10 积分 | 21 页 | 1.01 MB | 10 月前3
山东大学:DeepSeek 应用与部署高级能力层 复杂系统建模与自主决策 ,包括数字孪生仿真系统(构建物理于数字融合虚拟环境 模拟天气等) 、 多智能体协同优化(将每个个体作为智能体通过联邦学习模拟群体行为) 和元认 知调 控机制(实施监控自身决策、 动态分配资源、 自动触发行为) 。 • 4. 终极能力层 自主进化与创造性突破 ,包括概念空间探索(通过对抗网络探索新合金成分等) 、 范式转移预警(监控跨领域知识流、 • 1. DeepSeek 赋能酒企场 景 - 市场分析与消费者洞察 - 智能营销与个性化推荐 - 生产优化与质量控制 - 供应链管理与库存优化 - 品牌故事与文化传播 - 智能客服与消费者互动 - 新品研发与口味预测 - 施工进度管理与优化 - 材料采购与供应链优化 - 客户需求分析与个性化服务 - 智能客服与售后支持 - 装修质量检测与问题预测 - 市场趋势分析与营销策略优化 DeepSeek 治疗效果预测与优化 - 智能营销与个性化推荐 - 健康数据管理与分析 - 医美产品设计与优化 - 合规管理与报告生成 • 5. DeepSeek 赋能跨境贸 易 - 市场分析与需求预测 - 供应链优化与物流管理 - 跨境支付与汇率风险管理 - 合规管理与海关申报 - 多语言客户服务与沟通 - 贸易伙伴匹配与谈判支持 - 风险管理与信用评估 - 跨境电商营销与推广 谢 谢! 2025.2.1510 积分 | 79 页 | 6.52 MB | 10 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025Loss 小 ) ■ 数据集:数据集越大 (x 轴 ), 模型效果越好 ■ 模型参数:参数越多 (x 轴 ), 模型效果越好 算 力 L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖 数据集 模型参数量10 积分 | 23 页 | 7.53 MB | 10 月前3
从智慧教育到智慧课堂:理论、规范与实践无处不在 的开放、 按需学习 基于大数 据的科学 分析与评 价 绿色高效 的教育管 理 技 术 特 征 情景感知 无缝连接 可视化 按需推送 智慧 教育 核心 特征 全向交互 智能管控 12 情境感知 情境感知是智慧教育最基础的功能特征,依据情 境感知数据自适应地为用户提供推送式服务。 13 内在 个人学习状态感知内容 外在学习环境感知内容 感知学习者的专业知识背景; 联接社群 学习者的多个学习终 端之间实现数据同步、 无缝切换,学习过程 实现无缝迁移 具体 体现 16 全向交 互 • 自然交互 • 深度互动 • 过程记录 17 智能管 控 教育环境、资源、管理与服务的智能管理是智慧教 育的核心特征。 智能控制 智能诊断 智能分析 智能调节 智能调度 18 按需推 送 智能教育要达成“人人教、人人学”的美好愿望,教育 智慧技术创新应用 21 物联网 大数据 云计算 泛在网络 ① ② ③ ④ 23 物联网 创 新 学生体质健康 监测 学习情境数 据采集 拓展课外教 学活动 教育安全监 控与危机快 速处理 教学设备管 理 05/06/2025 大数据 大数据技术 25 大数据 创 新 教育舆情监测与剖析 教育信息化与现代化发展水平评估 教育机构布局与教育经费调整 学生的发展性评价10 积分 | 74 页 | 10.39 MB | 10 月前3
共 8 条
- 1
