集控链 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

DeepSeek-V3 是一款 MoE 模型，总参数量 671B ，激活参数量 37B ，采用 2048 张 H800 （节点内 NVLink ，节点间 IB ，非超节点架构）在 14.8T token 数据集上基于自研 HAI-LLM 训练系统总计训练了 1394h （ 58.08 天）性能优数学、科学和代码等领域领先业界，成为业界公认的 LLM 的领先模型来源： DeepSeek 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA ：空间压缩术训练框架加速： 16 到 3 的量化压缩，通信降低 89% 推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质降本技术创新硬件级、算法级、架构级、工程级、开源生态 5 大技术创新，轰动全球 .. 应用使能应用使能套件 / SDK AI 计算框架 PyTorch / TensorFlow / Caffe...... NV 系列硬件模组 / 加速卡 / 服务器 / --> 集群 NV 处理器 Ampere 系列 / Hopper 系列 ... 英伟达 AI 基础软硬件架构 ModelArts 应用使能训练平台 / 推理引擎 / 模型套件 /

0 积分 | 32 页 | 2.52 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

化方向转型升级，打造依托于人工智能、大数据、云计算等现代信息技术的新质生产力。工业 AI 和大模型的应用，已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预测性维护、供应链优化、创新服务、绿色制造、智能客服等众多环节，它通过处理和分析海量工业数据，帮助企业在上述各个环节中做出最优的智能化决策，从而在多个环节全方位实现提质、增效、降本，增强竞争力。在日趋激烈的 ....................................................................................47 3.2 美的楼宇科技美控：楼宇 AI 节能解决方案 ............................................................................49 3.3 利珀：晶硅电池隐裂检测产品拟产品的各种实际应用场景，如正常操作、极限性能、潜在故障等，预测产品性能表现，进一步指导设计改进。 1.2 工业 AI 的应用范畴 04 01 工业人工智能 (AI) 行业观察生产过程管控在生产过程管控方面，AI 技术的应用主要集中在提高生产效率、优化资源配置、增强质量控制和实现生产过程的自动化与智能化。具体包括： • 设备管理：在设备入库管理方面，AI 通过深度学习识别设备上的

0 积分 | 82 页 | 5.13 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

R1的出现再次证明了强化学习的潜力所在： ➢ R1-Zero 从基础模型开始构建，完全依赖强化学习，而不使用人类专家标注的监督微调（SFT）； ➢ 随着训练步骤增加，模型逐渐展现出长文本推理及长链推理能力； ➢ 随着推理路径增长，模型表现出自我修复和启发式搜索的能力； 4 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ 得益于强大的推理能力与长文本思考能力，DeepSeek 标注的数据来让模型初步掌握某种能力（如对话或者语言风格），然后再用RL来进一步优化性能 ➢ DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 ➢ 无需构建和维护高质量的SFT数据集，而是让模型直接在RL环境中进行探索 ➢ 类比：初学者在没有老师指导的情况下，通过不断的尝试和错误来掌握一门新的技能。 ➢ 这种自主学习的方式，不仅节省了大量的标注成本； ➢ 更重要的是，它让模 Questions: ➢ 能否在Zero基础上兼顾推理性能的同时，提升模型的帮助性和安全性？例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1； ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero

10 积分 | 76 页 | 8.39 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

月阿里推出的 M6 模型的参数量达 10 万亿。 3.1 大模型的概念训练数据量大计算资源需求高参数数量庞大大模型的设计和训练旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。大模型通常能够学习到更细微的模式和规律，具有更强的泛化能力和表达能力学习能力强大模型可以从大量的数据中学习，并利用学到的知识和模式来提供更精准的答案和预测。这使得它 OpenAI 定义推理模型在 OpenAI 的官网上， OpenAI 定义推理模型是在回答之前进行思考，并在回复用户之前，在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前，先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来跨语言翻译）、问答系统（能够回答用户提出的问题）、情感分析（用于判断文本中的情感倾向）、语言生成（如聊天机器人）等大模型的应用领域非常广泛，涵盖了自然语言处理、计算机视觉、语音识别、推荐系统、医疗健康、金融风控、工业制造、生物信息学、自动驾驶、气候研究等多个领域 3.7 大模型的应用领域（ 4 ）推荐系统大模型可以用于个性化推荐、广告推荐等任务。通过分析用户的历史行为和兴趣偏好，大模型可以为用户提供个性化的推荐服务

10 积分 | 123 页 | 15.88 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

“quietquitting”）局限：复杂逻辑问题需升级至 R1 版本模块 2：深度思考（R1）——决策智囊团技术突破： ⚫ 思维链可视化：像老师写板书一样展示推理步骤（如解方程时先分解条件再推导） ⚫ 反事实推演：模拟“如果特斯拉降价 10%”对产业链的 6 级影响实战场景： ⚫ 医疗诊断：输入症状自动关联相似病例，生成检查建议（需医生复核） ⚫ 投资分析：对比财报数据→预测企业风险→生成可视化报告商业分析：“假设你是麦肯锡顾问，分析新能源汽车充电桩市场的三大风险点，用 SWOT 框架呈现” ⚫ 创意写作：“用鲁迅杂文风格，写一篇讽刺 AI 过度依赖现象的短文，结尾需反转升华” ③思维链可视化指令设计：要求展示推理过程（如“先分解条件再推导”）应用场景： ⚫ -解数学题时自动展示公式推导步骤 ⚫ -分析商业案例时生成因果逻辑图 2.行业专用模板：拿来即用的生产力工具 GPT-4 生成问卷文案，最后用 Claude 整理数据图表” 效率提升：全流程时间缩短 70% ③批判性训练 ⚫ 逆向推演：“假设我的奶茶店三个月后倒闭，请逆向分析失败原因链” ⚫ 跨界迁移：“参考迪士尼排队管理策略，优化咖啡店高峰时段服务流程” 5.官方推荐模板（简化版） 1.代码优化： “下面这段 Python 代码运行缓慢，请解释问题并提供两种优化方案”

10 积分 | 21 页 | 1.01 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

高级能力层复杂系统建模与自主决策，包括数字孪生仿真系统（构建物理于数字融合虚拟环境模拟天气等）、多智能体协同优化（将每个个体作为智能体通过联邦学习模拟群体行为）和元认知调控机制（实施监控自身决策、动态分配资源、自动触发行为）。 • 4. 终极能力层自主进化与创造性突破，包括概念空间探索（通过对抗网络探索新合金成分等）、范式转移预警（监控跨领域知识流、 • 1. DeepSeek 赋能酒企场景 - 市场分析与消费者洞察 - 智能营销与个性化推荐 - 生产优化与质量控制 - 供应链管理与库存优化 - 品牌故事与文化传播 - 智能客服与消费者互动 - 新品研发与口味预测 - 施工进度管理与优化 - 材料采购与供应链优化 - 客户需求分析与个性化服务 - 智能客服与售后支持 - 装修质量检测与问题预测 - 市场趋势分析与营销策略优化 DeepSeek 治疗效果预测与优化 - 智能营销与个性化推荐 - 健康数据管理与分析 - 医美产品设计与优化 - 合规管理与报告生成 • 5. DeepSeek 赋能跨境贸易 - 市场分析与需求预测 - 供应链优化与物流管理 - 跨境支付与汇率风险管理 - 合规管理与海关申报 - 多语言客户服务与沟通 - 贸易伙伴匹配与谈判支持 - 风险管理与信用评估 - 跨境电商营销与推广谢谢！ 2025.2.15

10 积分 | 79 页 | 6.52 MB | 1 年前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

Loss 小 ) ■ 数据集：数据集越大 (x 轴 ), 模型效果越好 ■ 模型参数：参数越多 (x 轴 ), 模型效果越好算力 L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖数据集模型参数量

10 积分 | 23 页 | 7.53 MB | 1 年前
3
从智慧教育到智慧课堂：理论、规范与实践

无处不在的开放、按需学习基于大数据的科学分析与评价绿色高效的教育管理技术特征情景感知无缝连接可视化按需推送智慧教育核心特征全向交互智能管控 12 情境感知情境感知是智慧教育最基础的功能特征，依据情境感知数据自适应地为用户提供推送式服务。 13 内在个人学习状态感知内容外在学习环境感知内容 感知学习者的专业知识背景；联接社群学习者的多个学习终端之间实现数据同步、无缝切换，学习过程实现无缝迁移具体体现 16 全向交互 • 自然交互 • 深度互动 • 过程记录 17 智能管控教育环境、资源、管理与服务的智能管理是智慧教育的核心特征。 智能控制 智能诊断 智能分析 智能调节 智能调度 18 按需推送智能教育要达成“人人教、人人学”的美好愿望，教育智慧技术创新应用 21 物联网大数据云计算泛在网络 ① ② ③ ④ 23 物联网创新学生体质健康监测学习情境数据采集拓展课外教学活动教育安全监控与危机快速处理教学设备管理 05/06/2025 大数据大数据技术 25 大数据创新教育舆情监测与剖析教育信息化与现代化发展水平评估教育机构布局与教育经费调整学生的发展性评价

10 积分 | 74 页 | 10.39 MB | 1 年前
3

共 8 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

英特尔-工业人工智能白皮书2025年版

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek大模型赋能高校教学和科研2025

AI跃迁派：2025年DeepSeek零基础完全指南

山东大学：DeepSeek 应用与部署

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

从智慧教育到智慧课堂：理论、规范与实践