积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(7)技术工具(7)

语言

全部中文(简体)(7)

格式

全部PPT文档 PPT(5)PDF文档 PDF(2)
 
本次搜索耗时 0.014 秒,为您找到相关结果约 7 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    DeepSeek-V3 是一款 MoE 模型,总参数量 671B ,激活参数量 37B ,采用 2048 张 H800 (节点内 NVLink ,节点间 IB ,非超节点架构) 在 14.8T token 数据集上基 于自 研 HAI-LLM 训练系统总计训练了 1394h ( 58.08 天) 性能优 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 每 token 的 KV Cache 量大幅减少,且精度更高。 DeepSeekV3 模型架构: Multi-Head Latent Attention ( MLA ) 1. 推理阶段,理论上可以将 KV Cache 降低 1~2 个数量级,大幅减少 HBM 存取和通信的开销。 2. 对昇腾更亲和,大幅降低对 HBM 依赖,提升推理 Decode 性能。 MLA 架构 昇腾 影响 device 上开始流水 ③ 每卡显存占用略微增大 DualPipe :双流并行优化计算和通信, All-to-All 通信开销接近 0 • 双向管道训练 ,需要存两份参数来进行训练( Parameter 2x ) • 模型总参数量 671B ,每个卡上 4 个 routed expert 对应 26.8B , 同时 考虑到 PP-16 和 FP8 量化 ,每个卡上显存占用为 1
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    可视化是信息时代数据处理与显示的必然趋势,是 智慧教育观摩、巡视、监控的必备功能,是智慧教 育系统的重要特征。 • 可视化监控 • 可视化呈现 • 可视化操作 智慧技术创新应用 21 物联网 大数据 云计算 泛在网络 ① ② ③ ④ 23 物联网 创 新 学生体质健康 监测 学习情境数 据采集 拓展课外教 学活动 教育安全监 控与危机快 速处理 教学设备管 理 05/06/2025 学生的发展性评价 基于大数据的科学研究 26 云计算 • 云计算中的“云”主要用来强调计算泛 在性和分布性,实质上是分布式计算、 并行计算和网格计算等技术的发展。 • 将分布在各地的服务器群进行网联, 能够实现大规模计算能力、海量数据 处理和信息服务的需求。 27 云计算 创 新 • 学生通过电子书包 等终端随时随地享 受云端的各种学习 服务 云学习环境 • 保证学习数据的永 不丢失,为学习分 交互性 智能化 网络化 虚拟化 未来教室 案例:南方科技大学附属实验学校 信息化应用环境建设 自带设备学习 ( BYOD ) 新技术全学科运用 我们以云计算为基础,在语文、数学、英语、音乐、美术、科学等 学科中开展基于移动终端的云学习,并借助无线互联网和智能移动 终端,进行教学创新,以期探索出具有南方科技大学实验学校特质 的信息化教与学模式。 配备 PAD 移动终端(板书、分 享、评价、展示)
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    Distill - Llama - 70B 等 ,在推理能力上表现出色。 • 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 , 部分限时免费 ,涵盖文本生成等功能。 • 百度智能云: 千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用 ≈ 0.6 个 token 。 • 但因为不同模型的分词不同 , 所以换算比例也存在差异 , 每一次实际处 理 token 数量以模型返回为准 ,您可以从返回结果的 usage 中查看。 阿里云部署 Deepseek 以 DeepSeek-R1 满血版为例进行演示 ,通过百炼模型服务进行 DeepSeek 开源模型调用 ,可以 根 据实际需求选择其他参数规模的 DeepSeek 模型。百炼平台的 Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下 DeepSeek - R1 蒸馏模型。 • 云原生构建:登录腾讯云 ,云原生构建相关服务 ,一键体验 DeepSeek ,无需等待下载 ,支持
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    技术从专用化迈向 了通用化。AI 技术正在步入工业领域的千行百业,帮助企业实现从传统的劳动密集型、资源密集型企 业,向技术密集型、知识密集型的高端化、智能化、绿色化方向转型升级,打造依托于人工智能、大 数据、云计算等现代信息技术的新质生产力。 工业 AI 和大模型的应用,已经渗透到工业生产的产品设计、企业流程管理规划、智能化生产、设备预 测性维护、供应链优化、创新服务、绿色制造、智能客服等众多环节,它通过处理和分析海量工业数 设备管理: 在设备入库管理方面,AI 通过深度学习识别设备上的 条形码、二维码或设备特征,自动读取设备信息如型 号、序列号等;AI 的自然语言处理功能,可以自动 提取设备手册或标签上的文字信息,获取设备规格、 性能指标等关键参数。这些都能显著提升设备入库管 理的效率和准确性。 在设备运维管理方面,利用机器学习算法,对部署在 设备上的温度、压力、振动等各种传感器给出的监测 数据进行处理分析,实时监控设备运行状态,并可通 尾落地。另外,从工程层面来讲,工 业大模型的开发成本及维护成本,低于工业专用小模型。 1.3.2 工业大模型 07 01 工业人工智能 (AI) 行业观察 汽车制造作为制造业皇冠上的明珠,也是 AI 技术落地应用的重要领域。目前,AI 技术已经渗透到汽车制造中繁多复杂的生 产流程中,从汽车零部件的质量检测、到生产物流运输、装配生产线的自动化、再到整车质量检测等众多环节,AI 技术的
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    研究方法和应用场景展开。 与会者们深入探讨了人工智能的基本概念、 算法和技术, 以及其在各个领域的应用潜力。 他们共同认识到 ,人工智能的研究和发展将为人类带来巨大的变革和进步 1.2 人工智能的诞 生 在这次会议上 , “人工智能”这个词汇被约翰 . 麦卡锡( John McCarthy ) 首次提出。 与会者们不仅对人工智能的研究和应 用 前景进行了深入探讨 ,还提出了许多重要的观点和思路 ,为人工智能的发展奠定了基础。 Nat u ral La ng uage Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义和语境规则 。 代表性产品包括 GPT 系列 ( OpenA I ) 、 Bard ( Google ) 、 DeepSeek 、文心一言 (百度)等 合 了 NLP 和 CV 的能力, 以实现对多模态信息 的综合 理解和分析,从而能够更全面地理解和 处理复杂 的数据 。代表性产品包括 DingoDB 多模向量数据 库(九章云极 DataCanvas ) 、 DALL-E(OpenAI) 、 悟空画画(华 为) 、 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    Watson,IBM 创始人, 1943 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 大型机时代 1940- 1980 计算机算力的发展 大型机时代 PC 时 代 云计算时代 人工智能时代 1940- 1980- 2000- 2020 ■ 大型机时代:数字化未开始,算力需求潜力未发掘 ■ PC 时代:一个应用只需一台电脑,算力够 ■ 云计算时代:应用需要超过一台机器的算力,算力基本够 ■ 人工智能时代:算力开始不足,需大量高性能 Al 加速器 计算机算力的发展 人工智能大模型算力估计 ■ 人工智能大模型算力估计 ■ 1, 数据量 反斜面坑道 ( 战术穿插 ) 范弗利特弹药量 ( 地毯轰 炸 ) 大资金、大算力、大模型 “ 大模型” 》 上 甘 岭 ” 国 际 国 内 发布时间 G P U 时 ( 小 时 ) 训练成本 ( 美元 ) Llama 3.1 2024 年 7 月 3.1*107 6.2*107 DeepSeek
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 Deepseek R1在AIME2024上获得了79.8%的成绩,略高于OpenAI-o1-1217。在MATH-500上,获得97.3% 的惊人成绩,表现与OpenAI-o1-1217相当。 ➢ 在编码相关的任务中表现出专家水平,在 Codeforces上获得了2029 Elo评级,在竞赛中表现 优于96.3%的人类参与者 ➢ DeepSeek-R1 在知识类问答上推动科学探索边界: ➢ MMLU 等 STEM- related 榜单上取得良好表现 ➢ R1 展现出强推理模型在 AI-Driven Research 的潜力 ➢ 在长文本依赖任务如 FRAMEs 和 事实性推断任务 Simple-QA上表现突出 5 回顾:Pre-Training Scaling Law ➢ Pre-Training Scaling Laws: 预训练模型上广泛观察到的现象,协调了计算量C、模 型参数量N和数据大小D之间的关系
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
共 7 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案智慧教育课堂理论规范实践山东东大大学山东大学应用部署英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版模型赋能高校教学科研浙江浙江大学优势算力成本角度解读R1Kimi1.5及类推理推理模型开发报告
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩