积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(7)技术工具(7)

语言

全部中文(简体)(7)

格式

全部PPT文档 PPT(4)PDF文档 PDF(3)
 
本次搜索耗时 0.014 秒,为您找到相关结果约 7 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: CUDA 互联技术: NV Link AI 芯片: NV 、 AMD • DS 对强化学习的创新使用, 可以让大模型便捷的获 得 通用性 + 专用性, 可以满足各应用场景需求 重新思考中美技术路线的选择 泛化性和经济性大幅提升 LLM 进入“ CV Resnet 时刻” 补齐最后一块自主创新的版图 真正形成中美两条 AI 技术路 线 AI 框架:昇思、飞桨 … 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级,模型能力 = 算力 x 数据 x 思考 构 模 型 2023 ChatGPT 模型能力突破 开启 NLP 时代 2012 AlexNet 模型能力突破 开启 CV 时代 1998 LeNet 首个 CNN 架构模型 2025 DeepSeek 效率与成本双突破 NLP 全面普及 2015 Resnet 效率与成本双突破 CV 全面普及 AI 模型算法: DeepSeek 国家战略清晰
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    ....................................................................29 2.2.1 英特尔® oneAPI 工具包 — 跨架构性能加速 .................................................................................29 2.2.2 OpenVINO™ 展开来讲,大模型技术有以下几项基本特征: 1. 普遍基于 Transformer 架构。Transformer 架构通过引入自注意力 (Self-Attention) 机制,在处理序列数据时,能同时 关注输入序列的所有元素,并直接建立任意两个元素之间的联系,从而捕捉序列中的长距离依赖关系,实现对输入序列的 高效处理和理解。由于不依赖序列顺序,Transformer 架构在模型训练和推理时的并行处理能力更强,效率更高。 2 化能力, 能够有效处理多种从未见过的数据或新任务,甚至能处理一些与训练数据截然不同的任务。这使得大模型能应用于多种任 务和场景,具有广泛的适用性。 4. 灵活性和可定制性。大模型通常具有灵活的架构和可定制的参数,可以根据特定需求对通用大模型进行定制和优化。通过 微调 (Fine-tuning) 技术,预训练的大模型可以快速适应新的任务和数据集,而无需从头开始训练。此外,还可以通过添 加新
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    对于新的桌面体验来讲,用户需要最小的适 应性。  虚拟桌面架构  通过分享应用环境,每个刀片 支持 50-100 个用户  需要用户适应新的桌面体验  终端服务  基于 1:1 理念,每位学习者拥有一台 PC 或者服务器  桌面超薄式设备  流操作形态和应用 Linux 或者 Windows 虚拟桌面架构 e: 用户可以拥有操作系统 低成本的弱功能客户机 Windows 终端服务:  按比例具有低成本优势  用户分享式操作系统  用户不具有管理者权限  低成本的弱功能客户机 Windows 流提供如下功能:  图形和视频优化  低能源服务器架构  需要功能强大弱功能客户机 智慧课堂: IBM 桌面虚拟化的三种实体模型 刀片或传统 Servers 智慧课堂:基于云计算的虚拟计算 WFU NCA&T OC12 (622 Mbps 有能力运行最新的应用  控制、安全、集中放置。  当出现错误时可以无缝连接到空闲设备上;  教育者不必在纠结于技术问题 集中式架构 为在客户端和服务器之间提供 高速网络接入服务 集成性门户为实体接入应用和 内容提供了可能 虚拟桌面服务 学生、教师和职员 公共架构 IBM 公有云 旧的桌面服务 开放教育资源 来自与 IBM 和其他服务商的的 网络服务能够提供协作和生产 效率
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    2018 — 2024 DeepSeek 介 绍 DeepSeek : 2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek : 技术创新—模型架构 | V3 PPO : Proximal Policy Optimization GRPO : Group Relative Policy ,用于构建可扩展且生 产就绪的 RAG 应用程序 ,适合企业大规模 AI 应用。 • 3. LLMWare :官网: https://llmware.ai/ • 功能:提供统一框架构建基于 LLM 的应用 ,如 RAG 和代理, 包含 RAG Pipeline 和 50 + 小型专用模型 ,适用于定制特定 领 域解决方案。 • 4. LangChain :官网: https://www
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    如果你面临创意写作、 文本生成、 意图识别等发散性较强且较为创意多样的任务 ,请选择通用大模 型 3.4 大模型的分 类 大模型是基于 Transformer 架构的 ,这种架构是一种专门用于自然语言处理的“编码 - 解码器”架构。 在训练过程中 ,大模 型将输入的单词以向量的形式传递给神经网络 ,然后通过网络的编码解码以及自注意力机制 ,建立起每个单词之间联系的 权 重。大模型的核心能力 主流大模型“幻觉”评 测 3.6 大模型产 品 厦门大学大数据教学团队作品 n ChatGPT ChatGPT 是一种由 OpenAI 训练的大语言模型。 它是基于 Transformer 架构 ,经过大量文本数据训练而成 ,能够生成自 然、 流畅的语言 ,并具备回答问题、 生成文本、 语言翻译等多种功能 ChatGPT 的应用范围广泛 , 可以用于客服、 问答系统、 对话生成、 文本生成等领域。 语言风格和文化背景 n Gemini Gemini 是谷歌发布的大模型 , 它能够同时处理多种类型的数据和任务 , 覆盖文本、 图像、 音频、 视频等多个领域。 Gemini 采用了全新的架构 ,将多模态编码器和多模态解码器两个主要组件结合在一起 , 以提供最佳结果 Gemini 包括三种不同规模的模型: Gemini Ultra 、 Gemini Pro 和 Gemini Nano ,
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    大规模RL起到了激活和发掘预训练阶段积累的知识和推理能力的作用 ➢ DeepSeek-V3 低成本(5,576,000美元 )带来惊艳效果 ➢ MoE 架构 671B 激活37B \ 使用 Multi-head Latent Attention (MLA) 架构 ➢ 2048张 H800 计算: ~54天 21 DeepSeek-R1 技术剖析:RL 加持下的 Length 泛化&推理范式涌现 ➢ 大 Expert) + 256 路由专家(Routed Expert) 每个Token 激活 8 个路由专家 ➢ DeepSeek-V3 模型架构: MLA (Multi-head Latent Attention) + MoE (Mixture of Expert) 架构 ➢ MLA:通过引入潜在空间来提高计算效率,同时保持了模型对输入数据的复杂关系的捕捉能力 ➢ MoE: 注于通过高效的专家分配和计算资源利用来降低成本
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    复杂推理:像学霸解数学题一样处理逻辑难题(R1 模型) ⚫ 多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频) ⚫ 超长上下文:一口气读完 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 忽略背景 错误:“推荐旅游城市”→可能推荐南极科考站 修正:“预算 5000 元/3 天/亲子游,推荐 5 个国内城市并说明交通和住宿方案” 4.专业术语滥用 错误:“用 MoE 架构优化输出”→普通人难以理解 修正:“让不同专家模块共同解决这个问题” 5.过度依赖 错误:直接使用 AI 生成的医学诊断建议 修正:要求“提供相似病例和检查建议,需医生复核”
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
共 7 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版智慧教育课堂理论规范实践山东东大大学山东大学应用部署模型赋能高校教学科研R1Kimi1.5及类推理推理模型开发解读报告AI跃迁基础完全指南
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩