积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(8)技术工具(8)

语言

全部中文(简体)(8)

格式

全部PPT文档 PPT(5)PDF文档 PDF(3)
 
本次搜索耗时 0.037 秒,为您找到相关结果约 8 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    Scaling-Law ? ➢ 随着模型尺寸逐渐增大,预训练阶段参数 Scaling Up 带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 环境中进行探索 ➢ 类比:初学者在没有老师指导的情况下,通过不断的尝试和错误来掌握一门新的技能。 ➢ 这种自主学习的方式,不仅节省了大量的标注成本; ➢ 更重要的是,它让模型能够自由地探索解决问题的路径,而不是被预先设定的模式所束缚。 12 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示 ➢ 跳过SFT阶段,直接运用纯强 界,也有一些 工作利用小模型复现 Aha Moment 得益于大规模RL和高质量推理数据); ➢ 大规模强化学习加持:GRPO 对于强化学习训练的优化; ➢ 规则化奖励:绕过奖励攻陷问题,但是得益于推理问题可以进行自动化标记和验证 (Self-Automated Verification and Annotation),这是与一般聊天和写作请求任务不同的; 13 DeepSeek-R1 技术剖析:DeepSeek-R1
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    “计算机之父”和“人工智能之父”艾伦 · 图灵( Alan M. Turing ) 发表了论文《计算机器与智能》 ,这篇论文被誉 为人工智能科学的开山之作。 在论文的开篇 , 图灵提出了一个引人深思的问题: “机器能思考吗? ”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 更细微的模式和规律 ,具有更强的泛化能力和表达能力 学习能力强 大模型可以从大量的数据中学习, 并利用学到的知识和模式来提供 更精准的答案和预测 。这使得它 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 程 3.2 大模型的发展历 程 大模型发展对算力的需求演变
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    颠覆性定义:人人都能用的认知引擎 DeepSeek(深度求索)是中国首个全栈开源的大语言模型,由杭州深度求索人工智能 公司研发,定位为“认知智能引擎”。简单来说,它是一个能像人类一样思考、学习和解 决问题的超级 AI 工具。 核心能力: ⚫ 复杂推理:像学霸解数学题一样处理逻辑难题(R1 模型) ⚫ 多模态融合:能理解文字、图片、文件等多种信息(未来还将支持语音和视频) ⚫ 3-4 万字的长文档(64Ktoken 容量) 技术架构: ⚫ MLA 多头潜在注意力:像多线程处理信息,显存占用降低 50%,适合普通电脑运 行 ⚫ MoE 混合专家系统:遇到问题自动召唤“专业团队”,比如数学题找数学专家模 块,写诗找创意模块 ⚫ 强化学习驱动:通过“试错+奖励”机制自我进化,类似游戏 AI 自学通关 2.划时代意义:中国 AI 的破局之战 ⚫ 知识管家:自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译:支持 42 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 R1 版本 模块 2:深度思考(R1)——决策智囊团 技术突破: ⚫ 思维链可视化:像老师写板书一样展示推理步骤(如解方程时先分解条件再推 导) ⚫ 反事实推演:模拟“如果特斯拉降价
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    生产资 源,提高资源利用率,确保生产线始终保持在最佳工 作状态,提高生产效率。 在生产过程监控和优化方面,AI 算法通过分析生产 线上的各种运行状态反馈数据和工艺参数,能够预 测及发现潜在问题,并自动调整参数,优化产线运 行状态。 • 生产安全管理:通过智能视频分析技术分析从生产现 场采集的视频,进行行为识别与违规监测,如自动识 别生产线上的工人是否穿了防护服、佩戴安全帽,是 汽车数字模型,并能对模型进行风格调整、零部件编辑及颜色更换等操作。这能 使原本需要 1-2 年的设计周期大幅缩短。 车身表面的涂漆质量是衡量整车品质的重要指标之一,它不仅关系到车辆的美观性,更事关车辆的防腐性、耐久性 等问题。漆面喷涂环节工艺繁多复杂,易出现颗粒、缩孔、焊渣、脏污等各类缺陷,进而影响整车外观甚至漆面的 耐久性。 传统的人工漆面缺陷检测方法,受检测人员自身状态及长时间工作易疲劳等因素的影响,无法精确检出各类缺陷, 度一般要求达到 10μm,检测节拍根据盖板尺寸大小通常在 6 秒到 1 秒/件之间,甚至更快。 传统的人眼检测,不但无法达到微小缺陷的检测精度要求,而且人眼容易疲劳,存在效率低、误检漏检偏高等问题, 无法满足生产的精度和节拍要求。将深度学习算法与高精度成像系统相结合,更快速地识别出产品图像中的缺陷及 种类,满足生产线对检测精度和速度的要求。 锂电池的质量直接关乎电动车的安全性,因此锂电
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    式 ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) ■ 可行性分析:资金没问题,尤其优质生产力领域 2, 购买最新 GPU ■ 可行性分析:美国可以发禁令 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 国内人工智能的发展模式、可行性分析 美国限制中国 AI 发展的策略 Y ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) 可行性分析:资金没问题,尤其优质生产力领域 ■ 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 2, 购买最新 GPU 可行性分析:美国可以发禁令
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    图像、 音频、 视频、 代 码、传感器数据统一语义) 和动态数据治理(解决数据缺失、 噪音干扰、 概念飘逸等) , 支持 200 多 种数据格式自动解析。 • 2. 中级能力层 领域问题建模与复杂推理 ,包括领域自适应学习(建立医、 教育、 金融垂直应用于 模型) 、 因果推理引擎(建立因果图模型) 和多目标优化决策(求解帕 累托最有解) 。 • 3. 高级能力层 - 品牌故事与文化传播 - 智能客服与消费者互动 - 新品研发与口味预测 - 施工进度管理与优化 - 材料采购与供应链优化 - 客户需求分析与个性化服务 - 智能客服与售后支持 - 装修质量检测与问题预测 - 市场趋势分析与营销策略优化 DeepSeek 赋能各行业的应用场 景 • 2. DeepSeek 赋能房产装 修 - 智能设计与方案生成 ( VR ) 与增强现实 ( AR ) -
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    DeepSeek R1: 在 Reasoning 任务达到了世界水平( OpenAI- o1 ) 以 2 阶段 SFT+2 阶段 RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 以 DeepSeek-V3 — 分析报告 差异三:基础能力差异导致支持完备度不同 基础库、加速库、三方库等支持情况不同 跨架构时需通过引入、适配第三方库,或者开 发基于自身架构的对等库来解决库的差异问题 计算架构 支持的主要基础库 / 加速库 昇腾 DVPP/AIPP/mxVision/ ACLNN/ACLBlas 等 英伟达 Codec SDK/CV-CUDA/ cuDNN/cuBlas/DALI
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    基本可以放弃桌面端的支持需求。  提高可靠性、利用性和产出。  有能力运行最新的应用  控制、安全、集中放置。  当出现错误时可以无缝连接到空闲设备上;  教育者不必在纠结于技术问题 集中式架构 为在客户端和服务器之间提供 高速网络接入服务 集成性门户为实体接入应用和 内容提供了可能 虚拟桌面服务 学生、教师和职员 公共架构 IBM 公有云 旧的桌面服务
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
共 8 条
  • 1
前往
页
相关搜索词
2025DeepSeekR1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研AI跃迁基础完全指南英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版浙江大学浙江大学优势算力成本角度山东东大山东大学应用部署华为解决方案解决方案智慧教育课堂理论规范实践
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩