积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(16)人工智能(16)

语言

全部中文(简体)(16)

格式

全部PDF文档 PDF(14)PPT文档 PPT(2)
 
本次搜索耗时 0.027 秒,为您找到相关结果约 16 个.
  • 全部
  • 研究报告
  • 人工智能
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调( SFT ); 随着训练步骤增加,模型逐渐展现出长文本推理及长链推理能力; 随着推理路径增长,模型表现出自我修复和启发式搜索的能力; DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 Compute Optimallycan be More Effective than Scaling Model Parameters Laws [1] 。 DeepSeek-R1 Zero: 无需监督微调 SFT ,纯强化学习驱动的强推理模型 DeepSeek-R1 技术剖析: DeepSeek-R1 Zero model 需要大量的计算资源,可能会复杂化整个流程 训练模板: 选择最简单的 Thinking Process , 直接观察到最直接的 RL 过程下的表现 DeepSeek-R1 Zero: 无需监督微调 SFT ,纯强化学习驱动的强推理模型 DeepSeek-R1 技术剖析: DeepSeek-R1 Zero
    10 积分 | 76 页 | 6.72 MB | 5 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    模型层开源创新推动上层商业化实践 降本增效推动大模型落地,选择微调、蒸馏或RAG等路径达到ROI最大化 来源:艾瑞咨询研究院自主研究绘制。 2024年,“后训练”和“强化学习”成为大模型技术创新的热点。后训练通常由大模型厂商在预训练模型基础上完成,其流程一般包括: 监督微调(SFT),即利用特定任务的标注数据对模型进行微调,使其学习任务模式;奖励模型(RM)训练,通过收集人类反馈数据训练 成本、高性能的开源模型(如DeepSeek、阿里QwQ系列)极大推动了大模型的商业化实践,吸引更多需求方拥抱大模型能力底座,并进 一步采用微调、蒸馏、RAG工程等方式完成定向优化和应用部署。 预训练大模型能力落地实践路径 数据处理 后训练/ 增量预训练 微调 模型部署 蒸馏 RAG 在预训练大模型基 础上有后训练或者 微调/精调的进一步 需求,则需要更多 数据(公开数据集、 企业内部数据等) 来进行模型调整。 数据集的结构、质 等都是以基模为基 础进行后训练得到。 数据预处理 增量预训练 后训练 监督微调SFT、强化 学习RL、RLHF、偏 好优化对齐等 注入领域知识,优 化特定任务或领域 基于预训练模型,通 过少量特定数据集对 模型进行进一步训练。 参数全 面微调 参数高 效微调 针对所有层 的所有参数 进行微调 针对部分 层的参数 进行微调 Adapter Tuning LoRA、QLoRA Prompt
    0 积分 | 51 页 | 3.35 MB | 5 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    模型层开源创新推动上层商业化实践 降本增效推动大模型落地,选择微调、蒸馏或RAG等路径达到ROI最大化 来源:艾瑞咨询研究院自主研究绘制。 2024年,“后训练”和“强化学习”成为大模型技术创新的热点。后训练通常由大模型厂商在预训练模型基础上完成,其流程一般包括: 监督微调(SFT),即利用特定任务的标注数据对模型进行微调,使其学习任务模式;奖励模型(RM)训练,通过收集人类反馈数据训练 成本、高性能的开源模型(如DeepSeek、阿里QwQ系列)极大推动了大模型的商业化实践,吸引更多需求方拥抱大模型能力底座,并进 一步采用微调、蒸馏、RAG工程等方式完成定向优化和应用部署。 预训练大模型能力落地实践路径 数据处理 后训练/ 增量预训练 微调 模型部署 蒸馏 RAG 在预训练大模型基 础上有后训练或者 微调/精调的进一步 需求,则需要更多 数据(公开数据集、 企业内部数据等) 来进行模型调整。 数据集的结构、质 等都是以基模为基 础进行后训练得到。 数据预处理 增量预训练 后训练 监督微调SFT、强化 学习RL、RLHF、偏 好优化对齐等 注入领域知识,优 化特定任务或领域 基于预训练模型,通 过少量特定数据集对 模型进行进一步训练。 参数全 面微调 参数高 效微调 针对所有层 的所有参数 进行微调 针对部分 层的参数 进行微调 Adapter Tuning LoRA、QLoRA Prompt
    10 积分 | 51 页 | 3.35 MB | 6 月前
    3
  • pdf文档 北京大学-DeepSeek原理和落地应用2025

    国产自主研发三大优势,不仅实现技术代际 跨越,更推动AI技术普惠化与国产化生态繁 荣,成为全球大模型赛道的重要领跑者。 核心加分项:开源、低成本、国产化 • 开源:技术共享,生态共建 全量开源训练代码、数据清洗工具及微调框架,开发者可快速构建教育、金融、医 疗等垂直领域应用,推动社区协同创新。 • 低成本:普惠企业级AI应用 做了大量的模型架构优化和系统工程优化。 训练成本仅$557w :显著低于行业同类模型,打破高价壁垒。 DeepSeek-R1促使行业开始从 “唯规模论”转向更加注重 “性价比”和“高效能”方向 01 02 03 打破垄断 价格下调 推动创新 21 21 模型有三种使用方式:在软件系统中调用官方API、模型微调、直接使用。 前 两种涉及到IT技术比较多。这里讲的是直接使用的三种方法,适合普通用户。 DeepSeek直接使用��� 22 DeepSeek官方-开袋即食��� 23 官网: https://chat Generative (生成式) Pre-trained (预训练) Transformer (变换器) LLM:Large Language Model GPT工作原理-2 预训练 (自监督) 监督微调 人类反馈 强化学习 接收输入 处理输入 进行推理 生成输出 上下文 + 训练知识 阶段1:模型训练 阶段2:推理 大模型工作过程 GPT工作原理-3 数据来源 说明 维基百科 在线百科
    10 积分 | 57 页 | 9.65 MB | 5 月前
    3
  • ppt文档 解码DeepSeek构建医药行业新质生产力

    engineering 提⽰词⼯程 Nvidia A100 ( A800 ) ⾼性 能卡 RLHF 强化学习 SFT RDMA 监督微调 解决数据处理的延迟 顶尖的 AI ⼈才 数⼗ TB ⾼质量数据 数万对⾼质量 prompt 理解 Chatgpt, ⼀个 AI 领域的“⼯程奇 多渠道营销 学术化推⼴ • 交叉证据⽹络构建 患者服务 31 ROI 优化 • 明确应⽤场景:不是所有场景需要 AI • 混合部署策略 :“ 该省省, 该花花” • 模型选择和微调:“满⾎ ”虽好, 但所需推 理资源逆天 • ⾼并发处理 使⽤场景与内容风险 • 内容准确性验证: 专业内容需交叉 验证、追溯来源 • 版权意识:避免直接商⽤模型⽣成
    0 积分 | 32 页 | 3.98 MB | 5 月前
    3
  • pdf文档 腾讯云:2025年解码DeepSeek构建医药行业新质生产力报告

    Chatbot: ⽂本交互式应⽤ Gpt3: 预训练⼤模型 Prompt engineering 提⽰词⼯程 RLHF 强化学习 Nvidia A100(A800) ⾼性能卡 SFT 监督微调 RDMA 解决数据处理的延迟 顶尖的AI⼈才 数⼗TB⾼质量数据 数万对⾼质量prompt 增长:破圈,两个⽉到⼀亿⽤户的速度 “创新落后”的机会成本被不断放⼤ 体验: 哎哟 不错噢 低成本,超出⽤户预期的“智能” 内容准确性验证:专业内容需交叉 验证、追溯来源 • 版权意识:避免直接商⽤模型⽣成 的代码、⽂案或设计 使⽤场景与内容风险 • 明确应⽤场景:不是所有场景需要AI • 混合部署策略:v“该省省,该花花” • 模型选择和微调:“满⾎”虽好,但所需推 理资源逆天 • ⾼并发处理 ROI优化 个⼈应⽤ 企业应⽤ • 避免透露公司敏感信息:⽐如内 部⽂件、政策草案、经济数据等 法律风险 虚假信息 32 ⼈⼯智能将如何改变医患互动?
    10 积分 | 32 页 | 14.20 MB | 5 月前
    3
  • pdf文档 中国算力中心行业白皮书

    III. 算力中心供给分析 IV. 算力中心供需研判及未来展望 V. 附录 16 资料来源:灼识咨询 • 当下模型参数量大规模提升,同时影响训练数 据量及训练次数,推动训练阶段算力及对应的 微调阶段算力提升。 • 模型参数量基本确定,随着应用场景、适用 人群数量增加,导致推理数据及模型数量增 多,进而使推理算力需求井喷发展。 训练算力 核心影响因素 模型数量 参数量 训练数据量 算力双重刚需,显著推动智能算力基础设施踏上快速 发展轨道,促使其不断迭代升级、扩容增效,全方位满足人工智能技术蓬勃发展的内在需求。 推理算力 核心影响因素 训练 预训练 二次训练 全参微调 局部微调 算力需求 超大规模 千卡~万卡 大规模 数百卡~千 卡 较小规模 单卡~8卡 起步 小规模 单卡1卡起 步 工程难度 很高 TP/DP/PP并 行,海量数据 高 基模选择、 灵快轻易 推理:将训练好的模型应用于新场景 经过训练的模型参数量 模型数量 应用场景 单用户数量 用户活跃度 应用时间 大模型在不同场景的算力需求及工程难度 算 力 训练阶段 微调阶段 ➢ 训练完的模型参数量也会影响推理端算力 大模型训练 作为驱动人工智能发展的关键生产要素,数据规模多维度影响大模型的性能与应用场景:超大模型追求“能力上 限”,轻量化模型聚焦“应用普适性
    10 积分 | 54 页 | 6.96 MB | 5 月前
    3
  • pdf文档 2025年自动化人工智能报告

    InSilico Medicine,一家制药公司,利用生成式人工智 能在不到30个月的时间内,完成了从药物发现到一期临 床试验的进程,这大约是通常所需时间的一半。 11 他 们使用了一个基于组学和临床数据的模型进行微调,以 识别药物治疗的潜在靶点。为了开发可能的药物组成, 他们使用了一个由500个预测和预训练模型组成的生成 化学引擎。对于Insilico来说,人工智能是他们工作的核 心——塑造围绕它的业务和行业。 比萨公司自己的销售数据来估算潜在需求。代理商回应 称,一些电动汽车网络提供 22 02 技术愿景2025 | 人工智能:自主宣言 您的AI的性格是什么?企业在客户互动中赋予自主性, 但在这样做的同时,对经验的微调不容忽视。个性化的 触摸、独特的声音和个性化是公司建立客户忠诚度和信 任的关键方式——而现在感觉这就是AI所缺乏的。拟人 化的AI可以为体验注入生命,以前所未有的方式解锁客 户关系。随着企业开始构建AI认知数字大脑,它们可以 您的面容,在未来的24小时 现在,在人工智能时代,这种参与度危机面临被加剧的 风险。人工智能模型和数字系统的日益自主性可以创造 巨大的机会,前所未有的规模进行一对一对话的机会。 但如果这些模型只是针对功能进行微调,而不是体验, 它们听起来将显得陈词滥调或平淡无奇,并让所有潜在 的机会无法实现。这不仅仅是在企业渠道上会出现的问 题。展望未来,随着基于生成式人工智能的聊天平台将 自己定位为通往数字世界的主要窗口,这个问题变得更
    10 积分 | 66 页 | 5.50 MB | 5 月前
    3
  • pdf文档 2025年以DeepSeek为代表的AI在能源行业的应用前景预测报告

    融合能源生产、传输、消费等不同环节以及气象、地 理等相关领域的数据,让DeepSeek能从更丰富的维度理解能源问题中的逻辑关系。 。 2、模型优化:利用能源领域的特定数据集对DeepSeek进行微调,针对能源领域的复杂逻辑关系问题,调整模型的参数和结构。将 DeepSeek与其他专门用于处理逻辑关系的模型或算法进行集成,如知识图谱、逻辑推理引擎等,结合各自的优势来提升处理复杂逻辑 关系的能力。
    10 积分 | 29 页 | 2.37 MB | 5 月前
    3
  • pdf文档 与非网:2024年中国智算产业全景调研:技术重构与演进报告

    3. 生成式AI驱动的变革 核心点: 范式革新 | 生成式AI推动高性能算力需求,加速云-边-端覆盖与多元异构算力协同。 产业升级 | 技术突破催生新玩家(如大模型服务商),降低应用门槛并催生微调服务模式。 服务格局 | 传统算力机制无法满足大模型需求,定制化服务(独占式/大规模算力)成主 流。 成本优化 | 缩短部署周期、提升数据控制能力,助力企业降本增效。 21 Supplyframe
    20 积分 | 41 页 | 17.39 MB | 4 月前
    3
共 16 条
  • 1
  • 2
前往
页
相关搜索词
北大DeepSeekR1及类推理模型推理模型开发解读2024中国人工智能人工智能产业研究报告北京大学北京大学原理落地应用2025解码构建医药药行行业医药行业新质生产生产力腾讯算力中心白皮皮书白皮书自动自动化代表AI能源能源行业前景预测与非智算全景调研技术重构演进
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩