积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(5)大模型技术(5)

语言

全部中文(简体)(5)

格式

全部PPT文档 PPT(3)PDF文档 PDF(1)DOC文档 DOC(1)
 
本次搜索耗时 0.010 秒,为您找到相关结果约 5 个.
  • 全部
  • 人工智能
  • 大模型技术
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 DeepSeek洞察与大模型应用-人工智能技术发展与应用实践

    2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- • R1推出后,追平GPT-o1,迅速出圈海外。从 DeepSeek在美国下载排名从1月22日的201名,迅速 在1月27日登顶第一名;截止1月30日,DeepSeek在 168个国家位居下载榜第一名 • 而然地出现了许多强大而有趣的推理行为;但是,遇到 了可读性差和语言混合等挑战 • DeepSeek-R1:为了解决这些问题并进一步提高推理 性能,DeepSeek团队引入了 R1,它在RL之前结合了 多阶段训练和少量冷启动数据。R1在推理任务上实现 了与OpenAI-o1-1217相当的性能 DeepSeek-R1(对标GPT-o1)于2025年1月 20日推出,随后DeepSeek进一步出圈 DeepSeek-R1 更新日期:2025-2-11 n DeepSeek-V3和R1进入到国际顶尖模型行列 n DeepSeek-R1是综合效果最好的开源模型, 排在众多优秀的开源和闭源模型前面 n Qwen2.5-Max、GLM-4-Plus、Step-2- 16K-Exp等国产模型也有不俗的表现 -6- DeepSeek模型效果 (2/2) n DeepSeek-V3和R1相对于700亿以下开源模型(以千问720亿
    10 积分 | 37 页 | 5.87 MB | 6 月前
    3
  • ppt文档 DeepSeek消费电子行业大模型新型应用最佳实践分享

    核心收益 长上下文 (64~128K) 超大模型启动加速 独享 GPU 算力集群 私有 API 服务调用 高并发、高可用 企业级鉴权流控 算力投入持续降低 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时 蒸馏后模型多模式精调 • 全参 +LoRA 双模 式 • 低至 1 卡 A10 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 全系大语言模型支持 SFT 快速 直观 R1 推理结果 生成 R1 推理服务调用 构造蒸馏数据 集 清洗 R1 推理结果 灵活、易扩展 基于 TI 平台精调工具链,迁移 R1 高级推理能力至小尺寸模型,以更低推理成本满足垂直场景下的业务需 求 内置 R1 模型一键部 署 快速 选择并精调目标模型 评估对比模型效果 R1 模型部署 效果评 估 蒸馏模
    10 积分 | 28 页 | 5.00 MB | 6 月前
    3
  • ppt文档 金融-DeepSeek银行部署加速,AI金融应用迎来跃迁

    其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所
    10 积分 | 25 页 | 1.44 MB | 2 天前
    3
  • ppt文档 从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

    开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 o1 在数学和代码问题上的水平大幅提升 ,超越人类专 家 开源大模型 DeepSeek R1 匹敌 OpenAI o1 DeepSeek 的 “ aha moment” 这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素? 在数学和代码推理任务上的卓越表现 • 开源大模型 DeepSeek-R1 在 MATH 基准上达到 87.2% 的准确率 横空出世: OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较 强 小结一: 推理模型和思维链 (Chain of Thought
    20 积分 | 61 页 | 13.10 MB | 2 天前
    3
  • word文档 DeepSeek AI大模型在工程造价上的应用方案

    变化 等)生成多个预算方案,供决策者参考。  审核反馈机制:建立预算审核的反馈机制,确保审核意见能够 及时传达并落实。 为了进一步优化预算编制与审核的效率,可以利用 DeepSeek- R1 大模型的多维数据分析功能,结合以下表格展示不同方案的对 比情况: 方案编 号 预算总额(万 元) 材料成本(万 元) 人工成本(万 元) 工期 (天) 风险评 估 方案 2023 年:材料单价为 150 元/吨,波动范围为±10%。 基于这些数据,模型可以预测未来一年内该材料的价格可能上 涨至 160 元/吨,并提供相应的预算调整建议。此外,DeepSeek- R1 还能够通过对比不同项目中相似工程的成本构成,发现预算编 制中的常见问题。例如,通过对五项类似工程的历史数据分析,模 型总结出以下规律:  机电安装工程中的设备采购成本占比平均为 35%,但在某一 总之,用户满意度调查不仅验证了 DeepSeek-R1 大模型在工 程造价领域的应用价值,也为模型的持续改进提供了宝贵的用户视 角和实际数据支持。通过不断迭代和优化,我们相信 DeepSeek- R1 将在未来的工程造价工作中发挥更加重要的作用。 11. 风险管理与应对措施 在 DeekSeek-R1 大模型应用于工程造价的过程中,风险管理 与应对措施的制定是确保项目顺利实施的关键。首先,模型在预测
    0 积分 | 138 页 | 252.70 KB | 5 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
DeepSeek洞察模型应用人工智能人工智能技术发展实践消费电子行业电子行业新型最佳分享金融银行部署加速AI迎来跃迁从大体到复杂系统构建61PPT工程造价工程造价方案
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩