浙江大学-DeepSeek模型优势:算力、成本角度解读2025DeepSeek 模型优势:算力、成本角度 解读 2025 年 2 月 ■ 什么算力 ?“ 对信息数据进行计算,实现目标结果的能力” ■ 传统算力:信息计算力 ■ 现代算力:信息计算力、数据存储力、网络运载力 算力的基本概念 大脑 草绳、石子 算盘、算筹 ▶ 计算器、计算机 ■ 原生算力:大脑 ( 可处理复杂逻辑,但不能高速处理简单运算 可行性分析:美国可以发禁令 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 国内人工智能的发展模式、可行性分析 美国限制中国 AI 发展的策略 Y ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) 可行性分析:资金没问题,尤其优质生产力领域 可行性分析:资金没问题,尤其优质生产力领域 ■ 3 , 用 GPU 训练性能领先的大模型 ■ 可行性分析:国内 Al 人才没问题 ■ 4, 用训练的 GPU 给客户提供高质量模型服务 ■ 可行性分析:国内做工业化低成本有绝对优势 2, 购买最新 GPU 可行性分析:美国可以发禁令 美国政府对我国的禁令 现成成熟算力: 2023 年禁止出口高端 Al 芯片 ■ A100 、 H00 、 H800 、 A800 等数据中心10 积分 | 23 页 | 7.53 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告证时间过晚的情况; (REINFORCE 系列更快;PPO训练稳定但是慢) ➢ 多语言可能是因为预训练数据是多语言的,“一视同仁”被 Tokenization,不同的领域的不 同语言编码是否有不同优势? DS-R1 Zero 长度涌现现象 社区复现结果 1 社区复现结果 2 DeepSeek-R1 长度泛化复现:https://zhuanlan.zhihu.com/p/21290410831 核心目标是最大化下面的目标函数 ➢ 其中, 𝜋𝜃和 𝜋𝜃𝑜𝑙𝑑 分别表示当前策略模型和旧策略模型,q, o是从问题数据集和旧策略 𝜋𝜃𝑜𝑙𝑑中 采样的输入和输出, 𝐴𝑡是基于广义优势估计(GAE)计算的优势值,依赖于奖励序列 {𝑟≥t} 和学 习的价值函数𝑉𝜓 。因此,PPO需要同时训练策略模型和价值函数。为避免奖励模型的过度优化, 标准做法是在每个词元的奖励中添加与参考模型的KL惩罚项 ,GRPO从旧策略𝜋𝜃𝑜𝑙𝑑中采样一组输出,并通过最大化以下目标优化策略模型: ➢ 通过群组相对方式计算优势值,与奖励模型的对比性质(通常基于同一问题的输出比较训练)天然 契合;此外,GRPO直接将策略模型与参考模型的KL散度作为正则项加入损失函数,而非将其混入 奖励计算,简化了优势值的计算。 DeepSeekMath https://arxiv.org/pdf/2402.03300 2410 积分 | 76 页 | 8.39 MB | 6 月前3
从智慧教育到智慧课堂:理论、规范与实践流操作形态和应用 Linux 或者 Windows 虚拟桌面架构 e: 用户可以拥有操作系统 低成本的弱功能客户机 Linux 或者 Windows 终端服务: 按比例具有低成本优势 用户分享式操作系统 用户不具有管理者权限 低成本的弱功能客户机 Windows 流提供如下功能: 图形和视频优化 低能源服务器架构 需要功能强大弱功能客户机 智慧课堂: 触控电子白 板 退缩 空间 退缩 空间 退缩 空间 投影机 案例一:多功能教室整体设备配置图 案例二:合作探究学习情境 案例三 : 未来教室环境 案例四:混合式课堂与实验室 智慧课堂的教学优势 学生在“一对一” 环境中开展学习, 人手一台平板电 脑。 教室利用教室墙 开展教学活动 基于新技术的未来学习 未来教室环境的支撑技术 环境创设:利用技术手段,为基于 未来教室的学习提供虚拟学习环境, 类型。 优势 环境简易变革,实现教学理念及方式大幅改进 低投入,高产出 使用简单,师生能够快速适应新环境 小步子逐步实施,保证教育生态平衡发展 互动型未来教室 构建基于一对一的教学环境,学习者能够有序开展小组合作 学习、项目学习等多样互动的学习方式。教师可基于教学环 境开展深度互动教学,引导学习者创造性学习、体验做中学 的乐趣。 优势 教学内容富媒体呈现10 积分 | 74 页 | 10.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版非云上进行,这也对边缘端的算力提出了更高要求。 09 01 工业人工智能 (AI) 行业观察 新材料的 快速筛选 加速设计 锂电池未来的技术核心竞争点在于材料。快速筛选出高能效的材料,是掌握竞争优势的关键。大模型通过高通量计 算与数据库构建、分子生成模型和高通量筛选策略等步骤,能从数百万种材料中,快速筛选出具有高能效潜力的材 料,缩短新材料的发现周期。 高效能材料的发现,直接关系着电池的 的落地还是有差距;而大模型凭借强大的自学习能力和泛化能力,以及与具体行 业数据的结合调优,优势明显。 大模型的出现,将 AI 技术在工业领域的应用推向了新的发展阶段。其具体落地将会以基础大模型为技术底座,融合工业细 分行业的数据和专家经验,形成垂直化、场景化、专业化的工业大模型。工业大模型相对基础大模型具有参数量少、专业度 高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。 。 尽管传统 AI 技术和大模型在解决各种工业问题方面,从理论上讲存在诸多明显优势,但是要将 AI 技术和大模型真正成功落 地应用,依然有很多具有挑战性的问题亟待解决。 1.5 工业 AI 与工业大模型落地应用 面临的挑战 第一,数据问题。 无论是传统工业 AI 技术,还是工业大模型的落地应用,数据都是首要问题。首先是数据的数量问题,如何从应用场景 中收集到大量的数据作为训练算法或模0 积分 | 82 页 | 5.13 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南避坑指南:若遇安装失败,检查存储空间是否充足,或关闭杀毒软件后重试 ③微信小程序(轻量化入口) 获取路径: 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势:无需注册,微信一键登录,适合快速查询天气、新闻等简单任务 ⚫ 限制:高峰期可能响应延迟,建议复杂任务切换至 APP 或网页版 ④电脑版(专业场景必备) 下载安装: 1.访问官网选择 算法黑箱:医疗诊断系统出现“正确结论+错误逻辑”案例 ⚫ 防御机制:建立“可解释性 AI 认证”,关键决策需展示推理路径 4.共生之道:人类文明的升维指南 在 AI 时代保持竞争优势,需掌握三大核心能力: ①元认知能力 ⚫ 批判性思维:能识别 AI 建议中的逻辑漏洞(如发现商业方案中的“合成数据偏 差”) ⚫ 价值判断:在 AI 提供的 100 种方案中选择最符合伦理的路径 工具与行业经验结合,如老匠人用 DeepSeek 设计非遗数字化方 案 ③情感创造力 ⚫ 审美突破:设计师通过 AI 生成 1000 种图案,筛选出最具情感共鸣的设计 ⚫ 共情优势:心理咨询师借助 AI 分析数据,但治疗决策始终由人类主导 5.终极展望:硅基与碳基的共生文明 DeepSeek 预示的不仅是技术革命,更是文明形态的进化: ①文明备份计划10 积分 | 21 页 | 1.01 MB | 6 月前3
DeepSeek大模型赋能高校教学和科研2025RAG 的局限性在于 , 它缺乏自 主决策和规划的能力 ,对于一 些复杂的、 需要灵活应变的任务可能无 法胜任 各 自 的 优 势 和 适 用 场 景 RAG 和 AI Agent 都有各自的优势和适 用场景。对于企业用户来说 ,在选择时 需要根据自身的业务需求、 数据资源、 技术实力和预算等因素进行综合考虑。 如果企业只是需要解决一些简单的知 识 在这个快速 发展的人工智能时代 ,只 有选择最适合 自己的技术 ,才能在激 烈的市场竞争中 立于不败之地 AI Ag e nt AI Agent 则在复杂场景下展现出了强 大 的优势 , 它能够根据环境的变化和 任务 的要求 , 自主地进行决策和规划 , 实现 任务的自动化执行。无论是在智能 客服、 智 能 办 公 还 是 智 能 生 产 等 领 域 , A I Agent10 积分 | 123 页 | 15.88 MB | 6 月前3
共 6 条
- 1
