DeepSeek大模型赋能高校教学和科研20256 大模型产品 3.7 大模型应用领 域 厦门大学大数据教学团队作品 大模型通常指的是大规模的人工智能模型 ,是一种基于深度学习技术 ,具 有 海量参数、强大的学习能力和泛化能力 ,能够处理和生成多种类型数据的 人 工智能模型。 通常说的大模型的“大”的特点体现在: 2020 年 , OpenAI 公司推出了 GPT-3 ,模型参数规模达到了 1750 亿。 2023 年 3 月发布的 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时 呈现 的错误或令人困惑的问题 3.1 大模型的概 念 3.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 3.2 大模型的发展历 OpenAI 的官网上 , OpenAI 定义推理模 型是在回答之前进行思考 , 并在回复用户 之前 ,在内部生成一长串的思维链过程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前 , 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 一样。 推理模型的核心 也就是说10 积分 | 123 页 | 15.88 MB | 6 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告带来的边际收益开始递减;如果想要深度提升模 型推理能力和长程问题能力,基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers to Solve Math Word (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是和 ➢ 没有使用Reward Model, 因为ORM和PRM等基于神经网络的都可能遭受reward hacking 而retraining reward 技术 Pipeline 总览 ➢ 冷启动 Cold Start ➢ 数据准备:few-shot long cot data, 详细带反思和验证的数据集 ➢ 双重验证:由人类注释者和 R1-zero 生成的高质量链式思考 (Chain-of-Thought, CoT)数据,部分样本长度达到 10,000 Token ➢ 成效:提供一些 Human Prior \ 显著提升了语言的语义连贯性、可10 积分 | 76 页 | 8.39 MB | 6 月前3
英特尔-工业人工智能白皮书2025年版............................................................................... 40 2.3.3 RAG 检索增强生成模型实现 .............................................................................................. ............................................................................. 51 3.4 诺达佳:基于 AI 的在线式视觉随动同步点胶机应用 ...........................................................53 3.5 新松:智能巡检机器人 ....... .................................................................................55 3.6 华泰软件:智能化图纸生成管家 ............................................................................................... 570 积分 | 82 页 | 5.13 MB | 5 月前3
AI跃迁派:2025年DeepSeek零基础完全指南的破局之战 DeepSeek 的诞生不仅是技术突破,更是国家战略级的里程碑: 成本革命: ⚫ 训练成本仅 558 万美元(仅为美国同类模型的 1/20) ⚫ 推理速度提升 3 倍,生成文字速度从 20 字/秒提升至 60 字/秒 行业重塑: ⚫ 迫使国际巨头降价(如 AnthropicClaude 降价 30%) ⚫ 首款登顶全球 140 国应用榜的国产 AI 场景需求: 模块 1:基础版(V3)——效率倍增器 适用人群:学生、白领、自媒体创作者 核心技能: ⚫ 文案生产:3 分钟生成周报/演讲稿/小红书爆款文案(带 Emoji 和话题标签) ⚫ 知识管家:自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译:支持 42 种语言互译,自动适配文化差异(如把“摆烂”翻译成 “quietquitting”) 局限:复杂逻辑问题需升级至 医疗诊断:输入症状自动关联相似病例,生成检查建议(需医生复核) ⚫ 投资分析:对比财报数据→预测企业风险→生成可视化报告 ⚫ 学术研究:自动标注论文参考文献,检测实验数据矛盾点 模块 3:联网搜索——实时情报局 数据引擎: ⚫ 抓取最新政策文件(如半小时前发布的医保新规) ⚫ 追踪社交媒体热点(分析微博热搜背后的情绪图谱) 创新用法: ⚫ 竞品监控:自动生成友商产品功能对比表10 积分 | 21 页 | 1.01 MB | 6 月前3
华为昇腾DeepSeek解决方案微软 Azure 部署更高效 月级调优 周 / 天级优 化 数据依赖降低 高质量数据 生成数据 算法依赖降低 高端人才 开源 + 蒸 馏 监督微调 SFT NVIDIA Hugging Face GitHub 更多行业 高质量数据生成 强化学习 主流云服务商已支持 DS 覆盖公 / 私有云部署 模型蒸馏 - 模型小型化 Huawei Proprietary - Restricted Distribution 昇腾硬件使能 Ascend Runtime 模型训练:算网 / 算存深度协同是大模型分布式并行训练的基 础 大模型技术发展方向 支持 2 级框盒、框框组网,适用于大规模及超大规模集群 3 、 AI 任 务信 息 任务、通信域 … 1 、控制器获取网络拓扑, 下 发路径 信息 2 自适应选择性重计算、内存碎片优化、 … 模型训练:应用使能软件加持, MFU 领先、线性度持平 NV 模型训练最优 = 单机执行最优 + 集群并行最优 + 中断时间最短 软件层分布式并行 充分调度算力资源 提供分布式加速库,内置主流 加速算法,满足各类模型加速 场景 Ascend C 编程语言 + Runtime 开放接口 算子库 低阶二进制算子库0 积分 | 32 页 | 2.52 MB | 5 月前3
从智慧教育到智慧课堂:理论、规范与实践征 情景感知 无缝连接 可视化 按需推送 智慧 教育 核心 特征 全向交互 智能管控 12 情境感知 情境感知是智慧教育最基础的功能特征,依据情 境感知数据自适应地为用户提供推送式服务。 13 内在 个人学习状态感知内容 外在学习环境感知内容 感知学习者的专业知识背景; 感知学习者的学习状态,如 焦虑、烦躁、开心等; 感知学习者的知识背景、知 识基础、知识缺陷等; 教育舆情监测与剖析 教育信息化与现代化发展水平评估 教育机构布局与教育经费调整 学生的发展性评价 基于大数据的科学研究 26 云计算 • 云计算中的“云”主要用来强调计算泛 在性和分布性,实质上是分布式计算、 并行计算和网格计算等技术的发展。 • 将分布在各地的服务器群进行网联, 能够实现大规模计算能力、海量数据 处理和信息服务的需求。 27 云计算 创 新 • 学生通过电子书包 等终端随时随地享 STEM 学习实验室2 充分激活学生潜能与创意,促进数字技术和 个人制造的有效融合,让学生有更多的实践动手 的机会,我们高标准建设“ STEM 创新学习实验 室” ,让学生在实践操作中开展创客式学习,培 养学生创新能力。 S 学习实验室 ( 科学 Science ) T 学习实验室 ( 技术 Technology ) E 学习实验室 (工程 Engineering ) A 学习实验室10 积分 | 74 页 | 10.39 MB | 6 月前3
山东大学:DeepSeek 应用与部署Roy 安全准则组合模型推 理 Deepseek r1 推理玻尿酸配 方 DeepSeek 提示词工 程 提示词工程 Deepseek 十类提示 词 • 1. 内容生成类 :文本生成、代码生成、创 意生成和数据模拟。 • 2. 信息处理类 :文本摘要、信息抽取、 情感分析和多语言翻译。 • 3. 对话交互类 :角色扮演、多轮对话、 反问引导。 :风格迁移、知识库绑 定、偏好记忆。 • 6. 系统操作类:模式切换、资源优化、 记 忆管理。 • 7. 知识查询类:事实核查、概念解释、 溯 源检索。 • 8. 教育与研究类:题目生成、论文润色、 实验设计。 • 9. 多模态处理类: 图文互译、表格解析、 视频脚本。 • 10. 伦理与安全类: 内容审核、价值观对 齐、风险预警。 DeepSeek 部署方 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 , 部分限时免费 ,涵盖文本生成等功能。 • 百度智能云: 千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用 ,且限时免费 ,其模型在百科知 识、 数学推理等任务表现突出。 • 英伟达:10 积分 | 79 页 | 6.52 MB | 5 月前3
浙江大学-DeepSeek模型优势:算力、成本角度解读2025GPU 给客户提供高质量模型服务 ■ 例子:营收小、整体亏钱 2025 年特朗普的“星际之门”为 OpenAl 筹 5000 亿美元 Al 基础设施 ! 国际人工智能企业 OpenAI 的商业模 式 ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) ■ 可行性分析:资金没问题,尤其优质生产力领域 2, 购买最新 GPU ■ 可行性分析:美国可以发禁令10 积分 | 23 页 | 7.53 MB | 5 月前3
共 8 条
- 1
