生成式 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek大模型赋能高校教学和科研2025

6 大模型产品 3.7 大模型应用领域厦门大学大数据教学团队作品大模型通常指的是大规模的人工智能模型，是一种基于深度学习技术，具有海量参数、强大的学习能力和泛化能力，能够处理和生成多种类型数据的人工智能模型。通常说的大模型的“大”的特点体现在： 2020 年， OpenAI 公司推出了 GPT-3 ，模型参数规模达到了 1750 亿。 2023 年 3 月发布的更连贯的回答可迁移性高学习到的知识和能力可以在不同的任务和领域中迁移和应用。这意味着一次训练就可以将模型应用于多种任务，无需重新训练语言生成能力大模型可以生成更自然、更流利的语言，减少了生成输出时呈现的错误或令人困惑的问题 3.1 大模型的概念 3.2 大模型的发展历程大模型发展历经三个阶段，分别是萌芽期、沉淀期和爆发期 3.2 大模型的发展历 OpenAI 的官网上， OpenAI 定义推理模型是在回答之前进行思考，并在回复用户之前，在内部生成一长串的思维链过程。思维链是一种提示大语言模型进行逐步推理的方法。它让模型在得出最终答案之前，先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。推理模型的核心也就是说

10 积分 | 123 页 | 15.88 MB | 10 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

带来的边际收益开始递减；如果想要深度提升模型推理能力和长程问题能力，基于RL的 Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正，如果仅是依靠生成式方法和扩大参数规模，那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers to Solve Math Word (Rule-Based Reward) : 准确率奖励 + 格式奖励 ➢ 准确率奖励 Accuracy Rewards: 判断答案是否是正确的 ➢ 格式奖励Format Rewards: 规劝模型生成答案的过程是和 ➢ 没有使用Reward Model, 因为ORM和PRM等基于神经网络的都可能遭受reward hacking 而retraining reward 技术 Pipeline 总览 ➢ 冷启动 Cold Start ➢ 数据准备：few-shot long cot data, 详细带反思和验证的数据集 ➢ 双重验证：由人类注释者和 R1-zero 生成的高质量链式思考（Chain-of-Thought, CoT）数据，部分样本长度达到 10,000 Token ➢ 成效：提供一些 Human Prior \ 显著提升了语言的语义连贯性、可

10 积分 | 76 页 | 8.39 MB | 10 月前
3
英特尔-工业人工智能白皮书2025年版

............................................................................... 40 2.3.3 RAG 检索增强生成模型实现 .............................................................................................. ............................................................................. 51 3.4 诺达佳：基于 AI 的在线式视觉随动同步点胶机应用 ...........................................................53 3.5 新松：智能巡检机器人 ....... .................................................................................55 3.6 华泰软件：智能化图纸生成管家 ............................................................................................... 57

0 积分 | 82 页 | 5.13 MB | 10 月前
3
AI跃迁派：2025年DeepSeek零基础完全指南

的破局之战 DeepSeek 的诞生不仅是技术突破，更是国家战略级的里程碑：成本革命： ⚫ 训练成本仅 558 万美元（仅为美国同类模型的 1/20） ⚫ 推理速度提升 3 倍，生成文字速度从 20 字/秒提升至 60 字/秒行业重塑： ⚫ 迫使国际巨头降价（如 AnthropicClaude 降价 30%） ⚫ 首款登顶全球 140 国应用榜的国产 AI 场景需求：模块 1：基础版（V3）——效率倍增器适用人群：学生、白领、自媒体创作者核心技能： ⚫ 文案生产：3 分钟生成周报/演讲稿/小红书爆款文案（带 Emoji 和话题标签） ⚫ 知识管家：自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译：支持 42 种语言互译，自动适配文化差异（如把“摆烂”翻译成 “quietquitting”）局限：复杂逻辑问题需升级至医疗诊断：输入症状自动关联相似病例，生成检查建议（需医生复核） ⚫ 投资分析：对比财报数据→预测企业风险→生成可视化报告 ⚫ 学术研究：自动标注论文参考文献，检测实验数据矛盾点模块 3：联网搜索——实时情报局数据引擎： ⚫ 抓取最新政策文件（如半小时前发布的医保新规） ⚫ 追踪社交媒体热点（分析微博热搜背后的情绪图谱）创新用法： ⚫ 竞品监控：自动生成友商产品功能对比表

10 积分 | 21 页 | 1.01 MB | 10 月前
3
华为昇腾DeepSeek解决方案

微软 Azure 部署更高效月级调优周 / 天级优化数据依赖降低高质量数据生成数据算法依赖降低高端人才开源 + 蒸馏监督微调 SFT NVIDIA Hugging Face GitHub 更多行业高质量数据生成强化学习主流云服务商已支持 DS 覆盖公 / 私有云部署模型蒸馏 - 模型小型化 Huawei Proprietary - Restricted Distribution 昇腾硬件使能 Ascend Runtime 模型训练：算网 / 算存深度协同是大模型分布式并行训练的基础大模型技术发展方向支持 2 级框盒、框框组网，适用于大规模及超大规模集群 3 、 AI 任务信息任务、通信域 … 1 、控制器获取网络拓扑，下发路径信息 2 自适应选择性重计算、内存碎片优化、 … 模型训练：应用使能软件加持， MFU 领先、线性度持平 NV 模型训练最优 = 单机执行最优 + 集群并行最优 + 中断时间最短软件层分布式并行充分调度算力资源提供分布式加速库，内置主流加速算法，满足各类模型加速场景 Ascend C 编程语言 + Runtime 开放接口算子库低阶二进制算子库

0 积分 | 32 页 | 2.52 MB | 10 月前
3
从智慧教育到智慧课堂：理论、规范与实践

征情景感知无缝连接可视化按需推送智慧教育核心特征全向交互智能管控 12 情境感知情境感知是智慧教育最基础的功能特征，依据情境感知数据自适应地为用户提供推送式服务。 13 内在个人学习状态感知内容外在学习环境感知内容 感知学习者的专业知识背景； 感知学习者的学习状态，如焦虑、烦躁、开心等； 感知学习者的知识背景、知识基础、知识缺陷等；教育舆情监测与剖析教育信息化与现代化发展水平评估教育机构布局与教育经费调整学生的发展性评价基于大数据的科学研究 26 云计算 • 云计算中的“云”主要用来强调计算泛在性和分布性，实质上是分布式计算、并行计算和网格计算等技术的发展。 • 将分布在各地的服务器群进行网联，能够实现大规模计算能力、海量数据处理和信息服务的需求。 27 云计算创新 • 学生通过电子书包等终端随时随地享 STEM 学习实验室2 充分激活学生潜能与创意，促进数字技术和个人制造的有效融合，让学生有更多的实践动手的机会，我们高标准建设“ STEM 创新学习实验室” ，让学生在实践操作中开展创客式学习，培养学生创新能力。  S 学习实验室（科学 Science ）  T 学习实验室（技术 Technology ）  E 学习实验室（工程 Engineering ）  A 学习实验室

10 积分 | 74 页 | 10.39 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

Roy 安全准则组合模型推理 Deepseek r1 推理玻尿酸配方 DeepSeek 提示词工程提示词工程 Deepseek 十类提示词 • 1. 内容生成类：文本生成、代码生成、创意生成和数据模拟。 • 2. 信息处理类：文本摘要、信息抽取、情感分析和多语言翻译。 • 3. 对话交互类：角色扮演、多轮对话、反问引导。：风格迁移、知识库绑定、偏好记忆。 • 6. 系统操作类：模式切换、资源优化、记忆管理。 • 7. 知识查询类：事实核查、概念解释、溯源检索。 • 8. 教育与研究类：题目生成、论文润色、实验设计。 • 9. 多模态处理类：图文互译、表格解析、视频脚本。 • 10. 伦理与安全类：内容审核、价值观对齐、风险预警。 DeepSeek 部署方阿里云百炼：提供多个 DeepSeek 系列模型，如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等，部分限时免费，涵盖文本生成等功能。 • 百度智能云：千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用，且限时免费，其模型在百科知识、数学推理等任务表现突出。 • 英伟达：

10 积分 | 79 页 | 6.52 MB | 10 月前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

GPU 给客户提供高质量模型服务 ■ 例子：营收小、整体亏钱 2025 年特朗普的“星际之门”为 OpenAl 筹 5000 亿美元 Al 基础设施 ! 国际人工智能企业 OpenAI 的商业模式 ■ 国内人工智能商业模式 ( 循环以下四步 ) ■ 1, 国内融资 ( 亿美金 ) ■ 可行性分析：资金没问题，尤其优质生产力领域 2, 购买最新 GPU ■ 可行性分析：美国可以发禁令

10 积分 | 23 页 | 7.53 MB | 10 月前
3

共 8 条前往

页

分类

语言

格式