垂类 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 的惊人成绩，表现与OpenAI-o1-1217相当。 ➢ 在编码相关的任务中表现出专家水平，在 Codeforces上获得了2029 Elo评级，在竞赛中表现优于96.3%的人类参与者 ➢ DeepSeek-R1 在知识类问答上推动科学探索边界： ➢ MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related 榜单上取得良好表现 ➢ R1 展现出强推理模型在 AI-Driven Research 中，通过反复自我迭代和监督微调 ➢ 基于STaR 可以进一步将这种思路扩展到思考过程是搜索过程的特例，比如 rStar-Math, SoS 都可以用类似的思路来理解。 ➢ 本质上，STaR一类的方法是希望模型能够学习到MetaCoT, 即问题到答案映射过程背后的深入规律 ➢ 但是对于问题的结构要求性高，对于复杂数学推理任务可能难以自我迭代 ➢ 难以融入 Rule-Based Reward

10 积分 | 76 页 | 8.39 MB | 1 年前
3
AIGC+教育行业报告2024

，大力出奇迹的暴力美学路径已被行业所验证，未来格局仍会以有着多类型资源积累的大厂占据主要份额，创新企业可以依据特定场景深入理解而切入，但若没有自主大模型仍然会受制于人。同时，通用大模型与教育垂类大模型的关系，正向着各司其职、融合发展的方向持续演化，未来可能呈现出通用大模型与N个专家模型多重组合的形态。在内容层面，基于神经网络技术的AIGC与素养发展具有天然相似的基因，企业可以发力C端小模识经验的教授范围进一步扩大、教育效果增强 ➢ 条件：在海量数据、更大算力的支撑下 ➢ 特点：大语言模型能更加深入地解析事物，在更深层次和更广的范围发现事物的新特点 ➢ 优势：在发现、认识、运用规律上相较于人类有着明显的优势，人造工具突破人类认知大语言模型教育突变人类把数字语言外化给机器，人工智能在发现、认识、运用规律上更具优势，带来教育体系变革语言的发展及其教育影响 ➢ 数字系统：二进制、八进制、十进制等应学习。随着深度学习技术的进步，人工智能技术步入商业化阶段，AI+教育也进入产业期。近几年大数据、云计算、算力能力提升，大规模语言模型急速发展，2022年ChatGPT的发布更是引发了海内外LLMs的军备竞赛，2023年各类教育垂类大模型的争相发布，打开了通向通用人工智能（AGI）之路，帮助师生大幅提升教学效率，推动大规模的因材施教逐步落地。来源：公开资料，艾瑞咨询研究院自主研究及绘制。 1954 1956 1960 1965

10 积分 | 55 页 | 3.32 MB | 1 年前
3
抢滩接入Deepseek，教育行业迈入AI深度整合新阶段

行能力/功能升级、或以 DeepSeek为基座发布新AI教育应用和智能学习硬件，快速抢占DeepSeek模型带来的AI创新机遇。代表性教育企业围绕DeepSeek的布局总览相较于其他通用及垂类大模型，DeepSeek能够得到头部教育企业广泛青睐、激起抢滩布局，主要得益于其几大特点： l 深度思考模式：DeepSeek的深度思考模式能够输出自然语言形式的推理过程，使得学习、解题的思功能；新发布AI学习应用“随时问”，由自研九章大模型与DeepSeek大模型联合支持，主打一站式智能化教育。围绕DeepSeek，学而思的AI教育布局呈现出双协同、生态化特点： 1、突破单一模型局限，将教育垂类大模型与DeepSeek深度融合，结合DeepSeek 拆解复杂问题和语言交互的强项、及九章大模型深耕数学推理与学科知识图谱的优势，实现精准分析/定位/回溯知识点、强化逻辑推理并显化思维路径、理解并输出线接入DeepSeek、加速智能硬件创新，推动AI教育场景的深化与成本优化。 1、底层技术融合：构建DeepSeek-R1的通用智能推理能力与自研教育垂类大模型 “子曰”结合的混合架构，以提升复杂场景的AI教育能力精准度，并打造了基于 DeepSeek的多模态应用。 2、全线产品线接入：软件端，网易有道AI学习类App接入DeepSeek，以其深度思维优势提升AI教育能力和个性化交互学习体验；此外，网易有道基于子曰教育大模型

10 积分 | 6 页 | 1.23 MB | 6 月前
3
赋能金融，AI开启新时代【AI金融新纪元】系列报告（三）

执业证书编号： S0600516110001 联系邮箱： hux@dwzq.com.cn 二零二四年五月七日证券研究报告 l 2009 年移动应用市场兴起，财经类移动 APP 开始出现； 2010 年代后半段 -2020 年初，财经类移动 APP 开始致力于满足用户多元化的财富管理需求。 AI 技术的兴起使得智能营销、智能投顾等获得助推，东方财富、同花顺和华泰证模型的数字金融新时代。东方财富、同花顺、恒生电子引领金融科技前沿。 l 互联网在中国迅速发展， 2008 年牛市下 PC 端金融网络门户兴起，新浪、搜狐、网易等传统门户财经频道日益成熟，和讯网、金融界、证券之星等垂直财经网址厚积薄发。但是受限于时代条件，互联网金融领域仍处于起步阶段。东方财富后来居上，成为该阶段的集大成者。 l 中国金融与技术的融合始于 20 世纪 80 年代，互联网及数字技术出现，传统金融机构受到提高年期间，随着中国互联网用户数量的翻倍增长和互联网证券行业的发展，垂直财经网站的活跃度总体上呈现上升趋势。据艾瑞咨询 2017 年 8 月数据，东方财富网 PC 端日均覆盖人数位居同类网站首位，达到 1056 万人，几乎与 Top10 中其他 9 名网站（中国经济网、和讯网、同花顺、中金在线、金融界等）覆盖人数总和相当。同时从月度浏览时间来看，东方财富网达到 5758

10 积分 | 32 页 | 1.10 MB | 6 月前
3
大模型时代的AI教育：思考与实践2024

1、数据智能：LLM取得了突破，最被看好 • 概率模型，机器学习（统计学习方法）、数据模型、计算数学 2、学习人脑：当前遇到挑战，可能会成为道路1的一部分 • 抽象模型：杨立昆的世界模型+功能分区 • 类脑计算：意识研究、认识论（哲学物理学）、认知神经科学  包括生物计算，不排斥数据科学方法（mortal computation） 3、具身智能：刚起步，研究热点，可能会成为道路1的未来 • 如何培养AI专业人才和AI赋能人才 • AI如何赋能教育第一届人工智能教育大会（2019） 02 对AI教育的思考：AI重塑就业岗位和组织结构  从职业角度来看，人工智能将带来三类影响 1. 替代少部分基础岗位 • 一些简单的重复性、模板化、“照本宣科式”的智力劳动可能会被替代，例如：基础客户服务、简单文秘、甚至一些翻译工作 2. 革新大部分岗位的职业技能 • AI实验室建设 • 专业垂类大模型训练 • 教学创新大赛 • AI相关课题转化 • AI+学科教材共研 • AI领域科研论文 • AI技能大赛人工智能通识课 • 人工智能通识课建设 • 实验设备、系统搭建 • AIGC课程建设 • AIGC技能大赛 • AI+学科交叉融合 03 我们的AI教育实践：青鸟AI实验室七类主要产品和服务 NovaAI开放平台

10 积分 | 36 页 | 4.04 MB | 1 年前
3
AI赋能央企数智化转型研究报告——迈向世界一流企业的智能引擎-科智咨询

引擎 4 第一章：AI 赋能央企数智化转型发展概况一、AI 赋能央企数智化转型政策导向主要结论：政策上聚焦场景、算力、数据治理三方面。场景方面专注能源、制造等央企的垂类场景（如智能巡检、预测性维护等）。算力方面将加快建设智算中心，以国产算力芯片为主。数据治理方面则关注生成式 AI 的数据标注、合规审核、质量评估等。 2023-2025 年央企 AI 相关政通运输、信息技术、建筑、民生等关键领域。从行业属性来看，可划分为 6 个大行业，其中能源电力、煤矿、石油化工可划归到能源与资源类；钢铁机械没备、汽车、航天军工可划归到工业制造类；信息技术、投资/商业/服务、旅游划归到信息技术与商务服务，其中能源与资源类央企数量占比最高。图表 4 国资委下属 100 家央企行业分布数据来源：科智咨询分析整理 5 7 3 20 农业/医疗建筑工程旅游投资/商业/服务信息技术运输物流航天军工汽车钢铁机械设备石油化工煤炭/矿冶/黄金/盐业能源电力能源与资源类工业制造类运输物流类信息技术与商务服务建筑工程农业/医疗 AI 赋能央企数智化转型——迈向世界一流企业的智能引擎 12 图表 5 国资委下属 100 家央企行业描述

20 积分 | 42 页 | 3.65 MB | 4 月前
3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

ChatGPT 所能实现的人类意图，来自于机器学习、神经网络以及 Transformer 模型的多种技术模型积累 2019 年 GPT-2 BART RoBERTa ChatGPT 经过多类技术积累，最终形成针对人类反馈信息学习的大规模预训练语言模型 2018 年 GPT-1 T5 BERT 2020 年 GPT-3 M2m- 100 XLM 进行海量数据学习训练 1.0 时代 AI 2.0 时代图像分类文本分类信用评估房价预测销量预测客户分群新闻聚类广告定向社区发现文生图文生视频语音与对话影视与广告文章报告问答内容人像写真广告图片样例代码测试用例视频生成分类聚类回归文本生成语音生成代码生成图像生成 Multi-task Language Understanding WebBrowseAndSummarize 工具浏览网页并总结网页内容（此工具调用了 LLM ）第三步：调用 ConductResearch 工具生成调研报告（此工具调用了 LLM ）一个具体的例子类型名称说明角色 Researcher 调研员智能体，从网络进行搜索并总结报告。通过 LLM 提示工程 (Prompt Engineering) ，让 LLM 以调研员的角色去规划

20 积分 | 61 页 | 13.10 MB | 6 月前
3
腾讯云：2025年解码DeepSeek构建医药行业新质生产力报告

场上获得了⼴泛认可。其中： • DeepSeek-V3 是在14.8万亿⾼质量 token 上完成预训练的⼀个强⼤的混合专家 (MoE) 语⾔模型，拥有6710亿参数（激活参数370亿）。作为通⽤⼤语⾔模型，其在在知识类任务（知识问答、内容⽣成等）领域表现出⾊ • DeepSeek-R1 是基于 DeepSeek-V3-Base 训练⽣成的强化推理能⼒模型，在数学、代码⽣成和逻辑推断等复杂推理任务上表现优异更低的研发成本* 传统模型需要⽤32位或者16位数记录数字 • “⼿机号码，记最后4位” • 提升训练速度同时保持精度，降低硬件门槛 FPBn混合精度训练 • 从海量数据中提炼⾼价值信息，提升模型学习效率 • 蒸馏垂类⼩模型能⼒，不输于全尺⼨模型数据蒸馏技术 • ⼤道⾄简，⽤强化学习跳出题海和⼩测让模型⾃⼰学会思考 GRPO(群体相对策略优化) 效果体验惊艳，成本极致压缩 8 为什么⼈⼈都爱DeepSeek ⼤模型发展的⼏⼤“基⽯” 01 DeepSeek极致成本降低，显著降低本地化部署的成本，极⼤激活本地数据计算资源 02 DeepSeek是最开源的⼤模型，便于医疗⾏业开发者使⽤和优化，垂类⼩模型不输于⼤模型算法框架 03 医疗⾏业拥有⼤量数据资源，是⼤模型训练和应⽤的重要⽀撑数据资源 04 医疗信息化⼚家数千家，为⼤模型应⽤提供良好的⽣态基础⽣态资源 05 医疗⾏业⼈均学历⾼，具备开展⼤模型研究

10 积分 | 32 页 | 14.20 MB | 1 年前
3
2025企业级AI Agent（智能体）价值及应用

但不直接处理工作。人类和 AI 进行协作，工作量相当。 AI 根据人类 prompt 完成工作初稿，人类进行目标设定，修改调整，最后确认。 AI 完成绝大部分工作，人类负责设定目标、提供资源和监督结果， AI 完成任务拆分，工具选择，进度控制，现目标后自主结束工作。 Chatbot Copilot 绝大多数的工作新一代生产力引擎：企业级 AI Agent 的核心能力驱动企业数字化变化其核心在于 Agent 强大的自然语言理解（ NLU ）与意图识别能力，能精准捕捉人类模糊、多样化的指令并翻译成精确的机用最自然的语言对话替代繁复的软件操作界面，让每一位员工都能轻松调用全公司的数字化能力与服务，极大降低技术使用门槛。化水平，用“群体智慧”解决单点问题。 Agent 场景地图：四类角色各司其职借助 AIGC 规模化高效生成的能力，实现低成本、高质量的创意素材生成，加速内容制作流程，为新的制作方式及分发模式提供基础，为产业创新提供基础。游戏、娱乐、影视、营销、广告、教育等需要更多灵感及创意的领域更自然，更类人，带有情绪价值的表达，并且表达中迅速形成合理的反馈

20 积分 | 76 页 | 10.80 MB | 6 月前
3
百度智能客服实践和展望（17页PPT）

大量 FAQ • 指代抽象 • 统一聚类标注训练 • 语料生成与训练方法 • 知识图谱可视化运营工具提高效率一倍以上系统复杂 • 话务系统和架构复杂性 • 后台业务复杂集成 • 异地双活部署架构 • 能力开放严苛环境下 SLA 99.99% 系统外围高度可定制金融行业垂直解决方案建立服务生态辅助工具词云组件（基于意图实体识别生成）敏感词辅助提示前端集成定制主题及 logo 定制菜单可配置子路由及页面替换后端 API 会话中控 API 知识管理类 API WEBHOOK JS 组件人机协作助手聊天对话组件 NLU 分析系统日志会话日志系统操作日志系统集成合作伙伴合作伙伴生态圈互

20 积分 | 17 页 | 5.60 MB | 6 月前
3

共 235 条前往

页

分类

语言

格式