ppt文档 厦大团队:DeepSeek大模型赋能政府数字化转型 VIP文档

13.42 MB 121 页 0 下载 30 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
DeepSeek 每个人都可以读懂的大模型科普报告(政府篇) DeepSeek 大模型赋能政府数字化转 型 厦门大学 林子雨 副教授 厦门大学大数据教学团队作品 2025 年 3 月 9 日 国 内 高 校 大 数 据 教 学 的 重 要 贡 献 者 团队负责人 :林子雨 副教授 年轻力量: 核心成员全部 46 周岁以下 结构合理: 教学型、 科研型、 实验工程师 专注专业: 从 2013 年至今 , 11 年专注于大数据教学 团队特点: 眼光前瞻、 紧跟技术、 创新实干、 执行力 强 影响力高: 多项指标在国内高校大数据教学领域领 先 • 教材数量 • 教材占有率 • MOOC 课程学习人数 • 师资培养 • 教学研讨会 • 教学网站访问量 • 在线讲座观看人数 • 团队联系方式: ziyulin@xmu.edu.cn 厦门大学大数据教学团队 1. 大模型: 人工智能的前沿 2. 大模型产品 3. 大模型的行业应用 4. 政府部门本地部署大模型 5. DeepSeek 大模型在政务服务领域的应 用 6. DeepSeek 大模型在政府工作中的应用 7. 智能体的政务应用 8. AIGC 与政府应用实践 目录 厦门大学大数据教学团队作品 1. 大模型:人工智能的前 沿 1.1 大模型的概念 1.2 大模型的发展历程 1.3 人工智能与大模型的关系 1.4 大模型分类 大模型通常指的是大规模的人工智能模型 ,是一种基于深度学习技术 ,具 有 海量参数、强大的学习能力和泛化能力 ,能够处理和生成多种类型数据的 人 工智能模型 通常说的大模型的“大”的特点体现在: 2020 年 , OpenAI 公司推出了 GPT-3 ,模型参数规模达到了 1750 亿 2023 年 3 月发布的 GPT-4 的参数规模是 GPT-3 的 10 倍以上 ,达到 1.8 万亿 1.1 大模型的概 念 训练数据量大 计算资源需求高 参数数量庞大 大模型的设计和训练旨在提供更强大、 更准确的模型性能 , 以应对更复杂、 更庞大的数据集或任务。 大模型通常能够学习 到 更细微的模式和规律 ,具有更强的泛化能力和表达能力 学习能力强 大模型可以从大量的数据中学习, 并利用学到的知识和模式来提供 更精准的答案和预测 。这使得它 们在解决复杂问题和应对新的 场 景时表现更加出色 上下文理解能力 大模型具有更强的上下文理解能 力 ,能够理解更复杂的语意和语 境 。这使得它们能够产生更准确、 更连贯的回答 可迁移性高 学习到的知识和能力可以在不同 的任务和领域中迁移和应用 。 这 意味着一次训练就可以将模 型应 用于多种任务,无需重新 训练 语言生成能力 大模型可以生成更自然 、更流 利 的语言,减少了生成输出时呈现 的错误或令人困惑的问题 1.1 大模型的概 念 1.2 大模型的发展历 程 大模型发展历经三个阶段 ,分别是萌芽期、 沉淀期和爆发 期 1.2 大模型的发展历 程 1.2 大模型的发展历 程 大模型发展对算力的需求演变 人工智能 机器学习 深度学习 人工智能包含了机器学习 ,机器学习包含了深度学习 ,深度学习可以采用不同的模型 , 其中一种模型是预训练模型 ,预训 练模型包含了预训练大模型(可以简称为“大模型”) ,预训练大模型包含了预训练大语言模型(可以简称为“大语言模 型”) ,预训练大语言模型的典型代表包括 OpenAI 的 GPT 和百度的文心 ERNIE , ChatGPT 是基于 GPT 开发的大模型产 品, 预训练大模型 预训练 大语言模型 预训练大语言模型 GPT 文 心 ERNIE 1.3 人工智能与大模型的关 系 深度学习模型 预训练模型 文心一言 ChatGPT 文心一言是基于文心 ERNIE 开发的大模型产 品 语言大模型 是 指 在 自 然 语 言 处 理 ( Nat u ral La ng uage Processing , NLP )领域中的一类大 模型, 通常 用于处理文本数据和理解自然语言 。 这类大模型 的主要特点是它们在大规模语料库上 进行了训练, 以学习自然语言的各种语法 、语义 和语境规则 。 代表性产品包括 GPT 系列 ( OpenAI ) 、 Bard ( Google ) 、 DeepSeek 、文心一言(百度)等 多模态大模型 是指能够处理多种不同类型数据的大模型,例如 文本 、 图像 、音频等多模态数据 。这类模型结 合 了 NLP 和 CV 的能力, 以实现对多模态信息 的综合 理解和分析,从而能够更全面地理解和 处理复杂 的数据 。代表性产品包括 DingoDB 多模向量数据 库(九章云极 DataCanvas ) 、 DALL-E(OpenAI) 、 悟空画画(华 为) 、 midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV )领 域中使用的大模型 ,通常用 于图像处理和分析 。 这类模型通过在大规模图 像数据上进行训练, 可 以实现各种视觉任务 , 如图像分类 、 目标检测 、 图像分割 、姿态估计 、人脸识别等 。代表性产品 包括 VIT 系列 ( Google ) 、文心 UFO 、华为盘古 CV 、 INTERN (商汤)等 1.4 大模型的分 类 通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务 , 相当于 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 模型 。 它们通常使用行业相关的 数 据进行预训练或微调, 以提高 在该 领域的性能和准确度,相当 于 AI 成 为“行业专家” 垂直大模型 L2 是指那些针对特定任务或场景的大 模型 。 它们通常使用任务相关的 数 据进行预训练或微调, 以提高 在该 任务上的性能和效果 1.4 大模型的分 类 按照应用领域的不同 ,大模型主要可以分为 L0 、 L1 、 L2 三个 层级 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理 模 型是在回答之前进行思考 , 并在回复用 户 之前 ,在内部生成一长串的思维链过 程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前, 先显式地写出推理的中间步骤。这就像 人 类解决复杂问题时会先把思考过程写 下来 一样 推理模型的核心 也就是说 ,如果模型在回复你之前有一 长 串的思考过程(这个过程必须可以显示输 出) ,探索了很多不同的路径之后给出 答 案 ,那么有这个能力的大模型就是推 理大 模型。推理模型的核心在于处理那 些需要 多步骤逻辑推导才能解决的复杂 问题 推理大模型 推理大模型的概念大规模传播应该开始于 2024 年 9 月份 2024 年 9 月 12 日 , OpenAI 官方宣 布了 OpenAI o1 推理大模型 1.4 大模型的分 类 大语言模型可以分为通用大模型和推理大模型 非推理问题 : ” 法国的首都是哪里 ? ” (答案直接 、 无需推导 ) 推理问题: ” 一列火车以每小时 60 英里的速度行驶 3 小时 , 行驶距离是多少? ” (需先理解 ”距离 = 速度 × 时间 ” 的关系 , 再分步计算) 将“推理”定义为通过生成中间步骤来回答复杂问题的过程 2 个简单的例子: 通用的大语言模型( LLM ) 可能直接输出简短答案(如” 180 英里”) 推理模型的特点在于显式展示中间推导过程 1.4 大模型的分 类 Sebastian Raschka 博士( Lightning AI 的首席教育学家) : 特性 推理大模型 通用大模型 适用场景 复杂推理、 解谜、 数学、 编码难题 文本生成、 翻译、 摘要、 基础知识问答 复杂问题解决能力 优秀 ,能进行深度思考和逻辑推理 一般 ,难以处理多步骤的复杂问题 运算效率 较低 ,推理时间较长 ,资源消耗大 较高 , 响应速度快 ,资源消耗相对较小 幻觉风险 较高 , 可能出现“过度思考”导致的错误答案 较低 ,更依赖于已知的知识和模式 泛化能力 更强 ,能更好地适应新问题和未知场景 相对较弱 ,更依赖于训练数据 擅长任务举例 解决复杂逻辑谜题 ,编写复杂算法 ,数学证明 撰写新闻稿 ,翻译文章 , 生成产品描述 , 回答 常识问题 成本 通常更高 通常更低 在应用方面二者各有擅长的领域 , 而不是简单的谁强谁弱问题 n 如果你需要完成数据分析、 逻辑推理、 代码生成等逻辑性较强且较为复杂的任务 ,请选择推理大模 型 n 如果你面临创意写作、 文本生成、 意图识别等发散性较强且较为创意多样的任务 ,请选择通用大模 型 1.4 大模型的分 类 2.1 国外的大模型产品 2.2 国内的大模型产品 2.3 主流大模型“幻觉”评 测 2. 大模型产 品 厦门大学大数据教学团队作品 n ChatGPT ChatGPT 是一种由 OpenAI 训练的大语言模型。 它是基于 Transformer 架构 ,经过大量文本数据训练而成 ,能够生成自然、 流畅的语言 ,并具备回答问题、 生成文本、 语言翻译等多种功能 ChatGPT 的应用范围广泛 , 可以用于客服、 问答系统、 对话生成、 文本生成等领域。 它能够理解人类语言 ,并能够回 答各 种问题 ,提供相关的知识和信息。 与其他聊天机器人相比 , ChatGPT 具备更强的语言理解和生成能力 ,能够更自然地 与人 类交流 ,并且能够更好地适应不同的领域和场景。 ChatGPT 的训练数据来自互联网上的大量文本 , 因此 , 它能够 涵盖多种 2.1 国外的大模型产 品 语言风格和文化背景 Gemini 是谷歌发布的大模型 , 它能够同时处理多种类型的数据和任务 , 覆盖文本、 图像、 音频、 视频等多个领域。 Gemini 采用了全新的架构 ,将多模态编码器和多模态解码器两个主要组件结合在一起 , 以提供最佳结果 Gemini 包括三种不同规模的模型: Gemini Ultra 、 Gemini Pro 和 Gemini Nano , 适用于不同任务和设备。 2023 年 12 月 6 日, Gemini 的初始版本已在 Bard 中提供 ,开发人员版本可通过 Google Cloud 的 API 获得。 Gemini 可以应用于 Bard 和 Pixel 8 Pro 智能手机。 Gemini 的应用范围广泛 ,包括问题回答、 摘要生成、 翻译、 字幕生成、 情感分析等任务。 然而 , 由于其 复杂 性和黑箱性质 , Gemini 的可解释性仍然是一个挑战 2.1 国外的大模型产品 n Gemini n Sora 2024 年 2 月 16 日 , OpenAI 再次震撼全球科技界 ,发布了名为 Sora 的 文本 生成视频大模型 ,只需输入文本就能自动生成视频。 这一技术的诞生, 不仅标志着人工智能在视频生成领域的重大突破 ,更引发了关于人工智 能发展对人类未来影响的深刻思考。 随着 Sora 的发布 ,人工智能似乎正 式踏入了通用人工智能( AGI : Artificial General Intelligence ) 的时 代。 AGI 是指能够像人类一样进行各种智能活动的机器智能 ,包括理解语言、 识别图像、 进行复杂推理等。 Sora 大模型能够直接输出长达 60 秒的视频 , 并且视频中包含了高度细致的背景、 复杂的多角度镜头 , 以及富有情 感 的多个角色。 这种能力已经超越了简单的图像或文本生成 ,开始触 及到 视频这一更加复杂和动态的媒介。 这意味着人工智能不仅在处理 静态信 息上越来越强大 , 而且在动态内容的创造上也展现出了惊人的 潜力 2.1 国外的大模型产 品 n Sora 右图是 Sora 根据文本自动生成的视频画面 , 一位戴 着 墨镜、 穿着皮衣的时尚女子走在雨后夜晚的东京 市区 街道上 ,抹了鲜艳唇彩的唇角微微翘起 , 即便 带着墨 镜也能看到她的微笑 ,地面的积水映出了她 的身影和 灯红酒绿的霓虹灯 ,热闹非凡的唐人街正 在进行舞龙 表演 ,熙熙攘攘的人群目光都聚焦在跃 动的彩龙身上, 整个环境的喜庆氛围仿佛令人身临其 境 2.1 国外的大模型产 品 n OpenAI o3 2024 年 12 月 20 日 , OpenAI 发布推理模型 o3 ,无论在软件工程、 编写代码 ,还是竞赛数学、 掌握人类博士级别的自然 科学 知识能力方面 , o3 都达到了很高的水平 2.1 国外的大模型产 品 大模型 图标 指标排名 DeepSeek 能力测评第一 豆包 用户数量第一 Kimi 文本处理第一 即梦 AI 作图能力第一 通义万相 视频生成第一 智谱清言 文档归纳第一 2.2 国内的大模型产 品 2025 年 1 月国内大模型排行 榜 2024 年 12 月 26 日 ,杭州一家名为“深度求索”( DeepSeek ) 的中国初创公 司, 发布了全新一代大模型 DeepSeek-V3 。 在多个基准测试中 , DeepSeek-V3 的 性能均超越了其他开源模型 , 甚至与顶尖的闭源大模型 GPT-4o 不相上下 , 尤 其在数学推理上 , DeepSeek-V3 更是遥遥领先。 DeepSeek-V3 以多项 开创性 技术 ,大幅提升了模型的性能和训练效率。 DeepSeek-V3 在性能比 肩 GPT- 4o 的同时 ,研发却只花了 558 万美元 , 训练成本不到后者的二十分之一。 因 为表现太过优越 , DeepSeek 在硅谷被誉为“来自东方的神秘力量”。 2025 年 1 月 20 日 , DeepSeek-R1 正式发布 ,拥有卓越的性能 ,在数学、 代码 和推理任务上可与 OpenAI o1 媲美。 2.2 国内的大模型产 品 n DeepSeek (深度求索) DeepSeek 创始人 梁文峰 n 通义千问 通义千问是阿里云推出的一个超大规模的语言模型 , 它具备多轮对话、 文 案创作、 逻辑推理、 多模态理解、 多语言支持的能力。 通义千问这个名 字 有“通义”和“千问”两层含义 , “通义”表示这个模型能够理解各种语 言 的含义 , “千问”则表示这个模型能够回答各种问题。 通义千问基于深 度 学习技术 ,通过对大量文本数据进行训练 ,从而具备了强大的语言理解 和生成能力。 它能够理解自然语言 ,并能够生成自然语言文本 n 字节跳动豆包 豆包是字节跳动基于云雀模型开发的 AI , 能理解你的需求并生成高质量 回 应。 它知识储备丰富 , 涵盖历史、 科学、 技术等众多领域 , 无论是日 常问 题咨询 , 还是深入学术探讨 , 都能提供准确全面的信息。 同时 , 具备 出色 的文本创作能力 , 能撰写故事、 诗歌、 文案等各类体裁。 并且擅长语言 交 互 交流自然流畅 就像身边的知心伙伴 耐心倾听并给予恰当反馈 2.2 国内的大模型产 品 n 文心一言 文心一言是由百度研发的知识增强大模型 ,能够与人对话互动、 回答问题、 协助创作 , 高效便捷地帮助人们获取信息、 知识和灵感 文心一言基于飞桨深度学习平台和文心知识增强大模型 ,持续从海量数据和 大规模知识中融合学习 ,具备知识增强、 检索增强和对话增强的技术特色。 文心一言具有广泛的应用场景 ,例如智能客服、 智能家居、 移动应用等领域。 它可以与用户进行自然语言交互 , 帮助用户解决各种问题 ,提供相关的知识 和信息 n Kimi Kimi 是月之暗面科技 2023 年推出的 AI 助手 , 可处理 200 万字超长文本 ,支 持多 格式文件解读、 互联网信息搜索整合、 多语言对话等 ,能用于办公、 学习、 创作等 场景 ,有网页版、 APP 、 微信小程序等使用方式 2.2 国内的大模型产 品 大模型幻觉 ,也被称为 AI 幻觉 ,是指大型语言 模 型在生成内容时 , 产生与事实不符、 逻辑错 误或 无中生有等不合理信息的现象 比如在回答历史事件时 , 可能会编造不存在的 细 节或人物; 在进行科学知识讲解时 , 给出错 误的 理论或数据 其产生原因主要包括: 模型训练数据存在偏差、 不完整或错误 , 导致在学习过程中引入了不准 确 的信息; 模型基于概率分布生成内容 , 在某 些情 况下会选择一些看似合理但实际错误的路 径。 大 模型幻觉会影响信息的准确性和可靠性 , 在信息 传播、 学术研究等领域可能带来不良影响。 因此, 在使用大模型时 , 需要对其输出内容进 行仔细验 证和甄别 2.3 主流大模型“幻觉”评测 3. 大模型的行业应用 厦门大学大数据教学团队作品 ( 2 )计算机视觉 大模型在计算机视觉领域也有广泛应用 ,可以用于图像分类(识别 图 像中的物体和场景)、 目标检测(能够定位并识别图像中的特定 物 体)、图像生成(如风格迁移、图像超分辨率增强)、人脸识 别(用 于安全验证和身份识别)、医学影像分析(辅助医生诊断疾 病)等 ( 1 ) 自然语言处理 大模型在自然语言处理领域具有重要的应用 ,可以用于文本生成 (如文章、小说、新闻等的创作)、翻译系统(能够实现高质量 的 跨语言翻译)、问答系统(能够回答用户提出的问题)、情感 分析 (用于判断文本中的情感倾向)、语言生成(如聊天机器 人)等 大模型的应用领域非常广泛 ,涵盖了自然语言处理、 计算机视觉、 语音识别、 推荐系统、 医疗健康、 金融风控、 工业制造、 生物信息学、 自动驾驶、 气候研究等多个领域 3. 大模型的行业应 用 ( 4 )推荐系统 大模型可以用于个性化推荐、广告推荐等任务。通过分析用户的历 史 行为和兴趣偏好 ,大模型可以为用户提供个性化的推荐服务 ,提高 用 户满意度和转化率 ( 3 )语音识别 大模型在语音识别领域也有应用 ,如语音识别、语音合成等。通 过 学习大量的语音数据 ,大模型可以实现高质量的跨语言翻译和语 音 识别以及生成自然语音 3. 大模型的行业应 用 金融风控 自动驾驶 医疗健康 大模型可以用于信用评估、欺诈检测等任 务 。通过分析大量的金融数据 ,大模型 可 以评估用户的信用等级和风险水平, 以及 检测欺诈行为,提高金融系统的安 全性和 稳定性 大模型可以用于医疗影像诊断、疾病预测 等任务 。通过学
下载文档到本地,方便使用
共 121 页, 还有 1 页可预览, 继续阅读
文档评分
请文明评论,理性发言.