电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。230 积分 | 25 页 | 2.20 MB | 9 月前3
金融垂类大模型试用体验【AI金融新纪元】系列报告(一)讯混元大模型和蚂蚁金融大模型相继正式亮相。 2023 年 11 月 ,幻方量化旗下 DeepSeek 推出 DeepSeek LLM 67Bt ,相较于其他金融模型 拥有 更突出的推理、数学、编程等能力。 2024 年开年之初, 同花顺和东方财富分别推出问财 HithinkGPT 和妙想金融大模型, 内测火热进行中。 2. 金融垂类大模型赋能金融业务 ,推动行业业务实现增量提升。 目前各家公司都在致力于以大模型赋能股基 东方财富 妙想金融大模型 高品质金融数据供给 恒生电子 LightGPT (升级) + WarrenQ+ 光 子 / 轻量化 幻方量化 DeepSeek LLM 67Bt / 数学编程能力强 时间 发布机构 金融垂类模型 2023 年 5 月 度小满 轩辕大模型 奇富科技 奇 富 GPT 2023 年 6 月 恒生电子 LightGPT 2023 年 9 月 蚂蚁集团 态基因 3 . 恒生电子LightGPT+WarrenQ:打造更专业、更合规、更轻量的金融行业大模型 4. 幻方量化DeepSeek LLM 67Bt:数学能力表现突出,指令跟随、编程能力遥遥领先 5. 金融大模型百花齐放,引领金融行业效率变革,开启数字金融新时代 目录10 积分 | 25 页 | 1.60 MB | 3 月前3
电子AI+系列专题:复盘英伟达的AI发展之路S0980522090001 l GPU 是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 倍。 l 计算与网络事业部收入占比提升,数据中心超过游戏成为收入主要来源。 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 2016 年的 241.5 万个上升至 2021 年 的 566.7 万个,对应 CAGR 达 18.60% ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练0 积分 | 30 页 | 1.27 MB | 9 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页......................................................................................... 13 编程:AI 协助编程开发,提高开发效率与质量 .................................................................................. 摘要:大模型能力提升不断解锁新的应用场景 过去一年,大模型能力的发展速度超出我们预期。以衡量 LLM 的常用的多语言理解均值评 测标准(MMLU)为例,2021 年底全球最先进大模型的 MMLU 5-shot 得分刚达到 60%, 2022 年底超过 70%,而 2023 年底已提升至超过 85%。在语言能力之外,AI 大模型的多模 态能力也快速提升。2023 年初,主流闭源大模型通常为纯文本的 LLM。2023 化方式来处理和回复用户输入,可以模拟人类对话,通过文字或语音与用户进行实时交互。 2010 年代,随着 NLP 等技术的发展,Chatbot 已经在客服、营销、企业信息服务等领域得 到了广泛应用。然而,由于语言理解及生成能力有限,因此 Chatbot 的落地范围局限在 B 端特定服务型场景,并未诞生具有广泛影响力的 C 端产品。2022 年 12 月,ChatGPT 在文 本生成、代码生成与修改、多轮对话等领域展现了大幅超越过去0 积分 | 40 页 | 2.60 MB | 9 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域不分伯仲,训练成本仅约为 558 万美元。1 月 20 日,DeepSeek 开源 R1 模型,后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 图 1:DeepSeek R1 性能比肩 OpenAI o1 数据来源:DeepSeek公众号,东莞证券研究所 同时,DeepSeek-R1 海外头部企业积极跟进。2 月 1 日,OpenAI 官宣 o3 mini 和 o3 mini high 两大版本上 线 ChatGPT,其中 o3 mini 的复杂推理、对话能力显著提升,在科学、数学、编程等领 域性能优秀,且保持了 o1 mini 的低成本和低延迟,并可与联网搜索功能搭配使用。谷 歌则在 2 月 6 日推出 Gemini 2.0 家族,包括 Gemini 2.0 Pro 实验版本、Gemini reasoning、Grok 3 mini reasoning。其中 Grok 3 在数学、科学、 编程等领域的性能进一步提升,表现好于 Gemini 2 Pro、DeepSeek V3、Claude 3.5 Sonnet 及 GPT-4o 等模型;而推理模型 Grok 3 reasoning Beta 在数学、科学、编程等表现上 亦好于 OpenAI o3 mini(high)、DeepSeek R1、Gemini0 积分 | 23 页 | 2.65 MB | 9 月前3
2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教 浙 统计语言模型 (SLM) 神经语言模型 (NLM) 预训练语言模 型(PLM) 大语言模型 (LLM) Seq2Seq建模 基于循环神经网络RNN描述单 词序列的概率 • 优点:通过词嵌入和隐 藏层,上下文捕捉和泛 化能力较强; 上下文学习、指令微调、 扩展规律 (GPT3、GPT4…) 基于Transformer架构的语言模型 • 优点: ✓ 长距离依赖处理能力强:自注意力机制能捕捉任 意距离的依赖关系。 ✓ 并行计算能力强:Transformer架构支持并行计算, 训练速度更快。 • 缺点:资源消耗大 自然语言处理模型的演进 浙江大学人工智能教育教学研究中心 中心 智能教育教学研究中心 大学人工智能教育教学研究中心 DeepSeek-R1:监督微调+强化学习训练 DeepSeek-R1-Zero (强推理模型) 推理导向强化学习 (准确率奖励+格式奖励) 纯强化学习训练 低可控:生成文本可 读性差、语言混乱 高探索自由度 => 推理能力自我觉醒 (更长的思维链、更深层次的 推理路径) DeepSeek-V3 (基础模型) 监督微调 强化学习 图源自《ReFT: Reasoning with10 积分 | 45 页 | 7.21 MB | 3 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 深度求索 ) 公司成立于 2023 年 5 月,是一家致力于实现 AGI(Artificial General Intelligence ,通用人工智能 ) 的创新型科技公司,专注于开发先进 的大语言模型和相关技术。 DeepSeek 由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。 l 2024 年 5 月, DeepSeek-V2 发布,成为全球最强开源通用 DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提 升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型,允许所有人在遵循 MIT License 的情况 下,蒸馏 R1 训练其他模型。 2023/050 积分 | 38 页 | 1.95 MB | 9 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 GPT-3.5,在 各种专业和学术基准上已经表现出人类水平。智能终端接入人工智能大 模型的趋势是明确的,预计很快在下游应用层面将出现 ............................................................................. 16 图 34: Infinix 推出多语言对话能力 AI 向导 ................................................................................. 16 图 35: 是一个大型的多模态模型,相比上一代 ChatGPT 新增了图像功能,同时具备 更精准的语言理解能力。GPT 的升级背后是 OpenAI 的大语言模型的进一步演进,同时 带动下游应用的拓展,涌现出新一批应用场景。 1.1. GPT 迭代更新,人工智能掀起科技潮 GPT 升级至四代,模型能力高速提升。ChatGPT 是由 OpenAI 开发的自然语言生成 模型,采用 Transformer 神经网络架构(又称0 积分 | 28 页 | 2.68 MB | 9 月前3
AI 金融大模型的两条技术路线【AI金融新纪元】系列报告(二)谷歌将在谷歌云上部署 Claude ,并于推出自研的大模型 LaMDA 的聊 天机器人 Bard ; AWS 推出自有基础模型 Titan 和 AIGC 服务 Bedrock ,以及 AI 编程助手 Amazon CodeWhisperer 。 Anthropic 推出 Claude ,是最接近 ChatGPT 的商业竞品; xAI 发布其首个 AI 大模型产品 Grok ,模型通过 BloombergGPT 率先登场。 BloombergGPT 的混合训练方法使其模型在金融任务上 的表 现大大超过了现有的大语言模型 ,而在通用场景上的表现则与之相当 ,甚至优于现有模型。 AI4Finance Foundation 开发 FinGPT ,为金融大 型语言 模型提供互联网规模的数据 ,以此推动金融领域的开源发展。 2 ) 国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业 1. 通用+金融VS金融垂类哪方更强 通用 + 金融 VS 金融垂类哪方更强 通用语言大模型 金融垂类大模型 优势 泛用性强 由于在多样化的数据集上进行了训练,通用模 型能够处理各种话题和领域的问题 领域专业性 在金融领域具有专业的理解能力,更精熟于金 融术语和概念 灵活性和利用率高10 积分 | 26 页 | 1.36 MB | 3 月前3
中国信通院:普惠算力赋能教育行业研究报告(2025年)机器人以其拟人、形象的特点,拉近了与幼儿的情感距离,能够帮助 幼儿缓解入园焦虑、形成定时喝水、端正坐姿等良好的生活习惯;利 用搭载语音技术的智能机器人开展语音交互活动、个性化推送语言资 源,可促进不同年龄段幼儿发展语言能力。资源共享助力家园共育有 所突破,家园共育是促进幼儿发展的重要手段。有研究表明,家长最 希望接受学校、园所渠道提供的家庭教育指导服务,多数家长认为学 校提供的家庭教育指导 普惠算力赋能教育行业研究报告(2025 年) 19 大的计算能力,有力支撑了包括复杂科学计算、工程仿真、人工智能 训练等在内的高阶教学与前沿科研活动。算力开发平台通过提供一站 式的开发工具、丰富的算法模型以及友好的编程环境,极大地简化了 从理论到实践的应用过程,有效赋能师生开展自主性的算法创新与项 目实践。不仅培养了学生在大规模数据处理与智能模型开发方面的核 心能力,更促进了跨学科融合与研究范式的转型。两类平台的协同发 为学生提供了高度个性化的学习体验。个性化体验的技术内核主要包 括自适应学习引擎、智能认知诊断、实时反馈与干预等,通过基于知 普惠算力赋能教育行业研究报告(2025 年) 21 识图谱与学习分析算法以及自然语言处理与表情识别等技术能够实 施评估学生知识掌握水平、感知学生专注度,并且基于学生学习数据 可以实现精准学情分析。例如百度基于百度大脑 7.0 平台推出小度智 能学习平板,将 AI 技术与教育场景深度融合,配备的10 积分 | 52 页 | 1.81 MB | 1 月前3
共 30 条
- 1
- 2
- 3
