电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。230 积分 | 25 页 | 2.20 MB | 9 月前3
AI 金融大模型的两条技术路线【AI金融新纪元】系列报告(二)BloombergGPT 率先登场。 BloombergGPT 的混合训练方法使其模型在金融任务上 的表 现大大超过了现有的大语言模型 ,而在通用场景上的表现则与之相当 ,甚至优于现有模型。 AI4Finance Foundation 开发 FinGPT ,为金融大 型语言 模型提供互联网规模的数据 ,以此推动金融领域的开源发展。 2 ) 国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业 1. 通用+金融VS金融垂类哪方更强 通用 + 金融 VS 金融垂类哪方更强 通用语言大模型 金融垂类大模型 优势 泛用性强 由于在多样化的数据集上进行了训练,通用模 型能够处理各种话题和领域的问题 领域专业性 在金融领域具有专业的理解能力,更精熟于金 融术语和概念 灵活性和利用率高 与金融的结合主要有两条技术路径:①通用模型 + 金融语料训练金融大模型,②金融垂类大模型。 由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、 迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模 型在结构上更加复杂,影响模型效率,而金融垂类模型则是在更新维护上具有复杂性。 数据来源:东吴证券研究所整理10 积分 | 26 页 | 1.36 MB | 3 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 GPT-3.5,在 各种专业和学术基准上已经表现出人类水平。智能终端接入人工智能大 模型的趋势是明确的,预计很快在下游应用层面将出现 ............................................................................. 16 图 34: Infinix 推出多语言对话能力 AI 向导 ................................................................................. 16 图 35: 是一个大型的多模态模型,相比上一代 ChatGPT 新增了图像功能,同时具备 更精准的语言理解能力。GPT 的升级背后是 OpenAI 的大语言模型的进一步演进,同时 带动下游应用的拓展,涌现出新一批应用场景。 1.1. GPT 迭代更新,人工智能掀起科技潮 GPT 升级至四代,模型能力高速提升。ChatGPT 是由 OpenAI 开发的自然语言生成 模型,采用 Transformer 神经网络架构(又称0 积分 | 28 页 | 2.68 MB | 9 月前3
电子AI+系列专题:复盘英伟达的AI发展之路S0980522090001 l GPU 是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 倍。 l 计算与网络事业部收入占比提升,数据中心超过游戏成为收入主要来源。 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 2016 年的 241.5 万个上升至 2021 年 的 566.7 万个,对应 CAGR 达 18.60% ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练0 积分 | 30 页 | 1.27 MB | 9 月前3
金融行业银行客户经理基于DeepSeek构建AI Agent智能体应用方案(237页 WORD)........................................................................................20 2.1.2 多语言支持................................................................................................. .........................................................................................75 4.1 自然语言处理(NLP)优化.......................................................................................... 在此背景下,基于 DeepSeek 大模型构建客户经理智能体成为突破 现有瓶颈的关键路径。 本项目的核心目标是通过 AI 智能体实现三个维度的价值重 构: 服务效能升级:构建具备自然语言理解、多轮对话管理和金融 知识推理能力的智能体,实现 90%标准化业务咨询的自动化 处理,将平均响应时间从传统模式的 4 小时压缩至 30 秒以内 资源优化配置:释放人力聚焦高价值客户,预计可减少10 积分 | 247 页 | 2.05 MB | 3 月前3
2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教 浙 统计语言模型 (SLM) 神经语言模型 (NLM) 预训练语言模 型(PLM) 大语言模型 (LLM) Seq2Seq建模 基于循环神经网络RNN描述单 词序列的概率 • 优点:通过词嵌入和隐 藏层,上下文捕捉和泛 化能力较强; 上下文学习、指令微调、 扩展规律 (GPT3、GPT4…) 基于Transformer架构的语言模型 • 优点: ✓ 长距离依赖处理能力强:自注意力机制能捕捉任 意距离的依赖关系。 ✓ 并行计算能力强:Transformer架构支持并行计算, 训练速度更快。 • 缺点:资源消耗大 自然语言处理模型的演进 浙江大学人工智能教育教学研究中心 中心 智能教育教学研究中心 大学人工智能教育教学研究中心 DeepSeek-R1:监督微调+强化学习训练 DeepSeek-R1-Zero (强推理模型) 推理导向强化学习 (准确率奖励+格式奖励) 纯强化学习训练 低可控:生成文本可 读性差、语言混乱 高探索自由度 => 推理能力自我觉醒 (更长的思维链、更深层次的 推理路径) DeepSeek-V3 (基础模型) 监督微调 强化学习 图源自《ReFT: Reasoning with10 积分 | 45 页 | 7.21 MB | 3 月前3
金融与AI融合持续深化【AI金融新纪元】系列报告(四)-东吴证券AI 赋能保险行业:推动保险价值链实现自动化与个性化,在产品设计、承保理赔及中后台管理等环节全面提升效率与决策能力,并逐步拓展至 精算等核心领域。此外,开拓 AI 驱动的保险业务创新、跨境保险服务与多语言支持服务等新生业务新局面,助力保险机构实现高质量数字化转 型。 AI 赋能银行: AI 大模型在 C 端实现智能个性化服务与交叉销售提升,在 B 端深化对企业客户的风险管理与解决方案输出。此外,开拓 效部署、算力底座以及业务数智化创新的需求,助力金融机构快速完成大模型的部署落地,加速行业数智化转型进程。 蚂蚁金服: 2025 年 3 月,蚂蚁集团 Ling 团队发表了一篇技术成果论文,推出两款不同规模的 MoE 大语言模型——百灵轻量版( Ling- Lite )与百灵增强版( Ling-Plus ),两者性能均达到行业领先水平 。 腾讯云: 2025 年 2 月 27 日,腾讯混元自研的快思考模型 Turbo 44% , 同 时在知识、数理、创作等方面也有突出表现。通过模型架构创新, Turbo S 部署成本也大幅下降,持续推动大模型应用门槛降低。 东方财富:妙想金融大模型是东方财富重磅打造的金融行业大语言模型, 2025 年 3 月 21 日,东方财富宣布妙想大模型已正式向所有用户开 放,并全面登陆东方财富 APP ,开启智能投资时代,表明其在金融大模型上的布局已经深度融入核心业务链条。 数据来源10 积分 | 38 页 | 1.08 MB | 3 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页摘要:大模型能力提升不断解锁新的应用场景 过去一年,大模型能力的发展速度超出我们预期。以衡量 LLM 的常用的多语言理解均值评 测标准(MMLU)为例,2021 年底全球最先进大模型的 MMLU 5-shot 得分刚达到 60%, 2022 年底超过 70%,而 2023 年底已提升至超过 85%。在语言能力之外,AI 大模型的多模 态能力也快速提升。2023 年初,主流闭源大模型通常为纯文本的 LLM。2023 化方式来处理和回复用户输入,可以模拟人类对话,通过文字或语音与用户进行实时交互。 2010 年代,随着 NLP 等技术的发展,Chatbot 已经在客服、营销、企业信息服务等领域得 到了广泛应用。然而,由于语言理解及生成能力有限,因此 Chatbot 的落地范围局限在 B 端特定服务型场景,并未诞生具有广泛影响力的 C 端产品。2022 年 12 月,ChatGPT 在文 本生成、代码生成与修改、多轮对话等领域展现了大幅超越过去 语音助手、物体识别、生活助理等 AI 功能已在 AR/VR 产品中广泛出现。语音助手功能让 AR 眼镜能够通过上下文语义理解与用户进行更自然的交流,如李未可 Meta Lens S3 通过 大型语言模型 AI 系统提供闲聊和建议。物体识别技术使 AR 眼镜能够识别现实世界中的物 体,例如 Meta 雷朋智能眼镜引入建筑识别和菜单翻译功能。此外,生活助理功能与用户的 社交生活深度绑定,提供聊天回0 积分 | 40 页 | 2.60 MB | 9 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 深度求索 ) 公司成立于 2023 年 5 月,是一家致力于实现 AGI(Artificial General Intelligence ,通用人工智能 ) 的创新型科技公司,专注于开发先进 的大语言模型和相关技术。 DeepSeek 由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。 l 2024 年 5 月, DeepSeek-V2 发布,成为全球最强开源通用 DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提 升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型,允许所有人在遵循 MIT License 的情况 下,蒸馏 R1 训练其他模型。 2023/050 积分 | 38 页 | 1.95 MB | 9 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域不分伯仲,训练成本仅约为 558 万美元。1 月 20 日,DeepSeek 开源 R1 模型,后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 图 1:DeepSeek R1 性能比肩 OpenAI o1 数据来源:DeepSeek公众号,东莞证券研究所 同时,DeepSeek-R1 事项,此外亦 具备录音转文字、多种语言及方言实时同传翻译的功能,首发价为 1,399 元。 表 1:多款智能耳机产品密集推出 产品 发 布 时 间 价格 (元) AI 功能 iKKO ActiveBuds 2024 年 2 月 1,799 接入 OpenAI 的 GPT-4o 模型,能够回答用户提出问题;支持 62 种 语言同声传译,57 种语言录音转笔记,提炼内容要点、优化语法、 科大讯飞 iFLYBUDS Pro2 2024 年 5 月 1,399 搭载 viaim AI 会议助理,智能分析耳机实时转写的内容,提取关 键信息、生成会议摘要及待办事项,具备录音转文字、多种语言 及方言实时同传翻译的功能。单次续航 9 小时,搭配充电仓达 36 小时 SoundAI FairyClip C1 2024 年 7 月 199 接入 AzeroGPT 壹元大模型,支持实时转写、文件转写、多语翻译、0 积分 | 23 页 | 2.65 MB | 9 月前3
共 25 条
- 1
- 2
- 3
