积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(24)区域研究(24)

语言

全部中文(简体)(15)

格式

全部PDF文档 PDF(12)PPT文档 PPT(8)DOC文档 DOC(4)
 
本次搜索耗时 0.018 秒,为您找到相关结果约 24 个.
  • 全部
  • 研究报告
  • 区域研究
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页

    请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。23
    0 积分 | 25 页 | 2.20 MB | 6 月前
    3
  • ppt文档 金融垂类大模型试用体验【AI金融新纪元】系列报告(一)

    讯混元大模型和蚂蚁金融大模型相继正式亮相。 2023 年 11 月 ,幻方量化旗下 DeepSeek 推出 DeepSeek LLM 67Bt ,相较于其他金融模型 拥有 更突出的推理、数学、编程等能力。 2024 年开年之初, 同花顺和东方财富分别推出问财 HithinkGPT 和妙想金融大模型, 内测火热进行中。 2. 金融垂类大模型赋能金融业务 ,推动行业业务实现增量提升。 目前各家公司都在致力于以大模型赋能股基 东方财富 妙想金融大模型 高品质金融数据供给 恒生电子 LightGPT (升级) + WarrenQ+ 光 子 / 轻量化 幻方量化 DeepSeek LLM 67Bt / 数学编程能力强 时间 发布机构 金融垂类模型 2023 年 5 月 度小满 轩辕大模型 奇富科技 奇 富 GPT 2023 年 6 月 恒生电子 LightGPT 2023 年 9 月 蚂蚁集团 态基因 3 . 恒生电子LightGPT+WarrenQ:打造更专业、更合规、更轻量的金融行业大模型 4. 幻方量化DeepSeek LLM 67Bt:数学能力表现突出,指令跟随、编程能力遥遥领先 5. 金融大模型百花齐放,引领金融行业效率变革,开启数字金融新时代 目录
    10 积分 | 25 页 | 1.60 MB | 3 小时前
    3
  • ppt文档 电子AI+系列专题:复盘英伟达的AI发展之路

    S0980522090001 l GPU 是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 倍。 l 计算与网络事业部收入占比提升,数据中心超过游戏成为收入主要来源。 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 2016 年的 241.5 万个上升至 2021 年 的 566.7 万个,对应 CAGR 达 18.60% ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练
    0 积分 | 30 页 | 1.27 MB | 6 月前
    3
  • pdf文档 电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页

    ......................................................................................... 13 编程:AI 协助编程开发,提高开发效率与质量 .................................................................................. 摘要:大模型能力提升不断解锁新的应用场景 过去一年,大模型能力的发展速度超出我们预期。以衡量 LLM 的常用的多语言理解均值评 测标准(MMLU)为例,2021 年底全球最先进大模型的 MMLU 5-shot 得分刚达到 60%, 2022 年底超过 70%,而 2023 年底已提升至超过 85%。在语言能力之外,AI 大模型的多模 态能力也快速提升。2023 年初,主流闭源大模型通常为纯文本的 LLM。2023 化方式来处理和回复用户输入,可以模拟人类对话,通过文字或语音与用户进行实时交互。 2010 年代,随着 NLP 等技术的发展,Chatbot 已经在客服、营销、企业信息服务等领域得 到了广泛应用。然而,由于语言理解及生成能力有限,因此 Chatbot 的落地范围局限在 B 端特定服务型场景,并未诞生具有广泛影响力的 C 端产品。2022 年 12 月,ChatGPT 在文 本生成、代码生成与修改、多轮对话等领域展现了大幅超越过去
    0 积分 | 40 页 | 2.60 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    不分伯仲,训练成本仅约为 558 万美元。1 月 20 日,DeepSeek 开源 R1 模型,后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 图 1:DeepSeek R1 性能比肩 OpenAI o1 数据来源:DeepSeek公众号,东莞证券研究所 同时,DeepSeek-R1 海外头部企业积极跟进。2 月 1 日,OpenAI 官宣 o3 mini 和 o3 mini high 两大版本上 线 ChatGPT,其中 o3 mini 的复杂推理、对话能力显著提升,在科学、数学、编程等领 域性能优秀,且保持了 o1 mini 的低成本和低延迟,并可与联网搜索功能搭配使用。谷 歌则在 2 月 6 日推出 Gemini 2.0 家族,包括 Gemini 2.0 Pro 实验版本、Gemini reasoning、Grok 3 mini reasoning。其中 Grok 3 在数学、科学、 编程等领域的性能进一步提升,表现好于 Gemini 2 Pro、DeepSeek V3、Claude 3.5 Sonnet 及 GPT-4o 等模型;而推理模型 Grok 3 reasoning Beta 在数学、科学、编程等表现上 亦好于 OpenAI o3 mini(high)、DeepSeek R1、Gemini
    0 积分 | 23 页 | 2.65 MB | 6 月前
    3
  • pdf文档 2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)

    大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教 浙 统计语言模型 (SLM) 神经语言模型 (NLM) 预训练语言模 型(PLM) 大语言模型 (LLM) Seq2Seq建模 基于循环神经网络RNN描述单 词序列的概率 • 优点:通过词嵌入和隐 藏层,上下文捕捉和泛 化能力较强; 上下文学习、指令微调、 扩展规律 (GPT3、GPT4…) 基于Transformer架构的语言模型 • 优点: ✓ 长距离依赖处理能力强:自注意力机制能捕捉任 意距离的依赖关系。 ✓ 并行计算能力强:Transformer架构支持并行计算, 训练速度更快。 • 缺点:资源消耗大 自然语言处理模型的演进 浙江大学人工智能教育教学研究中心 中心 智能教育教学研究中心 大学人工智能教育教学研究中心 DeepSeek-R1:监督微调+强化学习训练 DeepSeek-R1-Zero (强推理模型) 推理导向强化学习 (准确率奖励+格式奖励) 纯强化学习训练 低可控:生成文本可 读性差、语言混乱 高探索自由度 => 推理能力自我觉醒 (更长的思维链、更深层次的 推理路径) DeepSeek-V3 (基础模型) 监督微调 强化学习 图源自《ReFT: Reasoning with
    10 积分 | 45 页 | 7.21 MB | 3 小时前
    3
  • ppt文档 电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

    为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 深度求索 ) 公司成立于 2023 年 5 月,是一家致力于实现 AGI(Artificial General Intelligence ,通用人工智能 ) 的创新型科技公司,专注于开发先进 的大语言模型和相关技术。 DeepSeek 由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。 l 2024 年 5 月, DeepSeek-V2 发布,成为全球最强开源通用 DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提 升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型,允许所有人在遵循 MIT License 的情况 下,蒸馏 R1 训练其他模型。 2023/05
    0 积分 | 38 页 | 1.95 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页

    将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 GPT-3.5,在 各种专业和学术基准上已经表现出人类水平。智能终端接入人工智能大 模型的趋势是明确的,预计很快在下游应用层面将出现 ............................................................................. 16 图 34: Infinix 推出多语言对话能力 AI 向导 ................................................................................. 16 图 35: 是一个大型的多模态模型,相比上一代 ChatGPT 新增了图像功能,同时具备 更精准的语言理解能力。GPT 的升级背后是 OpenAI 的大语言模型的进一步演进,同时 带动下游应用的拓展,涌现出新一批应用场景。 1.1. GPT 迭代更新,人工智能掀起科技潮 GPT 升级至四代,模型能力高速提升。ChatGPT 是由 OpenAI 开发的自然语言生成 模型,采用 Transformer 神经网络架构(又称
    0 积分 | 28 页 | 2.68 MB | 6 月前
    3
  • ppt文档 AI 金融大模型的两条技术路线【AI金融新纪元】系列报告(二)

    谷歌将在谷歌云上部署 Claude ,并于推出自研的大模型 LaMDA 的聊 天机器人 Bard ; AWS 推出自有基础模型 Titan 和 AIGC 服务 Bedrock ,以及 AI 编程助手 Amazon CodeWhisperer 。 Anthropic 推出 Claude ,是最接近 ChatGPT 的商业竞品; xAI 发布其首个 AI 大模型产品 Grok ,模型通过 BloombergGPT 率先登场。 BloombergGPT 的混合训练方法使其模型在金融任务上 的表 现大大超过了现有的大语言模型 ,而在通用场景上的表现则与之相当 ,甚至优于现有模型。 AI4Finance Foundation 开发 FinGPT ,为金融大 型语言 模型提供互联网规模的数据 ,以此推动金融领域的开源发展。 2 ) 国内金融垂类模型百花齐放。奇富科技率先宣布推出自研的金融行业 1. 通用+金融VS金融垂类哪方更强 通用 + 金融 VS 金融垂类哪方更强 通用语言大模型 金融垂类大模型 优势 泛用性强 由于在多样化的数据集上进行了训练,通用模 型能够处理各种话题和领域的问题 领域专业性 在金融领域具有专业的理解能力,更精熟于金 融术语和概念 灵活性和利用率高
    10 积分 | 26 页 | 1.36 MB | 3 小时前
    3
  • pdf文档 浙江省地标-大中型体育场馆智慧化建设和管理规范

    主动服务、高效运行、智能监管等功能为一体的新型 建设和运行管理模式。 4 缩略语 下列缩略语适用于本标准。 AI:人工智能(Artificial Intelligence) API:应用编程接口(Application Programming Interface) AR:增强现实(Augmented Reality) BIM: 建筑信息模型(Building Information 智慧停车 管理 建筑设备 管理 能耗计量 设备管理 智能照明 管理 智慧安防 设备平台 网络管理 平台 …… 接入 网关 规则 引擎 数据库 框架 数据 模型 快速 编程 算法 支撑 统一 认证 数据 分发 可视化 引擎 数据 分析 表单流 程引擎 时序数 据库 开放 API …… 消息 服务 …… 竞赛信息 …… 数字孪生 图1 智慧体育场馆总体架构 流程引擎等。 6.4.4 数据中台应为数据采集、计算、存储、加工的技术集合,包括计算服务、数据治理、数据模型、 数据库框架、开放 API、时序数据库、消息服务等。 6.4.5 AI 中台包括快速编程、算法容器、算法支撑、集成 SDK 等。 6.5 技术规范体系 6.5.1 应构建并执行涵盖智慧体育场馆的技术规范、标准体系和明细表。 6.5.2 应制定涵盖数据、业务、技术、项目、安全等要素的关键标准规范研制计划表。
    0 积分 | 20 页 | 613.17 KB | 5 月前
    3
共 24 条
  • 1
  • 2
  • 3
前往
页
相关搜索词
电子行业电子行业AI系列专题边缘语言模型终端部署推动一轮新一轮需求20230531国信证券25金融垂类试用体验纪元新纪元报告复盘伟达发展需要什么什么样硬件20240621华泰40深度DeepSeek平权关注及算力领域2025智能驱动变革浙江大学浙江大学小林重塑开源生态应用爆发持续推升算力降本增效降本增效拓宽落地场景丰富20230712东吴28两条技术路线浙江省地标大中中型大中型体育场馆体育场体育场馆智慧建设管理规范
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩