基于多模态大模型的电力现场安监管控研究及实践20 积分 | 22 页 | 5.05 MB | 5 月前3
盛视科技深耕智慧口岸,海外业务、多模态AI构筑第二增长曲线计算机 2024 年 01 月 08 日 盛视科技(002990.SZ) 深耕智慧口岸,海外业务、多模态AI构筑第二增长曲线 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 公 司 报 告 公 司 首 次 覆 盖 报 告 强烈推荐(首次) 股价:31.99 元 主要数据 季度末,公司完成了对云南河口口岸(1.66 亿元)、瑞丽(含 畹町)口岸(1.06 亿元)两个亿级合同的签署。据我们不完全统计,公司 2023 年以来中标项目金额合计已达 9.78 亿元。 公司携手华为出海,推进多模态 AI 赋能业务场景。“一带一路”极大推动 了我国边境地区口岸数字化的需求,同时也带动了沿线国家的海外口岸数 字化需求,公司目前已联手华为大力布局海外市场。“一带一路”沿线国 家是公司海外市场重点布局的区域,截至 年公司与华为签署协议将在全球海 关领域开展全面合作,包括海关、口岸和综保区/自贸区等产品和解决方案 开发、市场推广、项目拓展、生态构建等。同时,公司也在积极推进多模 态 AI 研究赋能业务场景,已规划多模态 M2-GPT 大模型。 2021A 2022A 2023E 2024E 2025E 营业收入(百万元) 1,127 989 1,849 2,547 3,4000 积分 | 18 页 | 1.93 MB | 10 月前3
电力人工智能多模态大模型创新技术及应用方案(35页 PPT)电力人工智能多模态大模型 创新技术与应用 1 、研究背景 2 、关键技术 3 、应用案例 4 、未来展望 目 录 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科 学;其在历史上经过多个发展时期,形成了不同的技术流派; 深度学习是目前主流。 1950s—1970s 1970s 中期 1980s-2000s 通用模型 无需人类专家标注 高效互联通讯: NVLINK 、 HCCL ( 华为 ) 多模态通用模型: Qwen2-VL 等 . 背景 1—— 人工智能的概念及发 展 数据 算力 的范式,使大规模预训练成为可能。近年来,大模型凭借超大规模参数和海量数据学习,在多模态学习、 推理和通用人工智能方向取得重要进展,为人工智能的发展开启了新的阶段。 大模型 模态扩展 文本 检索增强 图像 / 视频 大规模基础模型 音频 电力大模型 医疗大模型。 Transformer 架构 注意力机制 多模态融合 0upr ake Wefert10 积分 | 35 页 | 7.61 MB | 2 月前3
生态环境保护基于多模态AI大模型智慧诊断应用设计方案(141页 WORD)项目编号: 生态环境保护基于多模态 AI 大模型智慧 诊断应用 设 计 方 案 目 录 1. 引言........................................................................................................................................... ...........................................................................................9 1.3 多模态 AI 大模型的简介......................................................................................... .....22 3. 多模态 AI 大模型概述........................................................................................................................................................23 3.1 多模态学习的定义........40 积分 | 149 页 | 294.25 KB | 2 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证 Formal 空间关系、几何模式和物体交互。这些合成数据集提供了可控环境,用于测试模型的视觉推理能力,并且可以 无限生成训练样本。 ➢ 文本渲染数据 是通过将文本内容转换为视觉格式创建的,使模型能够在不同模态下保持一致的文本处理能力。 通过将文本文档、代码片段和结构化数据转换为图像,确保模型无论接收的是纯文本输入还是截图或照片中的 文本,都能提供一致的响应。这也有助于增强模型在处理文本密集型图像(如截图、表格、公式等)时的能力。 Open Questions: ➢ Long-COT 指令数据扩展是否有助于慢思考推理能力? ➢ 哪种 Long-COT 数据构造方式具有最佳样本效率? ➢ Long-COT 及其扩展是否有助于多模态任务? ➢ Takeaways from RedStar [1]: ➢ Long-COT 在有限数据下增强推理能力:小规模数据集(如 1.3k 个问题)可以显著提升推理性能,尤其是在数学任务中,10 积分 | 76 页 | 8.39 MB | 10 月前3
北大:DeepSeek-R1及类强推理模型开发解读o- series) 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及 Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 过度思考等 未来方向分析探讨 模态穿透赋能推理边界拓展: Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱 强推理下的安全:形式化验证 Formal 空间关系、几何模式和物体交互。这些合成数据集提供了可控环境,用于测试模型的视觉推理能力,并且可 以 无限生成训练样本。 文本渲染数据 是通过将文本内容转换为视觉格式创建的,使模型能够在不同模态下保持一致的文本处理能力。 通过将文本文档、代码片段和结构化数据转换为图像,确保模型无论接收的是纯文本输入还是截图或照片中的 文本,都能提供一致的响应。这也有助于增强模型在处理文本 Open Questions: Long-COT 指令数据扩展是否有助于慢思考推理能力? 哪种 Long-COT 数据构造方式具有最佳样本效率? Long-COT 及其扩展是否有助于多模态任务? Takeaways from RedStar [1]: Long-COT 在有限数据下增强推理能力:小规模数据集(如 1.3k 个问题) 可以显著提升推理性能,尤其是在数学任务 中,10 积分 | 76 页 | 6.72 MB | 10 月前3
低空环境智能感知关键技术及应用方案(43页 PPT)赛 全球包括卡耐基梅隆大学等 在内的 2000+ 参赛队伍 5000+ 篇论文使用并引用 > 关键平台: 建立了复杂环境协同感知数据平台 ( TPAMI 2022 ) 构建了大规模多源、多模态、多任务、非完备复杂环境协同感知数据平 台 VisDrone ,覆盖单机和多机协同感知任务。 国内外广泛使用的无人机视觉基准数据平台 DroneCrowd-TJU 吴文俊人工智能科技进步奖一等奖 l 吴文俊人工智能优秀青年奖 l 天津市自然科学一等奖 l 黑龙江省自然科学一等奖 l 天津市科技进步奖二等奖 l 中国智能交通协会科技进步奖二等奖 l 2022 CVPR 视觉语言多模态挑战赛冠军 l 2023 CVPR 开放世界目标检测挑战赛冠军 l 2024 昇腾 AI 创新大赛天津区域决赛高校赛道金奖 空军“无人争锋”挑战赛冠军 基础平台建设 构建了国内外广泛使用的无人机视觉基准数据平台 视觉-语言-导航 (VLN) 多模态动态感知 多任务协同学习 视觉-语言-动作 (VLA) 多智能体社会化交互 群体态势自主感知 集 群 协 同 感 控 一 体 视 觉感 四 未来工作 一 研究背景 二 VisDrone 数据平 台 · 三 · 低空协同感知脑 混合专家动态融合 数据支撑 大规模、多源、多模态、多任务的协同感知开放数据平台10 积分 | 43 页 | 14.84 MB | 1 月前3
2024年中国人工智能产业研究报告于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 安 全 等 问 题 仍 引 发 一 定 焦 虑 。 技 术 方 面 , Transformer架构依然主导大模型发展,研发侧通过强化学习、思维链优化提升模型推理能力, 同时加速跨模态融合,并在推 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础0 积分 | 51 页 | 3.35 MB | 10 月前3
2024年中国人工智能产业研究报告于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 安 全 等 问 题 仍 引 发 一 定 焦 虑 。 技 术 方 面 , Transformer架构依然主导大模型发展,研发侧通过强化学习、思维链优化提升模型推理能力, 同时加速跨模态融合,并在推 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础10 积分 | 51 页 | 3.35 MB | 10 月前3
2025年应用全生命周期智能化白皮书API 则从传统的服务接口演进为“智 能连接器”,通过动态编排与语义理解,支撑 Agent 间的自主协商与任务分解。此外随着云原生 AI 技术(如多模态大模型、 智能 Agent 开发与运行、检索增强生成、智能应用管理引擎、智能组装与集成、统一可观测、多模态交互、AI 内生安全等) 的成熟,使得 Agent 的开发效率提升数倍以上,支撑智能化应用的多模交互、自主运行、智能进化、环境理解、智能协作、 智能应用平台的八大关键技术 4.3.1 多模态融合技术,实现多模态智能 4.3.2 智能 Agent 开发与运行,实现群体智能 4.3.3 检索增强生成,增强智能体个性化记忆 4.3.4 智能应用管理引擎,让应用自动运行与自主优化 4.3.5 智能组装与集成,扩展应用能力边界 4.3.6 统一的智能体可观测,支撑海量智能应用高效运维 4.3.7 多模态交互,建立双向人机协同体验 4.3.8 自主感知环境,分析数据,做出决策,甚至进行自我 优化和升级。物联网与 5G 技术催生智能系统的群体化演进,形成协同工作的群体,共同完成复杂的任务,实现资源的 优化配置和高效利用。自然语言处理与多模态交互技术的突破,则加速重塑人机协作的认知界面,使得人机协作更加 便捷和高效。复杂系统向“组装式”模块化架构演进则为人机协作提供了灵活可扩展的载体,不同的功能模块可以独 立开发、测试和部署,然后根20 积分 | 59 页 | 8.39 MB | 8 月前3
共 545 条
- 1
- 2
- 3
- 4
- 5
- 6
- 55
