2025年构建多技术融合的湖仓一体化平台,打造银行数据智核新引擎报告言及建设工作。 演进路线(一) 结构化数据 贴源 模型 集市 BI 报表 集市 半/半结构化数据 历史 归档 实时 计算 数据仓库 BI 报表 数据湖 结构化数据 贴源 模型 集市 BI 报表 集市 半/半结构化数据 历史 归档 实时 计算 湖仓分体 数据探索 机器学习 结构化数据 模型 集市 BI 报表 集市 半/半结构化数据 湖仓一体 — — 湖内建仓 数据探索 机器学习 结构化数据 模型 集市 BI 报表 集市 半/半结构化数据 湖仓一体 — 湖仓分体 数据探索 机器学习 实时 计算 流批 一体 贴源 归档 湖仓分体,数据仓库与数据 湖分离搭建,通过数据交换 平台完成数据同步。 特点: (1)双路建设,双路加载, 耦合度低 (2)互不依赖,使用独立, 管理独立 湖内建仓,将数据仓 库与大数据平台的功 数据 集市层 报送 集市 外部/法 人 数据区 历史 数据区 仓模块 实时 数据区 湖模块 报表 集市 财务 集市 客户 集市 绩效 集市 风险 集市 半结构化/非 结构化 数据区 逻辑加工区 ...... 实时 数据区 明细 数据 汇总 数据 指标 数据 缓存层 贴源层 标准层 通用汇总10 积分 | 21 页 | 3.74 MB | 5 月前3
2025年AI CITY发展研究报告——“人工智能+”时代的智慧城市发展范式创新数据是信息的载体,是描述客观世界的符号记录,数据的整合汇聚是构建知识与高质量数据集的基础前提。首 先,通过API接口对接、网络爬虫、文件导入、边缘计算等技术采集外部数据资源,包括结构化数据(如关系型数据 库、Excel表格)、半结构化数据(如JSON/XML日志)、非结构化数据(文本、图像、音频等)。同时,依托政府或 企业内部的数据共享平台、数据开放平台等,实现内部数据的集中汇聚。其次,运用ETL工具完成数据清洗转换,通 资源的准确性与一致性,形成可供分析的基础数 据资源。 知识库: 知识是从数据中提炼出的有价值的信息,是对数据的深度理解与抽象概括,知识的形成是数据价值升维的过 程。首先,对基础数据资源进行结构化处理,通过统计分析、文本向量化、图像特征提取等技术构建输入特征空间。 其次,选择监督学习、无监督学习、深度学习算法等适配算法,利用梯度下降等优化方法拟合数据分布,通过交叉验 证和正则化避免过拟合 量产业特质、业务逻辑、价值度量上与人工智能技术的匹配度,实现“双向奔赴”。一是优先聚焦数字化基础雄厚、 工具应用广泛且数据资源丰富的主导产业。如已部署RPA、SQL、BI等应用的业务领域,拥有充足结构化数据集。二 是锚定核心业务。聚焦核心业务流程中的关键流程,选择小切口突破,基于业务特点深挖AI赋能应用潜力。三是推动 大小模型协同。充分释放大模型泛化能力,处理语言理解等擅长任务,同时借助小模型精准攻克特定难题,以大小模20 积分 | 78 页 | 5.45 MB | 4 月前3
中兴通讯自智网络白皮书2025个闭环的、高效的创新生态。 23 中兴通讯高阶自智网络演进方案 数据引擎通过数据采集、数据治理、数据存储、数据处理等功能来支持智能应用。支持多源采集与格式处理,支持多 种数据源和结构化、半结构化、非结构化数据,提供数据转换(格式、编码等)和清洗(去重、处理缺失值等),支持湖 仓一体的数据存储,支持对数据安全与隐私保护,提供数据加密和访问控制,并提供数据接口、数据共享和交互。未来 Gen 要求,大大节省工作量,将交换机故障识别和诊断过程从140分钟以上,降低到20分钟以内。 图10 网络云故障智能处理方案图 29 中兴通讯高阶自智网络实践案例 用户意图输入 通信大模型 AIOps小模型 结构化大模型 (具泛化能力) 训练平台 离线训练 CIIA 运维应用 看网助手 故障助手 值守助手 ... 多智能体 场景 智能体 监控 智能体 故障处理 智能体 KPI分析 智能体 知识问答10 积分 | 41 页 | 7.03 MB | 6 月前3
中国建筑业企业数字化研究报告(2024)-北京中建协认证中心大数据分析技术是指利用先进的数据采集、存储、处理和分析技术,从海 量、多源、异构的数据中提取有价值信息的过程和方法。在建筑业中,大数据 分析主要处理来自设计文档、BIM 模型、施工记录、设备传感器、市场调研等 多种渠道的结构化和非结构化数据。这些数据具有数量庞大(Volume)、类型 多样(Variety)、生成速度快(Velocity)、真实性要求高(Veracity)和价 值密度低(Value)等"5V"特性。 术使机器能够"看懂 "施工现场和建筑构件,实现自动检测和识别。自然语言处理则使 AI 系统能够 理解和生成人类语言,支持智能文档处理和交互式设计辅助。知识图谱通过构 建概念间的关联网络,形成结构化的知识体系,为 AI 系统提供推理和决策的基 础。 在建筑领域,AI 技术的实现依赖于高质量的建筑数据集、适配建筑特性的 算法模型、高性能的计算基础设施以及专业领域知识与 AI 技术的融合应用框架。 针对地基基础施工、基坑开 挖或地下空间利用等进行优化模拟和可行性论证。导则还强调了数据格式的统 中国建筑业企业数字化研究报告 40 一与交付标准的重要性,需要对数据进行结构化的分解,并以通用、开源的数 据格式进行交付,以便后续设计、施工环节可完整调用。 最后,安全与合规性也是数字勘察技术体系的重要方面。对由无人机、激 光雷达、卫星导航等技术获取的海量地形地貌信息,应遵循统一的格式与标准,20 积分 | 115 页 | 10.19 MB | 5 月前3
中国移动:云智算技术白皮书(2025)开发流程智能化、协作效率高效化、应用落地简便化, 助力规模化 AI 应用落地。 2.5.5.1 向量数据库 人工智能所需数据的复杂性和多样性正以前所未有的速度增长,而传统数据 库技术不适用于海量的非结构化数据处理。向量数据库针对非结构化数据的处理 进行优化,尤其擅长高效的相似性搜索,通过将数据转化为高维向量,实现对文 本、图像、音频等复杂数据的高效处理,正在成为 AI 时代不可或缺的关键数据 处理技术。当前中 维的高维数据,与大模型无缝集成,广泛应用于人工智能、机器学习、推荐系统、 图像识别等领域。 面向近期,针对不同类型的向量数据和应用场景,增强对全文检索、多路检 索召回和融合排序等关键技术的支持,获取更全面的非结构化数据信息,提高检 索结果的相关性和准确性。 19 面向中远期,向量数据库进一步与大语言模型(LLM)等人工智能技术深度 融合,更好地支持 RAG(检索增强生成)等应用场景。持续提升自适应能力,能0 积分 | 30 页 | 716.31 KB | 5 月前3
《行业瞭望》矿山专刊--新华三的数据,也包 括一些结构化、半结构化和非结构化数据。实现集团全量数据应汇尽汇,应接尽接的目标。 采:采数据。对分布在集团不同单位、不同系统、不同地域、不同结构、不同方式的数据, 进行分类、分级采集,针对物联网、煤炭生产、供电、供热预警数据通过流式方式实时采集, 采集时间可达到1秒之内。针对人资、综合管控等结构化数据采用T+1离线数据采集模式, 定期采集。针对非结构化数据定时通过文件方式采集。 集。 存:存数据。针对不同采集方式、不同结构的数据,利用Hadoop存储非结构化数据和离线 数据,利用MPP分布式并行数据库存储实时数据、快速查询数据。实现不同场景的数据分类 高效存储,提升海量数据处理和快速查询的效率。 算:算数据。根据业内行标和自身业务实际情况制定主数据、元数据、数据标准等管理办法 和标准管理体系,为数据治理、质量监控提供标准。数据快速响应:构建离线数仓和实时数 仓 Flink 计算 归集库 主题库 专题库 DE大数据平台 HDFS Hbase 生产分析 供热分析 告警分析 产量预测 ……. 融 合 集 成 平 台 流式数据 半/结构化数据 非结构化数据 语音/文件、图片/….. AI 分析 批数据处理 数据运营平台 数据标准 数据治理 数据开发 …… MPP 实时数据分析 历史数据分析 汇 采 存 用 算 160 智慧矿山技术专家10 积分 | 189 页 | 25.75 MB | 6 月前3
2025年量子计算应用能力指标与测评研究报告-量子信息网络产业联盟-对接的核心性能指标,尝试从应用需求层面评估量子计算真实能力, 从而能够综合判断量子计算技术成熟度,推动当前 NISQ 实用化。 特别需要说明的是,量子计算目前仅在量子模拟、大数分解、线 性系统求解、非结构化搜索等方面有理论优势,在组合优化、机器学 习方面有潜在优势,但暂时缺乏理论证明。应用评测只是针对给定计 算问题与量子算法,在给定量子计算系统上,与经典计算进行对比, 目标是评估该类问题是否适用量子计算,而不是给出该类问题是否必 的引入带来了极大的模型训练与推理资源开销。 在数据处理方面,通感算智融合的移动网络无论网络内数据还 是网外数据都将爆炸式增长,包括网络状态数据、基站侧数据、用 户侧数据、信令数据、运维数据、专家经验数据等结构化与非结构 化数据。高效的网络运营,离不开高效的大数据处理与支持。网络 大数据处理包括数据清洗与集成、数据降维、数据特征提取、知识 提取等,这些通常基于统计类模型或神经网络类模型来实现。海量0 积分 | 46 页 | 1.93 MB | 5 月前3
CIC灼识咨询:2025中国供应链金融科技行业蓝皮书资产支持票据,是一种债务融资工具,该票据由特定资产所产生的可预测现金流作为还款支持,并约定在一 定期限内还本付息 ABS Asset-backed Securities 资产支持证券,是指以基础资产未来所产生的现金流为偿付支持,通过结构化设计进行信用增级,在此基础上发行资 产支持证券的过程 BaaS Blockchain as a Service 区块链即服务,是指将区块链框架嵌入云计算平台,利用云服务基础设施的部署和管理优势,为开发者提供便捷、高 信用评估结果 灵活贷款审批 智能化 可视化 债权多级 拆分流转 信用 全链条渗透 自动化 依托多维度、多层次 数据,降低供应链金 融风险水平 1 2 3 打通数据信息 风险结构化 供应链金融科技解决方案提高供应链金融运营效率,降低风险水平,让服务渗透全产业中小微企业 供应链金融科技解决方案的价值分析 -供应链金融科技解决方案能提高供应链金融的融资运营效率,降低风险水平,20 积分 | 30 页 | 7.13 MB | 5 月前3
趋势纲要 2050 : 技术与创新讲故事等领域 - 具有挑战性 关于人类优越性的传统假设 创造性任务 • 组织应该评估 Human - AI 是否 系统优于人类或 AI 独立工作。 AI在创意领域展现出巨大的潜力,可通过明确的指导原则和结构化 流程进行战略利用。 • 在创造性任务中的人与人工智能协作可以显示出明显的优势 , 例 如,生成文本、图像或视频。人类提供创新的方向,而AI则通过执 行重复性过程来提升效率。 31% 23% • 公司需要评估其价值链,以识别生成式AI的高度影响机会,可以使用如罗兰贝格AI就绪雷达等工具来与竞争对手的采用情况进 行基准比较 • 进一步地,公司应设定清晰的战略目标,定义生产力基准,并结构化非结构化数据以确保AI的有效性。组织可以 根据需要优化现有AI模型或开发自定义模型 • 公司还可以实施有针对性的AI用例,评估并逐步改进其性能,在整个组织内逐步 推广,同时严格维护数据安全和隐私标准 •0 积分 | 72 页 | 2.97 MB | 5 月前3
MoonFox月狐数据:2025年智能PPT行业市场研究报告目前行业应用普遍具备基础PPT生成能力并快速向高质量AI生产进阶 情景感知交互 能力提升 智能处理 精确度提升 全流程理解 能力提升 21 • OpenAI-o1:具备通用推理能力 • OpenAI-o3:结构化的内部推理 过程解决编程 • Deepseek-R1:提升思维深度与 推理能力,在数学、编码、常识 和写作等多方面测试位列前茅 新机会伴随着大模型技术提升而形成,智能PPT商业模式初显,市场将持续整合20 积分 | 23 页 | 4.73 MB | 4 月前3
共 21 条
- 1
- 2
- 3
