国家电网华为云技术培训华为云数据中台解决方案（33页 PPT）

语言	格式	评分
中文（简体）	.pptx	3
概览
国家电网华为云技术培训华为云数据中台解决方案介绍目录 • 国网数据中台总体方案介绍 • 结构化数据处理方案介绍 • 非结构化数据处理方案介绍 • 数据中台使用说明 2 业务 xx 中台 5 数据中台 6 物联平台数据治理数据接口注册数据接口管理标签管理 AI 使能 BI 报表数据可视化设备管理（ DMP ）主数据管理数据模型管理数据标准管理模型开发数据预处理数据质量管理数据生命周期管理 AI 架构设计数据分析数据集成全业务统一数据中心 4 PaaS 应用管理微服务治理服务目录 Devops 通用公共服务应用发布注册中心服务发布 API 网关编排调度配置中心服务订购分布式消息弹性伸缩调用链服务自定义 GaussDB100 监控日控制台 GaussDB 200 & 交换数据复制管理元数据数据中心 7 安全应用安全主机与虚拟化安全网络安全终端安全身份认证与访问管理安全管理 3 IaaS 计算存储网络混合云云边协同应用云运维云运营计量计费管理泛在电力物联网平台层方案全景图项目 / 需求管理代码检测流水线自动测试结构化数据采集非结构化数据采集流式数据采集结构化数据人员域物资域物资域非结构化数据市场域项目域物资域连接管理（ CMP ）电网业务资源中台设备管理工程项目电网安全负荷分析智能巡检能效服务数据中心 8 统一管理客户服务中台贴源层共享层分析层 2 无线网络 / 物联代理电网 OMS 系统电网 OA 办公系统电网财务系统综合能源服务系统设备鉴权设备访问权限管理设备配置管理输电业务系统配电业务系统计费 / 入账数据处理规则引擎报表统计资产管理 3 1 终端采集服务管理资源对象管理健康度分析告警管理性能管理拓扑管理用户管理运维权限管理角色管理容量管理 AI 应用场景服务生命周期管理服务列表数据仓库中台志大数据分析 DWS （ GaussDB200 服务化）数据管理统一接入、统一管理、统一服务的国网数据中台架构数据服务（ DAYU ） Kafka 消息中间件结构化业务类采集类 ERP PMS 用采 J 营销系统财务系统共享层贴源层 MRS IoT 数据一级系统 HCS8.0 数据中台技术架构图分析层 DCS( 缓存 ) DLI( 跨源分析 ) DLI( 实时流计算 ) CSS( 云搜索服务 ) 报表分析 GES ( 图引擎服务）标签管理模型层近源层 E 文件 ETL 数据质量管理元数据管理数据开发数据资产模型管理数据安全人力资源管理 IoT 平台 4 其他层次特点选型组件贴源层 • 数据只增不减，具备审计能力，并提供给共享层做数据恢复 • 提供低廉的存储能力，以供海量数据存储 • 提供高并发数据写入能力，以供数据高效写入 • 数据不对外开放，数据访问以支持海量数据审计和高可靠为主 MRS （ Hive ）表共享层 • 需要提供高效的访问能力 • 需要支持数据发放能力 • 需要支持高效的数据更新，删除能力 DWS 分析层 • 高并发的查询能力 • 强资源隔离能力 DWS 迁移工具 DRS ：实现将数据从 Oracle 到 Kafka DAYU ：实现从 Kafka 到 Hive/DWS DRS 、 DAYU 数据使能模型管理，质量管理，资产管理，血缘分析等 DAYU 跨源分析可以支持数据源在 RDS 、 DWS 、 HBase 、 Redis 等不同数据源的跨源分析 DLI(Spark) 流处理支持通过 SQL 语句编排流处理作业，简化编程复杂度 DLI(Flink) 数据中台各层选型原因说明 5 数据中台主力服务介绍 • DRS • MRS • DWS • DLI • DAYU 6 01 多来源支持各种来源数据库 • 无论您的数据库是在：本地机房 • 还是在：其他云 • 还是在：华为云内部均支持 02 多场景通过 DRS 可以轻松，便捷的实现多种场景： • 数据库迁移 • 数据同步 03 多网络支持多种网络方式您可以选择： • 公网网络 • 华为 VPN 网络 • 专线网络 • 华为 VPC 网络 04 多类型支持丰富数据库类型 • MySQL • Oracle 支持消息系统 • Kafka 数据中台组件介绍 -DRS 7 企业级 • 高可用部署，所有管理节点均实现 HA • 支持 Kerberos 安全认证与 RBAC • 多级租户管理 • 支持数据表加密 • 强大的服务监控管理系统 • 支持滚动补丁升级，业务无中断易运维用户无需关注硬件的购买和维护，专门研发的企业级集群管理系统，可让用户更好的监控和管理大数据平台，并可通过短信 / 邮件的方式，提醒用户平台异常高安全经由华为专业的安全团队和德国 PSA 安全认证测试，提供云上高安全的大数据服务。基于 Kerberos 认证，实现了基于角色的安全控制以及完善的审计功能低成本 • 灵活配置节点与磁盘规格 • 灵活配置集群规模 • 灵活配置大数据软件及版本 • 支持计算存储分离，作业运行完自动销毁 • 支持自定义策略，集群自动弹性伸缩 O&M 集群管理平台数据接入实时流分析批处理授权 DSL Spark SQL Hive Presto 分布式计算框架 MRS 服务：云时代全栈企业级大数据服务 HDFS / HBase IaaS 分布式存储 ORC File RC File Parquet CarbonData P a a s Yarn / Zookeeper 轻量增强深度增强完全自研 Spark Streaming Spark Superior Scheduler Storm MapReduce/TeZ OS Auth Kerberos Storm Sqoop Flume Kafka 8 数据实时洞见 • 支持流式数据实时入库、业务数据准实时同步 • 数据入库即可查，零等待 • 万亿数据查询分析毫秒级响应极简易用 • 数据迁移工具，最大化降低 TTM • 兼容标准 SQL 2003 ，内置丰富 OLAP 函数 • TPC-H 、 TPC-DS 真正 100% 支持企业级、安全可信赖 • 支持分布式事务 ACID ，数据强一致保证 • 满足史上最严安全合规要求 GDPR • 业界唯一数据库防火墙服务协调节点协调节点 10GE/25GE/40GE 高性能网络计算节点计算节点计算节点业务场景标准接口 MPP 大规模并行处理引擎自动云备份 IoT 互联网 BI 可视化运营分析标准 ANSI SQL 标准 JDBC 、 ODBC DWS ：实时、简单、安全可信的企业级数据仓库金融企业数据仓库 / 集市 EB 级对象存储服务 OBS 游戏决策分析 9 企业经营分析业务开发挖掘预测 • 逻辑统一数据视图 • 资源隔离，数据权限控制与分享 • 跨源分析优化器 • 关联 AI 能力图片日志数据时序数据空间地理数据数据表 OBS Kafka CloudTable DWS RDS 方案特点： n 统一分析入口 n 多数据源，免搬迁 n 批流结合 n AI 能力低门槛使用 n 企业多租户应用场景简介：随着信息化时代的来临，企业数据产生越来约迅速，数据种类越来越多，体量也越来越大，如何挖掘数据的价值是企业信息化首要问题，在数据变成价值之前，往往需要对大量数据进行加工转换，预先汇聚等各种 ETL 处理 DLI ：数据跨源分析，打破数据孤岛，海量数据高效数据处理 10 DLI 》》数据中台关键技术能力产存消监管控平台智能 AI ：存储 +AI ：定期推荐存储优化策略，如增加索引， MV 等，数据越存越合理计算 +AI ：根据负载和业务 SLA ，自动调整资源调度运营 +AI ：脏数据发现，数据潜在关系发现用户应用分析》数据服务面向多种任务，最新的大数据和 AI 能力 • Serverless ，根据负载自动伸缩 • 原生接口，企业应用无缝迁移数据采集采集，同步数据规范数据表 / 模型设计，约束规则定义数据治理标注，智能 ETL ，治理数据资产数据血缘，全局视图数据服务支撑业务主题 / 画像 / 指标的访问查询检索数据中台组件介绍 -DAYU 敏捷可视能力自助分析能力快速开发能力全局治理能力高效探索能力 DWS/Hive/DLI/RDS Serverless 架构数据湖底座 DAYU 可管理丰富的数据源类型 Native 生态接口离线迁移实时接入 DAYU 平台：一站式数据运营平台 11 DAYU 数据集成 DAYU 数据服务第三方工具数据消费 ca ffe 目录 • 国网数据中台总体方案介绍 • 结构化数据处理方案介绍 • 非结构化数据处理方案介绍 • 数据中台使用说明 12 结构化数据处理—数据特点生产库多由 Oracle 或者 MySQL 组成，占生产库的 90% 生产库一般会存在更新删除，比例一般为 80% 新增， 19% 更新， 1% 删除生产库可能会存在无主键表生产库中，会出现 LOB 字段， GIS 字段，自定义字段生产库的总量（业务数据 40T ，量测类 600T ），但是同步到数仓，希望能做到只增不减生产库的表的数目一般特别多，达到 10 万张，数据迁移效率是首要考虑的点每天的增量数据不算太大（ 40G/XX 省） 13 1. 备库不是数据中台必须组件。备库在读写分离、缓解高并发读压力等实际需求情况下，按需建设并依实际需求接入数据。 2. Kafka 一收多发，并发接入 MRS 、 DWS 3. 到 MRS 、 DWS 的数据需要 ORC 转换、数据抹平、增量到全量的合并通过内置程序完成，使用大数据平台算力。结构化数据经 DRS 实时抽取至 Kafka ，经 DAYU 内置程序并行写入 MRS 和 DWS 中。 DWS 分析层共享层模型层 Cim 模型 1:1 映射表近源层 ( 待关联表） Cim 模型需多表关联的表系统原有备库图例 ERP 、 PMS 等业务数据流用采类数据流，源库为 oracle 虚线为规划中的数据流 MRS 镜像数据审计数据（按需） DAYU 数据解析 3 DRS 实时抽取备库 RDS 备库（可选，按需） DRS 实时抽取 2 数据管理 ETL 数据开发元数据管理模型管理 5 贴源层结构化数据处理 - 总体流程业务类 ERP PMS 营销系统财务系统 DAYU 数据解析 4 数据资产数据安全数据服务（ DAYU ） Kafka 消息中间件采集类用采数据质量管理结构化 1 2. 历史 + 增量平滑同步 2. DDL 数据 2. 支持特殊分隔符 3. 全量行记录补齐 3. JSON 格式 3. 支持按分区表入库 1. 临时表 4. 实时处理 4. AVRO 格式 4. 支持导出到临时表 2. 全量表 5. 低权限 6. 高可靠 7. 并发度 8. 性能 >30MB/s 9. Oracle 版本支持（ 10/11/12/ ） 10. 需要支持白名单 / 黑名单配置 5. 增加时间戳和操作类型字段等扩展字段 6. 数据去重（临时表 + 全量表） 7. 数据合并（临时表 + 全量表 DRS Kafka 1. 解析日志 1. DML 数据结构化数据处理 - 特点说明 HBase DWS Hive 、 Spark DAYU 1. 按库同步 15 Oracle DML 新增数据： { "table" : "{schema.tablename} ", "op_type" : “I”, "op_ts":"2019-11-26 22:26:24.000108", "current_ts":"2019-11-26T22:26:30.252000", "pos":"00000000000000008226", "after":{"id":2,"name":"g"} } 更新数据： { "table" : "{schema.tablename} ", "op_type" : “U”, "op_ts":"2019-11-26 22:26:24.000108", "current_ts":"2019-11-26T22:26:30.252000", "pos":"00000000000000008227", “before":{"id":1,"name":“terry"}, “after":{"id":1,"name":“luna"} } 删除数据： { "table" : "{schema.tablename} ", "op_type" : “D”, "op_ts":"2019-11-26 22:26:24.000108", "current_ts":"2019-11-26T22:26:30.252000", "pos":"00000000000000008228", “before":{"id":1,"name":“terry"}, “after":{} } 建表语句 { "recordType": "table", "db": "db1", "schema": "", "name": "tab1", "columns": [ "col1": { "name": "col1", "position": 1, "type": "int", "precision": 10, "scale": 2, "length": 11, "default": 0, "nullable": "no", "autoIncrement": "yes", "isPrimary": "yes", "charset":"utf8", "comment": "" }, "col2": { "name": "col2", "position": 2, "type": "varchar", "precision": , "scale": , "length": 100, "default": '', "nullable": "yes", "autoIncrement": "no", "isPrimary": "no", "charset":"utf8" } ], "constranits":[ {"name": "pk1", "type": "primary", "columns": ["col1"]}, {"name": "uk1", "type": "unique", "columns": ["col2", "col3"]}, {"name": "cons1", "type": "check", "content": "col4 in ('M','F')"} ], "charset":"utf8" } 结构化数据处理 -Kafka 消息格式 16 DDL 字段类型范围 Hive 类型 DWS 类型 INTEGER 4bytes INTEGER INTEGER Char 1-2000 Char Char Varchar2/varchar 1-4000 String TEXT NCHAR/NVARCHAR2 1-4000 String TEXT Number 1 x 10-130 to 9.99...9 x 10125 -1 x 10-130 to 9.99...99 x 10125 Decimal Numeric Number(1) 1byte Tinyint TINYINT Number(2)-Number(4) 2byte SmallInt SMALLINT Number(5)-Number