2026智能网络统一监控运维管理平台整体解决方案
5.96 MB
28 页
4 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pptx | 3 |
| 概览 | ||
1 智能网络监控运维管理平台解决方案 2 目录 / Contents 需求理解 0 1 解决方案 0 2 实施方案 0 3 成功案例 0 4 加入星球获取更多更全的数智化解决方案 需求理解 建设目标 1 运维管理能力体系 4 网络统一运维管理建设目标 实现网络运维工作目标与组织业 务目标的统一,助力运维工作降本增效 构建完善的网络运维体系 通过组织、流程、制度的完善、支撑手段的 建设,构建低成本高效率的 IT 运营体系,推 动 IT 运营工作自动化、智能化、一体化化发 展。 具备自动化运维能力 通过自动化运维工具集的建设,减轻运 维人员重复性、繁琐的工作,提升运营 效率。同时,使得运营人员主要精力用 于更有价值的事项。 构建网络一体化监控能力 • 构建从设备、数据、系统、业务的立体一体 化监控,实现网络系统的全面精益运营 • 构建问题发现、诊断、处理的一体化服务能 力,提升了运维服务水平 网络统一监控运维管理体系 自动化 一体化 体系化 5 构建面向“设备 - 数据 - 系统 - 业务”的端到端运营管理能力体系 构建网络统一运维管理能力体系,对基础设备、数据、系统、业务进行统一运维管理,提供网络运维监控、可视化监控、端到端 管理、数据质量保障等多个领域的综合运维管理能力,促进网络运营降本增效。 网络统一监控运维管理能力体系 决策者 基层 管理者 面 向 业 务 的 数 据 驱 动 的 主 动 式 运 维 资 源 采 集 监 控 告 警 流 程 数 据 日 志 配 置 操 作 工 具 运营 分析 系统级可 视化运维 业务级运 维管理 管理 视图 客户 感知 流程管 理 端到端全流程业务管理能力 全链路质量管控,业务服务实时监控与分析,保障 业务服务稳定运行。 综合保障能力 + 精细化运维能力 实现对设备、数据、系统等统一监控 运营保障 统一监控管理能力 构建闭环运维管理,明确职责分工,保障 系统稳定运行。 统一运营管理视图 以数据驱动运营管理,辅助运营运维决策。 统一资源管理能力 物理、逻辑、应用、业务资源的 全面管理 利用数据可视化技术展示综合运营情况,提供统一 运营管理视图,掌握运营态势。 统一运营分析管理能力 统一运营流程管理能力 固话化运维流程、实现运维流程电子化、移动化 统一运营操作管理能力 对日常运维操作通过编排,任务定制形成操作 场景,实现自动化处理故障恢复。 解决方案 总体定位 总体方案蓝图 总体业务流程 总体架构 2 7 总体定位:建设统一运维平台,构建面向业务的数据驱动的主动、智能的运维体系 网络统一运维平台负责对某企业所涉及到的网络设备及服务的运行情况进行全面的监控,及时发现网络的各类异常并通知维护人员,以保证网 络的正常运行,提升网络用户的感知。 构建面向业务的,主动式、 智能化的统一平台运维体系 构建面向业务的,主动式、 智能化的统一平台运维体系 建立快速故障和风险识别与 预警并主动修复的运维能力 建立快速故障和风险识别与 预警并主动修复的运维能力 保障网络运行的 稳定性和可用性 保障网络运行的 稳定性和可用性 确保网络运维工作 与业务目标的融合 确保网络运维工作 与业务目标的融合 网络各类网络设备 路由器 IDS 交换机 防火墙 智能统一网络监控运维管理平台 采集各个网络设备的各项指标 监控数据采集 规则引擎 流程管理 消息管理 大数据能力 AI 能力 非结构化 数据处理 数据建 模 / 标 注 机 器 / 深 度学习 规则模型 中继器 负载均衡器 …… 管理人员 运营人员 运维人员 8 总体方案蓝图 基于大数据技术,参照 ITSS 、 ITIL 等技术与行业标准,建设网络统一运维管控平台,为网络运行注入业务化、规范化、智能化的运维管理 能力,助力构建完善、科学的平台运维体系,以确保整个整个网络的高效运营。 智能统一网络监控运维管理平台 IT 物联网 大数据 云计算 智能故障分析 大屏统一监控 快速故障修复 信息推送与告警 故障报告 数据汇集 深度分析 发现故障 / 风险 数据分析 可视化展示 信息推送 报表管理 资源管理 智能监控 事件管理 运维管理 运营分析 调整算法 查收报告 整体监控 信息配置 处理告警 处理故障 设置任务 数据采集 主动探测 告警、修复 识别、预测 实时任务 定时全面 多维智能 基础能力 统一门户 网络设备 9 总体业务流程 数据采集 匹配规则 智能监控中心 监控告警 运维流程中心 操作管理中心 自动运维 创建工单 分派工单 受理工单 异常处理 工单完成 人工报障 如果符合自动化运 维规则,则系统自 动处理告警 工单关闭 告警消除 告警分析 如果不符合自动化运维 规则,则人工派单 1. 支持被动式设备 数据采集 2. 支持主动式探索 10 10 总体架构:基于“统一技术 + 业务中台”架构设计,支撑“统一规划 + 分步实施“的建设模式 监管 对象 路由器 交换机 防火墙 负载均衡器 IDS 中继器… 统一运维管理平台采用中台技术架构,整个架构核心由基础能力平台 ( 资源平台、采集平台、监控平台、流程平台、运管平台、消息平 台 ) ,业务中心 ( 资源管理、监控预警、作业管理、运维流程、分析 ) 和统一门户 ( 支持 PC 、手机端、大屏多端展示 ) 组成。 后台 计算资源 存储资源 网络资源 标准接口 中 台 基础 能力 核心 能力 平台 平台管理 组织管理 用户管理 角色管理 权限管理 绩效管理 数据管理 配置管理 日志管理 业务流程平台 智能监控平台 资源管理平台 消息推送平台 运维管控平台 采集处理平台 AI 算法引擎 流程管理引擎 分布式框架 分布式存储 搜索引擎 分布式缓存 服务调度 流处理引擎 消息引擎 数据共享服务 前 台 运维 门户 应用 服务 资源管理中心 智能监控中心 运维流程中心 操作管理中心 运营分析中心 统一门户 个人门户 大屏展示 APP 实施方案 3 平台运维门户 资源管理中心 智能监控中心 运维流程中心 操作管理中心 运营分析中心 12 12 统一运维门户 · 面向不同角色与场景,提供可视化的集中监控应用,全面感知网络运行健康度 统一门户以使用角色和场景展现统为主线,面向不同使用者特定场景,实现对业务、网络资源或能力的“可视”、“可控”、“可追溯”,分角色分权 限向决策层、管理、基层维护人员提供统一的运维视图。而数据可视化支持 PC 、大屏、手机等多端展示,让不同人员可以实现随时、随地的可 视化的网络运维管理。 02 数据可视化, 全面感知 03 移动端, 随时随地 高效办公 01 统一门户 提升效率 13 13 全面资源管理 · 对网络资源进行全面、全过程规范管控,实现网络资源的可控、可视、可靠 资源管理中心通过构建 CMDB ,将 x 区网络所涉及的资源数据集中、统一标准化管理,实现资源数据全生命周期的唯一性、准确性、完整性 和可维护性,为网络运维提供准确的基础资源数据,为网络的高效运行与维护奠定基础。 中继器 交换机 负载均衡器 防火墙 路由器 IDS 堡垒机 各类网络资源对象 资源配置维护 资源自动发现 资源关系自动发现 资源关系维护调整 CMDB 标准化 唯一性 准确性 完整性 资源配置管理 资源基线管理 资源下线、报废 资源上线管控流程 资源状态变更管控 资源自动稽核 资源准确性稽核 资源合规性稽核 资源层次关系拓扑可视 14 14 智能监控 - 基础监控 · 对网络资源进行全覆盖实时监控,保障网络相关设备稳定运行 网络各种网络设备 网络统一运维管理平台 资源管理 监控预警 操作控制 数据采集 流程管理 统一监控门户 路由器 交换机 防火墙 堡垒机…… 操作 接口 基础 数据 事件 数据 性能 数据 告警 信息 日志 数据 资源方面:可实现网络资源的全面管控及信息联动; 监控方面:汇聚各种网络设备的告警和性能数据。 将 mx 区网络资源进行统一、规范的管控,实现对网络资源的全面监控,确保 mx 区网络的运行稳定。 15 15 智能监控 - 自主监控 · 主动巡检、探测网络状态,及时发现风险、保障网络的可用性 可以利用自动化测试脚本,命令执行,模拟操作等方式,主动对网络各项资源的运行状况进检测,主动发现存在的故障与潜在风险,改变被 动等待故障发生的监控运维工作模式,保证网络的可用性。 设备故障的主动探测、网络健康自动巡检、网络可用性保障 业务可用测试 发现问题 主动巡检 快速修复 告警通知 问题分析 任务分派 解决告警 设备可用探测 系统状态巡检 设备状态巡检 执行测 试脚本 执行检 测命令 模拟操 作… 16 16 智能监控 - 自主运维 · 智能化监控模型设计,统一告警策略配置,自动故障与风险告警 • 活动会话计数 • 背板利用率 • 大缓冲区命中 • 大缓冲区未命中 • 接口重启计数 • DNS 请求 • CPU 利用率 • 丢包 • 链路响应 • 内存利用率 • 入站出站流 量利用率 • 数据包错误 • 冲突数 • …… 监 控 指 标 …… 监 控 设 备 人工配置 机器学习 监 控 模 型 监控模型库 监 控 告 警 告警 事件 告警规则库 告警 方式 告警内 容模版 告警 联系人 可以根据各个网络设备的各项监控指标建立监控模型,同时,系统能够通过机器学习的方式完善监控模型库,并能够根据告警规则,生成告警。 17 17 智能监控 - 多维监控 · 从多个维度进行网络运行监控,保障网络的可用和稳定性 T 从技术角度发现问题 从技术的角度来对网络运行状 态进行分析,识别、预测并排 除故障,保障网络可用。 B 从业务视角排除故障 从业务的视角来分析故障带来 的影响,排除故障,确保网络 的可用性。 M 从管理视角分析风险 从管理的视角来检查使用状态 与分析问题和风险,确保网络 使用符合管理要求与规范。 部门主管 业务骨干 技术专家 技术 业务 管理 丢 包 延 迟 抖 动 可 用 性 流 量 背 板 带 宽 链 路 响 应 …… 负载均衡器… 中继器 防火墙 交换机 路由器 场景 A 场景 B 场景 C … 18 18 运维流程管理 · 基于 ITIL 标准,建立规范、标准化的运维管理流程,为网络运维保驾护航 基于 ITIL 行业标准,结合信息安全、 IT 运维管理标准及制度,建立标准服务支撑流程,故障定级定界、配套应急响应流程,保障问题、故障的 有序标准化处理。同时,利用各类支撑工具和手段辅助故障与应急处理,实现故障的快速处理,并逐步形成运维知识库,不断管理和技术优化提 升运营服务能力, 为网络的运维管理保驾护航。 应急响应流程 服务支撑流程 工具 & 知识库 监控工具 操作工具 集成工具 经验沉淀 标准方案 应急预案 19 19 高效操作管理 · 建立统一运维操作中心,形成运维操作规范与预案,提升运维工作效率 统一操作管理中心将日常运营管理工作的常态操作与脚本通过技术编排固化形成自动化执行的操作任务,让系统自动执 行、人工触发、或供第三方系统直接调用等方式实现自动化操作处理,提升日常运营工作效率,让运营工作更轻松。 缩短操作执行时间,提高执行效率; 减少人工失误导致的系统故障; 提高运维自动化水平,减少人工投入,降低运营 成本。 降低了关键岗位的技能要求; 消除故障隐患、保证作业效率; 降低日常运维工作中人员的时间投入、精力投入。 自动化操作运营场景 命令 操作 服务 启停 集中 配置 系统 巡检 安全 检测 应急 切换 故障 预案 …… 收到告警 匹配预案 执行任务 告警恢复 故障处理 验证通知 预 案 管 理 预案定义 预案编排 预案定时调度 预案手工调度 预案执行日志 预案管理(审批、权限、增删改查) 预案库 周期作业调度 & 批量操作处理 20 20 集中运营分析 · 挖掘运维数据潜在价值,辅助维护与运营管理决策 统一门户以使用角色和场景展现统为主线,面向不同使用者特定场景,实现对业务、网络资源或能力的“可视”、“可控”、“可追溯”,分角色分权限 向决策层、管理、基层维护人员提供统一的运维视图。而数据可视化支持 PC 、大屏、手机等多端展示,让不同人员可以实现随时、随地的可视 化的运维管理。 网络统一运维管理平台 资源数据 监控数据 告警数据 故障数据 操作数据 日志… 网络 故障 分析 健康 状况 分析 传输 流量 分析 设备 质量 分析 服务 质量 分析 管理 流程 分析 分析网络的故障率与稳定性,发 现问题,提升网络运行的稳定性 和可用性 发现隐患,辅助问题诊断 对资源利用情况进行深入分析, 优化资源利用率,为运营降本增 效 分析网络服务质量,助力优化提 升网络性能 对流程流转进行全面分析,为优 化运维管理流程制度提供支撑 4方案成功案例 22 22 方案成功案例 · 某系统集成商 OMC 平台 - 总体方案 OMC 运营管理平台包括监控管理中心、操作管理中心、业务管理中心、运营管理中心、运维管理中心等功能。数据采集会自动采集被监 控系统的各项运行数据,再由统一处理根据配置的规则对数据进行分析。当发现了故障或风险时由告警引擎负责告知维护人员,而系统管 理员则可以通过可视化报表及时掌握各系统的整体运行与故障情况。 23 23 方案成功案例 · 某系统集成商 OMC 平台 - 全面 IT 监控 24 24 方案成功案例 · 某大型电信运营商 CRM 重构 - 统一监控平台 25 25 方案成功案例 · 某大型电器集团 ITSM 平台 - 总体架构 ITSM 平台 事件管理 问题管理 服务级别管理 知识库管理 系统配置 变更管理 事件记录信息 临时解决方案 SLA 变更信息 变更申请 知识查询 提交知识 消息管理 人员管理 运维管理 服务台 电话 WEB IM 。。。 变更申请 变更信息 报表管理 配置管理 监控 系统 项目 管理 HR 系统 …… 系统 全球员工 26 26 方案成功案例 · 某大型电器集团 ITSM 平台 - 功能架构 事件管理 事件报障 事件升级 关闭事件 事件受理 事件转办 事件处理 问题管理 问题提交 问题验证 问题关闭 问题分派 问题转办 问题解决 变更管理 变更申请 评审组评审 规范性审核 沟通变更 知识管理 知识添加 知识维护 知识查询 知识事件问题关联 流程配置 流程图配置 人员管理 成员信息 成员组管理 重大事件管理 重大事件创建 重大事件关闭 重大事件判定 跟踪及处理 合理性审核 模板管理 环节配置 用户满意度回访 事件单服务评价 回访关闭 用户回访反馈 回访跟踪及处理 调度变更 实施结果 反馈 组织验证 变更 实施变更 回退 反馈变更 结果 关闭变更 变更跟踪 系统配置 专业线人数 变更通知 CMO 配置 服务目录 考核标准 小分类配置 变更审批 SLA/OLA 配置 配置区域 报障来源 角色管理 评价来源 权限管理 运维管理 值班控制台 考核单 加班单 考核流程 请假 / 休假 单 入场单 退场单 置换单 运维工单管 理 报表管理 事件报告 问题报表 用户满意度 报告 重大事件报 告 KPI 考核报 表 变更报告 快捷菜单 我的待办 本组工单 已处理 我创建的 值班控制台 创建事件单 消息管理 事件告警 邮件通知 短信通知 27 27 方案成功案例 · 某大型电器集团 ITSM 平台 - 应用功能 THANKS
| ||
下载文档到本地,方便使用
共 28 页, 还有
6 页可预览,
继续阅读
文档评分


IT运维管理平台建设方案-I运维监控流程
华为eSight商业市场统一运维解决方案