企业IT统一智能运营管理解决方案机房环境 硬件设备 网络 中间件 业务 数据 系统 应用 IT 监控运维 业务运营 人 员 方 法 流 程 工 具 可用性 成本 连续性 性能 体验 设备故障 系统异常 系统故障 系统变更 企业 IT 监控运维是企业业务正常与高效运转的基础保障 系统监控 维修更新 业务保障 应用反馈 6 IT 运维现状 · 被动救火式运维模式,业务风险高、运维人员疲于奔命 新系统上线越来越多 业务访问量快速增长 用户体验要求越来越高 业务处理时效性更高 业务中断容忍度更低 高层对 IT 部门考核更严…… 系统架构越来越复杂 故障类型越来越多 系统负载更大、故障风险高 故障排查、修复更难 技术快速演进与新技术应用 人员技术能力与经验不足 人员成本越来越高 知识经验无法沉淀…… 外部 挑战 内部 挑战 规模更大 要求更高 变化更快 定时粗略巡查 等待故障报告 人工故障处理 实时全面监控 分散维护系统 集中监控系统 自动故障处理 提前故障预警 随着业务对 IT 运维提出的要求越来越高,原来传统的被动救火式的 IT 运维模式已经不能 满足企业的要求,无法为业务的发展提供保障 只有借助当前先进的技术,构建主动巡防式的 IT 监控与运维体系,能够提前预防并智能 化处理系统的各类故障,才为业务的快速发展保驾护航,满足企业对10 积分 | 33 页 | 4.92 MB | 6 月前3
中国联通数字化监控平台稳定性保障工具落地实践海 站 几个 核心系统 单系统 应用维度根因定位 故障点人工恢复 系统具备应急预案 被动应急 统一变更入口 故障统一调度 工具建设 数字化转型中系统安全生产痛点 问题 数智运维挑战 n 端到端稳定性保障体系缺失, 自动化、智能化故障处理能力不足 n 故障处理过多依赖专家经验,故障没有沉淀为有效的资产 n 故障处于被动防御,救火,运维大数据未被合理价值挖掘 分布式架构挑战 中间件、云平台、 基础设施各管自身 集团 + 省分 几百套系统 跨系统全链路 定界诊断 故障自愈 混沌工程 主动预防 变更追踪 变更管控 集团 + 分子公 司 整体态势感 知 体系建设 故障发现 与诊断 故障恢复 与应急 故障预防 故障调度 体系演进 稳定性保障工具建设历程 一个目标,依托四大保障,聚焦研运流程中四个阶段,对应十五项核心工作,严格把控七个关口,将 安全生产 稳定性保障左移,在入网控制时介入,对入网控制、发布上线、故障预防、故障发现、故障定位,故 障恢复、 故障改进提供端到端工具支撑。 GO PS 全 球 运 维 大 会 2 0 2 3 · 上 海 站 做实安全生产,提升 IT 系统稳定性 核心业务链路深度治理 设计关20 积分 | 24 页 | 2.00 MB | 4 月前3
A级数据中心建设运营汇报方案(29页 PPT)检测仪器:编制与施工进度计划相匹配的检测仪器使用计划,特别是各 系统的测试和验证,应提前做好资料收集,仪器准备,包括福禄克网络 测试仪,温湿度计,热像仪,气流计、照度计等。 物资调配 调试与测试 运维 测试 故障切 换 灾难预 演 运维应 急流程 验证 功能 测试 ATS 系 统联调 UPS 系 统联调 柴油发 电机系 统联调 BMS 测试 散热系 统联调 精密空 调系统 联调 冷机系 / 工单)考核与验收结果的审批;负责整个项目执行过程的管控(进度、质量、文档、成本、验收等),确保项目任务 按时交付 运维工程师:常驻现场,通过不同的方式响应客户的需求,现场及远程为客户诊断、排除故障,对客户的问题进行汇总、分析,并提 出合理的解决办法;负责项目任务的分析、工单拆分与下发,负责服务厂商服务的定期考核 专家顾问组:由多名资深技术专家组成,主要负责对数据中心的规划设计,对用户提供安全评估、性能评估、稳定性评估、可靠性评 全评估、性能评估、稳定性评估、可靠性评 估、可用性评估,隐患预警报告;高级技术培训 技术资源部:由几十名资深专业技术人员组成,负责项目的规划;项目工程的实施;日常运营维护的远程、现场支持服务;用户故障 的诊断排查; 服务支持手段 心 为 客 户 提 供 7×2 4 小 时 响 应 的 服 务 平 台, 客 户 若 对 本 项 目 产 品、 技10 积分 | 29 页 | 11.70 MB | 1 小时前3
AI+工业设备预测性维护解决方案(34页 PPT),并依据该状态发展趋势和可能的故障模式 ,预先制定维修计划 ,确定机器应该修 理的时间、 内容、方式。预测性维护可以为企业带来以下效益: ☐ 降低维保成本 ☐ 延长设备寿命 ☐ 提高设备使用率 ☐ 减少库存成本 ☐ 提升生产安全 维护触发点 固定周期,不考虑设备实际 状态,可能带来过度维护 必要时,预留足够应对时间 给一线人员在故障前做出应对 维护方式 根据零部件的平均损坏率进行维护, 遵从操作手册(凭经验) 有计划无目标 事后维护 故障发生后 最昂贵的维护 事后维修比事前预防的成本高约 50% 以 上 状态监测 健康评估 异常监测 故障预测 故障诊断 维修决策 图形 1 解决方案 解决思路 将数据和知识库进行深入融合,构建 AI 模型库: 如整合设备传感器数据与知识库中的故障案例,预测 剩余使用寿命(如“轴承预计 AI+ 设备管理(预测性维护) 基于设备运行状态——实时监测与数据分析的主动维护策略: 持续采集设备运行参数(如振动、温度、电流等); 利用机器学习或物理模型预测设备劣化趋势; 在故障发生前,精准定位风险点并制定干预计划。 全面设备管理体系的三类方式比较 模式 特点 事后维护 " 不坏不修,坏了才修 " ,缺乏事前准备,易导致停工时间延长并扰乱生产计划。 预防性维护 按照10 积分 | 34 页 | 3.98 MB | 2 天前3
中国移动IT云智慧运维创新实践(35页 PPT)部署的区域 ,所有探针全 MESH 多协议探测, 统一的健康度计算、告警 ,并呈现在态势感 知拓扑。帮助运维人员快速判断应用故障是 否与网络有关。 全局网络拓扑 网元自动发现: 基于网络运行数据生成网 络拓扑 ,从架构、 区域、设备到链路整体可 视化 以健康度评估模型为触点 ,构 建故障场景 , 自动定位故障根因 极简网络发现:基于标准协议, 自动发现 网络设备、连接关系 智能监测: 发现网络后自动采集网络时延、 丢包率、利用率等网元指标 ,动态更新 星空雷达网络 AI 分析平 台 构建数字孪生模型 l l l l l l 自动感知故障 自动发现网络 能力开放 智能分析 故障定界 依托数据中心全景视图大屏 以及聚合展示 ,以网络存活度、平均响应时延、平均丢包率等指标对批量设备的 IP 进行监测 ,星空雷达关注的重点不 再 是单个网元的故障 ,而是可能引起大规模故障的异常网元集合。 星空雷达网络 分析平 台 AI 将网络抽象为设备、链路、路径三类网元 ,而网元健康度基于不同的计算因子采用扣分机制 ,结合历史波动、 异常样本, 自动分辨计算指标的异常状态20 积分 | 35 页 | 8.58 MB | 2 天前3
智慧煤矿建设现状与发展方向(198页PPT-中国矿业大学)智能集成控制平台 一体化生产控制系统 一体化生产管理系统 1 个系统 煤矿大数据及云服务系统 煤矿安全生产数据网络传输体系 大数据煤矿重大灾害预警与专家决策平台 基于大数据的煤矿关键设备故障诊断与远程维护平台 基于专家系统的煤矿安全专家知识库 煤矿机电设备生产企业技术服务知识库 基于云计算的煤矿安全生产信息综合数据库 5.1 智慧煤矿建设目标与建设内容 含义 范围 具体建设内容 主通风机监控系统 5.1 智慧煤矿建设目标与建设内容 5 个 中 心 生 产 运 营 管 理 中 心 基于 GIS 的“一张图”生产协同管理系统 智能决策支持系统 大型机电设备故障诊断系统 智能物流管运系统 移动互联煤矿安全生产综合管理信息系统 矿井数字化三维可视化系统 矿井信息化管理软件( ERP ) 5 个 中心 安全 监测 中心 安全监测监控系统 井下人员精确定位管理系统 矿井有线调度通信系统和矿井行政通信系统分别设置,并应能互通;通 信线缆应分设两条,从不同的井筒或一个井筒保持一定间隔的不同位置 进入井下配线设备;交换机的处理机、电源应采用热备份结构,具有告 警、故障自动诊断、倒换等功能;具有备用电源,电网停电后,系统中 设备的备用电源连续工作时间应不小于 2h ;系统最大通信距离应不小 于 15km 。 移动通信选用 WiFi 或 4G 等技术的矿用通信系统;能自动识别手机终30 积分 | 197 页 | 44.91 MB | 2 天前3
智慧工地管控数字化解决方案物料管理系统 设备计划管理 年计划任务发送、本年度购置计划及上年度结转 计划填报、设备购置计划审批、查询 设备维保管理 系统可根据设备状态制定标准的预防性维护计划, 预测性维修集装备状态监测、故障诊断、故障 (状态)预测、维修决策支持和维修活动于一体 物资现场管理 每一次物料移动操作均对某一核算单位的成本费 用产生影响,需要生成对应的财务凭证 不能系统直接对接的,预留接口, 同时输出指定 主要特点 主要价值 l 智能诊断维护方便:自动显示设备运行状态、自 动提示设备运行故障、自动生成系统检测文件 l 升级方便安装简单:预留硬件控制接口、方便硬 件升级、软件升级远程快捷;信号自动集成、模 块化设计减少设备占用空间、安装简单稳定可靠 l 规范管理提高形象:规范过磅过程,提高企业管 近预设安全值时,系统会以声、光、电的形式给 出 预警,提示现场操作人员 l 历史查询系统可以将实时报警信息记录到数据库中, 并记录报警时间、恢复时间、报警变量、报警值等 信息 l 系统可自动记录故障,并提供故障查询功能,如按 日期和报警变量查询等 l 操作记录查询,可将状态监测中显示的操作记录到 数据库中,应记录操作名称、每次操作的开始时间 和结束时间、当前的起重量信息、当前的实时风速10 积分 | 86 页 | 7.78 MB | 3 月前3
智慧矿山数据中台建设及管控一体化平台建设方案化、互联化和智能化。 ? 数据融合困难 矿山生产相关子系统众多,数 据相对独立,融合困难; 缺少多系统协同联动 缺少智慧大脑,各系统独立运 行,无法实现智能联动; 被动的故障或灾害监测 现有安全监测及设备监控系统只能做到灾 害或者故障的事后响应功能,缺少事件预 警机智; 缺少大数据分析应用 现有系统普遍偏重数据采集和单一的数 据监测,缺少数据挖掘和数据分析,数 据的横向比对和分析; 1 生产辅助系统 - 通风机监控子系统 3.2 智慧矿山综自系统 风量、风压、电机电压、电机电流、电机故障等相关参数的实时数据显示及故障报警。 3.2.3.2 生产辅助系统 - 空压机监控子系统 3.2 智慧矿山综自系统 机组的运行状态、压力、电流、排气温度、油温等相关参数的实时数据显示及故障报警。 3.2.3.3 生产辅助系统 - 水泵房监控子系统 3.2 智慧矿山综自系统 水泵的运行 生产作业管理 班组管理 故障诊断模型 设备性能预测模型 预防性维护指导 预防性维护方案 预防性维护派单 预防性维护记录 故障维修指导 故障维修方案 故障维修派单 故障维修记录 故障分析准确率分析 故障率统计 保养 \ 维修落实率 保养 \ 维修及时率 故障代码库 事件处理库 预测 分析 预警 报警 预防性 维护 维修 指导 统计 分析 知识库 设备运行监测 故障分析 异常预警提醒10 积分 | 49 页 | 23.49 MB | 6 月前3
智能制造深层剖析机 器 学 习 认知制造业借助认知计算技术、认知分析技术、工业物联网 (IoT) 技术及其他技术推动制造制造业务转型 认知 解决方案 实时洞察 个性化制造 数据整合 车间可视度 自动故障检修 主动维护 流程自动化 自动决策 自主运行 自给自足的 生态系统 推销失败后, 服务数据 实际需求数据和 预期需求数据 制造执行 系统数据 企业资源 计划数据 机器传感器数据 35 GUANLIJISHUHUA GUANLIJISHUHUA 动设备故障诊断与预测性维护平台分析框架 故障诊断分析 • 分析方法 / 模型 : 相关数据异常分析模型 • 输入数据 : 传感器监控数据 • 结果输出 : 每个传感器在某时刻的异常 评分 ; 关键性能指标(依赖关系 图) 关键故障预测 传感器异常诊断 整机健康状态评估 • 分析方法 / 模型 : 时域频域分析 : 传感器监控数据 • 结果输出 : 故障原因和类型 • 分析方法 / 模型 : 聚类相关技术 • 输入数据 : 部件状态数据 • 结果输出 : 整机健康指数 ; • 分析方法 / 模型 : 决策树 支持向量机 神经网络 • 输入数据 : 监控数据 维修历史 • 结果输出 : 提前预知关键故障 数据收集和准备 36 GUANLIJISHUHUA10 积分 | 63 页 | 17.79 MB | 6 月前3
IT运维管理解决方案治理投入缺乏 合规审计要求越来越高,运行风险越来越大 被动服务导向,服务满意度差 经验式和离散的服务流程,服务过程缺乏管理 IT 部门和维护人员的工作绩效难以考核 缺乏有效的知识管理,容易产生人员单点故障 外包服务趋势,服务质量难评估 2 ITIL 和 IT 运维治理 ITILv1 Created ITIL Created ITIL ITILv2 ITILv3 1980s 1990s 2023 ITIL 概览 -- ITIL V2 效劳支持、效劳供给框架 IT Customer Relationship Management 公布治理 变更治理 配置治理 效劳水平治理 大事〔故障〕治理 问题治理 效劳供给 Service Delivery 效劳支持 Service Support Service Desk 效劳台 容量〔力气〕治理 IT 效劳连续性治理 可用性治理 部门面对客户恳求时,没有统一的效劳 ,客户往往直接联系工程师。恳求没有被记录下 来,很难后续追踪和统计。虽然看似很高效很便利,但客户怎么还不满足? 建立分层的故障支持体系,增加 IT 部门整体联动性 当 IT 部门在处理故障时,往往设计到几个部门 / 组同时诊断,导致扯皮现象发生,最终延误了故障 处理的时间,如何才能有效避开此类状况?如何让整个 IT 组织高效运转起来? 用户 用户 上级支持机构 上级支持机构 供给商 供给商10 积分 | 28 页 | 3.37 MB | 6 月前3
共 560 条
- 1
- 2
- 3
- 4
- 5
- 6
- 56
