ppt文档 IT部门运维管理综合解决方案 VIP文档

18.52 MB 62 页 4 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
IT 部门运维管理综合解决方案 目录 运维管理的解决方案 1 解决方案的架构  IT 运维面临的挑战  整体解决方案框架 2 产品功能介绍  主机监控解决方案  网络监控解决方案  ITSM 流程解决方案 3 XX 科技的介绍  公司介绍  参考案例  产品和服务 4 问答讨论 IT 的环境越来越复杂, IT 运维的难度也越来越大 降低 IT 成本 如何提升员工、资产、项目和活动的产出 ? 提升服务质量 如何满足您的企业对 IT 服务性能的要求? 控制风险 如何定义和控制风险,提升系统可靠性 ? 增加对业务的影响 如何确保您的 IT 投资和运营决策与业务优先级 要求相吻合? 提供可视性 如何清晰掌握 IT 中的成本和活动? 业务对 IT 的期望也越来越高 运维管理:“治”、“管”、“监”、“控” 的整体工具框架 开放平台运维管理门户 集中监控管理平台 集中性能 系统监控 集中告警 网络监控 应用监控 机房监控 集中拓扑 服务和流程管理平台 生产调度管理 日常操作管理 配置管理 服务请求管理 自动化管理平台 产品 设施 分销 信息 人员 运输 安全 语音 存储 小型机 网络 系统 应用 配置管理数据库 监控数据 配置数据 资源使用数据 业务服务管理 CIO 的 IT 仪表盘 服务和部署自动化管理 各平台数据信息的抽取,转换和加载 服务台和自助服务 统一权限管理 统一报表管理 集中告警数据 流程质量和配置数据 资源数据 服务器服务(优化和标准化) 存储服务(优化和标准化) 网络服务(优化和标准化) 虚拟化管理 监管机构 业务人员 技术人员 管理层 外部客 户 服务人 员 安全监控 环境监控 治 监 管 控 事件管理 问题管理 变更管理 目录 运维管理的解决方案 1 解决方案的架构  IT 运维面临的挑战  整体解决方案框架 2 产品功能介绍  主机监控解决方案  网络监控解决方案  ITSM 流程解决方案 3 XX 科技的介绍  公司介绍  参考案例  产品和服务 4 问答讨论 • 主要功能和特点包括: 1. 从多种 IT 资源中获取实时可用性和性能数据 2. 开箱即用 3. 阀值监控以自动生成告警事件 (Situation) 4. 事件报告和自动响应预定义的告警事件 (Event reporting) 5. 借助于浏览器的管理界面 6. 自定义的管理逻辑视图 7. 历史数据存储以用于统计报表和回顾 系统和应用监控的基石 – IBM Tivoli Monitoring 体系架构 系统监控架构及部署方式 分支机构 数据中心 监控架构 服务器 - 操作系统 - 数据库 - 中间件及应用 - … 服务器 - 操作系统 - 数据库 - 中间件及应用 - … 被管系统 被管系统 TEPS TEMS TDW TEMS 用户界面 Agent-based Agent-less Agent-based Agent-less TEMS TEPS = Tivoli Enterprise Portal Server TEMS = Tivoli Enterprise Management Server TDW = Tivoli Data Warehouse 典型架构设计 系统和应用监控范围 平台 数据库 应用 商业集成 Web 架构 通信 & 协作 Lotus Domino Exchange Unix Windows Linux OS/400 DB2 (Z & Distributed) Oracle Informix SAP MySAP Siebel Tuxedo WebSphere MQ WebSphere MQ Integrator WebSphere (Z & Distributed) IIS iPlanet Apache WebLogic SQL .NET CICS IMS z/OS Sybase Citrix VMWare Web Services Cluster(s) New New New IBM Tivoli 监控程序支持您的整个 IT 环境,并且可以快速实施,实现价值 40 个以上用 于修正的定 制包 示例: Cisco Works S1 Tuxedo etc . . . OPAL 最佳实践库 Universal Agent ( 通用服务代理 ) ( URL, SNMP, File, Socket, ODBC, API, .. ) Syslog Probe, Syslog Daemon 管理门户 – Tivoli Enterprise Portal Intelligent Linking Personalized Views Easy to use Browser controls Persistent customized workspaces for future use 从单一界面管理 IT 资源和应用 管理报警条件,设置阀值  Multiple thresholds linked by Boolean logic for determining complex problems  Allows for an automated/reflex action in response to violation 自动化处理流程 定义逻辑视图 历史数据采集分析 Real Time Data NT : Attribute Groups NT_Memory NT_Process NT_Disk NT_Processor DB2 : Attribute Groups… DB2_BF DB2_Lock DB2_Inst DB2_Partition SQL : Attribute Groups… SQL_DB SQL_Lock SQL_TBL SQL_.... 所有数据,包括实时数据和历史数据,都可以从 Tivoli Enterprise Portal 中展示 Tivoli Data Warehouse 2.1 汇集和剪除数据,使长期数据的管理更简单,并且 提供对 DB2 、 MS SQL 和 Oracle 的支持 实时数据 短期历史数据 长期历史数据 RDB Tivoli Enterprise Portal 操作系统监控 • CPU 处理器 • 内存使用情况 • 磁盘性能 • 进程监控 • 文件系统监控 • RPC 调用的性能情况 • 日志文件 • 用户访问情况 • 服务器网络使用情况 • ……… 磁盘资源监控 操作系统监控 进程监控 网卡监控 增强的 IBM System p / AIX 主机监控 • ITM System Edition for System p •更轻量级的 System p 监控 •可视化管理 System p 系统可用性和 健康状态 •虚拟资源到物理资源的映射 • 全面的 System p 性能监控 •可视化管理 System p 系统性能 •历史数据收集 •客户化定制视图、 Situation 和 Workflow • 与 IBM Director System 无缝集成 数据库监控 Application Top Ten Failed SQL Statement % Top Ten Sort Overflows Bottom Ten Buffer Pool Hit Ratio Top Ten Lock Timeout Top Ten Lock Deadlock Database Bottom Ten Buffer Pool Hit Ratio Top Ten Connection Top Ten Failed SQL Statement % Top Ten Lock Timeout Top Ten Deadlock System Overview Server Key Events Server Connection Database – Bottom Ten BufferPool Hit Ratio Applications-Top Ten Sql Statement Server Status Locking Conflict Locking Conflict Top Ten Application Lock Timeout Application Lock Timeout Locking Conflict 应用服务器运行状态监控 指示应用服 务器的总体 健康状态 包括 CPU 使用率、 内存堆分配、换页 率 , 垃圾回收率 , 池大小 , 线程池使 用率等 应用服务器健康状态监控 JMS summary by app. server HTTP Session and Web Container per app. server Top 5 delays and completion rates per application 内存垃圾回收效率分析 • 垃圾回收效率会对应用服务器性能产生重大影响,包括其发生频率、回收时间等,因为 在垃圾回收执行期间,其他进程不能活动。 ITM 工作视图能够展示细节的 GC 行为和全 面的 GC 效率分析。 最近的 GC 具 体性能分析 回收频率 - # GC’s per Minute 最近的 JVM 堆 使用趋势 % GC 消耗 时间 响应时间监控 Web 应用监控 交易响应时间 监控 Client 响应时 间监控 初始目标 当前状态 专家建议 采取措施解决问题  专家建议提供了问题和推荐恢复措施的详细描述  使 IT 操作可以解决已知的错误,并且使主题专家抽出时间进行更多的附加值活动  可以通过定制来获得本地的专家知识,或者与使用说明书相链接 专家建议减少了问题解决方案的时间 / 成本 扩展机制 Universal Agent Universal Agent 为 ITM 提供了极大的扩展能力 目录 运维管理的解决方案 1 解决方案的架构  IT 运维面临的挑战  整体解决方案框架 2 产品功能介绍  主机监控解决方案  网络监控解决方案  ITSM 流程解决方案 3 XX 科技的介绍  公司介绍  参考案例  产品和服务 4 问答讨论 网络监控 – Netcool – #1 网管软件  保障网络的最佳健康状况和不 间断的运行,保障至关重要的 依靠网络连接的业务和服务  IDC 针对 Netcool 的报告 :  每年节省运维费用 $58.7M  <65 days 收回软件投资成本  服务可用性达 99.99%  减少内部 downtime 64%  减少外部 downtime 72%  降低故障修复时间 64%  提高 IT 有效性 18%  提高操作员生产力 22% 事件管理 业务的优化 网络智能化管理 先进的相关性 服务管理 业务影响分析 全面的网络监控 – “网管的网管” Probes (~ 200): ATM Forum MIB RFC 1695 for ATM switches ATM Forum PNNI (Single Pier) MIB ATM Forum ILMI MIB ATM Forum LANE Client MIB Frame Relay MIB RFC 1315 FDDI MIB RFC 1512 ADC Metrica NPR Airspan Sitespan Alcatel 1000 E10/OCB-283 Alcatel 5620 Logfile Alcatel 5620 NM CORBA Alcatel 5620 SAM Alcatel AWS Alcatel DSC Dex per Class 5 Voice Switch Alcatel MT20 Alcatel NMC 1300 Alcatel OMC-R (3GPP) Alcatel OMC-R (Q3 Interface) Alcatel OMC-R (Terminal Server Connection) Alcatel OMC-S Alcatel OS-OS Alcatel S12 Alcatel SMC 1360 Enterprise SNMP EMS Probe Ericsson 3GPP (OSS-RC/RANOS/CNOS) Ericsson ACP 1000 Ericsson AXE 10 per Class 5 Voice Switch Ericsson BNSI Ericsson MD110 Ericsson RANOS (3GPP) Ericsson Xmate Lucent 5ESS - Class 5 Voice Switch Lucent Agile ATM Lucent ECP Lucent ITM-NM/OMS Lucent ITM-SC Lucent JMTE (CORBA) Lucent Naviscore Lucent NFM Lucent OMC (CORBA) Lucent OTAF/SDHLR Lucent Wavestar SNMS Vendor Alliances (~25): Alcatel Motorola Siemens Ericsson Tellabs Marconi Lucent Nokia Huawei Fujitsu Ciena Cisco Juniper Checkpoint Cramer Metasolv SAP Xtera Voyence Bridge MIB RFC 1493 MIB-II RFC 1213/2096 RMON MIBs OSPF MIB BGP MIB ifStack MIB VRRP MIB 31 different Cisco MIBs (including MPLS VPNs) 21 Nortel MIBs 6 different Extreme Networks MIBs (inc VLANs) Juniper MPLS VPN support SNMP support (175 MIBs), including: • 优秀的网络运维平台是整个网管系统成功的技术基础 • 高性能的核心满足大型网络管理性能要求 • 体系结构能够适合大型网络管理的结构要求 • 实现运维流程,提供足够的灵活性 TNM 网络管理运维平台 呈现评估 信息综合分析处理 全面信息采集 实时监控界面 Precision 自动化处理 Actions Triggers 相关性 分析 事件自 动处理 报表 Object Server 重复事件压缩 统计分析报告 设备告警 设备告警 性能和流量 监控 拓扑发现 故障点定位 G WebTop 数据库 ISM SNMP M 网络连通性 ISM ICMP M Trapd Probe P Syslog Probe P 网络管理基本包 二 / 三层拓朴管理 ( 可选项 ) 客户自有数据库和报表系统 TNM 深入的网络监控和信息采集 • TNM 事件采集特点 • Netcool 探针,集成网元等各种管理信息 • Netcool Syslog Probe 提供对 Cisco Syslog 几千行规则, Syslog 信息详细的分类,解释和严重性判断,不仅 仅只是简单的数行字串匹配 • 对其他厂商 Syslog 处理规则 • 全球用户信息处理经验的大量累积 • 对原始信息的丰富,以实现更灵活和方便的信息过 滤、分析和丰富 • 自动的存储转发功能 状态采集 事件采集 自动拓扑 端到端性能和服 务质量监控 网络事件类型和来源 Syslog Trap ICMP SNMP 路由器 / 交换机 路由器 / 交换机 线路和设备连通性 路由器 / 交换机 Voice Security Datacenter Apps Data Center Servers Wireless Optical Routers & Switches VPNs 端到端服务管理 现成的处理规则大大减少实施和维护的工作量 网络实时综合监控 • 显示运维关注的主要实时信息,可以根据用户的需求进行调整 广域网实时监控 • 广域网视角显示关注的节点、线路的状态信息 局域网实时监控 • 局域网视角,按照局域网核心路由器、核心交换机、楼层交换机进行分类,监控 参数按照设备故障事件(包括各类 syslog 告警事件)、设备性能事件(包括各类 SNMP 采集的性能事件)、线路事件(包括设备端口事件)。 网络设备性能 网络流量 丰富的应用协议级性能管理 Internet Service Monitoring(ISM) 支持绝大部分应用协议级性能监控,可以帮助用户对 HTTP 、 HTTPS 、 FTP 、 DNS 、邮件等企业级服务提供性能检测。 举例说明,针对 HTTP 监控, ISM 提供 如 下丰富的性能 KPI :  Status  Lookup Time  Connect Time  Download Time  Response Time  Bytes Per Sec  Bytes Transferred 网络设备的配置信息管理 事件分类视图 • 事件分类监控视图,包括: 10 分钟内故障事件告警、严重级别故障事件告警、 性能类事件告警、连通性事件告警、配置类的故障信息等等,将事件按照最佳实 践的分类方式进行显示,方便运维人员监控故障 深入的故障关联,帮助定位根源故障点 • 自动故障 / 恢复关联 • 自动基于拓扑连接的故障根源点定位 • 物理端口故障导致逻辑端口报警 • 上层连接设备故障导致下级设备报警 • 板卡故障导致端口报警 • 物理资源故障导致逻辑协议,如路由报警 • 灵活的策略编辑,定义事件的关联策略 目录 运维管理的解决方案 1 解决方案的架构  IT 运维面临的挑战  整体解决方案框架 2 产品功能介绍  主机监控解决方案  网络监控解决方案  ITSM 流程解决方案 3 XX 科技的介绍  公司介绍  参考案例  产品和服务 4 问答讨论 ITSM 成功实施的三大要素 ITIL 是 IT 服务管理的最佳实践,已经成 为中国客户 IT 运维流程设计的首选标准 咨询专家和实施队伍,具备多年国内各 行业的实施经验,保证了 IT 运维平台的 高质量的定制实施和维护 = + + 成功实施!!! IBM Tivoli® Service Request Management 和 Asset Management 提
下载文档到本地,方便使用
共 62 页, 还有 16 页可预览, 继续阅读
文档评分
请文明评论,理性发言.