
Q/SY
中国石油天然气集团公司企业标准
Q/SY 1331.1—2010
信息系统运维管理规范
第1部分:导则
Specifications for information system operation management-
Part 1: General guidelines
201005—25发布
2010-08一01实施
中国石油天然气集团公司 发布
Q/SY 1331.1—2010
目 次
前言 1范围 2基本要求 2.1闭环控制 2.2集中控制 2.3指标机制 3内容概述 3.1各个部分间关系 3.2各部分概述
制定方法 4. 1 阶段性 4.2 关联性 4.3 角色和责任设计原则 4.4 关闭原则 4.5 监控原则 4.6 职能定义原则 5 实施方法 5. 1 计划确认 5. 2 现状差距分析 5.3 制定方案设计 5. 4 标准宣贯
4
Q/SY1331.1—2010
前言
Q/SY1331《信息系统运维管理规范》分为七个部分:
第1部分:导则;第2部分:热线帮助;第3部分:监控管理;一第4部分:事件管理;第5部分:问题管理;第6部分:变更管理;第7部分:配置管理。
本部分为Q/SY1331的第1部分。 本部分由中国石油天然气集团公司信息技术专业标准化技术委员会提出并归口。 本部分起草单位:中国石油勘探开发研究院。 本部分主要起草人:于爱丽、高雪、张、张铁刚、李蓬、贾文清。
Ⅱ
Q/SY 1331.1--2010
信息系统运维管理规范
第1部分:导则
1范围
Q/SY1331的本部分规定了中国石油天然气集团公司(以下简称“中国石油”)信息系统运维管理规范的指导原则、总体要求以及应用方法。
本部分适用于中国石油范围内已正式上线的信息系统运维管理工作。 2基本要求
信息系统的运维管理工作遵循以下基本要求, 2.1闭环控制
完整的质量控制模型应实现持续的循环改进。信息系统的运维管理活动被分解为独立的流程后,应针对每个流程制定具体的计划和确定检查周期,并进行有效而及时地调整,形成持续的改进循环。
信息系统的运维管理总体遵循上述原则,形成质量控制闭环,即各个关键流程围绕着目标,建立流程的反馈信息和机制,实现流程自身的加强和纠正,进入下一个管理水平控制阶段,流程以及相应职能形成持续改进的闭环控制。 2.2集中控制
信息系统的运维管理应设置集中控制机制,用于全面监控整个信息系统是否处于正常运行状态,提供对系统所涉及每个环节的主动预防;当发生异常时,集中控制机制提供统一任务分类和资源调度,协调各个流程在整个运行维护管理及异常处理过程中的密切配合,实现总体效果优化。 2.3指标机制
指标是信息系统的运维管理体系的组成部分,是实现流程设计目标的度量手段,也是实现持续改进的保障机制之一。对于热线帮助、监控管理、事件管理、问题管理、变更管理、配置管理等关键流程,应设计、实施相关指标,以实现对各个关键流程的导向和控制,形成各项管理服务性能和事项的标准化说明,并为实现绩效测评提供依据。 3内容概述 3.1各个部分间关系
Q/SY1331是指导信息系统运维和管理系统化、规范化的统一标准,其中本部分提供运维管理工作的总体指导原则、思路和方法,另外六部分包含热线帮助、监控、事件、问题、变更、配置等关键流程,提供运维管理工作具体实施的流程和方法。
事件管理和问题管理是两个相对独立但联系密切的流程,事件管理强调处理的时效性,问题管理强调处理的预见性。变更管理流程确保所有的变更都经过授权,并具有可追溯性。配置管理流程准确、完整地记录信息系统运行环境中的配置项信息,与变更管理联系紧密,为各个流程提供符合实际情况的系统运行支持数据。热线帮助为信息技术服务的供需双方建立统一的连接点,各个流程的输出都为热线帮助提供信息支持。 3.2各部分概述 3.2.1导则
确立中国石油信息技术总体规划中的各信息系统运维管理应遵循的基本原则和使用范围,明确所
1
Q/SY1331.1—2010
包含的各项标准之间的相互关系。 3.2.2热线帮助
热线帮助在用户与信息系统运维组织之间建立单一联系点,保证用户的呼叫请求的输人唯一性。 建立热线帮助能提高信息系统服务时效性和稳定性,减少服务的响应时间、提高用户满意度。 3.2.3监控管理
监控管理的范围覆盖信息系统运维管理配置管理数据库中的基础设施方面内容,对这些配置项状态的监控确保整个信息系统处于正常运行状态,并评估例外情况对关键设备、信息系统等可能会产生的影响,对热线帮助、事件管理、问题管理、变更管理、配置管理等各个流程提供重要支持。 3.2.4事件管理
信息系统运维管理中非计划中的信息系统服务中断或信息系统服务质量的下降定义为事件,包括系统崩溃、软件事件、影响用户业务操作和系统正常运作的事件,以及其他影响业务流程的情形。事件管理是为确保信息系统尽快恢复正常工作状态而设计的流程,强调快速响应、快速恢复,使事件对业务的影响降低至最小化 3.2.5问题管理
问题是由一项或多项事件导致的影响信息系统正常运行的结果。问题管理是为调查事件发生的潜在原因,制定解决方案并防止事件再次发生而设计的流程,强调查找事件发生的根源,做好解决和预防工作。 3.2.6变更管理
对变更进行审批和控制,通过对变更进行评估,确保在对信息系统运维产生最小负面影响的情况下实施变更,同时通过在组织内进行有效的沟通与协商,确保所有的变更都经过授权,并具有可追溯性。 3.2.7配置管理
对信息系统中运维管理过程配置项资源进行识别和定义,在信息系统整个生命周期内控制配置项的状态以及配置项之间的相互关系等信息,记录并报告配置变更的要求,验证配置项的完整性和正确性。确保配置管理数据库能够准确地反映现存配置项的实际版本状况 4制定方法
Q/SY1331的制定遵循以下要求。 4.1阶段性
信息系统运维管理规范针对信息系统运维管理工作的细化需要具有阶段性,需要依据实践情况确定热线帮助、问题管理、事件管理、监控管理、变更管理、配置管理等流程实施的优先级,遵循“急用先做”的策略,逐步开展各管理流程的设计梳理工作。 4.2关联性
信息系统运维管理各核心管理流程关系紧密。在设计单个管理流程时,应考虑流程关联的规则和相互影响,增强关联性的自动化和智能化。 4.3角色和责任设计原则
信息系统运维管理各管理流程设计要明确划分每个处理步骤的角色和责任,做到流程各阶段职责分明。 4.4关闭原则
流程设计需给流程设定结束条件,并在流程关闭阶段确认实施的服务水平,实现流程管理闭环控制。 4.5监控原则
流程的执行过程要通过监控管理全程跟踪流程的执行情况,使执行过程具备可追溯性。
2
Q/SY 1331.1—2010
4.6职能定义原则
职能定义的原则以信息系统运维组织人员工作技能作为依据,以特定信息系统运维管理工作流程实际需要为基础,把相同性质的管理工作及人员组合在一起,统一定义管理流程相关职能和角色 5实施方法
Q/SY1331的实施遵循以下步骤。 5.1计划确认
结合信息系统运维组织整体工作计划、业界最佳经验和发展趋势、信息系统管理部门整体流程改进方向和计划,确定本信息系统运维管理工作的范围、目标、所需要的资源、流程实施总体计划等。 5.2现状差距分析 5.2.1总体现状差距分析
基于信息系统运维管理工作范围、目标,从日常工作和以下的信息源中分析当前信息系统运维管理现状,侧重于当前不同流程之间的衔接、新的管理流程需求、监控和管理平台的需求等。信息来源包括:
a)来自业务部门的需求: b)客户满意度调查结果; c)内部提出的流程改进建议; d)与管理层沟通的结果; e)业务和技术上的变革
5.2.2当前运维现状分析
结合信息系统运维管理总体现状,识别当前流程与Q/SY1331推荐的流程之间的差距,侧重于流程的设计原则、角色、效率、流程具体活动、工具的使用、指标的定义或获取等。 5.3制定方案设计 5.3.1角色定义
通过对信息系统运维管理流程顺畅执行所需的任务进行梳理和分析,确定角色定义。每个角色需要承担的职责对应各项管理维护任务;通过对现有组织架构、人员岗位的调研分析了解相关人员的技能和工作负荷情况。依据所需职责要求和目前岗位技能、所需任务与目前工作负荷的匹配情况,确定所需岗位职责与目前人员岗位的映射关系,保证信息系统运维管理体系的顺畅运行。 5.3.2流程设计
结合Q/SY1331的系列标准对各流程的具体描述,汇总来自管理层、用户、内部运维队伍的流程改进建议,基于统一的评估标准改进运维管理流程,基于总体的运行维护经费投入情况,提供相应的流程改进点清单。统一的评估标准应至少包括:
a)流程改进建议带来的受益及影响; b)实施建议的紧急程度和优先级; c)宣贯或实施的难易程度; d)推广或部署中的风险; e)流程改进的成本收益分析。
5.3.3指标实施
完成角色定义和流程设计后,需要确定一套系统的指标评估体系,用于衡量运维管理流程的效能和效率。 5.4标准宣贯
标准制定完成后,应正式更新相关的文档、模板、表格等记录,形成新的流程制度,同时正式发
3
Q/SY1331.12010
布并通告相关团队。开展Q/SY1331的培训、宣导和推广工作,以保证在企业内部逐步培养信息技术服务管理的意识,转变以往的信息系统运营方式方法,建立基于国际先进理念的运维工作氛围和团队文化。