
Q/SY
中国石油天然气集团公司企业标准
Q/SY 1331.3—2014 代替Q/SY1331.3—2010
信息系统运维管理规范第3部分:监控管理
Specifications for information system operation and maintenance management-
Part 3 : Monitoring management
2014—08—22发布
2014一10一01实施
中国石油天然气集团公司
发布
Q/SY 1331. 3—2014
目 次
前言引言
I
范围术语和定义
1
2
3 角色和职责
流程原则流程和说明 6 指标和报告附录A (资料性附录) 监控管理指标附录B (资料性附录) 监控管理表单参考文献
4
5
2
6
10
1
Q/SY1331.3—2014
前言
Q/SY1331一2014《信息系统运维管理规范》分为七个部分:
第1部分:导则;第2部分:帮助热线;
—一第3部分:监控管理;
第4部分:事件和服务请求管理;
一
第5部分:问题管理;第6部分:变更管理;第7部分:配置管理。
本部分为Q/SY1331的第3部分。 本部分按照GB/T1.1—2009《标准化工作导则 第1部分:标准的结构和编写》给出的规则
起草。
本部分代替Q/SY1331.3一2010《信息系统运维管理规范 第3部分:监控管理》,与Q/SY
1331.3一2010相比,除编辑性修改外,主要变化如下:
在前言中,增加了标准编制所依据的起草规则;删除了“规范性引用文件”(见2010年版的第2章);删除了“监控对象”(见2010年版的第4章);删除了“基本要求”(见2010年版的第5章);修订了“范围”(见第1章);修订了“术语和定义”(见第2章);修订了“角色”,标题名称修改为“角色和职责”(见第3章);增加了“流程原则”(见第4章);修订了“活动及流程”,标题名称修改为“流程和说明”(见第5章);修订了“指标”,标题名称修改为“指标和报告”(见第6章);修订了附录A(见附录A);修订了附录B(见附录B); 增加了参考文献。
本部分由中国石油天然气集团公司信息管理部提出。 本部分由中国石油天然气集团公司标准化委员会信息技术专业标准化技术委员会归口。 本部分起草单位:东方地球物理勘探有限责任公司。 本部分主要起草人:王立福、刘欣欣、高鹏、娄宏骏、王文娟、谢银飞、张硕、付兵华、薛
智中。
II
Q/SY1331.3—2014
引言
随着中国石油天然气集团公司(以下简称“中国石油”)信息化建设的推进,支持中国石油经营管理和业务发展的信息系统日益增多。中国石油信息技术环境日趋复杂:一方面设备种类和数量增多,管理不断细化;另一方面信息系统涉及面广,容易引发故障的环节增多。
本部分的制定参照了国际、国内和相关行业的同类技术规范及标准,结合中国石油总部及下属企
业的信息系统运维管理的现状和业务特点,考虑了中国石油未来的业务发展对信息系统运维管理的需求。
监控管理流程为组织提供了监测事件、了解其影响和确定适当控制措施的能力。主要活动包括识别监控管理需求、制定监控管理计划、执行监控管理计划、监控和报告以及回顾和改进。
本部分的第3章规定了监控管理流程活动中主要的角色、角色的职责和应具有的技能,本部分的第4章规定了监控管理流程执行过程中应遵循的原则。 本部分的第5章描述了监控管理流程图、流程执行过程的主要活动及各活动的详细描述。 本部分的第6章描述了监控管理流程的关键指标和各类报告。 本部分的附录A给出了监控管理指标。 本部分的附录B给出了监控管理表单。
Ⅲ
Q/SY1331.3—2014
信息系统运维管理规范第3部分:监控管理
1范围
Q/SY1331的本部分规定了中国石油天然气集团公司(以下简称“中国石油”)信息系统运维管
理过程中监控管理的范围、术语和定义、角色和职责、流程原则、流程和说明以及指标和报告。
本部分适用于中国石油范围内已正式上线的信息系统运维管理工作,非统建信息系统运维管理工作可以参照本部分执行。
2术语和定义
下列术语和定义适用于本文件。
2. 1
监控管理 monitor management 用于找到信息系统运行环境中的干扰因素,确保由此所产生的影响能够得到及时准确地发现,并
将有关事项进行识别、捕获、记录和分类,监控整个事件的发展;另一方面对信息系统运维管理过程中的计划性事件进行监控。 2. 2
告警alert 监控对象的某些状态发生改变或者失效、某些指标已突破阈值的通知,通常由系统管理工具发出
和管理,受事件管理流程的控制。
3角色和职责
监控管理角色设置过程中,根据Q/SY1331.1的要求,建立运维岗位与流程角色映射关系,见表1。
表1 流程角色和职责对应表
流程角色
技能要求
职责
熟悉中国石油信息技术总体规
a)
划要求;
a) 确保监控管理流程满足实际的需要,角色职责定 b) 有很强的计划、组织、领导和
义明确,流程各环节设计合理; b) 接收各方意见和建议,改进和提高监控管理流
控制才能,能够综合各方意见,定期优化流程;具有很好的沟通技能、良好的
监控管理流程负责人
程的有效性和效率;制定和解释流程的相关内容;
c)
团队合作精神和跨部门协调能力;熟悉信息技术基础设施架构;
2
d)检查监控管理策略规划执行情况
d) e)掌握监控管理相关技术
1
Q/SY1331.3—2014
表1 (续) 职责
流程角色
技能要求
a) 根据监控管理计划确定监控管理的范围和指标; b) 在监控管理服务中负责技术支持; c) 对监控管理服务过程中的请求、事件和问题做出
a)具备较好的理解能力和沟通
能力; b) 具备信息技术基础设施中软、
技术支持员
响应,并对处理结果负责; d) 监控管理流程培训相关工作; e) 针对监控管理计划执行过程中出现的问题,进行 c) 掌握监控管理相关技术或工具
硬件及相关设施的管理能力;
持续改进
a)充分了解应用系统的IT环境和
在监控管理服务中负责日常操作的实施; b) 根据规范和手册,执行监控管理服务各过程,并
a)
架构;熟悉和了解监控管理的原理;
监控操作员
b)
对其执行结果负责
c) 熟悉监控管理相关技术或工具
4流程原则
4.1基本原则
基本原则包括:
基于业务需求和服务级别管理目标,制定监控管理需求和监控管理计划。
a) b)当发生重大变更或业务环境发生重大变化时,需评估变更对监控需求和监控管理计划的
影响。 监控管理计划应定期(至少每半年)进行回顾,以确保监控管理计划适宜、充分及有效
c) d) 监控管理流程应定期(至少每半年)进行回顾,回顾内容包括关键绩效指标、流程执行效
率,流程支持工具的有效性,以改进监控管理流程。 e) 应采用人工或自动工具等方法监控信息系统运行环境,按照监控管理计划,在约定的时间内
进行健康巡检,形成周期性巡检记录。
4.2通知原则
当告警发生时,根据其严重性和影响范围,可采用电话、短信或邮件等方式通知相关负责人。 4.3 3监控指标原则
监控指标原则包括: a) 根据监控管理计划要求,制定监控指标体系。 b) 根据监控范围不同,制定适宜的监控指标。
根据业务峰值变化,人工或者自动方式动态调整监控值。
c) d) 根据业务需求情况,可对同一指标设定不同的监控阈值 e)
当业务环境发生重大变化或重大变更时,应重新评估监控管理指标体系,确保其持续有效。
4.4监控处理原则
监控处理原则包括: a)) 对于监控过程中的告警,需进行集中处理;对重复的告警信息,需要进行归并处理,对彼此
2