您当前的位置:首页>行业标准>Q/SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理

Q/SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理

资料类别:行业标准

文档格式:PDF电子版

文件大小:17.68 MB

资料语言:中文

更新时间:2023-10-31 18:03:54



相关搜索: 系统 监控 管理 信息 管理规范 系统 部分 1331

内容简介

Q/SY 1331.3-2010 信息系统运维管理规范 第3部分:监控管理 Q/SY
中国石油天然气集团公司企业标准
Q/SY 1331.3—2010
信息系统运维管理规范第3部分:监控管理
Specifications for information system operation management-
Part 3 : Monitoring management
2010—05—25发布
2010-08—01实施
中国石油天然气集团公司 发布 Q/SY1331.3—2010
目 次
前言
范围规范性引用文件术语和定义监控对象
2 3 4
5 基本要求角色
6
...
6.1 监控管理负责人 6.2监控管理支持组 7活动及流程 8指标.. 8.1指标 8.2报告附录A(资料性附录) 监控管理表单附录B(资料性附录) 监控指标
.. 前 言
Q/SY1331《信息系统运维管理规范》分为七个部分:
第1部分:导则;第2部分:热线帮助;第3部分:监控管理;第4部分:事件管理;第5部分:问题管理; -第6部分:变更管理;第7部分:配置管理。
本部分为Q/SY1331的第3部分。 本部分的附录A、附录B为资料性附录。 本部分由中国石油天然气集团公司信息技术专业标准化技术委员会提出并归口。 本部分起草单位:中国石油勘探开发研究院。 本部分主要起草人:于爱丽、马洵、辛海燕、徐鸿儒、张、谢丽红。 信息系统运维管理规范第3部分:监控管理
1范围
Q/SY1331的本部分规定了中国石油天然气集团公司(以下简称“中国石油”)信息系统运维管理过程中监控管理的目标、流程、角色职责及相关指标。
本部分适用于中国石油范围内已正式上线的信息系统运维管理工作。 2规范性引用文件
下列文件中的条款通过Q/SY1331的本部分的引用而成为本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分,然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。
Q/SY1223.1一2009信息系统总体控制规范第1部分:实施 Q/SY1333—2010广域网建设与运行维护规范
3术语和定义
下列术语和定义适用于Q/SY1331的本部分。
3.1
监控管理monitor management 用于找到信息系统运维环境中的干扰因素,确保由此所产生的影响能够得到及时准确的发现,并
将有关事项进行识别、捕获、记录和分类,监控整个事件的发展;另一方面对信息系统运维管理过程中的计划性事件进行监控。 4监控对象
覆盖整个信息系统运维管理中的各个部分,根据组织的基础设施不同而异,包括但不限于以下分类:
a)服务器(群)。 b)存储设备。 c)应用层交换设备。 d)网络。 e)操作系统。 f)数据库。 g)信息系统。 h)用户状态。 i)数据监控。 i)活动操作过程。
5基本要求
采用人工或自动工具等方法监控信息系统运维环境和过程,合理设计、策划监控的时间间隔,在 约定的时间内进行健康巡检,形成周期性巡检记录。监控管理确保信息系统运维管理符合以下要求:
a)符合服务管理计划或服务水平。 b)使得约定的信息系统运维管理得到统一、有序、有效地实施和保持 c)对约定服务的监控形成周期性报告。
6角色 6.1监控管理负责人
a)监控流程的效率和效果。 b)管理监控管理支持组的工作并维护监控管理系统, c)为运行维护改进工作提供建议
6.2监控管理支持组
负责支持执行监控管理的各项具体工作,执行职责范围内的记录、分类、匹配,转交监控的输出信息。 7活动及流程
日常监控活动包括以下内容。 a)服务器(群):包括但不限于对服务器进行以下周期性监控:
巡查CPU利用率、内存利用率、磁盘I/O读写率、磁盘空间利用率;服务器负载均衡;对系统进行全面防病毒扫描检查:磁盘空间检查和数据文档整理;系统日志分析;检查设备状态灯是否正常(检查频率遵循Q/SY1223.1—2009);散热风扇工作噪声检查(检查频率遵循Q/SY1223.1—2009);批处理作业检查(检查频率遵循Q/SY1223.1—2009)等。
b)存储设备:存储设备监控根据业务需要进行定期或不定期巡检,包括但不限于:
设备是否能够正常启动、关闭;是否在规定的阈值范围内运行等
c)应用层交换设备:应用层交换设备监控根据业务需要进行定期或不定期巡检,包括但不限于:
带宽管理;适应性操作究余;状态故障恢复优先级排列与控制;访问控制等。
d)网络:包括但不限于对以下网络组成部分进行周期性监
检查设备状态灯是否正常:散热风扇工作噪声检查;所有接口是否正常工作;对端口网线进行检查整理;设备日志分析;更改重要设备的密码;防火墙日志检查(检查频率遵循Q/SY1223.1—2009);检查链路可用性(详细事项参见Q/SY1333—2010中表B.5)等。 e)操作系统:包括但不限于对操作系统进行以下周期性监控:
检查操作系统是否正常启动;检查操作系统是否能够正常登录;检查是否安装最新的操作系统补丁;检查告警消息;检查配置文件;操作系统日志分析等(根据信息系统范围内对事件的界定进行日志分析)。
f)数据库:包括但不限于对数据库进行以下周期性监控:
数据库状态;空间管理;数据库性能;对数据库事务的相关信息和状态的监控;分析数据库日志等
g)信息系统:信息系统根据业务需要进行定期或不定期巡检,包括但不限于:
各个功能模块可用性; -应用程序反应速度;应用程序日志(检查频率遵循Q/SY1223.1—2009)等。

h)用户监控:用户监控根据业务需要进行定期或不定期巡检,包括但不限于:
用户操作情况;监控用户账号和用户权限;关键权限变化;闲置的敏感用户账号处理:停用/撤销;远程登录账号(检查频率遵循Q/SY1223.1一2009)等。
i)数据监控:数据监控根据业务需要进行定期或不定期巡检,包括但不限于:
是否能够顺利加载;导入及导出;数据备份情况;对数据库进行直接数据访问情况(检查频率遵循Q/SY1223.1—2009)等。
j)活动操作过程:活动操作过程监控根据业务需要进行定期或不定期巡检,包括但不限于:
是否制定活动操作的步骤;是否保存监控记录;活动是否遵循职责分离原则等。
监控管理活动中所引用的表格参见附录A。 8指标 8.1指标
a)健康巡检周期。 b)关键监控周期。 c)监测到的告警数量。 d)由未监测到的异常引发的事件数量, e)由监控管理同时协调两个以上监控流程的次数。 f)未监测到异常所占比例。 监控指标参见附录B。 8.2报告
监控报告可以采用以下形式: a)根据报告周期划分:日志、周报、月报、季报、年报。 b)根据监控对象范围划分:服务器(群)、存储设备、应用层交换设备、网络、操作系统、数
据库、信息系统、用户、数据和活动操作过程等。
上一章:Q/SY 1331.6-2010 信息系统运维管理规范 第6部分:变更管理 下一章:Q/SY 1331.2-2010 信息系统运维管理规范 第2部分:热线帮助

相关文章

Q/SY 10331.3-2019 信息系统运维管理规范 第3部分:监控管理 Q/SY 1331.3-2014 信息系统运维管理规范 第3部分:监控管理 Q/SY 10331.7-2019 信息系统运维管理规范 第7部分:配置管理 Q/SY 10331.5-2019 信息系统运维管理规范 第5部分:问题管理 Q/SY 10331.6-2019 信息系统运维管理规范 第6部分:变更管理 Q/SY 1331.7-2014 信息系统运维管理规范 第7部分:配置管理 Q/SY 1331.6-2014 信息系统运维管理规范 第6部分:变更管理 Q/SY 1331.5-2014 信息系统运维管理规范 第5部分:问题管理