
数字热本与率用
学习一种通过数据应
用实施数据库质量控制的方法
吴笛1陈芳莉”
(1.东北石油大学黑龙江大庆163318;2.中国石化石油勘探深开发研究院北京100083)
学术论坛
摘要没有经过质量控制的数据通常是不完整的、不客易被采纳利用。本文描述了一种结合信息技水和助操开发业务知识开展数据质量控制的方法,包含从原始数据自动采集、校验、业务工作环境应用,以及业务研究知的回存等环节,以达到质量控制的目的。
关键词:数据质量控制成熟度数据应用
中图分类号:TP311 1前言
文献标识码:A
文章编号:1007-9416(2014)07-0217-01
技术人员来操作。例如分析分段测并曲线数据,进行拼接形成一个
没有经过质量控制的数据通常是不完整的、不容易被采纳利用,任何数据库都需要有质量控制的方法,能够对不同来源不同种类的数据进行加载,集成和质量校验,使其迅速变为可以利用的数据资源。单纯的信息计算很难觉察案数据中的业务问题,有了勘探开发专业人员的参与,数据会同时收到信息技术和专业知识的约束,从而更为准确。
2数据质量控制流程12)
本文描述的数据质量控制流程主要包含四个阶段。
(1)原始数据加载(As-is):这种状态下,数据不做任何质量控制,直接进人数据库。
(2)信息技术进行质量检查(ITQC):这个阶段通过软件程序进行自动检验和纠正,
(3)通过数据应用进行质量控制。
第一步,地质科学家进行质量检查(GeoscienceQC):这个阶段对数据进行处理,满足业务的具体需求。这需要手工干预来完成,如进行测并曲线的拼接或者分段,同时处理数据质量问题。
第二步,地质科学家数据分析(GeiscienceAnalysis):这部分包括研究成果知识的捕获,对数据的修正和补充后回存到主数据库中。
2.1原始数据加载(As-is)
这是数据质量控制流程的第一个阶段,多种类型的数据在这个阶段被快速自动化加载到系统中,并被设置为优先访问的数据。这个阶段的主要排战是不同来源的数据同时如载到一个数据库中,这个阶段的主要校验手段是数据库结构和约束,确保数据类型和数据精度的正确。
2.2信息技术进行质量检查(ITQC)
信息技术进行质量检查(ITQC)阶段主要是应用必要的数据转换和校验规则,确保数据可以利用。数据转换的例子是测并数据。测并曲线数据初始阶段可能以原始的DLIS格式存放,之后被转换为标准LAS文件进行观察和分析。在这个阶段,应用"预防性法则”,所有无意义的数据会被截获,留下的值都是合理有价值的。例如,会应用一组规则,确保所有并的深度值都在并的真正深度底界范围内。所有的转换和校验都是自动激活的,这个阶段的数据转换和校验优先于业务,
2.3通过数据应用进行质量控制
(1)地质科学家进行质量检查(GeoscienceQC):在这个阶段的数据质量检查需要更高业务水平的用户参与,有可能会需要专门的
从顶界到底界的完整并简剖面。这个阶段要应用更加严格的数据规则,有时还需要有经验的数据管理员痛下决心。这个阶段应用的“侦
正确性。例如,地面海拨的值在误差允许的范围内,但却与数字高程的值相差基远,
(2)地质科学家数据分析(GeiscienceAnalysis):在这个阶段,地质科学家利用多个工具对数据进行仔细分析,这个阶段的数据应该有值得信赖的成熟度,再不需要花费时间进行数据检查,发现异常值时,需要自问一下这是一个真的错误,还是代表一个物理的异常,通常需要更深的调查才能找到原因。
2.4知识积累
一且地质科学家完成了数据分析,或者增加了注解说明,或者更新了数据,这些工作内容要作为知识按照一定工作流程写人到主数据库中。流程要尽可能简单,方便后来人对数据的理解和应用。只要企业在这个区域的勘探开发工作不停止,数据就会被不同的地质科学家用到,不同的理解和注释被标注到数据上,不断被写人主数据库。
3数据质量成熟度
在数据不断被检查和应用的过程中,数据的成熟度是不断提高的,通过数据质量控制和数据应用,能不断提高数据的准确性。例如自动采集的地面海拨值可以是任何有效数字值,信息技术能将此值控制在可以接受的范围内,而勘探开发研究人员开展研究的过程中,则通过与其他相关信息如测并曲线、邻近并、区域地质数据等的
比对,进行更进一步的验证3。 4结语
企业对数据的依赖程度不断加大,数据质量的好坏直接关系到信息的准确程度,不管采用怎样的数据库架构和数据质量控制流程,要实现数据质量的不断提高,需要在应用中不断修正和完善数
据,使数据真正成为决策的依据。参考文献
[1]国外数据质量管理研究综述.宋敏等情报杂志.2007.2
[2JImp lementing the Data Management Continuum,steve Cooper. Scott Schneider,Grant Monaghan 1 7TH PNEC 论文集
[3]一种提高石油勘探开发数据质量成熟度的闭环管理流程浅析陈芳莉等.中国科技织横.2014.8
[4]数据质量管理与企业信息化建设.未曼等.计算机时代,2005.6.
收移日期:20140629
作者简介:吴笛(1992一),男,山东即显人,东北石油大学,信息管理与信息系统专业,2011级:
陈芳莉(1969一),女,陕西西安人,中国石化石油勘探开发研究院信息资料中心,高级工程师,研究生学历,研究方向:石油勘深开发数据工程。
217