
ICS 35.040.01
CCS A 24 DB42
湖
北 省 地 方 标 准
DB42/T 2284—2024
湖北省药品监管数据质量管理规范
Specification for drug regulatory data quality management
in Hubei province
2024 - 09 - 22 发布
2024 - 11 - 22 实施
湖北省市场监督管理局 发 布
DB42/T 2284—2024
目
次
前言 ................................................................................. III
1 范围 .................................................................................1
2 规范性引用文件 .......................................................................1
3 术语和定义 ...........................................................................1
4 数据质量要求 .........................................................................2
5 数据质量控制 .........................................................................3
6 数据质量评估指标 .....................................................................4
7 标准实施及评价 .......................................................................7
附录 A(资料性) 湖北省地方标准实施信息及意见反馈表 .....................................8
参考文献 ...............................................................................9
I
DB42/T 2284—2024
前
言
本文件按照GB/T1.1-2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由湖北省药品监督管理局提出并归口。
本文件起草单位:湖北省药品监督管理局信息技术与电子监管中心、湖北天智联创技术有限公司、
湖北省标准化与质量研究院。
本文件主要起草人:全同珍、秦少华、刘莹鑫、徐伟、陈磊、陈伟伟、王婷、常湉、徐术坤、余梅、
段晓非、谭婉天、康乃文、顾鑫。
本文件实施应用中的疑问,可咨询湖北省药品监督管理局,联系电话:027-87111636,邮箱:
38710203@qq.com。对本文件的有关修改意见和建议请反馈至湖北省药品监督管理局信息技术与电子监
管中心,联系电话:027-87111636,邮箱:38710203@qq.com。
III
DB42/T 2284—2024
湖北省药品监管数据质量管理规范
1 范围
本文件规定了药品监管数据质量管理规范,包含数据质量评价指标、数据质量控制、数据质量要求。
本文件适用于湖北省各级药品监管部门药品监管数据的质量控制。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 42381(所有部分) 数据质量
GB/T 43709-2024 资产管理信息化 数据质量管理要求
DB42/T 2080 湖北省药品监管数据治理规范
DB42/T 2081 湖北省药品监管数据资源目录编制指南
3 术语和定义
GB/T 36073界定的以及下列术语和定义适用于本文件。
数据质量 data quality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。
注: 数据模型按不同的应用层次分成三种类型:概念数据模型、逻辑数据模型、物理数据模型。
[来源:GB/T 36073—2018,3.10,有修改]
数据质量控制 data quality control
应用数据管理技术,使数据在采集、存贮、传输中满足相关的质量要求。
数据审核 data verification
对上传或更新的药品监管数据进行初步审核,包括检查药品监管数据的完整性和准确性。
数据清洗 data cleaning
清洗药品监管数据中的脏数据,包括处理缺失数据、重复数据、数据格式不一致等问题,以提高数
据质量。
数据纠错 data correction
对存在错误的药品监管数据进行纠错处理,以确保数据准确性和一致性。
数据监测 data monitoring
1
DB42/T 2284—2024
定期进行药品监管数据监测,检查数据是否符合预期标准,并及时处理发现的问题。
4 数据质量要求
数据采集环节
药品监管数据提供部门在数据采集环节应符合下列要求控制数据质量:
a) 应实现数据的电子化、系统化建设及管理;
b) 应按照 DB42/T 2081 的规定建立数据资源目录,进行数据分类
c) 数据的命名、定义和表示应符合已发布的数据模型、数据字典、业务术语、数据项、参考数据
等数据标准的要求;
d) 数据应满足业务需求;
e) 数据应满足准确性、完整性、一致性、规范性、时效性和可用性等要求。
数据传输环节
药品监管数据提供部门和药品监管数据中心在数据传输环节应符合下列要求控制数据质量:
a) 应采取必要的数据安全传输手段,预防数据被篡改、损坏、泄露等恶意攻击;
b) 应采取数据异常监测、断点续传等控制方式,并按数据更新频率及时更新数据;
c) 数据应满足准确性、完整性、一致性、规范性、时效性和可用性等要求。
数据治理环节
药品监管数据中心在数据治理环节应符合下列要求控制数据质量:
a) 应按照 DB42/T 2080 的规定执行数据清洗加工、标准化、格式化等操作;
b) 应按照国家局数据分级分类相关标准执行;
c) 数据应脱敏中应按执行;
d) 数据应满足准确性、完整性、一致性、规范性、时效性和可用性等要求;
数据存储环节
药品监管数据中心在数据存储环节应符合下列要求控制数据质量:
a) 应支持文件的分布式存储机制和分布式数据库系统的存储;
b) 应支持结构化数据和非结构化数据的存储;
c) 应支持包括批量、交互查询、实时流、内存计算等典型的大数据场景的存储;
d) 应支持大数据存储的可靠性、可管理和安全等总体要求;
e) 数据应满足准确性、完整性、一致性、规范性、时效性和可用性等要求。
数据服务环节
药品监管数据提供部门在数据服务环节应符合下列要求控制数据质量:
a) 数据应满足准确性、完整性、一致性、规范性、时效性和可用性等要求;
b) 数据应满足可访问性要求,确保数据在需要时的可获取;
c) 数据应满足可用性要求,确保数据在设定有效生存周期内的可使用。
2
DB42/T 2284—2024
数据质量管理活动评估
药品监管数据提供部门在数据质量管理活动评估应符合下列要求:
a) 制定监测计划,并对监测范围进行可行性分析,确定监测方法;
b) 建立评价指标体系,指标体系中的基本元素按照 GB/T 36344 的要求进行确定;
c) 保存数据监测的记录,形成相应的报告;
d) 对监测发现的数据质量问题,有相应的追踪整改机制;
5 数据质量控制
数据审核
药品监管数据审核包括但不限于以下内容:
a) 数据格式审核。对上传的数据进行格式审核,确保数据格式符合系统要求,如数据类型、数据
长度、数据范围等;
b) 数据完整性审核。对上传的数据进行完整性审核,确保数据完整无缺失、无重复、无错误等;
c) 数据准确性审核。对上传的数据进行准确性审核,确保数据内容符合实际情况、符合业务规则,
如数据范围、数值逻辑、数据时效等;
d) 数据安全审核。对上传的数据进行安全审核,确保数据不含有敏感信息、不含有恶意代码等。
数据清洗
药品监管数据清洗包括但不限于以下内容:
a) 缺失数据处理。对数据中的缺失数据进行处理,如填充默认值、删除缺失数据等;
b) 重复数据处理。对数据中的重复数据进行处理,如删除重复数据、合并重复数据等;
c) 数据格式不一致处理。对数据中的格式不一致的数据进行处理,如进行数据类型转换、统一日
期格式等;
d) 异常数据处理。对数据中的异常数据进行处理,如删除异常数据、修正异常数据等。
数据纠错
药品监管数据纠错包括但不限于以下内容:
a) 错误数据定位。对数据进行检查,找出存在错误的数据,并定位错误的位置和类型;
b) 数据错误分类。对错误数据进行分类,如数据格式错误、逻辑错误、数据范围错误等;
c) 数据错误处理。对错误数据进行处理,如进行数据格式转换、修正数据逻辑错误、调整数据范
围等;
d) 数据纠正验证。对纠正后的数据进行验证,确保数据准确性和一致性。
数据监测
药品监管数据监测包括但不限于以下内容:
a) 定义监测指标。根据业务需求和数据分析目的,定义需要监测的指标和标准;
b) 数据采集和处理。定期采集数据,并进行数据清洗、数据纠错等预处理步骤;
3
DB42/T 2284—2024
c) 数据分析和比对。对采集的数据进行分析和比对,检查数据是否符合预期标准,发现异常数据;
d) 异常数据处理。对发现的异常数据进行处理,如进行数据纠错、数据清洗等步骤,以提高数据
质量。
6 数据质量评估指标
数据质量概念
药品监管数据质量是保证药品监管数据应用和提供优质药品监管数据服务的基础。药品监管数据
质量管理要求主要包括六个特性指标:
a) 准确性:数据准确表示其所描述的真实实体(实际对象)真实值的程度;
b) 完整性:按照数据规则要求,数据元素被赋予数值的程度;
c) 一致性:数据与其他特定上下文中使用的数据无矛盾的程度;
d) 规范性:数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度;
e) 时效性:数据在时间变化中的正确程度;
f) 可用性:数据能被访问的程度。
准确性
在特定的使用环境中,药品监管数据具有正确地表示一个概念的相关属性真实值的程度,准确性评
价指标见表1。
表1 准确性评估指标
指标名称 指标描述
数据格式合规性 数据格式(包括数据类型、数值范围、数据长度、精度等)是否满足预期要求。 示例:身份证号不能出现标点符号;以及对字符编码的一些限制,都需要通过规定内容 的格式来实现。
数据重复率 特定字段、记录、文件或数据集意外重复的度量。 示例:药品监管数据的电子证照信息入库记录时,重复录入,入库表中出现两条一样的 数据。
数据唯一性 特定字段、记录、文件或数据集唯一性的度量 示例:药品监管数据的电子证照信息中证书编号不可能重复。
脏数据出现率 正确字段、记录、文件或数据集之外无效数据的度量。 示例:事务发生回滚时由于回滚机制不健全或不完善导致可能出现脏数据。
完整性
在特定的使用环境中,与一个实体相关联的药品监管数据具有所预期的属性值和相关的实例值的
程度,完整性评价指标见表2。
4
DB42/T 2284—2024
表2 完整性评估指标
指标名称 指标描述
数据内容正确性 数据内容是否是预期数据。 示例:需要获取的是药品监管电子证书发证机关,如发证机关为湖北省药品监督管理局,则 获取值应该为湖北省药品监督管理局。
数据记录完整性 按照业务规则要求,数据集中应被赋值的数据记录的赋值程度。 示例:药品监管数据的电子证照信息中,法定代表人、企业代表人、质量代表人等人员相关 数据的详细程度。
一致性
在特定的使用环境中,药品监管数据具有表征与其他数据无矛盾且连贯的属性的程度,一致性评价
指标见表3。一致性可以存在下列两种情况中的任意一种或两种:
a) 在与单个实体有关的数据之中。
b) 多个可以比较实体的类似数据之间。
注: 采用同义词代表了造成不一致性的一种特例:用来定义数据的术语词典可用于避免这种不一致性。
表3 一致性评估指标
指标名称 指标描述
相同数据一致性 同一数据在不同位置存储或被不同应用或用户使用时,数据的一致性;数据发生变化时,存储 在不同位置的同一数据被同步修改。 示例:当药品监管数据的电子证照信息证书内容变更后,不同界面查询的证书内容都变成修改后 的。
关联数据一致性 根据一致性约束规则检查关联数据的一致性。 示例:如药品监管数据的执法部门名称修改后,人员在查询个人所属部门时,部门名称显示修改 后信息。
规范性
在特定的使用环境中,药品监管数据具有表征其符合数据标准、数据模型、业务规则、元数据或者
权威参考数据的属性,规范性评价指标见表4。
表4 规范性评估指标
指标名称 指标描述
数据标准 药品监管数据符合数据标准的度量。 1.评价数据质量时需要收集数据在命名、创建、定义、更新和归档时遵循的标准,包括国 际标准、国家标准、行业标准、地方标准或相关规定等。 2.和数据归档一样甚至更重要,在一个完整的数据规则中旧数据的销毁一般也有一个比较 详细且具有可执行性的规定。 示例:对数据的定义,组织、监督和保护进行标准化的过程。
5
DB42/T 2284—2024
表 4 规范性评估指标(续)
指标名称 指标描述
数据模型 药品监管数据符合数据模型的度量。 1.数据模型是一种直观描述组织数据结构的手段,是数据表达的规范。 2.评价数据质量时需要检查是否存在清晰可理解的数据模型定义以及这些数据的组织形式 示例:E-R 模型,实体关系模型,数据库设计初期可以用此模型梳理各实体之间的关系, 实体属性等重要部分。
元数据 药品监管数据符合元数据定义的度量。 元数据标注、描述或刻画其他数据、以使检索或使用信息更容易。评价数据质量时需要检 查是否提供可解读的元数据文档。 示例:包含各字段名称、描述、类型值域等内容的数据字典为一种元数据文档
业务规则 药品监管数据符合业务规则的度量。 1.业务规则是一种权威性原则或指导方针,用来描述业务交互,并建立行动和数据行为结 果及完整性的规则。 2.评价数据质量时需要检查是否存在良好归档的业务规则示例:比如某些业务数据在 6 点 以后不允许更新操作
权威参考数据(权威参 考源) 参考数据是系统、应用软件、数据库、流程、报告及交易记录和主记录用来参考的数值集 合或分类表。 评价数据质量时需要收集参考数据列表。 示例:一张用于一个特定字段的有效值列表为一种参考数据类型
安全规范 安全规范是安全和隐私方面的规则,包括数据权限管理,数据脱敏处理等。示例:某些数 据的修改权限只能赋值给指定人员。
时效性
在特定的使用环境中,药品监管数据具有表征其在时间变化中的正确程度,时效性评价指标见表5。
表5 时效性评估指标
指标名称 指标描述
基于时间段的正确性 基于日期范围的记录数或频率分布符合业务需求的程度。 示例:药品监管数据,可能随温度、时间改变。
基于时间点及时性 基于时间戳的记录数、频率分布或延迟时间符合业务需求的程度。 示例:药品监管数据的电子证照信息中,生产地址在实际业务中,地址信息有变化。
时序性 数据集中同一实体的数据元素之间的相对时序关系。 示例:药品监管数据的执法信息,开始时间和结束时间的关系
可用性
在特定的使用环境中,药品监管数据能被访问的程度,尤其是对因缺少某些能力而需要支持技术或
特殊配置的人,可用性评价指标见表6。
6
DB42/T 2284—2024
表6 可用性评估指标
指标名称 指标描述
可访问 药品监管数据在需要时的可获取性。 示例:用户想查看自己同部门其他人员电话信息时,可以查看其他人员的手机号码等信息
可用性 药品监管数据在设定有效生存周期内的可使用性。 示例:系统记录的联系地址等信息是可用的,可以将相关文件寄往该地址。
评估方法
数据质量评估中6个特性包含19项评估指标项,宜采用整体抽样方法对各指标项进行量化评估,其
中,各指标项默认权值相同。
单一指标评估值=合规数据/随机抽样数据*100%
综合指标评估值=∑单一指标估值/19 *100%
注: 随机抽样数据数量根据现场实际要求确定。
评估结果见表7。
表7 评估结果
综合指标估值 评估结果
0.9≤综合指标评估值≤1 优秀
0.7≤综合指标评估值<0.9 良好
0.6≤综合指标评估值<0.7 合格
0≤综合指标评估值<0.6 一般
7 标准实施及评价
结合本文件使用对象、和制定目及实施预期效果,认真做好标准实施准备,包括标准实施的方案
准备、组织准备、知识准备、手段准备和物质条件准备等。
制定标准实施方案。在标准颁布实施后的 1 月内宜组织标准主要起草人完成标准实施方案制定,
并报标准归口单位备案,同时编制完成标准宣贯讲义;6 个月内,计划组织不少于 1 次的标准宣贯培训。
本文件的相关方包括各级药品监督管理部门、药品生产销售企业、药品检测机构等。针对各类管
理人员、技术人员、行政人员等,重点宣贯药品监管数据质量评价指标、质量控制、质量要求。
本文件实施检查标准实施方案的落实情况,逐条检查标准实施内容的落实,并记录未实施内容的
理由或原因。文件起草单位将结合标准宣贯,每季度宜组织 1 次标准实施检查,也检查标准实施的支持
手段和物质条件的落实情况。做好标准实施验证记录,畅通标准实施信息采集的方式方法和反馈渠道,
定期整理并处理收集到的意见建议。依据《中华人民共和国标准化法》落实标准实施评价。
在文件实施 6 个月后,对照标准实施方案,宜开展标准实施效果评价分析,总结实施经验成效,
梳理存在的薄弱环节。标准实施的评价不仅从技术进步、质量水平、客户满意度、规范性、效率、节约、
节省、履行社会责任等方面进行有益性评价,同时还要评价标准实施带来的问题,以便为未来改进提供
参考,以评价标准促进标准持续完善。
适时向标准化行政主管部门和标准归口单位反馈情况,提出标准推广、修改、补充、完善或者废止
等意见建议。
标准实施信息及意见反馈表示例见附录 A。
7
DB42/T 2284—2024
附 录 A
(资料性)
湖北省地方标准实施信息及意见反馈表
表A.1给出了湖北省地方标准实施信息及意见反馈表。
表A.1 湖北省地方标准实施信息及意见反馈表
标准名称及编号
总体评价 适用性 该标准与当前所在地的产业或社会发展水平是否相匹配? □是 □否
协调性 该标准的特色要求与其他强制性标准的主要技术指标、相关法律法 规、部门规章或产业政策是否协调? □是 □否
执行 情况 标准执行单位或人员是否按照标准要求组织开展相关工作? □是 □否
实施信息 标准实施过程中是否存在阻力和障碍? □是 □否
实施过程中存在的主要问题
修改意见 总体 意见 □适用 □修改 □废止
具体修改 意见 需修改章节: 具体修改意见:
反馈渠道 □标准化行政主管部门 □省直行业主管部门 □专业标准化技术委员会(工作组) □标准起草组(牵头起草单位)
反馈人 姓名: 单位: 联系方式:
填表说明:为及时掌握标准实施情况,了解地方标准实施过程中存在的问题,并为标准复审提供科学依据,特制定
《湖北省地方标准实施信息及意见反馈表》。可根据实际情况在表格中对应方框打勾,有需要文字说明的反馈意见可在
相应位置进行文字描述,也可另附页。
8
DB42/T 2284—2024
参 考 文 献
[1] GB/T 36073-2018 数据管理能力成熟度评估模型
[2] GB/T 36344-2018 信息技术数据质量评价指标
9