ICS 01.040.01
CCS
A 00
44
广
东
省
地
方
标
准
DB44/T 2562.1—2024
政务大数据 公共数据元规范 第 1 部分:
基础数据元
Government big data Specification of common data elements Part1: Basic data
elements
2024 - 11 - 11 发布
2025 - 02 - 11 实施
广东省市场监督管理局 发 布
DB44/T 2562.1—2024
I
目
次
前言 ................................................................................. II
1 范围 ............................................................................... 1
2 规范性引用文件 ..................................................................... 1
3 术语和定义 ......................................................................... 1
4 基本要求 ........................................................................... 3
5 公共数据元目录 ..................................................................... 7
附录 A(规范性) 数据元值域代码集 .................................................... 75
参考文献 ............................................................................ 276
索引 ................................................................................ 278
DB44/T 2562.1—2024
II
前
言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件是是DB44/T 2562《政务大数据 公共数据元规范》的第1部分。DB44/T 2562已发布了以下
部分:
——第1部分:基础数据元。
本文件由广东省政务服务和数据管理局提出、归口,并组织实施。
本文件起草单位:数字广东网络建设有限公司、厦门市巨龙信息科技有限公司
本文件主要起草人:陈胜凯、王波、周海军、刘芸、吴绍灯、罗小松、邓光金、黄琦、郑强生、李
琛琛、任勇、汪延杰。
DB44/T 2562.1—2024
1
政务大数据 公共数据元规范 第 1 部分:基础数据元
1 范围
本文件规定了广东省数据资源“一网共享”平台(以下简称省数据资源“一网共享”平台)公共数
据元的基本要求及自然人、法人、位置、资产等基础数据元的分类及属性。
本文件适用于省数据资源“一网共享”平台及地市分节点公共数据的交换和共享。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 4880.1—2005 语种名称代码 第1部分:2字母代码
GB/T 4880.2—2000 语种名称代码 第2部分:3字母代码
GB/T 4880.3—2009 语种名称代码 第3部分:所有语种的3字母代码
GB/T 4881—1985 中国语种代码
GB/T 5271.1—2000 信息技术 词汇 第1部分:基本术语
GB/T 7408—2005 数据和交换格式 信息交换 日期和时间表示法
GB 11714—1997 全国组织机构代码编制规则
GB 12904—2008 商品条码 零售商品编码与条码表示
GB 16735—2019 道路车辆 车辆识别代号(VIN)
GB/T 17986.1—2000 房产测量规范 第1单元:房产测量规定
GB/T 18391.1—2009 信息技术 元数据注册系统(MDR) 第1部分:框架
GB/T 19488.1—2004 电子政务数据元 第1部分:设计和管理规范
GB/T 19488.2—2008 电子政务数据元 第2部分:公共数据目录
GB/T 23705—2009 数字城市地理信息公共平台地名/地址编码规则
GB/T 30170—2013 地理信息 基于坐标的空间参照
GB 32100—2015 法人和其他组织统一社会信用代码编码规则
GB/T 36104—2018 法人和其他组织统一社会信用代码基础数据元
GB/T 37346—2019 不动产单元设定与代码编制规则
GA 36—2018 中华人民共和国机动车号牌
GA/T 543.1—2011 公安数据元(1)
LD/T 32.6—2015 社会保障卡规范 第6部分:应用数据结构
WS 375.9—2012 疾病控制基本数据集 第9部分:死亡医学证明
WS 376.1—2013 儿童保健基本数据集 第1部分:出生医学证明
CFDAB/T 0301.3—2014 食品药品监管信息基础数据元 第3部分:药品
CFDAB/T 0301.4—2013 食品药品监管信息基础数据元 第4部分:医疗器械
3 术语和定义
DB44/T 2562.1—2024
2
GB/T 19488.1—2004、GB/T 19488.2—2008、GB/T 18391.1—2009界定的以及下列术语和定义适用
于本文件。
省数据资源“一网共享”平台 data shared platform
在数字政府改革模式下,集约建设的省市一体化的政务大数据中心,分为省级节点和地级以上市分
节点,是承载数据汇聚、共享、分析等功能的载体。
注: 即《广东省公共数据管理办法》中第三条第四点中所述省政务大数据中心,依照《关于印发我省数字政府改革
建设“12345+N”工作业务体系的通知》更名所得。
数据 data
信息的可再解释的形式化表示,以适用于通信﹑解释或处理。
注: 数据可以由人工或自动的方式加工,处理。
[来源:GB/T 5271.1—2000,01.01.02]
数据元 data element
用一组属性描述定义、标识、表示和允许值的数据单元。
[来源:GB/T 18391.1—2009,3.3.8]
电子政务数据元 electronic government data element
政务活动过程中涉及的所有数据元。
[来源:GB/T 19488.1—2004,3.3]
公共数据元 common data element
在多个政务部门的应用系统中共同使用的数据元。
[来源:GB/T 19488.2—2008,3.4]
元数据 metadata
定义和描述其他数据的数据。
[来源:GB/T 18391.1—2009,3.2.16]
对象类 object class
对象集。现实世界中的想法,抽象概念或事物的集合,有清晰的边界和含义,并且特性和其行为遵
循同样的规则而能够加以标识。
[来源:GB/T 18391.1—2009,3.3.22]
特性 property
对象类的所有个体所共有的某种性质。
[来源:GB/T 18391.1—2009,3.3.29]
表示 representation
值域、数据类型的组合,必要时也包括计量单位或字符集。
[来源:GB/T 19488.1—2004,3.8]
DB44/T 2562.1—2024
3
实体 entity
任何具体或抽象的事物,包括事物间的联系。
[来源:GB/T 19488.1—2004,3.10]
属性 attribute
某个对象或实体的一种特性。
[来源:GB/T 18391.1—2009,3.1.1]
值域 value domain
允许值的集合。
[来源:GB/T 18391.1—2009,3.3.38]
采集机关 the government department responsible for collection
指根据法律、法规、规章确定的某一类公共数据的法定采集部门,是公共数据元信息编制与维护的
主体。
注册机构 registration authority
经授权对数据元或其他对象注册的组织。
[来源:GB/T 19488.1—2004,3.15]
4 基本要求
数据元属性
数据元的规范是通过对其一系列属性的描述来实现的。这些属性实际上是数据元的元数据。
数据元主要的属性和说明见表1。
表1 数据元属性
属性名称
定义说明
内部标识符
在一个注册机构内,由注册机构分配的、与语言无关的数据元的唯一标识符。该标识符由
注册机构省政务服务数据管理局进行统一的维护管理。
一级分类
一级分类是对具备共性的数据元进行排列或分组的大类。
二级分类
二级分类是对具备共性的数据元进行排列或分组的小类。
中文名称
赋予数据元的单个或多个中文字词的指称。
英文名称
赋予数据元的单个或多个英文字词的指称。
业务定义
表达一个数据元的本质特性并使其区别于所有其他数据元的陈述。
表示词
数据元名称成分之一,表达了该数据元值域的表示形式。
数据类型
用于表示数据元的符号、字符或其他表示的类型。
数据格式
描述从技术角度规定的数据项所允许的数据类型。
值域
根据相应属性中所规定的数据类型、数据格式而决定数据元的允许值集合。对于值域范围
为枚举值的,说明所引用的代码表。
采集机关
对数据元注册系统的数据元提出增补、变更、取消、删除或撤出的机构或其所属(或授权)
部门。
备注
数据元的附加注释。
DB44/T 2562.1—2024
4
数据元分类
4.2.1 数据元分类原则
为了确保数据元分类合理,对数据元进行分类时宜参照以下原则:
a) 科学性:选择事物或概念(即分类对象)最稳定的本质属性或特征作为分类的基础和依据;
b) 系统性:将选定的事物、概念的属性或特征按一定的排列顺序予以系统化,并形成一个科学合
理的分类体系;
c) 可扩展性:通常要设置收容类目,以保证增加新的事物或概念时,不打乱已建立的分类体系;
d) 兼容性:应与相关标准(包括国际标准)协调一致;
e) 综合实用性:分类要从系统工程角度出发,把局部问题放在系统整体中处理,达到系统最优。
4.2.2 数据元分类
4.2.2.1 关于数据元一级分类的说明见表 2。
表2 数据元一级分类
一级分类
说明
自然人类
与个人社会生活密切相关的数据元,代表了个人的基本状态与特征。例如:姓名、证件号码、民
族等。
法人类
与法人信息密切相关的数据元,代表了法人的基本状态与特征。例如:机构名称、统一社会信用
代码等。
位置类
与任何层次地理区域、地址相关的数据元。例如:道路编号、道路类型代码等。
资产类
与车辆、房屋的基本信息、活动密切相关的数据元。例如:车辆识别代号、产权证号等。
其他类
上述无法表示的其他数据元。例如:国际标准书号等。
4.2.2.2 关于数据元二级分类的说明见表 3。
表3 数据元二级分类
一级分类
二级分类
说明
自然人类
基本信息
自然人最基本、且基本不变的信息,比如姓名、性别、出生日期等。
出生信息
自然人出生相关的信息,包括出生日期、出生医学证明编号等。
婚姻信息
自然人的婚姻信息,包括结婚信息、离婚信息等。
教育信息
自然人接受教育的相关信息,包括学籍、专业等。
就业信息
自然人工作经历和获得相关职业资质的信息。
社保信息
自然人所获得的社会保障、社会救助等相关信息。
死亡信息
自然人死亡相关的信息,包括死亡日期、死亡医学证明编号等。
健康信息
自然人健康相关的信息。
违法犯罪信息
自然人违法犯罪的相关信息。
法人类
注册登记信息
法人最基本的识别信息。比如统一社会信用代码、企业名称等。
税务信息
法人税务相关的信息。
变更信息
法人变更相关信息。
注销登记信息
法人注销登记相关信息。
资本与资产
法人名下所有的资本、资产信息。
信用评价信息
法人信用评价相关的信息。
机构扩展信息
法人其他不在上述分类的信息。
DB44/T 2562.1—2024
5
表3 数据元二级分类(续)
一级分类
二级分类
说明
位置类
地址信息
包括各类与地址相关的信息。
道路信息
包括道路的编号、分类分级等信息。
资产类
机动车类信息
各类车辆的基本信息,包括车辆识别代号、车辆品牌等。
房屋基本信息
各类房屋的基本信息,包括产权证号、建筑面积等。
其他类
药品信息
与药品管理有关的信息,包括药品通用名称、药品规格等。
医疗器械信息
与医疗器械管理有关的信息,包括医疗器械注册证号等。
其他信息
不在上述分类的其他信息。
内部标识符的编码规则
数据元内部标识符采用两段式编码,由分类码和顺序码组成,编码结构如图1所示。
图1 数据元内部标识符编码结构
数据元内部标识符由数字型代码标识组成,采用两段式的编码规则:
a) 分类码,2 位数字,表示数据元的一级分类,见表 4;
b) 顺序码,4 位数字,表示数据元的顺序号。
表4 内部标识符(前两位)的编码规则
内部标识符(前两位)
说明
11
自然人类数据元
12
法人类数据元
13
位置类数据元
14
资产类数据元
99
其他类数据元
表示词
表示词是数据元名称成分之一,标识出数据元的表示词有助于实现对数据元的规范化命名、分析、
类比和查询等功能。常用的表示词见表5。
DB44/T 2562.1—2024
6
表5 常用的表示词
表示词名称
说明
金额
货币单位的数量,通常与货币类型有关。
日期时间
特定的年月日或时间点。
代码
表示一组值中的一个值的字符串(字母、数字、符号)
描述
表示一个人、客体、地点、事件或概念的一系列句子,既可用于定义(通常用一两个句子),也可
用于较长文本。在数据元的中文名称中通常使用“说明”、“备注”、“意见”等词。
名称
为一个人、客体、地点、事件或概念指定的一个词或短语。该词或短语是对人、客体、地点、事
件或概念的称谓。
号码
一个特定值的数字表示。它通常表示了顺序或一系列中的一个。
量
非货币单位的数量,通常与计量单位有关。
比率
一个计量的量或金额与另一个计量的量或金额的比。
指示符
两个且只有两个表明条件的值,比如 Yes/No、True/False。
数据类型
数据类型用于表示数据元的符号、字符或其他表示的类型。数据类型可能的取值见表6,应符合GB/T
19488.1—2004,5.5.2的要求。
表6 数据类型
数据类型
说明
字符型
通过字符形式表达的值的类型。
数值型
通过从“0”到“9”数字形式表达的值的类型。
日期时间型
通过 YYYYMMDD、YYYYMMDDhhmmss 等形式表达日期时间的类型。
布尔型
两个且只有两个表明条件的值,比如 Yes/No、True/False。
大文本类型
存储大文本的数据类型,比如文章,大段文字等。
二进制类型
上述无法表示的其他数据类型,比如图像、音频等。
数据格式
数据格式是从业务角度规定的数据元值的格式需求,包括所允许的最大、最小字符长度,数据元值
的表示格式等。数据格式中使用的字符含义见表7,应符合GB/T 19488.1—2004,5.5.3的要求。
表7 数据格式
数据格式
说明
a
字母字符,包括一般符号、拉丁字母、汉字、汉字拼音符号等
n
数字字符
an
字母数字字符
m
定长 m 个字符
..ul
长度不定的文本
..p,q
最长 p 个数字字符,小数点后 q 位
..
从最小长度到最大长度,前面附加最小长度,后面附加最大长度
YYYYMMDDhhmmss
YYYY 表示年份,MM 表示月份,DD 表示日期,hh 表示小时,mm 表示分钟,ss 表示秒,可以视
情况组合使用
DB44/T 2562.1—2024
7
数据元的使用
在使用省数据资源“一网共享”平台公共数据元时,可以有如下两种方式:
a) 直接使用:直接用于公共数据元来开展数据库或信息交换格式的设计。例如,“政治面貌代码”、
“民族名称”等数据元可以直接使用;
b) 派生使用:对公共数据元中的对象类词或特性词进行限定,生成新的数据元。例如,对于公共
数据元“证件有效期开始日期”,可以将其扩展为“港澳通行证有效期开始日期”;又如,对
于公共数据元“姓名”,可以扩展为“参保人姓名”。需要注意的是,派生后的数据元与原数
据元相比,在定义、数据类型、数据格式、值域等属性上不能出现矛盾。
扩展原则
数据元扩展需从政务信息资源出发,对应用范围广、共享程度高、交互频繁的信息项,参考国家标
准、行业标准、法律法规、国家或部委规范等新增数据元。扩展数据元应按照内部标识符的编码规则新
增分类及数据元,并定义数据元的属性。
5 公共数据元目录
自然人类
5.1.1 基本信息
5.1.1.1 姓名
内部标识符:110001
一级分类:自然人类
二级分类:基本信息
中文名称:姓名
英文名称:name
业务定义:指在户籍管理部门正式登记注册、人事档案中正式记载的姓氏名称。
表示词:名称
数据类型:字符型
数据格式:an..50
值域:
采集机关:公安部门
备注:汉字表示的姓名中间不应存在空格。
5.1.1.2 人员英文名
内部标识符:110002
一级分类:自然人类
二级分类:基本信息
中文名称:人员英文名
英文名称:English name
业务定义:指人的英文名的全称。
表示词:名称
数据类型:字符型
DB44/T 2562.1—2024
8
数据格式:an..80
值域:
采集机关:公安部门
备注:
5.1.1.3 曾用名
内部标识符:110003
一级分类:自然人类
二级分类:基本信息
中文名称:曾用名
英文名称:former name
业务定义:指曾经在户籍管理部门正式登记注册、人事档案中正式记载的姓名。
表示词:名称
数据类型:字符型
数据格式:an..50
值域:
采集机关:公安部门
备注:
5.1.1.4 性别代码
内部标识符:110004
一级分类:自然人类
二级分类:基本信息
中文名称:性别代码
英文名称:codes for gender
业务定义:指人的性别代码。
表示词:代码
数据类型:字符型
数据格式:n..1
值域:符合附录A表A.1 性别代码表的规定。
采集机关:公安部门
备注:
5.1.1.5 性别名称
内部标识符:110005
一级分类:自然人类
二级分类:基本信息
中文名称:性别名称
英文名称:name of gender
业务定义:指人的性别名称。
表示词:名称
数据类型:字符型
数据格式:an..20
DB44/T 2562.1—2024
9
值域:符合附录A表A.1 性别代码表的规定。
采集机关:公安部门
备注:
5.1.1.6 民族数字代码
内部标识符:110006
一级分类:自然人类
二级分类:基本信息
中文名称:民族数字代码
英文名称:numeric codes for nationality
业务定义:指民族的数字代码。
表示词:代码
数据类型:字符型
数据格式:n..2
值域:符合附录A表A.2 民族数字代码表的规定。
采集机关:公安部门
备注:
5.1.1.7 民族字母代码
内部标识符:110007
一级分类:自然人类
二级分类:基本信息
中文名称:民族字母代码
英文名称:alphabetic codes for nationality
业务定义:指民族的字母代码。
表示词:代码
数据类型:字符型
数据格式:a..2
值域:符合附录A表A.3民族字母代码表的规定。
采集机关:公安部门
备注:
5.1.1.8 民族名称
内部标识符:110008
一级分类:自然人类
二级分类:基本信息
中文名称:民族名称
英文名称:name of nationality
业务定义:指中国各民族的名称。