
ICS 03.060 CCS A 11
中华人民共和国国家标准
GB/T 41462—2022
基于文本数据的金融风险防控要求Requirements for financial risks control based on text data
2022-04-15发布
2022-11-01实施
国家市场监督管理总局
发 布
国家标准化管理委员会
GB/T 41462——2022
基于文本数据的金融风险防控要求
1 范围
本文件规定了基于文本数据金融风险防控的整体框架、文本数据要求、预处理、信息抽取、数据表示、分析预警、用户交互、系统评估、安全防护、软硬件要求。
本文件适用于金融相关的文本数据处理及金融信息的挖掘、抽取与分析。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 4754—2017 国民经济行业分类
GB/T 20269——2006 信息安全技术 信息系统安全管理要求GB/T 20271——2006 信息安全技术 信息系统通用安全技术要求GB/T 32319—2015 银行业产品说明书描述规范
ISO 21586:2020 金融服务的参考数据 银行产品服务说明描述规范【Reference data for financial services—Specification for the description of banking products or services (BPoS)]
3 术语和定义
下列术语和定义适用于本文件。3.1
学习 learning
一个生物学系统或自动系统获得知识或技能的过程,使它可用于改进其性能。【来源:GB/T5271.31—2006,31.01.01】3.2
概念 concept 为确定类别成员的抽象实体。注:概念用于客体分类。
【来源:GB/T 5271.31—2006,31.01.06】3.3
语义 semantics
词或词组与它们的含义之间的关系。【来源:GB/T12200.1——1990,4.1.2.12】3.4
文本 text 文本数据 text data
以字符、符号、字、短语、段落、句子、表格或者其他字符排列形式出现的数据,旨在表达一个意义,其解释主要以读者对某种自然语言或人工语言的理解为基础。
示例:打印在纸上或显示在屏幕上的业务信件。【来源:GB/T5271.1—2000,01.01.03,有修改】3.5
信息(在信息处理中) information(in information processing)
关于客体(如事实、事件、事物、过程或思想,包括概念知识),在一定的场合中具有特定的意义。【来源:GB/T5271.1—2000,01.01】3.6
机器学习 machine learning 自动学习 automatic learning
功能单元通过获取新知识或技能,或通过重组现有知识或技能来改善其性能的过程。【来源:GB/T5271.28—2001,28.01.21】3.7
编码 code
汉字【汉语词语】编码 Chinese character【Chinese word and phrase】coding 按照一定的规则,对指定的汉字【汉语词语】集内的元素编制相应的代码。【来源:GB/T12200.1——1990,4.1.4.1】3.8
模式(用于人工智能) pattern(in artificial intelligence)一组特征及其相互关系,用来识别在给定背景中的实体。注:这些特征可包括几何形状、声音、图片、信号或文本。【来源:GB/T5271.28—2001,28.02.08】3.9
规则 rule
启发式规则 heuristic rule
一种特别的书面规则,能将专家用于解决问题的知识和经验形式化。【来源:GB/T5271.28—2001,28.03.09,有修改】3.10
抽取(用作动词) extract
(信息检索)从一组选项中,选择并取出某些符合预先确定的性质的项。【来源:GB/T17532—2005,8.9】3.11
结构化表示 structured representation
一种格式化的、可识别的并具有一定的操作规范的文本数据的表示方法。注:表示后的文本数据的性质和量值位置是固定的。示例:XML语言。3.12
本体(主体) subject
一种用于描述领域中各个概念和概念间的关系。示例:“金融”。3.13
属性 property 个体之间的二元关系。