您当前的位置:首页>行业标准>Q/SY 10552-2022 勘探开发知识图谱与人工智能平台技术规范

Q/SY 10552-2022 勘探开发知识图谱与人工智能平台技术规范

资料类别:行业标准

文档格式:PDF电子版

文件大小:8.99 MB

资料语言:中文

更新时间:2023-10-27 09:03:23



推荐标签: 人工智能 开发 平台 图谱 勘探 知识 技术规范 10552

内容简介

Q/SY 10552-2022 勘探开发知识图谱与人工智能平台技术规范 Q/SY
中国石油天然气集团有限公司企业标准
Q/SY 105522022
勘探开发知识图谱与人工智能平台技术规范
Technical specification for petroleum exploration and development
knowledge graph and artificial intelligence platform
2022—07—14发布
202209-01实施
中国石油天然气集团有限公司 发布 Q/SY10552—2022
目 次
前言 1范围 2规范性引用文件 3术语和定义人工智能平台架构与功能

1
4.1平台架构
4.2平台功能 5数据管理 5.1数据与数据集 5.2样本与样本库 6知识图谱 6.1 开发流程 6.2 命名规则 6.3 知识获取 6.4 知识融合 6.5 知识图谱质量评估 6.6 知识图谱应用 6.7 勘探开发知识图谱 7AI计算 7.1 工程分类与命名 7.2开发流程 7.3 算法及模型 7.4 二次开发 7.5服务发布 7.6成果共享 8平台安全要求 8.1数据、算法和模型安全 8.2人工智能技术和管理安全附录A(规范性) 知识图谱本体设计附录B(规范性) 算法注册规范参考文献
-
...
10
10
11
11 11
24
25 Q/SY10552—2022
前言
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件由数字和信息化管理部提出本文件由中国石油天然气集团有限公司标准化委员会信息技术专业标准化技术委员会归口。 本文件起草单位:数字和信息化管理部、勘探与生产分公司、勘探开发研究院、大庆油田公司,
大港油田分公司、长庆油田分公司、新疆油田分公司、规划总院。
本文件主要起草人:龚仁彬、卢山、窦宏恩、张仲宏、林霞、 米兰、欣、李宁、吴淑红、丁建宇、刘国强、石玉江、钟吉彬、冉卫东、张亚顺、董烈、陈斌、刘立夏、刘宗尚、向冲、武博宇、曹晨、董世泰、高志勇、胡国艺、 李顺明、武宏亮、李良川、黄晓丽。
S
1I Q/SY10552—2022
探开发知识图谱与人工智能平台技术规范
1范围
本文件规定了人工智能平台架构与功能数据管理、知识图谱,AI计算及平台安全要求。 本文件适用于从事油气勘探开发科研、生产和经营管理的人工智能研究与应用的信息技术人员及
业务人员。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件,不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
SY/T6184油气田勘探开发数据项属性规范值 SY/T6580石油天然气勘探开发常用量和单位 T/CESA1034信息技术 人工智能小样本机器学习样本量和算法要求 Q/SY10547(所有部分) 油气勘探开发数据结构
3术语和定义
下列术语和定义适用于本文件。
3.1
人工智能 artificial intelligence 利用数字计算机或数字计算机控制的机器模拟,延伸和扩展 的智能,感知环境、获取知识并使
用知识获得最佳结果的理论,方法、技术及应用系统。 3.2
勘探开发知识图谱exploration and development knowledge graph 对勘探开发业务知识、数据、图形图像, 日 国 半结构化、 非结构化多模态资料进行有
效加工、处理、整合、对齐,聚合大量勘探开发业务概念及其相互关系,主 通过实体,关系,实体或<实体。属性,属性值>三元组的形式来表示,可实现勘探开发知识的高效搜索。查询及推理等功能。 3.3
本体ontology 在大数据语境下,本体是一些约束后续各种不同层次逻辑模型的语义模型。 [来源:GB/T35295—2017.2.1.54]
3.4
实体entity 存在或可能存在的任何具体或抽象的事物,包括这些事物间的关联。
1 Q/SY105522022
[来源:GB/T5271.17—2010,17.02.05]
3.5
属性 attribute 实体的一种命名的性质。 [来源:GB/T5271.17—2010,17.02.12]
3.6
关系relation 具有相同属性的各实体值的集合及这些属性。 [来源:GB/T5271.172010.17.04.01]
4人工智能平台架构与功能 4.1平台架构
中国石油认知计算平台(E8)是按照集团公司“统一规划、统一标准、统一设计、统一投资、统一建设、统一管理”原则建设,按照教据 知识,算法 算力和场景五个关键因素进行设计的,通用、开放、可扩展的人工智能平台。平台由数据管理、知识图谱、AI计算、智能服务超市、系统管理和应用场景六部分组成, 人工智能平台功能架构见图1
A
业务应用 应用认知分析

R 测井油气层识别 初至波白动拾取 地层位解释 抽油机井工况诊断单井产量逆减和合水预测
...
系统管理权限管理告警管理运行监控用户管理日志管理
智能问智能服务超市
知识搜索模型展示
知识推荐
文本生成
自然语言处理
模型监控
发布审核 AI计算
知识图谱
图谱构建知识服务
本体管理图谱管理数据管理 数据集成
算法开发/训练
模型管理项目管理
模型部著数据处理
数据预处理
数据集管理
数据存储
图1人工智能平台功能架构
4.2平台功能 4.2.1 数据管理 4.2.1.1 数据管理为知识图谱和AI计算提供数据和样本 4.2.1.2数据管理具体功能包括数据集成,数据集管理,数据预处理,数据标注,样本库管理等。数据类型可支持:
a)结构化数据:可包括主数据及业务数据。 b非结构化数据:文本文档,如单井文档,物探文档,油气田开发和地面工程相关文档及其他
综合文档:交会图、部面图、平面图、柱状图、立体图、三维可视图等图件类数据,岩心照片、露头照片及分析化验照片,钻井、作业、生产等现场的音视频数据等。
c)半结构化数据,如网页等。
2 Q/SY 10552—2022
4.2.2知识图谱 4.2.2.1知识图谱模块提供知识图谱自动化构建,更新流水线,用于知识图谱构建,支持非结构化信息抽取,图谱自动化构建更新。 4.2.2.2图谱构建流程主要包括:本体选取,数据源配置,信息抽取,知识映射,知识融合和知识存储,并具有图谱管理和图谱可视化等功能。
4.2.3AI计算
4.2.3.1AI计算模块提供机器学习模型开发的全流程管理,具有工程管理、特征工程、算法开发与管理、模型训练、模型部署及发布功能。 4.2.3.2平台预置不少于100种带用的机器学习算法,支持主流的开源深度学习框架,如 TensorFlow,PyTorch,MindSpore,PaddlePaddle等。 4.2.4智能服务超市 4.2.4.1智能服务超市应集中发布和展示AI服务和智能模型。 4.2.4.2AI服务包括知识搜索、知识推荐 智能问答、命名实体识别、 分词,文本相似度计算等,智能模型包括用户发布的智能化业务模型及智能服务 4.2.5系统管理
系统管理包括权限管理、告警管理、运行监控、用户管理日志管理 4.2.6应用场景
中国石油认知计算平台(ES)已完成五个应用场景的研发,五个场景包括测井油气层识别、初至波自动拾取。地震层位解释、抽油机井工况诊断、单井产量递减和含水预测。
5数据管理
5.1 数据与数据集
5.1.1平台按照数据湖、统建系统。自建系统、其他数据的优先级获取数据。 5.1.2数据应进行预处理,包括清洗、过滤、格式转换等。 5.1.3平台数据宜采用常用标准的交换格式:
a)地震数据:应支持业内主流地震数据格式,如SEG-Y,GeoEast数据格式等: b)测井数据:应支持业内主流测井数据格式,如LAS、WIS、CIFLog数据格式等: c)地质模型数据:应支持业内主流地质模型数据格式,如DA工等: d)功图数据:应支持业内主流示功图数据格式,如CSV数据包含位移和载荷数据对: e)岩心照片:应支持业内主流岩心照片数据格式,如JPEG、PNG等。
5.1.4数据存储时应记录和存储数据集的元数据,包括数据来源,数据类型、数据内容、数据项说明。 5.1.5基于正态分布、长尾分布的数据质量监控,确定数据阔值,判断数据是否为异常数据。 5.1.6数据集命名规则应符合图2的规定,例如“地震大庆油田萨尔图V1.0.0”,其中各部分应满足以下要求。
a)专业指钻井、地震、测井、油藏开发、油气田生产等专业。
3 Q/SY10552—2022
b)归属指油气田公司(研究院)、采油厂、作业区等组织划分。 c)主要对象以油气田为单元划分(油田、探区、工区)。 d)版本由主版本号、子版本号、修正版本号三项组成。版本命名规则应按照V主版本号.子
版本号.修正版本号的格式命名,各版本之间应采用点连接。主版本号和次版本号是必选的,主版本号可从0开始。
e)各项之间应采用下划线“”连接。
X X
X X
第四层级(版本)
连接符(二))
三是级(主婴对象)
连接符(二)
第二层级(归属)
连接符(二)
第一层级(专业)
图2 数据集命名规则
5.2样本与样本库 5.2.1平台提供不同业务场景下样本数据集的管理,包括样本的构建,编辑,清洗。导人导出功能,支持样本库的查询、可视化展示功能 5.2.2勘探开发标注的样本数量应覆盖研究范围内数据80%以上的数据特征 5.2.3勘探开发标注的样本应满足常规勘探开发研究要求。涵盖研究范围内所有类型,且各种类型数量分布应相对均衡。 5.2.4样本库分类应按专业和业务流程进行分类 5.2.5样本库命名规则应符合图3的规定,其中各部分应满足
a)××油田应采用中国石油规定的名利 b)业务活动应采用最具体的业务名称,如初至波拾取等 c)版本命名应符合5.1.od)的规定 d)各项之间采用下划线
进行连接。
x x
第三层级(版本)
连接符(_)
第二层级(业务活动)
连接符()
第一层级(油田)
图3样本库命名规则
4
上一章:Q/SY 10555-2022 采油采气与地面工程数据规范 下一章:Q/SY 10553-2022 数据架构管理规范

相关文章

Q/SY 01086-2020 油气勘探开发测井资料采集与管理规范 Q/SY 10434-2021 勘探开发生产运行数据报表规范 Q/SY 10845-2021 勘探开发数据入湖技术规范 Q/SY 1547.1-2012 油气勘探开发数据结构 第1部分:勘探开发基础数据 Q/SY 10547.3-2018 油气勘探开发数据结构 第3部分:技术数据 Q/SY 08527-2021 油气田勘探开发作业职业病危害因素识别及岗位防护规范 Q/SY 1527-2012 油气田勘探开发作业职业病危害因素识别及岗位防护规范 Q/SY 10547.2-2018 油气勘探开发数据结构 第2部分:生产数据