基于本体的石油地质领域知识服务系统研究
0 引言
目前的信息服务主要是依靠检索词匹配的方式来实现资源的查询与利用,因而检索词匹配的程度直接决定了资源的利用率和信息服务的效果。依靠检索词匹配方式的检索系统主要存在的问题是,由于忽略了知识资源的语义层面,因而造成了大量语义知识资源的确缺失,无法准确地反映知识资源与用户检索需求之间的相似度[1]。特别是面对海量、异构的地质资料数据,传统的信息服务系统很难满足用户的检索需求。具有语义匹配功能和本体知识技术的知识服务系统成为当前研究热点和难点。
1 地质服务的知识框架
随着信息服务系统的不断发展,地质资料已从传统的借阅服务转变为知识服务,即按照知识结构和语义特征进行资料的组织、共享与服务已经成为必然趋势。本体能够构建出清晰的领域知识框架及脉络,继承已有的知识资源,避免重复工作,使得知识资源的高效快捷的重用及共享成为可能。在本体的基础上将行业内的标准规范、统计数据、学科知识脉络、研究进展和资源索引库等资源进行多元融合,就可以形成较为丰富完善的领域产品,以产品层作为数据支撑,就可以构建出个性化的领域知识服务系统。结合石油领域特点,本文提出了基于本体的石油地质领域知识服务框架,具体如图 1所示。
图1 基于本体的石油地质领域知识服务框架Fig.1 The framework of petroleum geological knowledge service system based on ontology
资源层:石油地质领域的原始资源来自于书籍、研究报告、各类原始数据和统计数据、地质图库、油藏模型以及网页上的资源等各种形式的已有工作成果。
知识层:要实现地质领域的知识服务,首先要建立领域知识架构。地质本体能够提供包括石油地质领域、构造地质领域、古生物领域等各类地质领域知识的结构化描述、定义及属性[2]。
产品层:知识服务需要有丰富多样的产品作为支撑,包括基于本体的学科知识脉络、数据产品、统计数据产品、研究进展报告及资源索引库等。这些知识产品一方面提高用户检索资源的命中率,找到用户真正需要的资源;,另一方面还能够为用户提供可能与检索需求相关的参考概念,以及相应的资源。
服务层:学科知识服务的主要途径是用户主动检索。这种检索可以在机构内网,也可以通过互联网。知识检索的对象可以是结构化的领域本体,可以是基于知识网络索引的一般资源,服务层的目标就是为各种类型用户满足各种不同的需求,最终提供个性化服务。
知识服务的根本目的就是能够直截了当的为用户提供真正需要的知识和资源,省去用户自己归纳总结筛选排除的过程。本文所提出的基于本体的地质领域知识服务框架,能够把松散地存放于各处的原始资料进行加工处理,形成系统的知识结构,将构建成的领域本体进一步开发形成知识产品,最后实现知识服务。
结合石油地质领域的特点,本文构建了石油地质领域本体,并基于开源的全文搜索工具包Lucene等技术实现了石油地质领域知识检索系统试验[3]。
2 构建石油地质领域本体
手工构建本体是一项耗时耗力的巨大工程,自动化构建本体技术尚不成熟[1,4],鉴于已有完善的《地质叙词表》和《石油主题词表》,因而本文提出一种基于叙词表的半自动化本体构建方法,具体方法如图2所示。
图2 叙词表转换为本体的流程Fig.2 The process of converting the thesaurus into an ontology
地质叙词表又称为地质主题词表,包含了地质学科的词汇和词汇之间的各种关系。叙词表的语义关系分为“用、代、分、属、参”,分别用来表示词汇之间的等同、等级、相关等语义关系。叙词表包含较全面和权威的领域概念和重要的语义关系,为本体提供了较好的概念基础。很多研究尝试基于叙词表进行构建本体,研究重点在于叙词表向本体转换的方法。
由叙词表构建本体的方法将叙词表的叙词作为本体中概念的来源,在叙词表概念关系的基础上,修改完善概念的属性、关系,并添加公理和函数。叙词表的相关关系没有更细的划分,包含了本体一般定义中除了层次关系和等同关系外的所有关系。所以要想建立更精确的领域本体,除了叙词的注释,还需要参考其他知识来源,如《石油地质》、《中国石油勘探开发百科全书》等,为本体的类添加需要的关系[4]。
最终通过概念和概念层级的确定、定义概念的属性、对汉语拼音、叙词编号、英文译名、范畴号、注释项的处理及为概念添加实例等工作[5],构建了轻量级的石油地质领域本体,完成的面向知识服务的石油地质领域本体包含个概念,概念之间的关系达到个,概念的实例4137个。关系分为等同关系、等级关系和相关关系,其中相关关系除包含叙词表中固有的相关关系,还增加了相关领域学科,如信息技术及数学地质。实例涵盖了石油人物、书籍、机构以及重点区域等,具体如图3所示。
文章来源:《新疆石油地质》 网址: http://www.xjsydzzz.cn/qikandaodu/2020/1029/426.html
上一篇:试述石油地质工程中改善高含水期油田注水开发
下一篇:智慧园区发展思路研究