河南省甲骨文信息处理重点实验室

实验室研究方向

2017年05月22日 17:02  点击:[]

实验室紧紧围绕国家重大战略需求,以服务文化传承创新为主线,建设具有国际水平的甲骨文大数据平台,采用智能信息技术服务甲骨学研究,把实验室建成甲骨文信息处理领域一流的科学研究、技术创新和人才培养基地。在多年开展甲骨文信息处理研究的基础上,形成了甲骨文数字化技术、甲骨文大数据分析技术、甲骨文模式识别技术、甲骨文知识工程四个稳定的研究方向,具有鲜明的特色。

(1)甲骨文数字化技术

数字化是甲骨文信息处理的基础,数字化技术主要研究甲骨文字库、编码、标准,以及资料库、文献库的数字化技术和数字出版技术,具体技术包括文献的多粒度检索技术;图片和文字的跨媒体检索技术;互联网甲骨文文献和研究资料的自动收集技术,总之,甲骨文大数据平台为社会提供一个资料齐全、权威、准确、实时、方便使用的甲骨文数据库。

(2)甲骨文大数据分析技术

在甲骨文大数据基础上进行数据挖掘,首先对甲骨文数据进行标注(手工、半自动、计算机自动标注),在标注的基础上通过统计、在线分析处理、检索、机器学习等方法进行上下文信息扩展,开展大数据关联挖掘等研究,从而进行分类、识别、聚类等数据分析,帮助解决甲骨残缺文字的拟补、分类分期等问题。

(3)甲骨文模式识别技术

主要研究甲骨文字在拓片、照片等图像中定位、分割、识别技术等,解决图像检索的难点,为甲骨文字形整理、分类和甲骨碎片缀合做好基础工作。甲骨文是一种没有进入国际字符编码标准UNICODE的古文字,所以甲骨文的存储和检索是甲骨文数字化的关键,甲骨文作为一种“比较”成熟的文字,字形复杂、异体字较多,字形标准很难统一,所以甲骨文的图像检索技术就变得非常重要。该方向为准确识别甲骨文提供技术支持。

(4)甲骨文知识工程

主要对甲骨学进行知识表示,构建面向智能考释的知识图谱,包括实体分类、属性预测、实体关系推理,进行知识推理并生成证据,对缺失语义进行补全或预测,帮助解决甲骨文未识文字的考释等问题。该方向从计算语言学角度研究甲骨文卜辞的语义、语法、甲骨文字的词性、词义,建立甲骨文本体和知识图谱,为推理和考释甲骨文字做好基础工作。

关闭