一种基于语言学特征的本体匹配改进算法

点赞:9229 浏览:34667 近期更新时间:2024-02-03 作者:网友分享原创网站原创

摘 要 :本体匹配通过发现领域内不同本体间元素的映射关系来解决本体异构的问题.该文主要通过对基于语言学特征的本体匹配相关算法展开研究与讨论后,提出了一种基于编辑距离、I-Sub算法和WordNet的综合性本体匹配算法,并设计了一个匹配框架对该算法进行实验验证.


关 键 词 :本体;本体匹配;基于语言学;相似度算法

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)17-4094-04

本体的目标是捕获相关领域的知识,确定该领域内共同认可的词汇,通过概念之间的关系来描述概念的语义,提供对该领域知识的共同理解.由于本体创建和使用的主观性、自治性和分布性,造成了本体异构的问题,本体匹配是解决本体异构问题的有效途径,是发现不同本体之间实体元素映射关系的关键技术.通过本体映射可以建立异构本体间的交互规则,使异构本体间能相互沟通,实现语义互操作.

本文以本体匹配为研究对象,针对基于语言学特征的本体匹配算法进行分析和研究,分别比较了三种不同的本体匹配算法:编辑距离、I-sub算法和基于WordNet的相关算法,然后根据这三种算法的特点提出了一种综合性改进算法,给出了新算法的设计模型,并构建了一个本体匹配工具,最后通过实验分析该算法的有效性.

1.基于语言学特征的本体匹配算法分析

1.1通过编辑距离计算相似度

通过编辑距离计算两个字符串之间的相似度是一种很常用的本体匹配方法.字符串编辑距离表示的是两个字符串通过插入字符、删除字符、改写字符而变为相同字符串所需要的操作数.

4.结束语

本文以基于语言学特征的相似度算法为研究对象,分析了算法的基本思想,然后提出了基于多种语言学特征的综合相似度算法,给出了相应的本体匹配的算法设计.通过数据集benchmarks进行验证,分别与相关的两种算法相比较并分析结果,验证此综合算法在本体匹配方面的可行性与有效性.该文的不足之处在于将本体匹配局限于语言学特征这一方面,没有对本体结构等方面作深入研究,导致匹配方法的单一性,影响了匹配的精度和广度,下一步的工作要拓展思路,将本体匹配方法扩展到本体的其它特性,提高本体匹配的效率.