中医方剂与图集的转换方法

点赞:4930 浏览:16742 近期更新时间:2024-02-29 作者:网友分享原创网站原创

摘 要:中药复方数据挖掘研究是将我国丰富的中药信息资源和现代最新信息技术相结合的重要内容,它意味着基于中医理论,利用知识发现技术,对传统中药新药、中医组方理论及规律、中药作用机制、有效成分构效关系等多个方面进行全面、系统的研究.图作为一种经典的数据结构,被广泛用于复杂数据结构分析与建模.文章探讨了图建模技术并实现了中医方剂与图集的转换.

关 键 词:中医方剂;中医药方;图集;数据结构;领域本体;数据库

中图分类号:TP39文献标志码:A文章编号:1006-8228(2012)11-26-02

ConversionmethodoftraditionalChinesemedicineprescriptionsandatlas

LanHaohui

(ZhejiangSongyangCountyfinanciallocaltaxationBureau,Lishui,Zhejiang323400,China)

Abstract:ResearchondataminingofChinesemedicineisitalbinationofabundantChinesemedicineinformationresourcesandmoderninformationtechnology.ItisbasedonTCMtheory,usingknowledgediscoverytechnologytomakeaprehensive,systematicresearchontraditionalChinesemedicineprescription,theoryandruleofChinesemedicineeffectiveponent,mechani,structure-activityrelationships.Atlas,asaclassicdatastructure,isusedinanalysisandmodelingofplexdatastructure.ThemodelingtechnologyofatlasisdiscussedandtheconversionoftraditionalChinesemedicineandatlasisimplemented.


Keywords:theprescriptionoftraditionalChinesemedicine;traditionalChinesemedicineprescription;atlas;datastructure;domainontology;database

0引言

本文主要研究如何将中医的相关知识合理地转换为图结构,从而为进一步利用图结构对中医的潜在知识挖掘做好准备.本文内容涉及到对中医方剂的提取方法和提取后的数据在数据库中存储的方式,以及这些存储内容中的关系计算和图结构的建立.

1中医数据

在取得中医医案后,先对文本进行初步的处理(主要是应用最大匹配算法(正向和反向)对中医医案进行初步的分词),然后对处理过的句子进行自底向上的句法分析,利用中医领域本体进行排歧处理、同义词识别和未登录词的识别,得到最优分词序列.分词框架如图1所示.

1.1分词算法

最大匹配算法(正向和反向)从左到右,或从右到左,每次取最长词,得到切分结果.正向匹配算法可分成五个步骤.

⑴待切分的汉字符串s1,已切分的汉字符串s2(s2初始串为空).

⑵s1如果为空串,转⑹.

⑶从s1的左边复制一个子串w作为候选词,w尽可能长,但长度不超过最大词长(一般为7个字长).

⑷如果在词表中能找到w,或w的长度为2,那么将w和一个词界标记(“/”)一起加到s2的右边,并且从s1的左边去掉w,转⑵.

⑸去掉w中最后一个汉字,转⑷.

⑹结束.

[开始][最大匹配算法][自底向上句法][优化后的词语][同义词识别][歧义处理][未登录词识别][结束][词库][本体库]

图1分词框架图

算法包含两重循环:外循环是从输入串中复制后选词w,内循环是用候选词w去匹配词表中的词.

反向最大匹配的是:每次从汉字符串的右边取一个候选词,候选词不止一个汉字而且在词表中查不到时,将它最前面的一个汉字去掉.

中医方剂与图集的转换方法参考属性评定
有关论文范文主题研究: 关于数据库的论文范文检索 大学生适用: 学院学士论文、学位论文
相关参考文献下载数量: 63 写作解决问题: 本科论文怎么写
毕业论文开题报告: 论文提纲、论文总结 职称论文适用: 技师论文、初级职称
所属大学生专业类别: 本科论文怎么写 论文题目推荐度: 经典题目

1.2本体的应用

本体是共享可重用的概念集合,利用本体捕获自然语言的语法知识,确定该领域内共同认可的术语(概念),提供人和机器对该领域知识的共同理解,并给出这些概念之间相互关系的明确定义.所以,本系统分析和建立了分词阶段所需要的定义.

中医领域本体是指应用本体论的基本方法,通过中医概念提取、关系提取,把中医知识体系中的名词术语抽象为一组概念与概念之间的关系的理论和方法.中医领域本体是主要用于描述中医领域知识的专门本体.它给出了中医领域实体概念及相互关系、领域活动以及该领域所具有的特性和规律的一种形式化描述.

中医领域本体的构建是由中医领域专家通过分析中医概念术语间的语义关系和中医辨证论治的层次关系,完成中医辨证论治基础本体的构建,并给出中医知识的共享模型的明确的形式化规范说明.中医领域本体(本系统中的中医领域本体雏形)的构建过程如下:

⑴确定概念,添加本体中的概念;

⑵建立概念之间的关系.

1.3数据库的设计

据中医药方剂的特点,同时考虑了以后的关系计算,我们按照病人就诊的过程设计了数据库.其中包括一诊、二诊等过程,以及望、闻、问、切等诊疗手段;同时,还包括方剂的组成,症状,证型等方剂本身的特点和数据,如图2所示.