信息组织视角CNKI

点赞:27030 浏览:128190 近期更新时间:2024-02-19 作者:网友分享原创网站原创

摘 要 从信息组织的视角对CNKI知识网络怎么写作平台分别从宏观(资源集合的导航组织;检索结果集合后处理组织)、中观(基于文献单元的引文链接组织)、微观(基于知识单元的知识元链接组织;概念关系词典技术)层面进行剖析;认为CNKI提供一个相对较为完善和深入的数字图书馆信息组织方法体系,可以作为我国数字图书馆信息组织的典范.并期望CNKI通过优化信息组织能提供更高质量的知识怎么写作.


关 键 词 信息组织 知识组织 数字信息组织 CNKI 引文链接 知识元链接

分类号 G354

作为中国国家知识基础设施的CNKI,经过多年的发展,无论在资源数量、信息组织水平、检索平台功能还是信息怎么写作方面都取得了长足的进步,知识增值效应得到了充分的显现,也为我国数字图书馆的建设与发展树立了典范.

1 数字信息组织与CNKI信息组织概述

信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的信息增值过程,是信息获取和利用的基础.数字网络环境下,信息组织的外延不断拓展,信息资源的采集、信息内容的揭示和关联、信息链接组织、信息内容和信息体系重组、信息系统整合组织、检索结果后处理组织都是信息组织的重要内容和任务,远远超出了图书情报系统传统信息组织的范围.

目前,数字图书馆信息组织面临的最大挑战是如何增强信息组织的适应性和有效性,通过对系统与内容的灵活组织及深层组织,从而实现全面满足用户各方面、各层次的信息需要.作为我国数字图书馆建设的一面旗帜,CNKI基于其相当完备和充足的资源数量,充分体现了数字图书馆信息组织的灵活性、深入性、适应性、有效性特征,为实现知识搜索提供了充分的信息组织和知识组织保证.

在CNKI的开发过程中,先后制定了“CNKI系列数据库产品标准”,涉及到从数据入编、加工到最后形成数据库产品的全过程,从数据源头、数据质量等方面为开展深入的知识挖掘提供了基础;建设了各种知识库资源,包括:CNKI知识词典、引文数据库、各种索引数据库、概念关系词典等,对实现知识搜索、提高搜索性能起到了基础性作用.

CNKI自主开发的网络资源检索和怎么写作的共享平台,简称KNS.目前KNS已从3.0版升级到5.0版.2008年CNKI推出中国学术文献网络出版总库检索平台,依托强大的知识网络怎么写作平台KNS5.2,与其他文献资源实现跨库检索,并通过知网节构建成知识型数据库.新平台深度整合了CNKI的系列数据库,信息揭示的维度和深度、平台检索和怎么写作功能均得到显著提升,真正形成了知识资源的深度开发和利用平台.

CNKI以多维导航、检索结果分组聚类和排序显示、引文链接、知识元链接、概念关系词典等主要信息组织技术为支撑,提供强大的信息检索功能和知识发现功能,极大地提高了信息资源的增值利用程度.

2 宏观信息组织

宏观层面的信息组织是指应用组成信息集合的资源标识系统为用户生成导航路径,其目的是为了去支持用户随机的浏览和定向的检索.宏观信息组织的核心是按资源的一个或多个属性的不同对信息集合重新分组整合形成子集合的过程.笔者把宏观的信息组织分为前检索阶段资源集合的导航组织和后检索阶段上的检索结果集合聚类组织.

信息组织视角CNKI参考属性评定
有关论文范文主题研究: 关于数据库的论文范例 大学生适用: 本科毕业论文、研究生论文
相关参考文献下载数量: 73 写作解决问题: 写作资料
毕业论文开题报告: 论文提纲、论文小结 职称论文适用: 期刊发表、中级职称
所属大学生专业类别: 写作资料 论文题目推荐度: 最新题目

2.1 资源集合的导航组织

导航体系决定用户对系统信息资源的选择和搜寻策略.当信息集合覆盖多学科、多层次、多类型的巨量内容资源时,如何引导用户快速定位到目标子集合、找到所需要的信息内容就是信息集合可用性和易用性的一个重要指标,这就是资源的导航组织.

数据库或信息系统等信息集合通常通过提供分类、主题浏览等方式进行导航组织.当然,具体导航方式的选择取决于信息资源集合的特点、信息资源的构成、信息用户群等因素.一个优秀的复杂信息集合往往采用多种导航方式,让用户在巨量的信息集合中任意选择自己的搜索路径,快速定位到最精确的目标子集合.多维导航方式的选择从信息组织原理来分析,实质是根据信息集合或资源的属性进行分面分类的过程.

CNKI将《中国知识资源总库》中各数据库整合为一个检索平台,使每种数据库都支持单库和跨库检索.为此,CNKI平台提供了多维导航和个性化导航,并在最新版平台中实现了多维导航和个性化的集成.多维导航分为学科内容分类导航、数据库资源类型导航、期刊导航(按期刊荣誉和权威性)、基金导航(根据期刊发文的特点)和机构导航等.个性化导航,主要体现在最新版的CNKI中,《中国学术文献网络出版总库》收录的所有文献,均按《中国图书分类法》分成168个学科数字图书馆和3000多个子专业数字图书馆,各学科专业数字图书馆均是该学科专业的学术文献总库.用户可根据自己的研究领域,选择进入某学科专业领域的数字图书馆,既可纵览本学科全部文献内容,又可涉猎本学科的相关领域.各专业馆详细揭示本学科及其边缘和交叉学科的重要研究成果、进展与动态,并可使用户了解、掌握重要研究项目和相关研究人员与机构的研究历史和最新动向.表1罗列了“图书情报与数字图书馆”专业数字图书馆的所有导航栏目名称:

2.2 检索结果集合后处理组织

如果说前检索阶段资源集合的导航组织主要用于定位检索目标,那么检索后处理阶段对检索结果集合的聚类组织和排序显示是对检索结果的进一步重组,有助于用户快速定位到准确的检索结果,减轻检索负担.大规模应答检索结果集的后处理,即聚类组织和排序显示的作用随着Web海量搜索的发展突显了出来,表现为:一方面可实现从多角度、多层次反映文献与查询要求;另一方面改变了传统检索过程中不考虑用户检索偏好,缺少根据用户具体需求的变化动态调整检索策略的缺憾,进而提高了查准率和易用性.

CNKI新平台对检索结果集合进行了深入的细化分组聚类和排序组织,一是提供多角度的文献分组聚类:学科类别、中文关 键 词、研究层次、文献作者、文献出版来源、期刊名称、研究资助基金、来源数据库、发表年度、作者单位;二是提供相关性、发表时间、被引频次和下载频次多种排序显示方式.将传统上线性、一维、散列的检索结果立体化、多维化、计量化,从而实现检索结果的快速筛选和准确定位.表2为“信息共享空间”86条检索结果的部分分组聚类显示:

3 中观知识组织

知识是相互联系的,也是在这种联系中继承并创新发展的.发现、理解这种联系,是人们有效学习和成功创新的关键.“站在巨人的肩膀上”揭示了文献引用的动机――原文献的科学参考价值,这是引文存在的本原.1955年,Dr.Garfield在《Science》发表论文提出将引文索引作为一种新的文献检索与分类工具,即将一篇文献作为检索字段从而跟踪一个Idea的发展过程状态.自此,引文索引成为文献信息组织的重要方法,成就了一大批权威的引文索引数据库,如IsI的SCI(现发展为IsIWeb0fKnowledge平台)、EI《工程索引》等;进而,基于引文分析链接组织的引文检索也成为重要的知识发现和知识创新的科学查询方法.

就知识组分的层次而言,引文链接组织属于文献单元知识组织的范畴.通过文献引文链接,人们可以从一篇高质量的文献出发沿着科学研究的发展道路,通过对被引文献(citedreference)的追溯――越查越旧;追踪引用文献(timescited)――越查越新;挖掘相关文献(relatedrecords)――越查越深,从而实现科研的创新与发展.此外,引文分析有助于人们发现学科分布、发展趋势以及评价机构、作者的学术水平等.

在数字化、网络化出版载体中,引文链接揭示文献之间学术关联的特性得到了充分的释放和展示.数字链接技术让引文链接分析组织技术如虎添翼,得到了极致发挥,一大批网络引文系统应运而生,如GoogleScholar、CrossRef等.CNKI也是一个非常成功的网络引文数据库.

CNKI平台的基础之一就是引文链接网络,它充分利用引文链接组织技术,对所收录的每一篇文献进行引文分析,切分引文条目,分析引文元数据项,建立深度关联的引文网络,包括参考文献、引证文献、共引文献、同被引文献、二级参考文献、二级引证文献.此外,CNKI还通过对相关知识元(如作者、机构)的分析,以及基于Web日志分析和关联规则挖掘,设置了相似文献、同作者与相关作者文献、同机构与相关机构文献、同类文献、同行关注文献(见最新版CNKI)等相天文献的链接.“引文网络+相关文献链接”构成了CNKI的核心――“知网节”.以“中国知网”期刊库为例,某一篇文献的“知网节”(见图1)充分展示了“节点文献”的引文网络(左虚线框)和相关文献(右虚线框),并没置时间轴展示每一年度的引文文献数.

博硕士学位论文、会议论文等CNKI系列数据库,也都配备了形式相同的“知网节”,而且各种文献的“知网节”都打破了源数据库的限制,构成了,跨库“知网节”.而且,CNKI系列数据库的“知网节”还与国家科技图书馆的所有英文文献进行引文链接,并可跨平台检索,提供远程原文传送怎么写作.此外,CMKI已实现了与国外一些重要数据库(如Springer,Highwire等)的跨平台链接和检索也在迅速推进之中.CNKI引文链接准确率达98%,从而为引文检索和评价分析提供了保障.

通过深度引文分析链接关联起来的“知网节”,人们可以追溯课题的发展历史和研究背景,把握目前的研究进展与研究现状,并探索未来的发展趋向及研究空间.同时,“知网节”又是一个强大的检索平台,通过它所提供的个性化知识怎么写作(推怎么写作),有助于激发、引导、类比、联想等各种创新思维,促进科学发现和技术创新.

CNKI的引文链接功能,除了可以构建相关的知识网络外,还可用于个人、机构、论文、期刊等方面的计量与评价,预测学科分布、学术趋势,评价期刊质量和机构、作者的学术水平等.

4 微观知识组织

4.1 基于知识单元的知识元链接组织

知识组织颗粒度一旦实现从文献单元深入到文献中的知识元,大量文献中所包含的知识元及相关信息之间的关联将产生极大的知识增值.因此,我们说知识元是知识组织的核心和基元.

知识元是构成知识结构的最小独立单元,用来表示一个个针对特定问题的解决方案,可以是概念、方法、规则、公理等数据或事实以及实例化的知识.由于知识元的内容比较单一、独立,比较容易选择与之相适应的最佳存储和查询,便于知识库的构建与检索,便于用户直接查询、组合知识元.必须指出的是,知识元检索足建立在对文献内容细粒度标引基础上的.就知识组分的层次而言,知识元链接属于知识单元组织的范畴.

基于知识元的知识组织,首先要实现对文献知识元的提取和标引,在此基础上在知识元间建立链接,进而形成知识网络.基于知识元的知识网络对知识发现、知识创新和知识集成怎么写作的实现提供最大可能.

在引文链接的基础上,CNKI深入到文献中的微观层面,提炼出知识元,通过知识之间在微观水平上的联系把知识直接关联起来,从而真正形成“知识网络”,支持知识搜索.

CNKI知识元数据库是由独立的知识元素构成的数据库.通过对《中国知识资源总库》资源的加工,提取出具有独立性和完整性的知识单元,然后以知识网络为基础,为“知识单元”设置链接,构建成知识元数据库.具体地,CNKI的知识元数据库分为三类:

理论与方法型知识元:包括思想方法、公理、原理、定律及正在探索中的观念,观点,方法与技巧.

事实型知识元:包括自然,社会存在和演变的事实信息.

数值型知识元:包括各种数据类知识和科学数据,具有数值分析和知识推理功能.

CNKI知识元数据库还包括从其他文献中挖掘出来的最新知识元,该知识元库是不断动态变化的.基于上述知识元库,CNKI以知识网络中心为基础,对作者、机构、刊名、关 键 词以及相关作者、相关机构、相关关 键 词等“知识单元”设置链接,通过这些链接可以检索知识网络中心配制的数据库的相应字段,获取检索结果.

CAJViewer7.0及7.02的“知识元链接及释义”功能,在线链接了许多来自各种百科全书、辞典、字典、图谱、年鉴等工具书的概念、术语、定理、公理、定律、人物、事件以及数字、图片、表格等各种知识元和从其他文献中挖掘出来的最新知识元所形成知识元库,对每篇文章的专业术语与词汇都做出标示,并给出这些专业术语与词汇在各种专业工具书中的权威释义.

目前,在基于知识单元的知识元链接组织层面上,CNKI提供的知识搜索包括对文献、数值、学术图形、历史事件、学术定义、学术趋势、新概念、表格等的搜索以及翻译助手、学术统计分析、热点趋势分析等,在常规检索中可以实现相关词和相似词的扩展推荐.

4.2 概念关系词典技术

概念关系的揭示与组织是实现语义挖掘和关联的基础.概念关系包含同义、近义、等级、相关关系及其他隐含语义关系.检索系统中内嵌概念关系词典,主要用于检索控制,人们称之为后控制.从后控制的角度来分析,在执行检索的过程中,系统通过基于内置的概念关系词典的相似性或相关性运算,可以实现后控制检索,如可以帮助用户修正查询式,实现查询扩展,从而提高检全率和检准率.概念关系词典还可以辅助实现自动分类与聚类,概念关系词典的构造技术及完备性直接决定了检索系统的智能处理水平.

CNKI的KNS平台内嵌概念关系词典,用来支撑语义知识资源挖掘.CNKI概念关系词典是一个以揭示各学科专业词汇(关 键 词、术语、主题词)所代表的概念之间的关系为基本内容的专业知识库系统,词与词之间包含同义、缩略语、译名、上下位等各种关系.CNKI概念关系词典中词之间的概念关系主要来自系统对CNKI系列数据库中大量文献内容的智能分析.基于该词典,检索系统设置了检索词智能扩展功能(包括概念扩展和词形扩展)和概念导航功能,其中:

检索词智能扩展基于概念关系词典相关语义场运算技术,实现了不同字段间的智能扩展,有助于提高了检全率和检准率,便于发现新知识,实现知识漫游怎么写作,如图2所示:

概念导航基于概念关系词典相近语义场运算技术,以文本形式表现概念之间的相近关系,实现概念导航,有助于提高查全率,便于发现新知识,如图3所示:

5 结语

CNKI数字图书馆知识网络平台的成功运行依托于对信息资源和信息系统从宏观到微观层面的信息有序组织和知识揭示组织技术.通过剖析,笔者认为CNKI为人们提供了一个相对较为完善和深入的数字图书馆信息组织方法体系,可以作为我国数字图书馆信息组织的典范.

当然,笔者也期待CNKI在下一步发展的过程中,汲取权威数据库检索平台(如IsIWebofKnowledge)的某些信息和知识组织理念和方法,在来源刊物的优选控制机制、引文的完整性和引文深度、概念关系词典和相关算法方面作进一步的优化与完善.