网络信息资源的组织方法和方式

点赞:18570 浏览:82770 近期更新时间:2024-01-22 作者:网友分享原创网站原创

摘 要:探讨几种不同网络信息资源的组织方法和方式,并对网络信息资源组织的发展趋势提出一些看法.

关 键 词 :网络信息资源;组织方法;方式

中图分类号:G20 文献标志码:A 文章编号:1673-291X(2013)30-0280-03

网络信息资源就是依据互联网传播,它是由信息存储技术、数据库技术、网络通信技术与超文本、超媒体技术所支撑的信息资源.网络信息资源组织就是通过一定的技术和手段,对网络上产生和传播的信息资源进行搜集、整理,使之从无序到有序,便于用户访问和使用的过程.随着计算机技术的发展与完善,网络上的信息量成几何倍数在增加.我们知道网络上信息传播的速度和产生的速度已经达到令人惊诧的地步,知道互联网和正在利用互联网的人都在成倍数地增加,但是随之而来的不足和缺点也越来越突出,就是由于局部的有序性和整体的无序性、缺乏统一的标准和版权等问题,许多信息用户需要信息,但是他们却不知道怎么在网络上准确地查找到自己所需要的信息,或者不能够找全自己所需要的全部信息.因此对网络信息资源的组织也越来越重要,如何改进网络信息资源的组织方式,提高信息的可利用率已经迫在眉睫了.

一、网络信息资源的组织方法

(一)分类组织法

分类组织法主要是从宏观的角度上揭示信息的内涵,方便用户的查询和使用,其优势是首先可以限定检索范围,提高检准率.其次其等级结构可以提供检索词的上下文,可以方便分类浏览.另外多媒体信息在网络信息资源中的比例越来越大,其内容特征难以用文字表达,分类组织法的聚类功能及标识为之提供了一条解决途径.但是由于网络信息资源的新特点,分类法也在进一步的调整,增加新的类目,修订类名,增加新的术语作为索引词,控制类目的深度等.传统文献分类法如DDC、LCC、UDC,在网络信息资源组织中被直接采用.自编分类系统也相继出现,其类型主要有以下三种:一是等级式主题分类系统,如雅虎中国就是采用该方法建立其检索系统;二是分面组配分类系统,如中文搜索引擎“中华网目”;三是学科分类系统,如“网络指南针”等.

(二)主题分类法

主题标引是网络信息资源组织的另一种主要模式.它是一种利用自然语言或规范语言对信息内容进行标引的方法.主题法组织网络信息资源一般分为以下几种类型[1]:(1)使用关 键 词 法组织网络信息,关 键 词 法就是将信息原来所用的、能描述其主题概念的那些具有关键性的词抽出来,不加规范或只作极少的规范化处理,按字顺排列,以提供检索途径的方法.作为一种自然语言,关 键 词 能够直观揭示信息中所包含的知识,并且不必查表选词,不必依赖专业标引人员,因而在网络信息组织中得到了广泛的应用,各种搜索引擎和数据库大多采用了此种方法;(2)使用叙词法组织网络信息.其主要是采用受控语言作为标识,来表达信息所论及的事物的主题,并将全部标识按字顺排列,且都有完善的参照系统来显示主题概念间的关系.但是由于其需要专业的人员进行编排,往往有些滞后,成本也高;(3)使用关 键 词 法与叙词法相结合组织网络信息.这种方法可以综合利用两者的优点,准确地对信息资源进行描述和组织.

(三)元数据组织

元数据的一般定义是“关于数据的数据”(dataabout data).元数据包括著录项目和著录格式两个方面.网络信息资源的元数据著录项目已提出的有Dublin Core,VRA Core Categorieor Visual Resource,CDWA等.著录格式有HTML和XML两种[2].元数据可以描述信息资源的特征,进而对网络信息资源进行定位,有利于网络信息资源的获取.根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源.

(四)基于语义的网络信息组织

XML是由W3C于1998年2月发布的一种描述任意文本结构的标准.XML的目的是标示网络数据以供机器辨识跟处理,并且去除了多余的烦琐的代码. XML的新特点是将数据的内容与显示格式分开,程序的开发者可以根据自己的需要创建属于自己的标记,对信息进行确切描述,并使用文档类型定义(Document Type Definition,DTD)或XMLSchema来约束这些标签的结构.

其利用RDF实现信息之间的语义关联,RDF是一种描述和使用数据的方法,它提出了一个简单的数据模型,通过属性(Property)和值(Value)来描述资源以及资源与资源之间的关系.RDF的实质是一种二元表达关系,因为任何复杂的关系都可以转换成多个简单的二元关系来表示,所以RDF可以用简单的二元关系模型来表达复杂的关系模型.同时,RDF还提供了一种基于XML语法的RDF图[3].如某单位A是资源A的创建者,具体表示(见下图):

二、网络信息资源的组织方式

(一)文件方式

以文件方式组织网络信息资源简单方便,由于计算机所处理的最终结果都是以文件方式保留在磁盘里,所以它可以存储图形、图像、图表、音频、视频等非结构化信息,可以方便地利用文件系统来管理.技术简单,非常容易实现,但是由于网络的普及和信息量的增多,信息结构较为复杂,这种方式难以实现有效控制和管理.

(二)数据库方式

该方式指将所有获得的信息资源按照固定的记录格式存储,用户通过关键字查询,就可以找到所需信息线索,然后就可以链接相关的数据库,查获相关的信息资源.利用数据库技术对网络信息资源进行管理有很大的优势:首先,数据库技术利用严谨的数据模型对信息进行规范化处理,利用关系代数理论进行信息查询的优化,提高了效率.其次,数据的最小存取单位是字段,可根据用户需求灵活地改变查询结果集的大小,从而大大降低了网络数据传输的负载[4].数据库组织方法是目前网络信息资源组织的普遍使用方法,特别是在数据量比较大的时候. (三)搜索引擎方式

搜索引擎是一种以查询为目的的网络信息资源组织方式,它通过网络蜘蛛等爬行程序,将网络上的信息资源或者是与某一个课题相关的站点收录到自己的数据库中,抽取关 键 词 并进行索引,并提供检索入口,将用户输入的词语与数据库中的信息资源相匹配,按照相关性高低将检索结果输出,呈现给用户的一种程序.其特点是使用方便,操作简单,缺点是缺乏统一的规范,有时检索的结果不能满足用户的需求.

(四)主题指南方式

主题指南方式综合使用主题组织法与分类组织法,利用网络的超链接技术将众多的网络信息资源以节点为基本单位组成检索体系,其类目用主题词标识,Yahoo就是一种代表性的主题指南.用户检索时从较大的类目开始,通过超链的指引,逐层点击浏览,直到所需信息.该方式的优点是具有严密的系统性和良好的包容性和可扩充性,能较好地满足用户的族性检索要求,检准率高,特别适合建立专业性或专题性的网络信息体系[5].缺点是很难确定一个全面的范畴体系作基础,来涵盖所有的网络信息资源.另外用户为了快速地查到自己所需的信息,还需要对相应的体系结构有一定的了解.

(五)超媒体组织方式

它是指以超文本与多媒体技术相结合而组织利用网上信息资源的方式,它是将文字、表格、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,检索到所需要的信息[6].这种方式可组织各类媒体的信息,方便地描述和建立各媒体信息之间的语义联系,并且其节点中的内容可多可少,结构可以任意伸缩,具有良好的包容性和可扩充性.由于超媒体的诸多优点,使它成为了Inter上占主流地位的信息资源组织与检索的方式.

三、网络信息资源组织的发展趋势

(一)实现信息资源组织标准化和规范化

由于网络信息资源的多样性和存读的开放性,使得信息资源组织标准化和规范化有很大的难度.标准化主要包括编制和使用标准化的网络分类表,制定和执行标准化的标引规则,从而使不同的标引机构对网络信息的揭示和表达趋于一致[7].目前,国际和国内已先后颁布了多种相关标准,如《分类表编制指南:方法示例》(ISOlR919)、《多语种分类表的版面设计》(ISO/R.1149)、《文献工作—文献审读、主题分析与选定标引词的方法》(IS05693)等.

(二)探索发展新的技术

随着计算机技术的飞速发展,一些新的发明也给了网络信息资源组织以强有力的技术支持,但是都还不是很成熟,都需要进一步的开发和研究.(1)数据挖掘技术.它使用复杂的统计分析和模型技术从大量的数据或信息中抽取或识别出用户需要的深层次信息.它既能挖掘数据又可挖掘文本.(2)自动标引技术.随着信息时代的到来,网络信息资源急剧增加,利用人工对海量数据进行标引已经成为不可能,因此自动标引技术的实现尤为重要.计算机对网络信息资源进行自动标引时,或应用网络搜索软件如Web spider(蜘蛛)、crawler(爬虫)等来实现自动标引,或应用人机结合标引的方式进行标引.(3)信息推送技术.信息推送是网络公司通过一定的技术标准或协议,从网上的信息源或信息制作商获取信息,通过学习固定的频道向用户发送信息的新型的信息传播系统.它能深刻地改变互联网络的传播方式,并对信息采集、加工、利用和控制产生重大影响.(4)基于内容的多媒体检索技术.基于内容的多媒体检索技术是利用图像/视频内容的特征进行特征检索.除了根据内容的特征来进行特征检索的同时还提供了许多其他检索手段,如可通过提供样本图像进行相似性检索,通过人机交互进行浏览检索等,这种技术融合了图像理解技术,拓宽了检索的途径,具有一定的人工智能技术.


(三)分类、主题一体化

分类法的族性检索与主题法的特性检索都是在检索体系中所不可少的,它们各有自己的优点与不足.在网络信息资源的组织中应该将二者组织在一起使用,Yahoo等搜索引擎均较好地将分类与主题检索系统综合在一起.分类、主题一体化是对分类法和叙词表的术语、标识、参照、索引等实施统一的控制,使二者有机地融为一体.叙词表采用完整的参照系统、编制范畴表和词族表,两者有机地结合,可以相互补充.走分类主题一体化道路,克服分类检索语言单纯以学科聚类,主题语言单纯以事物聚类的局限性.如可以在搜索引擎输出关 键 词 检索结果的同时,列出相应的分类途径和相似上位类的站点或者资源,也可以选择在搜索结果中二次检索,这种方法既可以用关 键 词 进行检索,也保留了分类法的等级分类体系,较好地克服了了分类检索与主题检索各自的缺点.

(四)自然语言与人工语言结合

网络检索工具都采用自然语言标引和检索,这样的结果是词间的相互关系得不到揭示,同义词和近义词得不到控制,后控词表可以很好地解决这样的问题,它既有规范语言的特点,也十分地接近自然语言.网络信息的特点和网络用户的多样性,决定了自然语言更适合计算机网络检索.为此改进的措施是自然语言和受控制语言一体化.自然语言以其成本低、方便用户利用、处理时差短、检索效率高等优势已将成为检索的主流.然而人工语言的优点也是自然语言所无法比拟的,促进自然语言与人工语言互相取长补短、共同发展应成为检索语言的研究发展方向.

网络信息资源的组织方法和方式参考属性评定
有关论文范文主题研究: 关于网络信息的论文范文素材 大学生适用: 研究生论文、研究生毕业论文
相关参考文献下载数量: 24 写作解决问题: 如何怎么撰写
毕业论文开题报告: 论文任务书、论文题目 职称论文适用: 核心期刊、中级职称
所属大学生专业类别: 如何怎么撰写 论文题目推荐度: 经典题目