数字文化资源的元数据格式

点赞:30388 浏览:142109 近期更新时间:2024-04-22 作者:网友分享原创网站原创

〔摘 要〕元数据可以实现对庞大数字文化资源的描述、管理和有效检索.本文首先介绍了数字文化资源的特点和应用中对元数据的实际需求,并重点分析了数字文化资源的元数据格式.之后,通过对目前国内外已有元数据格式的分析和归纳,本文提出了以VRACore(VisualResourcesAssociation)作为核心格式,CDWA(TheCategorieorDescriptionofWorksofArt)部分元素作为扩展元素的数字文化资源的元数据格式.最后通过实例来分析所提出元数据格式在数字文化资源应用中的可行性.

〔关 键 词〕数字文化资源;元数据;VARCore;CDWA

〔中图分类号〕TP311.13〔文献标识码〕A〔文章编号〕1008-0821(2013)08-0061-04

文化资源是人类在社会发展过程中创造并借以进一步从事文化生产和文化活动的物质成果和精神成果的总和.广义的文化资源难以给出具体的界定,只要能体现人类追求和满足人类精神需求的产品或活动,都应属于文化资源的范畴.我国历史悠久,民族风俗各异,民俗风情资源相当丰富,同时目前各文化领域也不断涌现出各种各样的文化资源,为了保护与保存、传承、传播、交流共享这些文化资源,我们需要对文化资源进行数字化处理.

文化资源种类繁多、数据庞大,而且增长速度也非常快,为了方便确认、检索、管理这些文化资源,人们提出了数字文化资源的元数据概念.所谓元数据,是描述数据的数据或信息的信息.元数据的使用领域非常广泛,不同领域(甚至同一领域)往往存在着多个不同的元数据格式.在数字文化资源领域中,元数据格式的选择不仅要根据其数据特点和应用需要,同时还需要尽量考虑元数据格式的兼容性以及后续的可扩展性.首先本文将介绍一些相关概念,并总结归纳几种经典的元数据格式,其次分析合适数字文化资源的元数据格式并以一实例分析其可行性,最后对本文进行总结和展望.

1元数据与数字文化资源

1.1元数据简介

元数据是“用来描述数字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系”[1].在不同的领域元数据的具体定义不尽相同.在图书馆与信息界,元数据被定义为“提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述”[2].但它的本质则是描述数据的数据(dataaboutdata),它是信息共享和交换的基础和前提.元数据的使用目的在于:(1)识别资源;(2)评价资源;(3)跟踪资源;(4)实现信息资源的保存与保护、发现、查找以及对信息资源的有效管理等.

元数据格式涉及的内容有元数据内容格式、元数据应用规范和元数据格式语言[3].其中元数据内容格式一般由标题、创作者、主题、日期等元素或其子元素组成.而应用规范是应用系统在使用元数据格式进行实际描述数据时的具体规范,涉及元素选择方式,元素内容详细界定,内容描述方式等内容.所谓元数据格式语言,是指定义、标记、封装、交换传递元数据时所用到的语言.目前在不同领域和不同应用项目中已存在多种不同的元数据格式.

元数据的应用范围非常广,SusanneBoll等专家认为元数据可应用于图像、声频和视频的检索和导航,结构化的文献管理,地理和环境信息系统,数字图书馆,混合多媒体等[4].随着数字化信息的发展,元数据也正在被用于数字图书馆、医学信息资源等更多的领域中.

1.2数字文化资源简介

数字文化资源是文化资源数字化后的产物.文化资源的数字化是利用数字技术对文化资源进行加工处理.数字文化资源的时效性强,并且不受时间、地域的限制.文化资源种类众多,分类方式也很多.一般意义上的数字文化资源非常广泛,目前国际上还未形成可用数字文化资源描述的统一元数据格式.针对不同种类的数字文化资源形成适合该种类的数字文化资源的元数据格式更具现实意义.

数字文化资源的元数据格式是根据其数据特点和应用需求而确定的.在数字文化资源领域,元数据主要用于对数字文化资源的管理、保护与长期保存、描述、确认和检索、知识产权的辨认、跟踪和管理等.因此数字文化资源的元数据除了具有其他一般元数据的元素外(比如主题、创作者、来源等),还应元数据内容上体现技术、材料、位置、风格/时期等元素.此外,在功能上一定要满足著录描述、确认和检索、保护与保存、管理.

2元数据格式分析

随着元数据重要性日益突出,许多国家、国际学术团体和公司都在研究制定与其密切相关的元数据格式.下面将介绍几种目前国内外比较经典的元数据格式.

2.1国外常用的几种元数据格式

2.1.1DC

都柏林核心元数据(DublinCore,DC)[5]是由计算机专家、网络专家和图书馆专家等人员所组成的一个非正式小组于1995年在美国俄亥俄州都柏林开发的元数据元素集.DC由15个基本元素组成,包括标题、创作者、主题、摘 要等.DC简单易用,并主要用于网络资源的著录和发现.随着DC的发展,DC与其它多种元数据格式建立了映射关系,通常还被作为各种元数据格式转换的媒介.DC元数据应用于各学科各领域,如澳大利亚政府怎么写作,丹麦国家图书馆等.


2.2.2中国科学院科学数据库核心元数据格式

中国科学院科学数据库核心元数据格式是由中国科学院计算机网络信息中心主持,联合中科院各单位共同研究制定,主要用于科学数据库资源的建设、管理、共享和怎么写作等[7].其元数据由数据集元数据、怎么写作元数据两部分组成.该元数据格式是开放式的,用户可基于该方案开发满足特定需求的元数据.

数字文化资源的元数据格式参考属性评定
有关论文范文主题研究: 关于图书馆的论文范文文献 大学生适用: 学校学生论文、学年论文
相关参考文献下载数量: 16 写作解决问题: 写作参考
毕业论文开题报告: 标准论文格式、论文总结 职称论文适用: 职称评定、职称评初级
所属大学生专业类别: 写作参考 论文题目推荐度: 最新题目

3元数据与数字文化资源

4结论

我国的文化资源非常丰富且增长迅速,对文化资源的数字化处理可以在很大程度上解决资源保护、传承、交流共享等问题.本文首先分析了数字文化资源的特点和应用需求,并对目前国内外已有的元数据格式进行分析和归纳,提出了一种以VRACore作为核心格式,CDWA中部分元素作为扩展元素的元数据格式,并以一个雕像作品为例,多个不同元素从不同角度对雕塑内容、知识产权、文化特点等方面进行详细介绍.我们可以根据这些元素来描述、确定和检索、保护与长期保存和管理数字文化资源.

本文目前只是考虑数字文化资源的应用特点,及数字文化资源元数据定义与目前已有元数据格式的兼容性,但随着应用的展开,部分格式还需要进一步完善,如核心元素是否需要扩展,核心子元素的确定等.在后续工作中,我们要对所提格式进行完善修改,同时还应考虑元数据格式的兼容性及后续的扩展性等问题.