《中国档案机读目录格式》的结构与功能

点赞:16632 浏览:71114 近期更新时间:2024-02-18 作者:网友分享原创网站原创

随着我国国家信息化的发展,我国档案信息化也呈现迅猛的发展势头,而2006年3月我国颁布的国家标准《GB/T20163-2006中国档案机读目录格式》就是支持档案信息化,实现档案目录信息交换与共享的基础性标准.

在《GB/T20163-2006中国档案机读目录格式》正式颁布之前,我国档案界还没有在国家层面上制定出适合档案机读目录的标准格式.但档案信息化的发展又急需档案机读目录格式的标准,在这种情况下,各地和各行业的档案部门就制定了许多档案机读目录格式的地方和行业标准.这些档案机读目录的地方标准和行业标准的制定,在本地区和本行业对档案目录信息的交换与共享,起到了积极的推动作用,但是从国家层面来说,没有一个标准的机读目录格式,这又制约了整个国家范围内的档案目录信息的交换与共享,因为机读目录格式的地方标准和行业标准,在相互之间的兼容上,在所采用设计技术上,都还难以成为真正意义上的标准的档案机读目录格式.由于这类档案机读目录格式没有遵循国际标准和国家标准的交换格式,而仅仅是各种简单的、专门的固定结构格式在生成档案目录记录,于是就形成了我国档案机读目录格式上“自由放任”的无序局面,从而对我国档案目录信息的规模化、网络化利用及其档案利用的现代化造成了如下的严重问题:

(1)各地区、各部门都按自己的固定格式的来生成档案机读目录数据,造成原本应该统一的档案目录数据出现了“数据割据”的信息孤岛的局面,从而难以进行跨地区、跨部门的数据交流,更严重的是无法实现档案目录数据的在一国范围内的数据资源共享;

(2)各地区、各部门生成的档案机读目录,由于没有头标区,机读目录数据普遍没有自我说明能力,造成数据质量低下;

(3)各地区、各部门生成的档案机读目录,由于都是采用机读目录的固定格式,因此,不能反映档案目录数据各种变化和类型多样的特点;

(4)各地区、各部门生成的档案机读目录,由于没有采用标准的格式,因此,数据格式的生成依赖于计算机某一应用软件,数据的保存也依赖于计算机某一应用软件,造成档案目录数据永久性保存的难度大为增加,或为了达到档案目录数据的永久性保存,不得不跟踪所依赖的软件,不断地进行数据转换,造成数据保存的费用大为增加,而且导致数据丢失的不安全性也大大增加.

国家标准《GB/T20163-2006中国档案机读目录格式》的制定,其目的就是力图在我国的国家层次上,解决目前我国档案在计算机机读目录格式上无序的局面及其生成的记录数据质量不高的现状,并从机读目录方面为我国档案信息化建设提供一个可靠的与国际标准与国家标准相适应的标准化基础.

中国档案机读目录格式的总体架构

中国档案机读目录格式在总体架构上有框架格式和执行格式之分,框架格式就是机读目录在组织结构上的总体的划分.国家标准《GB/T20163-2006中国档案机读目录格式》的制定,在框架格式上采用的是国际标准《ISO2709信息与文献信息交换格式》.按照这一标准,中国档案机读目录的框架格式就是把一条记录划分为四个区,即:


相对应于这四个区,一条机读目录记录也就相应地划分为四个部分,即:

遵循这个标准的框架格式,其关键就是,能使各计算机系统所生成的机读目录数据记录在进行数据交换时都有了一个标准格式,从而扫除数据交换与共享中的障碍.

执行格式就是机读目录在数据区上的组织结构.国家标准《GB/T20163-2006中国档案机读目录格式》在执行格式上,采用的是《国际通用机读目录格式》(UNIMARC),因此,其执行格式则主要是由十个功能块构成,以分别针对机读目录所著录的不同的档案特征信息完成不同的著录功能.这十个功能块是:

档案数据库采用档案机读目录的执行格式,是提高档案计算机系统检索效率的必要条件,因此,在档案数据库著录中采用国家标准《GB/T20163-2006中国档案机读目录格式》是当前我国档案数据库建设中的一项迫切任务.

中国档案机

读目录格式的字段结构

国家标准《GB/T20163-2006中国档案机读目录格式》在数据字段的设置上,是根据我国国家行业标准《DA/T18-1999档案著录规则》以及国际档案理事会的《国际标准――档案著录规则(总则)》(2000年第二版)来设置的.其字段的结构特点是:

1.每一个字段根据国际与国家标准赋予一个三位数字构成的标识符.如档号字段赋予“001”这样由三位数字组成的字段标识符,题名字段赋予“200”这样由三位数字组成的字段标识符,时间字段赋予“210”字段标识符,等等.如下所示:

2.每一个字段根据国际与国家标准建立一个目次项.每个字段的目次项由12位数字构成,左三位表示字段标识符,中四位表示该字节的长度,右五位表示该字节的起始位置.如下所示:

3.各个字段的目次项所构成的目次,加上字段在一起,就形成了目次加字段的交换格式,计算机读取字段时,先读目次项,如要读取档号字段,计算机就先读“001”,然后读“0008”个字节,从起始地址“00000”开始读,就可以读取档号;如要读取题名字段,计算机就先读“200”,然后读“0025”个字节,从起始地址“00008”开始读,就可以读取题名,等等,如下所示:

采用这样的结构,就可以使计算机变得很灵活,即:

(1)变固定的字段长度为变长,因为,不管字段长度为多少,计算机一读取目次项就知道,因此也就不需要规定字段长度,这样,在实际著录中,如档号是多长字节,就给予多长字节,从而使机读目录数据能够反映档案文件的实际情况.

(2)变固定的字段数量为可变的数量,由于机读目录格式,用三位数字来标识字段,因此,其最多可以有999个字段,所以,要增加一个或多个著录字段很容易,只要在目次中加上这个字段的目次项,计算机就可以读取,反之,那些著录字段在实际著录中不需要的,那么在目次中就无该著录字段的目次项,这样一条记录的著录字段就可根据文件的实际情况而变化,计算机就很灵活了,可以很好地反映档案著录的实际.

(3)变固定的记录长度为不定长的记录长度,也就是说,采用机读目录格式,可以使计算机著录所形成的记录是变长的,实际著录是多长字节就是多长字节,而不会造成存贮空间的浪费.

(4)同时,采用这种标准的机读目录格式,还可对档案进行多级著录,使形成的档案记录能够完整地反映档案全宗的整体,反映档案来源原则和全宗不可分散性原则等,从而使计算机所形成的档案记录具有很高的质量.

当然,采用这种机读目录格式的字段结构更有利于档案目录信息的交换,因为,这种字段结构本身就是为交换而设计.

《中国档案机读目录格式》的结构与功能参考属性评定
有关论文范文主题研究: 关于计算机的文章 大学生适用: 专升本毕业论文、学校学生论文
相关参考文献下载数量: 52 写作解决问题: 学术论文怎么写
毕业论文开题报告: 论文提纲、论文小结 职称论文适用: 核心期刊、职称评中级
所属大学生专业类别: 学术论文怎么写 论文题目推荐度: 优秀选题

中国档案机读目录格式的功能

根据国家标准《GB/T20163-2006中国档案机读目录格式》规定,档案机读目录头标区作为框架格式的第一部分,是位于各条记录之首,头标区是对一条记录的总体说明,它主要说明了如下两个方面:

(1)给出了一系列指令性数据:如记录长度、数据基地址、目次说明等,供计算机识别与处理记录时使用.(2)给出了一系列说明性数据:如记录状态、记录类型、著录级别、著录等级、著录格式、档案著录控制等,对记录本身起自我说明作用,同时也供计算机识别与处理用.

由此我们可以知道,记录头标区的功能在机读目录中起着识别、说明一条记录的作用,一条记录有了标准化的头标区,那么这条记录在任何计算机系统中都可以被识别、被处理.同时在时间上经过几十年、几百年,这条记录自身的总体情况依然是清晰的,可确认的.

根据国家标准《GB/T20163-2006中国档案机读目录格式》规定,档案机读目录目次区作为框架格式的第二部分,是紧跟在头标区之后,其由若干目次项和置于目次区末的字段分隔符组成.目次区之所以这样称谓,是因为它的设计方法如同一本书的目录.通常,书前的目录表示该书各个章节及起始页数,可以使读者较快地找到所需章节的位置,而在机读目录的目次区中,其所指示的一条记录的各个数据字段的标识符(如001,100等等)就相当于书的各章节名,其所指示的数据字段的长度就相当于各章节所占有的总的页数,而其所指示的数据字段的起始位置则相当于各章节的起始页码.可见,目次区的功能是:

(1)进一步向计算机指示目录数据的描述信息;(2)便于计算机更便捷地对目录数据进行查找和处理.

根据国家标准《GB/T20163-2006中国档案机读目录格式》规定,档案机读目录框架格式的第三部分是数据区,其紧跟在目次区之后.所谓的数据区就是著录目录数据的区域,如著录档号、题名、责任者等一项项档案目录数据的区域.一条记录的档案目录数据,如一个档号、一个题名及一个责任者等,这些相当于手工著录的一个个著录项,这些数据项在数据区各占据一个数据字段,由此就构成了数据区的字段,所以,数据区就是由若干个数据字段构成的.这样数据区就能充分反映与揭示档案目录信息的特点.由此,我们可以知道,数据区的功能是:

(1)完整、准确、规范地反映档案的特征;(2)为确认与检索档案提供有效的、规范的、全面的数据控制.

根据国家标准《GB/T20163-2006中国档案机读目录格式》规定,档案机读目录框架格式的第四部分是记录分隔符,记录分隔符的功能,就是标识一条记录的结构,从而有助于确认一条实际的机读目录的记录.

国家标准《GB/T20163-2006中国档案机读目录格式》,其数据字段设置也非常齐全,从理论上讲,其可以设置多达999个字段,因此,遵循国家标准《GB/T20163-2006中国档案机读目录格式》,按这一标准格式组织机读目录,其具有如下意义:

(1)可以确保各档案部门生成结构一致、准确及具有自我说明能力的档案目录信息记录;(2)可以使各档案部门所生成的机读记录的档案信息得到方便的检索与交换;(3)可以使各档案部门所生成的机读记录集成于一个统一的信息系统;(4)可以使机读记录的数据结构不依赖于计算机的硬件与软件.

由于标准的机读目录格式具有如上的意义,所以,按这一格式建立档案目录数据库就能:

(1)建立全国的档案机读目录中心或全国的档案机读目录联合数据库,从而有利于馆际间的数据交流,可以实现档案数据在一国乃至在国际范围内的数据共享.

(2)由于按照这一标准格式组织数据又是独立于计算机软件和硬件的,因此能以标准格式的“不变”应计算机软硬件的“万变”,而这一点对档案数据来说极为重要,因为档案目录数据中的一部分要作为永久保存的数据,所以这些数据的生成和利用不能依赖于计算机的某一软件与硬件,这样才能保证这些数据在计算机发展的长久的时间内依然能够得到有效的利用,而不至于维系于某一软硬件而使利用受阻.笮

(作者单位:南京政治学院上海分院信息管理系200433)