近十年我国数字档案馆的统计与可视化

点赞:14069 浏览:59029 近期更新时间:2024-03-12 作者:网友分享原创网站原创

摘 要:为客观反映近十年我国数字档案馆研究的相关情况,运用文献计量和可视化分析方法,对CNKI收录的2003年~2012年间研究数字档案馆的期刊论文、学位论文和会议论文从作者、机构和主题角度,结合知识图谱进行统计及可视化分析.结果表明,档案类期刊特别是核心期刊是载文主体,高发文作者数量不多,作者及机构合著较少,高等学校是研究主力,研究热点紧跟信息技术发展.

关 键 词:数字档案馆;2003年~2012年;文献计量;统计分析;可视化分析;知识图谱

1引言

数字档案馆是近十几年我国档案领域研究重点和热点之一.随着时代及技术发展,数字档案馆出现多种叫法.罗沛霖早在1991年就提及“电子档案馆”,[1]1997年刘建平文中出现“数字化档案馆”、“虚拟型档案馆”,[2]1998年冯惠玲认为数字档案馆亦可称为“电子档案馆”、“虚拟档案馆”或“无墙档案馆”.[3]


李继红1997年在《档案学通讯》上撰文,论述了电子档案馆的8个特点,[4]开始了比较系统的数字档案馆研究.此后,国内许多专家、学者和档案工作者积极投身数字档案馆的研究与实践,取得了大量的研究成果,国内也不断建成各种类型的数字档案馆.

为客观准确地反映我国近十年数字档案馆研究的有关情况,作者收集了中国知网收录的有关文献,并对整理后的文献进行统计分析和可视化分析.

2文献来源及数据整理

为使检索结果尽量全面,以表达式“KY等于(‘数字档案馆’+‘电子档案馆’+‘虚拟档案馆’+‘无墙档案馆’+‘数字化档案馆’+‘虚拟型档案馆’+‘虚拟化档案馆’+‘数字型档案馆’+‘电子化档案馆’+‘电子型档案馆’)”对中国知网的期刊、特色期刊、博士、硕士、国内会议、国际会议、学术辑刊7个数据库进行专业检索,时间范围为2003年~2012年,检索结果2758篇.

为确保各项统计数据的准确,作者对检索到的全文逐一进行了核对,剔除了重复文献和“消息”、“动态”、“讲话”、“书评”、“目录”等不宜用作统计分析的文献,以及有中国知网机标关 键 词但相关性不强或仅1页的文献,保留了检索词在关 键 词中无但标题中有的文献.经整理后,用于统计分析的各类文献共计661篇(其中机标关 键 词文献115篇),仅占检索结果总数的24%,可见,文献分析不能简单地以检索结果作为研究对象.统计文献的年度及类型分布如图1.

图1统计分析文献年度及类型分布(单位:篇)

经统计,以上文献来源于178种期刊、20家研究生培养机构和13次学术会议,其中期刊占比超过九成.载文前10位的期刊是《兰台世界》(81篇)、《档案学通讯》(43)、《档案学研究》(36)、《档案》(34)、《浙江档案》(27)、《北京档案》(18)、《档案与建设》(15)、《档案管理》(14)、《科技情报开发与经济》(14)、《云南档案》(13).此外,《山西档案》、《四川档案》、《湖北档案》、《城建档案》的发文量均为11篇,档案类期刊特别是核心期刊发文比重大,发文超过5篇的主要档案类刊物的发文量达357篇,占期刊论文的59.3%.

为便于统计和确保统计数据的准确,对统计文献的作者单位(机构)名称、关 键 词进行了统一和规范,如将机构“南京政治学院上海分院”、“解放军南京政治学院上海分院”、“中国人民解放军南京政治学院上海校区”等统一为“解放军南京政治学院上海分院”,将各级政府的“档案馆”、“档案局”统一为“档案局”,同属两个机构的只统计第一个机构;将关 键 词“档案工作人员”、“档案工作者”、“档案馆员”、“档案人员”等统一为“档案馆员”,“大学”、“高校”、“高等学校”、“高等院校”统一为“高等学校”.

近十年我国数字档案馆的统计与可视化参考属性评定
有关论文范文主题研究: 关于档案馆的论文范文素材 大学生适用: 学校学生论文、自考论文
相关参考文献下载数量: 97 写作解决问题: 写作资料
毕业论文开题报告: 论文模板、论文目录 职称论文适用: 技师论文、职称评副高
所属大学生专业类别: 写作资料 论文题目推荐度: 免费选题

3文献统计与分析

对文献信息进行相关的统计与分析,可以从中发现知识发展脉络、热点前沿等,[5]本文以时间为主线,利用自编软件对作者、机构、关 键 词等进行规范处理,统计分析了近十年我国数字档案馆研究的作者及机构发文与合作、主题变化,并利用社会网络分析可视化软件,绘制数字档案馆研究的“高发文作者-年度共现”图谱、“作者合著网络”图谱、“高发文机构-年度共现”图谱、“热点主题-年度共现”图谱.

3.1作者统计与分析.(1)作者发文数量.统计文献涉及作者702人,篇均作者1.37人,其中第一作者发文525人,人均发文不足1.26篇;独著476篇,占72.01%;两人合著文章142篇,占21.48%;三人合著31篇,占4.69%;三人以上合著12篇,占1.82%.

将发文数不少于3篇的作者和发文年度信息导入NetDraw软件,得到以第一作者身份发文的作者-年度共现图谱(图2).图中方形节点表示发文年度,圆形节点表示作者,连线表示作者在该年度发表了论文,连线上的数字表示发文篇数.发文最多的作者潘连根在2004年~2007年共发表论文17篇,袁红军、金更达、薛四新、唐艳芳在四个年度内均发表了论文,其他作者则在1年~3年间发表了不少于3篇论文.

图2高发文作者-年度共现图谱

(2)发文第一作者地域分布.统计文献中以第一作者发文最多的为河南省作者,其次是江苏、浙江、上海和北京,以上省市第一作者发文接近统计文献的一半,另外,湖北、广东、山东和黑龙江第一作者发文数也都在30篇以上,作者涵盖了28个省(自治区、直辖市).

表1统计论文发文第一作者地域分布(单位:篇)

(3)作者合著网络.合著网络是因学者合著论文而形成的社会网络,[6]以图谱形式来呈现清晰而直观.图3是合作发文2篇以上的作者合著网络图谱,图中方形节点表示发文作者(附机构以区分同名作者),合著关系通过连线体现,连线上的数字为合作发文篇数.统计文献独著占比超过七成,合著网络比较零散.

图3作者合著网络图谱3.2机构统计与分析.(1)第一作者机构发文数量.统计文献中,第一作者发文机构多达355家,其中224家仅发文1篇.最多的是解放军南京政治学院上海分院(27篇),其次是浙江大学(22)、绍兴文理学院(18)、武汉大学(17)、南京大学(16)、湘潭大学(15).经统计,第一作者发文数量前20个机构的发文总数为246篇,占统计文献的近四成.

利用NetDraw软件绘出第一作者发文机构-年度共现图谱(图4,发文大于等于5),图中方形节点表示发文年度,圆形节点表示第一作者发文机构,连线表示某机构在某年有第一作者发表了论文,连线上的数字表示发文篇数.解放军南京政治学院上海分院、浙江大学、苏州大学、中国人民大学、武汉大学、吉林大学连线校多,表明多数年份发表了论文.图中可看出,高发文机构仅一家基层档案机构.

图4高发文机构-年度共现图谱

(2)机构类型发文分布.由于部分统计文献作者机构信息不完整,影响统计结果的准确性.统计文献中,高校及其档案馆、图书馆发文量最大,占比达71.7%.

表2第一作者机构类型及发文数(单位:篇)

(3)机构合著网络.同作者合著网络一样,机构合著网络是因机构合著论文而形成的社会网络.利用NetDraw软件可绘制机构合著网络图谱(限篇幅,图略),与图2相似,机构合著网络也比较零散,没有一家机构与三家以上的机构合作发文超过2篇.

3.3主题分布与热点分析.关 键 词是从文献的标题和正文中抽取的最能够反映文献内容的词,通过分析其变化能把握学科发展的过程与规律,反映研究的热点和发展动向.本文选用关 键 词进行主题分析,并结合年度进行热点分析.

统计文献经规范处理后,共有关 键 词3050个,篇均4.61个(部分文献有机标关 键 词,实际篇均数更少).统计文献涉及关 键 词1139个,除“数字档案馆”外,前20位的其他关 键 词出现的频次在16~53之间,出现仅一次的关 键 词达800个,可见研究的分散度较大.表3是频次前20位的关 键 词及出现频次.

表3频次前20位的关 键 词

表3体现了十年间数字档案馆研究的主要主题、研究热点,但并不能很好地体现研究主题的演化和近期的热点或趋势.而利用NetDraw软件绘出关 键 词-年度共现图谱(图5,词频大于等于4),则能较好地得以体现(为使图谱更清晰,隐藏了关 键 词“数字档案馆”).图中方形节点表示年度,圆形节点表示关 键 词,连线表示关 键 词出现在该年度的论文中,连线上的数字表示关 键 词各年出现的频次.关 键 词与年度的连线越多,表明该主题研究持续的时间越长,连线上的数字越大,则表明该年度该主题的研究越热.

图5热点主题-年度共现图谱

从图中可以看出,数字化、建设、档案信息资源、电子文件等关 键 词与年度连线较多,表明围绕数字档案馆的这些研究持续时间较长,而云计算、信息技术、信息化、信息怎么写作、知识管理等主要出现在近几年,表明这些是数字档案馆研究的新热点,体现出数字档案馆研究紧跟新技术、新研究的发展.

4结论

通过以上统计和分析,可以得出以下基本结论.

4.1档案类期刊特别是核心期刊是数字档案馆研究的发文主体,是研究数字档案馆应关注的重点文献,当然,学位论文也值得关注.

4.2数字档案馆研究虽有一定数量的高发文作者,但高产作者占比偏低,同时鲜有发文较均匀出现在十年间或近几年的核心作者,表明有关学者对数字档案馆研究的持续性和稳定性不够强.

4.3作者独立发文较多,合著较少,且合著作者多为同一单位,跨地域、跨机构合作的情况较少,机构合著情况亦如此,表明针对数字档案馆研究多为个人自由研究,缺乏较广泛的合作.

4.4高等学校及其档案馆、图书馆是发文主体,表明高校在数字档案馆研究方面的科研能力较强,同时有几家高等学校十年间绝大多数年份有论文发表,表明部分高校该领域的研究有较强的持续性和稳定性.

4.5针对数字档案馆相关的数字化、建设、档案信息资源等主题的研究持续时间长,且热度不减,表明这些研究尚有待深入或完善;而近几年针对数字档案馆的云计算、信息技术、信息化等研究,则表明数字档案馆的研究跟上了技术潮流,同时吸纳和借鉴了其他领域的最新研究成果.

*本文系高校基本科研业务费资助项目“档案数字化的管理与应用研究”(BESTI-JBKY-201104)成果之一.