基于CSSCI的中国引文的可视化

点赞:3124 浏览:7598 近期更新时间:2024-03-19 作者:网友分享原创网站原创

[摘 要]以“引文分析”为检索词在CSSCI中检索到1998-2007年间527篇文献,3328条引文.对这些数据进行统计和引文分析,利用NETDRAW、C1TESPACE等可视化软件,绘制引文分析领域的重要作者和重要文献图,反映引文分析领域的重要人物和重要著作,展现引文分析领域的知识结构关系.

[关 键 词]CSSCI引文分析科学计量学可视化图谱

[分类号]G306

1.导言

 科学知识可视化图谱是在信息技术的推动下发展出来的一个新领域,当前已经成为科学计量学的一个新热点.陈悦和刘则渊认为科学知识图谱是显示科学知识的发展进程与结构关系的一种图形,它是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,是显示科学知识地理分布的知识地图转向以图像展现知识结构关系与演进规律的结果.KatyBorner等综述了知视可视化历程,对引文分析领域进行了可视化研究.安伟峰、熊润芝、周云平等、徐佳宁等、刘艳苏等以及叶协杰众多学者也利用不同的中文数据库、不同的方法以及不同时期对我国的引文分析研究状况进行了研究.虽然中外学者都从不同角度研究了引文分析领域,但是中文引文分析领域的可视化研究几乎还没有开展.本文拟对中文引文分析这个领域运用可视化工具来做一个清晰的描绘.

2.数据及方法

本论文研究所用的数据来源于CSSCI数据库.笔者于2008年4月24日以“引文分析”为检索词在CSSCI中检索到1998-2007年间527篇文献,共得到3328条引文.

下载这些检索记录,通过对数据进行仔细辨认和合并,利用大连理工大学刘盛博编的中文处理软件对CSSCI数据进行格式转换,变为Bibexcel、UciCitespace等软件可处理格式,然后利用这些软件对记录中的关 键 词、作者、来源期刊、被引作者、被引期刊等进行分析或绘图.

3.统计结果与分析

3.1关 键 词分析

527篇论文中,共有2133个关 键 词,对出现3次以上的97个关 键 词进行共现分析,利用Uci,计算中心性,再利用Netdrw绘制这些关 键 词共现网络,得到图1.通过对关 键 词的分析,可得出我国引文分析领域的主要研究内容.

从图1可以看出,节点越大,表示中心性越高.中心性较高的一些词有引文分析、SCI、CSSCI、文献计量学、影响因子,期刊评价等.两个节点之间的连线粗细代表关 键 词共同出现的次数,连线越粗,就是共同出现的次数越多.与引文分析共同出现次数较多的词有文献计量学、期刊评价、载文分析、作者分析等.

3.2作者分析

在527篇论文中,共有682名作者,表1是发表4篇以上的作者及其工作单位.

从表l可以看出,引文分析领域发文4篇以上的作者有29人,其中24人是与图书情报信息有关的,1人与医学有关.南京大学有9人,中国科学技术信息研究所4人,中国科学院文献情报中心有2人,北京大学有2人,浙江大学科技部2人,其余各1人.

3.3来源期刊分析

527篇论文分布在106种杂志中,发表在前20种杂志中的论文数为390,占总论文的74.7%,也就是说20%左右的杂志中包括了大约80%的有关引文分析的论文,基本符合“二八”律,可以认为这些杂志是发表引文分析论文的核心期刊.可以看到前20种期刊大都是图书馆学、情报学的核心期刊.表2显示出引文分析领域的文章除了多数发表在图书情报类的杂志上外,还有很多发表在与科学学、科技管理有关的核心期刊上.

3.4被引作者分析 对527篇论文的3328条引文进行分析,发现有1280位作者被引证,平均每位作者被引频次2.6次.在这庞大的作者群中,被引频次最高的30位作者的总被引频次为731次,占总被引频次的21.97%,平均每位高被引频次作者被引频次24.37次.利用Citespaee软件绘图,得到图2,显示了我国引文分析领域的高频被引作者情况,图3显示了引文分析领域的重要文献.

从图2和图3中可以看出,较大节点的作者是在引文分析领域有突出作用的作者.影响最大的是武汉大学中国科学评价研究中心的邱均平,其主要代表作是1988年出版的《文献计量学》一书.王崇德、罗式胜、丁学东三人也出版了有关文献计量学的专著.庞景安《科学计量研究方法论》一书,详细介绍了引文分析在科学计量学中的应用.梁立明、蒋国华也出版了有关科学计量学的专著.有些集体作者,如中国科学技术信息所、中国社会科学索引课题组、中国科技论文统计与分析课题组、南京大学中国社会科学研究评价中心,这些课题组对我国的引文分析研究也有极大的影响和促进.金碧辉、武夷山、孟连生、朱献有、马费成等人也有突出的贡献,他们的单篇论文的被引频次也很高.姜春林、邹志仁、程刚、袁培国、钟旭、党亚茹、崔雷的研究也各有特色.

3.5被引期刊分析 3328条引文分别来自918种杂志和其他类型文献,包括专著、报告、网页等.但是被引前20种杂志中的引文有1346条,占总引文的40.4%,表3显示被引前20种期刊大多都是图书馆、情报学的核心期刊.《科学学研究》、《科学学与科技管理》等杂志的被引用说明科学学也对引文分析有较大的影响.有380条外文引文,占总引文的11.4%;有160条网页引文,占总引文的48%,其中680条引文都只被引一次,以上说明引文分析对别的学科的知识吸收还是相对较少,吸收较多的还是图书情报学、科学学、科学计量学、管理学、编辑学的知识.

4.我国引文分析存在问题及对策

4.1中国引文分析存在问题

4.1.1引文分析研究缺乏核心作者引文分析在我国的研究历史只有30多年,还没有引文分析的核心作者,虽然有许多专家学者,也有很高的被引频次,但是他们都是图书情报领域的先贤,而引文分析则是依附于文献计量学存在的,大部分的著作都与文献计量学和科学计量学研究相关.因此,表现出引文分析理论研究少,应用研究多,方法简单;方法研究上简单统计多,指标模型少;应用研究用于评价的多,管理的少;研究图情、医药领域较多,其他领域少.

4.1.2数据样本的选择缺乏科学性引文分析是力图根据统计特征找出文献生产、传播等规律,从而进行更深入的研究,为决策提供量化依据.统计特征的出现要求有足够的样本量,足够明确的研究对象,足够大的时间跨度.而国内正式发表的有关引文分析的论文普遍存在着样本量小、时间跨度短、学科代表性差等问题.

4.1.3中文引文分析可视化困难我国的引文分析可视化的进展不大,虽然近年来掀起了引文分析可视化的热潮,但是大多是对来自WebofScience数据的可视化,而以中文出现的知识图谱则不是太多.4.1.4中文的引文数据局限性中文引文数据库有一定的局限性,如CSSCI中的数据从格式到录入出现了很多不统一及错误,如有的引文写错著者姓名、发表年份、出版社等等.在本研究中对这些现象作粗略的统计,其中年份写错或不写的占总引文的3.1%,不写出版社或期刊的占6.2%,不计算其他格式不统一,引文的错误总计在数据库中几乎达到10%.这样就给研究的统计工作带来很大的困难.

4.2中国引文分析现状成因

4.2.1理论基础薄弱首先,引文分析起初是当作文献计量学的一种方法被引入的,由于其使用起来简单易行,大多数学者只是把其当作一种工具来使用,究竟其包括什么样的原理,其使用的前提条件、使用原则、形成机制,并没有人去深入地探究;其次,引文分析理论在国外也进展不大,到目前为止,大多数的引文分析还是以传统的文献数理统计和共引理论为基础进行研究,没有更进一步突破;第三,我国的研究者重视应用研究、忽略理论研究.

4.2.2中文引文数据库不完善为了更好地发展我国的图书馆事业和文献研究工作,我国科研人员不断努力,开发了许多相关的引文数据库,如CSCD,CST―PC,CSSCI等.这些数据库与SCI数据库相比,不论是在数据套录功能还是数据收录年代或期刊收录范围上都有所欠缺.为了进行引文分析,用户不得不把需要的文献记录和它们引用的参考文献题录一一手工摘取,再导入自建的小型引文库中通过编制计算机程序才能获得需要的统计数字.这无疑极大地阻碍了研究人员利用国内引文数据进行分析的积极性.

4.2.3没有适合的分析软件由于我国引文分析发展的较晚,一些引文分析的技术都是来自于国外.国外有很多专家学者利用计算机编程,开发了许多文献计量学软件,进行引文分析.例如:Bibexcel就是OllePersson为文献计量学专门编制普遍适用的、统一格式的数据处理软件,可以处理来自WebofScience等数据库的数据,不但能够进行统计处理,还可以分析数据,形成所需要的关系矩阵.而我国文献计量学、科学计量学的学者目前还没有开发出普遍适用中文数据格式的软件,对于一些不懂数学、计算机编程的学者,要靠最原始的手工来进行计数,所以他们花费在数据处理上的功夫可想而知.

4.2.4不规范的引文行为目前我国的科技论文在引文规范上普遍存在着一些问题,主要表现在以下三方面:“用而不引”和“不用而引”;对参考文献的标注不规范;“引文复制”与“引而不注”;著录失误.此外,一些由于情报交流的障碍,如语言障碍、编译代码转换的障碍、检索工具的障碍、理解水平与能力的障碍等等,都是造成引文错误的直接客观的原因.


4.3中国引文分析的对策建议

4.3.1加强引文分析的理论建设首先,大力开展引文分析的理论研究,对引文分析的原理、规律、研究对象以及与引文分析相关的概念检测设、环境、适用范围进行深入和系统的讨论,力图形成引文分析的研究范式;其次,加强和国外同行的合作交流,力图自主创新,发展适合我国学者的引文分析方法和理论;再次,引文分析有很强的交叉学科的特点,交叉学科的特点就是容易吸取其他学科的先进理论,要想在理论上有所突破,可以借鉴其他学科的理论方法;第四,提倡研究者进行理论研究,改变研究作风;第五,提高研究者和使用者综合素质,使他们能够敏锐地发现引文分析的问题,合理利用引文分析进行科研评价,提高科研活动的效率.

基于CSSCI的中国引文的可视化参考属性评定
有关论文范文主题研究: 关于数据库的论文范本 大学生适用: 学校学生论文、高校毕业论文
相关参考文献下载数量: 94 写作解决问题: 写作参考
毕业论文开题报告: 标准论文格式、论文前言 职称论文适用: 论文发表、中级职称
所属大学生专业类别: 写作参考 论文题目推荐度: 经典题目

4.3.2完善发展各种引文数据库首先,优化数据库结构,加强数据规范管理工作,改善数据库检索性能;其次,借鉴美国ISI的WebofKnowledge(WoK)的经验,对我国各类引文数据库进行重组、加强和完善;可以把CSCD和CSTPC整合起来,成为中国的“SCI”,把CSSCI建成中国的“SSCI”,把各种引文数据库的资源集成为强大的引文网络平台;再次,及时和数据库用户沟通和交流,获得有益的反馈信息.

4.3.3开发中文引文分析软件首先,可以把中文格式换成WebofScience的格式.计算机程序识别数据格式,不一定识别是中文还是英文,因此,只要能把中文引文的格式转换成为WebofScience的格式,就可以利用bibexcel,还有其他能够识别WebofScience格式的软件.其次,开发中文的处理软件.中国科学技术信息所、中国科学院文献情报中心、南京大学社会科学评价中心都为我国引文数据库的建设做出了不可磨灭的贡献.应该让这些单位继续发挥他们的专长,开发出一批适合进行中文引文分析的软件.

4.3.4尽量避免引文失范行为首先,应该强化作者规范意识.作者在引用他人文献的时候,要以认真的态度,消除不良引用心态,养成良好的阅读习惯和引用习惯对引用的内容和引文的著录进行反复核查,避免错误.其次,提高编辑责任意识.期刊编辑人员也要对本期刊发表论文的文末参考文献予以重视.学术期刊的编辑审稿人员除了审查论文内容之外,也应注意抽查文末的参考文献.这样做既是对本期刊的学术质量负责,也是对领域内其它学术期刊的尊重.