JCR5年期影响因子实证

点赞:7766 浏览:32214 近期更新时间:2024-02-26 作者:网友分享原创网站原创

[摘 要]使用期刊引证报告(JCR)中高分子科学学科1999-2009年间的49种期刊数据,从多种角度对5年期刊影响因子(IF5)的性质进行分析.结果显示,IF5不仅能反映多数期刊的被引高峰期,而且能较好地反映出期刊的平均被引水平,体现期刊影响因子概念的本质.最后,将期刊的5年期影响因子与基于被引半衰期的响因子作对比分析,发现IF5本身隐含着期刊论文的被引规律.

[关 键 词]5年期影响因子期刊评价指标被引半衰期

离散系数

(分类号]G350

1引言

期刊影响因子(impactfactor,IF)是美国SCI创始人GarfieldE于1972年提出的作为评价期刊的一个重要指标,它以期刊为对象,统计在一定时间内期刊的平均被引率,其计算方法为:用某期刊前年发表的论文在统计当年的总被引次数除以该刊前年出版论文总量.可见,期刊影响因子的计算基于3个基本数据:论文总量、总被引频次和统计时间期,其中论文总量和被引频次是期刊的自身属性,而时间的跨度则取决于期刊引文的高峰期.国际著名科学计量学家Price在经过大量的文献统计后得出结论:科学论文发表后2年为论文的被引用高峰期.长期以来,ThomsonReu-ters在期刊引证报告(JCR)中公布的影响因子一直采用2年作为时间跨度.为此,对于影响因子的讨论成为学术界的热点,Glanzel和Moed对影响因子计算方法的局限性进行了研究,指出时间跨度是导致期刊影响因子局限性的因素之一.Arehambault和Lariviere也指出,以2年为时间跨度太短,对于一些发展进程比较慢的学科,IF不能合理地测度其期刊论文影响力.任胜利等也指出,2年统计期使IF在不同学科间的可比性受到制约.与此同时,国内外学者对于影响因子的算法进行了大量研究.其中,文献[7]将期刊的被引半衰期(citedhalf-life,CHL)作为时间跨度对IF进行分析,提出了基于被引半衰期的影响因子(citedhalf-lifeimpactfactor,CHL-IF).

经过学术界对IF的热议之后,ThomsonReuters于2009年发布的新版JCR中增加了5年期影响因子(5-yearimpactfactor,IF5).其以5年作为期刊统计期,计算方法是:用某期刊前5年发表的论文在统计当年的总被引次数除以该刊前5年出版的论文总量.作为一项新生指标,IF5也必将成为学术界研究的热点.目前Jacso对JCR报告中图书馆学和情报学期刊的IF5进行了定性研究,认为IF5是IF的有益补充.重庆大学的赵星以2008年JCR科学版6015种期刊数据为样本,运用统计学方法初探IF5的性质,认为IF5不仅是IF的重要补充,对于引文高峰到来较晚的学科期刊,IF5的测度可能更具合理性.但是,目前对5年是否是最佳统计期尚未定论,关于IF5的本质探讨缺少实证研究,对其本质的揭示研究不够深入.

目前,学术期刊影响因子已经由一种模糊的指标成为衡量期刊、学术论文、作者、机构等学术研究水平高低的重要定量测定指标.5年期影响因子作为一项新生指标,以其指标性质及对期刊论文被引规律的反映,决定能否对学术评价工作进行正确合理的指导.挖掘IF(m5)的本质并揭示其实质特征是合理应用该指标的前提,鉴于此,本文尝试以1999-2009年期刊JCR科学版中高分子科学学科中的期刊数据为分析样本,从不同角度对IF5的性质进行分析.首先将IF5与IF进行对比,希望更好地理解这两种指标之间的性质差异;其次将IFs与不同时间跨度的影响因子进行对比,分析以5年为期刊影响因子的时间跨度的合理性,从而更好地揭示IF5的本质;最后将IF5与基于被引半衰期的影响闪子做对比分析,深入分析IF5的实质特性.

2数据获取

选取JCR中高分子科学学科的期刊作为研究样本,本研究需获取1999-2009年期间该学科的JCR数据,2005-2009年获取的数据为两年期影响因子(IF)、5年期影响因子(IF5)、论文总数(articles,N)、被引半衰期(citedhalf-life,CHL)及被引半衰期的源数据表;其中1999-2004年期间只需获取JCR中的论文总数(N)这一指标.数据获取方法是:在JCR科学版,选择2009年(这里以2009年的数据获取为例),选中"viewagroupofjournalsbysubjectcategory”,然后在学科主题中选择“polymerscience”进行检索,结果显示为该学科下的全部期刊的指标数据,然后点击每一种期刊进入其被引半衰期的源数据表,将数据整理后保存为excell表.JCR报告每年收录的高分子科学学科期刊近70种,其中在1999-2009年期间连续被收录11年的共49种,本文以此49种期刊作为研究样本.

3数据处理与分析

将数据信息导入统计软件,以便进行数据的计算及分析.分析软件使用的是excell2003和matlab2009.

3.1IFs与IF的比较

IFs与IF作为目前JCR报告中同时公布的两项指标,本研究首先对其进行对比.49种期刊2005―2009年IF和IF5年平均值如表1所示.

其中,2005年、2006年的IFs值在JCR报告巾未公布,对于该两年的IF5是由作者根据5年期影响因子的计算公式自行算出.为了避免个体差异,将期刊IF;与IF的均值进行对比.为了更直观地对IF,与IF进行比较,以期刊为横轴,以期刊的IF5与IF平均值为纵轴,按期刊IF由小到大的顺序得出其关系,见图1.

由图1可知,多数期刊(41种)总体的IFs平均值大于IF,并且对所有期刊的5年影响因子统计其均值可得,IFs平均值为1.895,IF平均值为1.723,这两点都说明该学科的大部分期刊的引文高峰并没有在前两年出现,因此对于此类引文高峰到来比较晚的学科期刊,IF5的测度更具有合理性.

3.2与其他时间跨度下的影响因子进行比较

本节尝试将IF5与其他时间跨度下的影响因子进行比较.根据影响因子的计算公式,分别计算出2005―2009年期刊的3年期影响因子IF3.4年期影响因子IF4和6年期影响因子IF(m6).这里需要说明的是,由于目前JCR报告可供查询的是1999-2009年的期刊数据,所以2005年最多可计算出时间跨度为6年的期刊影响因子,受这一限制,笔者将最大时间跨度取为6年.

对每一种期刊的每一影响因子分别统计其5年的平均值及其离散系数,统计结果见表2.

这里将每一种期刊2005-2009年期间同一时间跨度下的影响因子作为集合x.其中,集合x的离散系数(V)的计算公式为:

V等于(/)SD×100

这里又是集合x的均值,SD是集合x的标准差.

SD的计算公式为:SD等于(/),1n-l(mi)等于1∑(mn)(x(mi)-x(h2))

观察表2中不同影响因子的离散值可以发现,多数期刊的最大离散系数出现在2年期影响因子上.为了进一步研究这一现象背后隐含的规律,将所有期刊同一影响因子的离散系数作为一个样本,统计出每一影响因子的平均离散系数.统计结果为:IF的平均离散系数为22.734;IF3的平均离散系数为16.778;IF(m4)的平均离散系数为15.951;IF5的平均离散系数为15.458;IF5的平均离散系数为14.612.显然,随着时间跨度的增加,影响因子的平均离散系数不断减少,表明时间跨度越长其影响因子的稳定性越好,其对应的影响因子越能反映期刊的长期平均被引水平.


将所有期刊同一影响因子作为一个样本,统计其平均值,统计结果为:IF统计平均值为1.793;IF3统计平均值为1.831;F(m4)统计平均值为1.874;IF5统计平均值为1.886;IF6统计平均值为1.879.表明IF5作为期刊评价指标,能很好地反映出期刊被引高峰期.

表221)115-2009期刊影响因子平均值及离散系数

注:阴影部分为同一期刊不同影响因子的最大离散系数.

影响因子的本质含义可以表述为:考察某年处于被引高峰期的期刊论文的平均被引率.所以,期刊影响因子的时间跨度有两点基本要求:①要包括期刊论文的被引高峰期;②尽量反映期刊的平均被引水平.上述的两点分析表明,IF5既能反映出期刊的长期平均被引水平,也能反映出期刊被引高峰期,所以,以5年为时间跨度是体现期刊被引高峰期和被引平均水平的一个最佳交叉点,IF5能够体现影响因子概念的本质.

为了研究不同影响因子对期刊间学术影响力的测度差异,将所有期刊同一影响因子的平均值作为一个集合,按公式(1)、(2)计算其离散系数,计算结果为:IF的离散系数为141.606;IF3的离散系数为139.285;IF4的离散系数为140.134;1F5的离散系数为142.746;IF5的离散系数为142.177.可见,从2年期影响因子到5年期影响因子,随着时间跨度的增加,其离散系数慢慢增大,但是6年期的影响因子其离散系数又开始降低,从而看出IF5的离散系数最大.离散系数越大,说明不同期刊问的学术影响力差异越大,所以IF5测度下不同期刊间的学术影响力差异变大,这一点与赵星在文献[10]中的统计结果不同,出现这一差异的原因是两者选择的研究样本不同,本文以高分子科学这一具体学科期刊为研究样本,而文献[10]是以JCR科学版巾所有学科期刊为研究样本,很显然这一差异与学科期刊的引文规律有关,不同学科期刊引文规律不同导致期刊出现较大差异的时间也不同.笔者认为在同一学科中研究期刊间的学术影响力差异更有意义.

3.3与基于期刊被引半衰期的影响因子进行比较

期刊被引半衰期(CHL)是JCR报告中的另一指标,某期刊在T年的被引半衰期是指该种期刊在T年一年内被引总次数达50%的较新那部分论文是在最近多长一段时间内发表的,它反映了该期刊在客观上被引用的规律.笔者认同文献[7]中的观点,认为以被引半衰期为时间跨度的影响因子应该可以反映出期刊论文的被引规律.

由于目前JCR报告可供查询的是1999-2009年的期刊数据,而JCR的被引源数据提供的是期刊过去9年中每一年论文在当年的被引次数及9年之后所有论文在当年的被引总数.例如,2009年JCR报告中提供的某期刊的被引源数据是2000-2008年期间每一年该期刊论文在2009年的被引次数及1999年之后所有该期刊论文在2009年的被引总数.鉴于这一条件限制,可以汁算出的期刊影响因子的最大时间跨度为9年,在49种期刊的研究样本中,被引半衰期大于9年的有14种期刊,这14种期刊的CHL-IF是无法计算的,所以必须将其剔除.另外,JCR报告提供的1999-2009年数据中,可以获取的期刊载文量是期刊每年的论文载文量,受这一条件的限制,2008年、2009年可以计算出的期刊影响因子的最大时间跨度为9年,2007年可以计算出的期刊影响因子的最大时间跨度为8年,2006年可以计算出的期刊影响因子的最大时间跨度为7年,以此类推.为消除个体差异,仍然采用样本平均值的比较方法,选取2007-2009年3年的期刊数据作为研究样本,期刊影响因子可取的最大时间跨度为8年,故再将被引半衰期大于8年而小于9年的5种期刊剔除,剩下的30种期刊作为本节的研究样本.期刊序号仍然沿用之前49种期刊中的序号.

以被引半衰期为时间跨度,计算出2007-2009年期刊的影响因子CHL-IF,计算结果如表3所示:

其中,Tc为被引半衰期内发表的论文在统计当年的总被引次数,N(ma)为被引半衰期内发表的论文总数.

计算期刊同一时间跨度影响因子在2007-2009年3年的平均值,并以所有期刊同一时间跨度影响因子为一个样本集合,计算其离散系数,得到IF的离散系数为60.783,IF(m3)的离散系数为45.849,IF4的离散系数为31.344,IF(m5)的离散系数为148.526,IF(m6)的离散系数为62.116,IF(m7)的离散系数为68.250,IF(m8)的离散系数为86.307,CHL-1F的离散系数为149.011,分析发现,其中IF;与cHL-IF的离散系数很接近,并且这种相似度是其他任意两种影响因子之间都不存在的.进而对期刊分别以IF,和CHL-lF为测度指标进行排序,对排序结果进行分析发现,有22种期刊的排名完全一致,且排名不一致的期刊其排序差别也很少,排名次序相差不超过两位.这两点表明,IF(m5)实质隐含着期刊的被引规律,是用期刊被引总量中前50%的引文来反映期刊的学术影响力.

JCR5年期影响因子实证参考属性评定
有关论文范文主题研究: 关于期刊的论文范文集 大学生适用: 本科毕业论文、高校毕业论文
相关参考文献下载数量: 98 写作解决问题: 如何怎么撰写
毕业论文开题报告: 文献综述、论文目录 职称论文适用: 核心期刊、中级职称
所属大学生专业类别: 如何怎么撰写 论文题目推荐度: 经典题目

4结语

本文利用高分子科学学科期刊11年的样本数据,将5年期影响因子置于多个不同时间跨度的影响因子中进行实证分析.研究表明,以5年为期刊统计期是体现期刊被引高峰期与期刊平均被引的一个最佳统计期,IF(m5)较好地反映出了期刊的被引高峰期和论文被引平均水平,是影响因子概念的本质体现.作为IF的重要补充,以IF(m5)作为测度指标对期刊学术影响力的评价更加全面、更具客观性.

对CHL-IF与IF(m5)的对比研究发现,CHL-IF与IF(m5)在反映不同期刊学术影响力差异方面极其相似,并且以这两种影响因子为测度指标对期刊论文学术影响力的评价结果总体一致,这表明IF(m5)实质隐含着期刊论文的被引规律,是用期刊被引总量中前50%的引文反映期刊的学术影响力.

当然,本文对研究IF(m5)作为测度指标所反映出的不同期刊间的学术影响力差异这一问题的分析不够深入,在后续的研究中可结合被引文数据库及引文时间分布对其进行细化分析;同时,对于IF(m5)评价的全面性、客观性需要更多的研究评议结果进行验证.