文被引的文本因素:多学科视角

点赞:5955 浏览:21041 近期更新时间:2024-03-01 作者:网友分享原创网站原创

[摘 要]文献长度、参考文献数量是否影响论文被引频次,不同学科有不同的检验结果.网络环境下,题名字数、关 键 词个数是否对论文被引具有显著影响,尚未见文献报导.通过对来自6个学科的455篇论文被引的文本因素进行分析,发现:①关 键 词个数对文献被引存在明显的影响;②参考文献数量对英文语种文献的被引确实存在显著影响,但对中文语种文献被引的影响却不能通过显著性检验;③多学科背景下,文献篇幅长短及题名字数多少对文献被引没有显著影响;④存在“中国学者所发表的英文论文,篇幅越长越有可能不被引用”的现象.

[关 键 词]引用 文本因素 文献篇幅 参考文献数量 题名字数 关 键 词个数

[分类号]G350

世所公认,论文的被引是研究论文与某特定领域知识体的“连接剂”,也是测度论文重要性的“计量仪”.鉴于零被引论文的大量出现,不少机构逐渐将论文被自变量量作为判断学者学术水平的一个重要指标.研究论文被引次数的影响因素,将利于学者扩大其学术论文的影响力和公信力,利于管理机构制定合适的奖励或认定政策,也利于报刊等出版单位组稿编辑等业务流程的决策.

1 前人研究综述与本文检测设

论文被引有许多客观因素,甚至偶然因素.总体而言,关于文献被引的因素可分为以下几类:①期刊因素,比如期刊级别、网络出版等;②作者因素,包含作者性别、作者地位、论文作者多寡、论文作者所在机构的学科实力、论文作者所获得的资金资助等;③论文文本因素,包含参考文献多寡、篇幅长短、表格和图形数量、学科热点话题等.以上因素,除了期刊级别、作者性别、热点话题获得一致认可外,在不同学科、不同视角的研究中,对于其他因素都有不同的声音.比如,大陆学者杨冠英就明确质疑作者的影响力:仅有少数的个体对于科学的进步是有贡献的充斥着各式各样标榜作者自己学术地位的所谓学科知识地图,也许是一种讽刺.欧洲南方天文台(ESO)的天文学家Dietrich及大陆国家天文台陈学雷研究员也怀疑论文篇幅对文章被引次数的影响,认为其尚不确定.

另一个值得注意的现象是,目前学者对文献被引的影响因素分析都局限于某一学科.而事实上,早有学者怀疑,自然科学与社会科学在引用文献上面存在极大的差异.比如,Hamilton就认为“人文社会科学不习惯引用前人研究”,但Did和Lowell却反驳了这种观点.无论如何,以某一学科为研究对象,所得出的结论是否带有普遍意义,尚需检视.

有鉴于此,我们尝试从多学科视角对论文被引的影响因素进行分析,限于篇幅,本文先从论文的文本因素着手.

根据前人研究,本文提出如下检测设:

检测设1:论文参考文献越多,其被引的可能性越大;

检测没2:论文篇幅越长,其被引的可能性越大.

除此之外,我们认为,网络环境下,论文题名长度和关 键 词个数可能影响论文被引次数.论文的题名、关 键 词是一篇论文必不可少的要素,是论文的精髓与灵魂;网络环境下,更关系检索和结果筛选的效率.从许多检索系统的统计分析来看,用户最倾向使用的检索字段依次为标题、关 键 词、摘 要、作者和参考文献;学者为了尽可能在题名、关 键 词中充分体现论文研究主题或者研究创新,会选择增加题名长度、关键同个数.而事实上,这也迎合了如今智能检索系统的发展趋势――当题名中无法匹配检索词时,系统自动在关 键 词、摘 要或者全文中进行匹配.检索系统的默认检索途径以及学者的思维习惯,都可能导致“题名较长、关 键 词较多的文献更容易被检索命中,从而获得学者引用”.即有检测设:

文被引的文本因素:多学科视角参考属性评定
有关论文范文主题研究: 关于参考文献的文章 大学生适用: 学士学位论文、硕士论文
相关参考文献下载数量: 53 写作解决问题: 写作参考
毕业论文开题报告: 标准论文格式、论文选题 职称论文适用: 刊物发表、中级职称
所属大学生专业类别: 写作参考 论文题目推荐度: 优秀选题

检测设3:论文题名越长,其被引可能性越大;

检测设4:论文关 键 词越多,其被引可能性越大.


2 样本数据特征

本文数据源于西南大学图书馆2009―2010年所出具的37份引用检索报告.此37份报告的委托人为了评职称、重点实验室年检、科研报奖等原因而要求进行多库引用检索,出具的报告中委托人已经将被引很少甚至没有被引的文献剔除,因此,剩下的都是高被引或者委托人认为确实质量高的论文.数据处理过程中,笔者等人剔除了发表于2009年和2010年的论文52篇(即委托人认为质量高但事实上尚没有引用发生的论文);考虑到奇异值可能带来的影响,笔者还剔除了2004年发表于Science上面的畸高被引论文1篇(蚕学,被引410次),最终获得论文455篇,其中英文230篇,中文225篇,论文的学科分布如表1所示:

笔者等人在原有报告基础上,于2011年2月18日一3月2日问对455篇论文的最新引用情况进行了统计;为了避免自引对论文被引的影响,本文对沦文自引他引进行了区分,455篇论文共得自引1075次,他引3404次(下文的检测设检验过程,即分别以总的被引次数和他引次数作为因变量).样本题名长度、关 键 词个数、文献长度、参考文献数量、论文的被引次数等资料的描述统计值如表2所示:

3 检测设检验

3.1 不区分语种情形下的检测设检验

分别以“他引、总引”为因变量,“论文参考文献数量、文献长度(页码)、题名字数、关 键 词个数”4个因素为自变量,进行同归分析,结果如表3、表4所示:

可见,以0.05为显著性检验水平,多学科视角及不分语种情况下,关 键 词个数、参考文献数量对论文被引确实产生了非常明显的影响:关 键 词每增加一个,他引增加1.05次,总引增加1.402次;参考文献每增加一篇,他引增加0.094次,总引增加0.134次,即检测设1、检测设4成立.

从回归系数的正负可见,尽管题名字数对文献被引有正的影响(与检测设2的预期接近),但无法通过显著性检验,即检测设2不成立.蹊跷的是,文献长度对文献被引却表现出负的影响(与检测设3相悖),但仍然没通过显著性检验;即检测设3不成立.

3.2不同语种情形下的检测设检验

进一步考虑不同语种文献被引的文本因素,结果见表5-表8.可见,检测设4,即关 键 词个数对文献被引有明显的影响,在不同语种环境下,都通过了显著性检验.

表7-表8显示,对于英文语种文献,参考文献数量对文献被引确实有明显的影响,即检测设1在英文语种文献中成立.但表5-表6却显示,对于中文语种文献,参考文献数量对文献被引与否的影响,不仅没有通过显著性检验,而且获得的系数为负,表示参考文献越多,越可能不被引;检测设1在中文语种文献中不成立.两相对比,该因素在不同语种环境下的表现迥异,这也许和中国学者不注重前人研究,不喜欢编辑参考文献,甚至“乱编辑”参考文献有关.

检测设2、检测设3在不同语种环境下都没有通过显著性检验,即都不成立.但表7-表8表明,英文语种文献越长,越不可能被引.结合表3-表4,可以认为,“中国学者所发表的英文论文,篇幅越长越有可能不被引”.为何有如此现象,笔者等人尚不能做出清晰的解释.

4 结语

通过对来自6个学科的455篇论文被引的文本因素分析,笔者等人发现,关 键 词个数对文献被引存在明显的影响(检测设4),这种影响在中文论文或英文论文中都表现得一致.网络环境下,学者若想提高论文中被引频率,可以就论文主题尽可能撰写更多的关 键 词.通过对455篇文献进行不同语种的区分检验,发现参考文献数量对英文语种文献的被引确实存在显著影响(检测设1),但对中文语种文献被引的影响却不能通过显著性检验.我们认为,这可能与国内学术撰写不规范等原因有关.

研究表明,多学科背景下,文献篇幅长短及题名字数多少对文献被引没有显著影响.更奇怪的是,研究发现,中国学者所发表的英文论文,篇幅越长越有可能不被引用.为何存在如此可能,敬请同行更多地论证和解释.

遗憾的是,本文样本数据仅仅455篇论文,远比同行类似研究样本空问小;所得出的结论或者所发现的现象是否有普遍意义,尚需同行验证.当然,最值得警醒的是,本文的出发点――从多学科视角来讨论论文被引的影响因素,是否合适,确实需要同行商榷.而且,论文被引尚有作者因素、期刊因素,从多学科的视角来检验这些因素,是否有新的发现,尚需进一步的数据检验.

[作者简介]简琳,女,1963年生,馆员,发表论文10余篇,何静,女,1973年生,副研究馆员,发表论文15篇,周剑,男,1975年生,副研究馆员,发表论文20余篇.