医学稿件中统计学方法误用的回顾和评价

点赞:4226 浏览:9990 近期更新时间:2024-04-11 作者:网友分享原创网站原创

摘 要:检索关于“医学稿件统计学方法误用”主题的中文研究论文,对论文中提及的统计学误用方法进行系统分析并汇总,总结关于该主题论文的分布规律和发展脉络,并提出对该问题的应对策略.

关 键 词:医学稿件;统计学方法;误用;评价

中图分类号:C81文献标识码:A文章编号:1672-8122(2013)02-0058-02

医学统计学为医学研究提供了手段和方法,已经广泛地应用到医学科学研究中,是医学研究不可分割的部分.据研究,有86%的文章都使用了统计学方法[1].统计学方法应用的正确与否,直接关系到研究的结果,然而医学稿件中的统计学方法误用的情况却较多,有研究对应用了统计学分析的1371篇医学稿件研究发现,在统计学处理方面完全符合要求的只有26.7%[2].本文通过对以往发表的关于医学稿件中统计学方法误用方面的文献进行系统分析,总结归纳出主要的统计学问题,并提出应对措施.

一、研究对象和方法

以“医学”、“期刊”、“稿件”、“文章”、“论文”、“统计学方法”为关 键 词,在中国生物医学文献光盘数据库(CBM)、中文科技期刊数据库(维普)、中国知网(CNKI)及万方数据上进行检索.检索到关于医学稿件统计学方法误用相关主题的论文题录58篇,将题录导入NoteExpress2.0软件,通过逐条阅读题录的题目、关 键 词和摘 要,结合本研究内容制定的筛选标准,最终获取到密切相关文献的全文40篇.其中关于医学论文统计学方法误用问题方面的研究性论文29篇,关于医学论文统计学方法正确应用方面的继续教育性质论文11篇.通过逐篇阅读,提取文中所提及的有关论文统计学方法方面的信息.

二、文章基本信息分析

1.研究性论文时段分布.29篇研究论文中,6篇发表于上世纪90年代,最早的一篇《关于论文中数据的统计学处理问题》发表于1991年3期的《中华护理杂志》.23篇发表于2000—2011年,其中近5年发表的论文占69.6%(16/23).

2.研究性论文发表刊物分布及论文作者情况.8篇发表于编辑出版专业刊物《编辑学报》和《中国科技期刊研究》上,其他主要发表在医学院学报、预防医学杂志及其他医学类专业期刊上.论文第一作者专业为编辑学者14人,占48.3%(14/29);为流行病和卫生统计者8人,占27.6%(8/29).

3.研究性论文选题分布.29篇中有25篇是关于医学稿件统计学问题的专题研究,占86.2%,其他4篇是兼论,还提及了科研设计、表格设计及论文投稿过程中的其他问题.从研究方式来看,有10篇(34.5%)是通过对以往发表论文进行调查研究的客观总结,其他的多是作者根据自己阅读文献或审理稿件时发现的统计学问题,梳理后的经验总结.

4.继教论文情况分析.11篇关于医学统计学的继教论文中,有7篇刊登于2000年之后.8篇是杂志社邀请的有关专家书写的专题论文,多是连续刊登多个专题,刊登在“教育园地”和“继续医学教育”等栏目;余下3篇是期刊编辑部在自己期刊上发表的有关医学统计学方面的继教文章,多刊登在“读者·编者·作者”栏目.

三、医学稿件中常见的统计学问题

1.将t检验视为处理定量资料的“”.主要分为两种情况,一种是将2组t检验用于方差分析后的组间两两比较,这样会增加Ⅰ型错误的概率[3],致使检测阳性结果.这是最常见的统计学方法误用类型,几乎所有关于统计学方法误用的文章都提到了这个问题.滕洪松等[4]通过对6所学报期刊3个年度的论著文章进行分析发现,这种误用情况占所有误用文章的44.4%~60.5%,平均达半数以上.沈进等[5]对544篇论著的统计学方法研究发现,该种错误占63.09%,可见此种误用类型的普遍性.另一种是将成组t检验用于配对设计资料.因为配对资料已经从设计时尽量减少了实验误差,本该用配对t检验的资料若还用成组t检验,无疑会增大了混杂因素,降低了实验的精准度和结果的可信度.还有研究提到了将t检验和χ2检验相互误用的情况,如刘英等[6]举例,比较两种治疗方法的远期临床不良事件发生情况,应采用率表示,分析应采用χ2检验,而有的研究却误用了t检验,从而导致结果完全不同.随着多数作者科研水平的提高,这种“简单错误”已经较少见.

2.将χ2检验视为处理定性资料的“通用方法”.常见的误用类型有:(1)误用χ2检验代替确切概率法.当四格表资料的n<40或最小理论频数<1时,应该用确切概率法[7].但许多研究都没有考虑到这个因素,而简单用了四格表χ2检验,刘英等[6]比较了2种药物治疗心绞痛的疗效,若正确的使用确切概率法,结果显示差异无统计学意义,若错误的使用χ2检验,则会得到相反的结果.(2)误用χ2检验代替秩和检验和Ridit分析.若是行×列表资料,且表格一个方向是等级资料,当等级数大于3时,应该用秩和检验,但很多研究都用了χ2检验,万瑜等[8]将2002—2006年《中华骨科杂志》5年发表的论著文献中常见的统计学方法误用类型进行分析发现,行×列表资料误用χ2检验这种类型占所有统计学误用文献的15.1%,是除方差分析误用t检验之外的排名第二的误用类型,和滕洪松等[4]的研究结果基本一致.

3.误用单因素方差分析.当定量资料属于2个因素2个水平的组合设计时,应该采用析因设计资料的方差分析,而不能简单化为单因素4个水平(多水平)设计资料的方差分析[2].当资料属于重复测量定量资料时,应该采用重复测量的两因素设计定量资料的方差分析.当需要对多因素设计中的某个因素各水平下的平均值进行两两比较时,若因素之间的交互作用项具有统计学意义,不应简单地采用单因素多水平设计定量资料的q检验法、LSD-t检验法或Dunt-t检验法,而应建立在相应设计定量资料的方差分析基础之上[9].上述t检验、χ2检验及方差分析是最基本最常用的统计推断方法,但据统计,出现错误最多的就是这些最基本的概念和经典的统计方法[10].除此之外,还有很多关于统计学指标和结果表述等问题,都会影响研究结果的正确表达.4.统计学指标运用不当.(1)率与构成比的误用.如作者统计分析某市某年乙型脑炎不同年龄段的发生情况,将患者按≤3岁、3~9岁、≥10岁3个年龄阶段,分析不同年龄段患者所占比率,即构成比,而非率[2].(2)患病率与发病率混淆误用.发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数;而患病率则指观察时点某病的现患病例数与该时点人口数之比,强调的是该观察时点上某病的现患(新、旧病例)情况.然而在论文撰写中,许多作者没能正确区分观察、统计的时间,将二者混淆误用[11].(3)病死率和死亡率的混淆误用.死亡率等于死亡人数/同期人口数,是观察人群中某病的死亡频率,反映了观察人口因某病的死亡水平,是一个人口学指标,一般以10万分率表示;而病死率等于死亡人数/患某病的患者总数,是某病患者中因该病而死亡的频率,反映了某病的死亡危险性,一般以百分率表示.而部分作者常将某病住院病死率误认为某病的死亡率[12].

5.统计学结果表述和解释不当.对于统计结果的展示,一般要求应给出具体的统计量和P值,而很多文献只标明P>0.05,P<0.05,而未给出统计量,这是最常见的统计学错误[13].还有对统计学结果的解释,很多文章易将统计学结果和专业结论混淆,将P>0.05解释为“差异不显著”,P<0.05为“差异显著”,P<0.01为“差异非常显著”,这都是不对的[14].P<0.01只能说是有此样本推断总体的把握性更大,P值越小,就越有理由认为被比较的均数或率之间有差异.至于差异有多大,要由它们之间实际相差有多大再结合专业知识来确定.

四、研究性论文综合评价

笔者通过对文章内容分析发现,早期的关于医学稿件统计学方面的文章内容相对较浅,涉及的统计分析方法简单,后期的文章除了谈及常见的统计学问题外,还涉及到了科研设计和较复杂的统计学方法.如刘英等[6]提及在科研设计阶段要注意样本量和“随机、对照、均衡、重复”四大原则等,在统计学分析时,谈到了析因设计和重复测量方差分析.关于此主题文章的发展趋势,基本是随着稿件资料的复杂和设计的完善,统计学方法应用正确率逐渐提高,也越来越完善和丰富.从客观指标被引频次排名来看,发表在编辑学报上的关于这一主题的文章被引率较高,见表1.

医学稿件中统计学方法误用的回顾和评价参考属性评定
有关论文范文主题研究: 关于统计学的论文范文资料 大学生适用: 自考毕业论文、高校大学论文
相关参考文献下载数量: 73 写作解决问题: 写作技巧
毕业论文开题报告: 论文任务书、论文摘要 职称论文适用: 刊物发表、职称评初级
所属大学生专业类别: 写作技巧 论文题目推荐度: 经典题目

统计学处理在医学科技论文中的地位举足轻重,统计学方法的正确使用与否直接关系到结果的差异有无统计学意义.因此,应从多方面做起,提高统计学方法的正确使用率.首先,编辑人员应从思想上重视对统计学处理的把关,还应加强统计学专业知识的系统学习,提高自己的能力,遇到有异议的地方要翻阅资料以求正确解决.其次,可聘请统计专业的专家给予指导.当然,对于某些稿件来说,上述措施实属“亡羊补牢”,因为可能最初的实验设计阶段就存在一些问题,致使后期的统计学处理无法满足研究者的分析需求.这就需要从源头抓起,提高作者的统计学处理能力.编辑部可以举办关于稿件统计学处理的专题培训班,还可以在期刊上开设相关栏目,对读者进行系统的继续医学教育.