体育科研文中常规统计方法情况的调查

点赞:5152 浏览:14995 近期更新时间:2024-02-16 作者:网友分享原创网站原创

摘 要:选取体育核心类期刊科研论文700余篇,通过对所选取论文中常规统计方法应用情况的分析,结合论文中的具体例子,详细说明常规类统计方法在应用方面存在的常见问题,并说明如何正确使用.

关 键 词:常规统计方法,常见问题,分析

中图分类号:G812.6文献标识码:A文章编号:1007-3612(2010)03-0039-03

AResearchontheApplicationofConventionalStatisticalMethodsinSportsScienceThesis

FUJianghe1,MAWenhui2,ZHAOShuxiang3

(1.ThePhysicalEducationInstituteofHenanNormalUniversity,Xinxiang453007,HenanChina,2.NorthChinaInstituteofScienceandTechnology,Yanjiao065201,HebeiChina,2.BeijingSportUniversity,Beijing100084,China)

Abstract:Thethesisselects700scientificpaperrommajorperiodicalsinPEcategory,analyzestheconventionalstatisticmethodsusedinthem,binesspecificexamplesandparticularizeonerrorsofthemonlyusedstatisticmethodsinapplicationandtoexplainhowtousethemappropriately.

Keywords:theconventionalstatisticmethods,monerrors,analysis

随着体育事业的发展,描述统计、推断统计等常规统计方法,在体育科研论文中的应用也越来越广泛.但是,常规统计方法在体育期刊论文中广泛应用的同时,也存在着众多错误应用现象.因此,将期刊论文中常规统计方法应用方面所存在错误的具体情况,如实地反馈给体育科研人员,在量化分析备受体育科研人员关注的今天,显得尤为重要.

本文将根据所查阅的700余篇核心类体育期刊科研论文的实际情况,统计出现各种常规统计错误应用现象论文的具体篇数,并计算相应的出现率,然后针对各种常规统计错误应用现象,分别进行相应的分析和说明.

1样本含量太小时仍用“x±s”进行描述

所查阅论文中使用“x±s”描述数据的共有162篇,其中样本含量太小时仍用“x±s”描述数据的有14篇,该问题的出现率达8.6%.

1.1现象

原作者为了比较投掷运动员投掷发力时有无吼声对运动成绩是否有影响,原文中给出了如表1运动员组别、样本含量以及运动成绩的有关信息.运动员成绩用“x±s”形式表达,在此基础上,原作者对运动员发力时,是否伴随吼声与运动成绩的关系进行相关统计分析,以判断发力吼声与否是否对运动成绩有影响.

1.2分析

上述表1中,铁饼和标项目有的组别运动员样本含量为3、4甚至为2,原作者也用x±s对数据进行描述.其在描述数据信息时,忽视了用x±s形式描述样本数据时,对数据需满足正态性前提的要求.当样本含量特别小时,如本例的2、3或者4,此时根本无法确定数据的分布情况,所以也就不能用x±s形式描述数据,更不能对这些数据进行参数检验分析.

表1同一组别投掷运动员发力时吼声与否和运动成绩的关系

项目组别吼声/人数发力/成绩人数无声/人数发力/成绩铁饼青年男子1235.59±2.66431.65±5.37青年女子740.26±5.32627.08±3.07少年男子738.52±4.10935.64±5.48少年女子338.30±3.291630.79±5.42标青年男子1053.13±8.60745.32±6.89青年女子251.81±4.31635.76±5.79少年男子753.17±3.04642.35±4.71少年女子442.35±4.71637.04±5.341.3说明“x±s”仅应用于描述呈正态分布数据资料的集中和离散趋势,对于不呈正态分布的资料,一般用中位数和四分位差描述其集中和离散趋势更适合.

2用“x±s”描述数据时,多组数据标准差等同

所查阅论文中使用“x±s”描述数据的共有162篇,其中多组数据标准差相等的有3篇,该问题的出现率达1.9%.

2.1现象

原作者分析参加跳高比赛的少年运动员的技术特征.原文给出了跳高有关的6个指标,各指标用“x±s”形式表达描述,表中一共6个指标,其中5个指标男女运动员的标准差都分别相等,如表2所示.

2.2分析仔细观察表2中的6个指标,会发现男、女运动员6个指标中,除第一个跳高成绩指标外,其他5个指标的标准差都分别相等.从田径专业角度讲,性别差异会导致男女运动员跳高时各种高度指标的波动幅度不尽相同,从统计学角度讲,6个指标,其中有5个指标男女运动员的标准

投稿日期:2009-11-12

作者简介:付降河,助教,硕士,研究方向体育统计与测量评价.通讯作者:赵书祥.差分别相等,并且有4个指标的标准差都精确到了百分位数,出现这种巧合的可能性是很小的.

表2少年运动员成绩的构成及百分比

组别H/mH1/H%H2/H%H3/H%H1%身高/m女1.65±0.0570.1±0.0436.60±0.047.0±0.0266.8±31.76±0.05男1.98±0.0761.9±0.0444.85±0.047.0±0.0265.6±31.88±0.05tp<0.01p<0.01p?>0.052.3说明标准差反映的是数据的离散情况,表2男女运动员6个指标有5个指标标准差都分别相等,就意味着6个指标有5个指标的离散程度各自分别相同.现实中,对同一组学生某一指标进行两次测试,两次成绩标准差也很难出现完全等同情况.表2数据5个指标标准差分别等同,数据的吻合性太高,其数据来源值得怀疑.


3当X

所查阅论文中使用“x±s”描述数据的共有162篇,其中当

3.1现象原作者进行背越式跳高教学实验,对两个实验对象组均施行背战式跳高技术训练课10次,分别测试两个组实验前后的跳高成绩,所得数据用“x±s”形式表达描述,如表3所示.并对得到的数据进行了检验,具体数据如上表3所示,最后原作者得出两组成绩均有一定程度的提高,t检验表明,两组学生实验前后成绩分别在0.01和0.05水平上,差异具有显著性.


表3实验对象成绩测试对照表

对象n初始成绩x±s测试成绩x±s石油学院队员61.40±6(P<0.01)1.52±4体育专修学生81.48±5(?P?<0.05)1.56±33.2分析

仔细观察表3中四组数据会发现,这四组数据的标准差都大于它们相应的算术平均数,前两组标准差在数值上是算术平均数的3倍还要多,这就说明了一个现象,这四组数据严重呈偏态分布,更何况目前世界上任何人跳高成绩也不会超过3m,而表3有3处跳高成绩标准差大于3,说明其数据严重有误.由于“x±s”适合于描述呈正态分布的资料,因此对于表3中四组数据,也就不适合用“x±s”形式进行描述.

3.3说明在对数据进行描述时,“x±s”形式仅适合描述呈正态分布的数据资料.如果数据不呈正态分布时,不能用“x±s”形式描述其集中与离散趋势,相应的可以用中位数或众数描述其集中趋势,用四分位差描述其离散趋势,同样,对于偏态分布的数据资料,不适合进行参数检验,可以根据分析目的选择相应的非参数检验方法进行检验.

4描述数据时混淆比、率概念

所查阅论文使用相对数的共有61篇,其中描述数据时出现混淆比、率概念现象的共有4篇,该现象的出现率为6.6%.

4.1现象原作者比较中外优秀女子七项全能选手成绩的演进态势,原作者根据中外运动员各单项成绩,计算出了中外运动员各单项成绩的差值分数,并由各单项差值分数和总差值分数,计算出了各单项的差值百分率(表4).

表4中外全能运动员各单项成绩的差值及百分率

顺序单项名称差值分数差值百分率/%1跳远138202标13619.73铅球10815.64200m8912.95跳高8712.76800m7010.27100m栏689.94.2分析

从数值上看,最后一列数值之和为1.从原文作者的意图来看,原作者是想根据各单项差值分数和总差值分数,计算出相对数,从而用相对数的大小来说明中外运动员,在各个单项上成绩差距的大小,从概念上来看,比和率虽然同为相对数,但是百分率是强度相对数,一般用以说明某种现象发生的频率,而百分比则是结构相对数,一般用以说明总体各种属性成分的构成情况.原作者的意图是用相对数来描述各单项中外运动员成绩差值的幅度,而没有比较强度的意图,所以最后一列应为差值百分比,而不是差值百分率.百分比和百分率虽然差别仅有一个字,但意义不同,原作者在文中混淆了比和率的应用场合.

4.3说明百分率和百分比两者都是相对数,但是在意义和计算上均有区别.百分率为强度相对数,用以说明在一定范围和时间内,某现象的发生次数与该现象可能发生的次数之比,说明该现象发生的强度.而后者为结构相对数,一般用以说明具有某种属性的个体数目占全部个体总数的比重[1].

5该用两独立样本t检验,标出的统计量是F1,混淆方差分析和t检验的应用场合

5.1现象原作者欲比较跨栏常规教学法和念动教学法的教学效果,为此将抽取的学生随机分为实验组和对照组,实验组采用念动教学法,对照组采用常规教学法,教学8周后,比较两个组的跨栏跑成绩.原作者在没有提及使用哪种统计方法的前提下,给出了如上表5的有关统计信息,并由上表中信息得出两组跨栏跑平均成绩差异具有显著性,实验组成绩比对照组成绩好的结论.

表5实验后实验对象技评成绩比较

组别NxFP实验组1875.783.59<0.05对照组1771.065.2分析根据统计学知识,要比较试验后两组的平均成绩应该用两独立样本均数?t?检验.但是表中计算的统计量却是方差分析的统计量?F?,由于其在文中并没有提到所用的统计方法,因此不知其是笔误造成,还是混淆?t?检验和方差分析的前提条件.

5.3说明单因素方差分析和t检验有不同的使用场合,单因素方差分析用于解决两个以上样本均数的差异显著性问题,而t检验,根据分析目的又可以分为单个样本t检验、两独立样本t检验、配对t检验,原作者在文中涉及到实验组和对照组两个组别,所以应该用两独立样本t检验,所计算的统计量应该为t值,而不能是F值.

6样本含量太小应进行非参数检验,却仍用参数检验

在所查阅论文中使用t检验的有162篇,其中当样本含量太小时仍进行参数检验的有13篇,该问题的出现率为8%.

6.1现象原作者分析对比短跑运动员绳肌受伤与未受伤者,摆动腿着地前至着地段部分参数,未受伤短跑队员5名,受伤短跑队员3名,对比的参数如表6所示,各参数用“x±s”形式描述,表中最后一列给出两组队员各个参数对比结果.

表6受伤与未受伤队员摆动腿着地前至着地段部分参数对照表

髋关节合肌力矩(N.M)膝关节合肌力矩(N.M)最大放电值(mV)最大放电幅度时程(mS)未受伤者(n等于5)341.60±12.76312.40±8.993.63±0.40243.60±13.81受伤者(n等于3)253.30±44.43196.33±107.003.45±0.33282.00±17.09P<0.05P>0.05P>0.05P<0.056.2分析仔细分析表6发现,原作者在文中比较两组队员各个参数差异时,没有标明所用的统计方法与所计算的统计量,但是其文中数据用“?x±s?”形式描述.由于数据满足正态性要求时,才可以用“?x±s”形式对数据进行描述,且正态性是两独立样本t检验的前提之一,所以如果用“x±s”形式描述数据,对应的检验应该是两独立样本的t检验,如果表6中的检验结果为非参数检验的结果,那么表中数据的描述不应该用“x±s?”的形式.

对于表6中数据,两组样本含量分别为5和3,都非常小,所以无法确定其分布情况,所以也就不能用“x±s”描述数据特征,进而也就不能使用t检验进行差异显著性检验.应使用非参数检验,由于是两个独立样本,所以对应的非参数检验应该为秩和检验,在SPSS统计软件中为Wilcoxon-ManandWhitney检验.

6.3说明对于实践中的数据,在进行差异显著性检验时,如果数据不满足参数检验的前提条件,可以进行相应的非参数检验.对于单组和配对设计的数据资料,如不满足参数检验前提条件,可以进行符号检验或符号秩检验,对于单因素多水平设计的数据资料,如不满足参数检验前提条件,则可以进行Kruscal-Wallis秩和检验.由于表6中两个组样本含量太小,无法确定其分布形态,所以在进行差异显著性比较时,可以进行非参数检验.

7进行t检验时,方差不齐性,却仍按照方差齐性进行计算,没有注意两独立样本均数t检验时对方差齐性的要求

7.1现象

原作者进行跨栏跑教学实验,将44名女生随机分为实验组和对照组,两组均为22人,对照组采用传统的跨栏教学法,实验组采用新的教学方法.经过六周的教学训练后,进行测试,得出实验组和对照组的平均成绩及相关统计量,原作者在文中指明根据公式(1).

t等于|x1-x2|(n1-1)s12(n2-1)s22n1+n2-2(1n1+2n2)(1)


进行检验,最后得出实验组和对照组实验前跨栏跑成绩差异不具显著性,实验后两组跨栏跑成绩差异具有显著性的结论.

7.2分析

仔细检查表7发现,实验前实验组和对照组两组成绩的标准差分别为0.44和0.39,从直观上看,相差不大,方差齐性检验表明这两组数据方差齐性,可以根据上述公式进行两个独立样本的t检验,但是实验后对照组和实验组两组数据的标准差分别为0.79和0.41,从直观上看相差甚远,进一步作方差齐性检验发现,这两组数据方差并不齐性,但是原文作者依然使用给出的公式进行检验,忽略了文中所给出公式对方差齐性的前提要求.

表7实验组和对照组实验前后成绩比较

实验类别项目组别Nx±sSxtP实验前50m实验组228″9±0.440.090.806>0.05对照组228″8±0.390.08实验后60m跨栏跑实验组2214″4±0.410.095.421<0.01对照组2215″3±0.790.177.3说明在进行两独立样本?t检验时,数据一般要满足独立性、正态性和方差齐性的前提要求,当方差齐性时可以根据原作者文中给出的公式进行计算,如果方差齐性检验表明,方差并不齐性,但数据满足正态性和独立性的要求,此时要进行修正的t’检验,如果手算此时要根据公式(2)计算统计量t’值,并且此时查表所求的临界值也要根据公式(3)?.

t'等于|x1-x2|s12n1+s22n1(2)

t'α/2等于s12n1•,t'α/2(n1-1)+s22n2•,t'α/2(n2-1)s12n1+s22n2(3)

进行修正,然后用所得的临界值和t’统计量进行比较,并得出相应结论.运用统计软件进行统计分析时,如果用excel进行分析,要选择数据分析栏中的“双样本异方差检测设”项进行计算,如果选用SPSS进行计算,在结果的输出框中要看“Equalvariancenotassumed”的输出结果,并根据对应的“sig”值得出相应结论.

8小结

本文所列举的常规统计方法在应用中存在的各种问题,不同程度的反映了体育科研人员在常规统计方法学习、掌握和使用方面所存在的问题、不足和缺陷.留心他人科研活动中统计方法的应用情况,避免他人统计方法使用时的明显错误,对于我们进一步的学习、掌握和使用统计方法,有着积极的作用和意义.