R语言在生物统计学教学中的应用

点赞:11192 浏览:46197 近期更新时间:2024-04-06 作者:网友分享原创网站原创

摘 要:生物统计课程是生命科学领域本科学生的必修课程,因其理论性强、内容抽象、计算公式繁多而往往影响教学效果.将易学好用的R软件应用到大学生物统计的课程教学过程用,既能锻炼学生的实际动手能力又能提升学生的学习兴趣,提高教学效果.本文将介绍R语言的特点、国内外应用现状,对R语言在生物统计教学中用到的函数进行简单归纳,并通过实例演示分析R语言在生物统计教学中的优势.

关 键 词:生物统计;R语言;软件教学;教学研讨

生命科学领域的学习和研究内容决定了生物统计学课程是此领域本科学生的必修课程.但与生命科学领域其他专业课程相比,生物统计学理论性强、内容抽象、计算公式繁多.生命科学专业学生由于受形象思维方式的影响,较难接受和理解生物统计学的抽象概念和逻辑推理.课堂调查显示学生在心理上对本课程产生一定的抵触情绪,学习兴趣不高,学习效果不好.随着近年来本科教育目标及培养方案的不断调整,作为专业基础课程的生物统计学教学课时不断被压缩.但与此同时,生物统计学领域的新概念和新方法不断出现,学生由于进一步深造和工作对生物统计学知识的需求也不断增加,我们也必须不断增加和调整生物统计课程的教学内容.教学内容的不断膨胀和发展需求与教学学时压缩之间的矛盾是摆在国内众多任课教师面前的现实问题.因此,在学生认知不足、学习积极性不高的情况下,如何在有限的教学学时内高质量地完成生物统计学课程的教学,为学生奠定一个坚实的试验设计和统计分析的基础,是摆在每位从事生物统计课程教学教师面前的巨大挑战.

不同于传统的生物统计学教学对统计理论的过多强调,现代生物统计学教学过程中需对计算机技术在统计计算中应用能力的培养给予足够的重视.鉴于现在大学生计算机操作能力普遍较好且有兴趣的特点,在生物统计学课程教学中引入计算机教学为该课程改革提供了契机.运用计算机教学需要选择一个合适的统计分析软件,与常用的Excel和SAS软件相比,R语言既是一款更适合在生命科学相关专业本科生教学中进行使用的统计分析软件.

一、R语言的特点及应用现状

R语言早期由新西兰奥克兰大学的RossIhaka和RobertGentleman开发,现在则由“R开发核心团队”负责开发.R语言免费的软件,可从R网站(http://.r-project.)及其分布于世界各地的镜像网站上自由下载,具有丰富的统计函数及强大的画图功能,而且用户还可以通过安装新的套件(Packages)进一步增强其功能.R语言的代码是公开的,用户既可以查看函数的源代码学习统计编程,也可以通过修改源代码实现新的功能.鉴于其强大的统计计算与图形展示功能,且完全免费和源代码开放的特点,其近年来发展迅速.目前,国外众多大学统计相关课程及笔者较为了解的动物科学专业相关课程都将R作为教学工具软件.然而,目前国内高校统计相关课程教学中统计软件的使用虽种类繁多,有SPSS,SAS,Matlab,Minitab,Stata,Origin,MSxcel等,据笔者了解将R软件运用于大学统计教学的案例还非常少.因此,如何将R软件应用于大学生物统计学教学还需更多的研究和探讨.

二、R语言的基本功能

R语言在统计描述、统计作图、统计分布及统计检验等方面丰富的函数为生物统计教学提供了便利的资源.这些函数可分类总结如下:

统计描述:常用的统计描述函数有算术平均数mean,标准差sd,方差var,极差range,中位数median,和sum,最大值max,最小值min.同时,还可以用summary对不同类型数据进行简单统计描述,用table对多变量分类数据进行统计,用frequency对频数资料进行整理.统计作图:简单统计作图函数包括柱状图barplot、饼图pie、直方图hist、茎叶图stem、箱线图boxplot、散点图plot等图示方法;除此之外,还可以使用lattice程序包制作更为复杂的多变量、多数据集的组合图形,及3D图形.统计分布:在统计教学中统计分布是重要的一部分函数,R中常用的统计分布有正态分布normal,二项式分布binom,卡方分布chisq,指数分布exp,F分布f,泊松分布pois,t分布t,及均匀分布unif.将这些统计分布名称前面分别加上字母d、q和p即可获得这些统计分布的分布密度density,分位数quantile,概率函数probability.如dnorm(),即为正态分布密度函数.统计检验:R中常见的统计检验函数有t检验t.test,方差分析aov,卡方检验chisq.test,及相关检验cor.test.需要注意的是,在调用相关函数时,需提供正确的数据变量及参数选项.

三、生物统计教学实例分析

生物统计学的教学内容包括很多理论内容,例如各种统计分布、种统计检验的原理等.这些内容往往比较抽象,以口头讲解的方式通常难以在有限的时间内高效地传递这些信息,学生接受程度较低,教学效果不理想.生物统计学课程中讲解标准误时涉及到的“样本平均数的抽样分布”即是一个较为抽象的概念.此时可以使用R语言的数据模拟及图形演示功能演示样本平均数的生成过程及其分布.具体实现过程如下:(1)设定包括群体大小、样本大小、抽样次数、总体均数、总体方差等群体参数,使用rnorm()函数模拟生成服从正态分布的群体数据.(2)使用hist()函数作总体频数分布图.(3)用sample()函数对总体进行抽样,计算并记录样本均数,使用plot()函数和point()函数演示抽样过程及样本平均数.(4)使用hist()函数制作样本平均数的抽样分布频数图,使用sd(),mean()等函数统计输出样本平均数的抽样分布.

R语言在生物统计学教学中的应用参考属性评定
有关论文范文主题研究: 关于生物统计的论文范文素材 大学生适用: 学年论文、函授毕业论文
相关参考文献下载数量: 97 写作解决问题: 学术论文怎么写
毕业论文开题报告: 标准论文格式、论文总结 职称论文适用: 技师论文、初级职称
所属大学生专业类别: 学术论文怎么写 论文题目推荐度: 优秀选题

通过此演示,可让学生自行调节总体参数,样本大小等参数,从而让学生更加直接地理解参数之间的关系,进而快速掌握样本平均数抽样分布的概念.在此过程中,学生学习积极性得到了充分调动,课堂实际练习过程受到学生的好评,教学效果得到充分提升.

将R语言应用到生物统计学教学过程中,可以把抽象的统计学理论和统计学实践联系在一起,增加学生生物统计学学习的趣味性.在教学中也应注意引导学生认识到R语言是工具,生物统计学理论是应用的基础,只有培养学生具备良好的统计基础才能用好此工具.针对具体的教学对象,需根据需求调整具体的教学实施过程,完善利用R软件的教学方式,把学生培养成为统计理论与实践能力兼备的复合型人才.