SAS软件在医学统计中的应用

点赞:5400 浏览:18984 近期更新时间:2024-01-29 作者:网友分享原创网站原创

摘 要:美国SAS研究所在1976年研究出一款能够用来分析数据和编写报告的软件系统,它的全称是StatisticalAnalysisSystem,通过几十年以来的不断更新和完善,SAS已经可以在不同的系统下运行,而且其所使用的领域也越来越加的广泛和深入.在医学领域,各种医学统计都需要运用到这款软件,因此笔者今天就针对SAS软件在医学统计学当中相关应用的一些问题做出简要的分析和探讨,希望所得的结果能够引起大家的关注和重视,也希望这篇文字能够为相关的领域提供一个可供参考的资料.

关 键 词:SAS软件;医学统计;应用

中图分类号:TP311文献标识码:A文章编号:1009-3044(2013)35-8160-02

SAS的中文含义就是统计分析系统,它主要是通过数十个专用模块而构成的,功能比较全面,包括数据的访问,数据的管理,数据的存储,还有应用开发,报告编制,计量经济学,运筹方法学,图形处理以及数据分析等.医学统计学会涉及到医学领域的很多学科,其方法比较复发,而且工作起来计算量也比较庞大.最近这些年来,医学基因组学和临床试验统计学理论及其方法都在不断地发展和深入着.因此,笔者认为作为医学领域的相关统计人员除了要将医学统计学的基本理论掌握好以外,还需要对相关的软件操作知识做出必要的了解和认识.因此,笔者接下来将主要谈一谈SAS软件在医学统计当中应用的相关问题.

1SAS软件在医学统计中的统计描述

在医学当中最为常见的两种资料类型分别是定量资料和分类资料,因此在对数据进行处理的时候就需要对资料的类型和分析情况作出了解,这样在对资料进行描述的时候就能够根据特殊的情况选择合适的方法[1].

1.1定量资料的统计描述

所谓定量资料的统计描述就是对离散趋势和集中趋势进行描述,在描述性统计当中,频数分析和频数描述是两种最为常用的方法,如果我们想要对数据进行了解和认识,那么我们首先就需要从频数分析开始.

进行频数分析需要编制频数表,在编制频数表的时候需要将所有的观察结果按照一定的顺序做出排列,需要在排列的顺序当中去发现观察值的分布规律.也可以对某一个变量的频数进行频数分析,编制相应的频数分布表,这样就可以将该变量的分布类型揭示出来.频数分析能够将远离群体的某些可疑值发现,因此频数表能够对频数分布的两个重要特征做出表示,一个是集中趋势,另一个就是离散趋势.我们根据频数表所绘制出来的直方图就能够更加直观地将资料的分布特征观察出来[2].在SAS软件当中,我们可以通过分析员来对频数做出频数分析,通过编程做出频数统计.

SAS软件在医学统计中的应用参考属性评定
有关论文范文主题研究: 关于医学统计的论文范文数据库 大学生适用: 本科毕业论文、电大论文
相关参考文献下载数量: 23 写作解决问题: 毕业论文怎么写
毕业论文开题报告: 文献综述、论文前言 职称论文适用: 职称评定、职称评初级
所属大学生专业类别: 毕业论文怎么写 论文题目推荐度: 最新题目

频数分析能够将定量变量的相关资料的分布情况和集中情况进行一定的描述.但是,如果我们想要更多的了解一些关于集中趋势和离散趋势的确切信息,那么我们就需要对于一些相关的描述性指标作出必要的计算[3].所以,我们需要利用SAS软件当中的分析员来对常用描述性的统计指标作出描述,依然使用编程来对描述性的统计指标作出计算.

1.2分类变量的统计描述

分类变量的数据特征和定量资料是完全不相同的,分类变量的基础数据是绝对数据,比如某种疾病的出院人员、治愈人数以及死亡人数等等.在对一组定性资料数据特征进行描述的时候,一般都需要对其相对数做出计算[4].在医学统计当中,我们常用到的相对数有构成比、频率和相对比等.所以在这里,我们也需要通过分析员对我们常用的相对数指标作出计算.

2SAS软件在医学统计中对总体均数的应用

举个例子来说,已知某地27例健康的成年男子的血红蛋白的含量均数是[x]等于125g/L,标准差是S等于15g/L,其数据是(血红蛋白含量[g/L]):123,105,134,140,127,112,113,127,145,125,110,130,112,138,110,100,104,155,147,137,126,125,100,122,127,133,145.对该地健康成年男性的血红蛋白量在95%、99%的可信区间进行估计.我们可以用来做出总体的均数估计,运行分析员,做出数据集.经过具体的操作和分析,我们就可以得出我们需要的结果:95%ConfidenceIntervalforthemean;LowerLimit:118.91;UpperLimit:130.87.99%ConfidenceIntervalforthemean;LowerLimit:118.91;UpperLimit:130.87.

计算好这些以后,我们还需要通过SAS程度做出总体的均数估计,可以通过运用CAPABILITY过程当中的INTERVALS语句,对其正态分布的总体均数的各种类型的可信区间做出估计.在整体均数的计算当中,其可信区间的SAS程序常规格式为:proccapabilitydata等于“数据集的名字”noprint;intervals“变量名的列表”/method等于4;run;


3SAS软件在医学统计中队样本含量及检验效能的估计

在各类的医学统计研究当中,对样本含量做出确定是研究设计的一个重要内容.因为样本含量计算起来相当麻烦,而且其样本条件也不容易掌握,所以在很多研究当中都将样本含量的计算忽略掉了.因此也就很容易发生样本含量偏低、检测效能偏低以及结果不可靠等情况.但是我们也不能够盲目去追求大的样本,因为一旦样本含量过大就会对很多资源造成浪费,加剧了质量的控制难度,造成资料的可靠性下降[5].所以,在设计当中,只有对样本的大小做出科学的评估,才能够将检验的效能满足下来.

在对样本含量做出估计的时候需要使其具备四点条件.①对检验水平α做出确定,α是第一类错误的概率,其值越小所需要的样本例数就会越多,所以在通常条件下,我们会选择让α等于0.05,再根据专业的知识对双、单侧的检验进行确认;②将所期望的检验效能1-β提出来,如果两总体确实存在差别的时候,α就能够将这种差别发现,所以要求检验的效能越大,其样本的含量也就会越大.因此,检验效能也是由第二类错误β的大小所决定的,通常情况下,我们都选择β等于0.25-0.1之间,而相对的检验效能就是0.75-0.90之间,检验效能不能够小于0.75,不然的话就不能够将总体真实差异反映出来;③允许出现的误差范围为δ等于|μ1-μ2|,就是对两个总体参数差值进行比较,而总体参数可以通过预试验获得,也可以用专业上认为具有实际意义的差值来替代;④对总体标准差和总体率进行确定,通常都是根据试验结果或者预实验结果来确定,也可以通过样本标准差或者样本率来代替[5].

在SAS的系统当中,我们一般都运用分析员的模块对样本含量的大小做出评估,但是这种模块却仅仅只限于对连续性的变量样本模块含量做出估计.

4结束语

在本研究当中,笔者主要针对SAS软件在医学统计当中的相关应用做出了简要的分析和探讨.在目前为止,SAS是国际上最流行的大型统计分析系统之一,其应用范围及其广泛,其中当然包括医疗卫生领域.它最大的特点就是具有十分强大的编程功能,可以通过易学、灵活而又简单的程序语言来解决存在于数据读取、数据分析、数据处理、数据表达、数据连接等一系列程序当中的任意一种复杂的问题.所以,笔者认为,如果在医学统计领域将这一软件充分运用开来,将会收获到更为理想的效果.为此,相关的医学统计人员还需要更加的努力学习相应操作知识,争取让SAS软件在医学领域得到更为充分的应用.