统计学在社会经济调查方面的应用

点赞:10977 浏览:44958 近期更新时间:2024-03-13 作者:网友分享原创网站原创

摘 要:本文根据社会经济调查的原则、流程及统计学方法等,调查华南师范大学2012级MBA全体同学2013年5月31日上、下班花费时间及2013年5月26日-2013年6月1日网上购物消费金额指标.本次调查运用分层抽样、随机数表法、抽样误差计算、区间估计的调查方法,进行调查、计算并对调查数据进行分析.

关 键 词:分层抽样;随机数法;抽样误差;置信度区间

1调查方法设计及原则

分层抽样方案设计的原则须科学、有效、便利,也必须保证有较高的效率,即在相同的样本量的条件下,方案设计应使调查尽可能小、精度尽可能高,即目标量估计的抽样误差尽可能小.抽样方案必须有较强的可操作性,不仅便于具体抽样的实施,也便于后期数据处理.按照此原则,我们将全班112名同学按性别分为男、女两层并按姓氏排序编号.统计结果为男生69人,女生43人.

2随机数表抽样法

随机数表是统计工作者用计算机生成的随机数组成,并保证表中每个位置上出现哪一个数字是随机数表等概率的,利用随机数表抽取样本保证了各个个体被抽取的概率相等.真正的随机数是使用物理现象产生的:比如掷钱币、、转轮、使用电子元件的噪音、核裂变等等.这样的随机数发生器叫做物理性随机数发生器,它们的缺点是技术要求比较高.而通常我们使用的随机数表是使用伪随机数,这些数列是“似乎”随机的数,实际上它们是通过一个固定的、可以重复的计算方法产生的.计算机或计算器产生的随机数有很长的周期性.它们不真正地随机,因为它们实际上是可以计算出来的,但是它们具有类似于随机数的统计特征.本次调查采用随机表法抽取样本,完全排除主观挑选样本的可能性,使抽样调查有较强的科学性.本文的随机数表为EXCEL表通过函数“等于INT(RAND()*(b-a)+a)”生成,代表生成范围在(a,b)之间的随机整数.

将全班112名同学按性别分为二层.第一层为女同学,共43名人,按姓氏的拼音首字母排序,并编号1、2、3......43;第二层为学,共69人,采用

相同的办法排序,并编号1、2、3......69.

3分层抽样调查

欲了解华南师范大学2012级MBA全体同学2013年5月31日上、下班花费时间、2013年5月26日-2013年6月1日网上购物金额以及这两个个指标,对30个样本进行了分层抽样调查,数据收集的方法为网络调查,被调查者采用收取邮件方式对调查问卷作回答.发出问卷30份,有效回收30份.调查统计结果列出下表:

分层抽样具有比纯随机抽样高的抽样精度,但由于分层抽样中各层的样本的具体情况在抽样检验之前是未知的,所以我们也就无从知道样本的均值、方差.必须根据调查数据作进一步的计算与分析.

4抽样误差的计算

在112名同学总体中随机抽出30个样本,采用比例分配法把样本中的女、男分为两层,这里:N等于112,n等于30;N女等于43,n女等于21;N男等于69,n男等于18.

(一)指标1:上周五(2013年5月31日)上、下班花费时间

1.样本均值计算:

2.样本方差计算

3.置信区间

(二)指标2:上一周(2013年5月26日~2013年6月1日)网上购物金额


1.样本均值计算

2.样本方差计算

3.置信区间

5分层设计分析

分层设计效应的目地在于为抽样调查提供一个近似的、好用的估计来提高调查效率,并对群内的一致性进行分析.以下数据的计算结果(表-5)是严格按照分层抽样比,选择两个代表性指标,对全班同学的上、下班花费时间,网购消费水平作总体估计.

判断调查的抽样精度没有一个统一的标准,要因定性和定量研究的目地而定.一般误差在5%范围内,抽样精度较高,在5%-10%之间抽样精度较好,在10%-20%之间数据是可用的,在20%以上,可以认为抽样样误差较大.数据均可根据抽样调查在允许误差的范围内进行修正.所以为了提高抽样精度,三个调查指标的数据计算都是在允许误差95%的置信度区间内进行.

其中,置信水平可以分析总体参数值落在样本统计值某一区内的概率,而置信区间是在某一置信水平下样本统计值与总体参数值间误差范围.其区间范围越大,置信水平越高.

指标2网上购物金额抽样误差37.78,从抽样误差的角度来看,完全可以满足推断总体的要求.在置信水平为95%的前提下计算出的置信度间隔148.1最宽,表明置信水平最高,用该数据来估计全班同学的网购消费水平的可信度就最高.由国家统计局资料显示,全国居民平日在互联网上的钱主要用于上网、购物、玩游戏,缴纳各种生活费用.随着中国网购市场日渐安全规范,人们越来越喜欢网上购物这种新型的消费方式.

统计学在社会经济调查方面的应用参考属性评定
有关论文范文主题研究: 关于计算机的论文范本 大学生适用: 硕士学位论文、学年论文
相关参考文献下载数量: 36 写作解决问题: 写作技巧
毕业论文开题报告: 论文模板、论文题目 职称论文适用: 期刊发表、初级职称
所属大学生专业类别: 写作技巧 论文题目推荐度: 免费选题

指标3上周锻炼身体的时间其抽样误差15.01,从抽样误差的角度来看,也可以满足推断总体的要求.在置信水平为95%的前提下计算出的置信度间隔58.84较宽,表明置信水平较高,用该数据来估计全班同学的上周锻炼身体的时间可信度也较高.一份《2012年度中国职场人平衡指数调研报告》中指出“广州职场人工作时间全国第一,平均睡眠时间最短”.由此可见,人们没有更多的时间进行体育锻炼.对于本次调查华师全体同学的锻炼时间均值为73.39分钟,这个结果还是比较让人欣慰地.

总之,通过对30个样本的两个指标进行抽样数据分析,对全班同学的数据作代表性估计是毋庸置疑的,而且抽样误差水平很低.因此,上下班花费时间、网购消费水平、锻炼身体情况的样本数据对推算全班总体具有较好的精确度,为进一步了解全班同学情况提供了重要的参考依据.