基于数据挖掘的高职计算机一级MS―Office考试成绩

点赞:29947 浏览:134645 近期更新时间:2024-01-26 作者:网友分享原创网站原创

【摘 要】本为旨在利用当前的热门技术:数据挖掘技术对高职院校计算机一级MS-Office考试成绩进行分析和研究,从中找到一级MS-Office考试中隐含的信息,为高职院校今后的教学提供指导.

【关 键 词】数据挖掘,计算机一级MS-Office考试,聚类分析,K-Means


随着计算机技术的不断发展,目前很多高职院校把计算机等级考试:计算机一级MS-Office考试作为《计算机应用基础》这门课的考核方式,学生在一级MS-Office中取得的成绩以及过关率在一定程度上也反映了学生对该门课的掌握情况和教师的教学效果.该项考试同时得到了很多用人单位的认可,但是由于试题题型更新、题量稍多等原因,学生普遍的通过率不是很高,为了使学生能够更好的通过考试,也为了提高教学质量,本文将当前比较热门的数据挖掘技术引入到对学生一级MS-Office考试成绩的分析当中,目的是为了从中找到考试中所隐含的信息,从而为学生今后的学习和老师的教学提供较好的帮助和指导.

1.数据挖掘技术

数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的以前未知的并具有潜在可用的模式的过程.运用数据挖掘技术要解决的首要和最重要的任务就是:对于那些复杂的、不完整的数据如何进行分析,通过分析来发现这些数据间的关系,对于有用的模式如何进行提取,使得信息能够进行简化处理,对于某些不经确、不完备的知识如何确定其表达.

数据挖掘的分类的方式有很多种,根据数据挖掘的任务来分类可以分为如下的几种:分类或预测模型的数据挖掘、数据总结、数据聚类分析、关联规则分析、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等.其中常用的数据挖掘分析方法有:关联规则分析、分类分析、预测分析、聚类分析几种.

数据挖掘的过程有如下几步:首先对数据进行清理、收集,接着是数据的选择、变换、挖掘,然后是数据的挖掘、模式评估,最后是知识表示等.而对于这些过程并不是一次就可完成实现的,对于其中的某些步骤甚至是全过程有可能需要反复多次的进行,之后才能得到最终的结果.

2.数据挖掘技术在一级MS-Office考试成绩分析中的应用

众所周知,考试成绩的好坏往往是由多方面的原因引起的,除了大家公认的试题本身之外,还有任课教师的年龄、职称,学生自身的学习兴趣、学习前的知识掌握情况、课堂学习效果以及课后练习时间等等,都可能成为影响成绩好坏的因素.一级MS-Office也不例外.本文拟从这几方面来综述数据挖掘技术在其中的应用.

2.1采用聚类算法对试题本身进行分析

基于数据挖掘的高职计算机一级MS―Office考试成绩参考属性评定
有关论文范文主题研究: 关于计算机的论文范文数据库 大学生适用: 专科论文、专升本论文
相关参考文献下载数量: 58 写作解决问题: 写作技巧
毕业论文开题报告: 论文提纲、论文结论 职称论文适用: 杂志投稿、职称评中级
所属大学生专业类别: 写作技巧 论文题目推荐度: 经典题目

将聚类算法中的K-Means算法应用到一级MS-Office的考试评分系统中,根据搜集到的一些现有数据进行分析.在分析之前首先需要对一级MS-Office的题型进行说明,在最新的一级MS-Office中题型有:选择题(20分)、基本操作(10分)、文字处理(25分)、电子表格(20分)、演示文稿(15分)、上网题(10分).因此将采用K-Means挖掘算法对6个属性间的聚类分析挖掘.

在进行聚类分析之前,为了更好的进行分析,第一步需要对数据进行标准化.在进行标准化时需要遵循一个原则,即:将各个题型的实际所得分数除以该题型的总分,如对于选择题,某同学得分为15分,选择题的总分为20分,15/20得到0.75.以此类推,最终能够得到的标准化值的范围是[0,1].第二步对数据进行聚类分析,传统的K-Means算法由于其初始聚类中心是随机产生的,每次的聚类中心都会有所不同,这样就导致了聚类结果的不稳定,为了使得聚类结果具有较好的稳定性.这里在分析之前给定好中心.根据学生的考试成绩分布情况大致可以分为优秀、良好、中等、不及格4个等级.不同等级根据其概化后的数据分布区间来确定其初始聚类中心.第三步是对最后的聚类结果进行分析.通过聚类分析老师都能够很容易的分析出学生对该考试的题型掌握程度、以及今后在教学方面需要在哪方面下功夫,极大的方便的了日后的教学.

2.2采用关联规则对教师年龄、职称在一级MS-Office考试成绩中的影响进行分析

关联分析方法当前被普遍运用与教学之中,用于寻找数据库中数值的相关性,常用的关联分析技术有关联规则和序列模式.从大量的教学数据中找到有意义的关联关系,可以指导教师的教学工作.在很多高职院校中,关联规则常被应用到学生计算机等级考试、英语四六级考试的过关率的分析上,并以此作为评价教师教学效果的依据.同时将关联规则运用到考试成绩的分析当中,也会挖掘出影响学生过关率的一些相关因素,其挖掘结果对日后的教学过程起着非常重要的指导作用.

2.3采用分类算法对影响一级MS-Office考试成绩的其他因素进行分析

分类顾名思义就是对一个时间或者是一组对象根据他们的特性进行分类.分类模型不仅可以对已有的数据进行分析,也可以对未来进行预测.作为两类主要预测问题的方法:分类和预测,根据它们的不同分别用于离散数据和连续的预测.对于一级MS-Office的影响因素考虑到其数据的特性,将采用分类算法对其影响因素进行分析.分析步骤为:首先,需要先对数据进行采集,主要采集的数据有:学生的基本信息、学生情况的调查(学习兴趣、对之前知识的掌握情况等)等.以上情况可通过对学生进行问卷调查来获取.其次,对获得的数据进行预处理,将获得的数据进行集成,然后对遗漏的数据进行填补,接着对数据进行离散化操作,最后将需要挖掘的数据的规模在不影响最终挖掘结果的基础上进行缩减.第三,对数据进行分类挖掘并生成分类规则.通过以上三个步骤便可分析出其他因素对学生考试成绩的影响了.

3.结束语

本文以高职院校一级MS-Office等级考试成绩分析为例,阐述了数据挖掘技术在一级MS-Office考试成绩中根据不同的方面不同挖掘技术的应用方式.实验结果表明,将数据挖掘技术应用于高职院校成绩分析中的分析方法是使行之有效的,其分析结果不仅能够帮助学生通过考试成绩发现自己对于这门课程掌握的不好的部分,为后面的学习提供一些有针对性的改进,同时也为教师针对不同的学生的特点的教学方式有一个指导作用,也为后面的学生能够顺利通过考试提供帮助.