试卷是题库建设的重要环节

点赞:18308 浏览:82555 近期更新时间:2024-03-10 作者:网友分享原创网站原创

[摘 要]试卷分析对题库建设具有重要意义,根据教育测量理论对《中药学》题库抽组的三份期末试卷的信度、效度、难度和区分度进行分析,为优化题库试题质量提供依据,为教学及评价提供有益信息.

[关 键 词]试卷分析;信度;效度;难度;区分度

[中图分类号]G642.474[文献标识码]A[文章编号]1673-7210(2008)05(a)-100-03

教考分离是教育测量改革的关键,而题库建设是实现教考分离的最直接方式[1].因而,我们在充分调研论证的基础上,提倡标准化题库建设,组织题库知识培训,搭建题库建设交流平台,并根据实际情况分期分批组织建设,奖勤罚懒,奖优罚劣,大力推进了题库建设工作.目前我院所建题库基本涵盖了各专业主干课程,题库已在各种考试中发挥了重要作用.然而,题库建设是一项系统工程,题库试题需要在考试中得到检验,只有通过试卷分析淘汰劣质试题,不断扩充和优化入库题目,题库质量才能真正得以提升.因此,试卷分析是题库建设不可或缺的环节.我们抽取近3年(2005~2007年)连续在同一专业三个年级利用题库进行期末大考的试卷,并对试卷质量进行了分析,希望为题库建设提供一手材料,为教学研究和考试改革反馈有价值的信息.

1对象与方法

1.1研究对象

整群抽取2004、2005、2006级中西医结合临床专业统招本科生《中药学》3年(分别在2005年、2006年、2007年课程结业时)网络考试试卷(A卷、B卷、C卷)1206份,其中,2004级289份,2005级449份,2006级468份试卷进行分析.

1.2研究方法

三份试题均是由中药学科制定组卷策略从题库中随机生成(每份试卷均为77个题目).网络考试结束后,依照学院阅卷规程,客观题由计算机自动判分,主观题按制定的统一评卷标准流水判卷.整理数据,逐题分析,利用SPSS13.0统计软件包对试题的信度、难度、区分度和效度进行分析.

2结果

2.1各年级成绩

见表1.

根据国内外有关资料,结合我院中西医结合临床专业的现状,我们认为较理想的正态分布曲线是其曲线中心(平均分)在75分左右,标准差5~10分.从统计结果看,三次考试总体成绩基本符合这一要求.

2.2各年级成绩分布

见表2.

从表2得出,三份试卷的主要分数段均集中在60~90分,60分以下和90分以上的频数相对较少,近似正态分布.

2.3试卷信度

信度(reliability)是指测量结果的稳定性程度,也称可靠性.是指在相同条件下,对同一客观事物测量若干次,测量结果的相互符合程度或一致程度可说明数据的可靠性.因此,信度是反映考试结果稳定性、可靠性的指标.因学生的期末考试不可能重复进行,我们利用Cronbach′sα系数法考察所有题目间的平均一致性程度(所有题目得分是否具有较高的正相关),求得试卷的同质性信度,见表3.

当考察学生的学习成绩时并不要求题目间有很高的一致性或同质性[2].一般认为,同质性系数大于0.5,即可认为信度较高.统计结果显示,三份试卷可靠性系数均大于0.84,说明三份试卷的信度均好.

2.4试卷难度

试卷难度是指试卷中试题的难易程度.一般用难度系数P来表示.用公式P等于X/W来计算.其中,X是全体考生某试题得分平均值,W是某试题的满分值.三次考试试题的难度系数统计见表4.


由公式可知,P值越大,试题越简单;P值越小,试题越难.一般认为P值为0.3~0.9较为适中,A、B、C卷难度适中试题分别占总试题的75.32%、87.01%和79.22%.但三份试卷均有P<0.3的难题和P≥0.9的容易题,为进一步探讨这部分试题的质量,我们对其区分度进行了研究.

2.5试卷区分度

区分度是用于判定试题能否把学习优秀与较差的学生区别开来的指标.计算的方法是先将学生按总成绩排序,前27%的学生为高分组,后27%的学生为低分组,按下列公式求出区别指数r等于(Hj-Li)/Qj.其中,Hj是高分组第j题平均分;Lj是低分组第j题平均分;Qj是j题的满分值.r值越高,表示试题的区分度越好,r值越接近0,表示试题的区分度越差.一般认为r<0.15表示区分度较差,r≥0.15表示区分度较好.三份试卷区分度统计见表5.

从表5可以看出,三份试卷中,P<0.3的5道试题有2道试题r<0.15,区分度较差,核对原考题发现,这2道题为多选题,均是对理气药中行气止痛功效的考核,属大纲要求掌握内容,但学生掌握较差,说明学生对部分重点内容记忆不扎实,尤其是涉及到同类药物的特点比较时更为突出.建议教师在教学中对此部分内容予以加强.

对于P≥0.9的容易试题统计表明,有14道题目r≥0.15,为合格试题,26道题目r<0.15,甚至有的r=0,P=1,即100%的学生都回答正确.核对原考题发现:1道题目(中药产地与采集)为了解内容,其余25道题目全部为教学大纲要求掌握内容.这一结果说明对于重点问题学生掌握程度高,从一个侧面反映出良好的教学效果.当然,也不排除个别试题内容过于简单,应予以修正.

2.6试卷效度

效度(validity)是指测验实际能测出所要测量特质的程度.它包括内容效度、结构效度和准则效度[3].内容效度主要是指测验题目对所测内容范围的代表性程度.比较试卷考核的内容与教学大纲的一致性发现:三份试卷中各章节所占分数与中西结合临床专业教学大纲计划时数比例基本吻合,内容效度较好.

结构效度主要是用来反映试题是否考虑到教学目标、教育层次等内容,三份试卷题型完全相同,各题所占的分数也相同,统计结果见表6.

A、B、C卷的结构效度相同

从表6可以看出,三份试卷选择题均占50分,考核覆盖面较大,同时有16分的综合运用以保证考核的深度.从认知层次来看,记忆、理解、简单和综合应用的试题分数比大致为5.2∶2∶1.2∶1.6,基本上符合本专业对《中药学》考核的要求.

受考试时间和试题容量的限制,一份试卷不可能覆盖所有教学内容.考试内容只是教学内容的一个很小的抽样,因此,必须使试卷对教学内容和教学目标有较高的代表性.测验试题既能覆盖全部的教学内容,又能反映各部分内容和各认知层次的相对比重.一般来说,设计测试蓝图,即通过精心绘制命题双向细目表(本研究拆分为内容和结构两部分)就能组出高效度(包括内容效度及结构效度)的试卷[4],从而较好地实现这一要求.

准则效度应采用一个参照标准,并用与本次考核结果的相关性来表示.目前,还没有公认的“金标准”可以参照,通常用各类型题的得分与试卷总成绩之间的相关系数来表示,试题的总效度由各类型题效度加权平均求得(以各类型题所占比例为权重)[3],结果见表7.

统计结果表明,A、B、C三份试卷在三次考试中总体效度分别为0.66、0.70和0.75,以C卷效度最好.


3讨论

3.1科学的组卷策略是生成合格试卷的关键

命题策略包括考核知识点、题型、分值和难度系数(设为1~5).三次考试的组卷策略变动如下:①B卷比A卷在一个3分值简答题(综合)难度上降低了1个档次(难度由5变为4),即B卷比A卷难度降低.②C卷比A卷分别在1个1分值的单选题和1分值的判断题上难度提高了1个档次(难度均由1变为2),在1个1分值的填空题上难度降低了1个档次(难度由3变为2),即C卷比A卷难度有所升高.③C卷比B卷在1个1分值的单选题和1分值的判断题上难度均提高了1个档次(难度均由1变为2);在1个3分值的简答(综合)题上难度提高了1个档次(难度由4变为5);仅在1个1分值的填空题上难度降低了1个档次(难度由3变为2),即C卷比B卷难度明显提高.不难看出,B卷、A卷和C卷难度的依次提高,是导致2005级(79.85分)、2004级(78.88分)和2006级(75.75分)学生考试成绩顺次下降的重要原因之一.上已述及,我们认为学生成绩分布的钟型曲线中心应在75分左右,三次考试比较,本次期末考试试卷(C卷)较A、B两卷难度稍大,试卷效度高,学生成绩分布也最为理想.

总之,科学的组卷策略是生成合格试卷的关键,应根据教学大纲和施测对象的变化摸索恰当的组卷策略.

3.2试卷分析是提升题库质量的重要途径

我们从信度、效度、难度和区分度对三份试卷的试题质量进行了较为全面的研究,结果显示,三份试卷测量结果均稳定可靠,试卷效度逐年上升,本次期末考试(2006级)已达0.75.学生成绩随着命题策略调整呈现相应的波动,说明通过命题策略实现了对试卷的灵活调控,反映出《中药学》题库试题总体质量良好.通过对每道试题的难度和难题、易题区分度的分析,也发现题库还存在一些不够完善的地方,例如,部分试题区分度稍差,优质试题数量有待扩充,题型还偏少.只有让题库在考试中得到检验,并根据试卷分析结果对题库试题进行优化、补充和完善,才能切实提升试题库质量,即试卷分析是题库建设不可或缺的环节.

同时,试卷分析对于教学评价部门检查教学效果、教师适时调整教学方案都具有不可低估的作用.

[参考文献]

[1]詹向红,崔瑛,芦锰,等.基于题库建设的计算机网络考试探索[J].中国医药导报,2008,5(12):92.

[2]张敏强.教育测量学[M].北京:人民教育出版社,1998.109.

[3]齐佩金.加强试卷分析完善题库建设[J].东北财经大学学报,2003,30(6):66-68.

[4]于向英.教育测量与统计[M].郑州:郑州大学出版社,2004.55.

(收稿日期:2008-03-10)

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文