摘 要: 本文以统计学中的差异数量――标准分在科学、合理地评价和解释考试分数方面的应用为例,分析和阐述了标准分在考试成绩评价中的作用和意义,旨在为学校教育评价和教学改革提供参考。本文认为用标准分比用原始分数评价学生成绩更科学、更合理和公正,更能客观地反映学生的学习动态,使教师做到有的放矢、因材施教。
关键词: 原始分 标准分 意义 作用 考试成绩评价
一、引言
考试是学校教育的一个极为重要的组成部分,是检查教学质量、评价教师教学水平、检验学生知识掌握及能力结构的主要环节。过去评价学生成绩时,常常使用原始分数,如认为语文得90分的学生语文学得好,而外语得70分的学生则外语能力较低;再有,同一名学生期末数学得80分,语文得65分,于是认为该生是学理科的材料,文科不好。这些认识是不够科学的,因为试题的难易程度是决定学生分数的主要因素,题目难,原始分数就偏低;题目容易,原始分数就偏高,从而导致了原始分数之间的不可比性。试题还受区分度大小的影响,因而造成考试的内容不同质、不等效、不可加。由于考试分数或原始分数没有绝对的零点,也没有统一的单位,因而不能将一个学生前后多次考试的成绩进行比较,不能对不同科目的成绩进行比较,难以判断学生成绩的变化趋势。因此,原始分数得到的信息不够准确,不科学,用原始分来评价学生的成绩缺失公正性和合理性。采用标准分数对考试成绩进行分析,就可以克服以上缺点,因此,用标准分比用原始分数评价学生成绩更科学、更合理和公正。
二、标准分的定义及计算方法
标准分是由均数和标准差规定的相对地位量。它是统计学中最重要、用途最广的统计量,标准分的定义为:以标准差为单位标定某一分数离开团体均数的距离。公式为:
z==
式中X为某一原始分数,为N个原始分数的平均数,x-是离均差,即某一分数离开均数的差数,S为标准差,Z即为标准分数,因此标准分数常称为Z分数。Z分数有正值和负值。当Z为正数时,则X>;当Z为负数时,则X<;当Z=0时,则X=。Z分数的绝对值|Z|,表示某分数与在此分布上的平均数的距离,|Z|越大,表示某分数离开均数的位置越远。计算机(利用Excel表)可以方便地将原始分转换成标准分。
三、标准分的意义
标准分是一种具有相等单位的量数。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。其意义在于:
1.标准分的分布与原始数据的分布相同。
2.各科标准分的单位是绝对等价的。无论各科的平均分、标准差怎样不同,一经转换成标准分,就形成以平均数为0、标准差为1的统一的、固定不变的标准形式。
3.标准分数值的大小、正负,反映某一考分在全体中所处的位置,它是相对分数。
4.当总体均服从同一分布时,总体的标准分之间具有可比性。
5.用标准分表示的样本间可以进行算术运算。
因此,标准分在考试成绩评价中具有重要作用。
四、标准分的作用
标准分在考试成绩评估中的用途很多,一是能够明确各个分数在总体中的位置;二是能客观地比较不同学生不同学科的总成绩及其优劣;三是可以比较某学生不同学科、与阶段的考试成绩,正确评价其学习的发展。
(一)能明确各个分数在总体中的位置。
标准分是按正态分布原理而建立的分数制度,其主要特点是:分数不但可以反映考生的水平高低,而且可以直接反映出该分数在全体考生中的位置。
依据Z标准分数的意义,Z分数为0的原始成绩是全班的平均分。Z分数大于0的原始成绩高于全班的平均分;Z分数小于0的原始成绩则低于全班的平均分。也就是说,标准分数值的大小、正负,反映某一考分在全体中所处的位置。以表1为例。
表1是某高校10级商英2班第一学期外语三科期末考试的成绩统计。表1中学生01的泛读得分为34,其泛读标准分为-1.690,这表明学生01所得的泛读分数低于全体考生平均数1.690个标准差,在总体的位置靠后;学生02的泛读得分为65,泛读标准分为0.158,这表明学生02的泛读分数高于全体考生平均数0.158个标准差,在总体的位置则靠前。
再如,学生32的精读和泛读的原始分数都是73分,这个分数是高还是低?该学生在全体考生中的位置靠前还是靠后?单从原始分数看不出来,因为没有一个稳定的参照点。若把原始分数转换成标准分后,该学生在全体考生中的位置则一目了然:该生精读原始分数为73分,标准分为1.211,高于全体考生平均数,原始分数73分应算较高的成绩了;而泛读的标准分为0.635,接近全体考生平均数,原始分数73分则只算中等成绩,由此可见,原始分数很难准确说明分数所反映的考生实际水平,也不能确定分数在群体中的位置。而标准分则可以直接反映出该分数在全体考生中的位置。|Z|越大,表示某分数离开均数的位置越远。
(二)能客观地比较不同学生不同学科的总成绩及其优劣。
从表1可以看到,若按原始分累计总分,学生09、学生10和学生22的总分都是140,三者学习成绩处于并列的位置,没有优劣或高低之分;但将原始分数转换成标准分数后,以Z值的总和相比较,学生09的Z总为-1.013,学生10的为-1.189,学生22的为-0.777,则可以看出学生22的成绩要比学生09的高,而学生09的成绩又比学生10的要高。从“Z总”这一栏,我们可以明确地看到学生22、学生09和学生10在班级成绩中的排名分别为第26、第29和第31。三者原始总分相等,没法比较,但按标准分来分析,他们这几科的总成绩却有高低之分。
从表1还可以看到,学生07的总分为189,学生28的总分为195,以三科的总分来判定成绩的优劣,学生28排第8名,学生07则排第12名。表面上学生28的成绩似乎要比学生07的成绩好。但是,按原始总分计算只考虑了分值,并没有考虑各分值在各自总体(即各自科目的分数总体)中的价值,这种考虑是欠妥的。分数的价值应用最佳地位量标准分数来表示。那么将学生07和学生28的三科考分都换成Z值(见表1),以Z值的总和相比较,Z为1.748,而Z为1.433,则可看出学生07的分数价值要比学生28的高。学生07的成绩优于学生28,两者的排名恰与原始分数的排名截然相反。若要推荐优秀生,推荐学生07更为合理。其道理从学生08的泛读为84分,其Z值为1.291,与学生30的听力为84分,其Z值为1.775的比较分析可以显示出来。从原始分数看,同是84分,但由于分别位于不同科目的不同分布中,其价值是不同的。受试题难度和区分度大小的影响,导致了泛读的“1分”与听力的“1分”不等值,便造成了这样的现象:同样是84分的两科成绩却反映出两种高低不同的水平。
上述例子表明,使用原始分数难以对学生的水平进行科学的比较。将原始分数相加得到总分的方法,就好比将100元人民币加上100元港币再加上100元美元得到300元一样,是不能反映三种货币在总额中的真实价值的。由此可见,原始分数不具有简单的可加性,几门原始成绩的总分并不能说明个体在团体中的实际排名,不能确切评价学生成绩的优劣,甚至会产生与学生实际水平截然不同的结果。而标准分是以群体的平均分为参照、以标准差为度量单位的一种分数,是在消除考试难度、考生不确定因素产生的抽样误差影响,将考试成绩(分数制)通过某种变换而得到的具有明确区分、比较特性的考试成绩。所以标准分能够直接比较不同学生不同学科的总成绩,能够客观、公正地反映各个学生的成绩在群体成绩中的实际地位或实际排名。
本文为全文原貌 未安装PDF浏览器用户请先***安装 原版全文
(三)可比较某学生不同学科与阶段的成绩,正确评价其学习的发展。
我以某高校某学生第一学年(两个学期)大学语文与大学英语成绩为例来说明这个问题,见表2。
按表2中的原始分数评价,有人认为该生的语文成绩有进步,而英语学习有退步。而若将该生的成绩标准化后,不难发现,该生的语文成绩在班上的相对位置没有变化,而英语成绩第二学期虽比第一学期低7分,但标准分数提高了,说明该生在班上的相对成绩有所提高。同样,若仅看该生的第二学期成绩:语文86分,英语80分,不少人会认为该生的语文比英语学得好。但我们从表2中可知,该生的语文成绩高于平均成绩0.96个标准差,英语成绩高出平均成绩1.16个标准差,英语成绩比语文成绩在班上的相对位置高,因而相对来说该生的英语学得较好。所以只凭借原始分数盲目评价学生是不恰当的。如果教师采用标准分数,就可以掌握每个学生学习某科成绩发展趋势,了解学生知识的掌握程度。
五、结语
无论用原始分数比较单科成绩还是比较总成绩都是不科学的,因为各原始分数分别位于不同科目的不同分布中,价值不同,没有同一的测量尺度,因而不可加与不可比。标准分是采取统计学的计算方法计算出的一种数据,利用这种计算方法可以避免多次考试因试题量不同及试题难度不同而造成的前面提到的对学生的学习情况评价不确切的情况发生,使课程之间、学生之间、班级之间、年级之间和学校之间具有可比性,可对同一考试各科进行横向比较,也可对同一学科不同时期的考试纵向比较,找到个体在总体内的位置,从而对全校教学情况一目了然,教学管理也可以做到心中有数。
当前,仍有相当一部分教师用原始分数作为考试成绩评价的依据,尚未认识到原始分数的局限性。因而,我认为对标准分数的认同需要宣传,让教师更了解标准分的意义和作用,尽快地接受标准分,并运用标准分更好、更科学和更合理地评价学生的考试成绩,客观地了解学生的学习动态,做到有的放矢、因材施教。
参考文献:
[1]罗玉莲等.标准分及其应用[J].吉安师专学报,1998,VOL19,(5).
[2]刘晓莉.标准分与考试成绩评估[J].佛山科学技术学院学报(自然科学版),1999,VOL17,(4).
[3]廖平胜等.考试学[M].武汉:华中师范大学出版社,1988.
[4]张玉田等.学校教育评价[M].北京:中央民族大学出版社,1998.
[5]将庆伟等.教育科研中的量化方法[M].北京:中国科学技术出版社,1997.
[6]唐小杰等.课堂教学与学习成绩评价[M].南宁:广西教育出版社,2000.
注:“本文中所涉及到的***表、公式、注解等请以PDF格式阅读”
本文为全文原貌 未安装PDF浏览器用户请先***安装 原版全文
转载请注明出处学文网 » 浅析标准分在考试成绩评价中的作用