- 相關(guān)推薦
淺談考試成績的差異顯著性分析
淺談考試成績的差異顯著性分析
【摘 要】本文嘗試運用數(shù)理統(tǒng)計學(xué)中的顯著性檢驗的基本思想和常用的excel軟件簡單介紹了考試成績中班級之間、校際之間的平均分、優(yōu)秀率、及格率的差異顯著性檢驗,即U檢驗的計算方法與主要步驟;以及教改結(jié)題報告的成績分析涉及各種檢驗方法——T檢驗、Z檢驗的區(qū)別及計算方法、主要步驟。簡單而言,本文是用統(tǒng)計學(xué)中的檢驗方法科學(xué)地分析什么情況下兩個平均分、優(yōu)秀率、及格率“差別不大”,“差別明顯”,“差很多”,希望能更加科學(xué)客觀地分析兩個均值間的差異,對有需要的老師有所幫助。
【關(guān)鍵詞】成績差異;U檢驗;T檢驗;excel軟件
一、引言
在每次考試成績統(tǒng)計中,平均分、及格率、優(yōu)秀率依然是一個班級教學(xué)的主要考核指標,但由于這樣或那樣的原因,可能會有些學(xué)生缺考。特別是近年我市實行了中職技校春季招生政策,某些學(xué)校分流人數(shù)也許過半。如何才能科學(xué)地公平地進行統(tǒng)計分析,也是許多從事成績分析與管理的老師面臨的難題。
另外,在教改結(jié)題報告或階段性小結(jié)中,總要會對教改效果進行分析,也就難免對對比班與實驗班的考試成績中平均分、及格率、優(yōu)秀率等數(shù)據(jù)作顯著性檢驗,來比較教改的效果是否明顯或不明顯?戳瞬簧俳Y(jié)題報告,其中涉及到的檢驗方法如U檢驗,Z檢驗,T檢驗等等,不一而足,讓人摸不著頭腦。即便是數(shù)學(xué)教師,由于在大學(xué)就讀時的教學(xué)內(nèi)容側(cè)重點有所不同,或許對數(shù)理統(tǒng)計方面知識掌握不強,也很難明白這些檢驗方法孰是孰非,孰優(yōu)孰劣,更別說非專業(yè)其它科目的教師。在作成績對比分析時,通常無從下手,或是委托統(tǒng)計能力強的老師幫忙,或是隨意給些似是而非的數(shù)據(jù),抑或羅列考試成績,直接對比,不作任何檢驗,也就缺乏科學(xué)嚴謹性。
二、班、級考試成績差異顯著性分析
有些學(xué)校以班和年級考試人數(shù)與注冊人數(shù)比值作為相對系數(shù)對實考的分數(shù)進行了調(diào)整,其大致算法是:年級在冊人數(shù)為N,缺考R人,某班在冊人數(shù)為n,缺考r人,則相對系數(shù)為[(n-r)/n]/[(N-R)/N],用此系數(shù)乘以該班實際考試成績,即為相對成績,然后再以各班的相對成績進行對比。這或許是一種方法,但這種調(diào)整,會對實考的成績進行了放大或縮小,個人認為沒有多少益處。事實上,一個班級本身或許也有人缺考,只不過沒別班那么多,但平均分調(diào)整后可能偏離很多。
例1:一所學(xué)校九年級4個班,每個班注冊人數(shù)均為50,在一次考試中,某班平均分60,缺考20人,全級缺考100人,按上述方法折算該班平均分。解: =60*[(50-20)/50]/[(200-100)/200]=72,這是不科學(xué)的,也沒有什么意義。
1、樣本均值與總體均值差異顯著性檢驗(U檢驗)
要檢查班級之間成績是否相差太大,目的并不是要排出名次,可以采用U檢驗(有些文章也稱Z檢驗,在ecxel軟件中,相應(yīng)的變量也是Z。為避免與下文混淆,只有總體方差未知,本文方用Z檢驗,且二者計算不同,故此不用此名稱)。U檢驗的條件是:已知(或可以求出)樣本均值、樣本容量與總體均值、總體的標準差,可能采用U檢驗進行兩均值異顯著性檢驗。
統(tǒng)計學(xué)認為,不論x變量(考試分數(shù))是連續(xù)型還是離散型,也無論x服從何種分布,一般只要樣本容量(考試人數(shù))n>20,就可認為平均值 的分布是正態(tài)的, ,則 ,服從標準正態(tài)分布,這就是進行U檢驗的理論依據(jù)。U檢驗主要步驟如下:
第一步,建立虛無假設(shè),即先認為兩者沒有差異,用 表示
第二步,計算u統(tǒng)計量
U檢驗的統(tǒng)計量為 ,其中,
。╝) = ( 為該班每一個學(xué)生的分數(shù))是要檢驗班的平均分,excel軟件的公式為:=AVERAGE(該班的成績區(qū)域);
。╞) = ( 為年級每一個學(xué)生的分數(shù))是年級平均分,excel軟件的公式為:=AVERAGE(年級的成績區(qū)域);
。╟) 為標準誤, 年級標準差,計算公式是 = excel軟件的公式為:=STDEV(年級的成績區(qū)域);
。╠)n為該班人數(shù),excel軟件的公式為:=COUNT(該班的成績區(qū)域)。以上的數(shù)據(jù)均由學(xué)生考試成績表統(tǒng)計得到。
從u統(tǒng)計量式子中我們看到,在兩個平均分的差值進行標準化過程中,u值要受到年級標準差σ該班人數(shù)n影響。一般而言,就一次考試中n相對穩(wěn)定,經(jīng)開方后值更小,影響不大;而u值與σ成反比,換句話說,年級中各人成績離散程度越大,兩個平均分差值的差異就越不顯著。
第三步,設(shè)定顯著水平ɑ,查表或計算接受域
檢驗前必須設(shè)定顯著水平ɑ,這是一個小概率數(shù)值,經(jīng)常會選擇ɑ=0.05,此時置信度1-ɑ=0.95,也即檢驗的結(jié)果有95%可靠性,有5%的不可靠,這個誤差可能是由于偶然性造成的。在許多研究領(lǐng)域,0.05通常被認為是可接受錯誤的邊界水平。如果有必要,也可選擇ɑ=0.01,0.02等,使檢驗結(jié)果準確。由于標準正態(tài)分布圖像是關(guān)于縱軸兩邊對稱的,0.95對應(yīng)的置信區(qū)間占據(jù)中間部分,而兩側(cè)共占0.05,一側(cè)則占0.025,所以在計算或查表時,應(yīng)以1-ɑ/2作為參數(shù)進行。如顯著性水平ɑ=0.05,則查表或計算的是1-0.05/2=0.975對應(yīng)的置信區(qū)間,excel軟件的計算公式為:=NORMSINV(0.975),回車后得1.959963985,一般取近似數(shù)1.96。由于圖像對稱性,確定的置信區(qū)間為(-1.96,1.96),以這個區(qū)間為接受域。若令ɑ=0.01,則接受域(-2.578,2.578)。
第四步,觀察統(tǒng)計量u值是否落在接受區(qū)域 ,由此對樣本均值與總體均值作出顯著性差異判斷。如果u統(tǒng)計量在置信區(qū)間 (-1.96,1.96)內(nèi),接受H0,差異不顯著,否則拒絕H0,差異顯著;如果u統(tǒng)計量不在置信區(qū)間 (-2.578,2.578)內(nèi),則差異非常顯著。
例2.甲班某次參加考試36人,平均分66,年級平均分60,標準差為20分,檢驗甲班平均分與年級平均分是否有顯著性差異。 解:把相關(guān)數(shù)據(jù)代入 ,所以無顯著性差異。有些人認為相差5分就差很多,看來也是不科學(xué)的。
2、標準分的計算
由于標準分是綜合個體與總體分數(shù)排位等因素計算而來,因此標準分本身是經(jīng)過差異分析得到的數(shù)值。值得一提的是,在計算高考或中考標準分中,excel的NORMSINV函數(shù)作用非常大,不用查標準正態(tài)分布表,而且數(shù)值十分精確。換算公式T=100Z+500,其中Z=NORMSINV(Pi), Pi為某名次以下的人數(shù)占考生總數(shù)的百分比,相當于1-ɑ/2。例如10000人考試,則第1名的標準分為T=100Z+500= 100*NORMSINV(9999/ 10000)+500 872。
3、班、級的及格率、優(yōu)秀率的檢驗
在成績分析時,及格率、優(yōu)秀率也可以像平均分一那樣進行顯著性差異檢驗,那么這兩項該如何進行呢?難點在于標準差怎么求。
其實,從公式看:平均分、及格率、優(yōu)秀率三個數(shù)據(jù)的分母均為考試人數(shù),三者均為平均值。平均分是每個人的分數(shù)之和/考試人數(shù),由于每個人都會有一個分數(shù),直接相加可得。那么及格率呢?表面看是及格率=及格人數(shù)/考試人數(shù),在計算時,其實將每個人分數(shù)稍作處理:將達到及格的分數(shù)改為1,沒達到的改為0,excel軟件中可用公式=if(Ai>=60,1,0)及填充柄下拉簡單得到,Ai為每個原始分數(shù)所在單元格,然后對轉(zhuǎn)換后的數(shù)據(jù)求平均值(即及格率)與標準差了。然后把班、級的及格率代入u統(tǒng)計量式子中計算u值。優(yōu)秀率也用相方法處理即可。
例2.乙班某次考試成績?nèi)缦拢?/p>
87 64 71 81 75 72 87 46 54 61 50 42 65 50 79
72 43 68 64 64 60 48 87 48 52 56 54 50 48 62
92 70 82 53 82 73 75 72 68 70
求此次考試的及格率及對應(yīng)的標準差。
解:按及格分數(shù)為1,不及格分數(shù)為0轉(zhuǎn)換后為:
1 1 1 1 1 1 1 0 0 1 0 0 1 0 1
1 0 1 1 1 0 0 1 0 0 0 0 0 0 1
1 1 1 0 1 1 1 1 1 1
可以求出這組數(shù)據(jù)的平均值即及格率為=26/40=65%,標準差為S= =0.483。
年級的優(yōu)秀率與及對應(yīng)的標準差也如法炮制,再進一步如平均分一樣代入u統(tǒng)計量式子中計算就可以進行分析檢驗。需要指出的是,有些資料計算方法并非如此,這可能是轉(zhuǎn)換后的結(jié)果只有0、1兩個,不少人會認為這組數(shù)據(jù)服從兩點分布或二項分布,所以按兩點分布求方差S2=p(1-p),在這里p可以是及格率或優(yōu)秀率,像上例S= =0.4770,出入比較大,很明顯這并不是兩點分布。我認為每個人及格記1分,不及格記0分,班級的“平均數(shù)”就是及格率或優(yōu)秀率,這樣理解更自然,按上例方法求標準差及進行檢驗可能更科學(xué)。
4、U檢驗運用條件
在已知樣本均值、樣本容量及總體的均值及總體的標準差,在每次考試中,這幾個數(shù)據(jù)還是比較容易得到的,u統(tǒng)計量服從標準正態(tài)分布,即可以進行U檢驗。U檢驗涉及的計算較為簡單,把以上四個參數(shù)代入公式即得u統(tǒng)計量(如果u值為負則取絕對值),然后與臨界值比較,一般以1.96或2.578為臨界值,不再另外查表或計算,就可以分析樣本均值與總體均值是否具有顯著性差異,所以U檢驗在諸多領(lǐng)域運用廣泛。
三、教改結(jié)題報告中的成績分析(T檢驗,Z檢驗)
一般而言,教改成績就是實驗班與對比班兩個班的成績比較,能否僅憑這兩個班的平均分、優(yōu)秀率、及格率的差值,立即得出教學(xué)效果是否明顯呢?統(tǒng)計學(xué)認為,這樣得出的結(jié)論是不可靠的,因為一個班的平均分具有統(tǒng)計意義,存在抽樣誤差,此數(shù)據(jù)是在一定范圍內(nèi)波動的,故而我們需要進行顯著性差異檢驗。由于一個班多則也就50多人,少則也有20多人;所以每個班都可以看成一個樣本,兩個班就可看成從兩個總體中抽取出來的雙樣本,一個總體是實施了教改的,一個是沒有實施教改的。當然,這兩個總體在這種情形下更多是虛擬的,它們具體的'一些數(shù)據(jù)(平均分,方差等)我們是無從知曉的,也就沒有辦法直接研究,只能通過研究樣本(即實驗班及對比班成績),由樣本的數(shù)據(jù)對總體進行估計,并進行差異顯著性檢驗,才能作出判斷。
1、Z檢驗與T檢驗的區(qū)別
不少文章對Z檢驗還是T檢驗這兩種方法作出了說明,兩個總體均值的差異顯著性檢驗中,在不知總體方差及均值情況下且統(tǒng)計量服從t分布,可以使用Z檢驗或T檢驗。如果樣本容量n大于30,用Z檢驗,如果樣本容量n小于30,則用t檢驗,在這里樣本容量n即為該班人數(shù)。很明顯,正如前文所說,一個班的人數(shù)一般都在30人之上,可以用Z檢驗。但假如一個班30人以下,另一班30人以上那怎么辦?其實在計算機廣泛應(yīng)用計算的今天,不管樣本容量n是多少,哪種檢驗都是可以使用的,且各種檢驗的基本原理是相同的。下面,不妨先了解這兩種檢驗方法的統(tǒng)計量。
首先,不論哪種檢驗都要用到以下數(shù)據(jù):
(a)兩個班的平均分: ;
。╞)兩個班的考試人數(shù): ;
。╟)兩個班的成績的方差 ,應(yīng)用excel軟件的公式為=var(該班的成績區(qū)域),數(shù)量上,方差=標準差的平方。
t檢驗或z檢驗的主要步驟:
第一步,建立虛無假設(shè),即先認為兩者沒有差異,用 表示
第二步:計算Z檢驗或T檢驗統(tǒng)計量
z= ①,t= ②(大分母部分稱為標準誤)。式子中, 是兩個班的平均分, , 是兩個班分數(shù)的方差, 是兩個班考試人數(shù)。從函數(shù)單調(diào)性而言,不論z或t,與u值類似,當兩班的方差增大時,其值減小,即兩班均分所代表的兩總體的均值的差值差異性也到受成績離散程度影響。
另外,從式子結(jié)構(gòu)看,t統(tǒng)計量要復(fù)雜很多,這在計算工具落后的過去,這個計算當然是很繁瑣的。想當初,手中可能連計算器都沒有,開個方都可能需要手算。據(jù)說數(shù)學(xué)家陳景潤證明“1+2”時所用的草稿紙真的達到汗牛充棟地步,可堆滿房子,如果換了今天,估計他的稿紙也許高不盈尺。所以我們可以認為,Z檢驗其實只是T檢驗的粗略計算而已,二者其實都可使用,只是t值過程稍復(fù)雜,但應(yīng)更精確。 第三步 查表或計算臨界值
在不知總體方差情形下,兩個平均值差服從t分布,查表或計算t臨界值要有兩個參數(shù),顯著水平ɑ,及自由度df。如果考查一個班,d ,如果進行兩個班對比,自由度d 。計算臨界值 ,excel軟件中公式為:=TINV(ɑ,df),若令ɑ=0.05,自由度從30至120,臨界值 都約為2,詳見下表:
自由度df 30 40 50 60 70 80 90 100 110 120
臨界值t0 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 1.982 1.980
而兩個班的人數(shù)基本上也在這個幅度內(nèi),像U檢驗一樣,根據(jù)原始數(shù)據(jù)算出的t值與臨界值 進行比較,為了簡化運算, 可以取近似數(shù)2。
同樣,在差異顯著情形下,非要區(qū)別出相差很多,以令ɑ=0.01,自由度30至120主要的臨界值 如下:
自由度df 30 40 50 60 70 80 90 100 110 120
臨界值t0 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 2.621 2.617
第四步 比較t值或z值與 ,作出統(tǒng)計推斷
與u檢驗類似,比較計算出來的t值或z值與臨界值 ,如果|t|< =2或|z| < =2,則認為要檢驗的兩個樣本均值差異不明顯,否則差異顯著。
在報告中,不妨將各次考試成績計算出來的t值用表格與圖表形式展示出來,這樣使數(shù)據(jù)條理更加清晰,也會使得內(nèi)容更豐富,生動。
例3.某次考試原始成績(滿分100)如下:
實驗班30人:
90 54 56 84 78 84 78 78 82 50 82 76 80 56 80
80 76 78 68 70 60 64 68 50 70 72 47 68 74 72
對比班40人:
70 72 72 54 66 64 90 68 50 62 60 54 50 95 56
52 60 50 52 50 60 62 87 48 52 56 54 50 48 48
66 62 70 70 82 60 64 64 62 58
經(jīng)計算得,實驗班平均分 ,方差 =132.3,對比班平均分 ,方差 =135.2;分別代入Z統(tǒng)計量及T統(tǒng)計量式子中得
z= = =3.255,
t=
= =3.25,二者差別不大,均大于臨界值 =2,所以可以認為教改驗效果明顯。
2、及格率、優(yōu)秀率的檢驗
很多教改老師在成績分析時,主要是對實驗班及對比班的平均分進行顯著性差異檢驗,而及格率或優(yōu)秀率的檢驗則很少人涉及,這或許不夠全面。與U檢驗一樣,對分數(shù)稍作轉(zhuǎn)換,然后對處理后的兩組數(shù)據(jù)像平均分顯著性檢驗方法一樣進行計算。
例3.如上述例子,作及格率差異顯著性分析,及格的分數(shù)改為1,不及格的改為0,則兩個班的分數(shù)表為:
實驗班30人:
1 0 0 1 1 1 1 1 1 0 1 1 1 0 1
1 1 1 1 1 1 1 1 0 1 1 0 1 1 1
對比班40人:
1 1 1 0 1 1 1 1 0 1 1 0 0 1 0
0 1 0 0 0 1 1 1 0 0 0 0 0 0 0
1 1 1 1 1 1 1 1 1 0
算得實驗班及格率: =80%,方差 0.251;對比班及格率: =57.5%,方差 0.166,代入式子
=2.01>2,同樣及格率的檢驗差異顯著性是明顯的。同樣方法也可以對優(yōu)秀率進行檢驗。由于可以在excel表直接列表中用填充柄,計算極方便,此處不再贅言。
3、前后兩階段成績自身對比分析
如果說,實驗班與非實驗班的成績對比是橫比的話,那么自身兩次成績的對比則是縱比。教改實驗從開始接手到結(jié)束是一個過程,加上一個班學(xué)生的成績也是一個動態(tài)變化,反映在教改期間的每一次在考試成績,所以很有必要進行前后兩階段成績自身對比分析。
其檢驗方法是:對每一名學(xué)生兩次成績求差, ,然后以所有的差作為樣本數(shù)據(jù)進行分析。
統(tǒng)計量為 ,其中 為這組數(shù)據(jù)的標準差。
例4.如例1中實驗班成績?yōu)椋?/p>
90 54 56 84 78 84 78 78 82 50
82 76 80 56 80 80 76 78 68 70
60 64 68 50 70 72 47 68 74 72
而前一次考試成績?yōu)椋?/p>
87 52 55 83 84 81 71 76 81 54
80 76 80 54 78 77 74 72 65 74
62 63 68 44 71 68 45 66 73 75
對應(yīng)位置的兩個數(shù)據(jù)為同一名學(xué)生兩次成績,對這兩次成績平均分的進行差異顯著性檢驗。
解:兩組對應(yīng)位置的數(shù)據(jù)求差得:
3 2 1 1 -6 3 7 2 1 -4
2 0 0 2 2 3 2 6 3 -4
-2 1 0 6 -1 4 2 2 1 -3
計算得, =1.2 =2.93 df=30-1=29,計算 =2.045, 差異性顯著,所以可以作出結(jié)論:教改效果明顯。
同樣,與平均分、及格率,優(yōu)秀率一樣,通過對動態(tài)的差值計算的t值也可以通過表格與圖表表示出來,說明教改中實驗班與對比班成績差異是否顯著,教學(xué)效果是否明顯。
綜上所述,在教改成績分析中,不但要檢驗實驗班與對比班的平均分差異顯著性,還可以對兩班及格率、優(yōu)秀率差值進行檢驗,甚至對同一個班前后幾次成績進行檢驗,這樣方能更科學(xué)地分析教改成效。
四、差異顯著性分析的意義
不管是U檢驗還是T檢驗或其它檢驗,其計算方法都是兩個均值的差除以標準誤,然后與臨界值比較,U檢驗的臨界值 ,T檢驗的臨界值在ɑ=0.05,自由度30至100時 ,然后作出差異顯著性判斷。超過甚至遠遠超過這個臨界點是我們每一位教師所追求的目標。但是現(xiàn)實中,大多教師是達不到這個目標的,原因有很多,因篇幅關(guān)系此處不作分析,我想既然是教學(xué)改革是實驗,當然就會存在失敗,這是客觀現(xiàn)象。我們應(yīng)該更在乎過程,所以在成績分析時,也就沒有必要更改原始分數(shù),非要達到“效果顯著”。
以上筆者試圖用統(tǒng)計知識,簡單介紹了考試成績中班級之間乃至校際之間的平均分、優(yōu)秀率、及格率與的差異顯著性檢驗,以及教改結(jié)題報告的成績分析涉及各種檢驗方法,以期能對有需要的老師有所幫助,只是限于本人水平匱乏,文中必有許多不足之處,敬請各位給予指正為謝。
參考文獻:
[1] 佚名《Excel常用函數(shù)大全》
[2] 邢航《獨立樣本均數(shù)差異的顯著性檢驗及應(yīng)用》 《中國集體經(jīng)濟》 2008年第6期
[3] 鄭巧玲 何以平 《醫(yī)學(xué)論文中t檢驗誤用分析》 《中國科技期刊研究》2004年01期
[4] 《平均數(shù)差異顯著性檢驗統(tǒng)計檢驗力和效果大小的估計原理與方法》
[淺談考試成績的差異顯著性分析]
【淺談考試成績的差異顯著性分析】相關(guān)文章:
考試成績分析與反思09-03
初二考試成績分析(精選15篇)09-21
淺談制造業(yè)物流能力研究現(xiàn)狀分析及展望07-15
面膜與晚霜的根本差異08-11
中西飲酒文化的差異05-24
價格差異更能刺激購買09-07
代際差異引發(fā)管理變革06-21
感恩節(jié)的地域差異06-15