化學教學測量和評價相關知識

來源:文萃谷 2.64W

二 信度

化學教學測量和評價相關知識

信度(reliability)是指測驗結果的一致性或穩定性。信度指標通常用相關係數表示。信度是測驗的一致性的估計,效度是對測驗的準確性程度的估計。應當説,測驗的效度是最重要的,而測驗的信度對於效度來説是必不可少的,效度的高低受信度的制約。所編制的測驗若信度越小,則其效度也就越低。

常用的估量信度的方法有3種,可相應地求得3種信度:再測信度、複本信度和分半信度。

信度係數最大等於1,表示測驗完全反映了受試者的穩定水平;最小等於零,表示受試者的得分完全是隨機性的,與他們的知識水平無關。一般學業成績測驗要求信度係數在0.9左右,常會達到0.95。

提高測驗信度的主要辦法是:

(1)測驗試題的覆蓋面要寬;

(2)測驗的方法和時間必須嚴格統一,測驗的評定和記分的標準必須客觀、統一;

(3)測驗試題的難度要適當,指導語要明確、清晰;

(4)消除受試者的緊張心理,增強他們對測試環境的適應性,使他們發揮應有水平。

三 難度

難度(difficulty)指測試項目的難易程度,是測試工具對受試者知識與能力水平適合程度的指標。

在能力或非能力測驗裏,難度的指標是答對或通過每個項目的人數百分率(P值),即:

P代表項目的難度;

R為答對或通過某一項目的人數;

N為全體受試者人數;

P值越大,測驗項目的難度越低;P值越小,難度越高。

測驗試題的難度必須適當,一般以難度為0.3—0.8為宜。只有難度適當,方能保證測驗試題具有較高的區分度。若難度過大,全體受試者都不能回答。難度過小,又形成全體受試者都能回答,兩者都會降低測驗的區分度,從而影響測驗的效度和信度。

四 區分度

區分度(discrimination)是表示測驗項目對受試者水平的鑑別能力的指標,故也稱為鑑別力。區分度常從3種測驗中體現出來:一是難度測驗,這是最常用的一種測驗;二是速度測驗;三是廣度測驗。通常學業成績測驗,多含有這三種測驗的性質。測驗項目的區分度高,對受試者有較好的鑑別力,使程度高的學生得高分,程度低的學生得低分;區分度低的測驗則不能有效地將程度不等的受試者區別開來。

區分度可以用相關係數計算,或採用簡單的計算方法①。區分度值最高為1,表示測驗項目對受試者的能力水平有完全的鑑別力;最低值為零,表示測驗項目與受試者的能力水平無關。測試後,應淘汰區分度低的測驗試題。標準化測驗優秀試題的區分度常在0.40以上,區分度在0.29以下的試題則予淘汰,或經過改進後,再進行測試。

總之,良好的測驗除應具備測量的正確性和測量的可靠性這些基本特徵外,還應當具有:客觀性、易於管理、易於記分和易於理解、實施,測驗分數易於解釋等特點。

第五節 化學測驗試題的類型和試卷的編制

一 化學測驗試題的類型

測驗試題的類型是為測驗目標服務,並受所測驗的內容制約的。

英國專家曾把測驗試題劃分為七種類型①:

(1)正誤型。讓學生判斷正確與錯誤,並用劃(+)、(-)號作答。

(2)重現型。讓學生借回憶解答某些關於事實和化學原理的問題。

(3)填充型。讓學生根據題意填寫空白。

(4)匹配型。讓學生在給定的兩列物質的名稱、定義、類別或性質項中,劃出配伍的連線。

(5)選優型。讓學生從給出的多項答案選項中,選出正確答案項;試題選項設計成序列答案的形式,讓學生判斷寫出或劃出正確答案項的序號。

(6)思辨型。讓學生從幾種“答案”中,選出最佳答案,勾銷錯誤答案。

(7)變動型。讓學生運用已學過的知識和技能,解釋圖表或圖示,綜合概括有關數據得出結論。

我國高等學校入學考試,經過多年實踐,逐漸形成了具有特色的多種化學測驗試題,主要類型是:

(1)是非題。讓考生判斷答案的正誤,在規定的空格內劃出正、誤記號。

(2)填空題。將題幹中的關鍵字詞以空格的形式出現,讓考 生填充。

(3)選擇題。試題的題幹由直接問號或不完全陳述句構成,選項包括1個(或2個)正確答案以及3個(或4個)錯誤答案,隨機排列各選項的順序,讓考生選出正確答案。

(4)改錯題。讓考生指出題目中的錯誤,並寫出正確答案。

(5)問答題。讓考生按題目要求答問,是填空題的變動型。

(6)鑑別(或鑑定)題。結合給定的實驗事實或反應現象,讓考生區分或確認某些物質。

(7)計算題。結合化學概念或原理,讓考生解化學計算題。

(8)論證題。讓考生運用化學原理推論、證實指定的問題。

(9)實驗辨別題。讓考生通過給出的化學實驗現象或實驗的結論,來回答有關實驗裝置、操作及異常現象方面的問題。

(10)信息給予題。讓考生臨場閲讀給出的信息,綜合、判斷作出答案。

化學測驗試題,還可以從不同的角度進行劃分。例如,英國學者西姆遜(son)將多種選擇題區分為:(1)選擇題;(2)分類題;(3)多種組合題;(4)診斷和推理題;(5)實驗題①。我國學者將化學選擇題劃分為14種②,計有:(1)評價選擇題;(2)配伍選擇題;(3)比較選擇題;(4)多解選擇題;(5)組合選擇題;(6)因果選擇題;(7)填空選擇題;(8)類推選擇題;(9)分類選擇題;(10)改錯選擇題;(11)排列選擇題;(12)閲讀選擇題;(13)識圖選擇題;(14)相關選擇題。這是因為,選擇題(多項選一或多項選二)已成為各種客觀性測驗中被廣泛採用的一種題型,對這類測驗試題從多維度進行研究,自然是很必要的。《美國百科全書》中“教育”條目曾將多種選擇答案的測驗題概括為6種③:(1)多答案測驗題;(2)選擇錯誤答案的測驗題;(3)合併或否定前面給出的答案的測驗題;(4)評價測驗題;(5)答案配對測驗題;(6)分類測驗題。

二 化學測驗試卷的編制

試卷的編制是一項繁難、細緻的工作。應當説,這項工作融會了編制專家的大量心血,是全面地體現教育思想、教學目的、教學要求和科學測量與評價原理的一項系統工程的成果。

為了保證測試的內容和範圍符合測驗標準,充分反映測試取樣的代表性,同時又明確限定測驗試題的數量和佔分比例,在施測或試驗試行的基礎上,制定測驗試題組合的雙向細目表(簡稱雙向細目表)是必需的。

我國廣東省化學大學聯考標準化命題雙向細目表(見表9-1),可作為一個典型實例。

又如美國化學會考試委員會使用的由阿史福德(-ford)描述的成績水平發展而成的組合(Thegrid)表,也是一個據以設計測驗試題雙向細目表的好例。

行為目標Ⅰ 回憶重要事實的能力

知道重要事實,

知道重要術語的定義,

獲得重要概念,

理解理論和原理的字詞含義,

較重要的元素及其化合物的性質的一般知識。

行為目標Ⅱ 應用原理進行簡單預測的能力

對化學原理和理論及其解釋的基本瞭解,

定義的應用,

應用原理於類似的典型課程遇到過的那些情境,

應用原理於日常生活裏的新情境,

解釋一組數據並從中得出結論。

行為目標Ⅲ 應用原理進行定量計算的能力

化學符號的量的含義,

配平化學方程式。

行為目標Ⅳ 運用科學方法的能力

區分觀察到的現象與對這些現象的理論解釋,

用理論術語説明現象, 對理論給出實驗證明

控制一個實驗中的因數,

完全靠定義説明這個是真實的。

領域1 化學變化,元素、化合物;化合反應定律,分子運動論,化學計算。

領域2 溶液,電離,酸鹼鹽,中和反應,水解,金屬活動性順序,電化學。

領域3 氧化還原反應,反應熱,反應速率,化學平衡。

領域4 原子結構與化學性質,元素週期系。

領域5 普通元素及其化合物的化學。氫、氧、鹵素、硫族、氮

族的物理性質和化學性質,典型金屬。

有了上述雙向細目表,命題專家組就可以編制出有一定難度和區分度的試題,且試題(卷)的效度和信度比較高。同時,測驗試題涵蓋的知識和能力的比重也比較穩定。當然,如果已建立了測驗試題庫,那就從根本上保證了試卷編制和測試等過程的科學化、標準化。

三 試卷的分析與評價

測驗試卷施測以後,經過評閲、記分,需要進行試卷分析和統計,以從中獲取諸多的有益的信息,進而做出評價。

試卷分析的方法服務於不同的目的。為了分析教學效果,瞭解學生的學習情況而進行的試卷分析,意在於查明測驗分數高低的原因。學生得分普遍較高,要分析判定是由於測驗試題太容易,還是表明教授得法、教學效果好、學習水平高;學生得分低,是因為試題太難,還是由於教學效果差所致。

以調查研究教與學的情況為目的進行的試卷分析,教師可以採用列表記錄每道題的學生的答案,統計有多少人答錯;或者將批閲後的試卷(或答案紙)發還給學生,要求學生將答錯的題標出來。這樣就可以使教師迅速查明學生對哪些知識要點、哪部分內容掌握得不好,以作為隨後的補救教學(補課、輔導)的依據。

為了評價測驗本身的優劣而進行的試卷分析,應當根據教學 測量“四度”的要求,來進行試卷分析。這種試卷分析與對測驗進行的評價,可以有效地幫助教師和有關專家判斷測驗方案的效果,以決定取捨或修訂、調整。

評估測驗優劣的方法是教育測量和評價專門研究的課題。這裏僅作簡略介紹。

1.相對評價的數量表示和解釋

相對評價,也稱為常模參照評價,是以個體的成績與同一團體的平均成績(或常模)相互比較,從而確定該個體成績的適當等級的表示方法。教師據此可以比較某生與班級(或全體受試者)內其他學生成績的高低。

為此,必須將學生的得分(試卷上記載的分數)或稱原始分數,經過一定的處理,方可用來説明問題。

(1)標準分數。標準分數也叫Z分數。係指原始分數與其平均數的差數,以標準差為單位表示的.數值。計算公式為:

當Z值為零時,正好在平均數的位置,表明學生的學業成績一般;Z為正值,則表明學業成績高於一般;Z為負值,則學業成績低於一般。

把原始分數轉換為標準分數之後,每個考生的學業成績在同一團體中的位置一目瞭然。但由於Z分數有正、有負,不便於使用,經過變換,遂採用T分數。

T=10Z+50

T分數以50為一般,50以上越大越優,50以下越小越劣。採用T分數,不僅可以説明某生的測驗分數在同一團體中所處的位置,可以在各考生之間進行比較,而且可以比較同一考生在不同學科成績上的優劣,見表9-3。

(2)百分等級。一個特定分數在一百個等級中所處的等級位置稱為百分等級。常用PR(PercentileRanks)表示。某考生的測驗分數的百分等級就是低於這個分數的考生個數佔團體總考生數的百分比。例如,某考生化學考試得分為65分,班上40名學生中有28名的分數低於65分,因此,該考生在班上化學考試中所處的百分等級是:

這就表明:在班上有70%的學生測驗分數低於65分,即該生的成績優於全班70%的學生。

2.絕對評價

絕對評價是以受試者本人的現狀與既定的教學目標作比較。教學目標就是評定目標。

考生能夠完成多少體現教學目標的測試題才算達標,這是需要結合學習的性質和要求來確定的問題。一般言之,短期的教學目標和要求學生必須掌握的基本內容,達標值可定得高一些,如90%或100%;而對於較長期的教學目標與只需要讓學生一般瞭解的內容,達標要求可以低一點,如80%或85%,但至少要在70%以上。

絕對評價的評分,一般採用合格或不合格,也可以採用三級或五級評分。

三級標準的答對率如下:

好——答對率在85%以上;

中——答對率在70%—84%;

差——答對率在69%以下。

應當指出,上表中的等級和數字標記為美國實行的五級分制;答對率為我國實行的五級分制的量化指標。前者為相對評分,後者的答對率(記為相應的得分)為絕對評分。兩者不宜摺合計算,並列在一起僅供參考。

絕對評價適用於形成性測驗和診斷性測驗。獲得的反饋信息,便於及時瞭解學生掌握知識與能力水平的具體情況,以利及時調整、改進教學。

第六節 化學教學評價

教學評價是教育評價的一個子系統。教學評價是指收集教學 系統各方面的信息,並依據一定的客觀標準對教學及其效果作出衡量和科學判定的過程。

化學教學評價是教學評價理論在化學教學中的運用和發展。從方法論原則上講,化學教學評價的基本目的,也應當遵循以下結論①:(1)客觀認定教師的教學效果;(2)診斷教學疑難,改進教學;(3)提供反饋信息,促進學生學習。為了實現這些目的,需要從幾個方面來進行研究,方可取得良好效果。這些方面②是:

(1)學習目的。通過了解評價結果,來激發學生的學習積極性,引導他們調整學習方法,促使他們進行自我評價。

(2)指導目的。意義在於改進和提高教師對教學的指導作用。

(3)管理目的。在於給學生選擇適當的環境,提供相應的教育處置。

(4)研究目的。教學、教育研究工作者用於科學研究的評價。

化學教學評價主要包括化學教學過程評價、化學學習活動評價和化學教學效果評價。其中,前兩者是側重從教與學的角度概括地評估教學過程與學習活動的成就的,可歸屬於過程評價,而化學教學效果評價則屬於結果評價。過程評價與結果評價即是已被廣泛採用的形成性評價與總結性評價。

在不同的教學階段,基於不同的目的而進行的教學評價,與形成性評價和總結性評價並列的還有診斷性評價。這是化學教學評價的主要的三種類型。

實施化學教學評價的一般程序①是:

(1)準備階段。包括確定評價目的、編制評價指標體系、選擇評價方法等。

(2)蒐集評價信息階段。要採用一切有效的、可行的方法蒐集評價所需的充分的信息。

(3)分析、判斷階段。對所蒐集的原始資料、數據進行加工處理,形成綜合判斷,獲得評價結論。

(4)評價結果的利用階段。將評價結論反饋於化學教學過程,以改進教學工作,還可以為更大範圍的教育評價提供資料。

化學教學評價常採用測量的和非測量的方法以獲取所需的信息,即採用測驗法、觀察法、談話法、問卷調查法及個案研究法來得到評價所需的量的描述和質的描述兩方面的信息。關於測驗法,在本章第二節討論過的準備性測驗、形成性測驗和總結性測驗恰為與診斷性評價、形成性評價和總結性評價相匹配而實施。其他的評價測量方法,可參看教育科學研究方法與教育測量等專著。②

在化學教學評價中,為了提高評價的質量,應當注意把握以下方法論原則:

(1)重視相對評價與絕對評價相結合,注重絕對評價;

(2)講究定性評價與定量評價相結合,注重定量評價;

(3)做到形成性評價與總結性評價相結合,注重形成性評價。

熱門標籤