教師資格

當前位置 /首頁/從業資格證/教師資格/列表

運用教育測量知識進行資料分析與處理

教育測量是對學習能力、學業成績、興趣愛好思想品德以及教育措施上許多問題的數量化測定。下面由小編為大家整理的運用教育測量知識進行資料分析與處理要點,歡迎大家閱讀瀏覽。

運用教育測量知識進行資料分析與處理

教育測量是對學習能力、學業成績、興趣愛好、思想品德以及教育措施上許多問題的數量化測定。測量要具備單位、參照點、量表。教育測量中所使用的量表多以文字試題的形式出現,也有以圖形、符號、操作要求形式出現的。

  (一)基本概念

1.教育測量

教育測量有廣義和狹義之分。從廣義上說,教育測量泛指運用測量手段對教育活動所進行的量的測定。它涉及的範圍很廣,凡是需要並能夠測量的與教育有關的活動均在研究之列,如教育投入、教育過程各要素、教育的效果等。從狹義上講,教育測量專指按一定規則對學生的知識、智慧、個性發展、思想品德等所進行的量的測定。通常所提及的多是狹義上的教育測量。

2.教學評價

教育評價是按照一定標準,運用科學可行的方法,對教育活動所進行的價值判斷的過程。它包括對教學過程和教學效果的評價,諸如學校、教師的教學工作、課堂教學、教學方法、模式和內容以及學生的學業成就、一般智慧發展、個性發展、思想品德狀況等評價。

3.測驗及其種類

測驗是指對通過一定的儀器和試題所引起的受測者的行為樣本進行測量的系統程式。教育測量的物件和內容是非常豐富的。測驗作為教育測量的主要工具,種類也很繁多,可按不同標準加以分類。按測驗的功用分類:(1)學績測驗;(2)能力測驗;(3)人格測驗。

按測驗的目的分類:(1)診斷性測驗;(2)形成性測驗;(3)終結性鋇4驗。

按解釋分數和方法分類:

(1)常模參照測驗

指參照被測群體的實際水平解釋分數的測驗叫做常模參照測驗。群體的平均分數一般可以反映群體的水平,稱為常模。以常模為參照點,將被測個人的成績與常模比較,並把比較結果所反映出來的差異數量化,作為匯出分數。參照常模解釋分數,便於比較和選拔工作的進行,它屬於相對評價的範疇。例如,在升學考試中,按標準化的要求進行的分數轉換就是參照常模得出的。

(2)目標參照測驗

參照被測達到目標的程度來解釋分數的測驗,叫做目標參照測驗,也稱作標準參照測驗。通過與特定的標準進行比較,瞭解被測的達標程度,這是一種絕對評價方法。例如,畢業考試就是以某一學段的教育目標為標準,衡量學生的達標情況而進行的。

4.測量的要素測量的三要素:

①參照點。分絕對零點和相對零點。教育測量所應用的參照點都是相對零點。

②統一的單位。

③量具(測量工具)。教育測量常用的工具是試卷,而試卷由測題構成,故我們必須高度重視命題的研究,提高試題的質量,這樣才能保證測驗的可靠性和有效性。

  (二)資料整理

在教育測量中。通過各種測驗獲得大量分數,這些雜亂無章的分數有三個問題:一是看不清它們的分佈形態,二是不瞭解它們的特徵和變化規律,三是每個分數表達的意義含混模糊。因此,需要對零亂分散的分數進行整理和分析,以便在此基礎上做出解釋和評價。

1.分數整理

(1)順序排列表

順序排列是簡單的整理分數的方法。它是將所有個體的成績,按高低順序排列,並且列於表中,稱作順序排列表。這種方法簡明清晰,一眼便能看到最高分數和最低分數,而且可以大致瞭解個體成績

在總體中的位置。(2)頻數分佈表是一種反映資料分佈情況的統計表。所謂頻數是指一群資料在各個數值(或區間)上

所出現的資料的個數,也稱為次數。每一個頻數除以資料的總個數稱為頻率,或稱相對次數。

(3)頻數直方圖

由頻數分佈表可以製作頻數直方圖。方法是:以分數為橫軸,頻數為縱軸,建立直角座標系,在橫軸上標出各組分數的組中值,頻數值等距標在縱軸上;然後以組中值為底邊中點,組距為底邊,組頻數為高作出各矩形。即得頻數直方圖。

  (三)統計資料

  1.算術平均數一組數值的總和除以資料的總頻數所得的商稱為算術平均數,簡稱平均數。

2.方差

一組資料中。各個資料與平均數之差的平方和的算術平均數稱為這組資料的方差。又叫均方差或變異數。用符號S2或σ2表示。

3.標準差

方差的算術平方根稱為標準差。用符號S或σ表示。

標準差是反映全體考生分數之間的離散程度和差異情況。它與平均分一起使用,決定了某次考試分數分佈情況。σ值越大,表示部分考生離平均分的“差距越大”,也就是分數分佈較廣;σ值越小,則分數分佈較窄或說“集中在平均分附近”。

4.差異係數

標準差較準確地反映了一組分數的離散程度,它與原資料的單位相同,是一種絕對差異量數。在進行不同組間離散程度比較時,適用於單位相同、平均數相近的情況。如果各組資料單位不同,或雖然單位同但平均數相差甚遠時,不能直接用標準差比較,這時應使用差異係數。

5.標準分數(Z分數)

標準分數是以平均分為參照點,標準差為度量單位的分數。它具有重要理論價值和應用價值。

6.難度

難度是指試卷(題)的難易程度。一般用試卷(題)的得分率或答對率(P)表示,所以難度事實上是容易度。P值在0~1之間,數值越大,說明試卷(題)越容易。

一般情況下,測驗的平均難度接近O.50時,分數趨於常態分佈,否則分數分佈將出現偏態。就整個測驗而言,當平均難度為0.5且題目組間的相關為零的情況下,分數呈常態分佈,而難度值越小,則題目越難,低分段人數必然較多。難度值越大,題目越容易,分數將大部分集中在高分割槽。這樣,在分數的分佈上,就會呈現出兩種不同的偏向,前者為正偏態。後者為負偏態。

7.區分度

區分度是試題對不同考生的知識、能力水平的鑑別程度。如果一個題目的測試結果使水平高的考生答對(得高分),而水平低的考生答錯(得低分),它的區分能力就很強。題目的區分度反映了試題這種區分能力的高低。一般認為,區分度的數值達到了0.3.便可以接受;達到了0.3以上為好的題目:在0.4以上為優秀題目:低於0.3的題目,區分能力差。

可見,題目區分度的實質是用以鑑定一個題目有效性的指標,它的高低變化對測驗的質量具有深刻的影響。與題目的`難度相比,人們更關注題目的區分度的高低,並以此作為篩選和修改試題的主要依據。

試題的區分度的計算比較方便的方法有以下兩種:(1)得分率求差法

將受測群體按題目得分的高低排列,取高分人數的27%為一組,他們的得分率記作Ph;低分人數的27%為另一組,他們的得分率記作PV,用D表示區分度,則該題的區分度為

(2)得分求差法

將受測群體按題目得分的高低排列,取高分人數的27%為一組,低分人數的27%為另一組,用D表示區分度,用日表示高分組得分總和,用1表示低分組得分總和,用n表示高分組(低分組)人數, Xh表示該題的最高得分,X1、該題的最低得分,則

8.信度

信度是衡量測驗分數一致性或可靠性的一個指標,即用一個或一組測驗對同一被試群體施測多次,所得結果的一致性的程度,以及測驗分數所反映被試真實水平(即真分數)的可靠性程度。

(1)分半相關

將全卷中全部試題按題號或分數適當分半,得到兩個平行的“子試卷”,計算這兩個子試卷考生得分的相關係數,這樣求得的是半個試卷的信度,然後再用斯皮爾曼一布郎(Spearman—Brown)公式校正,得到考試的分半信度係數。一般認為分半信度係數在0,90以上比較合適。這個方法比較適合多數為選擇題的試卷。

(2)內部一致性信度

通常採用的是克倫巴赫(Cronbach)的α-係數公式,它適用於非選擇題(多重記分)較多的試卷。α-係數為試卷信度的最低限,一般認為其值在0,80以上,考試的信度比較好。

9.效度

效度是測驗有效性或準確性的指標。由於效度分析可以針對各種要求和運用各種程式,而在特定的條件下,使用不同的分析方法可以得到不同的效度。因此,一個測驗可以具有不同的效度指標。當我們討論一個測驗的效度時,只有界定了它的條件,效度才有確切的意義。

對常模參照測驗來說,主要有效標關聯效度、內容效度和結構效度。

(1)效標關聯效度

測驗的效標又可稱為準則,它是衡量測驗效度的參照標準。我們可以用一類標準化測驗作為某次測驗的效標(如國家級大學聯考、省級各類會考等),用積差相關法計算效度。

由於客觀上的種種原因,難以確定有效的效標,因此,效度的計算,採用求平均區分度代替。

(2)內容效度

測驗的題目對所要測量的內容具有代表性的程度稱作內容效度。它反映測驗題目在所要測量的內容範圍和教學目標內取樣是否充分和確切的問題,主要用於學科成績測驗。內容效度一般不用數量化指標來表示,主要依靠在某種依據的基礎上作出邏輯分析。為了提高測驗的內容效度,首先要注意界定測驗的內容範圍,其次要注意系統取樣。目前,大多數學科成績測驗的編制者根據教學目標的分類,先擬就測驗的藍圖,將各部分內容和教學目標各層次按確定的比重表達出來。然後編制測題,以滿足提高內容效度的要求。

(3)結構效度(構造效度)

結構效度是指考試對理論上構造或特質的測量程度,

確定結構效度需三個步驟:建立理論體系(理論結構)並以此出發提出關於某一心理特徵的假設:設計和編制測驗,並進行實施;用收集證據和邏輯分析的方法來驗證與理論假設的相符程度。

由於建立理論和提出假設的困難,操作步驟較為複雜,且沒有單一的量化指標來描述有效程度,所以,在一般的考試質量分析中很少採用。

TAG標籤:資料分析 教育 #