常模及測驗標準化
Norms and Test
Standardization
Key Terms and
Concepts
‧norm group 常模團體Raw score 原始分數
‧ frequency distribution 次數分配
‧Mean平均數, median中位數, mode眾數
‧percent correct 正確(答對)百分比
‧percentile rank 百分等級
‧normal distribution 常態分配curve 曲線
‧standard deviation 標準差variance 變異數
‧expectancy table 期望(預期)表
‧normalized standard score常態化標準分數
‧skewness 偏態
‧stanine scale 標準九sten scale 標準十
常模
‧教育量尺與自然量尺的比較
–絕對零點
‧50 分是25分的兩倍嗎
–等值的單位
‧數學70分主義70分
常模的意義
‧常模表是指原始分數(raw scores)與衍生
分數(derived scores)的對照表。
‧解釋測驗分數的依據
常模的功用
‧ 個人間比較
–表明個人分數在常模團體的相對位置
‧測驗間比較
–提供比較的數量,以便直接比較個人在不同測
驗上的分數
–大專聯考採用原始分數公平嗎?
常模的類型
‧全國常模
‧地區性常模
‧特殊團體常模
‧學校平均常模
‧為甚麼全國有70%的學生成績
高於全國常模的50%?
使用常模的考慮
‧新近性
‧代表性
‧適切性(關連性)
常模的建立方法
‧團體內常模
–依據個人在特殊團體中的相對位置, 據此所表
示的分數. 用來表示個人分數在團體中的相對
位置, 而確定分數的高低程度.
–可做各種的統計分析
–百分等級標準分數
常模的建立方法
‧發展性常模
–依據個人所獲得的發展水準, 據此所表示的分
數. 可以用來說明個人在正常發展歷程中的成
熟水準, 對個人做臨床研究具有價值.
–粗略不易作正確的統計處理
–年齡常模年級常模
百分等級
百分等級與百分位數
‧如果把一個團體分成一百個等分,此等分
點稱為百分點,百分等級就是指各百分點
以下包含有多少百分比的人數,亦即落在
某一個原始分數以下分數以下的人數百分
比。
‧而百分位數是指各百分點的測驗分數。
‧百分等級是代表所佔的等第,而百分位數
是代表所得的分數。
百分等級與百分位數
‧張三:原始分數32分,百分等級是86
‧表示他的分數勝過86%的人
‧ 86 32
百分等級的求法
‧未歸類資料的求法: 人數不多時, 先將分數
依高低排序, 並給予名次, 然後利用以下公
式, 求各分數的百分等級
–PR=100-(100R-50)/N
‧93, 84, 75, 62,46
‧第二名的百分位數是
–PR=100-(100*2-50)/5
– =70
百分等級的求法
‧歸類資料的求法
‧當樣本數較多時,可將全部測驗分數分
成幾組,並將原始分數歸入適當的組別,
而得到測驗分數的次數分配表,然後依
以下公式求百分等級。
–PR=(100/N)[(X-L)fp/h+F]
‧X:任何數的原始分數
‧N:全體人數
‧L:X所在組的真正下限
‧fp:X所在組的次數
‧h:組距
‧F:L以下的累積次數
組別f cf 計算過程
45-49 1 50
40-44 2 49 PR=(100/50)[(33-29.5)*8/5+35]
35-39 4 47 = 2[5.6+35]
30-34 8 43 =81.2=81
25-29 15 35
20-24 10 20 33分的百分等級是81
15-19 4 10
10-14 4 6
5-9 2 2
百分等級的求法
‧單值組距資料的求法
‧P. 136-P.138
百分位數的求法( 林青山: 心理與教育統計學, P. 76)
‧由百分等級算百分位數
–在一個測驗中, 你想贏過80%的人, 需考多
少分數?
‧Pp= l+{[(PR/100)N-F]/fp}h
–Pp :
– l:第P百分位數所在組別的真正下限
–PR: 百分等級
–N: 總人數
–F: 第P百分位數所在組別以下的累積次數
–fp:第P百分位數所在組別的次數
–h: 組距
組別f cf 計算過程
75-79 1 55
70-74 2 54 P74 =l+{[(PR/100)N-F]/fp}h
65-69 4 52 = 54.5+ {[(74/100)55-35]/8}5
60-64 5 48 =58.06
55-59 8 43
50-54 10 35 百分等級74的百分位數是58.06
45-49 9 25
40-44 7 16
35-39 4 9
30-34 2 5
25-29 2 3
20-24 1 1
百分等級的解釋
‧經常被使用的原因
–易計算易瞭解
–適用各種測驗
‧需注意之處
–百分等級是相對分數不是精熟程度
–百分等級是順序量尺,每單位不相等。靠近中
央部分的原始分數,小小的差距就會造成百分
等級很大的差距。
標準分數
‧逐漸成為主流
‧依據標準差單位來表示個人分數落在平均
數之上或之下(幾個標準差)的距離
‧直線標準分數: Z 分數T 分數
‧常態化標準分數: T 量表分數
直線標準分數
‧原始分數轉換成直線標準分數後,將各原
始分數和其標準分數在圖上化成點,各對
應點用線連起來,所有線均是直線,因此
稱他為直線標準分數。
直線標準分數-- --Z分數
‧Z=(X-M)S
–X:任何原始分數
–M:平均數
–S:標準差
Chen-Yung Lin:
‧S 2 = (X-M)2/N
‧Z=0.5的意義
直線標準分數--- ---Z分數
‧Z分數就是把原始分數改成平均為0標準差
為1的直線轉換。
‧Z分數簡單好用,但幾乎有一半是負數,所
以較不方便。
‧是標準分數的基本型,經常被改成其他標
準分數。
直線標準分數-- --T分數
‧T分數,T=10Z+50
–平均數為50,標準差為10
‧AGCT分數,AGCT=20Z+100
–平均數為100,標準差為20
常態化標準分數
‧(直線)標準化的目的在於使不同測驗的分數
可以比較。
‧但是當兩個分數的分配很明顯的不同時就
無法比較。
‧在這種情況就必須將原始分數都轉換為符
合常態分配的標準分數, 此種分數稱為常態
化標準分數。
常態分布偏態分布
‧(見下圖)
常態化標準分數
‧T量表分數
–50為平均數, 10 為標準差
–T=10z+50
‧z:常態化的標準分數
年齡常模
‧以心理年齡表示智力測驗的結果
‧適用於隨年齡而繼續生長的特質
–如身高體重智力閱讀能力
‧各年齡階段不是一致, 學年時期比較有意義,
當成熟後的年齡就沒有很大意義
年級常模
‧依據各個不同年級標準化樣本, 在測驗上所
得的平均數而建立
‧ 名詞解釋
‧percentile百分位數
‧ 受試者在標準化樣本的百分比,是由原始分數轉化而來的,可表各受試者在測驗分數上的
相對地位,其數值介於是0到100之間。
‧ The percentage of persons in the standardization sample who scored below a specific
raw score; percentiles vary from 0 to 100.
‧standard score標準分數
‧ 是將原始分數轉換後的分數,可說明原始分數距離算數平均數一個標準差單位是多少。
‧ A transformed score in where the original score is expressed as the distance from the
mean in standard deviation units.
‧ T score T分數是一種轉換分數,其平均數是50,標準差為10。
‧ a transformed score with mean of 50 and standard deviation of 10.
‧normalized standard score常態標準分數
‧ 是用非直線轉換方式將偏態分配轉換成常態分配的一種轉換分數
‧ A score obtained by a transformation that renders a skewed distribution into a normal distribution。
‧stanine scale標準九為一種量尺,將原始分數分成九個等分,從1到9。
‧ a scale in which all raw scores are converted to a single-digit system of scores ranging from 1 to 9.
‧sten scale 標準十量表
‧ 將分數分成10個單位,在平均數上、下兩邊各包含5個單位的常態標準分數。
‧ a 10-unit scale with five units above and five units below the mean.
‧C scale C量尺將標準九兩端各加一個單位,故有11個單位。
‧ a variant on the stanine scale with 11 units.
‧ random sampling隨機取樣
A selection strategy in which every subject has an equal chance of
being chosen. 是種篩選的策略,目的是讓每位受試者被選到的機率是相等的。
‧ stratified random sampling分層隨機抽樣
‧ A selection strategy in which subjects are chosen randomly, with the
constraint that the sample matches the population on relevant
background variables such as race, sex, occupation, and so on.
是種篩選策略,受試者被隨機選擇,而且樣本被限制需與母群背景,如種族、性別、
職業等配合。
‧ age norm年齡常模
‧名詞解釋
‧ A type of standardization that depicts the level of test performance for
each separate age group in the normative sample.
‧ 是種標準化類型,在一常態樣本下,描述各年齡群組在測驗表現的水準(層次)。
‧ grade norm年級常模
‧ A type of standardization that depicts the level of test performance for
each separate school grade in the normative sample.
‧ 是種標準化類型,在一常態樣本下,描述各學校年級在測驗表現的水準(層次)。
‧ local norms地區(區域)常模
‧ Norms derived from a representative local sample, as opposed to a
national sample. 常模是由具代表性的區域樣本而來,是相對於全國樣本。
描述次數分配的四個統計量數
‧ 集中量數central tendency
. 平均數M 2. 中位數Mdn 3. 眾數Mo
‧ 變異量數variability
. 變異數σ 2. 四分差Q 3. 全距
‧ 偏態skewness
. 常態. 正偏態positive. 負偏態negative
‧ 峰度kurtosis
1 高狹峰leptokurtic 低闊峰platykurtic
原始分數轉換
‧ percentiles百分位數percentile rank 百分等級
‧ standard scores 標準分數
1. standard score 標準z分數
2. T score T分數(直線轉換)
3. T scaled score T量表分數(非直線轉換)
(normalized standard score常態化標準分數)
4. stanine scale 標準九(USAF,WWⅡ)
5. sten scale 標準十(Canfield,1951)
6. C scale C量尺(Guilford & Fruchter,1978)
分11級
累積百分比0.1% 2.3 % 15.9% 50% 84.1% 97.7% 99.9%
圖二各種衍生分數間的關係
T分數20 30 40 50 60 70 80
百分等級PR 1 2 15 40 50 60 85 98 99
標準九的百分比4% 7% 12% 17% 20% 17% 12% 7% 4%
STANINE 1 2 3 4 5 6 7 8 9
CEEB分數200 300 400 500 600 700 800
AGCT分數40 60 80 100 120 140 160
斯比離差智商52 68 84 100 116 132 148
魏氏離差智商55 70 85 100 115 130 145
標準九的百分比
STANINE
1 2 3 4 5 6 7 8 9
4% 7% 12% 17% 20% 17% 12% 7% 4%
-2.25 -1.75 -1.25 -.75 -.25 .25 .75 1.25 1.75
~ ~ ~ ~ ~ ~ ~ ~ ~
-1.75 -1.25 -.75 -.25 .25 .75 1.25 1.75 2.25
4% 11 % 23% 40% 60% 77% 89% 96%
TOPIC 3A 常模以及測驗分數的解釋
‧ 常模norm的定義:是一具有代表性的
樣本團體在測驗上的表現或分數分布,
其可作為心理測驗中原始資料轉換的依
據,可表示個體在標準化常態樣本下的
相對測驗表現。
‧ 使用常模的目的:
1. 可知個體在群體中所處的相對位置。
2. 可作為互相比較及評估之用。
常模的類別
一、發展性常模
1.年齡常模
2.年級常模
3.順序量表ordinal scales
二、組內常模
1.百分位數(百分等級)
2.標準分數
(1)T分數
(2)離差智商
(3)其他量尺
三、全國性常模與特定的團體常模
發展性常模developmental norm
1. mental age以心理年齡來取樣。例如智力測驗的常模。以相同心
智年齡的人來作常模,而不管其生理年齡為何。
‧ 缺點:
– 心理年齡的單位大小不恆為一致,有隨著生理年齡的增加,單位逐
漸縮小的現象。
– 智力隨時在變。
2. grade equivalents以實際年級來區分的,是使用最普遍的一種。
‧ 缺點:
– 教材的內容每個年級並不相同,且在主題、重點以及進度上都不一
定相同,所以在比較上可能產生問題。
– 容易造成錯誤的解釋。例如一位四年級的學生在算術測驗上得到年
級等級值為6.9,這只代表他的算術能力高出同年級的人,但並不代
表他已經熟悉六年級的算術歷程,同時也不應該將年級常模視為學
業成就的標準。
3. ordinal scales將每個年齡層中,具代表性的各種功能性的行為
發展描述出來,再用實徵的方法來取得各階層的年齡。此法為發
展心理學家常用。最早的研究是Gesell及同事列出一系列行為的
模式,陳述出嬰兒每個月在動作、適應、語言及個體—社會四個
層面可能發展出來的各項行為。後來根據Piaget的發展理論,設
計出一套測量工具,這套測量工具即是一種順序量表,亦即必須
等到前一個階段的概念發展完整之後,才到達下一個階段。
組內常模Within Within-group norms
‧ 定義:指個體的行為表現與同等的團體做比較,提供特定“量”方面的意義。
‧ 種類:1.百分分數percentile 2.標準分數standard score 3.離差智
商deviation IQ。
百分位數是用標準化樣本在某一特定原始分數以下所佔的人數百分比來表示,
可看出受試者在團體中的相對位置。
‧ 優點:1.易計算、易了解。2.能做比較,故使用廣泛。
‧ 缺點:單位大小不一,越靠近分配的兩端,單位的不等性越明顯。所以它只
能指出某人在常態樣本下的相對位置,並不能說出兩個百分位數的差距。
標準分數是以該分配的標準差來表達個體與平均數的差距。將個體的分數與常
模團體平均數的差距,除以該分配的標準差,即是z分數。常態化標準分數
(normally standard scores)是指已經轉成合乎常態曲線的分配N(0,1)
的標準分數,而這些分數可以根據常態分配表查出落於平均數某一標準差間
的人數百分比而計算出來。
離差智商早期的智力測驗指的是採用了比率智商,此智商是將心理年齡與生理
年齡的比值乘以100。而目前的趨勢皆以離差智商所取代N(100,15)。它
是以100為平均值,以魏氏智力量表的標準差為其標準差。若選用15為標
準差,其得到的分數便可依照解釋斯比量表的比率智商的方式加以解釋,或
是我們也可用任何已熟悉的量表分配來互相對照。
標準化常態樣本
normative sample
– 用以建立常模的標準化常態樣本的特質:
1. particular:每份測驗都有其限制使用的對象
2. representative:此樣本必須代表它的母群。
3. large enough:取樣的個數要夠大。
4. selective factor:避免有針對某些特殊對象的因素。
– 常模的特性:
1. not absolute:不是絕對的,只是做參考,因常模中
的樣本只是母群中的一部份。
2. not universal:不是普遍性的,常模的樣本是有特定
範圍的。
3. not permanent:不是永久的,會因時間的不同而使
常模失去效用。
常模團體的選取
‧ National Anchor Norms:全國性標準定錨常模
ETS在1973年建立了一個National Anchor Norms,即是建立
一個標準定錨常模,使得兩個不同測驗的結果可以相互比較。為美國國
小學生常用的七個閱讀成就測驗,提供了真正可以比較且具代表性的全
國性常模。
‧ Specific Norms 特定的常模有兩種形式:
‧ subgroup norm:對不同的次級團體做不同的常模。
‧ local norm:對不同地區做不同常模。
‧ Fixed Reference Group:固定參照常模
可以說是沒有所謂的常模,或說是每年都在做常模。它只跟當時的人
做比較,以當時的人為參照標準,用他們來作常模,以計算某人在當時
的團體中的相對位置。
目的: 1. comparative:可使分數能做比較;
2. continuity:有連續性,其常模不因時間的不同而失去效用。
expectancy table 期望表
‧ A table that portrays the
established relationship
between test scores and
expected outcome on a relevant
task.
‧ 精確地描述測驗分數與期望結果間的關係
的對照表
‧ 是常模的一種實用形式,可預測受試者在
效標criterion上表現良好的可能性。
Criterion Criterion-Referenced Tests
和Norm Norm-Referenced Tests 的比較
Dimension 效標參照測驗常模參照測驗
用途受試表現和標準比
較
受試表現彼此比較
試題內容與實務相近較扁狹
非直接相近較寬闊
的技能
的技能
試題選取多數題目難度相似難度水準變異大
分數解釋用百分比或事先訂
定的通過標準解釋
用標準分數、百分
等級或年級等值
grade equivalent
沒有留言:
張貼留言