2011年5月15日 星期日

Topic 3A 常模及測驗標準化 Norms and Test Standardization

Topic 3A
常模及測驗標準化
Norms and Test Standardization
(五)心理測驗 教學進度:
Topic 3A常模及測驗標準化
Norms and Test Standardization
• Case Exhibit 3.1
Outmoded Tests and Outdated Norms
• Raw Scores
• Essential Statistical Concepts
• Raw Score Transformations
• Selecting a Norm Group
• Criterion-Referenced Tests
• Summary
Key Terms and Concepts
• norm group 常模團體 Raw score 原始分數
• frequency distribution 次數分配
• Mean平均數, median中位數, mode眾數
• percent correct 正確(答對)百分比
• percentile rank 百分等級
• normal distribution 常態分配 curve 曲線
• standard deviation 標準差 variance 變異數
• expectancy table 期望(預期)表
• normalized standard score常態化標準分數
• skewness 偏態
• stanine scale 標準九 sten scale 標準十

• 名詞解釋

• percentile百分位數
• 受試者在標準化樣本的百分比,是由原始分數轉化而來的,可表各受試者在測驗分數上的相對地位,其數值介於是0到100之間。
• The percentage of persons in the standardization sample who scored below a specific raw score; percentiles vary from 0 to 100.
• standard score標準分數
• 是將原始分數轉換後的分數,可說明原始分數距離算數平均數一個標準差單位是多少。
• A transformed score in where the original score is expressed as the distance from the mean in standard deviation units.
• T score T分數 是一種轉換分數,其平均數是50,標準差為10。
• a transformed score with mean of 50 and standard deviation of 10.
• normalized standard score常態標準分數
• 是用非直線轉換方式將偏態分配轉換成常態分配的一種轉換分數
• A score obtained by a transformation that renders a skewed distribution into a normal distribution。
• stanine scale標準九 為一種量尺,將原始分數分成九個等分,從1到9。
• a scale in which all raw scores are converted to a single-digit system of scores ranging from 1 to 9.
• sten scale 標準十量表
• 將分數分成10個單位,在平均數上、下兩邊各包含5個單位的常態標準分數。
• a 10-unit scale with five units above and five units below the mean.
• C scale C量尺 將標準九兩端各加一個單位,故有11個單位。
• a variant on the stanine scale with 11 units.

• random sampling隨機取樣
A selection strategy in which every subject has an equal chance of being chosen. 是種篩選的策略,目的是讓每位受試者被選到的機率是相等的。
• stratified random sampling分層隨機抽樣
• A selection strategy in which subjects are chosen randomly, with the constraint that the sample matches the population on relevant background variables such as race, sex, occupation, and so on.
是種篩選策略,受試者被隨機選擇,而且樣本被限制需與母群背景,如種族、性別、職業等配合。
• age norm年齡常模
• A type of standardization that depicts the level of test performance for each separate age group in the normative sample.
• 是種標準化類型,在一常態樣本下,描述各年齡群組在測驗表現的水準(層次)。
• grade norm年級常模
• A type of standardization that depicts the level of test performance for each separate school grade in the normative sample.
• 是種標準化類型,在一常態樣本下,描述各學校年級在測驗表現的水準(層次)。
• local norms地區(區域)常模
• Norms derived from a representative local sample, as opposed to a national sample. 常模是由具代表性的區域樣本而來,是相對於全國樣本。
描述次數分配的四個統計量數
• 集中量數 central tendency
. 平均數 M 2. 中位數Mdn 3. 眾數Mo
• 變異量數 variability
. 變異數 σ 2. 四分差Q 3. 全距
• 偏態 skewness
. 常態 . 正偏態positive. 負偏態 negative
• 峰度 kurtosis
1 高狹峰leptokurtic 低闊峰platykurtic

原始分數轉換
• percentiles百分位數 percentile rank 百分等級
• standard scores 標準分數
 standard score 標準z分數
 T score T分數(直線轉換)
 T scaled score T量表分數(非直線轉換) (normalized standard score常態化標準分數)
 stanine scale 標準九 (USAF,WWⅡ)
 sten scale 標準十 (Canfield,1951)
 C scale C量尺 (Guilford & Fruchter,1978)
分11級

圖二 各種衍生分數間的關係

TOPIC 3A 常模以及測驗分數的解釋
• 常模norm的定義:是一具有代表性的樣本團體在測驗上的表現或分數分布,其可作為心理測驗中原始資料轉換的依據,可表示個體在標準化常態樣本下的相對測驗表現。

• 使用常模的目的:
 可知個體在群體中所處的相對位置。
 可作為互相比較及評估之用。
發展性常模developmental norm
1. mental age以心理年齡來取樣。例如智力測驗的常模。以相同心智年齡的人來作常模,而不管其生理年齡為何。
• 缺點:
– 心理年齡的單位大小不恆為一致,有隨著生理年齡的增加,單位逐漸縮小的現象。
– 智力隨時在變。
2. grade equivalents以實際年級來區分的,是使用最普遍的一種。
• 缺點:
– 教材的內容每個年級並不相同,且在主題、重點以及進度上都不一定相同,所以在比較上可能產生問題。
– 容易造成錯誤的解釋。例如一位四年級的學生在算術測驗上得到年級等級值為6.9,這只代表他的算術能力高出同年級的人,但並不代表他已經熟悉六年級的算術歷程,同時也不應該將年級常模視為學業成就的標準。
3. ordinal scales將每個年齡層中,具代表性的各種功能性的行為發展描述出來,再用實徵的方法來取得各階層的年齡。此法為發展心理學家常用。最早的研究是Gesell及同事列出一系列行為的模式,陳述出嬰兒每個月在動作、適應、語言及個體—社會四個層面可能發展出來的各項行為。後來根據Piaget的發展理論,設計出一套測量工具,這套測量工具即是一種順序量表,亦即必須等到前一個階段的概念發展完整之後,才到達下一個階段。
組內常模 Within-group norms
• 定義:指個體的行為表現與同等的團體做比較,提供特定“量”方面的意義。
• 種類:1.百分分數 percentile 2.標準分數 standard score 3.離差智商 deviation IQ。
百分位數是用標準化樣本在某一特定原始分數以下所佔的人數百分比來表示,可看出受試者在團體中的相對位置。
• 優點:1.易計算、易了解。2.能做比較,故使用廣泛。
• 缺點:單位大小不一,越靠近分配的兩端,單位的不等性越明顯。所以它只能指出某人在常態樣本下的相對位置,並不能說出兩個百分位數的差距。
標準分數是以該分配的標準差來表達個體與平均數的差距。將個體的分數與常模團體平均數的差距,除以該分配的標準差,即是z分數。常態化標準分數(normally standard scores)是指已經轉成合乎常態曲線的分配N(0,1)的標準分數,而這些分數可以根據常態分配表查出落於平均數某一標準差間的人數百分比而計算出來。
離差智商早期的智力測驗指的是採用了比率智商,此智商是將心理年齡與生理年齡的比值乘以100。而目前的趨勢皆以離差智商所取代N(100,15)。它是以100為平均值,以魏氏智力量表的標準差為其標準差。若選用15為標準差,其得到的分數便可依照解釋斯比量表的比率智商的方式加以解釋,或是我們也可用任何已熟悉的量表分配來互相對照。




標準化常態樣本
normative sample
– 用以建立常模的標準化常態樣本的特質:
• particular:每份測驗都有其限制使用的對象
• representative:此樣本必須代表它的母群。
• large enough:取樣的個數要夠大。
• selective factor:避免有針對某些特殊對象的因素。
– 常模的特性:
• not absolute:不是絕對的,只是做參考,因常模中的樣本只是母群中的一部份。
• not universal:不是普遍性的,常模的樣本是有特定範圍的。
• not permanent:不是永久的,會因時間的不同而使常模失去效用。
常模的類別
• National Anchor Norms:全國性標準定錨常模
ETS在1973年建立了一個National Anchor Norms,即是建立一個標準定錨常模,使得兩個不同測驗的結果可以相互比較。為美國國小學生常用的七個閱讀成就測驗,提供了真正可以比較且具代表性的全國性常模。
• Specific Norms 特定的常模有兩種形式:
• subgroup norm:對不同的次級團體做不同的常模。
• local norm:對不同地區做不同常模。
• Fixed Reference Group:固定參照常模
可以說是沒有所謂的常模,或說是每年都在做常模。它只跟當時的人做比較,以當時的人為參照標準,用他們來作常模,以計算某人在當時的團體中的相對位置。
目的: 1. comparative:可使分數能做比較;
2. continuity:有連續性,其常模不因時間的不同而失去效用。
expectancy table期望表
• A table that portrays the established relationship between test scores and expected outcome on a relevant task.
• 精確地描述測驗分數與期望結果間的關係的對照表


Criterion-Referenced Tests
和 Norm-Referenced Tests 的比較
標準九的百分比
10/14隨堂考
1. X=75 M=50 SD=20
z=(75-50)/20=1.25 PR=89.44
T=1.25*10+50=62.5
2. X=45 M=50 SD=20
z=(45-50)/20=-0.25 PR=40.13
T=-0.25 *10+50=47.5
3. X=75 標準九等級為8
X=45 標準九等級為5
4. 甲生IQ=110,乙生T=60,丙生PR=75
甲z=.67 乙z=1.0 丙z=.68 故乙>丙>甲
第一次考試試題
填空題:22%(每格2分)
1. developed the "thought " to measure the essential speed of thought.
2.The hypothesis that we inadvertently disclose our inner-most , fantasies, and when responding to ambiguous or stimuli is known as the hypothesis.
3.In testing, is a comfortable, warm that serves to motivate examinees and elicit cooperation.
4.A test is a s procedure for s behavior and describing it with categories or scores.
5. The first person to write about the difference between mental illness and mental retardation was .(a. Binet b. Esquirol c. Freud d. Seguin)

名詞解釋:30%(每題 6 分)
– informed consent
– ETS
– MMPI & KMHQ
– Army α & Army β
– Personal Data Sheet

問答題: 48%(每題 12 分)
• Oscar Buros和L. M. Terman對心理測驗各有何貢獻?
• 舉例說明常模參照測驗和效標參照測驗criterion-referenced test。
• 心理測驗有哪些主要功能(各舉一例說明之)。
• 影響測驗結果主要有那些來源?

沒有留言:

張貼留言