2011年1月2日 星期日

基礎統計應用與Excel處理

BodhisattvaKsitigarbha
學習如何學習討論區精華版
基礎統計應用與Excel處理
第一章
A:1.有關<自變數/依變數/常數/變數>除課本p.51-52外;另可參考課本p.72-73
2.有關<資料的尺度>(測量的尺度或量表):問卷衡量尺度的設計是評估報告是否深入的關鍵。 無論研究者採用哪一種問卷回答的方式,事後的整理分析都需要量化後再進行,才能適用於各種統計方法,這種量化的處理工具便稱為衡量的尺度,又稱尺度(Scale)。目前較為廣泛使用的尺度可分為四類:
2.1類別尺度(nominal scale)或名目資料:此種尺度只是區分類別,如根據問卷答案可分為「是」與「否」兩類。每類答案的數字只作為分類之用,如果將這些答案數字(如1,2)做運算,根本沒有意義,因為這些數字在此並未涉及測量。
2.2順序尺度(ordinal scale)或次序資料:可以表示各類別之間的順序關係。但無法區分大小,代表順序的數字還是不能用來做運算,只能看出高低次序,如要求學生根據其心中偏好,將課埕依最喜歡到最不喜歡的順序排列,最喜歡給5分、最不喜歡給1分,這就是一種順序尺度。
2.3等距尺度(interval scale)或區間資料:包含了順序尺度的所有特性,尚能測量各順序之間的距離,有相差固定的間隔。等距尺度的分數可用來做加減乘除的運算,但是不能說明IQ120為IQ60的兩倍聰明,因為等距尺度並沒有一個真正零點。
2.4等比尺度(ratio scale)或比例資料:除了具有等距尺度的所有特性外,再加上「真零」。例如薪資、身高、年齡、體重等變數的測量都是用等比尺度,故可說薪資2萬元的人是薪資2萬元的人的兩倍。
2.5適用於各類尺度的統計分析方法列如下表:
尺度類別 例 集中量數 統計檢定
類別尺度
性別、品牌、車牌 眾數
X2檢定
順序尺度
評價或偏好等級 中位數
非母數檢定
等距尺度
溫度,IQ 算術平均數
大部份統計方法皆可使用
等比尺度
生產量、成本、身高 幾何平均數 變異數分析
3.共變數:兩個變數彼此相影響,參閱課本p.72-73;p.24(表4-6,參考用,不急著全弄懂,以後相關章節會介紹)
4.霍桑效應:「霍桑研究」(Hawthorne Works Studies):1924年美國西方電氣公司(Western Electric Company)霍桑廠(Hawthorne Plant)研究,探討「不同照明度對工作表現的影響」,研究中意外發現早先所假設「照明度對績效有影響」並非決定性,甚至關聯性不大,反而是研究進行時各種實驗處理對生產效率都有促進作用,後續研究證實受試者對於新的實驗處理會產生正向反應,即行為的改變是由於環境改變(實驗者的出現),而非由於實驗操弄造成,這種假設性效果目前我們常稱之為「霍桑效應」。
(楊關錩老師答覆,97.10.8)
A:1章
三、(1)250,(2)1000
四、1.○,2.×,3.○,4.○,5.○,6.○,7.×
五、22,30,111,660
第2章
二、-1.25元
三、-25元
四、
(一)陳姓考生的推論缺乏正確「母群思考」概念(參考課本p.17-18):因為在台灣「陳姓」的人本來就比較多(所謂「陳林滿天下」),因此考上的人當中姓陳的人也會相對地比較多(反應母群的比例),但這並不表示姓陳」與「考上大學」之間是否有任何因果關係。
(二)陳姓考生的推論缺乏正確「推論統計」概念:因為他所觀察的「考上大學聯考的榜單中,姓陳的人」,並非基於隨機抽樣,即使這些「考上大學聯考榜單的陳姓人」是由隨機抽樣產生,那還得比較這些考上大學的人當中姓陳者所占比例,是否顯著高於母群體當中姓陳者所占比例,否則該陳姓考生就不值得欣喜。
第3章
三、因為抽樣次數不多,僅30次,其結果略接近表3-1的分布情形,p=80/100=0.8。與表3-1、圖3-1之差別在於:後者之「抽樣次數較少30次,致誤差可能較高」,愈不易接近常態分配,且與圖3-1每一長條圖機率的高度比較,較不明顯。(※已於留言板說明)。
四、因為只抽5顆球,則白球出現的可能情形介於0-5,其機率分配亦可能介於0-1之間,與上一題比較,差別在於樣本數(5<25)較少,樣本分散程度較不明顯,致誤差較高。(※曾於留言板說明)
五、否。原因如下:
1.此記者的取樣樣本太少,只個人為樣本,就推論一般民眾對於興建高鐵的態度,可能過於輕率。
2.此調查存在著系統性偏差,因為在火車站附近出入的人,其通車族所佔的比例會比一般正常母群高,對火車的倚賴程度較強,所以,贊成興建高鐵的比例也會比較高,但不適合代表一般民眾的看法。
第4章、
一、名稱尺度
二、次序尺度
三、等比尺度
四、名稱尺度
五、次序尺度
十、是
十一、類別尺度
十二、(1)類別尺度,(2)等距尺度
十三、T考驗
十四、
(1)首先判斷問題屬何種尺度-「應用統計」期末考成績為「連續尺度」
(2)次就問題內容-
a.「台北中心」、「台北二中心」及「高雄中心」的學生-3個組群
b.「應用統計期末考成績」有何不同-比較差異
(3)選用統計方法-「連續尺度」、「3個組群」、「差異比較」
a.描述統計:
a1:要符合「連續尺度」的測量尺度-眾數、中數、四分位數 .標準差
a2:選取適用者:平均數(標準差可用於比較離散程度)
【當然答案不止前2項,只是該兩項較容易表達3個組群的集中或分散程度】
b.推論統計:
單層變異數分析(F考驗)、卡方檢定(比較3組群的差異是否顯著)【以上2項是使用頻率較高者,當然如果做2組、2組間比較,可加進T考驗、相關分析等】。
十五、真正自然的零
十六、1.(B、D、H),2.(B、F、I)3.(C、G、I)
十七、(1)名稱尺度,(2)等距尺度,(3)等距尺度或等比尺度,(4)名稱尺度
十八、(1)類別尺度,(2)等距尺度,(3)相依變數-等距尺度;獨立變數-類別尺度
十九、(C)、(D)
廿、1.名稱尺度,2.名稱尺度,3.次序尺度,4.等距尺度
廿三、類別尺度

以上答案僅供參考。
(楊關錩老師答覆,97.10.8)
Q以下為某次民意調查結果
「本調查以台北市住宅電話簿為抽樣清冊,共訪問成功1,008位台北市選民,其中男、女各約佔半數。在百分之九十五的信心水準時,抽樣誤差約為正、負3.1個百分點。」 (摘自中國時報83.07.12)
製作單位:特案新聞中心民意調查組
測驗時間:七月九、十、十一日
測驗地區:台北市
有效樣本數:1,003
問題(一)請問您,一旦台北市長開放民選,國民黨、民進黨、新黨各推出人選,請問您會支持那ㄧ黨的候選人?
1.國民黨(21.1%)、2.民進黨(12%)、3.新黨(8.3%)、4.不知道/無意見(58.1%)、5.拒答(0.5%)
問題(二)請問您,如果明天就是台北市市長選舉日,您心目中最理想的人選是哪位(不提示選項?)
1.蕭萬長(0.6%)、2.趙守博(0.1%)、3.黃大洲(3.1%)、4.丁守中(4.5%)
5.馬英九(3.9%)、6.謝長廷(1.9%)、7.陳水扁(13.3%)、8.趙少康(8.7%)
9.其他(請註明在答案紙上) (2.4%)、10.尚未決定(28.7%)
11.不知道/無意見(35.0%)、12.拒答(1.8%)
問題(三)請問您,如果明天就是台北市市長選舉日,在下列人選中,請問您心目中最理想的人選是哪位(請訪員輪換提示選項)
1.蕭萬長(7.3%)、2.趙守博(2.8%)、3.黃大洲(5.2%)、4.丁守中(4.5%)
5.馬英九(3.9%)、6.陳水扁(25.1%)、7.趙少康(20.3%)
8.其他(請註明在答案紙上) (1.9%)、9.不知道/無意見(27.3%)
10.拒答(1.6%)
請問
(3)在百分之九十五的信心水準時,國民黨候選人所獲得的支持率
答案為:21.1%±3.1% 亦即在18%~24.2%之間。
請問老師,這個答案如何計算出來呢?
第八章
<題目與答案>如下:
第九章 分散量數-自我評量題目
※考古題
1.空大五位同學,應用統計的分數為60、50、80、70、80。請問
排序:50、60、70、80、80
(1)平均數:60+50+80+70+80=340/5=68
(2)眾 數:80
(3)中 數:70
(4)標準差:(60-68)2+(50-68)2+(80-68)2+(70-68)2+(80-68)2=(64)+(324)+(12)+(4)+(12)=680/5=136
√11.66 或 ≒ 11.7
(5)如老師對這5位同學均加上5分,請問標準差變為多少?
平均數:50+5、60+5、70+5、80+5、80+5=365/5=73
標準差:(55-73)2+(65-73)2+(75-73)2+(85-73)2+(85-73)2=(324)+(64)+(4)+(144)+(144)=680/5=136
√11.66 或≒11.7
2.某大企業給予5位職員年終獎金,為20萬、30萬、20萬、10萬、15萬。請問:
(1)平均數為幾萬?(2)中數為幾萬?(3)眾數為幾萬?(4)標準差為多少?
(5)如果每5位職員年終獎金均增加壹倍,請問標準差變為多少?
排序:10、15、20、20、30(萬元)
平均數:10+15+20+20+30=95/5=19
中 數:20
眾 數:20
標準差:(20-19)2+(30-19)2+(20-19)2+(10-19)2+(15-19)2=(1)+(121)+(1)+(81)+(16)=220/5=44√6.6
增加壹倍之標準差變為多少?6.6*2倍=13.2
3.空大五位職員的年齡分別是30、25、60、40、45。
請計算(1)全距(2)平均數(3)中數(4)標準差 (10分)
排序:25、30、40、45、60
全 距:最大值-最小值= 60-25=35
平均數:25+30+40+45+60=200/5=40
中 數:40
標準差:(30-40)2+(25-40)2+(60-40)2+(40-40)2+(45-40)2=(100)+(225)+(400)+(0)+(25)=750/5=150√12.2
4.下列何者可以反應一個統計分配的偏態程度?
(A)一級動差(平均差) (B)二級動差(S2=變異量) (C)三級動差(偏態程度)
(D)四級動差(峰度) (E)平均差 (F)標準差。
※m3>0所以甲分配稱為「正偏態」;若乙分配為常態分配,則其m3=0;若m<0,丙分配稱為「負偏態」。
※g2>0,則甲分配為高狹峰分配;若g2=0且g1=0,則乙分配為常態分配,若丙分配的g2<0時,則丙分配為低闊峰分配。
5.如果X的變異數為25,Y=X+3,那麼,Y的變異數應為多少?(A)25 (B)28 (C)75 (D)225
6.如果X的變異數為25,Y=3X,那麼,Y的變異數應為多少?(A)25 (B)28 (C)75 (D)225
7.(一)反應統計分配的偏態程度,是用幾級動差?三級動差
(二)反應統計分配的峰度程度,是用幾級動差?四級動差
8.如果X的平均數為40,變異數為16,Y=X+5,Z=2X,那麼請問:
(一)Y的平均數、變異數、和標準差分別為多少?Y的平均數=45、變異數=16、標準差=4
(二)Z的平均數、變異數、和標準差分別為多少?Z的平均數=80、變異數=64、標準差=8

9.如果X=5,6,3,7,4;那麼,X的變異數應為多少?答:X的變異數應為2.5
平均數:5+6+3+7+4=25/5=5
變異數:(5-5)2+(6-5)2+(3-5)2+(7-5)2+(4-5)2=(0)+(1)+(4)+(4)+(1)=10/5=2
10.設某一變數 X 的四個數值如下:3 , 2 , 2 , 5 ,試計算 X 的變異量(即變異數)。
平均數:3+2+2+5=12/4=3
變異數:(3-3)2+(2-3)2+(2-3)2+(5-3)2=(0)+(1)+(1)+(4)=6/4=1.5
11.設某一變數 Y 的四個數值如下:4 , 3 , 2 , 7 ,試計算 Y 的變異量(即變異數)。
平均數:4+3+2+7=16/4=4
變異數:(4-4)2+(3-4)2+(2-4)2+(7-4)2=(0)+(1)+(4)+(9)=14/4=3.5
12.設有五個家庭的月收入如下(以萬元為單位):3、2、9、5、6,試計算上列變項之標準差(應列計算歷程,否則不予計分)
平均數:3+2+9+5+6=25/5=5
變異數:(3-5)2+(2-5)2+(9-5)2+(5-5)2+(6-5)2=(4)+(9)+(16)+(0)+(1)=30/5=6
標準差:VAR=6√2.449≒2.45
13.設有五個家庭的月收入如下(以萬元為單元):6、5、12、8、9,試計算上列變項之標準差(應列計算歷程,否則不予計分)
平均數:6+5+12+8+9=40/5=8
變異數:(6-8)2+(5-8)2+(12-8)2+(8-8)2+(9-8)2=(4)+(9)+(16)+(0)+(1)=30/5=6
標準差:VAR=6√2.45
14.試簡述各級(1~4級)動差的功用。P.165
第十章 相對地位量數自我評量題目
※考古題一
1.下列資料為10個人的受教育年限: 9, 12, 16, 12, 6, 9, 12, 9, 16, 18 ,試問受教育年限為12者之百分等級為何?
答:重新排序之後,這10個人的受教育年限如下:
年限 人數 累積人數 累積百分比 PR
18 1 10 100 95
16 2 9 90 80
12 3 7 70 55
9 3 4 40 25
6 1 1 10 5
受教育年限為12者之百分等級,取41-70的中間,可為55。
※考古題二
1.空大新生班的學生,期中考應用統計的成績分別為80、78、66、69、70、58、63、75、72、53、68、60,請問得到應用統計75分學生的PR(百分等級)為多少?答:PR=79。
分數 人數 累積人數 百分比 百分等級
80 1 12 100 96
78 1 11 92 88
75 1 10 83 79
72 1 9 75 71
70 1 8 67 63
69 1 7 58 54
68 1 6 50 46
66 1 5 42 38
63 1 4 33 29
60 1 3 25 21
58 1 2 17 13
53 1 1 8 4
2.如果X的變異數為25,Y的變異數為16,X和Y的共變數為9,那麼,X和Y的積差相關係數應為多少?(A)0.02 (B)0.15 (C)0.22 (D)0.33 (E)0.45
※X=25√5+Y=16√4=9,X和Y的積差相關係數:25√5+16√4=9,9/√5*√4=9/20=0.45
3.隨機取樣500個民眾,測其對政府公務人員服務態度的滿意度(分數介於1分到100分之間),得到平均數為80分,標準差為5分。其中某位民眾得分90,若將此位民眾的分數轉為標準化T分數(平均數為50,標準差為10),則此位民眾的T分數應該為多少?(A)55 (B)60 (C)65 (D)70 (E)75
※90-80/5=10/5=2*10+50=70
4.如果X的變異數為100,Y的變異數為81,X和Y的積差相關係數r=0.5,那麼,X和Y的共變數應為多少?答:X和Y的共變數=10×9×0.5=45
※X=100√10,Y=81√9,X*Y*R=10*9*0.5=45
5.如果某甲在魏氏智力測驗(μ=100,σ=15)上面的智力分數是136,那麼,該智力分數所相對應的標準化Z分數是多少?答:Z分數=(136-100)÷15=2.4
6.已知M(平均數) =75,Sx(變異數)=6.25,試將Xi=82.5 直線轉換為托福分數及魏氏IQ分數(30分)答:托福分數為800分。魏氏IQ分數為145分。
82.5-75÷6.25√2.5=3
托福M=500,SD=100,3*100+500=800分。
魏氏IQ M=100,SD=15,3*15+100=145分。
7.設有五個國家的GNP如下:(單位:兆元)
國家 甲 乙 丙 丁 戊
CMP 205 431 107 95 896
試問:以此資料為基礎,甲國的百分等級為多少﹖答:PR=70
國家 CMP 人數 累積人數 百分比 百分等級
乙 431 1 5 100 90
甲 205 1 4 80 70
丙 107 1 3 60 50
丁 95 1 2 40 30
戊 89 1 1 20 10
8.如果你的IQ是125(參與魏氏測驗所得的分數),那麼在一萬人當中,你只輸給幾個人?
※魏氏測驗M=100,SD=15,125-100/15=1.666≒1.67,Z 1.67=0.4525≒0.45,0.5+0.45=0.95,故Z值>95%,10000中輸給500人。※10000*95%=9500,10000-9500=500。
9.如果你的托福分數考700分,那麼在一萬個人當中,你只輸給幾個人?
※托福分數M=500,SD=100,700-500/100=2,Z 2=0.4772≒0.47,0.5+0.47=0.97,故Z值>97%,10000中輸給300人。※10000*97%=9700,10000-9700=300。
10.某公司徵才考試以國文和數學二科成績為用才標準,共有200人報考,考試結果原始分數的描述統計如表1.1 所示。某甲與某乙的考試結果如表1.2 所示,依據原始總分,兩人同列第十名,但只能有一人被錄取,某統計學家建議以標準化T分數(M=50,SD=10)為錄取依據,在此情況下,請完成表1.3 中六個細格的訊息,並勾選T分數總分較高者錄取。
表1.1:原始分數統計 表1.2:甲與乙的原始分數 表1.3:甲/乙的T分數
  國文 數學   國文 數學 總分   國文 數學 總分
平均數 70 40 甲 90 20 110 甲 60 30 90
標準差 20 10 乙 50 60 110 乙 40 70 110
※甲:國文分數X=90,M=70,SD=20,數學分數X=20,M=40,SD=10。T:M=50,SD=10。
國文:90-70/20=1,1*10+50=60,數學:20-40/10=-2,-2*10+50=30,總分:90分。
※乙:數學分數X=50,M=70,SD=20,數學分數X=60,M=40,SD=10。T:M=50,SD=10。
國文:50-70/20=-1,-1*10+50=40,數學:60-40/10=2,2*10+50=70,總分:110分。
11.續第七題,假如該國文及數學成績在一般人群中為常態分配(機率值如右圖所示),問甲的數學分數及乙的國文分數在一般人群中分別約高過多少百分比的人?(10分)
甲的數學分數0-40/10=-2,Z-2=-0.4772+0.5=0.0228(2.28%)
乙的國文分數0-70/20=-1,Z-1=-0.3413+0.5=0.1587(15.87%)
甲的數學分數及乙的國文分數在一般人群中分別約高過2.228%及15.87%的人
12.相對地位量數(每題五分,共計十分)
(1)有十個學生的統計考試分數如下:72,65,83,91,54,86,79,66,85,試問:考79分的那個學生的百分等級為何?答:79分之PR=50。
分數 人數 累數人數 百分比 百分等級
91 1 9 100 94
86 1 8 89 83
85 1 7 78 72
83 1 6 67 61
79 1 5 56 50
72 1 4 44 39
66 1 3 33 28
65 1 2 22 17
54 1 1 11 6
(2)有一個學生準備留學美國,他TOEFL分數(M=500,SD=100)考了650分,試將他的分數轉換成T分數(M=50,SD=10)。
650-500/100=1.5,1.5*10+50=65,故T分數為65分。
十一
十二
第十二章 常態分配自我評量題目
※考古題
1.在標準常態分配下,如果總人數為10,000人,則在標準常態分配下的Z=0到Z=2之間共有多少人?答:4772人。※10000*.04772=4772人。
2.隨機取樣500個民眾,測其對政府公務人員服務態度的滿意度(分數介於1分到100分之間),得到平均數為80分,中位數為73分,眾數為68分。由此可推知此一變數在此一樣本的分配型態必然為何?(A)常態分配 (B)正偏態分配 (C)負偏態分配 (D)高狹峰分配 (E)低闊峰分配
3.在五題是非題當中,一個學生盲目亂猜答對四題或四題以上的機率是多少?
可以利用巴斯卡三角算出,答對四題的機率:5/32,答對五題的機率:1/32,答對四題或四題以上的機率 = 5/32 + 1/32 = 6/32
4.某次考試陳老師出了三題是非題,每題答對給 5分,總分15分。張生完全不會,他就閉著眼睛亂猜,請問:他得10分或10分以上的機率有多少?
3題所有可能的組合是
3題全猜對:000…….. 1/8
2對1錯:00X 0X0 X00…….3/8
1對2錯:0XX XX0 X0X……3/8
3題全錯:XXX……………….1/8
f(x>=2)=1/8+3/8=1/2
5.某次考試陳老師出了四題是非題,每題答對給5分,總分20分。張生完全不會,他閉著眼睛亂猜,請問:他得15分或15分以上的機率有多少﹖
4題全對:1/16……得20分
對3題錯1題:4/16…..得15分
15分或15分以上的機率1/16+4/16=5/16
6.試簡述中央極限原理【試簡述中央極限定理】。
中央極限定理 (Central Limit Theorem) 是機率理論及統計學中最重要且常用的結果之一。對許多初學者而言,卻是一個不容易瞭解的抽象概念。為了讓初學者比較容易瞭解及掌握中央極限定理的基本概念,這裡將藉由網路互動式模擬程式,來讓初學者從互動的實驗中理解中央極限定理的基本概念。
這是一個數理統計中十分重要的定理。應用在前例中,其主旨說,如果已知在母群體中的平均售價為50元,標準差為5元,且每次從母群體中抽取 (如:30人)做為樣本,則所獲得的平均售價抽樣分佈圖會符合下列三點特質:
(1)平均售價抽樣分佈的平均值(即所有樣本之平均售價的總平均值),將會等於母群體的平均值。
(2)平均售價抽樣分佈標準差,是相當於母群體中的標準差除以樣本數的平方根。
(3)如果樣本數 n 的值越大,則平均售價抽樣分佈圖會越趨近於常態z分佈。
7.填充題:假設台北市國小學童為母群體,並且已知其平均體重為30公斤,其體重分配之標準差為6公斤;今從中隨機抽取無數多個樣本,每個樣本的人數皆為400人,獲得無數多個樣本平均數x,則這無數多個x所構成的抽樣分配(sampling distribution)將接近常態分配,其平均數為μ,標準差為σ/√N,此一結果所根據的定理被稱為中央極限定理。一般來說,當N愈大且重複抽樣無限多次時,此定理愈成立。
十四
第十四章 t檢定自我評量題目
※考古題一
1.某政治人物民調支持度
選舉前 選舉後
87 96
92 108
75 48
61 63
58 45
95 85
72 55
80 55
68 47
51 42
請以Excel計算相依t考驗,在0.05 檢定水準之下, 在民調支持度選前與選後可有不同?
答案:
t 檢定:成對母體平均數差異檢定
  選舉前 選舉後
平均數 73.9 64.4
變異數 218.3222222 550.2667
觀察值個數 10 10
皮耳森相關係數 0.808603979
假設的均數差 0
自由度 9
t 統計 2.082734671
P(T<=t) 單尾 0.033483825
臨界值:單尾 1.833113856
P(T<=t) 雙尾 0.066967649
臨界值:雙尾 2.262158887  
雙尾檢定接受虛無假設α=0.05 水準., 選前與選後之民調支持度無顯著性之差異。
2.請輸入下列資料
行政學 基礎統計應用與Excel 處理
85 82
82 75
90 80
90 80
75 85
88 85
87 75
85 80
78 99
82 99
以Excel 處理獨立性t檢定, 在0.05 檢定水準之下, 學習這兩科所得分數可有區別?
解答:
t 檢定:兩個母體平均數差的檢定,假設變異數相等

  行政學 基礎統計應用與Excel處理
平均數 84.2 84
變異數 24.84444444 74
觀察值個數 10 10
Pooled 變異數 49.42222222
假設的均數差 0
自由度 18
t 統計 0.06361417
P(T<=t) 單尾 0.474989287
臨界值:單尾 1.734063062
P(T<=t) 雙尾 0.949978574
臨界值:雙尾 2.100923666  
雙尾檢定接受虛無假設α=0.05水準,故學習此兩科所得分數,無顯著性之差異。
※考古題二
1.隨機取樣500個民眾(男女各半),測其對政府公務人員服務態度的滿意度(分數介於1分到100分之間),結果男生平均數為85分,女生平均數為75分,如果我們想要考驗男女平均數是否有顯著差異,可以使用下列何種考驗?(A)Z考驗 (B)獨立樣本t考驗 (C)相依樣本t考驗 (D)卡方考驗 (E)變異數分析F考驗
2.以下是T考驗的統計報表,目的是想瞭解男女在起薪上有何不同。請問女性的起薪的平均數是多少?標準差是多少?兩性在起薪方面是否呈現顯著性的不同?(20分)
t-tests for Independent samples of SEX 性別
Variable Number of Cases Mean SD SE of Mean
SALBEG 最初薪資
男 258 8120.5581 3644.712 226.910
女 216 5236.7870 1174.240 79.897
Mean Difference = 2883.7711
Levene's Test Equality of Variances: F=105.969 P= .000
t-test for Equality of Means 95%
Variances t-value df 2-Tail Sig SE of Mean CI fro DIff
Equal 11.15 472 .000 258.579 (2375.663, 3391.879)
Unequal 11.99 318.82 .000 240.565 (2410.475, 3357.067)
3.在T考驗當中,所衡量的尺度,正常的情況下是至少必須何種尺度?答:等距尺度
4.假如a.自由度是22,我們要達到t考驗中尾檢定0.05的顯著性水準,那麼t值必需至少是多少?如果b.自由度是24,單尾檢定,那麼要達到0.01的顯著性水準,t 值至少必須是多少?
※查閱t分配之臨界值
自由度是22,雙尾檢定0.05為2.074。自由度是24,單尾檢定0.01為2.492。
十五
Q亂碼如何看?
A:說明如下:
1.「亂碼」:指的是電腦系統不能顯示正確的字符,而顯示其他無意義的字符或空白,如一堆ASCII代碼。
2.嘗試將您的問題修改為:「亂數表如何看?」、「如何依據亂數表隨機抽樣?」
3.有關「亂數表如何看?」:首先說明「亂數表如何產生」,其原理是由隨機去編製,使0~9的出現機會都均等,例如可用一個圓盤的周邊刻上0~9,在固定轉速的情況下,轉出指針下的數字,紀錄而成,現在大都是使用電腦來產生隨機亂數表;「亂數表如何看?」亂數表的用途就在於它沒有規律性可循,當我麼要選取隨機的數值時,使用亂數表比較客觀公正。
4. 「如何依據亂數表隨機抽樣?」
(1)指定起始的行列:指定一個數值如<21>,即從第二行第一列,代表從第二行的第一個數字開始向右邊推算,例如教科書p.402為<99>。
(2)抽出數值:如果要抽樣的數值是十位,就以兩個數字為一組,向右取數
(3)抽樣:設有40人依序編號,欲抽出5人做抽樣調查:即
從指定數如<99>向右取5個數:<11>、<04>、<61>、<93>、<71>
因<61>、<93>、<71>大於40,再向右取直到小於40的3個數值出現<08>、<32>、<46>
故這5人抽樣調查結果:<11>、<04>、<08>、<32>、<46>。
(楊關錩老師答覆,97.11.12)
第十五章 簡易變異數分析自我評量題目
※考古題一
1. 請輸入以下管理方式的評分:
放任式 獨栽式 民主式
74 78 82
75 77 85
77 76 79
75 72 80
74 80 82
請問這三种管理方式的效率可有不同? 請以Excel變異數分析處理.
解答:
單因子變異數分析

摘要
組 個數 總和 平均 變異數
放任式 5 375 75 1.5
獨栽式 5 383 76.6 8.8
民主式 5 408 81.6 5.3

ANOVA
變源 SS 自由度 MS F P-值 臨界值
組間 118.5333 2 59.26667 11.39744 0.001683 3.88529
組內 62.4 12 5.2

F值11.39 >3.88529; p<.01,拒絕虛無假設α=0.01水準, 三种管理方式的效率具顯著性之差異。
※考古題二
1.請依據下列變異數分析表
(1)算出(表一)中的Mean Square(MS)值?答:如同下的表格
(2)F值?答:如同下的表格
(3)查教科書中「附表六」是否具備0.05的顯著性水準,而得以拒絕虛無假設,並予以解釋之。答:F=11.8>F2,12,0.05=3.89,拒絕H0;在顯著水準0.05下,拒絕虛無假設,有顯著性差異
(表一) 泛藍選民、泛綠選民與中間選民對陳水扁總統支持程度
變異來源 SS df MS F
組間變異 118 2 59 11.8
組內變異 60 12 5
整體變異 178 14
2.某研究者取樣180個企業單位,將其領導型態歸為三類,並測其員工的工作滿意度(分數介於1分到100分之間),每一個單位都有一個工作滿意度分數。該研究者想知道領導型態與員工工作滿意度之間是否有關係存在,他應該採用下列何種統計分析方式?(A)皮爾遜積差相關係數 (B)卡方考驗 (C)獨立樣本t考驗 (D)相依樣本t考驗 (E)單因子變異數分析
3.請依據下列變異數分析摘要表,(1)算出表格中的Mean Square(MS)值與F值,(2)推估服務型態分成幾種型態,(3)並為統計考驗結果下一個結論或解釋(顯著水準設定為.01)。

依變數:滿意程度 自變數:服務型態 受試者:一般民眾
Sum of Squares df Mean Square F Sig,
Between Groups 1941 2 970.5 5.727933 .005
Within Groups 11352 67 169.4328358
Total 13293.486 69
(1)Mean Square、F值?如同上的答案。
(2)服務型態分成三種。
(3) F=5.727933,p<0.01,拒絕虛無假設α=0.01水準,,在不同的服務型態之間,一般民眾的滿意程度具顯著性之差異。
4.如果我們想要知道台北中心、台北二中心以及高雄中心的學生在期末考「應用統計」的成績上有何不同,當用哪一個統計方法?答:單因子變異數分析。
十 六
第十六章 皮爾遜積差相關自我評量題目
※考古題一
1.請輸入以下資料:
紐約市政府公務員請病假之研究

每週運動時數 每年請假日數
1 4
0 9
0 11
2 2
5 4
6 5
8 1
11 0
以Excel 處理相關係數.
2.如前16-1資料:紐約市政府公務員請病假之研究,請製作散佈圖
解答:

※考古題二
1.如果X和Y的積差相關係數r=0.60,那麼,以簡單直線迴歸的方式去用X預測Y時,Y的變異量當中將有多少百分比可為X所解釋?(A)36﹪ (B)40﹪ (C)60﹪ (D)64﹪ (E)100﹪
2.如果顯著水準定為0.05,而且電腦報表顯示:X和Y的積差相關係數r=0.70,p=0.06,那麼下列何者是最適切的結論?
(A)X和Y的相關係數已達.05顯著水準,X和Y有高相關存在。
(B)X和Y的相關係數已接近.05顯著水準,X和Y有直線相關存在。
(C)X和Y的相關係數未達.05顯著水準,X和Y無直線相關存在。
(D)X和Y的相關係數雖然未達.05顯著水準,但X和Y有高相關存在。
(E)X和Y的相關係數雖然未達.05顯著水準,但若增加取樣人數,新的相關係數就會達到.05顯著水準。
3.如果我們做雙側(尾)考驗,自由度是24,而所得到的皮爾遜積差相關係數的值是0.412,(1)請問它是否呈現顯著性水準?(2)顯著性的水準是多少?(3)是否達到0.01的顯著性水準?
自由度是24,0.05=.388,0.01=.496
(1) 0.412<0.05=.388,有明顯。(2) 顯著性的水準是0.05 (3)沒達到0.01的顯著性水準。
4.有因果關係,一定有相關的存在,但是有相關性,不一定存在因果的關係,請問對不對?
答:對。
十 七
第十七章 卡方考驗自我評量題目
※考古題一
1.請輸入以下資料:答:請參考課本17-3圖
台灣人民對台灣居住環境品質的感覺

觀察次數 fo  
意見
年齡層 不滿意 滿意 (橫)總數
20-35 130 35 =SUM(B7:C7)
36-50 275 60 =SUM(B8:C8)
51以上 195 40 =SUM(B9,C9)
(縱)總數 =SUM(B7:B9) =SUM(C7:C9) =SUM(D7:D9)

※考古題二
1.在做卡方分配時,如何做次母體推論的檢定,應當如何解讀。參考P.344-345
以卡方考驗來計算樣本代表之檢定,亦即適合度的檢定,是用卡方考驗來檢定「樣本是否能代表母體」。譬如,調查者經由調查得知,樣本中所含男、女性別及年齡層,再與經由內政部得知母體所包含男、女性別百分比率,是否呈現顯著性的不同。
例:某民調單位以隨機抽樣訪問台灣地區20歲及以上的選民1000位,當中男性有530位,女性有470位,在年齡層方面,20歲至29歲是223人,30歲至39歲是293人,40歲至49歲是205人,50歲以上是279人,請問這樣的樣本,是否能夠代表母體?※可以的
我們調查內部的人口結構中,得知台灣地區20歲及以上的男、女之比率是52比48,年齡層比率20至29歲是22.5%,30歲至39歲是29.1%,40歲至49歲是20.4%,50歲及以上是28%。
男性的期望值(fe)應是,選民1000位 × 比率0.52=520
女性的期望值(fe)應是,選民1000位 × 比率0.48=480

根據虛無假設:X2=0.4小於3.84(自由度為1→男、女2-1=1),因此虛無假設是被接受在0.05水準,也就是說,就性別而言,樣本與母體是沒有什麼區別的。
就年齡層而言,期望值(fe)如下:
20-29歲(fe):1000×22.5%=225
30-39歲(fe):1000×29.1%=291
40-49歲(fe):1000×20.4%=204
50歲以上(fe):1000×28%=280


2.計算題:(10﹪)
下表中的數字為觀察次數。請根據以下資料進行卡方考驗:(一)請算出每一個細格的期望次數;(二)請算出卡方值;(三)請根據計算結果決定X與Y有無關聯。
fo Y:是否參加政黨?
是 否
X:性別 男 3 2
女 1 4
備註:當df=1,顯著水準設定.05時,卡方值的臨界值為3.84。
(1)
fe Y:是否參加政黨?
是 否
X:性別 男 3(2) 2(3)
女 1(2) 4(3)

(2)卡方值:1.67

(3)自由度df=( =(2-1)×(2-1)=1,df1=3.84,X2=1.67小於3.84(接受虛無假設),P>0.05,是否參加政黨與性別顯著性之差異。
3.某政府機關招考公務員,共有100人報名應徵,其中60人為女性,40人為男性,該機關主管懷疑其公務員職缺似乎對女性較具有吸引力,因此吸引較多女性報名,但又不確定此一性別差異是否為隨機誤差的結果。請你以卡方考驗解決該主管的疑惑(請計算出結果,並下決策)。
備註:當df=1,顯著水準設定.05時,卡方值的臨界值為3.84。(10分)
fe fo fo-fe (fo-fe)2 (fo-fe)2/fe
女性 60 50 10 100 2.00
男性 40 50 -10 100 2.00
χ2 =2.00+2.00= 4.00 > 3.84,達.05顯著水準。
結論:α=0.05水準,應徵該機關公務員考試者,男女比例具顯著之差異。
4.下列數字為觀察次數,請根據下列資料進行卡方考驗(1)計算出卡方值(2)查表有否顯著性,並解釋之。(40分)

(為計算方便只用卡方公式,不用Yate’s校正的公式。)答:參考計算題如同上。
5.如果我們想要知道台北市選民政黨屬性之差異,對年底市長選舉的候選人之投票有何不一樣,當用哪一個統計方法?(10分)
6.在卡方考驗時自由度是5在0.05的顯著水準χ2的值要到多少才能達到顯著性水準?如果要到0.01的顯著水準那麼χ2至少是多少呢?(10分)
自由度是5,0.05的顯著水準的χ2值是11.07,0.01的顯著水準的χ2值是15.092。
7.在卡方檢定χ2 當中,所衡量的尺度,正常的情況下是至少必需何種尺度?(10分)
卡方分配的衡量尺度是名稱尺度。

 
 

沒有留言:

張貼留言