1、量化研究與統計分析量化研究與統計分析謝寶煖謝寶煖台灣大學圖書資訊學系台灣大學圖書資訊學系2006年年4月月1日日自變數依變數統計分析方法類別類別類別類別交叉表交叉表卡方檢定卡方檢定類別類別連續連續比較平均數比較平均數變異數分析變異數分析連續連續相關分析連續類別迴歸分析p大學生是不是很需要大學生是不是很需要IL的五大能力的五大能力p男生、女生對男生、女生對IL的五項能力的需要程度是不是一樣?的五項能力的需要程度是不是一樣?p不同學院的學生對不同學院的學生對IL的五項能力的需要程度是不是一樣?的五項能力的需要程度是不是一樣?p不同年級的學生對不同年級的學生對IL的五項能力的需要程度是不是一樣?的五
2、項能力的需要程度是不是一樣?n獲取資訊資源的能力獲取資訊資源的能力n批判思考的能力批判思考的能力n解決問題的能力解決問題的能力n學科應用學科應用n職場生涯的競爭力職場生涯的競爭力p老師、學生對圖書館服務的滿意程度是不是一樣?老師、學生對圖書館服務的滿意程度是不是一樣?T檢定:基本概念檢定:基本概念p連續變數連續變數n次數分配:歸類整理次數分配:歸類整理n描述統計:描述統計:p集中趨勢量數集中趨勢量數(平均數、中數、眾數)(平均數、中數、眾數)p離散量數離散量數(全距、四分差、標準差、變異數)(全距、四分差、標準差、變異數)p抽樣分配特性抽樣分配特性n研究者無法確知抽樣過程是否具有偏差而違反常態
3、分研究者無法確知抽樣過程是否具有偏差而違反常態分配的基本要求,因此,連續變數的考驗必須特別考慮配的基本要求,因此,連續變數的考驗必須特別考慮抽樣分配的特性,選取適當的檢驗方式抽樣分配的特性,選取適當的檢驗方式p母群的多寡母群的多寡t檢定檢定:單母群與多母群單母群與多母群p單母群的平均數檢定單母群的平均數檢定n一個連續變數的得分可以計算出一個平均數,例如薪一個連續變數的得分可以計算出一個平均數,例如薪資的平均數或學業成績的平均數,如果研究者僅對單資的平均數或學業成績的平均數,如果研究者僅對單一變數的平均數加以檢驗,不考慮其他變數的影響,一變數的平均數加以檢驗,不考慮其他變數的影響,稱為單母群的平
4、均數考驗稱為單母群的平均數考驗p多母群的平均數檢定多母群的平均數檢定n同時考慮不同情況之下的平均數是否有所差異,例如同時考慮不同情況之下的平均數是否有所差異,例如男生與女生的平均數比較,此時即牽涉到多個平均數男生與女生的平均數比較,此時即牽涉到多個平均數的考驗;不同平均數,代表背後具有多個母群存在,的考驗;不同平均數,代表背後具有多個母群存在,因此稱為多母群的平均數考驗。因此稱為多母群的平均數考驗。t檢定檢定:單尾與雙尾檢定單尾與雙尾檢定p平均數檢定與卡方檢定不同,平均數檢定會因為平均數檢定與卡方檢定不同,平均數檢定會因為研究假設的方向性,而有單尾或雙尾檢定之區分研究假設的方向性,而有單尾或雙
5、尾檢定之區分p平均數檢定旨在比較不同平均數的大小差距,而平均數檢定旨在比較不同平均數的大小差距,而提出兩個平均數大於、小於或不等於等提出兩個平均數大於、小於或不等於等 不同形式不同形式的研究假設的研究假設ONE AND TWO-TAILED t-TESTSp單尾單尾或是雙尾的或是雙尾的T檢定,是取決於檢定,是取決於 是全部放在一是全部放在一邊或是平均分配在兩邊。邊或是平均分配在兩邊。p單尾單尾T檢定是用在只關心特定方向的結果時;而檢定是用在只關心特定方向的結果時;而雙尾雙尾T檢定則是結果的兩個方向都關心。檢定則是結果的兩個方向都關心。p單尾或是雙尾單尾或是雙尾T檢定之選擇,考量各種不同的假檢定
6、之選擇,考量各種不同的假設檢定情況。設檢定情況。TWO-TAILED t-TESTSp雙尾檢定雙尾檢定(two-tailed test)n無特定方向的假設,如:男生的薪資與女生的薪資有無特定方向的假設,如:男生的薪資與女生的薪資有所不同所不同n假設在兩個極端的情況都有可能發生,而必須設定兩假設在兩個極端的情況都有可能發生,而必須設定兩個拒絕區,個拒絕區,n虛無假設虛無假設 H0:1=2 (1-2=0)n對立假設對立假設 H1:1 2 (1-2 0)TWO-TAILED t-TESTSp雙尾雙尾T檢定是將檢定是將 值平均分配在兩端值平均分配在兩端p虛無假設之臨界值(虛無假設之臨界值(critic
7、al value)有有二:一為正,二:一為正,一為負,一為負,t值則是以正負號表示值則是以正負號表示()n例如:自由度為例如:自由度為10(df=10),而而 定為定為0.05,則則t 10,.05=2.228,其抽樣分配模式可以圖示如下:其抽樣分配模式可以圖示如下:22ONE-TAILED t-TESTSp單尾檢定(單尾檢定(one-tailed test)n只關心單一方向的比較關係時,如:男生的薪資只關心單一方向的比較關係時,如:男生的薪資x1高高於女生的薪資於女生的薪資x2 n平均數的考驗僅有一個拒絕區平均數的考驗僅有一個拒絕區n虛無假設虛無假設 H0:1 2p例如:例如:n自由度為自由
8、度為10(df=10)n 定為定為0.05nt 10,.05=1.812,其抽樣分配模式可以圖示如下:其抽樣分配模式可以圖示如下:p例如:例如:n自由度為自由度為10(df=10)n 定為定為0.05nt 10,.05=1.812,其抽樣分配模式可以圖示如下:其抽樣分配模式可以圖示如下:Comparison of One and Two-tailed t-testsp如果如果tOBS=3.37,那麼在雙尾和右邊單尾,都是那麼在雙尾和右邊單尾,都是顯著的;但是左邊單尾則是不顯著的;這是單尾顯著的;但是左邊單尾則是不顯著的;這是單尾檢定的風險。檢定的風險。Comparison of One and
9、 Two-tailed t-testsp如果如果tOBS=-1.92,那麼只有在左邊單尾才顯著;那麼只有在左邊單尾才顯著;檢定方向應該在研究設計時就設想好,而不是在檢定方向應該在研究設計時就設想好,而不是在檢定時操弄,有經驗的審稿者看到單尾檢定就會檢定時操弄,有經驗的審稿者看到單尾檢定就會特定注意其適用性的。特定注意其適用性的。Comparison of One and Two-tailed t-testsn單尾檢定由於僅需考慮單方向的差異性,因此在同樣單尾檢定由於僅需考慮單方向的差異性,因此在同樣的顯著水準下,可以較雙尾檢定容易得到顯著的結果,的顯著水準下,可以較雙尾檢定容易得到顯著的結果,
10、即其統計檢定力即其統計檢定力(power of test)大於雙尾檢定,因此採大於雙尾檢定,因此採用單尾檢定對於研究者似乎較為有利。用單尾檢定對於研究者似乎較為有利。n採用單尾檢定必須提出支持證據,除非理論文獻支持採用單尾檢定必須提出支持證據,除非理論文獻支持單尾檢定的概念,或是變項間的關係具有明顯的線索單尾檢定的概念,或是變項間的關係具有明顯的線索顯示須使用單尾檢定,否則以採雙尾檢定來考驗平均顯示須使用單尾檢定,否則以採雙尾檢定來考驗平均數的特性。數的特性。t檢定:獨立樣本與相依樣本檢定:獨立樣本與相依樣本p在多母數的平均數考驗中,不同的平均數進行相互比較,在多母數的平均數考驗中,不同的平均
11、數進行相互比較,然而不同的平均數可能計算自不同的樣本,亦有可能計算然而不同的平均數可能計算自不同的樣本,亦有可能計算自同一個樣本的同一群人,或是具有配對關係的不同樣本。自同一個樣本的同一群人,或是具有配對關係的不同樣本。根據機率原理,當不同的平均數來自不同的獨立樣本,兩根據機率原理,當不同的平均數來自不同的獨立樣本,兩個樣本的抽樣機率亦相互獨立個樣本的抽樣機率亦相互獨立p重複量數設計(重複量數設計(repeated measure design)n不同的平均數來自於同一樣本的同一群人不同的平均數來自於同一樣本的同一群人n例:圖資所學生的四學期平均成績例:圖資所學生的四學期平均成績p配對樣本設計
12、(配對樣本設計(matched sample design)n配對關係的不同樣本配對關係的不同樣本n例:夫妻兩人的薪資多寡、同組的成績例:夫妻兩人的薪資多寡、同組的成績n重複量數和配對樣本,樣本抽取的機率不是獨立的,是相依的。重複量數和配對樣本,樣本抽取的機率不是獨立的,是相依的。T 檢定的基本假設檢定的基本假設p常態分配常態分配p變異數同質性變異數同質性常態檢定常態檢定p程序:程序:n分析分析描述性統計描述性統計/摘要摘要預檢資料預檢資料統計圖統計圖常態機率圖附檢定常態機率圖附檢定顯示常態機率和去除趨勢常態機率圖。會顯示 Kolmogorov-Smirnov 統計量以及檢定常態性的 Lill
13、iefors 顯著水準。如果樣本大小不超過 50 個的話,就會計算 Shapiro-Wilk 統計量。敘述統計敘述統計4.623.40E-024.564.694.675.00.344.591541.00-2.108.1418.365.2824.115.19E-024.014.214.194.00.799.891541.00-.899.141.558.282平均數下限上限平均數的 95%信賴區間刪除兩極端各 5%觀察值之平均數中位數變異數標準差最小值最大值範圍四分位全距偏態峰度平均數下限上限平均數的 95%信賴區間刪除兩極端各 5%觀察值之平均數中位數變異數標準差最小值最大值範圍四分位全距偏態峰
14、度獲取資訊資源的能力批判思考的能力統計量標準誤常態檢定常態檢定.397297.000.233297.000.289297.000.334297.000.289297.000獲取資訊資源的能力批判思考的能力解決問題的能力學科應用職場生涯的競爭力統計量自由度顯著性Kolmogorov-Smirnov檢定aLilliefors 顯著性校正a.由上表之由上表之Lilliefors常態性顯著水準常態性顯著水準Kolomogorov-Smimov統計量可知,批判思考能力與獲取資訊統計量可知,批判思考能力與獲取資訊資源能力檢定之分佈常態化假設均達資源能力檢定之分佈常態化假設均達0.05之顯著水準之顯著水準獲
15、取資訊資源的能力 的常態 Q-Q 圖觀察值6543210期望次數常態.50.0-.5-1.0-1.5-2.0-2.5-3.0t檢定檢定p程序程序n單一樣本單一樣本t檢定檢定p檢定單一變數的平均數,是否跟指定的常數不同檢定單一變數的平均數,是否跟指定的常數不同p例:資優生的平均例:資優生的平均IQ是否不同於一般學生是否不同於一般學生 180n獨立樣本獨立樣本t檢定檢定p比較兩組不同樣本測量值的平均數比較兩組不同樣本測量值的平均數p例:研究生與大學生之網路利用頻率是否有差異?例:研究生與大學生之網路利用頻率是否有差異?n重複量數樣本之檢定重複量數樣本之檢定p例:期中考與期未考成績是否有顯著差異例:
16、期中考與期未考成績是否有顯著差異n配對樣本配對樣本t檢定檢定p比較單一樣本或配對樣本在兩個變數的平均數比較單一樣本或配對樣本在兩個變數的平均數p例:前後測之研究設計例:前後測之研究設計單一樣本單一樣本t檢定檢定n檢定單一變數的平均數,是否跟指定的常數不同檢定單一變數的平均數,是否跟指定的常數不同n例:資優生的平均例:資優生的平均IQ是否不同於一般學生是否不同於一般學生n程序:分析程序:分析比較平均數法比較平均數法單一樣本單一樣本t檢定檢定p例例1:汽水標示重量:汽水標示重量1000公克,隨機挑選公克,隨機挑選10瓶,檢定其標示是瓶,檢定其標示是否不符?否不符?p例例2:大學生是否需要:大學生是
17、否需要IL五項能力五項能力p例例1:汽水標示重量:汽水標示重量1000公克,隨機挑選公克,隨機挑選10瓶,檢瓶,檢定其標示是否不符?定其標示是否不符?單一樣本平均數檢定的樣本平均數為976公克,t-2.563,p0.031(p0.05),達到0.05的顯著水準,表示該品牌的汽水重量標示不實;同時從樣本平均數的大小(976公克)可知,其重量低於標示值1000公克。單一樣本統計量單一樣本統計量10976.000029.61619.3654VAR00001個數平均數標準差平均數的標準誤單一樣本檢定單一樣本檢定-2.5639.031-24.0000-45.1861-2.8139VAR00001t自由度
18、顯著性(雙尾)平均差異下界上界差異的 95%信賴區間檢定值=1000單一樣本統計量單一樣本統計量3024.62.583.37E-023024.12.895.13E-023014.33.824.73E-023014.44.774.47E-022984.32.784.52E-02獲取資訊資源的能力批判思考的能力解決問題的能力學科應用職場生涯的競爭力個數平均數標準差平均數的標準誤p例例2:大學生是否需要:大學生是否需要IL五項能力五項能力單一樣本檢定單一樣本檢定18.496301.000.62.56.692.260301.025.121.50E-02.226.882300.000.33.23.429
19、.819300.000.44.35.537.055297.000.32.23.41獲取資訊資源的能力批判思考的能力解決問題的能力學科應用職場生涯的競爭力t自由度顯著性(雙尾)平均差異下界上界差異的 95%信賴區間檢定值=4獲取資訊資源能力單一樣本平均數檢定的樣本平均數為4(需要),t-18.496,p0.000(p.05),顯示男生和女生樣本的變異性(離散情形)沒有顯著差異(是一致的);故假設變異數相等假設變異數相等變異數同質性假設變異數同質性假設p獨立樣本獨立樣本t檢定檢定(homogeneity of vairance)n樣本變異數同質樣本變異數同質p具有相似的離散情形具有相似的離散情形n
20、樣本變異數不同質樣本變異數不同質p兩個樣本在平均數差異外,還有其他差異來源兩個樣本在平均數差異外,還有其他差異來源nLevens test of homogeneity,變異分析(變異分析(F檢定),計檢定),計算兩個變異數的比值算兩個變異數的比值p達顯著水準,表示兩個樣本的變異數不同質,使用校正公式來達顯著水準,表示兩個樣本的變異數不同質,使用校正公式來計算計算t值值獨立樣本檢定獨立樣本檢定2.143.1441.007294.315.996267.507.3203.269.072.079294.937.080290.369.936.083.773.585293.559.585277.608.
21、5593.805.052-.710293.479-6.48E-02-.721291.831.472-6.48E-021.710.192-.329290.742-2.98E-02-.332284.843.740-2.98E-02假設變異數相等不假設變異數相等假設變異數相等不假設變異數相等假設變異數相等不假設變異數相等假設變異數相等不假設變異數相等假設變異數相等不假設變異數相等獲取資訊資源的能力批判思考的能力解決問題的能力學科應用職場生涯的競爭力F 檢定顯著性變異數相等的 Levene 檢定t自由度顯著性(雙尾)平均數相等的 t 檢定T檢定:假設變異數相等檢定:假設變異數相等男生和女生獲取資訊資源
22、能力上並沒有顯著差異。男生和女生獲取資訊資源能力上並沒有顯著差異。(t=1.007,p=.315.05)t檢定:抽樣分配特性檢定:抽樣分配特性p當母群標準差(變異數當母群標準差(變異數 2)已知,根據中央極限定理,來)已知,根據中央極限定理,來確認抽樣分配的標準誤,再基於常態分配的假設,進行確認抽樣分配的標準誤,再基於常態分配的假設,進行Z檢定檢定。p當母群標準差(變異數當母群標準差(變異數 2)未知,抽樣分配的標準誤必須)未知,抽樣分配的標準誤必須由樣本標準差來推估,因此可能因為樣本過小而造成偏誤,由樣本標準差來推估,因此可能因為樣本過小而造成偏誤,而需使用而需使用t檢定來進行考驗。檢定來進
23、行考驗。p但是母群體的標準差多無法得知,因此使用但是母群體的標準差多無法得知,因此使用Z考驗的機會考驗的機會並不多。並不多。p再者,由於再者,由於t檢定具有檢定具有robust statistics的特性,可隨著自由的特性,可隨著自由度的改變度的改變n大於大於30時,時,t分配和分配和Z分配十分接近,使用分配十分接近,使用t檢定檢定其實涵蓋了其實涵蓋了Z檢定的應用檢定的應用p所以,在統計分析實務,多以所以,在統計分析實務,多以t檢定來進行單樣本的平均檢定來進行單樣本的平均數考驗或平均數的差異檢定。數考驗或平均數的差異檢定。pRobust statistics 強韌統計強韌統計n可以視不同分配特性而調整理論分配的檢定方式,能可以視不同分配特性而調整理論分配的檢定方式,能夠適應不同的問題而變化夠適應不同的問題而變化