1、10-110-21.定義假設與假設檢定。2.描述假設檢定的 5 個步驟。3.區別單尾檢定與雙尾檢定間的不同。4.進行母體平均數的假設檢定。5.進行母體比例的假設檢定。6.定義型 I 與型 II 誤差。假設假設是一個關於母體參數的陳述,之後則使用資料與計算機率驗證這個陳述是否合理。母體參數的假設例子為:母體參數的假設例子為:對於系統分析師的平均月收入為$3,625。Bovines Chop House 約有 20%的顧客會在一個月內來用餐兩次。10-3假設檢定假設檢定(hypothesis testing):基於樣本證據與機率理論來判斷假設是否合理而要接受,或是假設不合理而要拒絕的過程。10-4
2、10-5虛無假設(虛無假設(null hypothesis)H0:關於母體參數值的假設性敘述。對立假設(對立假設(alternate hypothesis)H1:當樣本資料提供足夠證明虛無假設不為真時,接受的對立敘述就是對立假設。10-6 1.2.3.記得虛無假設始終包含等式包含等式10-70:;0:10HH0:;0:10HH0:;0:10HH型型 I 誤差(誤差(type I error):):當虛無假設 H0 為真時卻被拒絕,用 表示。型型 II 誤差(誤差(type II error):):當虛無假設不正確時卻被接受,用 表示。10-810-9當對立假設當對立假設 H1,表示,表示一個方
3、向一個方向時,即為時,即為單單尾檢定尾檢定,例如:,例如:H1:全職員工的年終獎金超過$35,000。($35,000)H1:行駛在 I-95 公路上的卡車時數每小時小於 60 英里。(60)H1:對於加油的顧客,付現的人數少於 20%。(2.58或 z 0.05,所以。10-2510-26上個問題,利用p值檢定:H0:200H1:200拒絕 H0 若f Z Z其中 Z=1.55 and Z=2.33拒絕H0 若 p-value 0.0606 不小於 0.01結論:不能拒絕 H0a)=0.10,具有一些證據證明 H0 不真。b)=0.05,具有較強證據證明H0 不真。c)=0.01,具有強烈證
4、據證明H0 不真。d)=0.001,具有極端強烈證據證明H0 不真。10-27因為母體標準差已知,且樣本個數 n大於 30,計算公式如下所示:n/Xz10-28因為母體標準差未知,因此使用樣本標準差來估計。同樣的,若樣本個數 n 大於 30,可以使用 s 來代替,計算公式如下所示:10-29zXsn/必須使用 t 分配取代標準常態分配。其檢定統計量為:10-30nsXt/McFarland保險公司處理一件理賠案件需要花費$60。與其他保險公司比較,McFarland 保險公司處理理賠案件的成本比其他公司高,因此該公司進行了降低成本的計畫。為了評估降低成本計畫的成效,McFarland 保險公司
5、隨機抽選最近的 26 件理賠案件,其樣本資料如下所示:在 0.01 的顯著水準下,可以說處理理賠案件的平均成本低於$60 嗎?10-3110-32步驟步驟 1:建立虛無假設與對立假設。:建立虛無假設與對立假設。H0:60;H1:60步驟步驟 2:選擇顯著水準。:選擇顯著水準。其為 0.01步驟步驟 3:計算檢定統計量。計算檢定統計量。檢定統計量是 t 分 配。因為樣本數小於 30。我們可以合理地假設每件理賠案件的平均成本服從常態分配。10-33nsXt/步驟步驟 4:陳述決策法則。:陳述決策法則。附錄 B.2 表格最左邊的那一行標示為 df(自由度),即樣本內觀測資料數量減去樣本的組數,寫成
6、n1。此範例的樣本數量是 26,組數是 1 組,所以自由度是261=25,在表格中找到自由度是 25 的那一列。此範例為,因此在表格中找到標示單尾部分,找出顯著水準 0.01 的那一行,再從左邊找到自由度為 25 的那一列,交叉點是 2.485,也就是所計算之檢定統計量值。此外,又因本例為單尾檢定且,所以臨界值為負數(2.485)。而決策法則是如果t值小於2.485,就必須拒絕H0。10-34步驟步驟 5:做決策。:做決策。26 個樣本的平均成本是$56.42,樣本標準差是$10.04。把這些值代入公式 10-2 中,計算出 t 值:因為1.818 落在臨界值 2.485 的右邊,所以在 0.
7、01 顯著水準下,不能拒絕虛無假設。這表示降低成本計畫,並沒有將平均處理成本降至$60 以下。也就是樣本平均數$56.42與母體平均數$60 之間的差距$3.58,可能源自抽樣誤差。10-3510-36t 分配的拒絕域,顯著水準為 0.01 10-37 一個小型平衡錘的平均長度是 43 公釐。生產主管認為調整後的機器所生產之平衡錘的長度已經改變,他要求工程部門進行調查。工程部門選取了 12 個平衡錘的樣本進行測量。其測量結果如下表所示:可以說平衡錘的平均長度已經改變了嗎?請使用 0.02 顯著水準。10-38先建立虛無假設與對立假設。H0:=43 H1:43 本例為雙尾檢定,且其自由度是 n1
8、=121=11。根據以上資料,從附錄B.2中的雙尾檢定,使用 0.02 顯著水準找出 t 值是2.718。決策法則是:如果檢定統計量 t 落在2.718的左邊或是 2.718 的右邊,則。我們將上述資訊整理成圖10-7。10-39t 分配雙尾檢定的拒絕域,其中=0.0210-40使用公式 10-2 計算 t 值:因為計算出來的 t 值是2.913,落在2.718的左邊區域,所以是 43 公釐的虛無假設,。因此結論是母體平均數不是 43 公釐,機器需要再做調整。10-4110-42比例的定義是成功次數與觀測資料總數量的比例。10-43計算樣本計算樣本比例比例 p 的公式為的公式為 10-4410
9、-45:為母體比例p:為樣本比例 在前一次的印地安那州長選舉顯示,如果候選人要當選,那麼至少要在北區贏得 80%的選票。現任州長想要了解繼續連任的機會有多大,他計畫在本州北區隨機抽選 2,000 位合格選民進行調查。使用假設檢定的步驟,了解現任州長連任機會。10-46 州長選舉的情形符合二項分配的條件,但這個範例可以使用常態分配去近似二項分配,因為n與 n(1)皆超過 5。n=2,000,=0.8(是在本州北區的得票率,也就是 80%),所以 n=2,000 0.8=1,600與 n(1)=2,000 (10.8)=400 都大於 5,可以進行母體比例的檢定。10-4710-48步驟步驟 1:
10、建立虛無假設與對立假設。:建立虛無假設與對立假設。H0:0.8;H1:0.8 步驟步驟 2:選擇顯著水準。:選擇顯著水準。其為 0.05步驟步驟 3:選擇檢定統計量。:選擇檢定統計量。使用 z 統計量,npz110-49步驟步驟 4:建立決策法則。:建立決策法則。顯著水準是 0.05,這機率是左尾拒絕域的面積。因此,z 值介於 0與臨界值之間的機率是0.50.05=0.45。再參考附錄 B.1 中面積接近0.45所相對應的 z 值是 1.65。所以在左尾的臨界值是1.65。因此決策法則是:如果透過樣本計算出來的檢定統計量小於1.65時,必須拒絕虛無假設,並接受對立假設;反之,則不得拒絕虛無假設
11、 H0。10-50步驟步驟 5:做決策。:做決策。抽選 2,000 位合格選民進行調查,其中指出有1,550 位選民打算投給現任州長。樣本比例是1,550/2,000=0.775。10-51 z 值2.8落在拒絕域中,因此在顯著水準0.05 下,拒絕虛無假設。這表示在樣本比例 77.5%與假設母體比例 80%間,2.5%的差距在統計上是顯著的,因此差距可能不是抽樣誤差所引起的。換句話說,樣本證據無法支持現任州長會繼續連任的說法。10-52 p-值為計算 z 值小於2.8的機率。從附錄 B.1 找出介於 0 至 2.8 範圍內 z 值的機率是 0.4974,由此可知 p-值是0.50.4974=0.0026。此 p-值小於顯著水準 0.05,這表示州長要連任的機率非常小。10-53顯著水準 0.05 與單尾檢定的拒絕域10-54