1、第 8 章區間估計統計實例pFood Lion 於 1957 年成立時的名稱是 Food Town,目前已是美國最大的連鎖超市之一,在美國的東南部 11 州共有 1,200 家分店。pFood Lion 建立了七類存貨組合的 LIFO 指標,包括雜貨、紙類/家用品、寵物用品、美容保健產品、乳品、香菸/菸草,以及啤酒/酒。p最近一年,美容保健產品類的 LIFO 指標是 1.015,以 95%的信賴水準,Food Lion 求算樣本估計值的邊際誤差是 0.006。p母體的 LlFO 指標的 95%區間估計值是 1.009 到1.021。此種準確度是很理想的。第8章區間估計 第290頁 2第 8 章
2、 區間估計p8.1 母體平均數:已知p8.2 母體平均數:未知p8.3 樣本大小的決定p8.4 母體比例第8章區間估計 第289頁 3點估計值 邊際誤差邊際誤差與區間估計值第8章區間估計 第290頁 4邊際誤差與區間估計值第8章區間估計 第291頁 58.1 母體平均數:已知p為了求算母體平均數的區間估計值,必須知道母體的標準差 或樣本的標準差 s 以計算邊際誤差。p 很少是已知的數值,但歷史資料或其他某些可用的訊息,讓我們得以在抽樣前取得母體標準差的優良估計值。p在此情況下,可視母體標準差已知,我們稱此為 已知(known)的情況。第8章區間估計 第291頁 6母體平均數的區間估計:已知樣本
3、平均數的抽樣誤差等於或少於 的機率為 1-。/2/2所有值的 1-的抽樣分配 xZ/2x第8章區間估計7/2/2的抽樣分配 xz2/xz2/iiiw xxwiiiw xxwiiiw xxwiiiw xxwiiiw xxw母體平均數的區間估計:已知所有值的 1-第8章區間估計8母體平均數的區間估計:已知p母體平均數的區間估計值:已知其中:為樣本平均數 1-為信賴係數 z/2 為右尾面積/2 的標準常態分配的 z 值 為母體標準差 n 為樣本大小x第8章區間估計 第293頁 9邊際誤差與區間估計:已知(實例)p第7章 CJW 例子中的歷史資料顯示,滿意度分數的母體是標準差 20 的常態分配。第8章
4、區間估計 第292頁 圖8.1 10邊際誤差與區間估計:已知(實例)p利用標準常態分配表,我們可以發現有 95%的常態分配隨機變數的值會落在離平均數 1.96 個標準差內。因為 的抽樣分配是常態分配,因此,有 95%的 值必須落在 1.96 內。洛依德公司的例子中,的抽樣分配是常態分配,標準誤 2。因為 1.96 1.96(2)3.92。我們的結論是:樣本大小為 n100 而得到的樣本平均數會有95%落在母體平均數 3.92 的範圍內(見圖 8.2)。xxxxxx第8章區間估計 第291-292頁 11邊際誤差與區間估計:已知(實例)第8章區間估計 第292頁 圖8.212邊際誤差與區間估計:
5、已知(實例)p以 洛依德公司為例,如果以 3.92 為邊際誤差,可以用 3.92 來計算 的區間估計值。為了解釋區間估計值的意義,我們先假定選取三個不同的隨機樣本,每個樣本都有 100 名CJW 的顧客,第一個樣本的樣本平均數是圖 8.3 的 。由圖 8.3 可看出,自 加減 3.92 得到的區間會涵蓋母體平均數 。如果隨機樣本得到的 如圖 8.3 所示,可以看到 顯然不等於 ,但是自 加減 3.92 得到的區間仍會涵蓋母體平均數。然而,若第三個樣本平均數是圖 8.3 的 ,情況又是如何?我們可看出此情況下的 3.92 而形成的區間並未涵蓋母體平均數。因為 落在抽樣分配的右尾,而且距離 超過
6、3.92。x1x2x2x1x2x3x3x3x第8章區間估計 第292頁 3x13邊際誤差與區間估計:已知(實例)p圖 8.3 陰影區內的任何樣本平均數 所建立的區間,都會包含母體平均數 。由於所有可能的樣本平均數有 95%都落在陰影區,所以將樣本平均數 加或減3.92 所形成的所有區間,有 95%會包含母體平均數 。x第8章區間估計 第292頁 x14邊際誤差與區間估計:已知(實例)第8章區間估計 第293頁 圖8.315邊際誤差與區間估計:已知(實例)p假定最近數週內,洛依德公司的品管團隊調查 100 位顧客,得到的樣本平均滿意度分數是 82,以 3.92計算區間估計值,可以得到 82 3.
7、92。因此,以最近一個月的樣本資料得到的區間估計值是 823.9278.08 到 823.9285.92。由於以 3.92 建立的各種區間估計值中,有 95%的區間估計值會包含母體平均數,因此,我們可以說有 95%的信心,78.08 到 85.92 的區間會包含母體平均數 。我們也可以說,這個區間是在 95%的信賴水準(confidence level)下建立的。其中,0.95稱為信賴係數(confidence coefficient),區間 78.08 到 85.92 則稱為 95%信賴區間(confidence interval)。xxx第8章區間估計 第293頁 16邊際誤差與區間估計:
8、已知(實例)p我們運用式(8.1)來建立 CJW 的 95%信賴區間。95%信賴區間,其信賴係數(1)0.95,因此,0.05。利用標準常態分配的機率表,右尾面積是/20.05/20.025,z0.0251.96。洛依德公司的樣本平均數是 82,=20,樣本大小n=100。我們可以得到因此,利用式(8.1),邊際誤差是 3.92,95%的信賴區間是823.9278.08到 823.9285.92。x第8章區間估計 第293-294頁 1720821.96823.92100邊際誤差與區間估計:已知(實例)p雖然95%的信賴水準很常使用,但其他如 90%及 99%的信賴水準也很常見。最常見的信賴水
9、準之z/2值整理在表8.1。第8章區間估計 第294頁 表8.118邊際誤差與區間估計:已知(實例)p使用這些值及式(8.1),CJW 問題的 90%信賴區間是p因此,在 90%的信賴水準下,邊際誤差是 3.29,信賴區間是 823.2978.71 到823.2985.29。同樣地,99%的信賴區間是因此,在 99%的信賴水準下,邊際誤差是 5.15,信賴區間是 825.1576.85 到855.1587.15。p比較90%,95%及99%三種信賴水準,我們可以看到,信賴水準提高時,信賴區間的寬度也會增加。第8章區間估計 第294頁 1920821.645100823.2920822.5761
10、00825.15p實際樣本數邊際誤差與區間估計:已知(實例)第8章區間估計 第294頁 208.2 母體平均數:未知p如果不能在抽樣前假定母體標準差 已知,就要以樣本標準差 s 來估計母體標準差。p此種情況稱為 未知(unknown)的情況。p若以 s 來估計 ,邊際誤差及母體平均數的區間估計值是根據稱為 t 分配(t distribution)的機率分配求算而得。第8章區間估計 第296頁 21第8章區間估計 第296頁 t 分配22t 分配第8章區間估計 第296頁 23t 分配0z,t第8章區間估計 第297頁 圖8.424t 分配p我們將以 t 的右下標表示 t 分配右尾的機率,正如
11、z0.025 表示標準常態分配右尾面積為 0.025 所對應的值一樣,t0.025代表 t 分配右尾面積為 0.025 所對應的 t 值。通常,我們以 t/2表示 t 分配右尾面積為 /2 時所對應的 t 值(見圖 8.5)。第8章區間估計 第297頁 25t 分配第8章區間估計 第297頁 圖8.526t 分配p附錄B的表2為 t 分配表,表8.2為t分配表的一部分,表中的每一列對應到特定自由度的t分配。當 t 分配的自由度為 9時,則 t0.0252.262;同理,t分配的自由度是 60 時,t0.0252.000。當自由度繼續地增加,則 t0.025 愈逼近 z0.0251.96。pT
12、分配表中自由度為無限大()的對應欄位中可發現標準常態分配的 z 值。假如自由度大於 100,就可用自由度無限大的 t值來近似。p自由度超過 100 的 t 分配,標準常態 z 值是很好的近似值。第8章區間估計 第297頁 27第8章區間估計 第298頁 表8.2t 分配28t 分配第8章區間估計 第298頁 表8.229t 分配第8章區間估計 第298頁 表8.230t 分配第8章區間估計 第298頁 表8.231母體平均數的區間估計:未知p區間估計其中:1-=信賴係數 t/2=自由度為 n-1,而右尾面積為/2 所對應的 t 值 s =樣本標準差第8章區間估計 第299頁 32母體平均數的區
13、間估計:未知(實例)p某個研究調查了美國家庭的信用卡帳戶餘額,以瞭解信用卡債務的情形。研究中共有 70 個家庭的信用卡帳戶資料的餘額,如表 8.3。p因為沒有任何歷史資料,我們並不知道信用卡帳戶餘額的母體標準差,因此,必須利用樣本標準差 s 來估計母體標準差。接下來,我們要建立母體平均數的 95%信賴區間。第8章區間估計 第299頁 33母體平均數的區間估計:未知(實例)第8章區間估計 第299頁 表8.334母體平均數的區間估計:未知(實例)p首先,利用表8.3的資料算出樣本平均數$9,312,樣本標準差 s$4,007。信賴水準是95%,樣本大小是 70,自由度為 n169,查表8.2可得
14、適當的t0.025值。我們可在自由度為69的列找到右尾是0.025時的t0.025=1.995。因此,母體平均數的點估計值是$9,312,邊際誤差是$955,95%信賴區間是9,312955$8,357 到 9,312955$10,267。x第8章區間估計 第299-300頁 35400793121.995709312955母體平均數的區間估計:未知p如果母體是常態分配,式(8.2)的區間估計公式可以適用於任何大小的樣本,並產生確切的區間估計值。p如果母體不是常態分配,則式(8.2)只是區間估計的近似值。此種情況下,近似值的近似程度則視母體的分配及樣本大小而定。第8章區間估計 第300頁 36
15、母體平均數的區間估計:未知p大部分的實際應用中,以式(8.2)建立母體平均數的信賴區間時,樣本大小n 30 就已足夠。p但是,如果母體分配有嚴重的偏態或是離群值,許多統計學者會建議最好將樣本大小增加到 50 或更多。p如果母體不是常態分配,但大致上對稱,樣本大小至少為 15,也可以用式(8.2)得到良好的近似信賴區間。p但在樣本更小時,只有分析人員相信或可以假定母體分配至少是近似常態時,才能使用式(8.2)。第8章區間估計 第300頁 37母體平均數的區間估計:未知使用小樣本(實例)p以 Scheer 工業公司訓練計畫之評估為例,說明小樣本下之區間估計的推算過程。Scheer 工業公司的製造經
16、理想要利用電腦來輔助訓練公司的維修人員,希望經由電腦訓練可減少訓練時間。為了評估這種訓練方式,該經理希望能夠估計在電腦輔助下的平均訓練時間。p假設管理者同意 20 名員工接受這項新的訓練,每一位員工所需的訓練天數如表 8.4 所示,樣本資料的直方圖如圖 8.7 所示。第8章區間估計 第300頁 38母體平均數的區間估計:未知使用小樣本(實例)第8章區間估計 第301頁 表8.439母體平均數的區間估計:未知使用小樣本(實例)第8章區間估計 第301頁 圖8.740母體平均數的區間估計:未知使用小樣本(實例)p計算出的樣本平均數和樣本標準差如下。查表得知自由度為 n119 時,t0.0252.0
17、93,運用式(8.2)可求得 95%信賴區間的估計值。因此,母體平均數之點估計值為 51.5 天,邊際誤差是 3.2 天,母體平均數之 95%信賴區間為 51.53.248.3 天到 51.53.254.7 天。第8章區間估計 第301頁 41母體平均數的區間估計:未知區間估計程序總整理p圖 8.8 列出兩種情況下的母體區間估計程序。大部分的實際應用中,樣本大小 n 30就已足夠。p如果母體是常態分配或近似常態,即使樣本大小不到 30 也可使用。但是 未知的情況,如果母體有嚴重的偏態或是有離群值,樣本大小最好為 n 50。第8章區間估計 第302頁 42母體平均數的區間估計:未知區間估計程序總
18、整理第8章區間估計 第302頁 圖8.8438.3 樣本大小的決定第8章區間估計 第305頁 44p邊際誤差邊際誤差母體平均數區間估計所需的樣本數母體平均數區間估計所需的樣本數母體平均數區間估計的樣本大小第8章區間估計 第305-306頁 45母體平均數區間估計的樣本大小p即使 未知,如果先前已有 的初始值或計畫值(planning value),仍可使用式(8.3)。實務上有下列方式可供選擇:1.利用前側實驗獲得的母體標準差作為 的計畫值。2.利用前測實驗獲得的樣本標準差作為 的計畫值。3.利用判斷或最佳猜測法來決定 值。例如,先估計母體的最大值與最小值,最大值與最小值的差距可作為全距的估計
19、值,再將全距除以 4 作為標準差的約略估計值,以作為母體 的計畫值。第8章區間估計 第306頁 46母體平均數區間估計的樣本大小(實例)p在一個美國租車費用的調查中發現,租用中型汽車的平均費用是每天$55。假設原先執行這項調查的公司想要執行另一項新的調查,以估計現階段在美國租用一輛中型汽車一天所需的費用。在設計此項新的研究時,計畫主持人特別指定在估計每天租車費的母體平均數時,必須採用的邊際誤差為$2,信賴水準則為 95%。p我們可以瞭解到計畫主持人所指定的邊際誤差 E2,而 95%的信賴水準表示 z0.0251.96。第8章區間估計 第306頁 47母體平均數區間估計的樣本大小(實例)p如此,
20、只需要得到母體標準差 的計畫值,即可算出符合條件的樣本大小。此時,一位分析師看過先前研究的樣本資料後,得到樣本標準差為$9.65,將此值當作 的計畫值,可得如此,此項新的研究至少需要 89.43 個中型汽車日租金的樣本大小,才能滿足計畫主持人之邊際誤差為$2 的要求。在這個例子中,算出的 n 值有小數點,我們採無條件進位法,因此,建議的樣本數是 90 個中型汽車租金的樣本。第8章區間估計 第306頁 482222/222()(1.96)(9.65)89.432znE8.4 母體比例第8章區間估計 第308頁 49母體比例的區間估計第8章區間估計 第308頁 50母體比例的區間估計第8章區間估計
21、 第308頁 圖8.951母體比例的區間估計p區間估計其中:1-是信賴係數 z/2為標準常態分配右尾面積/2所對應的 z 值 是母體比例p第8章區間估計 第309頁 52母體比例的區間估計(實例)p為了想瞭解女性高爾夫球員對高爾夫球課程的看法,針對全美 900 位女性高爾夫球員進行調查。調查結果發現,有 396 位女性高爾夫球員對練習發球的次數感到滿意,如此,對發球次數感到滿意的女性高爾夫球員之母體比例的點估計為396/9000.44。第8章區間估計 第309頁 53母體比例的區間估計(實例)p利用式(8.6)及 95%的信賴水準,我們可得因此,在 95%的信賴水準下,邊際誤差為 0.0324
22、且母體比例的區間估計為 0.4076 至 0.4724 之間。此調查結果得到的結論是:我們有 95%的信心說,有 40.76%至 47.24%的女性高爾夫球員對其練習發球的次數感到滿意。第8章區間估計 第309頁 54/2(1)0.44(10.44)0.441.969000.440.0324pppzn所需的樣本數所需的樣本數 n 的公式如下的公式如下p邊際誤差邊際誤差母體比例的區間估計的樣本大小第8章區間估計 第309頁 55p母體比例區間估計值所需的樣本數此計畫值可依下列程序獲得:1.利用以前來自相同或類似的樣本之樣本比例作為計畫值 p*。2.利用前測實驗選擇適當的樣本,此樣本比例值即可作為
23、計畫值 p*。3.利用判斷或最佳猜測來決定 p*值。4.在沒有先前的實驗資料可用的情形下,可設 p*的計畫值為 0.50。母體比例的區間估計的樣本大小第8章區間估計 第310頁 56母體比例的區間估計的樣本大小(實例)p再回到女性高爾夫球員的相關調查,假設公司有意執行一項新的調查,以估計對練習發球的次數感到滿意之女性高爾夫球員的母體比例。假若此調查之主持人希望在 95%的信賴水準下,母體比例估計的邊際誤差為 0.025,則到底需要多大的樣本?第8章區間估計 第310頁 57母體比例的區間估計的樣本大小(實例)p因為 E0.025 且z/21.96,所以我們需要一個計畫值 p*才能回答此一樣本數
24、的問題。我們以之前的調查結果中的 0.44當作計畫值 p*,則式(8.7)顯示出因此,樣本大小必須至少為 1,514.5,估計的結果才能滿足邊際誤差的要求。將此數值無條件進位,建議應抽取 1,515 位女性高爾夫球員作為樣本。第8章區間估計 第310頁 p5822/222()*(1*)(1.96)(0.44)(10.44)1514.5(0.025)zppnE母體比例的區間估計的樣本大小(實例)p選擇計畫值的第 4 項建議是使用 p*0.50 作為計畫值,通常是沒有其他資訊時才會使用。要瞭解為什麼會用此值,請注意式(8.7)可看出樣本數和 p*(1p*)值成比例,如果 p*(1p*)值大的話,則
25、樣本數也會隨之增加。p表 8.5 列出某些 p*(1p*)的可能值,而 p*(1p*)的最大值即在 p*0.50。如果設定 p*0.50,則可以確定建議的樣本數會最大。實際上,我們建議以此較安全或較保守的方式來決定所需要的樣本數。在任何狀況下,設 p*0.50 將可保證有足夠的樣本數來確保達到所需的精確度。第8章區間估計 第310頁 59母體比例的區間估計的樣本大小(實例)第8章區間估計 第310頁 表8.560母體比例的區間估計的樣本大小(實例)p在女性高爾夫球員的調查例子中,若計畫值 p*0.50,則樣本大小將為因此,建議樣本大小應取 1,537 位女性高爾夫球員。第8章區間估計 第310頁 6122/222()*(1*)(1.96)(0.50)(10.50)1536.6(0.025)zppnEEnd of Chapter 862