1、Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業 抽樣方法 抽樣分配 樣本平均數之抽樣分配 兩樣本平均數差之抽樣分配 樣本變異數之抽樣分配 t-分配 F-分配 結論1Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.1 抽樣誤差(1/5)誤差 非抽樣誤差:在蒐集資料之過程中,因筆誤、打字 錯誤、問卷設計不良、訪問者態度、技巧的差別、受訪者未回卷等一些非抽樣步驟因素,造成資料處 理錯誤所引起之誤差。(主要係人為疏失主要係人為疏失)抽樣誤差:由於抽樣方法、抽樣之樣本大小、樣本 統計量的選擇方式等因素,造成樣本統計量與母體 參數之差異。抽樣一定會有誤差!2Chapter 8 抽樣與
2、抽樣分配抽樣與抽樣分配前程企業8.1 抽樣方法(2/5)(一一)非隨機抽樣法非隨機抽樣法(non-random sampling)統計調查時抽取之樣本並不是依照機率模式設計去抽 取,而是根據個人的意志如自己的專長、知識、研究 的目的或考慮資料取得的方便性來選取樣本的方法。(二二)隨機抽樣法隨機抽樣法(random sampling)若抽樣之過程符合下列三個條件,則稱此抽樣方法為 隨機抽樣法隨機抽樣法:(1)母體中之母體中之任何一個資料均有被抽出的可能性任何一個資料均有被抽出的可能性,(2)任一組樣本任一組樣本被抽取之機率均可計算得知被抽取之機率均可計算得知,(3)任一組樣本任一組樣本被抽取之過
3、程均為獨立被抽取之過程均為獨立。3Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.1 抽樣方法(3/5)隨機樣本 若R.V.彼此獨立且具有相同之機率分配,則稱 為一組大小為 n 之隨機樣本。以下我們介紹四種常用之隨機抽樣方法。(1)簡單隨機抽樣法簡單隨機抽樣法(simple random sampling):母體中所有可能 的樣本,其被抽出的機率均相等的抽樣方法。一般常用抽 籤法及亂數表法兩種方式。抽籤法:將母體資料加以編號,並將號碼放入箱內,再由 箱內抽出所需之樣本。亂數表法:依據亂數表的號碼抽取樣本。而亂數表的構成 是利用隨機抽取的數字,然後將抽取的數字依序排列成一 隨機數字表
4、。nXXX,21nXXX,214Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.1 抽樣方法(4/5)(2)系統抽樣法系統抽樣法(systematic sampling):需將母體個數為 N 的資料依序由1至 N 加以編號,並給定一個抽樣間隔 k,由編號1至k 的資料中隨機抽取第一個樣本,然後再依第一個樣本資料之編號,每加 k 個單位取一個樣本,直到編號超過母體個數為止;或每隔 k 個單位時間抽取一個樣本,直到抽取所需之樣本為止。(例k=10,抽1,11,21,31,41,51,61,71,81,91,101)(3)分層隨機抽樣分層隨機抽樣(stratified random sa
5、mpling):將母體按其差異性分為若干個次群體(稱之為層(stratum),使得任兩個次群體的交集為空集合,且所有次群體的聯集為整個母體,然後在各層中依其母體的比率以簡單隨機抽樣法抽出各層之隨機樣本,最後將各層之隨機樣本合併起來,即為一組分層隨機樣本。(校、院、系、班)5Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業分層隨機抽樣分層隨機抽樣-說明說明以某校需抽取100人為例其下層(次群體)分別為院、系、班依各院人數佔全校之比例,依此為準,以簡單隨機抽樣抽取各系名稱,直至其人數到達該院之比例人數為止其與集群抽樣最大不同,在於集群抽樣不受限於各院在學校所佔人數比例6Chapter 8
6、抽樣與抽樣分配抽樣與抽樣分配前程企業8.1 抽樣方法(5/5)(4)集群抽樣集群抽樣(cluster sampling):將母體依其相似性分成 若干的次群體(稱為集群(cluster),使得任兩個次群體 的交集為空集合,且所有次群體的聯集為整個母體,然後利用簡單隨機抽樣抽出若干集群,最後再對所抽 出的集群全面調查。7Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.2 抽樣分配抽樣分配 樣本僅為母體的一部分,且樣本統計量隨著所選取 的樣本不同,產生的數值也將不同,因此,為了更 精確的推論母體參數,必須先瞭解樣本統計量之機 率分配。然而,由於樣本統計量之機率分配除了取 決於母體的機率分
7、配外,樣本大小及抽樣的方法也 將影響其機率分配,因此樣本統計量之機率分配稱 之為抽樣分配(sampling distribution)。8Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(1/7)(一一)常態母體常態母體 若隨機樣本 取自於一具有常態分配 之母體,則R.V.,i=1,2,n,此時 之 機率分配可由以下定理得知。定理定理8-1 若 為一組大小為 n 之隨機樣本 且 ,i=1,2,n,則 nXXX,21),(2N),(2NXiXnXXX,21niiniinnaaNXaXaXaYVR12212211,.),(.2NXVRi9Chapter 8 抽樣
8、與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(2/7)推理推理8-2 若樣本資料 取自於一具有常態分配 之母體,則 另外,關於 的期望值與變異數,可直接計算如下:nXXX,21),(2NnNXVR2,.X)(1)(1()(21nnXXXnEXEnnnnXXXnVarXVarn22221)(1)(1()(參見例8.110Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(3/7)例8.1假設某小學全校學生的體重呈現常態分配,且其平均體重為45公斤,標準差為4公斤。請問,(1)隨機抽出1位學生,體重大於50公斤的機率為何?(2)隨機抽出25位學生為
9、樣本,其平均體重大於50公斤之機率為 何?【解解】(1)令X 表抽樣所得之學生體重,則 。由此可 知,其體重大於50公斤之機率為)16,45(.NXVR1056.0)25.1()44550()50(ZPZPXP11Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(4/7)承上頁(2)令 為所抽出之25位學生體重,由假設得知,對於 且 彼此互 相獨立,由推理8-2得知 因此,2521,XXX25,2,1i)16,45(.NXVRi,nXXX,212516,45)(1.2521NXXXnXVR0)25.6()544550()50(ZPZPXP12Chapter
10、8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(5/7)(二二)大樣本大樣本 當隨機樣本不是取自於常態母體時,其平均數的 機率分配不易計算,不過當樣本為大樣本時,我過當樣本為大樣本時,我 們可發現樣本平均數們可發現樣本平均數 亦近似於常態分配亦近似於常態分配。當 n 越大,則 之機率分配越接近於常態分配 然而,不論母體資料具有何種機率分配,當樣本 個數 n 夠大時,樣本平均數之機率分配均近似於 常態分配,此即著名的中央極限定理 XX13Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(6/7)定理定理8-3 中央極限定理中央極限定理 若
11、一組隨機樣本 取自於平均數為 ,變異 數為 之母體,且其樣本平均數 ,則當 時,定理定理8-4 若一離散型隨機變數X具有二項分配且R.V.X b(n,p)當 n,則 nXXX,212)(121nXXXnXn1,0.NnXZVR參見例8.2)1()1,0(.pnpnpNXVR且,其中14Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.3 樣本平均數之抽樣分配(7/7)例題8.2已知某罐裝飲料熱量之平均數105(卡),標準差4(卡)。今隨機抽取100瓶此罐裝飲料做檢驗。試問,此100瓶罐裝飲料平均熱量至少106卡熱量的機率為何?【解解】利用中央極限定理,因此,)1,0(1004105.
12、NXZVR0062.09938.01)5.2(1)5.2(1004105106)106(ZPZPZPXP15Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.4 兩樣本平均數差之抽樣分配(1/5)(一一)成對樣本成對樣本 當成對樣本之觀測值為 ,則 令 由此可得,之抽樣分配即為 之抽樣分配 ,其中 。因此在成對樣 本條件下,兩樣本平均數差之抽樣分配可視為單一樣本 平均數之抽樣分配。),(,),(),(2211nnYXYXYX ,2 ,1 ,niYXDiiiYXVR.DVR.niiniiniiDnDYnYXnX111111,16Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8
13、.4 兩樣本平均數差之抽樣分配(2/5)(二二)獨立樣本獨立樣本 (1)兩母體均為常態分配兩母體均為常態分配 由定理8-1得知 由於 為兩個常態分配之線性組合,根據定理8-1,其 平均數與變異數如下:由此可知,),(.),(.222211mNYVRnNXVR且YX21)()()(YEXEYXEmnYVarXVarYXVar2221)()()(,即),(.222121mnNYXVR)1,0()(.222121NmnYXZVR17Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.4 兩樣本平均數差之抽樣分配(3/5)(2)兩樣本均為大樣本兩樣本均為大樣本 由中央極限定理得知,當 且 ,則
14、 如前所述,。即 nm),(.),(.222211mNYVRnNXVR且),(.222121mnNYXVR)1,0()(.222121NmnYXZVR參見例8.318Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.4 兩樣本平均數差之抽樣分配(4/5)例8.3假設有兩條獨立之生產線,已知兩生產線產品之平均重量分別為6.5公克及6公克,標準差分別為0.9公克及0.8公克,今隨機由兩生產線分別抽出36件及49件產品為樣本。請問第一組樣本平均數大於第二組樣本平均數1公克之機率為何?【解解】令 、分別表兩組樣本之平均重量,則 近似於 ,近似於 。由此得知 XYXVR.)81.0 ,5.6(
15、NYVR.)64.0 ,6(N)1,0(4964.03681.0)65.6()(.NYXZVR19Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.4 兩樣本平均數差之抽樣分配(5/5)承上頁而第一組樣本平均數大於第二組樣本平均數1公克之機率為 004.09960.01)65.2(165.24964.03681.0)65.6(1)1(ZPZPZPYXP20Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.5 樣本變異數之抽樣分配(1/2)定理定理8-5 假設一組隨機樣本 取自一常態分配 之母體,則 卡方分配之臨界值卡方分配之臨界值 若 ,以 來表示隨機變數X大於 之 機率為
16、 ,則),(2N)1()1(.222nSnVRnXXX,21)(2r)(.2rXVR)(2r)(2r)(2rXP參見例8.521Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.5 樣本變異數之抽樣分配(2/2)例8.5某家電公司宣稱其所生產之產品穩定性高:產品長度之標準差1毫米。今隨機抽取此公司所製造之產品10件作測量,得其標準差1.5毫米,請問是否能相信此公司之宣稱?(假設母體具有常態分配)【解解】由樣本變異數之抽樣分配得知,假設此公司宣稱 為真時,由此可得有95%的機率 介於 與 之間,即 經查表可得 抽樣所得之樣本標準差為1.5,因此 不落在此範圍之內,由此可知假設錯誤,即此
17、公司所製造之產品標準差並非1毫米。)1()1(2222nSn1)9(1)110(222S29S)9(2975.0)9(2025.0)9(9)9(2025.0222975.0S0228.1997004.22S25.2092S22Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.6 t-分配(1/4)t-分配分配 令Z為具有標準常態分配之隨機變數且V為具有自由度為 v 的卡方分配之隨機變數。若Z、V 為互相獨立,則稱 為具有自由度 v 之 t-分配或Student t-分配,一般以 表之。其機率密度函數為 vVZTVR.)(.vtTVRtvtvvvtfv,1221)(21223Chapt
18、er 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.6 t-分配(2/4)定理定理8-6 若 為取自於常態母體之隨機樣本,且 ,分別為此樣本之平均數與變異數,則 然而,基於 t-分配之對稱性,可知 t-分配具有以下特性:(1)若 ,則(2)nXXX,21X2S1.ntnSXTVR參見例8.7 vtTVR.。1)()(22vtTvtP。,即)()()()(1vtvtvtTPvtTP24Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.6 t-分配(3/4)例題8-7假設某廠牌行動電話之重量呈現常態分配,今此廠商宣稱其平均重量為78公克,然而倘若隨機抽取此廠牌行動電話10支,得其平均重量8
19、0公克,標準差4公克,請問我們是否可相信此廠商之宣稱為真?【解解】在母體為常態,未知條件下,假設此廠商宣稱 公克為真時,21ntnSX78 910478tXT25Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.6 t-分配(4/4)承上頁,由此可得有95%的機率 T介於 與 之間,即經查表可得 而抽樣所得結果 ,即落在2.2622至2.2622之中,因此我們有理由相信此廠商之宣稱。)9(025.0t)9(025.0t80X)9(10478)9()9(025.0975.0025.0tXtt2622.2104782622.2X5811.1104788010478X26Chapter 8
20、 抽樣與抽樣分配抽樣與抽樣分配前程企業8.7 F-分配(1/3)F-分配分配 令U、V 分別為具有自由度 u 及 v 之卡方分配的隨機變數 且U、V 互相獨立,則稱隨機變數 具有自由度 之F分配。一般以 表之,其機率 密度函數為 vVuUW/),(vu),(.vuFWVR xxvuvuxvuvuxfvuuu01222)(2122,27Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.7 F-分配(2/3)定理定理8-7 若 ,則定理定理8-8 令 、分別表兩常態母體之變異數且 、分 別表取自於此兩母體之樣本變異數且其樣本個數分 別為 n 及 m,則 具有自由度 之F分配。),(.vu
21、FXVR),(1.uvFXVR 212221S22S22222121/SSW)1,1(mn28Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.7 F-分配(3/3)定理定理8-9例8.9若R.V.,求 k 使得【解解】),(1),(12211vvfvvf)9 ,3(FX。99.0)(kXP0366.0345.271)3,9(1)9,3(01.099.0ffk29Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.8 結論(1/4)在單一樣本平均數之抽樣分配中,我們可分成以下四個情況。(一)母體為常態、已知或(二)母體為常態、未知2),(.2nNXVR)1,0(.NNXZVR
22、2)1(.ntNSXTVR30Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.8 結論(2/4)(三)大樣本、已知或(四)大樣本、未知或2),(.2nNXVR2),(.2nSNXVR)1,0(.NNXZVR)1,0(.NNSXZVR31Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.8 結論(3/4)而兩樣本平均數差之抽樣分配需考慮成對樣本或獨立樣本。(1)在成對樣本條件下:其抽樣分配可視為單一樣本平均數之 抽樣分配,其結果同上述之單一樣本平均數之抽樣分配。(2)在獨立樣本條件下:當變異數已知時,若兩母體均為常態 分配或大樣本時,則)1,0()()(.),(.222121222121NmnYXZVRmnNYXVR或32Chapter 8 抽樣與抽樣分配抽樣與抽樣分配前程企業8.8 結論(4/4)關於樣本變異數之抽樣分配,無論單一樣本變異數之抽樣分配或是兩樣本變異數比之抽樣分配均需假設在常態母體條件下進行,(1)單一樣本變異數之抽樣分配為(2)兩樣本變異數之抽樣分配為)1()1(.2222nSnVR1,1.22222121mnFSSFVR33