1、教科書:應用統計學徐世輝著 第五章離散型隨機變數及其常用的機率分配教科書:應用統計學徐世輝著5.1.1 隨機變數的意義 討論隨機實驗時,有時我們感興趣的,或許並不是確切的發生結 果,因其結果所成的樣本空間較為抽象,真正關心的,可能是將 這些確切結果經由一有意義的實數值函數轉換,進而改以函數值 表示的事件。經實數值函數轉變後以數值表示的事件即稱為實數 值事件(real value event),在實數裏有很多數學運算可應用,如加 法、減法、積分、微分。例如觀察投擲兩枚骰子的實驗中,我們 不在乎是(1,3)或(3,1)或(2,2)確切結果發生,對我 們更有意義的,則是兩枚骰子總合函數為4函數值的事
2、 件。經一特定實數值函數,並以轉換後的函數值來表示事件,則 此實數值函數即稱為隨機變數。5.1 隨機變數隨機變數教科書:應用統計學徐世輝著一般而言以大寫英文字母來表示此函數,也就是隨機變數。而以小寫英文字母來表示函數值,也就是隨機變數可能值。如上述投擲兩枚骰子實驗,若定義隨機變數函數:其面朝上點數總合。而其相對的可能值函數值2,3,4,5,6,7,8,9,10,11,12。並以 y來表示原樣本空間,經此函數轉變後的實數值事件。定義5.1.1 隨機變數(random variable)即是以樣本空間為定義域而值域為實數的實數值函數。5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著【例【
3、例5.1】考慮投擲三枚硬幣實驗,定義隨機變數:出現正面的次數。試著將每一樣本點所對應的函數值列出,並列出所有轉換後的實數值事件,所各自包含的樣本點。5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著解:上一章曾經提及,投擲三枚硬幣其樣本空間為:H:正面T:反面 HHH,HHT,HTH,HTT,THH,THT,TTH,TTT 而隨機變數定義為出現正面的次數,故其對應關係如本頁圖5-1所示。由此圖可知,隨機變數的可能值0,1,2,3。也就是說,原樣本空間經由隨機變數而轉變成4個實數值事件。其各自包含的樣本點為 0 TTT 1 THT,TTH,HTT 2 HHT,HTH,THH 3 HHH
4、5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著5.1.2 隨機變數的分類隨機變數可區分為兩大類:離散型隨機變數(discrete type random variable)和連續型隨機變數(continuous type random variable)。當一隨機變數其可能值的個數為有限個(finite)或是可數的無限多(countably infinite)時,稱為離散型隨機變數。而若一隨機變數其可能值為不可數的無限多(uncountably infinite)時,此時稱為連續型隨機變數。下一例子將可幫助讀者進一步清楚其詳
5、細的分類。5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著【例【例5.3】1.定義隨機變數:投擲一枚硬幣次,其出現正面的次數。則的可能值為 x0,1,2,3,.有限個。為離散型隨機變數。2.定義隨機變數:一小時內某一路口通過之車輛個數。則的可能值 y0,1,2,3,.可數的無限多。為離散型隨機變數。3.定義隨機變數:某一電視機之使用壽命。則的可能值0不可數的無限多。為連續型隨機變數。5.1 隨機變數隨機變數(續續)教科書:應用統計學徐世輝著定義5.2.1 一離散型隨機變數之機率分配(probability distribution),即是以表格、圖表、或公式,將隨機變數所有可能值而成
6、的事件之機率一一列出。定義5.2.2 一離散型隨機變數之機率分配 則有下列性質:1.0 1,對每一可能值。2.1)()(ypyYP)(ypyyp)(5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配教科書:應用統計學徐世輝著【例例5.4】台灣某一大學,企管系大二班。班上成績前五名中,有三名為男同學,二名為女同學。由於五名同學都十分優秀,老師想以公平之標準,隨機抽取二人擔任統計學助教。定義隨機變數:抽取二人中,女同學之人數。試以表格、圖表、或公式列出隨機變數之機率分配。5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配(續續)教科書:應用統計學徐世輝著解:隨機變數定義為抽取二人中,女
7、同學之人數。顯而易見的,可能值 y0,1,2。欲求之機率分配,必先將P(0),P(1),P(2)求出。由於是採隨機抽出,此實驗之所有樣本點,發生 機率皆相同。是故我們試著以古典法,求算事件機率。在解題之 前,先行介紹一組合符號 或 。此值 代表著在個不同的個體中,隨機抽取個,其各種不同可能抽取結 果之總數。故就本題而言,在五名學生中,抽取二名即有 個各 種可能結果。也就是此實驗之樣本空間有 10個樣本點。Cnx nxCnx nx)!(!xnxn52C52C5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配(續續)教科書:應用統計學徐世輝著5.2 離散型隨機變數之機率分配離散型隨機變數之機
8、率分配(續續)教科書:應用統計學徐世輝著5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配(續續)教科書:應用統計學徐世輝著5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配(續續)教科書:應用統計學徐世輝著累積機率F(x),我們又可將之稱為累積分配函數(cumulative distribution function),簡稱 c.d.f.。定義5.2.3一離散型隨機變數之累積機率(cumulative probability):F()P()=,意即將離散型隨機變數,由Y最小的可能值的機率,累加至 的機率為止之值。yyy5.2 離散型隨機變數之機率分配離散型隨機變數之機率分配(續續
9、):()x x yp x教科書:應用統計學徐世輝著5.3 期望值及變異數期望值及變異數教科書:應用統計學徐世輝著5.3.1 離散型隨機變數之期望值離散型隨機變數之期望值假設考慮投擲一公平骰子36次,進而出現之點數如下:2,1,2,4,5,6 5,3,1,6,6,3 3,6,4,1,1,5 4,5,3,6,6,3 6,2,1,4,6,1 3,3,5,6,1,6就以上資料36個數值,我們可計算其樣本平均數為再將這些資料稍加整理之後,可得如下表所示75.3)135(361361361iixx5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著 經由上表所表示各可能值之次數分配,我們
10、可以行另一方式,求算該樣本平均數:計算法則即是為 (樣本平均數)點數(可能值)相對次數 73745101234563.75363636363636x x5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著【例【例5.6】考慮投擲三枚公平硬幣,定義隨機變數:三枚公平硬幣正面朝上之個數。試求隨機變數之期望值。解:此隨機變數之機率分配為:根據期望值定義 y yyyp)(1331=01231.588885.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著5.3 期望值及變異數期望值及變異數(續續)
11、教科書:應用統計學徐世輝著5.3.2 離散型隨機變數之變異數離散型隨機變數之變異數5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著5.3.3 期望值及變異數之基本定理期望值及變異數之基本定理5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著【例【例5.10】再以例5.6為例,並利用定理5.5,求出隨機變數之變異數。5.3 期望值及變異數期望值及變異數(續續)教科書:應用統計學徐世輝著 在接下來幾小節中,將介紹幾個特殊且常見的機率分配。其中有:二項分配(binomial distrib
12、ution)超幾何分配(hyper-geometric distribution)幾何分配(geometric distribution)負二項分配(negative binomial distribution)卜瓦松分配(Poisson distribution)隨機變數的機率分配本是透過此隨機變數所定義的函數關係,由原 實驗樣本空間轉換而來。所以讀者學習這些機率分配時,若能清楚 各原實驗之前提條件,並了解該隨機變數所定義的函數關係,如此 必能收事半功倍之效。5.4 二項分配及超幾何分配二項分配及超幾何分配教科書:應用統計學徐世輝著5.4.1 二項分配二項分配5.4 二項分配及超幾何分配二項
13、分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4.2 超幾何分配超幾何分配5.4 二項分配及超幾何分
14、配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著【例【例5.16】在一水塘池中,計有20隻魚,其中有15隻金魚,5隻吳郭魚。今從池中抽取2隻魚,並定義隨機變數表示抽中吳郭魚隻數。試求出:(a)隨機變數之機率分配(b)期望值E Y,變異數V(Y)5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著解:(a)隨機變數表示抽中吳郭魚隻數。且一次抽取2隻,如此即可 視為採不放回,故Y必為超幾何隨機變數。
15、根據 定義 5.4.6 N20,r5,n2 P(),0,1,2CCCyy20215255.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4.3 二項分配與超幾何分配的關係二項分配與超幾何分配的關係 實務上很多抽樣檢驗,都是以一次抽取,也就是抽取不放回方式來進行。理論上我們應以超幾何分配來求算機率,不過在 例5.13中
16、我們曾經提及,當母體所含個數與抽取樣本個數相差很大時,此時雖採不放回方式,不過試驗間還是逼近“獨立”,故依舊以二項分配來估算,為什麼呢?玆以下例說明:5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著【例【例5.18】科學園區某一工廠,元月份共出產產品1000件,可惜此批產品中有100件為不良品。令隨機變數Y表示抽取5件中,不良品個數。則分別以(a)超幾何分配(b)二項分配,求算機率並比較差異!解:(a)採超幾何分配求算,N1000,r100,n5 P(y),y0,1,2,3,4,5 CCCyy1000590051005.4 二項分配及超幾何分配二項分配及超幾何
17、分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著由上可知,當N,n差距很大時,分別用二項分配及超幾何分配求算的機率值非常接近,可是求算過程中,經由超幾何分配可比起二項分配計算繁雜的多。所以當母體所含物體個數與抽取樣本個數差距很大時,以二項分配估算 b(n;pn/N)顯得容易的多,且又逼近超幾何分配求算值。5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.4 二項分配及超幾何分配二項分配及超幾何分配(續續)教科書:應用統計學徐世輝著5.5.1 幾何分配幾何分配 考慮一隨機實驗,其包含著連串
18、的伯努利試驗:每一次試驗依 舊只有“成功”(S)、“失敗”(F)兩種可能,各試驗彼此獨立,“成功”的機率固定為。跟二項分配的實驗前提限制,幾乎相同,唯一 不同的是,此時我們定義一新的隨機變數為直到第一次“成 功”(S)出現,所已執行試驗之總次數。由於此定義方式,使得不 再像二項實驗中,確切包含著個伯努利試驗。相對的,在此實 驗中可能包含著1個、2個,甚至於無限個伯努利試驗。我們稱 此隨機變數Y為幾何隨機變數(geometric random variable)。5.5 幾何分配及負二項分配幾何分配及負二項分配教科書:應用統計學徐世輝著5.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科
19、書:應用統計學徐世輝著5.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科書:應用統計學徐世輝著考慮與幾何分配相同的實驗前提限制,而與幾何分配所不同的是,此時我們再改令一隨機變數表示直到第r次“成功”出現,所已執行的試驗總次數。由於此定義方式,此實驗至少包含r個,甚至也包含了無限個伯努利試驗。此隨機變數跟幾何隨機變數相仿,都含有無限但可計數個可能值。此時我們稱此隨機變數為負二項隨機變數(negative binomial random variable)。而當負二項隨機變數之“成功”次數 r1時,其實就是幾何隨機變數之定義。5.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科書
20、:應用統計學徐世輝著負二項隨機變數,其可能值x,r1,r2,。若令 x,意指第r次“成功”(S)出現時,總試驗次數已達次,換句話 說,第次試驗,也就是最後一次試驗,必發生“成功”(S),而前面 的x1次試驗中,必發生了x1次“成功”(S),xr次“失敗”(F)。若考慮其一排列方式:因“成功”(S)的機率為,且各試驗之間彼此獨立。如上述之排列方 式,其發生的機率為 其中rxrrxrqppqp1pq15.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科書:應用統計學徐世輝著5.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科書:應用統計學徐世輝著5.5 幾何分配及負二項分配幾何分配
21、及負二項分配(續續)教科書:應用統計學徐世輝著5.5 幾何分配及負二項分配幾何分配及負二項分配(續續)教科書:應用統計學徐世輝著5.6.1 卜瓦松分配的意義卜瓦松分配的意義 考慮一隨機實驗,此實驗特色為,在某一特定區間內(一段時 間、一段距離、一部分面積、體積),觀察某特定“稀少”事件 發生的次數。所謂“稀少”,意指該事件發生的機率低,故發生 的次數少,不過理論上而言,此稀少事件發生的次數,也可能 至無限次,只不過其可能性非常的低。若令隨機變數表示在 此實驗中,此特定事件發生的次數。則此觀察過程,我們稱之 為卜瓦松實驗(Poisson experiment),隨機變數稱為卜瓦松 隨機變數(Po
22、isson random variable),其可能值y0,1,2,.為 無限但可數。5.6 卜瓦松分配卜瓦松分配教科書:應用統計學徐世輝著卜瓦松實驗有下列特性:1.在一單位區間,如單位時間或單位面積內,此特定稀少事件發生 平均次數(),通常為已知且固定。2.此事件在單位區間內發生平均次數(),通常與區間大小(t)成正比。3.不管此事件在該區間中何點發生,發生的機率必皆相同。4.假設此實驗可分割成極小的區間,每一區間至多可發生一件此特 定事件(成功),或是無該事件發生(失敗)。換句話說,每一小區間,可能發生結果只有兩類。5.事件在各小區間中發生與否,相互獨立。5.6 卜瓦松分配卜瓦松分配(續續
23、)教科書:應用統計學徐世輝著5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著【例【例5.23】台北市每天平均一小時內,發生一次搶案。若令表示一小時內,發生搶案次數。假設符合卜瓦松分配,試問:(a)一小時內,完全無搶案發生的機率。(b)一小時內,發生搶案超過兩次的機率。(c)兩小時內,恰巧只發生一次搶案的機率。5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著解:(a)由題目可知,符合卜瓦松分配,1 一小時內,完全無搶案發生,即 0 P(0)(b)一小時內,發生搶案超過兩次,即2 P(2)1P(0)P(1)P(2)3679.0!0110e01211111110.0803
24、0!1!2!eee 5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著 (c)令卜瓦松隨機變數表示兩小時內發生搶案的次數。根據特性 第二點,其平均搶案發生次數2。兩小時內,恰巧只發生一次搶案,即1 P(1)2707.0!1221e5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著5.6.2 卜瓦松分配與二項分配的關係卜瓦松分配與二項分配的關係5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著5.6 卜瓦松分配卜瓦松分配(續續)教科書:應用統計學徐世輝著5.7 總結總結教科書:應用統計學徐世輝著5.
25、7 總結總結(續續)教科書:應用統計學徐世輝著5.7 總結總結(續續)教科書:應用統計學徐世輝著5.7 總結總結(續續)教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明(續續)教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明(續續)教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明(續續)教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明(續續)教科書:應用統計學徐世輝著5.8 EXCEL範例說明範例說明(續續)教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明(續續)教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明(續續)教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明(續續)教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明(續續)教科書:應用統計學徐世輝著5.9 MINITAB範例說明範例說明(續續)