1、第六章 連續型隨機變數及其常用的機率分配6.1 連續型隨機變數隨機變數分為兩大類。若隨機變數之可能值個數為有限個;或是可數的無限多時(如人數、損壞物品個數),此時可將之歸類為離散型(discrete type)隨機變數。而若隨機變數之可能值個數為不可數的無限多時(如時間、身高),其可能值的集合為一區間,此時即將之稱為連續型(continuous type)隨機變數。6.1.1 連續型隨機變數之機率分配當隨機變數為離散型時,我們可對每一Y之可能值賦予一大於零的機率,並定義為其機率分配,其所有可能值機率總和為1。但對於連續型隨機變數而言,由於其可能值個數無限多且無法計數,故其每一個可能值的機率為0
2、,勢必無法如離散隨機變數之機率分配定義方式,來定義連續型之機率分配,所以我們將尋求以另一方式來定義連續型隨機變數之機率分配。考慮一連續型資料之隨機實驗,從中抽樣200組資料,繪出其相對次數直方圖,如圖6.1所示。假若我們將抽樣資料數增多,甚至無限多;同時將組間距縮小,甚至無限小,則繪出其相對次數直方圖必會如圖6.2所示,變為一平滑曲線。圖6.2平滑曲線乃代表著 圖6.1相對次數直方圖之極限形式。由相對次數直方圖性質可推知,曲線下與橫軸所夾之面積,即為此連續型隨機變數出現在此區間的機率。於是我們即藉由此曲線來定義連續型隨機變數之機率分配,並稱此曲線為“機率密度函數”。定義6.1.1機率密度函數(
3、probability density function)通常以表示,為一數學函數,用以描述連續型隨機變數Y之機率分配。若一連續型隨機變數Y之機率密度函數為,則其必具有下列之基本性質:1.對所有Y的可能值而言,f(y)0。2.隨機變數所有可能值機率總和為1,故若此機率密 度函數之兩 邊端點a與b,則整段函數與橫軸所涵蓋 的面積值必為1。即 3.欲求隨機變數Y落在曲線上任意兩點c與d之間的機率,也就是 區間機率P(cYd)時,則badyyfdyyf1)()(dcdyyfdYcP)()(【例6.1】假設Y為一連續型隨機變數,且其機率密度函數為 試求 (a)C值 (b)P(1Y2)(c)P(1Y2)
4、30 ,)4(,02)(yyyCyf其他範圍解:(a)根據上述性質(二),其機率總和為1,故1)4()(302dyyyCdyyf13033122|yyyyC19 C91C (b)此隨機變數Y之機率密度函數為 (c)因為在連續型隨機變數中,單點並無機率值30 ,)4)(9/1(,02)(yyyyf其他範圍|2132212312 91)4(91)21(yyyydyyyYP181118293327 2711)21()21(YPYP【例6.2】科學家做一實驗:測試老鼠跑出迷宮所需的時間。假設老鼠跑出迷宮,所花的時間為一隨機變數Y(單位:分鐘),其機率密度函數為試問老鼠在3分鐘內跑出迷宮的機率為如何?解
5、:老鼠在3分鐘內跑出迷宮的機率即為 P(1Y3),則 1 ,/1 ,0)(2yyyf其他範圍32)1(/1)31(|31312yyydyyYP6.1.2 連續型隨機變數之累積分配函數在連續型中,其累積分配函數定義本質與離散型時相同。不過由於其各自的機率分配定義不同,故其計算累積分配函數方法也稍有不同。定義6.1.2一連續型隨機變數Y之累積分配函數(cumulative distribution function),即為 ydttfyYPyYPyF)()()()(【例6.3】令Y為一隨機變數,其機率密度函數為試求:(a)累積分配函數F(y)(b)試利用F(y)求得P(1Y2)20 ,)2)(2/
6、1(,0)(yyyf其他範圍解:(a)依累積分配函數定義 ,則 ydttfyYPyF)()()(b)依累積分配函數定義 P(12)=P(2)P(1)=F(2)F(1)故由(a)中得知 P(12)=F(2)F(1)=1(3/4)=1/4)1411()2412(226.2 期望值及變異數在介紹離散型隨機變數時,我們曾經提及,描述一母體機率分配的集中趨勢及離散程度,最常使用的就是期望值及變異數。而在連續型隨機變數時,依舊是以期望值來測知此機率分配之中心點,以變異數來測量此機率分配之離散情形。在此期望值及變異數的基本定義仍然與離散型時相同,不過由於連續型之機率分配定義方式有些不同,故其計算方式也有稍許
7、不同。6.2.1 連續型隨機變數之期望值及變異數 定義6.2.1此連續型隨機變數的期望值(expected value)或平均數(mean)E y 定義為 dyyyfYE)(定理6.1若g(y)為連續型隨機變數函數,則其期望值為 dyyfyg)()(Y)gE定義6.2.2若連續型隨機變數Y的期望值為E Y=,則Y的變異數(variance)為 將變異數的正平方根 SD(Y),稱為隨機變數Y之標準差(standard deviation)。dyyfyYEYV)()()()(222)(YV【例6.4】Y為一連續型隨機變數,其機率密度函數試求Y之期望值E(Y)與變異數V(Y)。10 ,2 ,0)(y
8、yyf其他範圍解:依連續型隨機變數期望值之定義323222)(|10310210 y dyy ydyy dyyyfYE依連續型隨機變數變異數之定義 181949821)949821()98382()2)(9434()2()32()()()()(|102342103102210222 yyy dy yyy dyyyy dyyy dyyfy YEYV依連續型隨機變數變異數之定義6.2.2 期望值及變異數基本定理定理6.2若Y是一連續型隨機變數,;為兩常數,g1(Y)、g2(Y)gk(Y)為隨機變數Y之k個函數,則()E aYbaE Y b()V(aYb)a2V(Y)()E g1(Y)g2(Y)gk
9、(Y)E g1(Y)E g2(Y)E gk(Y)定理6.3若一連續型隨機變數Y,期望值E Y,則變異數V(Y)E y2(E Y)2E y226.3 均勻分配假設一隨機變數Y在某一區間a,b內發生的機率皆相同,則Y的機率分配稱為均勻分配。定義6.3.1 連續隨機變數Y,若其機率密度函數為 則Y的機率分配稱為均勻分配(uniform distribution)(yf 通常均勻分配可表示為 YU(),與稱為均勻分配的參數,也就是其上下界。若a=0;b=1,則稱為標準均勻分配(standard uniform distribution)。圖6.3為其密度函數圖形由圖可知,均勻分配又可稱為矩形分配(re
10、ctangular distribution)。總之,均勻分配最大的特點即是:隨機變數發生於某一段區間的機率密度函數,必與此區間的長度成反比。定理6.4若Y為一均勻隨機變數,上下界為與,YU(),則期望值為12)()(222abYV ,baYE變異數為【例6.7】假設一公車,在早上7:007:30之間到達某站牌的時間為均勻分配。有一天,阿輝剛好7:00時到達此站牌,試問(a)阿輝等待的時間超過十分鐘的機率(b)阿輝等待時間的期望值與變異數(a)題意所示,假設隨機變數Y代表阿輝從早上7:00開始,等待公車的時間。則Y為均勻分配,YU(0,30),其機率密度函數為n 解:(a)題意所示,假設隨機變
11、數Y代表阿輝從早上7:00開始,等待公 車的時間。則Y為均勻分配,YU(0,30),其機率密度函數為 則阿輝等待的時間超過十分鐘的機率即為 301030103230103030301301)10(|ydyYP(b)阿輝等待時間的期望值 阿輝等待時間的變異數 1523002baYE7512)030(12)()(222abYV6.4 指數分配6.4.1 指數分配的定義 在上一章中,我們曾經介紹一離散型隨機變數:卜瓦松隨機變 數。其定義為在某一單位區間內,某特定事件發生的次數。在 此同時,前所定義特定事件,兩兩之間所間隔的時間以隨機變 數Y表示,其機率分配即是將在這一節所介紹的連續型隨機變數:指數分
12、配。在所有不同常態分配下,我們都可透過一“標準化”的程序,使每一常態隨機變數都轉換成標準常態隨機變數。定義6.4.1 連續隨機變數Y,若其機率密度函數為 則Y的機率分配稱為指數分配(exponential distribution)指數分配唯一的參數即為,不同的決定出不同的指數分配。圖6.4為指數分配參數=1,=1/2,=1/3的圖形。【例6.7】假設欣力公司所生產的電視機,其壽命符合指數分配,且平均使用時間為5年。今阿輝買了一台此品牌的全新電視。試問阿輝5年內不用再換新電視的機率為何?解:設此電視壽命為Y,由其期望值為5,(1/)=5,可知=(1/5)Y符合指數分配,其機率密度函數即為 則阿
13、輝5年內不用再換新電視,也就是此電視壽命超過五年的機 率為11515551(5)0.36795|yyP Ydyeee6.4.2 無記憶性 我們接著試著證明指數分配是否真的具有無記憶性質,其證明 如下:假若Y為指數分配,則 aYPbaYPaYPaYbaYPaYbaYP)()()()()|()()()|()(bYPaYPb)aP(YaYbaYPeeebaba定理6.6若一非負的隨機變數Y具有無記憶(memoryless)性質,則 0;0 )()|(babYPaYbaYP6.5 常態分配6.5.1 常態分配的定義 常態分配可說是整個統計學的基礎,在此後章節,無論是假設 檢定、估計,甚至是迴歸分析,無
14、不以常態分配為理論基礎,做出許多的應用推論。由此可知常態分配的重要性。定理6.7若Y為一常態隨機變數,YN(),則期望值為2,2)(,YVYE 變異數為機率=0.683機率=0.954機率=0.9972323y)(yf圖6.5),(2NY圖6.5為一常態分配YN()之機率密度函數圖。由此圖,我們可知常態分配具有下列性質:1.常態分配曲線兩端尾巴與.橫軸漸漸接近,但絕不與橫軸相交 2.常態分配是以為中心的左右對稱分配,且其曲線形狀類似一鐘 型(bell-shaped)。由於其對稱的性質,故有下列的特性:如:(1)P(Y )P(Y )0.5 (2)對常數與,P(Y-a)1P(Y a)P(Ya)P(
15、aYb)P(Yb)P(Ya)6.5.2 標準常態分配及標準化 連續型隨機變數落在某一段區間的機率,定義為其機率密度函 數在此段所圍成的面積。我們可由圖6.5可知常態機率密度曲線 為鐘型,且由定義6.5.1瞭解常態機率密度函數的數學型式。讀 者不難發現,常態機率密度函數相當的複雜,若要算出其圍成 的面積,或許不是一件簡單的事。且不同的 及 2即形成不同 的常態分配,若將所有不同的常態分配都製成各自的機率表,是不太可能的事情。還好,在常態分配中,我們可透過一“標準 化”的程序,將所有可能的常態分配全部轉換成標準常態分配,再經由查標準常態分配的機率表。而所謂的標準常態分配(Standard Norm
16、al Distribution)即指的是期望值=0;變異數 2=1的常態分配。定義6.5.2 連續型隨機變數Y,若其機率密度函數為 則Y的機率分配稱為標準常態分配(Standard Normal Distribution)換句話說,若欲求一常態分配機率時,即可透過定理6.8所提供的轉換函數,再透過標準常態分配表,經由附表三即可求得。例如,假若YN(),則 因此 定理6.8若Y為一常態隨機變數,YN(),令 則Z為一標準常態隨機變數,ZN(0,1)YZ2,2,)1,0(NYZ)(1)()()(aaZPaYPaYP【例6.12】若有一常態隨機變數Y,其期望值為3,變異數為9,即,試求:(a)P(Y
17、0)(b)P(3Y6)解:(a)根據定理6.8,且經由附表三,可得 (b)根據定理6.8,且經由附表三,可得 8413.0)1()1()1()330()33033()0(ZPZPZPYPYP3413.05.08413.0 )0()1()0()1()10()33633333()63(ZPZPZPYPYP6.5.3 二項分配近似於常態分配在上一章離散隨機變數時,我們依序介紹了二項分配及卜瓦松分配。並且當二項分配 ,且np7時,此時可用卜瓦松分配P(np)來估計二項分配。而在此時,我們將再介紹以另一方法來估計二項分配,也就用此節所介紹的常態分配來估計二項分配。之前是以離散型隨機變數來估計離散型隨機變
18、數,而此處則是以連續型隨機變數來逼近離散型隨機變數。由中央極限定理(central limit theorem)可知,當隨機變數Y為二項分配,且其n很大時,隨機變數 之機率分配近似於標準常態的機率分配。如此,我們即可以之常態分配來估計之。100,0.01np)(YVYEY npYE)1()(pnpYV之前我們強調過,常態分配估計二項分配為連續型隨機變數估計離散型隨機變數之例。如此不免有些誤差。為了增加準確性,所以在應用上,通常在端點加或減 ,我們將之稱為連續性修正(continuity correction),在實務上,假如二項分配的直方圖不太偏斜,且 與 ,則可以常態分配來估算二項分配,因此,1210np(1)10np)1()1()1()1()1()1()1()2121()(212121212121pnpnpapnpnpapnpnpaZpnpnpaPpnpnpapnpnpYpnpnpaPaYaPaYP)1()1()1()1()1()1()1()2121()(212121212121pnpnpapnpnpbpnpnpbZpnpnpaPpnpnpbpnpnpYpnpnpaPbYaPbYaP