1、1第五章 離散型隨機變數 陳順宇 教授成功大學統計系2離散型隨機變數最常遇到的離散型隨機變數,如 二項分配二項分配、超幾何分配超幾何分配下一章將討論連續型隨機變數,如 常態分配常態分配 3隨機變數隨機變數 是一種函數對應,實驗的每一種結果指定一數值與之對應。4 隨機變數中之隨機隨機 表示結果的不可預知,變數變數表示每次結果會有不同的變化 通常隨機變數以英文大寫字母表示 5離散型隨機變數 若一隨機變數可能發生的數值 只有有限個或是 0,1,2,等整數個時,稱為離散型隨機變數 6如擲一個銅板 3 次 可能擲出的正面次數有0、1、2、3 共4種可能結果,令表3次中出現正面的次數 7圖 5.1 隨機變
2、數X實驗結果之對應數值 X 0 1 2 3(反 反 反)(反 反 正)(反 正 反)(正 反 反)(反 正 正)(正 反 正)(正 正 反)(正 正 正)實驗結果 對應 數值 8 像這種試驗每種實驗結果 有一數值與之對應,而且對應的數值只有可數的幾種 即為離散型隨機變數離散型隨機變數 9機率分佈機率分佈(或機率分配機率分配)一個離散型隨機變數在 各種可能數值k 發生的機率,稱為此隨機變數的機率分佈機率分佈(或機率分配機率分配),即隨機變數的機率分佈為 求 P(X=k)=?10例例5.1、甲、乙兩人玩擲骰子遊戲,由甲擲骰子 如擲出骰子點數是1,2時,甲需付給乙1元,如擲出骰子點數是3,4時,甲、
3、乙兩人沒有輸贏,如擲出骰子點數是5,6時,則甲可得1元 令X表甲擲1次骰子後所得的錢,求X的機率分佈?11點時 當擲 點時 當擲 點時當擲 5,613,401,2 1X12機率分佈 P(X=-1)=P(1,2)=2/6 P(X=0)=P(3,4)=2/6 P(X=1)=P(5,6)=2/6 13X可能值 1 0 1 X機率分佈 2/6 2/6 2/6 14圖 5.2 甲所得錢X的機率分佈 1 2 2 3 4 5 6 -1 0 1 2/6 2/6 2/6 實驗結果點數數數 X值 機率 15例例5.2、甲、丙兩人玩擲骰子遊戲,由甲擲骰子 如擲出點數是1,2時,甲可得2元,如擲出點數是3,4時,甲可
4、得4元,如擲出點數是5時,甲可得10元,如擲出點數是 6時,甲需付給丙 20元 令Y表擲1次骰子後甲所得的錢,求Y的機率分佈?16Y的機率分佈 Y 可能值 2 4 10-20 Y機率分佈 2/6 2/6 1/6 1/6 17例例5.5、某人擲一個公正銅板4次,令X代表4次中擲出正面的次數,求X的機率分佈?18擲4次銅板的實驗其樣本空間 U=(反,反,反,反),(反,反,反,正),(反,反,正,反),(反,正,反,反),(正,反,反,反),(反,反,正,正),(反,正,反,正),(反,正,正,反),(正,反,反,正),(正,反,正,反),(正,正,反,反),(反,正,正,正),(正,反,正,正)
5、,(正,正,反,正),(正,正,正,反),(正,正,正,正)19 U=正,反正,反正,反正,反 20U的計數 42)(Un21(1)擲4次銅板皆沒有出現正面的機率 44)21(21)0(XP22利用第四章事件獨立獨立求解 因每次擲出反面的機率都是1/2,而且每次擲出反面結果的事件都是獨立 因此4次都出現反面的機率為(1/2)4,即 =1/21/21/21/2=(1/2)4)0(XP234次銅板中恰有1次出現正面 ()=(正,反,反,反),(反,正,反,反),(反,反,正,反),(反,反,反,正)1X24擲4次銅板恰有1次出現正面的機率 4414)21(24)()1()1(CUnXnXP25一般
6、事件(X=k)發生機率 kkkCkXP44)21()21()(26 f 為 X的機率密度函數機率密度函數)(kf =)(kXP 27機率密度函數機率密度函數(1)nixfi,.,2,11)(0,(2)1)(1niixf 28機率密度函數圖 1x 2x 3x 4x 5x)(5xf)(4xf)(3xf)(2xf)(1xf)(ixf 29擲此骰子60次 點 數 1 2 3 4 5 6 出現次數10 11 11 9 12 730平均數 38.3607660125608460113601126010160/)7612594113112101(x 31相對次數相對次數 6010,6011,6011,609
7、,6012,607 326個相對次數都應接近等於1/6=)(XE=616161616161654321=5.3)(61kkXPk 33離散型的隨機變數離散型的隨機變數期望值期望值或稱或稱平均數平均數=)(XE=kkXPk)(=kkfk)(34變異數定義變異數定義 22)()(XEXEXEXVar35變異數也可利用下列二式計算(1)(XVar=kkfk)()(2(2)(XVar=22)()(XEXE 36例例5.6、(例例5.1續)甲、乙兩人玩擲骰子遊戲,令X表甲擲1次骰子後所得的錢,求 (1)X的期望值 (2)X的變異數。37X的機率分佈)1(XP=2/6 )0(XP=2/6 )1(XP=2/
8、6 38(1)X的期望值)(XE =)1(1)0(0)1()1(XPXPXP =626262101=0 39(2)X的變異數)(2XE=)1(1)0(0)1()1(222XPXPXP=626262101=4/6)(XVar=)(2XE 2)(XE=4/6 0=2/3 40例例5.7、(例例5.2續)甲、丙兩人玩擲骰子遊戲中,令Y表甲擲1次骰子後所得的錢,求 (1)Y的期望值 (2)Y的變異數 41Y的機率分佈)4(YP=2/6 )2(YP=2/6)10(YP=1/6 )20(YP=1/6 42(1)Y 的期望值 )(YE=)20()20()10(10)4(4)2(2YPYPYPYP =61)2
9、0(6110624622 =2/6 43Y的變異數)(2YE=)20()20()10(10)4()4()2(22222YPYPYPYP=61400611006216624=540/6)(YVar=)(2YE 2)(YE=540/6 (2/6)2=3236/36 44例例5.9、(例例5.5 續)令X代表擲一個公正銅板4次出現正面的次數,求 (1)X的期望值與 (2)X的變異數?45X機率分佈 X 可 能 值 0 1 2 3 4 X機率分佈 1/16 4/16 6/16 4/164/16 1/16 46期望值 216141643166216411610)(XE47X的變異數 5161416431
10、66216411610)(222222XE125)()()(222XEXEXVar48公司四個部門男女生人數統計交叉列表 部門 性別 生產部門 行銷部門 人事部門 技術部門 合 計 男 生 1460 250 140 150 2000 女 生 640 150 160 50 1000 合 計 2100 400 300 200 3000 49(1)求X,Y 的聯合機率分佈。(2)試證事件(X=0)與事件(Y=1)是 不獨立的 50X,Y聯合機率分佈 Y X 1 2 3 4 0 1460/3000 250/3000 140/3000 150/3000 1 640/3000 150/3000 160/3
11、000 50/3000 51事件(X=0)與事件(Y=1)是不獨立的)1()0()1,0(YPXPYXP52隨機變數獨立隨機變數獨立)()(),(kYPhXPkYhXP53)()()(2121XEXEXXE54若21,XX獨立 )()()(2121XVarXVarXXVar 55註註 1:)(YXE=)(ZE=2/6=0+2/6=)()(YEXE 註註2:)()(ZVarYXVar=773/9 2/3+3236/36=)()(YVarXVar 56相加期望值niiniiXEXE11)(57niinXEXE11)()(58畢氏定理解釋 X,Y 相加的變異數 X+Y Y X X+Y Y X X+Y
12、 Y X 59當資料是從某母體隨機取樣當資料是從某母體隨機取樣n個個(即即 X1,X2,.,Xn 是是iid)(a)(1niiXVar=2n,其中 Var(Xi)2 (5.13)(b)nXVar2)(5.14)(c)(inXVar=)(2iXVarn=22n 60期望值的意義 例例5.11、設某君花50元買一張獎券 (如愛國獎券等),請問這張獎券實際價值是多少錢?61表表5.2 愛國獎券之獎金與名額 獎獎項項 獎獎金金 名名額額 第一特獎 10,000,000 1 頭 獎 1,000,000 5 第二獎 100,000 10 第三獎 50,000 50 第四獎 10,000 100 第五獎 5
13、,000 200 第六獎 1,000 1,000 第七獎 500 2,000 第八獎 300 10,000 62您可想像如果把所有獎券都買進,則所有獎金都是您的,獎金共得 第一特獎:100000001 頭 獎:1000000 5 第 二 獎:100000 10 第 三 獎:50000 50 第 四 獎:10000 100 第 五 獎:5000 200 第 六 獎:1000 1000 第 七 獎:500 2000 )第 八 獎:300 10000 25,500,000 63但共買進的獎券有106=1,000,000,故每張的實際價值是25.5元。其計算方式為:25.5=25,500,000106
14、=(10,000,0001+1,000,0005+.+30010000)106=(10,000,0006101+1,000,0006105+.+30061010000)=(獎金得此獎金的機率)所有可能組合的總和 64期望值定義(報酬得此報酬之機率)的總和 數學式子是 kkXPkXE)()(655.3 二項分配二項分配 擲一銅板其結果有二種可能,正面或反面,正面或稱成功,以X=1表示,反面或稱失敗,以X=0表示,這種只有二種結果的試驗(或實驗)稱為伯努利試驗(Bernoulli Trial),66例例5.18、袋中取球觀其顏色:某公司舉辦摸紅球贈獎活動 一袋中有紅球r 個、非紅球b 個、每位顧客
15、由袋中取一球觀其顏色,如取到紅球可獲獎品,否則無獎品。因每次取出的球只有兩種可能,分別為紅球(稱之為成功)與 非紅球(稱之為失敗)故為伯努利試驗 67例例5.19、擲骰子:擲一個骰子,結果只有擲出點數 是2與不是2兩種可能,我們可以定義擲出 點數2為成功,其他點數為失敗。此種試驗不論骰子是否公正,都是伯努利試驗 68例例5.20、候選人得票率調查:受訪者若支持候選人甲為成功,否則為失敗(未定者為無效樣本)。此種調查,每位受訪者只有兩種可能:支持與不支持 故為伯努利試驗 69例例5.21、產品不良率調查:抽到不良品為成功,抽到良品為失敗 每次抽到產品只有 良品與不良品兩種可能結果 故為伯努利試驗
16、 70二項分配二項分配 如果重複做同樣狀況的伯努利試驗n次,求這n次中出現正面(或成功)次數的 機率是多少?這種從n次實驗中求有x次成功機率分配,稱之為二項分配二項分配(Binomial Distribution)711.二項分配二項分配特徵如下 (1)全部做n次重複的試驗。(2)每一次試驗只有二種可能,第i次若 成功以Xi=1表示,若失敗以Xi=0表示。(3)n次試驗是獨立的獨立的(Independent)(即上一次實驗結果不會影響下一次)。(4)每一次試驗成功的機率都是同樣的,成功機率都是p。72(5)令X表示n次試驗中成功的總次數,即X=X1+X2+Xn,我們以符號 X B(n,p)表
17、示 之,則n次 中 恰 有X次 成 功 的 機 率 為 其他0,.,2,1,0)1()(nxppxPxnxxn(5.16)73為什麼叫二項分配二項分配呢?這是由二項式定理而得名 nkknknknnppCpp0)1()1(1174例例5.22、若丟一個銅板(公正)6次,請問恰有3次正面,3次反面的 機率是多少?75恰有3次正面的機率)3(XP=3363)5.0()5.0(C 76例例5.23、擲一公正骰子6次,問(1)6次都未出現點數2的機率是多少?(2)恰有一次出現點數2的機率是多少?(3)6次都出現點數2的機率是多少?77(1)6次皆未出現點數2的機率)0(XP=660)65(C=6)65(
18、78(2)恰有1次點數2的機率)1(XP=5161)65()61(C=5)65)(61(6=5)65(79(3)6次皆出現點數2的機率)6(XP=666)61(C=6)61(802.二項分配二項分配的形狀(Shape)二項分配的機率圖有一共同特徵,即x由0到n,開始時機率值P(x)隨x增加而增大到某一點後就接著下降(即所謂單峰單峰情形),二項分配機率值P(x)最高點是在 x=(n+1)p,除非(n+1)p為整數。在(n+1)p為整數時,有兩個最高點分別在 x=(n+1)p1及x=(n+1)p。81二項分配的圖形 可能對稱,也有可能右偏,或是左偏,決定於成功的機率值p,如果p=0.5,則圖形是對
19、稱;如果p 0.5,則左偏82二項分配XB(30,p)為例,以p=0.5,0.8,0.2計算機率密度及圖形形狀 x p=0.5 p=0.8 p=0.2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0.00000 0.00000 0.00000 0.00000 0.00003 0.00013 0.00055 0.00190 0.00545 0.01332 0.02798 0.05088 0.08055 0.11154 0.13544 0.14446 0.13544 0.111
20、54 0.08055 0.05088 0.02798 0.01332 0.00545 0.00190 0.00055 0.00013 0.00003 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00001 0.00004 0.00018 0.00067 0.00221 0.00638 0.01612 0.03547 0.06756 0.11056 0.15382 0
21、.17946 0.17228 0.13252 0.07853 0.03366 0.00928 0.00124 0.00124 0.00928 0.03366 0.07853 0.13252 0.17228 0.17946 0.15382 0.11056 0.06756 0.03547 0.01612 0.00638 0.00221 0.00067 0.00018 0.00004 0.00001 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.000
22、00 83 圖圖5.5 B(30,0.5)機率密度函數圖 P 0.000.040.080.120.160.20051015202530 x 84圖圖5.6 B(30,0.8)機率密度函數圖 P 0.000.040.080.120.160.20051015202530 x 85 圖圖5.7 B(30,0.2)機率密度函數圖 P 0.000.040.080.120.160.20051015202530 x 863.二項分配二項分配的平均值與變異數 X是二項分配B(n,p),則 其平均值與變異數公式為(i)E(X)=np(ii)Var(X)=np(1-p)87例例5.26、奧華航空公司 奧華航空公司
23、接受訂位,經常有顧客訂位但未來搭乘,根據經驗約有20%的人訂位而未到,若奧華航空飛機只有20個座位,但已接受25個訂位,在沒有後補顧客的情況下,88求(1)至少有一位訂位者沒有座位的 機率是多少?(2)至少有一空位的機率是多少?(3)求這25位訂位者會到機場人數的 平均數與標準差?89令X表訂位且又來搭乘的人數,則XB(25,0.8)(1)P(X 21)=P(X=21)+P(X=22)+P(X=23)+P(X=24)+P(X=25)=2125(0.8)21(0.2)4+2225(0.8)22(0.2)3+2325(0.8)23(0.2)2+2425(0.8)24(0.2)1+2525(0.8)
24、25=0.4207(2)至少有一空位,表示訂位後來搭乘人數小於或等於19,故其機率為 P(X 19)=1P(X20)=1 P(X=20)+P(X=21)+P(X=25)=10.6167 =0.3833(3)搭乘人數X的平均數與標準差分別為 =E(X)=250.8=20=2.08.025)1(pnp=2 90例例5.27、大成公司 大成公司每天生產數千個晶體,已知產品有1%的晶體不符合規格,每小時檢查人員隨機選取40個樣本,X表示40個樣本中不符合規格零件的個數,求X小於或等於1的機率 91因X B(40,0.01),而樣品中只有一個或少於一個不符合規格,即X 1,其機率為 P(X 1)=P(X
25、=0)+P(X=1)=P(0)+P(1)=!40!0!40(0.99)40(0.01)0+!39!1!40(0.99)39(0.01)1=0.66897+0.27029=0.93926 925.4 超幾何分配超幾何分配 上節摸彩例子中,每次由袋中取球,看完顏色後又放回又放回袋中,所以上次取出球的顏色(成功、失敗)不會不會影響影響下次取出紅球(成功)的機率。下面仍然討論由袋中取球,但每次取出的球不再放回不再放回袋中,則上次取出球的顏色會影響會影響下一次取出紅球的機率 93超幾何分配超幾何分配的架構與二項分配一樣,都是伯努利試驗,即每次試驗只有二種結果,也是做n次試驗,所不同的是試驗與試驗間不再是
26、獨立,下一次試驗結果受上一次試驗結果影響。941.超幾何分配X H(N,n,r)的機率密度函數 NnrNknrkCCCkXP)(95紅(r)白(N-r)k k n-k 圖 5.8 由袋中取 n 個球,其中有 k 個紅球 96例例5.28 全班有32位男生、18位女生,抽籤派5位代表出公差,問 (1)抽到2位男生,3位女生的機率是多少?(2)抽到女多於男的機率是多少?97令 X表抽到男生的人數,則XH(50,5,32)(1)P(X=2)=550318232=0.1910 (2)女多於男的事件,則男生最多2位即(X 2),其機率為 P(X 2)=P(X=0)+P(X=1)+P(X=2)=55031
27、8232418132518032=0.2413 98超幾何分配期望值與變異數超幾何分配期望值與變異數:若 XH(N,n,r)(1)=E(X)=Nrn(2)2=Var(X)=)1)(1(NnNNrNrn 993.超幾何分配近似於二項分配 P(X=k)=NnrNknrkCCC knknrNrNrC)1()(100例例5.29、產品中不良率 已知某製程生產的產品中不良率是10%,從1000件產品隨機取出10件,令X表示不良品的個數,求 (1)P(X=2)=?(2)P(X 2)=?(3)求E(X)及Var(X)101X為超幾何分配(因一次取10件表示是取出後不放回),即 X H(1000,10,100
28、)故(1)P(X=2)=10100089002100=0.19447 如以二項分配計算,則 P(X=2)=210(0.1)2(0.9)8=0.1937 102(2)P(X 2)=1P(X=0)+P(X=1)=1 (10100099001100101000109000100)=0.2637 如以二項分配計算 P(X 2)=1010(0.1)0(0.9)10110(0.1)1(0.9)9=10.34870.3874=0.2639 103(3)利用公式(5.21)與(5.22)E(X)1100010100Nnr Var(X)=)1)(1)(NnNNrNrn=100(1000100)(11000100
29、)(110001001000)=10(1000100)(11000100)(11000101000)=0.8919 如以二項分配計算 E(X)=n p=100.1=1 Var(X)=n p (1 p)=10 0.1 0.9=0.9 104例例5.30、抽樣驗收 清華電子公司接到一批500個電子零件,合約上說明,如果從此批中任選10個檢查,發現超過一個不良品即可退貨,則接受此批貨。(1)試問如果此批貨中10%是不良品,則 公司接受此批貨的機率是多少?(2)如果此批貨的不良品是20%時,則 接受此批貨的機率又是多少?105 令X表示檢查10個中不良品的個數,則當X 1時接受此批貨。(1)XB(50
30、0,10,50)P(接受)=P(X 1)=P(0)+P(1)=1050094501501050010450050=0.7365(2)XH(500,10,100)P(接受)=P(X 1)=P(0)+P(1)=105009400110010500104000100=0.37337 106隨機變數 1.統計量會因抽樣不同得到不同的答案,是隨資料變動的,故稱為隨機變數 1072.離散型隨機變數常用的有 二項分配、超幾何分配、1083.以一張獎卷(或統一發票)為例,了解期望值(實際價值)等於所有報酬與 其發生機率乘積的加總 1094.期望值的性質:E(aX+bY)=aE(X)+bE(Y)為恆等式,由此導出若X1,.,Xn iid (即X1Xn是隨機取樣),則 E()=E(X1)。X1105.變異數的性質(1)Var(aX)=a2Var(X)(2)Var(aX+bY)=a2Var(X)+b2Var(Y),此式只有當 X,Y 獨立時才成立。(3)若 X1,.,Xn iid 且 Var(Xi)=2,則 Var(X)=2n 1116.機率密度、期望值與變異數 了解二項分配、超幾何分配的機率密度、期望值與變異數 1127.以袋中取球為例了解放回放回(二項分配)與不放回不放回(超幾何分配)差別 並知道當母體數N大,及抽樣數n小時,超幾何分配的機率值可以 二項分配 求其近似值