信赖区间与信心水准课件.ppt

上传人(卖家):晟晟文业 文档编号:5006197 上传时间:2023-02-01 格式:PPT 页数:63 大小:2.51MB
下载 相关 举报
信赖区间与信心水准课件.ppt_第1页
第1页 / 共63页
信赖区间与信心水准课件.ppt_第2页
第2页 / 共63页
信赖区间与信心水准课件.ppt_第3页
第3页 / 共63页
信赖区间与信心水准课件.ppt_第4页
第4页 / 共63页
信赖区间与信心水准课件.ppt_第5页
第5页 / 共63页
点击查看更多>>
资源描述

1、 信 賴 區 間 試 題 探 討 學科中心 信 賴 區 間 -95 暫綱實施前的準備設常態分配的期望值為m、變異數為s 2,則常態分配的機率分配函數是2121(),2xf xexRmss標準常態分配 XZms標準常態分配累積機率表 0zpp上面的標準常態累積機率表,是由平均值為 0、標準差為 1 的標準常態分配機率密度函數(上圖中的 f(x)),計算從到 zp 曲線下的面積而得,通常記作F(zp),因此上表可以寫成 F(zp)=p。2()21()2xf xe信賴區間的實驗老師為全班每個同學各準備一籤筒,事先不讓學生知道籤筒裡放了幾支籤,內含若干有獎籤,然後做一次實驗:每個同學在籤筒內抽取一支籤

2、,記錄是否為有獎籤後放回,連續抽取 20 次。記錄內容必為下列表格其中一列:區間公式對照表(n=20)區間半徑=中中籤籤數數中中籤比籤比例例 區間區間半徑半徑左左端點端點右右端點端點100.500.2190.2810.71900.000.0000.0000.000110.550.2180.3320.76810.050.0960.0000.146120.600.2150.3850.81520.100.1310.0000.231130.650.2090.4410.85930.150.1560.0000.306140.700.2010.4990.90140.200.1750.0250.375150.

3、750.1900.5600.94050.250.1900.0600.440160.800.1750.6250.97560.300.2010.0990.501170.850.1560.6941.00070.350.2090.1410.559180.900.1310.7691.00080.400.2150.1850.615190.950.0960.8541.00090.450.2180.2320.668201.000.0001.0001.00020)1(96.1ppp 舉例:若一學生抽 20 次得到 9 次有獎籤,則中籤比例為 ,區間半徑為區間為 0.450.218,0.45+0.218,即 0.

4、232,0.668 218.020)45.01(45.096.145.02090.60.70.80.91.00.50.40.30.20.10http:/ 40 個學生每個人都得到一個區間,如果老師事先知道 p=0.6,那麼從圖中可知,有 35 個區間包含真實的 p 值。全班 40 個學生包含 p 值區間個數的期望值為 40 0.95=38 個0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 3

5、3 34 35 36 37 38 39 40 00.020.040.060.080.10.120.140.160.180.200.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951p=0.6 二項分配以真實中獎機率 0.6 為例,20 次抽籤抽中有獎籤的比率必為 0,0.05,0.1,1.0 其中之一,舉例:抽中 9 次的中獎比率為 0.45,此事件發生機率為 0.071。(上圖左邊第二條綠色長條)上圖將每一種中獎比率與其發生機率作成直方圖,而綠色區域是 0.6 前後 1.96 個標準差的區域。119209)4.

6、0()6.0(C現在用常態分配去近似二項分配,每個同學 20 次抽籤的結果,抽中有獎籤的比率必為圖中 x 坐標之一,且此比率落在綠色區域的機率為 0.95。每個同學 20 次抽籤抽中有獎籤比率的結果好比是在擲一枚出現正面機率是 0.95 的銅板,成功擲出正面(抽中有獎籤比率落在綠色區域)的機率是 0.95。若樣本平均 落在 區間內,那麼區間會涵蓋真實值 p 。p 20)1(96.1,20)1(96.1pppppp+p p20)1(96.1ppp20)1(96.1ppp+20)1(96.1ppp20)1(96.1ppp+20)1(96.1,20)1(96.1pppppp+信賴區間的解讀全班依照這

7、樣的區間公式求出的 40 個區間,不論 n=20 或 n=50 的模擬實驗結果,可以發現並非一定有 95%的區間會涵蓋實際值 p。全班執行這個實驗,正如 40 個學生每人都在擲一枚出現正面機率為 0.95 的硬幣,我們只知道此實驗出現正面個數的期望值為 40 0.95=38 個,並不能保證一定出現 38 個正面。每個學生做出的區間,只可能有兩種情形:包含真實 p 值,或不包含真實 p 值。因此一旦做出區間後,並不能說真實 p 值在此區間的機率為 95%n=20 與 n=50 的區間估計的差異因區間半徑等於 ,所以較大的 n 值具有較小的區間半徑,也意味著有較佳區間估計的效果。較大的 n 值會導

8、致此實驗的分配會較近似常態分配。npp)1(96.1 信 賴 區 間 -95 暫綱實施後的練習題將隨機號碼表中的偶數當成擲銅板出現正面,奇數當成擲銅板出現反面,以此要求全班40個同學每人模擬投擲一個銅板20次的試驗,並計算擲出正面的比例及信心水準為95%的信賴區間,其中甲同學作出的區間為0.328,0.772,而乙同學作出的區間為0.556,0.944,試問下列敘述何者正確?(1)由甲所得到的信賴區間可知,甲模擬投擲銅板20次,得到 11次正面(2)由乙所得到的信賴區間可知,乙模擬投擲銅板20次,得到 15次正面(3)由甲所得到95%的信賴區間可知,此區間包含理論值0.5的 機率為0.95(4

9、)由信心水準為95%可推論,在全班已得到的40個區間裡,其中包含理論值0.5的區間數等於38個(5)若全班再做此試驗一次,所得到的40個95%的信賴區間 裡,其中包含理論值0.5的區間個數期望值約為38個Ans:(1)(2)(5)某校 1000 人一起做實驗,每個人均從已知籤筒(內有 5 支籤,其中 2 支是有獎籤)抽籤 n 次,每次取出一支籤,取出後須放回。下面第一圖是某次實驗中 n=50 時,每人抽中有獎籤比率與人數的分佈圖,第二圖則是另一次實驗中 n=100 的分佈圖。試問下列敘述何者正確:(1)兩實驗中,抽中有獎籤比率在 0.28,0.52 區間內的學生人數,以 n=100 的實驗裡人

10、數較多。(2)兩實驗中,抽中有獎籤比率在 0.38,0.42 區間內的學生人數,以 n=100 的實驗裡人數較多。(3)n=100 的實驗裡,全校抽中有獎籤比率在 0.31,0.49 區間內 的學生數為 950 人。(4)在 n=50 的實驗裡,一學生抽中有獎籤比率正好是 0.4 的機率為 。(5)若考慮 n=400 時,一學生抽中有獎籤比率在 0.35,0.45 區間 內的機率大於 0.95。Ans:(1)(2)(3)(4)(5)30205020)6.0()4.0(C(1)在兩實驗中,抽中有獎籤比率在 0.28,0.52 區間內的學生人數,以 n=100 的實驗裡人數較多。答:()n=50

11、的實驗裡,抽中有獎籤比率小於 0.28 的學生數為 15+8+3+1+1=28,大於 0.52 的學生數為 15+8+4+2+1 =30,因此在 0.280.52 之間的學生人數為10002830=948。同理,n=100 的實驗裡,在 0.280.52 之間的學生人數為1000211311=991。(2)兩實驗中,抽中有獎籤比率在 0.38,0.42 區間內的學生人數,以 n=100 的實驗裡人數較多。答:()n=50 的實驗裡,抽中有獎籤比率在 0.380.42 之間的學生人數為111+115+109=335。同理,n=100 的實驗裡,在 0.380.42 之間的學生人數為77+80+8

12、1+79+74=391,因此 n=100實驗裡人數較多。(3)n=100 的實驗裡,全校抽中有獎籤比率在 0.31,0.49 區間內的學生數為 950 人。答:()n=100 的實驗裡,抽中有獎籤比率小於 0.31 的學生數為 10+6+4+2+1+1=24,大於 0.49 的學生數為 10+7+4+3+1+1=26,因此在 0.310.49 之間的學生人數為10002426=950(4)在 n=50 的實驗裡,一學生抽中有獎籤比率正好是 0.4 的機率為 。答:()一學生抽中有獎籤比率正好是 0.4 是指他抽 50 次籤中得有獎籤 20 次,因此這個事件的機率為 。30205020)6.0(

13、)4.0(C30205020)6.0()4.0(C(5)若考慮 n=400 時,一學生抽中有獎籤比率在 0.35,0.45 區間內的機率大於 0.95。答:()因 ,抽中有獎籤比率在 0.350.45 之間的機率,以常態分配近似此二項分配,這個區間約是期望值前後 2 個標準差,因此機率大於 0.95。025.0205.04006.04.0承上題:若已知信心水準 90%的區間半徑公式是 (其中 是每人抽中有獎籤的比率),我們將 n=50 的區間半徑列表如下:(其中區間半徑值是四捨五入至小數點後第四位的近似值)利用下表,每個學生均可做出一個信心水準為 90%的信賴區間,試問下列敘述何者正確?npp

14、)1(65.1p 中獎比率區間半徑中獎比率區間半徑中獎比率區間半徑中獎比率區間半徑中獎比率區間半徑0.02 0.0327 0.22 0.0967 0.42 0.1152 0.62 0.1133 0.82 0.0896 0.04 0.0457 0.24 0.0997 0.44 0.1158 0.64 0.1120 0.84 0.0855 0.06 0.0554 0.26 0.1024 0.46 0.1163 0.66 0.1105 0.86 0.0810 0.08 0.0633 0.28 0.1048 0.48 0.1166 0.68 0.1088 0.88 0.0758 0.10 0.0700

15、 0.30 0.1069 0.50 0.1167 0.70 0.1069 0.90 0.0700 0.12 0.0758 0.32 0.1088 0.52 0.1166 0.72 0.1048 0.92 0.0633 0.14 0.0810 0.34 0.1105 0.54 0.1163 0.74 0.1024 0.94 0.0554 0.16 0.0855 0.36 0.1120 0.56 0.1158 0.76 0.0997 0.96 0.0457 0.18 0.0896 0.38 0.1133 0.58 0.1152 0.78 0.0967 0.98 0.0327 0.20 0.0933

16、 0.40 0.1143 0.60 0.1143 0.80 0.0933 1.00 0.0000(1)在 n=50 的實驗裡,抽中有獎籤比率是 0.5 的學生所做出的區間半徑一定大於其他抽中比率的學生做出的區間半徑。答:()從表中即可看出或由 可看出41)1(pp(2)若有一學生抽取 50 次後抽中有獎籤比率是 0.3,那麼 90%的信心水準的意義是指,真實中獎機率 0.4 落在此學生得到的信賴區間內的機率是 0.90。答:()雖然該生所做出的區間為 0.30.1069,0.3+0.1069,即 0.1931,0.4069,已經知道此區間涵蓋真實的中獎機率 0.4,因此我們不能再說 0.4 落

17、在此學生得到的信賴區間內的機率是 0.90。(3)90%的信心水準的意義是指全校 1000人在 n=50 的實驗裡,一定會有 900 人的信賴區間涵蓋真實中獎機率 0.4。答:()90%的信心水準的意義是指全校 1000 人在 n=50 的實驗裡,在 1000 個信賴區間中,涵蓋真實中獎機率 0.4 區間個數的期望值為 900 個。正如投擲一枚公正銅板 1000 次,得到正面次數的期望值為 500 次,但不是一定正好得到 500 次正面。(4)若在 n=50 的實驗裡要求信心水準提高時,區間長度將隨之增大。答:()要求信心水準提高是指,在期望值前後取更大的區間範圍,才能使抽中有獎籤比率落在此區

18、間的機率變大,這也是說,我們必須將區間半徑增大。舉一例,若信心水準是 95%,區間公式須變為 。50)1(96.1pp(5)在 n=100 的實驗裡,因區間半徑 較 n=50 實驗的區間半徑 小,所以信心水準隨著下降。答:()這是錯誤的觀念,由於這兩個公式都是指期望值前後 1.65 個標準差的範圍,此區域占全部約 90%,因此信心水準均為 90%。100)1(65.1pp50)1(65.1pp承上題:從 n=50 實驗的結果(第一圖)及區間公式表可知,這次實驗每個學生所做信心水準為 90%的信賴區間可以涵蓋真實中獎機率 0.4 的人數有 個。答:(890 個)從區間公式表可知,抽中比率是 0.

19、30 的區間為 0.1931,0.4069,抽中比率是 0.50 的區間為 0.3833,0.6167。再由第一圖知,抽中比率在0.30 0.50(含)的人數為 10005456=890機率的發展機率的概念起源於賭局,一直到1713 年J.Bernoulli 提出弱大數法則,標誌著數學機率論的誕生。接著是 De Moivre(1718年)與Laplace(1801年)的中央極限定理再來是 Gauss 的誤差之常態分配律(1809年)到了1900年,公理化的時機成熟,Hilbert 提出著名的23個問題,其中第6個就是關於物理學與機率論的公理化問題。結果在1933年才由俄國偉大數學家Kolmog

20、orov(1903-1987年)完成機率論的公理化,從此機率論作為一個數學理論完全確立。Bernoulli 家族 Bernoulli 大數法則 提出懸鏈線問題Jacob 解出懸鏈線問題 解出最速下降曲線問題Johann 流體力學 Riccati equationDaniel大 數 法 則 與 二 項 分 配00.050.10.150.20.250.300.020.040.060.080.10.120.140.160.180.20.220.240.260.280.30.320.340.360.380.40.420.440.460.480.50.520.540.560.580.60.620.640

21、.660.680.70.720.740.760.780.80.820.840.860.880.90.920.940.96n=100 二項分配n=10 二項分配系列3什 麼 是 大 數 法 則?先介紹柴比雪夫(Chebyshev)不等式:設隨機變數 X 的期望值為 ,變異數為 ,則對任意 常數 k(),恆有 以投擲公正硬幣 n 次的試驗為例,隨機變數 Sn 代表出現 正面的次數,所以 的期望值為 0.5,變異數為 ,而Chebyshev 不等式整理成m2s1k211)(kkXPsmnSnn412411)5.0(nnSPn取 =0.1 為例,Chebyshev 不等式成為而上述式子代表事實上,當

22、n=100 時,上述近似值是用 Excel 計算得到:nnSPn251)1.05.0(943.0)1.05.0100(100SP1)1.05.0(limnSPnnS100/100pS100/100p0.410.0158690.510.0780290.420.0222920.520.0735270.430.0300690.530.066590.440.0389530.540.0579580.450.0484740.550.0484740.460.0579580.560.0389530.470.066590.570.0300690.480.0735270.580.0222920.490.07802

23、90.590.0158690.50.079589 的二項分配其 Chebyshev 不等式是亦即對任意給定的正數 ,我們把上式稱為 當 時,隨機變數 機率收斂 到 0.5,這種收斂方式對照於函數序列,即為 fn 在集合 S 上逐點收斂至函數 f 。亦即 對每一個 ,當 ,1)5.0(limnSPnn2411)5.0(nnSPn0.5mnSnnSx)()(xfxfnn 逐點收斂的函數序列的例子:考慮 S 是開區間(0,1),。我們可知:對任意當 時,還有另一種收斂方式,稱為均勻收斂(uniform convergence):nnxxf)(0)(xf)1,0(a0)(afnn1.210.80.60

24、.40.2-0.2-0.4-0.60.511.522.53中 央 極 限 定 理:設 X1,Xn 是獨立且具相同分配的隨機變數,其中 E(Xi)=m,Var(Xi)=s 2,定義 ,則當 n 時,隨機變數 的分配會 趨近於標準常態分配(稱為分配收斂),也就是說隨機變數 的分配會趨近於標準常態分配nXsmsmnnXXn+)(1nXXXXn+21將隨機變數 整理成 ,由大數法則知,當 時 ,此處 符號的意思是指機率收斂:對任意給定的正數 ,而中央極限定理中,乘上 的功能是 讓機率密度函數圖撐開來nXsmms Xn大數法則與中央極限定理的關係:mpXnpsn1)(limmXPn中央極限定理中,所謂分

25、配收斂是指隨機變數 的機率密度函數趨近標準常態分配 N(0,1)的機率密度函數,nXsm撐開來 看得更清楚:用數學式表示分配收斂給定任意正數 z,當 n 時,(其中 是標準常態分配累積機率函數)1)(2)()(FFFzzzznXPsm中央極限定理的證明:定義動差生成函數(moment-generating function):可知 )()(XtXeEtM)()()()(2121nntXtXtXXXXeEeEeEtM+smnXi)(tMnXism?運算取極限)(XteE請100位同學每人投擲一個質量均勻銅板二十次的試驗,以擲出正面的比率為橫座標、學生人數為縱座標製作次數分配表。下表是以隨機號碼表

26、得到的100個模擬正面數:這個隨機模擬的結果有些令人失望,100個同學投擲個公正的銅板二十次,出現正面的比率中,人數最高的並不是期望值0.5,而且也沒有出現左右完全對稱的情形。這試驗的期望值是0.5,標準差是 0.11,而我們從前頁的圖表知道,擲出正面比率在0.5-0.11與0.5+0.11之間的人數佔全部的71%,在0.5-0.22與0.5+0.22之間的人數佔全部的95%,在0.5-0.33與0.5+0.33之間的人數佔全部的100%。20)5.01(5.0如果以100個同學投擲個公正銅板的模擬看來,即使並非每個同學擲出正面的比率值都是0.5(這種情形太困難了吧),但比率值在期望值前後1個

27、、2個、3個標準差範圍內的人數約略是佔全部的68%、95%、99.7%。這例子與常態分配的理論值有些誤差,想要更近似的方法是每人提高投擲次數(如每人投擲100次)及增加參與學生人數(如1000個學生參與),但隨機試驗仍存在不確定性,我們只是想從這些不確定性中尋找相似性。在沒有計算機的年代裡,我們連續投擲一個質量均勻銅板10000次,計算出現正面40006000次的機率值 就不是件容易的事,數學家想尋找一種模型能夠描繪二項分配或甚至是適用其他的機率分佈,於是常態分佈就廣泛地被大家使用了,只要上述投擲銅板的試驗次數夠多,它就能夠用常態分佈來近似其機率分佈的狀況,這種特別的現象即為統計學中一個重要的

28、定理:中央極限定理。600040001000010000)5.0(kkC 信 賴 區 間 -95 暫綱實施後的首次學測與指考某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民佔當地居民之百分比(以下簡稱為知名度)。結果如下:在95%信心水準之下,該產品在甲、乙兩地的知名度之信賴區間分別為 0.50,0.58、0.08,0.16。試問下列哪些選項是正確的?(1)甲地本次的參訪者中,54%的人聽過該產品(2)此次民調在乙地的參訪人數少於在甲地的參訪人數(3)此次調查結果可解讀為:甲地全體居民中有一半以 上的人聽過該產品的機率大於95%(4)若在乙地以同樣方式進行多次民調,所得知名度有 95%的機

29、會落在區間 0.08,0.16(5)經密集廣告宣傳後,在乙地再次進行民調,並增加 參訪人數達原人數的四倍,則在95%信心水準之下 該產品的知名度之信賴區間寬度會減半(即0.04)Ans:(1)(2)國一學生30萬人,智商測驗的結果是平均數100,標準差15的常態分配。若以智商130以上做為甄選國一學生為資優生的門檻,則根據這次測驗的結果判斷下列選項中的敘述,哪些是正確的?(1)約有5%的國一學生通過資優生甄選門檻(2)約有15萬名國一學生的智商在100以上(3)超過20萬名國一學生智商介於85至115之間(4)隨機抽出1000名國一學生,可期望有25名資 優生(5)如果某偏遠學校只有14名的國

30、一學生,那麼 該校不會有資優生Ans:(2)(3)(4)某縣市教育局欲瞭解高中生參加課外活動社團的意願,開學日隨機調查高一、高二、高三學生各1067名,詢問本學期是否要參加課外活動社團。已知該縣市的高一、高二、高三學生人數幾乎一樣多,各年級學生調查結果如下圖:試問下列選項中的敘述,哪些是正確的?(1)學生要參加課外活動社團之比例隨著年級增加而遞減(2)由上述資訊可以估算全體學生要參加課外活動社團的比例(3)在95%信心水準下,每一個年級學生要參加課外活動社團的比例之信賴 區間,都可以由題目中已知的數據算出(4)在95%信心水準下,三個年級的調查結果,以高一學生要參加課外活動 社團的比例的信賴區

31、間最長(5)在95%信心水準下,三個年級的調查結果,以高三學生要參加課外活動 社團的比例的信賴區間最短Ans:(1)(2)(3)(5)信 賴 區 間 -現況與未來某次測驗有單選題100題,每題有5個選項,答對得1分,不答與答錯均不得分不倒扣。請依此回答下列兩個多重選擇題:1.假設小明決定每題均亂猜答案,試問 下列敘述何者正確?(1)小明得分的期望值為20分(2)小明得到20分的機率大於得到21分的機率(3)小明得到19分的機率等於得到21分的機率(4)小明得到1624分的機率約等於0.95(5)若只用前50題計分,每題答對得2分答錯不倒扣,則小明得分的期望值是40分Ans:(1)(2)2.現在

32、有五個同學相約考試時每題都亂猜答案,但彼此不知是否真的均遵守約定亂猜答案,得分如下:學生 甲 乙 丙 丁 戊 分數 30 24 12 16 28老師建立下面的規則來判斷是否真的完全亂猜答案:作答者以每人答對比例為中心,做一個95%的信賴區間;若區間涵蓋0.2,我們就相信作答者真的是亂猜答案,若區間不涵蓋0.2,則否。試問我們相信遵守約定亂猜答案的同學是(1)甲 (2)乙 (3)丙 (4)丁 (5)戊註:95%的信賴區間是指Ans:(2)(4)(5)1(96.1,)1(96.1npppnppp+民意調查的意義常常在民意調查的報導中有如下的敘述:本項調查是由XX民意調查中心在XX年X月X日進行,以

33、隨機跳號抽樣及電腦輔助電話訪問方式,訪問台灣地區 1068 位 20 歲以上的民眾,在 95%的信心水準下抽樣誤差為 3%。如果這項調查的結果對於候選人A的支持度為32%,候選人B的支持度為30%,這代表候選人A支持度的95%信賴區間為29%,35%,候選人B支持度的95%信賴區間為27%,33%。這兩個區間有很大的重疊,因此選舉結果是有可能發生逆轉,這也是在相同的信心水準下,為何信賴區間的長度(即所謂抽樣誤差)要越小越好,而上面已提供了一個方法提高抽樣的樣本數 n。如何得到民意調查的抽樣數 n=1068?因 ,所以區間半徑 。若要求抽樣誤差不超過 d,則 即 。以此例而言,若選擇抽樣誤差 d 等於 0.03,因 95%的信心水準下,z0.975 1.96,則 n 1068。41)1(ppnznppz41)1(2121dnz412122421dzn但在相同的信心水準下,若選擇抽樣誤差 d 小於 0.01,則 n 9604。以成本的角度來看,為了讓抽樣誤差從 3%減少到 1%,與其增加 9 倍的樣本,不如更謹慎的規劃及更好的抽樣方法來得有效。信 賴 區 間 -批判與討論 Bye Bye

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(信赖区间与信心水准课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|