1、6 Sigma企劃部3/13/2001百分之百確定的事?百分之百確定的事?例子例子.量子的世界量子的世界機率決定一切機率決定一切統計學家從不說統計學家從不說100確定。確定。那麼有多確定那麼有多確定?95%確定;確定;99%確定;確定;99.99966%確定?確定?母體母體(分配分配)樣本樣本(抽樣抽樣)機率機率統計統計Q1:隨機變數隨機變數X為常態分配為常態分配N(,2),請問請問 的平均數、變異數、變異係數?的平均數、變異數、變異係數?Q2:自某一母體自某一母體Y隨機抽樣隨機抽樣50個樣本,得到樣本平均數為個樣本,得到樣本平均數為50,樣本標準差為樣本標準差為5,請問此母請問此母體平均數是
2、否為體平均數是否為45(在在95%顯著水準下顯著水準下)?x 敘述統計(Descriptive Statistics)樣本平均數、中位數、四分位數、變異數、標準差推論統計(Deductive Statistics)信賴區間估計(Confidence Interval)、假設檢定(Hypothesis Test)實驗設計 回歸分析(Regression)、變異數分析(ANOVA,ANalysis Of VAriance)A說:昨天晚上我和3個平均年齡只有24歲的小姐約會。B說:哇!茂死啊!茂死啊!A說:一點也不,年齡差距太大,一點也不起勁。B說:還好吧,你也才28歲而已!60歲6歲6歲只衡量數值
3、集中的程度還不夠,還要衡量離散的程度!只衡量數值集中的程度還不夠,還要衡量離散的程度!離散的程度:全距離散的程度:全距(Range)、標準差標準差(Standard Deviation)全距全距最大值最大值-最小值最小值樣本變異數樣本變異數Variance ,i=1,2,.n 其中其中 樣本標準差樣本標準差 s 三個樣本值分別為三個樣本值分別為6,6,60 平均平均24;全距;全距=54,標準差標準差s 31.177 12)(nxxinxxi13224)-(60 224)-(6 224)-(6樣本變異數 中位數:一群數值從小到大排列後,位於正中間的數。中位數:一群數值從小到大排列後,位於正中間
4、的數。(若為偶數個數值,則取最中間兩數的平均)(若為偶數個數值,則取最中間兩數的平均)四分位數:在此數值之下,有四分位數:在此數值之下,有1/4或或3/4的數值分佈。的數值分佈。例子例子1:10個樣本值,由小到大排列,如下:個樣本值,由小到大排列,如下:3,4,5,5,6,7,8,9,10,11求中位數?上四分位數求中位數?上四分位數(Q1)?下四分位數下四分位數(Q3)?Ans:中位數中位數(median)6.5 First Quartile(Q1)5 Third Quartile(Q3)8.75EXCEL、MINITAB都可以算出來;但都可以算出來;但Q1、Q3答案答案(公式公式)不一樣不
5、一樣 311 作法:把作法:把最小值,最小值,Q1,中位數中位數(=Q2),Q3,最大值最大值畫出來。畫出來。功用:可看出一群數值大致的分佈。功用:可看出一群數值大致的分佈。接前例接前例56.58.75 最小值 Q1 中位數 Q3 最大值 2)(2121)(xexf常態分配特性:1.期望值 E(x)=.又稱mean2.變異數 V(x)=23.為左右對稱的分配,-x23.為左右對稱的分配為左右對稱的分配4.當當v ,t 分配近似於標準分配近似於標準 常態分配常態分配N(0,1)t(v)t(v)設設(X1,.,Xn)為抽自常態母體為抽自常態母體N(,2)之之一組隨機一組隨機樣本,樣本,則:則:Pr
6、oof:1)-(nt/S-xn)1,0(/xzNn2)1(22s)1(nn1)1(/WZT22nSnnXv用來檢定母體平均數用來檢定母體平均數 設設 與與 為獨立隨機變數,且為獨立隨機變數,且又令:則隨機變數F的機率分配是自由度v1與v2的F分配,記為FF(v1,v2)222121Fvv2122)1(221v)2(222v 設設(X1,.,Xn1)與與(Y1,.,Yn2)為分別由常態母體為分別由常態母體N(1,12)與與N(2,22)抽出的兩抽出的兩組獨立的隨機樣本組獨立的隨機樣本,則:則:)1,1(F2122222121nnSS用來檢定兩母體標準差是否相等用來檢定兩母體標準差是否相等(1=2
7、)設設(X1,.,Xn)為由常態母體為由常態母體N(,2)抽出的一抽出的一組獨組獨立的隨機樣本立的隨機樣本。)1,0(NnxZ95.0)96.196.1(nxPRecall:Page 10 95.0)96.196.1(nxnxP表示:有有95%信心,母體的信心,母體的 mean()將在底下將在底下區間之內區間之內)96.1,96.1(nxnx如果要有99%信心的話呢?定義:對於一常態分配母體的mean(),若已若已知其標準差為知其標準差為,則其100(1-)%的信賴區間為:),(22nzxnzxExample:99%,Z/2=2.575(查表可得,統計軟體會內建)0Z/2(1-)-Z/2現實問
8、題是:現實問題是:不知道。不知道。對於一常態分配母體的mean(),若其母體標準差未知,求其100(1-)%的信賴區間t分配分配Recall:1)-(nt/S-xnT12)(nxxSi其中,i=1,2,n 1)()1,2()1,2(nntTtP0t(/2,n-1)(1-)-t(/2,n-1)1)()1,2()1,2(nntnSXtP 1)()1,2()1,2(nStXnStXPnn定義:對於一常態分配母體的mean(),若若與S為其樣本平均值及樣本標準差,則其100(1-)%的信賴區間為:x)()1,2()1,2(nStXnStXnn,查表得到或軟體內建)()110,025.0()110,02
9、5.0(nStXnStX,例子:10,13,17,14,20,15,21,18,13,20 為自一常態母體抽出的一組樣本。試求母體mean的95%信賴區間:,1.16x67.31102)(xxSi)1067.3*262.21.161067.3*262.21.16(,Ans:所以母體mean的95%信賴區間:)725.18475.13(,動機:經由統計方法,拒絕拒絕一原始的假設一原始的假設。原始假設:虛無假設虛無假設(Null Hypothesis):希望被否定的統計假設,以H0表示之。另外假設:對立假設對立假設(Alternative Hypothesis):由於否定虛無假設而被認為對的統計假
10、設,以H1或Ha表示之。H0:新藥不具療效H1:新藥具有療效利用數據及統計方法 去拒絕H0(接受H1)檢定程序:1.決定檢定統計量2.決定拒絕域(rejection region):與顯著水準有關當檢定統計量落入拒絕域,則拒絕當檢定統計量落入拒絕域,則拒絕H00Z(1-)H1Z0Z則拒絕H0 另一種表示檢定結果的方法:P-Value1.以標準常態分配為例,P-Value=P(Z檢定統計量Z0)2.當當P-Value0 30,不管母體分配為何,趨近常態實用經驗:若樣本本身的分佈是鐘型曲線(Bell-shape),則 樣本數 n只要等於4或5,不管母體分配為何,趨近常態2xx 謝謝各位!謝謝各位!恭喜各位已經學到統計的入門,恭喜各位已經學到統計的入門,請繼續加油!請繼續加油!