1、第三章.敘述統計學將資料表格化或繪製圖形,使資料能一目瞭然。一個好的圖表勝過千言萬語。資料形態有兩種:分立變數(discrete variable):沒有度量衡儀器的測定(無單位),分立變數都是計數的。如家庭子女數、性別、花的顏色等。連續變數(continuous variable):有度量衡儀器的測定(有單位,如公分、公斤等),觀測值間的變動是連續的,差異很小。如身高、體重、溫度等。表3.1 50粒250mg四環素膠囊測定重量表(mg)50粒四環素按重量大小排列後次數分配表(未分組)101 3.322logKN 本例N=50,所以組數:因此每組之組距:(256244)/71.714 2 組限
2、最小值為244,但組距為2,故第一組之上下組限為(244,245),第二組組限為(246,247)。因重量為連續變數,244應在243.5與244.5之間,且第一要包括最小值在內,第一組下組界為最小值減0.5 243.5,第一組上組界為243.5+2=245.5,而第二組下上組界為(245.5,247.5)。第一組組值=(243.5+245.5)/2=244.5,其他組值依此類推,而得如下分組次數分布表:101 3.322log 501 3.322 1.76.657K 50粒四環素次數分配表(分組後)(discrete variable)(continuous variable)9001345
3、566688100000224454551100110010010012100knkkknnkxnQkxxn;如果不是整數如果是整數。123,Q Q Q 之百分位數求法100PknQXQX11()2kkXX112 113225263371382525%,5012.51002495050%,502510011()(250250)250227575%,5037.5100252PkQXXPkQXXPkQXX補充左偏斜分布中量偏右常態分布中量在中間右偏斜分布中量偏左xnxxnii1)(211nniixxxx其中式中(讀音Summation or sigma)為總和符號 NxNii1樣品點(sample
4、 point)例3.1表3.4 台北市某醫院一星期內20位初生嬰兒體重表(克)iixiiiixixixx8.319020/6381620/)31063264(x克表3.4 台北市某醫院一星期內初生嬰兒體重表(克)iixiiiixixix120012008.3190 x6.3087x5.36/)654321(。cxncxncxncxnynyniininiiniinii1111111)(11xcxnccxnynyniiniinii111111xxDii0)(1111xnxnxxxxDniniiniinii而偏差總和等於0 xxDiiniixxSS12)(2222(55)(25)(105)(35)3
5、8SS 2222(54)(24)(104)(34)4238SS 為偶數如果為奇數如果nxxnxMednnn)12()2()21(21(5)1915922nMedX(4)(5)1894,()8.5222nMedXX(a)常態分布xMed0MxMed0M(b)右態分布xMed0M(c)左態分布圖3.8 常態分布與偏斜分布1011logniiuXnlog()10ugxantiu12.ngnxx xxgxu (0.8+3.35)/101.71 Med(1.18 1.81)/21.50 x 算術平均值中量gx1011010100.18775(loglog)/(log 0.8log 3.35)/100.1
6、8775log()10101.541.501.541.71nugguxxnxantiuMedxx121211111()111()Hnnxnxxxnxxx例子:例如某人到三家雜貨店買雞蛋,每家每個蛋之價錢分別為3.5,4,5元,求一顆蛋平均多少錢?由(3.7)式,此結果與算數平均值(元)略有出入。34.081113.545Hx4.17x 1.算數平均值:kiikiiifxfx11/if:組次數ix:組中點,k:組數25.250505.25625.24655.244350/71iiixfx人工測定法(mg%/ml)機器自動測定法(mg%/ml)圖3.9 同一組資料人工測定與機器自動化測定尿酸紀錄圖
7、8x 4.56.51012981076114.586.58781081285122.45MDxxn如尿酸人工測定法 4.5,6.5,7,10,12 M D=22SSNxNii122NxNii12)1(122nxxSnii)1(12nxxSnii2NxNii122NxSDNii122例3.8:擲一骰子,族群觀測值為1,2,3,4,5,6 =3.5,N=6則平方和:2222122221 3.523.563.517.512.621/6NiiSSx變方:9167.265.17122NSSNxNii標準偏差:7078.19167.22SD221(1)niiSxxn221(1)niiSSxxn0)(1ni
8、ixxnxxnxnxnxnxnxnxxxxnxxxxnxxnSniiniiniiniinininiiiniiinii21121222122111221221221111211211)2(11)(11假設同一組資料使用兩種不同方法測定人體血液中尿酸(uric acid)濃度,資料如下。試分別求人工測定法與儀器自動測定法尿酸濃度之均方及標準偏差。資料記錄圖,如圖3.9。均方:標準偏差:以簡算式求得 l人工測定法:l自動測定法:40ix5.3552ix875.845.3545405.35522S979.2875.82SS40ix3302ix均方:標準偏差:5.2410454033022S58.15.
9、22SS原樣品nxxx,21及新樣品nyyy,21,其中 iiycx22222111111111nnnyiiixiiisyyxcxcxxsnnn I原觀察值 新觀測值新觀測值偏差新觀測值偏差平方14.54.5-8=-3.5-3.5-0=-3.512.526.56.5-8=-1.5-1.5-0=-1.52.25377-8=-1-1-0=-1141010-8=22-0=2451212-8=44-0=416平均88-8=0 和 35.5 新觀測值均方與標準偏差與原觀測值均方與標準偏差相同例3.11:人工測定法尿酸值減常數c=8新樣品 nyyy,21,其中 iiycx例3.12:人工測定法尿酸值乘常數
10、c=22222222111111111nnnyiiixiiisyycxcxcxxc snnn 2291.52 22493.52 22412 221622 226442 214235.5 2nN6,5,32Nx2()x22()(1)ixxSn22()ibxxSn()2(/)n2()5985.32991iixx39925.2999122ixx2_22631.732xxn標準誤差_22,xx _2,SSx 5xE226SE100%CV 標準偏差平均值%100CV%100 xSCV兩單位標準偏差雖不同,但變異係數相同例3.14:設今有五位初生嬰兒體重如下:X(以克為單位):3260,3246,3324
11、,3200,2850Y(以盎司為單位):114.99,115.50,117.25,112.87,100.53 _215880,3176,35178ixxxS_2560.14,112.028,43.7665iyyyS35178187.5580,43.76656.6156xySS187.5580100%5.905%3176xCV6.6156100%5.905%112.028yCV解:乍看之下,身高的標準偏差遠大於體重的標準偏差,但因兩者的單位不同,不宜直接由標準偏差的大小來說明分散程度大小,此時應利用變異係數來回答本問題才正確。例3.16:假設調查10位成人的平均身高為166公分,標準偏差為36.8公分;平均體重為62.5公斤,標準偏差為12.3公斤,試問身高和體重哪一項分散程度較大?l 身高:%17.22%1001668.36CVl 體重:%68.19%1005.623.12CV由此可知,此10位成人體重的分散程度較身高來得小。The End