1、1 14-*LO4-1 繪製並解釋 點圖 dot plot.LO4-2 繪製並解釋 枝葉圖 stem-and-leaf.LO4-3 Identify and compute measures of position.LO4-4 繪製並分析 箱形圖 box plot.LO4-5 計算並解釋 偏態係數 coefficient of skewness.LO4-6 繪製並解釋 散佈圖 scatter diagram.LO4-7 製作並描述 條件次數表/交叉表 contingency table.Learning Objectives2 24-*點圖 Dot Plotsn點圖 dot plot:盡可能少
2、將資料分組,以免無法識別各個資料的確切數值。n在點圖中,每一筆資料都是一個點(dot),被標示在橫軸對應的數值上。n若多個觀察值的數值相等或非常接近,則可將各個資料點堆疊起來(“piled”on top of each other).LO4-1 Construct and interpret a dot plot.3 34-*點圖 Dot Plots-ExampleApplewood Auto Group Dealerships的兩個分店(Tionesta Ford Lincoln Mercury and Sheffield Motors,Inc.)的維修部門上個月都營業24天,下表列出這兩家
3、分店上個月維修的車輛數,請製作點圖(dot plots),並做出summary statistics報告來比較兩家分店的營業狀況與表現。LO4-14 44-*點圖 Dot Plot Example in MinitabLO4-14-範例:點圖抽樣花蓮50位70歲以上的長輩,調查他們過去一年就醫的次數。這組資料以點圖繪製如下:從點圖中可清楚的看出:這50位長輩們的去年的就醫次數主要是介於2-4次之間(共25位)。有三位沒有就醫記錄(次數=0)但有一位就醫次數多達9次。4-點圖的特性n優點:清楚顯示資料的分配型態,資料集中趨勢,以及最高值、最低值的觀察點。n缺點:圓點圖只是用於觀察點較少的資料。如
4、果觀察點多的時候,histogram較恰當。7 74-*枝葉圖 Stem-and-Leafn第二章中,次數分配將資料組織成有有意義的形式n將資料組織成次數分配的主要優勢在於:可輕易看出資料分配的形狀,而 枝葉圖 則可同時看到資料與分配形狀n次數分配有兩個缺點:而枝葉圖則全無此兩項缺點枝葉圖則全無此兩項缺點1.資料計入組次列表,表中無每一筆資料的確切值2.表中僅有組次,卻無各組內的實際分配資料n可用來表現資料分配,同時又能看到每一筆資料的確實數值的方法:枝葉圖 stem-and-leaf display.LO4-2 Construct and describe a stem-and-leaf d
5、isplay.8 84-*枝葉圖 Stem-and-Leafn枝葉圖枝葉圖(Stem-and-leaf displayStem-and-leaf display):用來組織與呈現資料的統計方法,每一數值被分成兩部分:The leading digit(s)becomes the stem and the trailing digit the leaf.枝的數值放在縱軸,葉的數值則被疊起來,水平列出。n枝葉圖優於次數分配之處:枝葉圖中,看得到每一筆資料的確實數值LO4-24-枝葉圖 Stem-and-Leaf 定義(p.96)n(1)將每一觀察值的數字分成兩部分,前數字為枝,後數字為葉。例如:數
6、字為89,枝為8,葉為9。n(2)在枝葉圖中分兩欄,枝垂直排列於左邊欄,葉橫向排列於跟其枝相對的右邊欄。n但數值為二位以上數字時,怎麼辦?一般都是將最後一位的數字作葉,前面的數字作枝。例如:數字156,枝是15,葉是6。4-枝葉圖 Stem-and-leaf Plot Examplen製作枝葉圖不必先排序n葉子必須為單位數,較能看出分布狀況n點圖 vs.枝葉圖:熟好熟壞,見仁見智,但一般常用點圖,而個人使用,為方便計,也可用枝葉圖。11114-*枝葉圖 Stem-and-leaf Plot Example(p97)Table 41 列出去年Greater Buffalo Automobile
7、Dealers Association(同業公會)45個會員所購買的廣告單位數(以30秒為1個單位)。將此資料以枝葉圖方式呈現,請問:資料集中於那個數值?最少買了多少單位的廣告?最多買了多少單位的廣告?LO4-24-Stem-and-leaf Plot Example尚未排列 排列後廣告時段的購買數量主要集中在:110130之間。有多少人購買數量介於110119之間?有多少人購買廣告數量介於120129之間?購買量最少是88,最多是156。看出每個層級當中的分配9人8人13134-*枝葉圖 Stem-and-leaf Plot Example組別為:80,90),90,100),100,110
8、),依此類推The usual procedure is to sort the leaf values from the smallest to largest.LO4-24-枝葉圖的特性n優點:能展現資料的次數分配形狀,也能保留資料的原始數值。n缺點:只能用於數量資料,且觀察值數目也不能太多。4-Minitab的枝葉圖:Ex.7(p.100)n最左邊多了一欄:以上/以下累積次數n最小值:38n40-49:次數0n(7)表示:中位數在本組內,且本組的組次7n組中點以下的組別,則為以上累積次數4-Ex.7(p.100)a.25b.1c.38,106d.60,61,63,63,65,65,69e
9、.No valuesf.9g.9h.76i.164-Ex.8(p.101)4-Ex.8(p.101)a.50b.Onec.126,270d.155,158,159e.No valuesf.13g.12h.193.5i.19 4-Self-review 4-1(p.99)1.(a)79,105(b)15(c)From 88 to 97;75%of the stores are in this range 2.7 78 0 0 1 3 4 8 89 1 2 5 6 6 8 9 10 1 2 4 811 2 6(a)8(b)10.1,10.2,10.4,10.8(c)9.5(d)11.6,7.720
10、204-*衡量相關位置 Measures of Positionn最常被用來衡量離散度者為標準差 n另一衡量資料分布情況的方法是:用數值(資料值)定位,將資料分成數個等分。n這種等分的衡量標準有:四分位數(quartiles)十分位十分位數(deciles)百分位數(percentiles)LO4-3 Identify and compute measures of position.4-資料等分位置的衡量:四分位數(Quartilesn四分位數:將順序資料的觀察值分成四個等分數值的分位數 所以四分位數內有三個分位數分位數Q Qi i (i=1,2,3)至少有至少有i/4i/4的觀察值的觀察值
11、QiQi 且有且有(4-i)/4(4-i)/4的觀察值的觀察值QiQi *第一四分位數(Q1)標示至少有1/4(25%)的觀察值小於Q1 *第二四分位數(Q2)標示至少有2/4(50%)的觀察值小於Q2:因此,也是中位數中位數 *第三四分位數(Q3)標示至少有3/4(75%)的觀察值小於Q34-十分位數、百分位數(p.107)n十分位數:將順序資料的觀察值分成十個等分數值的分位數 十分位數有幾個分位數?9個n百分位數:將順序資料的觀察值分成一百個等分數值的分位數4-百分位數與中位數、四分位數、十分位數之對照百分位數P10P20P25P30P40P50P60P70P75P80P90中位數Me四分
12、位數Q1Q2Q3十分位數D1D2D3D4D5D6D7D8D9表:表:百分位數與中位數、四分位數、十分位數之對照百分位數與中位數、四分位數、十分位數之對照24244-*百分位數 Percentile Computationn要計算 百分位數 percentile,令Lp 表示第p的百分位數的位置,因此,第33個百分位數,就位於 L33,而第50個百分位數,就位於 L50.n觀察值數目為 n,因此,若我們要找中位數 median的位置,它的位置就在 (n+1)/2,百分位數或可寫為(n+1)(P/100),而 P 為想要的百分位數的數值。LO4-34-nLp:百分位數的位置,n:觀察值數量,P:想
13、計算的百分位例1:60個觀察值中,想找出中位數的位置 P=50,Lp=(60+1)*(50/100)=30.5 中位數位於第30.5個觀察值例2:200個觀察值中,想找出第33個百分位的位置 P=33:將200個觀察值分成100等分,第33個百分位的位置 L33=(200+1)*(33/100)=66.33第33個百分位數值是第66.33個觀察值如何計算分位數的位置?(p.102)l該如何計算分位數的位置?可用以下這個公式:26264-*百分位數 Percentiles-ExampleListed below are the 酬庸/佣金commissions earned last month
14、 by a sample of 15 brokers at Salomon Smith Barneys Oakland,California,office.$2,038$1,758$1,721$1,637$2,097$2,047$2,205$1,787$2,287$1,940$2,311$2,054$2,406$1,471$1,460Locate the 中位數(median),第一個四分位數(the first quartile),and 第三個四分位數(the third quartile)for the commissions earned.LO4-327274-*百分位差 Percen
15、tiles ExampleStep 1:先將資料由低至高排序LO4-328284-*百分位差 Percentiles Example Step 2:計算第一、第三個四分位數,其位於 L25 及 L75,可用下式計算:LO4-3$1,460$1,471$1,637$1,721$1,758$1,787$1,940$2,038$2,047$2,054$2,097$2,205$2,287$2,311$2,406L25=(15+1)25100=4 L75=(15+1)75100=12Therefore,the first and third quartiles are located at the 4t
16、h and 12th positions,respectively:L25=$1,721;L75=$2,2054-Percentiles Example(cont.)$1,460$1,471$1,637$1,721$1,758$1,787$1,940$2,038$2,047$2,054$2,097$2,205$2,287$2,311$2,406Step 2:計算中位數的位置應用剛才介紹的公式,Lp=(n+1)*(P/100)n=15,P=50,L50=(15+1)*(50/100)=8 中位數位於排序資料的第8個$2,038Step 3:計算第一四分位數(first quartile)及第三四
17、分位數(third quartile)位置 L25=(15+1)*(25/100)=4第一四分位數位於排序資料的第4個$1,721 L75=(15+1)*(75/100)=12第三四分位數位於排序資料的第12個$2,205Step 1:將佣金資料從最低至最高值依序排列30304-*百分位差(若區位值LP並非整數)p.103前例中的區位都是整數 whole number.設若樣本中的6個觀察值依序排列為:43,61,75,91,101,and 104,亦即 n=6,而我們想找出第一個四分位數的位置?它位於第一個數值後它位於第一個數值後,再向後移動第一個數值與第二個數值的間距的0.75的位置,這就
18、是第一個四分位差。正如中位數一樣,四分位差不必拘泥於資料中觀察值的數據,也可以是兩個觀察數據的插值。在此例中,第一與第二個數值為 43 與 61,向後移動向後移動 0.75個間距個間距,第一個四分位差,亦即地 25th 個百分位差(percentile)為 56.5,由 43+0.75*(61-43)求出。75.110025)16(25=+=LLO4-34-四分位數:當觀察值數量為偶數隨機抽樣6台汽車這星期的加油公升數:91,75,61,101,43,104請問第二四分位數是多少?第三四分位數是多少?重點:四分位數不是一定要觀察值中已有的數值數字排序後為:43,61,75,91,101,104
19、Lp=(n+1)*(P/100)第二四分位數的位置:L50=(6+1)*(50/100)=3.5排序數列中第3.5個第二四分位數的數值是多少?75+(91-75)*0.5=83 第三四分位數的位置:L75=(6+1)*(75/100)=5.25排序數列中第5.25個第三四分位數的數值是多少?101+(104-101)*0.25=101.754-Self-review 4-2(p.105)(a)What is the median weight?Lp=(9+1)*50/100=5 weight of the median=7.90(b)Determine the weights correspo
20、nding to the first and third quartiles Q1:Lp=(9+1)*25/100=2.5 weight of Q1=7.72+(7.8-7.72)*0.5=7.76 Q3:Lp=(9+1)*75/100=7.5 weight of Q3=7.97+(8.06-7.97)*0.5=8.015(C)Determine the weight corresponding to the 46th percentile Lp=(9+1)*46/100=4.6 weight of the 46th percentile=7.86+(7.9-7.86)*0.6=7.884=7
21、.8833334-*箱型圖/盒鬚圖 Box Plotn盒鬚圖(box plot)乃根據四分位數而繪製,有助於 觀察資料的分布情形 n繪製盒鬚圖,我們僅需5個統計數據:1.The minimum value 極小值極小值,2.Q1(the first quartile)第第1個四分位數個四分位數,3.The median 中位數中位數,4.Q3(the third quartile)第第3個四分位數個四分位數,and5.The maximum value 極大值極大值.LO4-4 Construct and analyze a box plot.34344-*箱型圖/盒鬚圖 Boxplot-Ex
22、amplenAlexanders Pizza 15英里內都免費送貨.老闆 Alex,想知道送貨所需的時間、一般送抵所耗時間?所耗費的時間在那個範圍(range)內?依據20個送貨的樣本,他得到下列資訊:Minimum value=13 minutesQ1=15 minutesMedian=18 minutesQ3=22 minutesMaximum value=30 minutesn請繪製盒鬚圖.根據此資訊,你的結論為何?What conclusions can you make about the delivery times?LO4-44-Boxplot Example(p.106)Ale
23、xanders Pizza的老闆Alex想知道:一般送貨要多久時間?大部分送貨所費的時間範圍(range)是多大?抽樣二十次送貨所花費的時間,他計算出以下的資料:最小值:13分 第一四分位數(Q1):15分 中位數:18分 第三四分位數(Q3):22分 最大值:30分請用這些數值繪製盒鬚圖。從盒鬚圖中,對於送貨時間我們可以做出哪些結論?36364-*箱型圖/盒鬚圖 Boxplot ExampleStep1:在X軸定好適當的格距Step 2:由 Q1(15 minutes)到 Q3(22 minutes)繪成一個箱子形狀.在箱子內的中位數處畫一垂直線來標示 median(18 minutes).
24、Step 3:從箱子兩端,將水平直線延長至最小值 the minimum value(13minutes)與最大值 the maximum value(30 minutes)處.LO4-44-Boxplot Example(pp.106-7)Step1:在橫軸上繪製格線(scale)Step 2:繪製一盒子(box),一邊始於Q1(15 minutes),一邊終於Q3(22 minutes).並在盒子中繪製一垂直線標示中位數中位數(18 minutes)盒子本身涵蓋居中50的觀察值,這垂直中位數線將盒內資料分成相等的兩部分(25%),代表資料中心位置。盒子的寬窄:居中50的觀察值集中的情況。S
25、tep 3:從盒子外左右延伸一橫線,左邊延伸至最小值最小值(13 minutes),右邊延伸至最大值最大值(30 minutes)這兩條延長橫線很像貓咪的鬍鬚(whiskers)這兩條鬍鬚長度涵蓋另外50的觀察值,代表資料的分散度4-這個圖告訴我們什麼?(p.107)(1)盒子內包含居中50%的觀察值i.e.50的送貨時間介於15分(Q1)及22分(Q3)之間(2)Q1跟Q3的距離稱為四分位差(interquartile range)?呈現居中50資料的分散度(盒子的長度)(3)盒子外的兩條鬍鬚各含25%的觀察值 右邊25的送貨時間差距較大,介於22及30分之間。資料呈右偏還是左偏?1.右邊的
26、鬍鬚比左邊長,表示資料是右偏分配。2.盒子內,(Me-Q1)Q3+1.5(Q3-Q1)要多小?outlier Q1-1.5(Q3-Q1)Q15.P1084-盒鬚圖極端界外值極端界外值外圍外圍平穩界外值平穩界外值內圍內圍最小值最小值Q1Q3中位數中位數最大值最大值內圍內圍平穩界外值平穩界外值外圍外圍極端界外值極端界外值1.5IQRIQR3IQR1.5IQR3IQR圖圖:盒鬚圖與資料的內外圍和界外值盒鬚圖與資料的內外圍和界外值4-45454-*偏態 Skewnessn第三章中介紹了衡量一組資料分配的中間趨勢值 central location(the mean,median,and mode)以及
27、衡量離散度dispersion(the range and standard deviation)的方法。n衡量分配的另一特性是:形狀衡量分配的另一特性是:形狀 Shape n通常資料分配的形狀有4種:1.symmetric,對稱的2.positively skewed,正偏/右偏的(有極大值)3.negatively skewed,and 負偏/左偏的(有極小值)4.bimodal.雙峰的(有兩個眾數)LO4-5 Compute and understand the coefficient of skewness.46464-*Commonly Observed ShapesLO4-54-偏
28、態量數(1)對稱分配對稱分配(2)左偏分配左偏分配(3)右偏分配右偏分配0eXMM=0eXM M0eM M X(1)曲線為對稱分配,此時中心位置就是平均數、中位數與曲線為對稱分配,此時中心位置就是平均數、中位數與 眾數的所在,三者為同一點,呈現三點合一的情形。眾數的所在,三者為同一點,呈現三點合一的情形。(2)曲線為左偏分配,此時平數最小,中位數則介於平均數曲線為左偏分配,此時平數最小,中位數則介於平均數與與 眾數之間。眾數之間。(3)曲線為右偏分配,此時平均數為最大,且呈現與左偏分曲線為右偏分配,此時平均數為最大,且呈現與左偏分 配相反之位置分布。配相反之位置分布。圖圖4-148484-*C
29、omputing the Coefficient of Skewness 計算偏態係數偏態係數 介於-3 與 3之間 若趨近於-3,表示資料相當負偏/左偏 negative skewness.若趨近於+3表示資料相當正偏/右偏 positive skewness.當平均數與中位數相等,偏態係數為 0,表示其分配為對稱 symmetrical 且 not skewed.Skewness can be calculated using Pearsons Coefficient of Skewness formula:LO4-54-資料偏態的衡量值(p.110)皮爾生偏態係數是測量偏態的衡量值其數值
30、介於(-3)3 之間.當數值是0,表示:平均數 中位數資料次數分配是對稱當數值接近-3,表示:平均數 中位數表示資料呈右偏50504-*偏態 Skewness An Example下面是抽樣的15家軟體公司在2010年每股營利(earnings per share),The earnings per share 由小到大排列:n計算平均數(mean),中位數(median),標準差(standard deviation).請用 Pearsons estimate來計算偏態係數(coefficient of skewness)n根據此分配的形狀,你的結論是?LO4-551514-*偏態 Skew
31、ness An Example01712251839543322511595440169540901954152674222.$).$.($)(Skewness the Compute:4 Step3.18 is largest to smallest from arranged data,of set the in value middle The Median the Find:3 Step.$).$.($.).$.($Deviation Standard the Compute:2 Step.$.$Mean the Compute:1 Step=+=sMedianXsknXXsnXXLO
32、4-54-Skewness017.122.5$)18.3$95.4($3)(322.5$115)95.4$40.16($.)95.4$09.0($195.4$1526.74$222=+=sMedianXsknXXsnXX Skewness the Compute:3 Step3.18 is largest to smallest from arranged data,of set the in value middle The Median the Find:3 Step Deviation Standard the Compute:2 Step Mean the Compute 1:Step
33、這組資料呈現右偏分配,也就是有少數觀察值的數值偏高,因此拉高了平均值(中位數)017.122.5$)18.3$95.4($3)(322.5$115)95.4$40.16($.)95.4$09.0($195.4$1526.74$222=+=sMedianXsknXXsnXX Skewness the Compute:3 Step3.18 is largest to smallest from arranged data,of set the in value middle The Median the Find:3 Step Deviation Standard the Compute:2 St
34、ep Mean the Compute 1:Step017.122.5$)18.3$95.4($3)(322.5$115)95.4$40.16($.)95.4$09.0($195.4$1526.74$222=+=sMedianXsknXXsnXX Skewness the Compute:3 Step3.18 is largest to smallest from arranged data,of set the in value middle The Median the Find:3 Step Deviation Standard the Compute:2 Step Mean the C
35、ompute 1:Step017.122.5$)18.3$95.4($3)(322.5$115)95.4$40.16($.)95.4$09.0($195.4$1526.74$222=+=sMedianXsknXXsnXX Skewness the Compute:3 Step3.18 is largest to smallest from arranged data,of set the in value middle The Median the Find:3 Step Deviation Standard the Compute:2 Step Mean the Compute 1:Step
36、4-n動差:(1)以0為中心的原動差:(2)以平均數為中心的動差:偏態係數:峰度係數:rrxUn=rrxUn=()rrxMn=3332MM=444242MMM=54544-*Describing the Relationship between Two Variables描述兩變數之關係n當我們研究兩個變數間的關係時,我們稱此資料為二元的(bivariate)n用來顯示兩個變數間關係的圖形:散佈圖(scatter diagram)n要繪製 散佈圖(scatter diagram),我們將一個變數值標示在橫軸(X-axis),將另一個變數值標示在縱軸(Y-axis),然後將每個資料點在此二元圖形
37、中。LO4-6 Create and interpret a scatter diagram.55554-*散佈圖 Scatter Diagram ExamplesLO4-64-散佈圖 scatter plot(P.115)公車年紀(X)跟公車維修費用(Y)之間的關係每一點代表一個觀察點(i.e.公車)。年紀愈大的公車,所花費的維修費用也就愈高兩者有正向的關係(positive relationship)4-散佈圖 scatter plot(P.115)汽車里程數(x)及拍賣價(y)汽車里程數愈高,拍賣價格愈低落兩者成反向的關係(negative relationship)身高(x)跟年收入(
38、y)兩者並沒有明顯的關係4-n長得高,賺得多?長得高,賺得多?2008-04 天下雜誌 394期長得高,也是一種工作優勢嗎?研究身高經濟學的專家最近發現,長得高,有助於增加收入;收入好,也有助於讓人長得高。工業革命以來,身高一直是衡量工作能力的不成文標準。十九世紀的英國工廠老闆在雇用童工時,就常拿兒童的身高,作為判斷年齡大小與體力好壞的衡量標準。儘管專家認為這種推論太武斷,但身材較高的人,比較值得雇用的說法,不無幾分道理,甚至在現代美國,都是如此最近有兩份研究指出,美國身材最高的四分之一人口,收入比最矮的四分之一人口,多出了910。第一份研究的學者認為,這是因為長得高的青少年比較有自信,有助於
39、社會技能的學習。另一份研究的學者則認為,兒童營養與照顧的多寡,影響腦袋和身體的發展,所以充分發育的人,會比較聰明。不過,看待身高與收入的關係,也不能這麼直截了當。例如,聯合國的資料顯示,烏干達人雖然比印度人更高,卻比印度人窮。十九世紀末出生的美國人,雖然比他們的祖先更有錢,卻也變矮了些。比爾蓋茲夠高嗎?這些謎團般的關係,究竟該如何解釋?應該說,人類的身高會隨著富裕而人類的身高會隨著富裕而增加,但增高的幅度卻會遞減增加,但增高的幅度卻會遞減隨著收入變多而呈弧形曲線發展。隨著收入變多而呈弧形曲線發展。要不然,比爾蓋茲這種有錢人肯定會變成超級巨人。賺夠了錢買營養食物吃,就能明顯改進身高;一旦免去勞役
40、、溫飽無虞,多出來的收入,對身高的幫助就有限了。身材高矮,是衡量匱乏、而非富饒的有用指標,美國俄亥俄州立大學教授史戴可一語點出。4-例子:p115n可看出汽車利潤與買主的年紀呈現微弱的正向關係n其實,看不太出來買主的年紀,與所買汽車的利潤的關係4-p.116其他可能範例n里程數越高,汽車的價值降低n駕駛越年輕,汽車險的的保費越高n交通警察的年資越長,開的罰單數越少,這可能是因為他們對違規的看法越來越開明(寬鬆),或因他們已經升官,僅監督下屬而不再在路邊值勤開單。61614-*Contingency Tables 條件次數表/交叉表/列聯表 n假若兩個變數中有一個或兩個變數為名目尺度或排序尺度的
41、資料(nominal or ordinal scale),怎麼辦?這時,我們可用列聯表/條件次數表(contingency table)來計數並整理成表。LO4-7 Develop and explain a contingency table.62624-*列聯表/條件次數表/交叉表 Contingency Tables條件次數表(contingency table)就是同時整理兩個變數的資料並且交叉製表(cross-tabulation)Examples:1.將某大學學生按照性別、與班級排名(class rank)分類2.將某商品依照合格(acceptable)或不合格(unaccepta
42、ble)以及生產的班別(日班、下午班、晚班)來分類.3.A voter in a school bond referendum(公投)is classified by party affiliation(Democrat,Republican,and other)and the number of children that voter has attending school in the district(0,1,2,etc.).LO4-763634-*Contingency Tables An ExampleApplewood Auto group有四家分店,若我們想比較每一款車在不同分
43、店的營利情況,換句話說,分店與營利是否有關係?The table below is the cross-tabulation of the raw data.注意:利潤已被轉換為排序變數 ordinal variable.LO4-764644-*Contingency Tables An ExampleFrom the contingency table,we observe the following:1.在右邊的總額欄顯示:180輛車中有90輛車以高於中位數的利潤出售,有一半則低於中位數,這非常符合中位數的定義。2.而Kane dealership 25 out of the 52,or
44、48 percent,的車以高於中位數利潤售出3.其他分店高於中位數利潤的比例分別為:50 percent for Olean,42 percent for Sheffield,and 60 percent for Tionesta.LO4-74-盒鬚圖兩組數值比較業務員Susan與Lauren最近8個星期股票交易的手續費收入如下。請透過盒鬚圖了解兩位營業員業績的全貌。若你是老闆,你要雇用哪位?Susan:min=30,第一四分位數=64.5,中位數=80,第三四分位數101,max=270Lauren:min=64,第一四分位數=85,中位數=93,第三四分位數118,max=1664-業務
45、員業績的盒鬚圖業務員業績的盒鬚圖020406080100 120 140 160 180 200 220 240 260 280 300極小值極小值朱碧霞鍾樂水極大值極大值中位數中位數1Q1Q3Q3QSusanLauren4-比較結果:1.Lauren業績的盒子比Susan的窄一些,資料集中度高 表示Lauren的業績較集中。2.Lauren的盒子的位置位於Susan的右邊,中位數較大 Lauren業績表現較佳 3.Lauren業績的鬍鬚比Susan短,Lauren的業績分散度小,且較為對稱 Lauren業績較穩定4-練習某電池生產商為了測試期所生產的電池使用時間,隨機選取20個電池,測驗結果
46、如下(小時):41.0,40.9,39.8,42.6,41.4,42.5,42.4,40.8,42.5,42.839.7,41.8,42.2,42.5,42.6,40.0,41.0,42.4,42.7,43.6請計算:(1)算數平均數、眾數、中位數(2)(2)第第1010及第及第9090百分位數的位置百分位數的位置(3)全距(4)變異數(5)(5)皮爾生偏態係數皮爾生偏態係數4-練習(1)Sample mean=835.2/20=41.76 mode=42.5 median=(42.2+42.4)/2=42.3(2)L10:(20+1)*0.1=2.1第2.1個觀察值 L90:(20+1)*0.9=18.9第18.9個觀察值(3)Range=43.6-39.7=3.9 (4)變異數 S2(Xi X)2/(n-1)=23.548/19=1.24 標準差S 1.11(5)3(41.76-42.3)/1.11=-1.46左偏分配