1、 The McGraw-Hill Companies,Inc.,2007第一章第一章敘述統計學敘述統計學 The McGraw-Hill Companies,Inc.,2007學習重點學習重點 分辨屬性與屬量數據 描述名目、順序、區間跟比例尺度的測量值 描述母體與樣本的差異 計算並解讀百分位數與四分位數 知道如何計算集中傾向的測度並且解釋之 產生各式各樣描述數據集的圖表 利用 Excel 樣板計算各式各樣的測度及產生各種圖表 The McGraw-Hill Companies,Inc.,2007四種測量尺度四種測量尺度 名目尺度(nominal scale)只是一個名字 順序尺度(ordina
2、l scale)是數據可以依照某種條件由小排到大 區間尺度(interval scale)是數據間的距離有意義 比例尺度(ratio scale)則是數據間的距離與比例皆有意義 The McGraw-Hill Companies,Inc.,2007母體與樣本母體與樣本 母體(population):包含研究者有興趣的所有測量值,亦稱為宇集(universe)。樣本(sample):選自母體的部分集合。The McGraw-Hill Companies,Inc.,2007百分位數與四分位數百分位數與四分位數 百分位數(percentile):比指定的百分比的數據點大的數字 四分位數(quarti
3、le):25 的倍數的百分位數 The McGraw-Hill Companies,Inc.,2007百分位數與四分位數百分位數與四分位數 第一個四分位數,也稱為下四分位數(lower quartile),就是第 25 個百分位數。第二個四分位數是第 50 個百分位數,也叫中四分位數(middle quartile)或中位數(median)。第三個四分位數是第 75 個百分位數,也叫上四分位數(upper quartile)。The McGraw-Hill Companies,Inc.,2007Median(中位數中位數)Middle value when sorted in order of
4、 magnitude 50th percentileMode(中數中數)Most frequently-occurring valueMean(平均數平均數)Average1-3 Measures of Central Tendency(集中趨勢)or Location The McGraw-Hill Companies,Inc.,2007例1-2 找出世界前20位富翁的第50個跟第80個百分位數 Templates(ch 1:Basic Statistics)The McGraw-Hill Companies,Inc.,2007SalesSorted Sales 9 6 6 9 12 101
5、0 1213 1315 1416 1414 1514 1616 1617 1616 1724 1721 1822 1818 1919 2018 2120 2217 24MedianMedian50th Percentile(20+1)50/100=10.516+(.5)(0)=16The median is the middle value of data sorted in order of magnitude.It is the 50th percentile.Example Median(Data is used from Example 1-2)The McGraw-Hill Comp
6、anies,Inc.,2007 .:.:.-6 9 10 12 13 14 15 16 17 18 19 20 21 22 24Mode=16The mode is the most frequently occurring value.It is the value with the highest frequency.Example-Mode(Data is used from Example 1-2)The McGraw-Hill Companies,Inc.,2007The mean of a set of observations is their average-the sum o
7、f the observed values divided by the number of observations.Population MeanSample Meanm=xNiN1xxnin=1Arithmetic Mean or Average(算術平均)The McGraw-Hill Companies,Inc.,2007變化的測度變化的測度 全距(range):是最大觀察值減最小觀察值。變異數(variance):全部數據點與平均偏離平方和 的平均。標準差(standard deviation):是變異數的方根。The McGraw-Hill Companies,Inc.,2007
8、()smss22121221=-=-=()xNxNNiNiNxiNPopulation Variance()()sxxnxxnnssininin2212122111=-=-=()Sample VarianceVariance(變異數)and Standard Deviation(標準差)()The McGraw-Hill Companies,Inc.,2007例1-2找出世界前20位富翁財富的平均數、變異數、標準差 The McGraw-Hill Companies,Inc.,2007偏度與峰度偏度與峰度 偏度(skewness)是頻率分配不對稱程度的測度。偏度為0表示對稱,偏度為正表示右偏,
9、偏度為負表示左偏。峰度(kurtosis)是頻率分配扁平程度的測度。峰度越大表示分配越瘦越尖。常態分配的峰度為3 相對扁度=絕對扁度 3NxNii31=-smNxNii41=-sm The McGraw-Hill Companies,Inc.,2007Summary Measures:Population Parameters Sample StatisticslMeasures of VariabilityRange(全距)Interquartile rangeVariance(變異數)Standard Deviation(標準差)lMeasures of Central TendencyM
10、edian(中位數)Mode(眾數)Mean(平均數)lOther summary measures:Skewness(偏態)Kurtosis(峰態)The McGraw-Hill Companies,Inc.,2007柴比雪夫定理柴比雪夫定理 柴比雪夫定理(Chebyshevs theorem)的原則如下:1.至少有四分之三的經驗值,與平均的偏 離落入兩個標準差內2.至少九分之八的觀察值,與平均的偏離 落入三個標準差內()211kkxP-sm The McGraw-Hill Companies,Inc.,2007經驗法則經驗法則 如果數據分配是山形的(mound-shaped),則此數據集可
11、適用嚴格一點的原則,就是所謂的經驗法則:1.大約有 68%的觀察值,與平均的偏離落 入 1 個標準差內2.大約有 95%的觀察值,與平均的偏離落 入 2 個標準差內3.絕大部分(幾乎全部)的觀察值,與平均 的偏離落入 3 個標準差內 The McGraw-Hill Companies,Inc.,2007呈現數據的方法呈現數據的方法 圓餅圖(pie chart):簡單描述呈現某種離散型數(分類數據)。直條圖(bar chart):用來呈現分類數據,它的測量尺度可以是名目的或是順序的。頻率多邊形(frequency polygon):類似直方圖,只有各區間的中點落在與該區間的頻率或相對頻率成比例的
12、高度上。肩形圖(ogive):是一種累加頻率圖。The McGraw-Hill Companies,Inc.,2007Pie Chart(餅圖)The McGraw-Hill Companies,Inc.,2007Bar Chart(直條圖)Average Revenues Average ExpensesFig.1-11 Airline Operating Expenses and Revenues1 21 086420Airlin eAmerican Continental DeltaNorthwest Southwest UnitedUSAir The McGraw-Hill Compa
13、nies,Inc.,2007Relative Frequency PolygonOgiveFrequency Polygon(頻率多邊形)and Ogive(累加頻率圖)504030201000.30.20.10.0Relative FrequencySales504030201001.00.50.0Cumulative Relative FrequencySales The McGraw-Hill Companies,Inc.,2007數據探查分析數據探查分析 莖葉圖(stem-and-leaf display):一種快速審視數據的技巧,包含某些直方圖的特徵。盒形圖:也叫盒鬚圖,是另一種端詳
14、數據的方法。The McGraw-Hill Companies,Inc.,2007XX*oMedianQ1Q3InnerFenceInnerFenceOuterFenceOuterFenceInterquartile RangeSmallest data point not below inner fenceLargest data point not exceeding inner fenceSuspected outlierOutlierQ1-3(IQR)Q1-1.5(IQR)Q3+1.5(IQR)Q3+3(IQR)Elements of a Box PlotBox Plot(盒形圖)Th
15、e McGraw-Hill Companies,Inc.,2007Example:Box Plot(盒形圖)The McGraw-Hill Companies,Inc.,2007K線圖 The McGraw-Hill Companies,Inc.,2007例1-8 42位工程師回答他們在銀幕上所看到的狀況,而完成某項工作的時間。分六組,並繪出折線圖、直條圖、餅圖。The McGraw-Hill Companies,Inc.,2007作業 任選並下載一支台灣上市公司過去250天股價資料,使用EXCEL將這些資料計算日報酬率及:敘述統計 頻率、相對頻率、累加頻率 日報酬頻率分佈圖、累加分佈圖 平均數、變異數、標準差 四分位數、百分位數、偏態係數、峰態係數
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。