1、Fred Li,2009Fred Li,2009統計學的定義 統計學是在面對不確定的情況下,提供人們能做出聰明決策的科學方法。其過程包括資料的蒐集、整理、呈現結果、解釋與分析。透過此一過程,並可進而根據分析的結果加以推論,從而可以獲得合理的研判與有效的結論。數理統計學與應用統計學為主要分支Fred Li,2009統計學的主要目的統計學的主要目的 萃取精華且具有意義的資訊 描述或分析各種變項之間的之關係與差異 處理不確定性的問題:研究由樣本資料推論母群特質之可靠機率或不確定性之大小 進行有效率之預測 研究實驗設計與統計方法之關係Fred Li,2009統計資料之要素與來源 DATA之三要素:(1
2、)個案錄(record)(2)變項(variable)(3)觀察值(observation)DATA之主要來源:(1)調查結果 (2)實驗結果 (3)模擬研究Fred Li,2009統計分析之主要步驟 描述統計:(1)資料搜集(2)記錄與整理 (3)描述性統計量數或圖表 (4)解釋與結論 推論統計:(1)資料抽樣(2)記錄與整理 (3)描述性統計量數 (4)母群推論 Fred Li,2009抽樣&推論Fred Li,2009推論統計類別 參數估計(如推估當選市長的機率)假設檢定(如檢驗事先所提的假設是否成立)分類(如區別分析)簡化資料(如因素分析)。Fred Li,2009常見之統計術語 母群
3、(population)樣本(sample)母數(parameter)統計量(statistic)常數(constant)與變項(variable):(1)自變項與依變項(2)連續變項與間斷變項(3)依測量層次分:名義變項、次序變項、等距變項、比率變項(4)量與質的變項Fred Li,2009統計基本概念(1)母群(population):整個研究對象的群體或根據樣本資料所欲推論的研究對象。母數(parameter):描述母群性質的量數,通常以希臘字母表示,例如以表平均數、表標準差、表相關係數、表百分比。通常只有神神才知道這些母數,所以用希臘字母來表示。Fred Li,2009統計基本概念(2
4、)樣本(sample):由母群中所抽出的部份代表性群體。統計數(statistic):描述樣本性質的量數,通常以英文字母表示,例如以M表平均數、S表標準差、r表相關係數、p表百分比。假如想利用樣本統計數來估計母數,我們也可稱他為母數的估計值(estimate)。Fred Li,2009統計基本概念(3)常數(constant):群體中之每一份子在某一屬性上均具有一成不變的特質。變項(variable):群體中之每一份子在某一屬性上,分屬不同類別或具有不同的特質,前者為質的變數,後者為量的變數。Fred Li,2009統計基本概念(4)自由度(degree of freedom):乃是變項中可以
5、自由變動的數值之個數,通常Df=#of data-#of means used,例如t考驗或F考驗時之自由度;或為實際觀察值(observations)個數(n)與變項個數(k)的函數,例如迴歸分析時殘差之自由度:(df=n-k-1);或為Full model時預測變項個數(k)減去Nulll model或Restricted model時預測變項個數(h),例如迴歸分析時回歸係數之自由度(df=k-h)。請問z-test的自由度如何計算?Fred Li,2009統計基本概念(5)對立假設(alternative hypothesis)相當於研究假設 虛無假設(null hypothesis)
6、為統計考驗的對象Fred Li,2009統計基本概念(6)第一類型錯誤 vs 第二類型錯誤Fred Li,2009描述統計學:Descriptive Statistics 數字(Numbers)用以量化待研究資料的特質圖表(Tables&Graphs)描繪與摘要待研究資料的有用資訊Fred Li,2009描述統計學的內涵 集中量數(central location)資料點集中情形的最佳代表值 離散量數(dispersion or variation)資料點的分散程度 偏態與峰度(skewness&kurtosis)資料點偏離常態的程度Fred Li,2009描述統計的運用 為推論統計的依據 應
7、報告每一變項之Mean,sd,range,and n 次數與百分比亦可合併應用Fred Li,2009選擇適當的描述統計 常態分配或無極端值:平均數與標準差 偏態或有極端值:中位數與四分位數、盒鬚圖(極大、極小值、Q1、Q2、Q3)遇比率量尺時,可用幾何平均數或調和平均數Fred Li,2009描述統計功能 摘要每一變項的重要資訊:Number of cases Central tendency Dispersion 協助研究者描述變項 推論統計中,用以分析變項間的關係與差異Fred Li,2009Data RecordFred Li,2009常態分配曲線 為一典型的分數分配曲線 Majori
8、ty of cases distributed around the peak in the middle Progressively fewer cases moving away form the middle Symmetrical one side mirrors the other Mean,median,and mode have the same valueFred Li,2009常態曲線Fred Li,2009Skewed Distributions 非對稱性正偏負偏Fred Li,2009個案人數 以 n(樣本)或 N(母群)表示例如:n=231 Cases may be p
9、eople,speaking turns,episodes Fred Li,2009集中量數 Mean Arithmetic mean or average Most sensitive to extreme scores Median Middle of all scores on one variable Mode Score or scores that appear most oftenFred Li,2009離散量數 Describes the variability or spread of scores Should be reported with mean Range Hig
10、hest to lowest score Standard deviation or sd If sd=0,all scores are the same Larger the sd,the more the scores differ from the meanFred Li,2009Standard DeviationFred Li,2009標準差的特性 Theoretical normal curve is divided into equal standards The more normal a distribution of scores,the more this theoret
11、ical property applies 68.26%of scores fall within+1 to 1 standardsFred Li,2009變項種類Nominal(Qualitative)Nominal(Quantitative)OrdinalInterval orratioFred Li,2009不同資料的描述MomentNon-mean based measureCenterMeanMode,medianSpreadVariance(standard deviation)Range,Interquartile rangeSkewSkewness-PeakedKurtosis
12、-Fred Li,2009平均數Xnxnii1Fred Li,2009變異數與標準差NiiNiiNxNx12212)(,)(Fred Li,2009母群變異數與標準差的估計值snxsnxniinii122121)(,1)(Fred Li,2009變異數係數100.vcFred Li,2009常態分配圖ValueFrequency例如:全國學生的大學入學成績Fred Li,2009負偏:非對稱性 台大學生的入學成績ValueFrequencyFred Li,2009正偏:非對稱性 落榜學生的入學成績ValueFrequencyFred Li,2009偏態:Skewnesssmedianmeans
13、emeannnxxxxniinii/)(3/)mod(2)1(2/312/313Fred Li,2009SkewnessVa lu eF re q u e n cyFred Li,2009峰度:KurtosisValueFrequencyk 3k=3k 3Fred Li,2009常態屬性 Skewness=0 Kurtosis=3ValueFrequency22/)(21)(xexfFred Li,2009ValueFrequency34%34%x47.7%47.7%常態屬性Fred Li,2009教 學評鑑Mean s.d.SkewKurtGives well-prepared,releva
14、nt presentations6.00.69-1.78.5Explains clearly and answers questions well5.90.68-1.04.8Uses visual aids well5.60.85-1.88.9Uses information technology effectively5.50.91-1.15.0Speaks well6.10.69-1.56.8Encourages questions&class participation6.10.66-0.883.7Stimulates interest in the subject5.90.76-1.1
15、4.7Is available outside of class for questions5.90.68-1.36.3Fred Li,2009圖例教學評建立提示意圖Means.d.SkewKurtGraphUses visual aids well5.60.85-1.88.9Encourages questions&class participation6.10.66-0.883.7Fraction(mean)q3170.6Fraction(mean)q6170.6Fred Li,2009圖例:加註常態曲線Fraction(mean)q9012345670.181319Fred Li,200
16、9盒鬚圖34567(mean)q9中位數PR=25PR=75非極端值下限非極端值上限極端值Fred Li,2009Fred Li,2009Fred Li,2009探索式資料分析Fred Li,2009莖葉圖的製作Fred Li,2009Fred Li,2009Fred Li,2009Stretched 莖葉圖Fred Li,2009Stretched 莖葉圖Fred Li,2009Stretched 莖葉圖Fred Li,2009 Leaf Unit=0.1Fred Li,2009Fred Li,2009雙向交叉表與散佈圖n 雙向交叉表與散佈圖:(Fred Li,2009雙向列表 一一Fred Li,2009Fred Li,2009Fred Li,2009Fred Li,2009月收入與啤酒購買有關嗎?Fred Li,2009Fred Li,2009 正相關Fred Li,2009 負相關Fred Li,2009 無顯著相關Fred Li,2009棒球隊例子 統一獅為了解封殺的次數與該隊得分的關係,蒐集到以下的 資料:Fred Li,2009Fred Li,2009棒球隊得分的啟示