1、Ming-chi Chen社會統計Page.1中級社會統計第十三講複迴歸分析Ming-chi Chen社會統計Page.2複迴歸分析 前面我們學到只有一個自變項的簡單迴歸分析 我們知道一個地區的人均病床數會影響到該地區的平均餘命 我們也知道一個地區的人均教育支出會影響該地區的平均餘命 但是如果教育支出相等的條件下,醫療資源的多寡會不會影響平均壽命?兩者孰輕孰重?控制的概念(在其他條件不變的情況下)Ming-chi Chen社會統計Page.3複迴歸分析 研究兩個或兩個以上的IV對DV的影響的分析方式,稱為複迴歸分析(multiple regression analysis)又稱多元迴歸分析 迴
2、歸方程式ikikiiixxxY2211為迴歸係數。為截距,其中k,1Ming-chi Chen社會統計Page.4多元迴歸Multiple Regression Models 統計成績與努力(所花時間)的關係如下:觀念y成績x1努力451006030050300704006550065600807004520075500304050607080900100200300400500600700800Ming-chi Chen社會統計Page.5多元迴歸Multiple Regression Models 兩者的迴歸線:觀念y成績x1努力451006030050300704006550065600
3、807004520075500X18007006005004003002001000Y908070605040(.012)(5.07)058.033.38iixyMing-chi Chen社會統計Page.6多元迴歸Multiple Regression Models 將學生對於數理科目的興趣納入考量發現:觀念y成績x1努力 x2興趣451001060300205030010704003065500206560020807003045200107550030304050607080900100200300400500600700800 x2=30 x2=20 x2=10Ming-chi Che
4、n社會統計Page.7多元迴歸Multiple Regression Models 如果我們針對具有相同興趣水準的學生來考量努力與成績的關係,則可以分別用三個迴歸線來表達:觀念X18007006005004003002001000Y908070605040X2 30.00 20.00 10.00Ming-chi Chen社會統計Page.8多元迴歸Multiple Regression Models這三條線的斜率似乎沒有原本迴歸線來得大,表示努力與成績的關係有一部份是受到興趣的干擾(confounding):有興趣的學生通常花比較多的時間觀念X1800700600500400300200100
5、0Y908070605040X2 30.00 20.00 10.00TotalMing-chi Chen社會統計Page.9多元迴歸Multiple Regression Models此時利用多元迴歸比簡單迴歸可以算出三條簡單迴歸的平均斜率。觀念X18007006005004003002001000Y908070605040X2 30.00 20.00 10.00Total(.088)(.004)(1.30)0.1025.066.312xxyiiMing-chi Chen社會統計Page.10多元迴歸Multiple Regression Models多元迴歸用來分析一個以上自變數對於依變數的
6、影響,可以看出其他變數不變(常數)的條件下,某一個變數對於依變數產生的淨影響為何?觀念X18007006005004003002001000Y908070605040X2 30.00 20.00 10.00TotalMing-chi Chen社會統計Page.11Partial Derivative偏微分觀念觀念 經濟學說我們對於某商品的需求量與價格及所得有關:),(21xxfy 所得水準商品價格21xx 在所得不變的條件下,商品價格x1變動,對於需求量y有何影響?22110 xBxBByMing-chi Chen社會統計Page.12Partial Derivative偏微分觀念觀念商品需求
7、變動商品價格變動yx1 假設所得固定為100,22110 xBxBBy因為價格變動所造成的商品需求變動可以表為:)100,()100,(111xfxxfy帶入原來的函數:)100()100(2110211110BxBBBxBxBBy111BxyxByiMing-chi Chen社會統計Page.13Partial Derivative偏微分觀念觀念 如果我們將x1切割成很小的單位,則每個極小單為的變動所造成的q變動為:11212,11001)100,()100(lim)(lim11Bxxxfxxxfxyxyxix22110 xBxBBy在x2不變(保持恆定)的情況下,x1的變動所造成y的變動M
8、ing-chi Chen社會統計Page.14Partial Derivative偏微分觀念觀念exBxBBy22110X2所得X1價格y需求yye21110 xBxBBy三個以上的自變數在三度空間上無法表達。二個自變數的多元迴歸分析在於設法找出最合適資料分佈的一個平面。Ming-chi Chen社會統計Page.15多元迴歸的參數推估求多元迴歸x1與x2的係數?YX1X281034952120649178261111331814841815551718exbxbay22112211xbxbay我們可以將所有的觀察值y視為x1與x2的線性函數加上誤差值e多元迴歸的預測值可以表為:Ming-ch
9、i Chen社會統計Page.16The Normal Equation觀念exbxbay2211X2所得X1價格y需求yye求使e2最小的平面2211xbxbayMing-chi Chen社會統計Page.17The Normal Equation觀念exbxbay2211)1()()(2221122xbxbayyyeSSE求 Minimum Q?將(1)式分別對a,b1,b2做偏微分,再將所得之方程式設為零,然後求解聯立方程式即可求得最小值。00021bSSEbSSEaSSEMing-chi Chen社會統計Page.18The Normal Equation觀念00021bSSEbSSE
10、aSSE0)()(2211eyyxbxbay0)()(1112211xexyyxxbxbay0)()(2222211xexyyxxbxbaye總和為零e與x1及x2不相關(uncorrelated)1()()(2221122xbxbayyyeSSEMing-chi Chen社會統計Page.19Basic Rules for Differentiation Rule 8:the chain rule)()(:)(xgfxgxgf複習Ming-chi Chen社會統計Page.20Example of chain rule222222332)2(6)2(32)(3)(2)()()(:)()(2)
11、(;)()()2()(xxxxxfyygxxhxhgxhxhgxfxxhyyygxfxxf:看成由下列兩函數合成我們可以把複習Ming-chi Chen社會統計Page.21微分求迴歸係數0)(0)1)(2)1)(2)1)(2)1)(2)()()()(:)(,1)(,2)()()(,)()()()()()(22112211221122212122121111221122221122221212221211112221122xbxbayxbxbayxbxbayxbxbayxbxbayaSSExhzgaSSExgfxgxgfxhzzgxbxbayxhzzzgxbxbayxbxbayxbxbayxb
12、xbayyyeSSEnnnnnn求最小令Ming-chi Chen社會統計Page.220)()(00)()(0 222112122111xxbxbaybSSExxbxbaybSSE同理,Ming-chi Chen社會統計Page.23The Normal Equation觀念221122110)(xbxbnayxbxbay21221111122110)(xxbxbxayxxxbxbay22221122222110)(xbxxbxayxxxbxbay)1()()(2221122xbxbayyyeSSEMing-chi Chen社會統計Page.24The Normal Equation觀念22
13、11xbxbnay21221111xxbxbxayx22221122xbxxbxayxYX1X28103495212064917826111133181484181555171828012080351510SumAverage1000,1928,1476822212xxy3560,4696,12802121yxyxxxMing-chi Chen社會統計Page.25The Normal Equation觀念21801208280bba21128019281204696bba2110001280803560bbaYX1X28103495212064917826111133181484181555
14、171828012080351510SumAverage1000,1928,1476822212xxy3560,4696,12802121yxyxxx3,2,2521bba213225xxyMing-chi Chen社會統計Page.26The Normal Equation觀念2211xbxbnay21221111xxbxbxayx22221122xbxxbxayxnxbnxbany22112211xbxbay迴歸平面通過中心點:),(21xxyMing-chi Chen社會統計Page.27Normal Equations in Reduced Form觀念2211xbxbay若將所有變數
15、都以離均值來表示求b1,b2等於:2221122)()(XbXbYYYeSSE0,021bSSEbSSE令0)(12211XXbXbY0)(22211XXbXbYYXXXbXb1212211YXXbXXb2222211)()()(222111xxbxxbyy2211xbxbay2211XbXbYMing-chi Chen社會統計Page.28Normal Equations in Reduced Form觀念解聯立方程式:YXXXbXb1212211YXXbXXb2222211212122212211221XXXXXXYXXXYXXb212122211212212XXXXXXYXXXYXXb2
16、122211212122SSSSSSSSSSSSSSyy2122211112211SSSSSSSSSSSSSSyyMing-chi Chen社會統計Page.29Normal Equations in Reduced Form觀念解聯立方程式:21222112121221SSSSSSSSSSSSSSbyy21222111122112SSSSSSSSSSSSSSbyy2222)(ynyyyYSSyy21212112111)(xnxxxXSS22222222222)(xnxxxXSSyxnyxyyxxYXSSy111111)(yxnyxyyxxYXSSy222222)(212122112112)(
17、xxnxxxxxxXXSSMing-chi Chen社會統計Page.30觀念YX1X281034952120649178261111331814841815551718280120803515101000,1928,1476822212xxy3560,4696,12802121yxyxxx21222112121221SSSSSSSSSSSSSSbyy200)100(81000222222xnxSS128)15(819282212111xnxSS496)35)(15(84696111yxnyxSSy760)35)(10(83560222yxnyxSSy80)10)(15(81280212112
18、xxnxxSS26400256006080099200)80(80)200(128)760)(80()4696)(200(1bMing-chi Chen社會統計Page.31一般化迴歸模型的假設條件 依變數Yi為隨機變數,自變數(Xi,i=1,k)為預先選定的變數。Zero Mean:E(ei)=0 Homoscedasticity:e2 is the same for all value of independent variable.Normality:ei為常態分配 No serial correlation:E(eiej)=0,i j Independent of ei and xij
19、:E(eixij)=0iikkiiiexBxBxBBY22110Ming-chi Chen社會統計Page.32一般化迴歸模型的假設條件 No perfect multicollinearity:it is not possible to find a set of numbers c0,c1,ck such thatnixcxcxccikkii,.,2,1every for,022110 樣本數nk+1,在複迴歸模型若有k個自變數,則有k+1(包括截距)個迴歸參數,此時利用樣本來估計迴歸參數時,樣本數必須大於k+1個。Ming-chi Chen社會統計Page.33The General M
20、ultiple Regression Model b0,b1,bk are the least-squares estimates of 0,1,k that minimize the residual sum of squares:iikkiiiexxxY22110ikkiiixbxbxbby2211022211022)()(ikkiiiiixbxbxbbyyyeSSE The Gauss-Markov Theorem:If the basic assumptions hold:b0,b1,bk are the unbiased estimates of0,1,k b0,b1,bk have
21、 the minimum variances among the class of linear unbiased estimators母體迴歸線樣本迴歸線Ming-chi Chen社會統計Page.34Estimated Standard Error of Regression 如同在簡單迴歸中,為了要做假設檢定,我們必須要估計e2。在簡單迴歸中,我們知道S2e=SSE/(n-2)為e2 的不偏估計式。同理,在複迴歸中,S2e=SSE/(n-(K+1)為e2 的不偏估計式。其中n為樣本數,(K+1)為所欲估計的未知數(即K個自變數加上一個常數項)。Ming-chi Chen社會統計Page.
22、35Estimated Standard Error of Regression SSE的一般性公式:22211022)()(ikkiiiiixbxbxbbyyyeSSEiikkiiiiiiyxbyxbyxbybySSE221102Ming-chi Chen社會統計Page.36Partition of Total Sum of Squares觀念多元迴歸中,SST=SSR+SSE仍然成立)()()(yyyyyy22)()()(yyyyyy)(2)()(22yyyyyyyy)(2)()(22yyyyyyyy)(2)(2)()(22yyyyyyyyyy0e)(2)()(221122xbxbayy
23、yyyy 2)()(221122exbexbeayyyye與x1及x2不相關Ming-chi Chen社會統計Page.37Partition of Total Sum of Squares觀念YX1X2y-hat(y-ybar)2(y-yhat)2(yhat-ybar)28103472916961495896116729212063319614444917833196256426111130811625331814534400324841815562401784441551718634006478428012080496816963272SST=SSE+SSRMing-chi Chen社會統
24、計Page.38Sum of Square due to Regression觀念22112211xbxbyaxbxbay代入2211xbxbay22112211xbxbxbxbyy)()(222111xxbxxbyy2211XbXbY以大寫字母來表示與平均值間的差異。212122222121222)(XXbbXbXbYyySSRMing-chi Chen社會統計Page.39Sum of Square due to Regression觀念212122222121222)(XXbbXbXbYyySSRYX1X281034952120649178261111331814841815551718
25、280120803515101000,1928,1476822212xxy3560,4696,12802121yxyxxx12818001928)(212121121xnxxxX8012001280)(2121221121xxnxxxxxxXX2008001000)(222222222xnxxxX)200(9)80(12)128(4)(22YyySSRMing-chi Chen社會統計Page.40Coefficient of Determination R2 判定係數SSTSSESSTSSRR12212122222121222)(XXbbXbXbYyySSR2)(yySST22)(iiyye
26、SSE 用來衡量迴歸方程式的配合度或解釋力Ming-chi Chen社會統計Page.41Adjusted R square 如果樣本數小或自變項個數增加,會使自由度變小,因此判定係數R2 會高估。亦即在複迴歸模型中若不斷加入與模型無關的解釋變數時,R2會提高一些,不能代表迴歸模型的解釋能力。需要調整複判定係數(adjusted coefficient of multiple determination)主要調整的是自由度)1/()1/(1)1/()()1/()(112122nSSTknSSEnyyknyyRniiniiMing-chi Chen社會統計Page.42Adjusted R sq
27、uare)1(111)1/()1/(122RknnnSSTknSSER)1/(2nSSTsy)1/(2knSSEse2221yeSSRMing-chi Chen社會統計Page.43Adjusted R square22,111RRknn少。可能會增加、不變或減,當我們增加2RIV 會增加。,則解釋能力的新的如果增加一個具有顯著2RIV會降低。,則會受到懲罰,的如果加入沒有解釋能力2RIV會減少。則只會增大或不變,不相對地,減小。的懲罰,可能反使增加不大,則經過使如果新增的也會變大。會變大,但是不變的情況下,在增加2222RR11)(IV11)(IVknnYYknnYYnMing-chi Ch
28、en社會統計Page.44Adjusted R square會出現負值時,當。可能為負,但仍小於)之間,的範圍不是在(222221110,1RnknyeRRMing-chi Chen社會統計Page.45Measuring Goodness of fit 在複迴歸中,可利用檢定迴歸方程式中所有的自變數對於依變數Y是否有聯合的解釋能力:H0:迴歸方程式無解釋能力 0=1=2=K=0H1:迴歸方程式有解釋能力(不全為零)Ming-chi Chen社會統計Page.46Measuring Goodness of fit)1/()(/)(22knyykyyF)1(,knkFRejectMing-chi
29、 Chen社會統計Page.47Ming-chi Chen社會統計Page.48部分迴歸係數的F檢定 檢定新增的IV對DV是否有影響 設原複迴歸模型有k個IV,新增Q個IV,欲檢定新增的Q個IV是否對DV有影響,H0:k+1=k+2=k+Q=0 H1:H0不為真1,222)1/(/)(QknQQkkQkFQkneQyyF須自行計算。沒有提供相關數據,必上式tataQknRQRRQknSSEQSSRSSRFQkkQkQkkQkS)1/()1()()1/(/)(222Ming-chi Chen社會統計Page.49個別迴歸參數的檢定 由樣本估計出來的迴歸係數必須接受統計檢定,以了解母體參數的真實性
30、質(從樣本得到這樣的係數,是否意味著母體參數不為零)。若母體迴歸變異數2已知,則利用Z分配進行檢定或區間估計。但如果2未知,用樣本變異數S2Y|XZ(也就是Se2)來代替,進行t檢定。Ming-chi Chen社會統計Page.50樣本誤差值變異數Se2222110222)(111)(11ikkiiiiiexbxbxbbyknknyykneknSSES)(11221102iikkiiiiiiyxbyxbyxbybyknMing-chi Chen社會統計Page.51二元迴歸係數的變異數22212221212121222221222212221212222122212222211)1)(2()(
31、)(21eaebebSnXXXXXXXXXXXXSSXXXXXSSXXXXXSXbXbaYMing-chi Chen社會統計Page.52假設檢定 迴歸係數檢定所要檢定的假設,這是雙尾檢定0:0:0100HH,這是雙尾檢定0:0:1110HH,這是雙尾檢定0:0:2120HHMing-chi Chen社會統計Page.53迴歸係數的t檢定aaSat01101bbSbt2202bbSbtMing-chi Chen社會統計Page.54Stata複迴歸結果=/Ming-chi Chen社會統計Page.55Confidence Intervals and tests of hypotheses 每
32、一個之95%信賴區間:ibiiStb025.1.knfd自變數個數ibiiSbtMing-chi Chen社會統計Page.56Stata複迴歸結果Ming-chi Chen社會統計Page.57複迴歸分析的統計預測:預測母體依變項的平均值信賴區間1)(2interval confidence%1)(Y2212221212121222221222/,3002211nXXXXXXXXXXXXSSStYYEXbXbaeYYnoo式中:)信賴區間(的母體預測平均值,Ming-chi Chen社會統計Page.58複迴歸分析的統計預測:預測母體依變項的信賴區間講義照般用軟體來解決,請參相關計算相當複雜
33、,一式中:)信賴區間(的母體預測值,StatanXXXXXXXXXXXXSSStYYXbXbaeeenoo 11)(2interval prediction%1Y2212221212121222221222/,3002211Ming-chi Chen社會統計Page.59Stata求預測值Ming-chi Chen社會統計Page.60Stata求預測值Ming-chi Chen社會統計Page.61預測母體依變項平均值的信賴區間1)(2221222121212122222122nXXXXXXXXXXXXSSeYo 在Stata裡用predict 新變數名稱,stdp這個指令來求對應數值。pr
34、edict stderr,stdpMing-chi Chen社會統計Page.62母體預測值平均E(Y|X)或y的95信賴區間 先求出t值,要知道自由度在31-328下,=0.05的t值。在Stata中,用invttail(28,.05/2)generate yhatll=yhat-stderr*invttail(28,.05/2)這是信賴下界 generate yhatul=yhat+stderr*invttail(28,.05/2)這是信賴上界Ming-chi Chen社會統計Ming-chi Chen社會統計Page.63Stata中求對應特定Xp預測母體值的標準差Ming-chi Ch
35、en社會統計 11)(2221222121212122222122nXXXXXXXXXXXXSSeeo 在Stata裡用predict 新變數名稱,stdf這個指令來求對應數值。這裡和前面略有不同。predict stderrf,stdfMing-chi Chen社會統計Page.64母體預測值Y-hat的95信賴區間 先求出t值,要知道自由度在31-328下,=0.05的t值。在Stata中,用invttail(28,.05/2)generate yhatllf=yhat-stderrf*invttail(28,.05/2)這是信賴下界 Generate yhatulf=yhat+stder
36、rf*invttail(28,.05/2)這是信賴上界Ming-chi Chen社會統計Ming-chi Chen社會統計Page.65複迴歸模型中解釋變數的相對重要性 複迴歸模型中,各個IV的相對重要性 國家在教育上的投入(0.0045)還是人口數目(0.00049)對中國各省市的平均餘命的影響比較重要?迴歸係數不能直接比較。因為單位不同。Ming-chi Chen社會統計Page.66複迴歸模型中解釋辨識的相對重要性 我們可以用標準差來把迴歸係數化成同樣單位 標準化的迴歸係數又稱為beta-coefficients IV變動一個標準差,DV變動的標準差數。YXiSSbi標準化係數Ming-
37、chi Chen社會統計Page.67Stata求標準化迴歸係數Ming-chi Chen社會統計Page.68Stata求標準化迴歸係數哪一個IV影響比較大?Ming-chi Chen社會統計Page.69虛擬變數Dummy Variables 在迴歸方程式中,我們假設所有的變數皆為連續變數。如果遇到名目尺度變數,我們可以用虛擬變數來進行分析。虛擬變數(D)又稱為類別變數(categorical variables),通常以(0,1)來區別類別。如男性D=1,女性D=0觀念Ming-chi Chen社會統計Page.70虛擬變數Dummy Variables 虛擬變數可以用來比較下列效果:T
38、emporal effect時間效果:戰時vs.平時,顛峰vs.非顛峰,假日vs.週間 Spatial effects地區效果:都市vs.鄉村 Qaulitative variables質性變數:已婚vs.未婚,男性vs.女性,白人vs.非白人 Broad groupings of qualitative variables化約變數。觀念Ming-chi Chen社會統計Page.71虛擬變數Dummy Variables Base case比較基底(或reference group參考組)當虛擬變數為0時的所有觀察值。因此虛擬變數的迴歸係數衡量比較基底與非比較基底兩群樣本之間的差異。觀念Mi
39、ng-chi Chen社會統計Page.72虛擬變數Dummy Variables觀念iiiiiDXDXYE210),|(若樣本為男若樣本為女性別教育年數分擔家務工作時數 0 1DXYMing-chi Chen社會統計Page.73虛擬變數Dummy Variables觀念iiiiiDXDXYE210),|(iiiiixxDXYE10210)0()0,|(當D=0時,iiiiixXDXYE120210)1()1,|(當D=1時,Ming-chi Chen社會統計Page.74虛擬變數Dummy Variables2001YX教育年數家務時數iiiixDXYE10)0,|(iiiixDXYE12
40、0)()1,|(Ming-chi Chen社會統計Page.75Stata與虛擬變數 打開85q1-family.dta 依變項為j2,注意缺失值定義和每週家務工作168小時的轉換(112小時)在Stata裡產生虛擬變數 以a1受訪者的性別為例 tab a1,gen(sex)這裡逗點之後的gen就是要求Stata從a1來產生一個名叫sex1(原本是a1=1男生)和sex2這兩個虛擬變數 當然我們只需要用到sex1,而把女生當作對照組 還有用婚姻狀態a5產生wed1(未婚)這個虛擬變數(把a5=3定義為缺失)我另外用eduy這個關於教育年數(小學及以下為6,初中9,高中12,大專及以上16)的連
41、續變數。作法是generate eduy=6 if b1=1Ming-chi Chen社會統計Page.76Stata與虛擬變數sex1=1為男生,sex1=0是對照組女生Ming-chi Chen社會統計Page.77Stata與虛擬變數(男性)(教育年數)家務時數85.1156.092.23Ming-chi Chen社會統計Page.78虛擬變數的推論統計包括男性這個虛擬變數在內的所有變數的迴歸係數都顯著,可以拒絕虛無假設(係數等於零)Ming-chi Chen社會統計Page.79虛擬變數Dummy Variables觀念男性教育年數85.1156.092.23),|(iiiDXYE當男
42、性=0時(女性)當男性=1時(男性)教育年數男性0.56-23.92)0,|(iiXYE教育年數男性0.56-)1(11.85-23.92()1,|(iiXYEMing-chi Chen社會統計Page.80虛擬變數Dummy VariablesMing-chi Chen社會統計Page.81兩個虛擬變數的迴歸)(5.54-)(11.90-)(0.398-23.16未婚男性教育年數家務時數 如果是女性如果是男性男性 0 1如果已婚如果未婚未婚 0 1Ming-chi Chen社會統計Page.82兩個虛擬變數的迴歸)(5.54-)(11.90-)(0.398-23.16未婚男性教育年數家務時數
43、)1(5.54-)1(11.90-)(0.398-23.16教育年數家務時數)0(5.54-)1(11.90-)(0.398-23.16教育年數家務時數 未婚男性)0(5.54-)0(11.90-)(0.398-23.16教育年數家務時數)1(5.54-)0(11.90-)(0.398-23.16教育年數家務時數 未婚女性已婚男性已婚女性Ming-chi Chen社會統計Page.83兩個以上類別的虛擬變數當所欲比較的類別超過兩個時,必須在迴歸方程式中加入K-1個虛擬變數,K為類別數。原住民大陸各省市客家閩南族群 4 3 2 1如果受訪者不是閩南人如果受訪者是閩南人閩南 0 1如果受訪者不是客
44、家人如果受訪者是客家人客家 0 1如果受訪者不是外省人如果受訪者是外省人外省 0 1Ming-chi Chen社會統計Page.84兩個以上類別的虛擬變數e)0(6.35)0(34.5)1(89.4)(0.75-14.57教育年數閩南:家務時數e)0(6.35)1(34.5)0(89.4)(0.75-14.57教育年數客家:家務時數e)1(6.35)0(34.5)0(89.4)(0.75-14.57教育年數外省:家務時數e)(6.35)(34.5)(89.4)(0.75-14.57外省客家閩南教育年數家務時數當所有的類別虛擬變數為0時,為比較基底組(參考組)的迴歸線。e)0(6.35)0(34
45、.5)0(89.4)(0.75-14.57教育年數原住民:家務時數Ming-chi Chen社會統計Page.85族群虛擬變數的推論統計族群的虛擬變數都未達顯著水準,可見得對家務時數沒有影響。Ming-chi Chen社會統計Page.86比較基底組的選擇 究竟哪一組當作比較基底最好沒有一定的答案,一般的選擇原則為:(1)最大人數組為基底。(2)不要以其他類別為基底。(3)人數過少的組別不要當基底。(4)同質性最高的為基底,即標準差最小的組。Ming-chi Chen社會統計Page.87Interaction with dummy variable 另外一種常見的非線性關係稱為交互作用(in
46、teraction)。22110 xBxBBy 在線性迴歸模型中,每一個自變數對於依變數的影響為固定的,每單位X1的變動,永遠造成B1單位Y的變動。但有時候x在不同情況下,可能對Y的影響大小並不同。Ming-chi Chen社會統計Page.88Interaction with dummy variable 所謂交互作用,指的是x1對y的影響,決定於x2的數值。或者說在不同的x2水準下,x1對Y有不同的影響。現實世界中常有類似的交互作用出現:例如學歷對於收入的影響決定與個人的聰明才智(聰明人較能發揮學歷的效用)年資對於薪資的影響在公務員、醫生、農人等不同職業類別中並不相同。Ming-chi C
47、hen社會統計Page.89Interaction with dummy variable 欲測試x1,x2是否存在交互作用,僅需將x1及x2兩變數相乘後放入模型中即可。exxBxBxBBy21322110 若x1,x2存在交互作用,則B3的統計檢定會顯著不同於零。Ming-chi Chen社會統計Page.90虛擬變數Dummy Variables+交叉觀念iiiiiiiDXDXDXYE3210),|(iiiiiXXDXYE10210)0()0,|(當D=0時,iiiiiiXXXDXYE)()1()1,|(31203210當D=1時,Ming-chi Chen社會統計Page.91虛擬變數D
48、ummy Variables+交叉產生交互作用項到達顯著水準Ming-chi Chen社會統計Page.92男女不同的教育效果較強。減少做家事上的效果比對於女性而言,教育在教育年數家務時數對於女性而言教育年數家務時數對於男性而言09.12.29)00.109.1()21.222.29(Ming-chi Chen社會統計Page.93男女不同的教育效果斜率和截距都有所不同Ming-chi Chen社會統計Page.94Models involving polynomials 在迴歸方程式中,有時自變數以二次項(parabola)或三次項(cubic polynomial)的型態出現。X年資收入XY102210XXY332210XXXYMing-chi Chen社會統計Page.95Models involving polynomialsAGE706050403020INCOME302826242220181614121086420(-12.19)(14.30)65.5(80.1605.658,103.819,122iixxy