1、在醫學資料中,特別是臨床醫學資料中,常在醫學資料中,特別是臨床醫學資料中,常常遇到一些定性指標,如臨床療效的評價、疾病常遇到一些定性指標,如臨床療效的評價、疾病的臨床分期、症狀嚴重程度的臨床分級、中醫診的臨床分期、症狀嚴重程度的臨床分級、中醫診斷的一些臨床症狀等,對這些指標常採用分成若斷的一些臨床症狀等,對這些指標常採用分成若干等級然後分類計數的辦法來解決它的量化問題,干等級然後分類計數的辦法來解決它的量化問題,這樣的資料我們在統計學上稱為有序變量這樣的資料我們在統計學上稱為有序變量(ordered variableordered variable)或半定量資料,也稱為等)或半定量資料,也稱為
2、等級資料(級資料(ranked dataranked data)。)。等級資料定義等級資料定義 等級資料劃分的兩種情況等級資料劃分的兩種情況特點特點觀察結果具有等級差別。觀察結果具有等級差別。v按性質劃分按性質劃分如藥物療效分為痊愈、顯效、好轉如藥物療效分為痊愈、顯效、好轉、無效;麻醉效果分為、無效;麻醉效果分為、級等。級等。v按數量分組按數量分組數據兩端不能確切測定的計量資料數據兩端不能確切測定的計量資料。如抗體滴度分為。如抗體滴度分為1:20,1:20,1:40,1:80,1:20,1:20,1:40,1:80,1:80;年齡分為年齡分為10,10,20,40,600.05P0.05)等級
3、資料正確的統計分析方法等級資料正確的統計分析方法 非參數統計的秩和檢驗非參數統計的秩和檢驗 Kendall Kendall、spearmanspearman等級相關等級相關 CMHCMH卡方檢驗卡方檢驗 RiditRidit分析分析 線性趨勢卡方檢驗線性趨勢卡方檢驗 有序變量的有序變量的LogisticLogistic回歸分析回歸分析一、非參秩和檢驗一、非參秩和檢驗 由於非參數檢驗法不考慮數據的分由於非參數檢驗法不考慮數據的分佈規律,檢驗不涉及總體參數,檢驗統佈規律,檢驗不涉及總體參數,檢驗統計量多是人們在總結經驗的基礎上創造計量多是人們在總結經驗的基礎上創造出來的,所以這類檢驗方法的特點是針
4、出來的,所以這類檢驗方法的特點是針對性強。但是不同設計、不同目的所用對性強。但是不同設計、不同目的所用的非參數檢驗法是不同的。的非參數檢驗法是不同的。v 單向有序行列表 在表的兩個方向上的分類中,一在表的兩個方向上的分類中,一個方向(橫向)無順序和等級概念,個方向(橫向)無順序和等級概念,另一個方向(縱向)是有順序的分類,另一個方向(縱向)是有順序的分類,稱為單向有序行列表。稱為單向有序行列表。a.a.兩組獨立樣本等級資料比較的兩組獨立樣本等級資料比較的Mann-Mann-WhitneyWhitney秩和檢驗秩和檢驗 以表以表1 1為例。將無效、有效、顯效三個療效等級數量化,為例。將無效、有效
5、、顯效三個療效等級數量化,數值用平均秩號,然後比較各組平均秩號的大小。數值用平均秩號,然後比較各組平均秩號的大小。治治 疗疗 组组 对对 照照 组组 合合 计计 秩秩 次次 范范 围围 平平 均均 秩秩 次次 无无 效效 6 14 20 1-20 10.5 有有 效效 19 20 39 21-59 40 显显 效效 35 24 59 60-118 89 合合 计计 60 58 118 兩組的平均秩號分別為兩組的平均秩號分別為治療組治療組R1=(6R1=(610.5+1910.5+1940+3540+3589)/60=65.689)/60=65.6對照組對照組R2=R2=(141410.5+20
6、10.5+2040+2440+248989)/58=53.1/58=53.1 經秩和檢驗,經秩和檢驗,u=2.169u=2.169,P0.05P0.05,兩組療效差異有,兩組療效差異有統計學意義,因為治療組平均秩號大于對照組,所以治統計學意義,因為治療組平均秩號大于對照組,所以治療組療效好。療組療效好。計算兩組秩號並進行秩和檢驗計算兩組秩號並進行秩和檢驗 Analyze Nonparametric Tests 2 independent Samples Test variable List result Grouping variable group Define groupsgroup11;
7、group22,Test Type Mann-Whitney OKSPSSSPSS窗口操作過程窗口操作過程Ranks GROUP N Mean Rank Sum of Ranks RESULT 1 60 65.63 3938.00 2 58 53.16 3083.00 Total 118 分析結果分析結果Test Statistics RESULT Mann-Whitney U 1372.000 Wilcoxon W 3083.000 Z-2.169 Asymp.Sig.(2-tailed).030 結論結論兩組療效差異有統計學意義,且治療兩組療效差異有統計學意義,且治療組效果好于對照組。組效
8、果好于對照組。=-2.169=-2.169,P0.05 P0.05 P0.05 結論結論兩組療效差異沒有統計學意義。兩組療效差異沒有統計學意義。b.b.兩 組 配 對 樣 本 等 級 資 料 比 較 的兩 組 配 對 樣 本 等 級 資 料 比 較 的WilcoxonWilcoxon秩和檢驗秩和檢驗c.c.多組等級資料比較的多組等級資料比較的KruskalKruskal-Wallis-Wallis秩秩和檢驗和檢驗 該方法對該方法對K(K2)K(K2)組獨立樣本進行組獨立樣本進行K K個個總體分佈函數相同假設的檢驗,是在總體分佈函數相同假設的檢驗,是在WilcoxonWilcoxon秩和檢驗基礎
9、上擴展的方法,稱秩和檢驗基礎上擴展的方法,稱為為K-WK-W檢驗。檢驗。例例2 2 對對5454例牙病患者的例牙病患者的6464顆患牙的根端形態不同分顆患牙的根端形態不同分為為3 3種,種,X X線片顯示喇叭口狀為線片顯示喇叭口狀為A A型,管壁平行狀為型,管壁平行狀為B B型,管壁由聚狀為型,管壁由聚狀為C C型型表表 3 3 不不同同根根端端形形态态分分型型的的疗疗效效比比较较 根根端端形形态态 牙牙数数 成成功功 进进步步 失失败败 A A 型型 1 18 8 3 3 9 9 6 6 B B 型型 2 24 4 1 10 0 1 10 0 4 4 C C 型型 2 22 2 1 10 0
10、 1 11 1 1 1 合合计计 6 64 4 2 23 3 3 30 0 1 11 1 比較不同根端形態患牙的療效有否差別。比較不同根端形態患牙的療效有否差別。1、建立數據庫、建立數據庫1.1定義變量定義變量 group:1 A型型 2 B型型 3 C型型 result:1成功成功 2進步進步 3失敗失敗 count:例數例數1.2錄入數據錄入數據1.3權重頻數權重頻數SPSS軟體操作步驟軟體操作步驟Analyze Nonparametric Tests K independent Samples Test variable List result Grouping variable gro
11、up Define rangeminimum1;maximum3 Continue Test Type Kruskal-Wallis HOK2、分析、分析3 3、結果、結果Ranks GROUP N Mean Rank RESULT 1 18 40.92 2 24 30.88 3 22 27.39 Total 64 Test Statistics RESULT Chi-Square 6.528 df 2 Asymp.Sig.038 結論結論按按=0.05=0.05的檢驗水準,三組間差異有統計學意義。的檢驗水準,三組間差異有統計學意義。H=6.528,P=0.038 計算結果中顯示的計算結果中顯
12、示的22值並不是值並不是22檢驗,只是檢驗,只是KruskalKruskal-Wallis Test-Wallis Test的檢驗的檢驗統計量統計量H H,此時近似,此時近似22分佈,所以按分佈,所以按22分佈的近似值來確定機率,它的自分佈的近似值來確定機率,它的自由度由度=組數組數-1-1。v 雙向有序資料行列表雙向有序資料行列表KendallKendall等級相等級相關法和關法和SpearmanSpearman等級相關分析法等級相關分析法 例例3 3 某病病情與療效的關係某病病情與療效的關係 表表4 4 某某病病病病情情与与疗疗效效的的关关系系(1 1)病病 情情 疗疗效效 极极重重 重重
13、 中中 轻轻 恶恶化化 3 30 0 2 20 0 2 20 0 1 10 0 无无效效 2 20 0 3 30 0 1 10 0 2 20 0 有有效效 1 10 0 1 10 0 3 30 0 3 30 0 表表 5 5 某某病病病病情情与与疗疗效效的的关关系系(2 2)病病 情情 疗疗效效 极极重重 重重 中中 轻轻 恶恶化化 2 20 0 2 20 0 3 30 0 1 10 0 无无效效 1 10 0 3 30 0 2 20 0 2 20 0 有有效效 3 30 0 1 10 0 1 10 0 3 30 0 兩表的區別僅在于病情兩表的區別僅在于病情“極重極重”組和組和“中中”組的數據
14、進行了互換。組的數據進行了互換。分別對上面兩個表格數據進行分別對上面兩個表格數據進行22檢驗和多檢驗和多組等級資料比較的組等級資料比較的KruskalKruskal-Wallis-Wallis秩和檢驗。秩和檢驗。對于表對于表4 42=40.0002=40.000,P=0.000P=0.000 H=24.896 H=24.896,P=0.000P=0.000對于表對于表5 52=40.0002=40.000,P=0.000P=0.000 H=24.896 H=24.896,P=0.000P=0.000兩種檢驗都兩種檢驗都無法表達表無法表達表4 4和表和表5 5的差別,的差別,直觀地看,直觀地看,
15、表表4 4的資料顯的資料顯示病情越輕示病情越輕者療效越好,者療效越好,表表5 5卻未顯示卻未顯示這種趨勢來。這種趨勢來。此時我們選用此時我們選用KendallKendall和和SpearmanSpearman等級相等級相關分析法分別計算相關係數關分析法分別計算相關係數t t和和rsrs。計算公式計算公式mmnS122t=n n總例數總例數 m m最長對角線上的格子數最長對角線上的格子數 S S專用統計量專用統計量Kendall等級相關意義等級相關意義當一個變量的等級為標準時,當一個變量的等級為標準時,另一個變量的等級與它不一致的情況(可分析兩個以另一個變量的等級與它不一致的情況(可分析兩個以及
16、多個變量間的等級相關性)。及多個變量間的等級相關性)。rs=1-)1(62nndn n總例數總例數 d d每一對值的等級差每一對值的等級差Spearman等級相關意義等級相關意義兩個變量之兩個變量之間的等級相關性。間的等級相關性。(只適用于分析兩個變量關係)(只適用于分析兩個變量關係)Spearman等級相關公式等級相關公式1.1.建立數據庫建立數據庫2.2.錄入數據錄入數據3.3.權重頻數權重頻數4.4.界面操作(以表界面操作(以表4 4為例)為例)Analyze Correlate Analyze Correlate Bivariate Row(sBivariate Row(s)療效療效
17、Column(sColumn(s)病情病情 Statistics Statistics K e n d a l l s t a u-b K e n d a l l s t a u-b ,Spearman OKSpearman OK 病病情情 疗疗效效 Correlation Coefficient 1.000.275 Sig.(2-tailed).000 病病情情 N 240 240 Correlation Coefficient.275 1.000 Sig.(2-tailed).000.Kendalls tau_b 疗疗效效 N 240 240 Correlation Coefficient
18、 1.000.320 Sig.(2-tailed).000 病病情情 N 240 240 Correlation Coefficient.320 1.000 Sig.(2-tailed).000.Spearmans rho 疗疗效效 N 240 240 表表4檢驗結果檢驗結果 病病情情 疗疗效效 Correlation Coefficient 1.000.039 Sig.(2-tailed).480 病病情情 N 240 240 Correlation Coefficient.039 1.000 Sig.(2-tailed).480.Kendalls tau_b 疗疗效效 N 240 240
19、Correlation Coefficient 1.000.046 Sig.(2-tailed).482 病病情情 N 240 240 Correlation Coefficient.046 1.000 Sig.(2-tailed).482.Spearmans rho 疗疗效效 N 240 240 表表5檢驗結果檢驗結果v 重複測量等級資料時間趨勢檢驗重複測量等級資料時間趨勢檢驗 CMHCMH卡方檢驗卡方檢驗 實例實例4 4 在某藥治療閉塞性動脈炎的臨床試驗中在某藥治療閉塞性動脈炎的臨床試驗中,治療治療2626例下肢潰瘍例下肢潰瘍的病患潰瘍改善情況見表的病患潰瘍改善情況見表6 6,評價該藥有無
20、促進潰瘍愈合的作用。,評價該藥有無促進潰瘍愈合的作用。表表 6 6 溃疡改善程度(例数)溃疡改善程度(例数)溃疡改善程度溃疡改善程度 第第 1 1 周周 第第 2 2 周周 第第 3 3 周周 溃疡面积不变溃疡面积不变 1414 1212 7 7 溃疡面积缩小溃疡面积缩小20%20%2 2 4 4 5 5 溃疡面积缩小溃疡面积缩小 20%20%50%50%8 8 7 7 6 6 溃疡面积缩小溃疡面积缩小50%50%2 2 3 3 6 6 完全治愈完全治愈 0 0 0 0 2 2 合计合计 2626 2626 2626 本例特點本例特點 1.1.個體的重複測量個體的重複測量 2.2.潰瘍隨時潰瘍
21、隨時間的變化趨勢間的變化趨勢 卡方檢驗卡方檢驗,Cochran-Mantel-,Cochran-Mantel-HanselHansel檢驗簡稱檢驗簡稱 ,包括非零相關、行平分差,包括非零相關、行平分差和一般聯繫和一般聯繫3 3種檢驗方法。對于這種重複測量種檢驗方法。對于這種重複測量的等級變量的等級變量,行列變量均為等級變量行列變量均為等級變量,應該作非應該作非零相關檢驗。本方法僅限于檢驗線性趨勢。零相關檢驗。本方法僅限于檢驗線性趨勢。計算公式計算公式 QcsQcs=cjjairiicjricjijaicinuanucnuaucn1212211)1(結果結果2=4.7424,P=0.0294結論
22、結論潰瘍改善程度隨著治療時間延長有變好的趨勢。潰瘍改善程度隨著治療時間延長有變好的趨勢。v多組等級資料的兩兩比較多組等級資料的兩兩比較RiditRidit分析分析 RiditRidit是是“Relative to an identified Relative to an identified distribution integral transformation”distribution integral transformation”的首個字母的首個字母縮寫,意指對于一個確認的分佈作積分變換。縮寫,意指對于一個確認的分佈作積分變換。RiditRidit分析是一種關於等級資料進行對比組分析是
23、一種關於等級資料進行對比組與標準組比較的假設檢驗方法,其基本思想是與標準組比較的假設檢驗方法,其基本思想是先確定一個標準組作為特定總體,求得各等級先確定一個標準組作為特定總體,求得各等級的的RiditRidit值,標準組平均值,標準組平均RiditRidit值理論上可以證明值理論上可以證明等于等于0.50.5,其他各組與標準組比較,看其可信區,其他各組與標準組比較,看其可信區間是否與間是否與0.50.5重疊,來判斷組間的統計學顯著性,重疊,來判斷組間的統計學顯著性,最後得出專業解釋。最後得出專業解釋。RiditRidit分析適用範圍分析適用範圍 1.1.兩組或兩組以上等級資料的比兩組或兩組以上
24、等級資料的比較和分析較和分析 2.2.兩端數據不確切的計量資料分兩端數據不確切的計量資料分組轉換成計數資料的分析,如血清組轉換成計數資料的分析,如血清滴度等。滴度等。特點特點簡便、直觀、適用性廣。簡便、直觀、適用性廣。一、確定標準組一、確定標準組 1.1.利用已知的標準分佈(道統方法)利用已知的標準分佈(道統方法)作為標準組。如某藥物大規模的觀察研究結作為標準組。如某藥物大規模的觀察研究結果,計算不同療效的果,計算不同療效的R R值。值。2.2.以例數最多的一組作為標準組。以例數最多的一組作為標準組。3.3.各組的例數都差不多時,可把各各組的例數都差不多時,可把各組觀察結果合併起來作為標準組。
25、組觀察結果合併起來作為標準組。二、計算標準組的二、計算標準組的RiditRidit值值三、利用對照組計算各組的平均三、利用對照組計算各組的平均R R值值四、置信區間判斷四、置信區間判斷五、統計檢驗五、統計檢驗:u:u檢驗、檢驗、t t檢驗、檢驗、22檢驗檢驗 糖糖衣衣 黄黄体体酮酮 复复方方 合合计计 无无效效 4 48 8 5 5 1 13 3 6 66 6 好好转转 1 18 84 4 1 16 6 3 36 6 1 12 26 6 显显效效 7 77 7 1 18 8 1 11 1 1 10 06 6 控控制制 5 52 2 1 19 9 1 17 7 8 88 8 合合计计 3 36
26、61 1 5 58 8 7 77 7 4 49 96 6 表表7 三種方劑對某婦科病患者治療效果比較三種方劑對某婦科病患者治療效果比較PEM3.1PEM3.1操作過程操作過程 1.1.建立數據庫建立數據庫 1.1 1.1 定義變量名定義變量名 1.2 1.2 錄入數據錄入數據2.2.界面操作界面操作 其他統計分析其他統計分析 RiditRidit分析分析 分析目的分析目的多個樣本比較多個樣本比較 分組變分組變量量分組分組 類別變量類別變量 類別類別 頻數變量頻數變量例數例數 確定確定 主要結果主要結果檢驗水準檢驗水準:=0.05 :=0.05 選用同一參照組選用同一參照組 (各樣本合計為參照組
27、各樣本合計為參照組)樣本數樣本數 k=3 k=3 等等 級級 數數:4:4 主要結果主要結果参照组各等级参照组各等级 R R 值的计算值的计算 等级等级 (1)(1)频数频数 (2)(2)(2)/2(2)/2 (3)(3)(2)(2)累累计计 (4)(4)(3)+(4)(3)+(4)移下一行移下一行(5)(5)R=(5)/NR=(5)/N (6)(6)1 1 6666 3333 0 0 33 33 0.06650.0665 2 2 236236 118118 6666 184184 0.37100.3710 3 3 106106 5353 302 302 355355 0.71570.7157
28、 4 4 8888 4444 408408 452452 0.91130.9113 各樣本平均各樣本平均R R 樣本名樣本名 頻數合計頻數合計 平均平均R R 第第1 1組組 361 0.4819361 0.4819 第第2 2組組 58 0.628758 0.6287 第第3 3組組 77 0.488177 0.4881主要結果主要結果卡方檢驗卡方檢驗:卡方值卡方值 =13.0887 =13.0887 自由度自由度 v=3 v=3 概概 率率 P=0.0044 P=0.0044 結論結論三種藥物對婦科病的療效差異有統計三種藥物對婦科病的療效差異有統計 學意義。學意義。主要結果主要結果1.1.
29、標準組平均標準組平均R R值值 =248.00/496 =248.00/496=0.5=0.5 2.2.標準組方差、標準差的計算標準組方差、標準差的計算 1222nnfRfRSR2RRSS标标准准组组 f f R R f fR R f fR R2 2 无无效效 6 66 6 0 0.0 06 66 65 5 4 4.3 39 9 0 0.2 29 9 好好转转 2 23 36 6 0 0.3 37 71 10 0 8 87 7.5 56 6 3 32 2.4 48 8 显显效效 1 10 06 6 0 0.7 71 15 57 7 7 75 5.8 86 6 5 54 4.3 30 0 控控制
30、制 8 88 8 0 0.9 91 11 13 3 8 80 0.1 19 9 7 73 3.0 08 8 合合计计 4 49 96 6 2 24 48 8.0 00 0 1 16 60 0.1 15 5 方差方差 =160.16 2482/496/=160.16 2482/496/(496-1496-1)=0.0730=0.0730標準差標準差 =0.2702=0.2702標準組方差、標準差的計算標準組方差、標準差的計算對比組平均對比組平均R值值 糖糖衣衣 黄黄体体酮酮 复复方方 合合计计 无无效效 4 48 8 5 5 1 13 3 6 66 6 好好转转 1 18 84 4 1 16 6
31、 3 36 6 1 12 26 6 显显效效 7 77 7 1 18 8 1 11 1 1 10 06 6 控控制制 5 52 2 1 19 9 1 17 7 8 88 8 合合计计 3 36 61 1 5 58 8 7 77 7 4 49 96 6 nfRR糖衣組糖衣組=0.4819 =0.4819 黃體酮組黃體酮組 =0.6287=0.6287 複方組複方組 =0.4881=0.4881 5277184489113.0527157.0773710.01840665.048 如果等級是由劣到優的順序排列,如果等級是由劣到優的順序排列,則平均則平均 RiditRidit值越大越好,否則越小越好
32、。值越大越好,否則越小越好。但我們不能單純以各組平均但我們不能單純以各組平均RiditRidit值的大值的大小來判斷各組的差異,因為小來判斷各組的差異,因為RiditRidit值是一值是一個點估計,沒有考慮抽樣誤差,而樣本個點估計,沒有考慮抽樣誤差,而樣本正好等于總體指標的可能性很小,因此正好等于總體指標的可能性很小,因此應該結合可信區間或統計檢驗方法綜合應該結合可信區間或統計檢驗方法綜合判斷。判斷。注意注意計算對比組可信區間計算對比組可信區間nSSRRRSR2對比組標準誤對比組標準誤對比組對比組95%可信區間可信區間計算對比組計算對比組95%CI並進行判斷並進行判斷糖衣組糖衣組95%CI95
33、%CI0.45340.51030.45340.5103黃體酮組黃體酮組95%CI95%CI0.55780.69970.55780.6997複方組複方組95%CI95%CI0.42650.54970.42650.5497判斷判斷透過可信區間比較對比組與標準組的差透過可信區間比較對比組與標準組的差別。看對比組別。看對比組95%95%可信區間是否包括標準組可信區間是否包括標準組RiditRidit值(值(0.50.5),不包括,則),不包括,則P0.05P0.05,差別有,差別有統計學意義。否則反之。統計學意義。否則反之。图1 不同方剂对妇科病疗效比较图1 不同方剂对妇科病疗效比较糖衣黄体酮复方0.00.00.50.51.01.0Ridit值Ridit值對比組對比組95%CI圖圖標準組標準組 多個對比組的兩兩比較多個對比組的兩兩比較 2121221222121nnnnSRRSSRRuRRR21212,1121121NNRRU統計界限統計界限u0.05,u0.05,差異無統計意義差異無統計意義 u1.96,P0.05,u1.96,P0.05,差異有統計意義差異有統計意義 u2.58,P0.01,u2.58,P0.01,差異有統計意義差異有統計意義 u 1,2=3.84,u 1,3=0.18,u 2,3=2.99小小 結結