1、20 20 总复习总复习考试可能出现的题型:考试可能出现的题型:最佳选择题辩正误案例分析题统计学研究特点:统计学研究特点:n研究的是研究的是样本样本,要要对对总体总体作出推断作出推断n得到的是得到的是频率频率,要对,要对概率概率作出推断作出推断n需进行需进行参数估计参数估计和和假设检验假设检验 抽样研究抽样研究 抽样误差抽样误差n利用利用“小概率原则小概率原则”进行统计推断进行统计推断 准确的收集数据;准确的收集数据;准确的录入数据;准确的录入数据;正确的选用统计分析方法、调用统计分析程序;正确的选用统计分析方法、调用统计分析程序;对输出的结果作出合理的解释。对输出的结果作出合理的解释。统计学
2、学习的重点是掌握如何:统计学学习的重点是掌握如何:统计统计描述描述抽样分布抽样分布参数估计:参数估计:点估计、区间估计点估计、区间估计定量资料定量资料算术均数、算术均数、中位数等中位数等集中趋势:集中趋势:离散趋势:离散趋势:极差、极差、四分位数间距、方差、四分位数间距、方差、标准差、变异系数标准差、变异系数定性资料:频率型指标、强度型指标、比定性资料:频率型指标、强度型指标、比 统计表和统计图统计表和统计图统计统计推断推断变量变量概率分布:正态分布概率分布:正态分布假设假设检验检验多变量:多变量:多重线性回归、多重线性回归、logistic回归、生存分析回归、生存分析两变量:两变量:简单线性
3、相关和简单线性相关和简单回归分析简单回归分析单变量单变量非参数检验非参数检验秩和秩和参数检验:参数检验:t 检验、检验、方差分析等方差分析等定性资料定性资料实验设计实验设计分组数分组数定量资料定量资料实验设计:实验设计:三要素、四原则、实验设计方案、样本含量估算三要素、四原则、实验设计方案、样本含量估算知识框架:知识框架:均数均数;标准差;标准差 N N(,2 2 )抽出抽出n个的样本个的样本随机抽样随机抽样原总体原总体X1,X2,X3Xn样本均数样本均数X1,X2,X3Xn正态分布与抽样分布正态分布与抽样分布nxNX22)(均数均数;标准误;标准误 N N(,2 2 )XXX50 x2.5x
4、原变量原变量样本均数样本均数标准差与标准误的区别与联系标准差与标准误的区别与联系标准差 标准误区别公式与n 关系n 增大,标准差趋于稳定。n 越大,标准误越小概念描述的是样本个体观察值的变异程度大小。描述的是样本均数的变异程度和抽样误差大小。意义小说明变量值围绕均数的波动小,均数对一组变量值的代表性好。小表示样本均数围绕总体均数的波动小,用样本推断总体的可靠性越强。用途与均数结合,描述观察值的分布范围,常用于估计医学参考值范围、计算变异系数、标准误等。均数结合,用于估计总体均数可能出现的范围,即可信区间,并用于假设检验。联系1.都是描述变异程度的指标2.标准误与标准差成正比,n一定时,标准差越
5、大,标准误也越大。nxNX22)(正态分布和抽样分布正态分布和抽样分布步骤:建立假设,确定检验水准建立假设,确定检验水准确定确定P值值计算检验统计量计算检验统计量作推断结论作推断结论拒绝拒绝H0,接受,接受H1,认为差异有统计学意义认为差异有统计学意义P PP P 不拒绝不拒绝H0,认为差异无统计学意义认为差异无统计学意义有关样本资料的差异性比较有关样本资料的差异性比较定量资料定量资料数据类型数据类型前提前提条件条件t/Z检验检验四格表四格表 RC表表配对配对四格表四格表设计类型设计类型单单样样本本两两独独立立样样本本配配对对设设计计多多独独立立样样本本方差分析方差分析两两组组二二分分类类配配
6、对对设设计计多多组组多多分分类类单单样样本本两两多多独独立立样样本本配配对对设设计计不满足不满足t 检验检验/方方差分析条件的差分析条件的等等级级资资料料设计设计类型类型定性资料定性资料设计类型设计类型 检验检验2秩和检验秩和检验随随机机区区组组资资料料析析因因设设计计资资料料重重复复测测量量资资料料前提条件前提条件前提条件前提条件变量变换或秩和检验变量变换或秩和检验1nnSXt/0t 检验检验变量变换或秩和检验变量变换或秩和检验例数例数n 50n 50正态正态偏态偏态两两独独立立样样本本定定量量资资料料假假设设检检验验单单样样本本配配对对资资料料差值差值正态正态偏态偏态1,/0nnsdtd对
7、子数对子数t 检验检验n 50例数例数正态正态偏态偏态n 50方差齐方差齐t 检验检验)11(2121nnSXXtc221nn方差不齐方差不齐方差齐方差齐变量变换或秩和检验变量变换或秩和检验t 检验检验22212121nSnSXXt11)(24142222121nSnSSSxxxx对于四格表资料的假设检验对于四格表资料的假设检验:n40且所有且所有T5 n40但有但有1T5 n40或有或有T1 TTA22)(TTA22)21()()()()(22dbcadcbanbcad)()()()2/(22dbcadcbannbcad!)!()!()!()!(ndcbadbcadcbap定性资料的假设检验
8、定性资料的假设检验-12.对于配对分类数据的对于配对分类数据的 22 表:表:1.b+c 40 2.b+c 40 cbcb22)()(cbcb221定性资料的假设检验定性资料的假设检验-23.行行列表资料的列表资料的2检验:检验:)1(22CRnnAn定性资料的假设检验定性资料的假设检验-3 自变量自变量X 因变量因变量Y 统计方法统计方法单因单果单因单果1个个1个个简单相关简单相关simple correlation简单回归简单回归simple regression多因单果多因单果多个多个1个个多重相关多重相关multiple correlation多重回归多重回归multiple regr
9、ession多因多果多因多果多个多个多个多个典则相关典则相关cononical correlation多元回归多元回归multivariate regression单因单果单因单果(扣除其它变量影响扣除其它变量影响)1个个1个个部分偏相关部分偏相关partial correlation相关和回归分析:相关和回归分析:简单相关:简单相关:回归分析回归分析1个因变量个因变量Y1个自变量个自变量X 2个以上自变量个以上自变量XY是数值是数值变量变量Y是分类是分类型变量型变量两个因变量两个因变量(结局分类变量(结局分类变量+时间)时间)生存分析生存分析Cox回归回归简单回归简单回归Simple reg
10、ression Logistic 回归回归Logistic regression 多重回归多重回归Multiple regression 常用的回归分析中分类:常用的回归分析中分类:曲线回归线性回归线性回归回归回归分析分析简单线性:简单线性:多重线性:多重线性:logistic回归回归线性回归线性回归iiXXXY.22110kkkkxxxxkkeexXX1101101.1ln22110或110011)-1Ln(-)-1Ln()(LneORORXY只只1个个X:(简单简单)多个多个X:XXeeX0011ln0或Cox回归回归).exp()()(22110ppXXXththjjRRln)exp(j
11、jRR区分多重线性回归、区分多重线性回归、logistic回归和回归和Cox回归的异同。回归的异同。01 01 绪论绪论1.掌握掌握6组基本概念:组基本概念:总体与样本总体与样本 同质与变异、同质与变异、参数和统计量参数和统计量 变量与变量分类、变量与变量分类、抽样研究与抽样误差抽样研究与抽样误差 随机事件与概率随机事件与概率2.掌握什么是抽样误差,它产生的原因及主要特征掌握什么是抽样误差,它产生的原因及主要特征。3.掌握随机事件、概率和小概率事件的基本含义。掌握随机事件、概率和小概率事件的基本含义。2 2 统计描述统计描述1.掌握定量资料集中趋势的指标:算术均数、几掌握定量资料集中趋势的指标
12、:算术均数、几何均数、中位数的概念、计算和适用条件;何均数、中位数的概念、计算和适用条件;2.掌握定量资料离散趋势的指标:极差、四分位掌握定量资料离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数的概念、计数间距、方差、标准差和变异系数的概念、计算和适用条件算和适用条件3.掌握率、构成比的概念和区别,掌握相对数的掌握率、构成比的概念和区别,掌握相对数的注意事项;注意事项;4.掌握常用统计图表的适用范围和制作方法,从掌握常用统计图表的适用范围和制作方法,从而根据资料的类型选择合适的统计图对资料进而根据资料的类型选择合适的统计图对资料进行描述。行描述。3 概率分布概率分布1.熟悉熟悉Poi
13、sson分布、二项分布的概念、参数与图形分布、二项分布的概念、参数与图形特征。特征。2.掌握掌握正态分布的概念,图形特征掌握掌握正态分布的概念,图形特征两个参两个参数及面积规律。数及面积规律。3.掌握标准正态分布的概念,标准化方法及意义。掌握标准正态分布的概念,标准化方法及意义。4.掌握正态分布和应用掌握正态分布和应用参考值范围的定义,计参考值范围的定义,计算方法。算方法。4 4 参数估计参数估计1.熟悉抽样误差的概念及产生原因熟悉抽样误差的概念及产生原因2.掌握抽样误差的概念以及标准误的计算;掌握抽样误差的概念以及标准误的计算;3.t分布的图形特征;分布的图形特征;4.参数估计的概念和参数估
14、计的基本方法。参数估计的概念和参数估计的基本方法。5 假设检验假设检验1.掌握假设检验中掌握假设检验中P值的含义及其与值的含义及其与的区别。的区别。2.掌握假设检验的基本思想和步骤;掌握假设检验的基本思想和步骤;3.掌握掌握型错误和型错误和型错误的概念,及二者的关型错误的概念,及二者的关系系4.掌握单侧检验和双侧检验的含义及应用条件;掌握单侧检验和双侧检验的含义及应用条件;5.单样本定量资料的分析思路和单样本单样本定量资料的分析思路和单样本t检验的检验的模型假设。模型假设。6 两样本定量资料的比较两样本定量资料的比较 1.掌握两独立样本定量资料的统计分析思路:两样本均掌握两独立样本定量资料的统
15、计分析思路:两样本均来自正态总体且总体方差齐时用来自正态总体且总体方差齐时用t 检验,两样本来自检验,两样本来自正态总体但总体方差不齐时用检验或秩和检验,当数正态总体但总体方差不齐时用检验或秩和检验,当数据来自偏态分布总体时,首先考虑采用变量变换,再据来自偏态分布总体时,首先考虑采用变量变换,再考虑选用秩和检验;考虑选用秩和检验;2.掌握配对设计的含义及两配对样本定量资料的统计分掌握配对设计的含义及两配对样本定量资料的统计分析思路:对于配对设计定量资料的统计分析,若差值析思路:对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对服从正态分布,可采用配对t检验,否则,采用配对资检验,否
16、则,采用配对资料的符号秩和检验;料的符号秩和检验;3.掌握两样本秩和检验的优缺点。掌握两样本秩和检验的优缺点。7.多组定量资料的比较多组定量资料的比较1.掌握完全随机设计的含义;掌握完全随机设计的含义;2.掌握单因素方差分析的基本思想和模型假设;掌握单因素方差分析的基本思想和模型假设;熟悉单因素方差分析的计算公式熟悉单因素方差分析的计算公式3.了解多独立样本了解多独立样本Kruscal-wallis秩和检验的编秩秩和检验的编秩方法。掌握多独立样本秩和检验的应用范围。方法。掌握多独立样本秩和检验的应用范围。8 定性资料的比较定性资料的比较1.了解四格表概念及四格表中了解四格表概念及四格表中4个基
17、本数据的含义;个基本数据的含义;2.了解配对四格表的概念以及配对四格表与一般四了解配对四格表的概念以及配对四格表与一般四格表在设计上的不同。格表在设计上的不同。3.熟悉等级资料平均水平秩和检验的基本过程。熟悉等级资料平均水平秩和检验的基本过程。4.掌握四格表资料检验的基本公式及各公式的适用掌握四格表资料检验的基本公式及各公式的适用条件;配对四格表检验的基本公式及各公式的适条件;配对四格表检验的基本公式及各公式的适用条件;掌握四格表的确切概率法的适用条件;用条件;掌握四格表的确切概率法的适用条件;掌握检验的注意事项。掌握检验的注意事项。9 两变量关联性分析两变量关联性分析 1.掌握各种两变量资料
18、类型的关联性分析方法,及掌握各种两变量资料类型的关联性分析方法,及应用的前提条件。应用的前提条件。2.熟悉线性相关分析的基本步骤。熟悉线性相关分析的基本步骤。3.掌握掌握 Pearson积矩相关系数、积矩相关系数、Spearman秩相关系秩相关系数、关联系数的概念、计算方法及解释意义。数、关联系数的概念、计算方法及解释意义。4.掌握关联性分析的结果解释意义。掌握关联性分析的结果解释意义。10 简单线性回归分析简单线性回归分析1.掌握线性回归掌握线性回归适用资料类型、应用前提适用资料类型、应用前提假设假设。2.熟悉线性回归的基本步骤,模型公式、求解回熟悉线性回归的基本步骤,模型公式、求解回归方程
19、中参数估计量归方程中参数估计量和和值所遵循的最小二乘值所遵循的最小二乘原则;原则;3.掌握回归系数的含义、计算方法及解释意义;掌握回归系数的含义、计算方法及解释意义;4.掌握相关与回归分析的区别与联系。掌握相关与回归分析的区别与联系。11 多重线性回归分析多重线性回归分析1.掌握多重线性回归分析的造用资料类型、应掌握多重线性回归分析的造用资料类型、应用前提条件诊断和多重共线性。用前提条件诊断和多重共线性。2.熟悉多重线性回归分析的模型公式、基本步熟悉多重线性回归分析的模型公式、基本步骤;骤;3.掌握多重线性回归分析中偏回归系数、标化掌握多重线性回归分析中偏回归系数、标化的回归系数的概念和解释意
20、义。的回归系数的概念和解释意义。4.掌握确定系数、复相关系数、调整确定系数、掌握确定系数、复相关系数、调整确定系数、调整复相关系数的概念和意义。调整复相关系数的概念和意义。12 实验设计实验设计1.熟悉配对、随机区组、析因、交叉、重熟悉配对、随机区组、析因、交叉、重复测量实验设计方法及其优缺点;复测量实验设计方法及其优缺点;2.掌握样本含量估算的意义和掌握样本含量估算的意义和4个主要影响个主要影响因素。因素。18 logistic回归分析回归分析1.掌握掌握logistic回归分析的适用资料类型、应用回归分析的适用资料类型、应用前提条件及注意事项。前提条件及注意事项。2.熟悉熟悉logistic回归分析的函数公式及建模基本回归分析的函数公式及建模基本步骤。步骤。3.掌握掌握 logistic回归模型中偏回归系数、回归模型中偏回归系数、优势比优势比或相对危险度的概念、解释意义及相互关系。或相对危险度的概念、解释意义及相互关系。路漫漫其修远兮路漫漫其修远兮