1、第四讲 均值的差异性检验之一(T检验)一、统计推断的基本概念一、统计推断的基本概念1、什么是统计推断u定义:通过对统计分析的结果进行假设,并通过统计分析来判定假设是否正确的研究方法。u基本思路检查数据的类型与分布特点假设数据满足某一特性(规范)选择合适的分析工具,开展统计分析由计算结果获取假设的检验概率如果假设是个小概率事件,则假设不成立,否则假设成立。一、统计推断的基本概念一、统计推断的基本概念2、两个核心问题u选择何种统计分析工具数据类型(高测度、低测度定距或定比、定序与定类)数据的分布形态数据的方差统计分析的具体要求(差异性、相关性、一致性还是聚类)一、统计推断的基本概念一、统计推断的基
2、本概念u假设与检验概率先根据分析工具进行假设假设假设数据符合正态分布?假设两组数据之间没有差异?计算检验概率,并判定结论检验概率0.05,假设成立。检验概率小于0.05,假设不成立。例如:假设数据符合正态分布,在对数据k-s检验后,发现p值为0.02,则假设失败,此数据不符合正态分布。假设两列数据没有显著性差异,在t检验后,发现p值为0.01,则假设失败,此两列数据之间存在显著性差异。二、均值差异性检验的概念二、均值差异性检验的概念1 1、什么是均值差异性?、什么是均值差异性?u定义:根据被试总体所获得的两组数据,如果存在统计学意义上的明显差别,代表二者存在着显著的差异性。对于被试的显著性差异
3、,一般借助于均值差异性来衡量。对于总体的差异性,借助样本的差异性检验来判定u解决方案假设两列数据没有显著性差异执行统计分析获取检验概率p (sig),若p0.05,则没有显著性差异若p=50)方差分析多组样本的均值差异性检验二、均值差异性检验的概念二、均值差异性检验的概念(2)(2)样本分布不满足正态分布,分布形态不清晰样本分布不满足正态分布,分布形态不清晰执行非参数检验执行非参数检验关键技术两独立样本的差异性检验多独立样本的差异性检验两关联样本的差异性检验多关联样本的差异性检验三、均值差异性的参数检验之方法三、均值差异性的参数检验之方法1、均值差异性参数检验的类型u对总体的均值差异性检验Z检
4、验u对小量样本的均值差异性检验T检验两组数据的比较单样本与指定值的T检验配对样本的T检验独立样本的T检验等方差情况异方差情况三、均值差异性的参数检验之方法三、均值差异性的参数检验之方法方差分析多组数据的均值比较单结果单因素方差分析只有一个自变量、一个因变量(结果)单结果(量)多因素方差分析只有一个因变量、但多个自变量单结果(量)带控制变量和多因素的方差分析只有一个因变量,但多个自变量、还有控制变量多个结果(变量)多因素的方差分析包含多个因变量、多个因素的方差分析三、均值差异性的参数检验之方法三、均值差异性的参数检验之方法2、均值差异性参数检验的流程u检查数据的类型与分布形态接近正态分布QQ图或
5、K-S检验数据类型高测度的定距变量、或者区分度较好的定序变量三、均值差异性的参数检验之方法三、均值差异性的参数检验之方法u根据检验目标,确立检验类型两组数据的比较t检验单样本与指定值的T检验配对样本的T检验独立样本的T检验等方差情况异方差情况多组数据的多重交叉比较方差分析结果变量(个数)单结果量或多结果量因素个数单因素、多因素有无控制变量协变量三、均值差异性的参数检验之方法三、均值差异性的参数检验之方法u判定获得结论执行统计分析命令后,获得检验概率根据检验概率,做出判定能够读懂输出结果能够读懂输出结果四、四、T T检验的实现检验的实现1、回顾u对数据实施T检验的基本条件数据类型:定距数据或区分
6、度较高的定序数据分布形态:满足t分布,或者接近于正态分布两组数据的均值比较u类型一组数据与单个值的对比配对样本的均值比较独立样本的均值比较等方差情况异方差情况四、四、T T检验的实现检验的实现2、单样本的T检验u例题:已知,初中三班学生的语文成绩如列表所示,请检查初中三班的语文成绩是否优于80分?u分析:以语文成绩与80分均值对比,检查是否优于80分,若用t检验,应该主要解决以下问题:语文成绩符合正态分布进行语文成绩与80分的单样本的T检验四、四、T T检验的实现检验的实现u实现过程基于SPSS功能(1)先求取语文列的均值;(2)判断是否满足正态分布(K-S检验)(3)执行单样本的T检验:分析
7、比较均值单样本的T检验输入检验变量:语文输入检验值:80最后“确定”(4)阅读输出结果观察sig值(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现u实现过程基于Excel的函数功能(1)先求取语文列的均值;用averageif或Average函数(2)执行单样本的T检验:在某一空闲单元格中输入数值80。输入T检验函数:TTEST(语文分区域,80所在区域,1,3)(3)阅读输出结果观察函数运算结果(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现u实现过程基于Excel的分析工具库(1)先求取语文列的均值;用averageif或Average函数(
8、2)执行单样本的T检验:在某两个空闲单元格中输入数值80。数据数据分析T检验:双样本异方差假设选择检验区域:语文区域选择检验值区域:8080最后“确定”(3)阅读输出结果观察函数运算结果(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现3、配对样本的T检验u例题:已知,初中三班学生的两次语文成绩如列表2所示,请检查初中三班的两次语文成绩是否存在显著性差异?u分析:对两次语文成绩进行差异性检验,检查是否有明显差异。若用t检验,应该主要解决以下问题:语文成绩符合正态分布是针对同一组样本的两次考试,成绩之间有一一对应关系进行两次语文成绩的配对T检验四、四、T T检验的实现检验的
9、实现u实现过程基于SPSS功能(1)判断两次语文成绩是否满足正态分布(K-S检验)(3)执行配对样本的T检验:分析比较均值配对样本的T检验选择变量1:语文1选择变量2:语文2设置置信区间为95%最后“确定”(4)阅读输出结果观察sig值(即检验概率P值)四、四、T T检验的实现检验的实现u实现过程基于Excel的函数功能(1)执行配对样本的T检验:在某一空闲单元格中,输入T检验函数:TTEST(语文分1区域,语文分2区域,2,1)(3)阅读输出结果观察函数运算结果(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现u实现过程基于Excel的分析工具库(1)执行配对样本的T检
10、验:数据数据分析T检验:平均值的成对二样本分析选择检验区域1:语文区域1选择检验区域2:语文区域2最后“确定”(2)阅读输出结果观察函数运算结果(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现u对配对样本T检验的补充说明两列数据具有一一对应关系两列数据都基本满足正态分布单尾与双尾检验若比较是否相同使用双尾检验(双侧检验)若比较是否一方优于另外一方可使用单尾检验检验概率的识别可规定检验概率的界值为0.05或者0.01结果:低于界值,存在差异高于界值,不存在显著性差异四、四、T T检验的实现检验的实现3、独立样本的T检验u例题:已知,初中三班学生的语文成绩如列表1所示,请检
11、查初中三班的男女生的语文成绩是否存在显著性差异?u分析:对一次语文成绩的男女生分组进行差异性检验,检查是否有明显差异。若用t检验,应该主要解决以下问题:语文成绩符合正态分布成绩之间没有一一对应关系,甚至个数都不同进行两次语文成绩的独立样本T检验注意:方差是否齐性,对分析方法和结果有影响?四、四、T T检验的实现检验的实现u实现过程基于SPSS功能(1)判断两次语文成绩是否满足正态分布(K-S检验)(3)执行独立样本的T检验:分析比较均值独立样本的T检验选择变量:语文1选择分组变量:性别2设置置信区间为95%最后“确定”(4)阅读输出结果先看F的sig值,若大于0.05,则看第一行的sig值;若
12、小于0.05,则看第二行的sig值。四、四、T T检验的实现检验的实现u实现过程基于Excel的函数功能(1)执行配对样本的T检验:在某一空闲单元格中,输入F检验函数:FTEST(语文分1区域,语文分2区域)若F检验值0.05输入T检验函数:TTEST(语文分1区域,语文分2区域,2,2)否则输入T检验函数:TTEST(语文分1区域,语文分2区域,2,2)(3)阅读输出结果观察函数运算结果(即检验概率P值)与已经求取的均值对比四、四、T T检验的实现检验的实现u实现过程基于Excel的分析工具库(1)执行独立样本的T检验:在某一空闲单元格中,输入F检验函数:FTEST(语文分1区域,语文分2区
13、域)若F检验值0.05数据数据分析T检验:双样本等方差假设否则数据数据分析T检验:双样本异方差假设选择检验区域1:语文区域1选择检验区域2:语文区域2最后“确定”(2)阅读输出结果观察函数运算结果(即检验概率P值)四、四、T T检验的实现检验的实现u对独立样本T检验的补充说明两列数据没有一一对应关系两列数据都基本满足正态分布采用单尾与双尾检验?若比较是否相同使用双尾检验(双侧检验)若比较是否一方优于另外一方可使用单尾检验检验概率的识别可规定检验概率的界值为0.05或者0.01结果:低于界值,存在差异高于界值,不存在显著性差异四、四、T T检验的实现检验的实现4、Z检验uZ检验的概念Z检验(Z Test)是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。在国内也被称作u检验。uZ检验的条件总体样本,或者大样本量数据基本满足正态分布定距变量或区分度较高的定序变量四、四、T T检验的实现检验的实现uZ检验的用法Excel之中首先,分别利用var(区域)计算出两个区域的方差之值;其次:启动命令:数据数据分析Z检验:双样本平均差检验细项:选择:区域1选择:区域2输入区域1的方差值;输入区域2的方差值:最后,以“确定”执行;阅读检验结果:观察检验后的P值。