1、第十九章 二项分布A基本概念 二项分布的来源 二项分布的正态近似 比率z检验 本书前面的章节主要介绍了参数统计的方法,如果变量为等距或等比数据,且数据分布服从正态分布(或t分布等),那么我们可以采用参数统计方法进行分析。 如果所有数据都是称名或者顺序数据,或者等距/等比数据不满足参数统计的分布假设,就需要采用非参数统计方法。 比如,期末考试6道判断题,一个学生她答对多少道题才算她考试通过呢? 对于这样的问题,即使这个学生完全不会,那她也很可能蒙对3道题,那她蒙对4道、5道、6道的概率是多少呢? 根据概率的乘法原则,几个独立事件同时出现的概率等于这些事件发生概率之积。 这样做对X道题的概率为 这
2、个公式代表的分布称为二项分布。XXXCXP66)5 . 01 (5 . 0)( 当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的一个且是唯一一个时(男女、对错等),就可能产生一个二项分布,也成为伯努利分布;这样的事件被称为二分事件。 对应的两个类别的概率通常用P和Q表示,P+Q=1. 扔硬币就是一个典型的二分事件,P=Q=0.5,随着试验次数(扔的次数)N增加,二分事件所对应的发生概率P和Q不会变化。 通常把第一类别(概率P的时间)的实验次数称为X,即二项分布的变量。 上面的问题中,P=Q,做对X道判断题的概率分布如下图所示。 随着试验的总次数N增加,二项分布越来越接近正态分布。
3、如果考试题目为单选题(三选一),P不等于Q,则二项分布不对称。 即使P不等于Q,但只要N足够大,二项分布也越来越对称,越来越接近正态分布。N足够大的标准: 如果P=0.5,当N大于25时,二项分布近似于正态分布; 如果P不接近0.5时,NPQ最少是9时才可将二项分布近似为正态分布。 总之,对于二分事件,只要N足够大,二项分布就接近于一个均值为NP,标准差为 的正态分布。 如果期末考试题为判断题,总题数50,该同学做对多少道才算她通过呢? 一般来说,只要她做的题目数大于一半,且概率足够小(0.5或P100时可不做连续性校正。NPQNPXz5 . 0 做出统计推断 Z分数落在拒绝区域外,接受零假设
4、,即婴儿对面孔没有注意偏好。96. 164. 15 . 0*5 . 0*305 . 05 . 0*30205 . 0NPQNPXz符号检验的前提假设: 二分事件:每个简单事件或者试验只属于两个分类中的一个或另一个,而不会同时在两个分类或第三个分类中,P+Q=1; 独立事件:实验中的每次试验互不干扰; 固定过程:P和Q在实验的每轮试验中保持不变; 正态近似:如果N不够大,需要查符号检验对应的表格,不能用正态逼近; 任意分布检验:因变量分布可不是正态分布。 在二分事件中,最常见的就是赌徒谬误,即认为事件的概率会在一串某一分类的结果接连出现后改变来弥补损失以保证分类间的平衡。 比如,我们知道扔硬币很
5、多次,正面朝上的次数和背面朝上的次数将接近相等,所以当连续几次都是正面朝上时,我们会觉得下次背面朝上的概率会变大,这就是赌徒谬误。 实际上,由于每次抛硬币都是与之前无关的独立事件,因此正面朝上的概率不会变。符号检验的应用 当只知道配对观测值的差异方向而不知道差异量或者差异量远不能近似于正态分布时,不能采用配对t检验,应该采用符号检验; 当配对t检验和符号检验都可以应用时,符号检验比配对t检验的统计检验力要低。 之前讲过的皮尔逊相关和斯皮尔曼等级相关的关系与此类似。第二十章 卡方检验A基本概念 卡方分布 期望频次和观测频次 卡方统计量 卡方临界值 各种不同的单因素卡方检验 上一章中我们介绍了二分
6、事件的计数数据服从二项分布,可以采用符号检验对二者差异进行检验。 比如从我们心理学院的两个专业中找30名同学去参加义务劳动,师范类找了20个人,非师范类找了10个人,非师范生认为挑选不公平,剥夺了他们为社会做贡献的权利,那么这次挑选真的不公平吗?我们可以通过符号检验来分析 零假设:两个专业同学被选的机会均等,即P=0.5 显著水平选择0.05双侧 N=30,近似于正态分布,0.05显著水平下,拒绝区域为大于1.96或者小于-1.96 采用连续性校正的公式 做出统计推断 接受零假设,两个专业的学生被选的概率是相等的。96. 164. 15 . 0*5 . 0*305 . 05 . 0*30205
7、 . 0NPQNPXz 如果上边的问题变了,30志愿者不分专业从大一、大二、大三三个年级中挑选,结果大一15人、大二10人、大三5人,这样的挑选平等吗? 很显然,上边的事件也不再是二分事件,它涉及到了三个类别,相应的分布也不再是二项分布,而是多项分布。 在二项分布中,各个值对应的概率我们可以轻松求得,但是在处理二分事件时,我们依然将它近似为正态分布; 对于多项分布,计算则比较复杂,这样就更需要采用近似的方法进行分析。 在参数统计中比较一个变量两个水平之间的差异可以用两样本t检验和方差分析,F值为t值的平方,服从F分布,F检验可用于处理多水平间的差异。 类似的,二项分布近似的正态分布可以处理二分
8、事件间的差异,对其平方得到的分布可以处理多个类别间的差异。NPQNPXz22)( 假设平方前的z分数服从正态分布,那么z的平方会服从另外一种不同的数学分布,即卡方分布。2 卡方分布的形状是由它的自由度决定的。卡方分布的自由度等于类别数减1,即k-1。 从上图可以看出,除非自由度非常大,否则所有的卡方分布会倾向于正偏态。 与F检验类似,卡方检验也是单侧的。NPQNPX22)( 对于二分事件 分子部分X-NP。NP代表的概率为P的情况下该类别的期望频次fe,而X代表实际或观测到的频次fo。 对于k种类别的情况,kooefff22)( 卡方检验的自由度为k-1,通过查表确定拒绝区域 前边的那个问题,
9、零假设:志愿者是随机选的,即三个年级的学生被选中的概率相等,均为1/3。 自由度为3-1=2,卡方临界为5.99,计算统计量小于临界值,接受零假设,志愿者的挑选各年级是机会平等的。510)105(10)1010(10)1015(2222 如果卡方计算值大于临界值,也就是显著的,意味着在期望频次和实际频次之间存在不匹配。 但是要确切知道到底是那两组存在差异,还需要进一步的分析(两两进行符号检验或卡方检验,对进行Bonferroni校正)。 前边我们讲的是单因素卡方检验,也称为拟合度检验,经常用于测量实际频次和基于理论的或假设的总体分布的期望频次之间的拟合度。 实际应用中存在以下几种情况:1、检验
10、无差假说:也就是假定期望频次相等,如前边的挑选志愿者的例子;2、检验假设分布的概率 卡方分布拟合度最初的应用就是基于某个连续变量的样本分布来检验它的总体分布形态。 比如检验期末考试成绩是否服从正态分布。选取100个学生,如果服从正态分布,那么将会有34个人的z分数在01之间,大约13个人落在12之间,3个人落在2以上,负数区域有同样的人数,这就是期望频次。把100名同学的成绩转化为z分数,统计出实际频次。然后用卡方检验来分析。 如果显著,则不服从正态分布;否则,服从。B基本统计过程 二因素列联表 关联皮尔逊卡方检验 卡方检验的假设 A部分我们对单因素卡方检验进行了介绍,在实际的心理学研究中往往
11、会牵涉到两个以上的变量之间的关系。所以二因素卡方检验要比单因素卡方检验更为常用。 比如,我们想看一下学生对授课教师的性别是否存在某种偏好。这样就涉及到两个两个变量学生的性别和老师的性别。两个课堂的情况如下表所示,两个课堂老师分别为男和女,各30人,男老师班上5个男生25个女生,女老师班上15个男生15个女生。下表称为列联表或交叉分类表男老师女老师行之和男学生51520女学生251540列之和303060 从上表可以看出,大多数男生选了女老师课堂,大多数女生选了男老师课堂,这似乎体现了一种相关,即异性偏好。 但这是否是一种随机产生的巧合呢? 我们可以采用关联皮尔逊卡方检验来决定是否决绝零假设。
12、在二因素卡方检验中,零假设是两个变量之间没有关系,即一个变量在不同类别中的分布不会随另一个变量不同水平的变化而变化。换句话说,零假设认为两个变量相互独立,互不影响。因此关联皮尔逊卡方检验也被称为独立性卡方检验。 在独立性卡方检验中,自由度等于两个变量自由度之积,df=(R-1)(C-1),本例中等于1,在0.05显著水平下卡方检验的拒绝区域为大于3.84。 统计量的计算依然采用公式 其中k为单元格数目,也就是类别数目,期望频次为kooefff22)(Nfe列之和行之和男老师女老师行之和男学生5(10)15(10)20女学生25(20)15(20)40列之和303060 括号内计算得到的期望频次
13、,则 做出推断,课堂上教师的性别与选课同学的性别存在相关,学生选课时对授课教师性别存在异性偏好。84. 35 . 720)2015(20)2025(10)1015(10)105(22222卡方检验的前提假设: 互斥互补的类别:每个观测值都会落入一个而且仅可以落入一个类别中; 观测值相互独立:可通过让每个被试只代表一次观测值来满足; 期望频次的大小:比较保守的规则是每个期望频次都大于5(df=1时,都要大于10);相对宽松的规则是每个期望频次都大于1,并且不多于20%的期望频次小于5.第二十章 顺序数据的统计检验 前两章我们讲了对于二分事件和N分事件,其数据为计数数据,这样的情况不符合参数统计的
14、假设,比较各个类别之间的差异我们可以采用符号检验和卡方检验。 在教育心理学的很多研究中,其数据也不遵从等距,或者其分布为较强的偏态分布,这时我们可以这些数据用顺序数据来表达,采用非参数统计的方法来分析。 五名男生期末考试成绩为98,96,94,90,80,六名女生 成绩为97,95,93,92,91,89,问10名同学成绩存在性别差异吗? 对于这样一个问题,我们不能确定数据是否服从正态分布,因此无法采用两样本t检验,这时可以采用秩和检验。 秩和即秩次之和或等级之和。秩次即按大小排序后的序号,一般从大到小排序。 括号里就是每个数据对应的秩次男: 98(1),96(3),94(5),90(9),8
15、0(11)女: 97(2),95(4),93(6),92(7),91(8),89(10) 排序之后,将容量较小的样本中各数据的等级相加,用T表示。 T=1+3+5+9+11=19 查秩和检验表,若T=T2,则表明两样本具有统计学意义。 查下表可知,在双侧0.05显著水平下, T=T1,男女生期末考试成绩存在差异。 在上边的例子中,两个样本量均小于10. 当两个样本量均大于10时,秩和T的分布接近于正态分布。其平均数为标准差为n1为较小的样本量 这样z分数等于2) 1(211nnnT12) 1(2121nnnnTTTTz 假设11个男生成绩排名为1,3,5,6,9,11,16,20,21,22,
16、23 12名女生成绩排名为2,4,7,8,10,12,13,14,15,17,18,19 正态分布平均数为132,标准差为16.25,秩和T为137,则z=0.311.96,所以男女生成绩无差异。 比较来自两个被试组的数据差异时,如果数据总体服从正态分布,我们可以采用两独立样本t检验来分析;如果两组数据总体不服从正态分布,可采用秩和检验来分析。 两组数据可以来自两组被试,也可以来自一组被试的两次测量,如果数据服从正态分布,则可采用配对t检验来分析;如果不服从正态分布,则可采用Wilcoxon符号等级检验法来分析。如果被试样本NT临界,两次无显著差异。 当N25时,一般认为T的分布近似于正态分布4) 1(NNT24) 12)(1(NNNTTTTz
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。