1、样本频数(百分数)的差异显著性测验v在生物学研究中,许多试验或调查结果是用频率(或百分在生物学研究中,许多试验或调查结果是用频率(或百分数、成数)来表示的。数、成数)来表示的。v例如总体或样本中的个体分属两种属性:例如总体或样本中的个体分属两种属性:v药剂处理后害虫的死与活药剂处理后害虫的死与活v种子的发芽与不发芽种子的发芽与不发芽v动物的雌与雄动物的雌与雄v试验的成功与失败试验的成功与失败v描述:成活率、死亡率、有效率、成功率、发芽率、合格描述:成活率、死亡率、有效率、成功率、发芽率、合格率率v类似这些性状组成的总体通常服从二项分布。类似这些性状组成的总体通常服从二项分布。v有些总体中的个体
2、属性有多种,可以经过适当的统计处理,有些总体中的个体属性有多种,可以经过适当的统计处理,将试验处理分为具有将试验处理分为具有“目标性状目标性状”和和“非目标性状非目标性状”两种两种属性,也可以将这样的总体当作二项总体看待。属性,也可以将这样的总体当作二项总体看待。v频率(百分数)的假设测验,可以按照二项分布频率(百分数)的假设测验,可以按照二项分布进行,即按照二项分布的概率函数计算相应百分进行,即按照二项分布的概率函数计算相应百分数或个体数的出现概率数或个体数的出现概率v但是,当样本容量但是,当样本容量n比较大,且比较大,且p与与q相差不太大相差不太大时,二项分布的概率函数渐近于正态分布,可以
3、时,二项分布的概率函数渐近于正态分布,可以利用正态分布对其进行近似的利用正态分布对其进行近似的u检验!检验!v应用应用u检验的具体条件:检验的具体条件:vn 30vnp 5vnq 5一、一个样本频率的假设测验一、一个样本频率的假设测验v这是检验一个样本频率这是检验一个样本频率 与某一理论频率与某一理论频率 的的差异显著性。差异显著性。p 0p(一)(一)np或或nq5时的检验时的检验v此时二项分布趋近于正态分布,可以使用此时二项分布趋近于正态分布,可以使用u检验,检验,但对于数据的连续性需要进行矫正!但对于数据的连续性需要进行矫正!v统计量的计算公式:统计量的计算公式:npqnppuc5 .
4、0其中,其中,p为理论频率,或某种期望、某种规定的值为理论频率,或某种期望、某种规定的值(三)当(三)当np或或nq30时的检验时的检验v此时可以使用此时可以使用u检验,且不需要矫正!检验,且不需要矫正!v检验的统计量:检验的统计量:npqppu其中,其中,q=1-px / n样本容量样本容量v例:有一批蔬菜种子的平均发芽率例:有一批蔬菜种子的平均发芽率p0=0.85,现在随机抽,现在随机抽取取500粒,用种衣剂进行浸种处理,结果有粒,用种衣剂进行浸种处理,结果有455粒发芽,试粒发芽,试检验种衣剂对促进种子发芽有无效果。检验种衣剂对促进种子发芽有无效果。v由于由于np和和nq都大于都大于30
5、,故不需要连续性矫正,故不需要连续性矫正vH0:p=p0=0.85,即用种衣剂浸种后的发芽率依然为,即用种衣剂浸种后的发芽率依然为0.85。vHA:pp0 即用种衣剂浸种后的发芽率被提高了。即用种衣剂浸种后的发芽率被提高了。v=0.05v检验的统计量:检验的统计量:89. 0500445nxp15. 085. 01,85. 0qp5 . 250015. 085. 085. 089. 0npqppu推断:推断:因为因为u0.05=1.645,uu0.05,统计量落在零假设的,统计量落在零假设的拒绝域内,所以拒绝无效假设,接受备择假设,拒绝域内,所以拒绝无效假设,接受备择假设,认为种衣剂浸种能够显
6、著地提高蔬菜种子的发芽认为种衣剂浸种能够显著地提高蔬菜种子的发芽率。率。T2代株号代株号待测待测株数株数PPT抗性筛选抗性筛选IL-4基因基因PCR扩增扩增阳性阳性株数株数阳性率阳性率(%)概概率率阳性阳性株数株数阳性率阳性率(%)概概率率哈白哈白AH-1-3AH-1-34 43 375750.050.050 00 00.010.050.053 350500.050.05哈白哈白AH-1-21AH-1-219292525256.5256.520.010.016 66.526.520.010.050.052 218.1818.180.010.01哈白哈白AH-1-27AH-1-2720203 3
7、15150.010.010 00 00.010.01哈白哈白AH-2-7AH-2-76060151525250.010.010 00 00.010.01哈白哈白AH-2-10AH-2-109191535358.2458.240.010.01141415.3815.380.010.05,接受零假设。6:0 计算阳性株数是6株的概率P,若P0.05,接受零假设。2:9 计算阳性株数是2株和比2株还少的概率P, 若P0.05,接受零假设。3:17 计算阳性株数是3株和比三株还少的概率P, 若P0.05,接受零假设。qpCxnxxnxp)(二、两个样本频数的假设检验二、两个样本频数的假设检验v目的是检
8、验两个样本频数的差异显著性!目的是检验两个样本频数的差异显著性!v一般假设两个样本的总体方差是相等的,即:一般假设两个样本的总体方差是相等的,即:v p1=p2=p, q=1-p2121nnxxp两个样本各自的观测值两个样本各自的观测值两个样本各自的样本容量两个样本各自的样本容量v当当np或或nq5时,用时,用u检验,并需要进行检验,并需要进行连续性矫正。连续性矫正。v当当np或或nq30时,用时,用u检验,并且无需检验,并且无需进行连续性矫正。进行连续性矫正。当当np或或nq5时:时:用用u检验,并需要进行连续性矫正。检验,并需要进行连续性矫正。212121115 . 05 . 0nnqpn
9、nppu若若n130,n230时:时:用用u检验,并且无需进行连续性矫正。检验,并且无需进行连续性矫正。212111nnqpppu若若n130,n230,则上述统计量可以替换为,则上述统计量可以替换为t,且且df =n1+n2-2例:某养鱼场发生了药物中毒,抽查甲池中的例:某养鱼场发生了药物中毒,抽查甲池中的29条鱼中条鱼中有有20条死亡,抽查乙池中条死亡,抽查乙池中28条鱼有条鱼有21条死亡,试检验甲、条死亡,试检验甲、乙两池发生药物中毒后,鱼的死亡是否有差异?乙两池发生药物中毒后,鱼的死亡是否有差异?np和和nq 均小于均小于30(即(即x1和和x2均小于均小于30),可以使用),可以使用
10、t检检验,且需要连续性矫正。验,且需要连续性矫正。H0:p1=p2,即甲、乙两池鱼的死亡率没有显著差异。,即甲、乙两池鱼的死亡率没有显著差异。HA:p1 p2 即甲、乙两池鱼的死亡率没有显著差异。即甲、乙两池鱼的死亡率没有显著差异。=0.05检验的统计量:检验的统计量:69. 02920111nxp750. 02821222nxp212121115 . 05 . 0nnqpnnppt209. 0281291281. 0719. 0285 . 0295 . 0750. 0690. 0当当df =29+28-2=55时,时,t0.05/2 = 2.004由于由于t=0.209 t0.05/2 = 2.004,所以接受零假设,即,所以接受零假设,即两个鱼池中鱼的死亡率没有显著差异。两个鱼池中鱼的死亡率没有显著差异。719. 0282921202121nnxxp