1、第五章第五章-1 常用的显著性检验方法常用的显著性检验方法 1.1 1.1 可疑值和异常值可疑值和异常值 可疑值:可疑值:当对同一样品进行重复测定时,一组数据中有当对同一样品进行重复测定时,一组数据中有一、两个测定值明显地偏大或偏小,称之为可疑值;一、两个测定值明显地偏大或偏小,称之为可疑值;eg.eg.酸碱滴定检测中,获得下列数据:酸碱滴定检测中,获得下列数据:5.38,5.38,5.39,5.405.38,5.38,5.39,5.40,5.41,5.515.41,5.51 可疑值的处理可疑值的处理:1.1.经分析经分析,是属于技术上的失误是属于技术上的失误,不论是否属于不论是否属于可疑可疑
2、值值,均应舍弃均应舍弃;2.2.若不能确定是技术上的失误若不能确定是技术上的失误,则应进行则应进行统计假设检验统计假设检验.1.可疑值的检验可疑值的检验1.2 几种常用可疑值的检出方法几种常用可疑值的检出方法1.利用算术平均误差利用算术平均误差检查检查 除去可疑值后除去可疑值后,求出求出 计算可疑值与平均值之差计算可疑值与平均值之差d d=|-|=|-|若若d d2.5 时时,可疑值舍去可疑值舍去;反之反之,保留保留.x可疑xx可疑2 2 拉衣达准则拉衣达准则 对于实验数据对于实验数据x x1 1,x x2 2,xxn n,先计算出平均值,先计算出平均值 和标准差和标准差s,若某个可疑值的离均
3、差满足若某个可疑值的离均差满足|d|di i|=|=|xi i-|-|3s(或或 2s),3 3s(或或2s)作为极限误差,则认为作为极限误差,则认为xi i是异常数据,予以剔除。是异常数据,予以剔除。选择选择 3 3s 还还是是 2s 作为极限误差作为极限误差,取决于检验的取决于检验的显著性水平显著性水平,或者可信度或者可信度1-1-.3s3s相当于显著性水平相当于显著性水平=0.01,2s=0.01,2s相当于显著性水平相当于显著性水平=0.05.=0.05.注注:计算平均值和标准差时可疑值包括在内计算平均值和标准差时可疑值包括在内.xx3.t-检测准则检测准则 实验数据按大小顺序排列:异
4、常值可能出现在极端值异常值可能出现在极端值 Xmin=x1 或或 Xmax=xn ,若有若有 则可以判断则可以判断Xmin 或或 Xmax为异常值为异常值,予以剔除予以剔除.注注:计算平均值和标准偏差时可疑值不包括在内计算平均值和标准偏差时可疑值不包括在内.K(n,)为t检验系数,可从下表中查得2 统计假设检验统计假设检验 xxkg520 x kg500 xBA,0 x 通过试验测定得到的每个观测值通过试验测定得到的每个观测值 ,既由被测个体所属,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值所以观测值 由
5、两部分组成,即由两部分组成,即 =+=+总体平均数总体平均数 反映了总体特征,反映了总体特征,表示试验误差。表示试验误差。若样本含量为若样本含量为n n,则样本平均数,则样本平均数:ixixiixinnxxii/)(00)()(000 x 0:与与H H0 0对应的假设,只有是在无效假设被否定后才可接对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。受的假设。无充分理由是不能轻率接受的。无效假设无效假设:假设总体参数假设总体参数()()与某一定值与某一定值(0 0)相等,记作相等,记作 H H0 0:0 0 或两个总体参数或两个总体参数(1 1,2 2)相等,记作
6、相等,记作 H H0 0:1 12 2,或,或H H0 0:1 12 20 0,即假设处理间没有效应即假设处理间没有效应,无显著差异。无显著差异。备择假设:备择假设:与无效假设相对应的另一种统计假设,记作与无效假设相对应的另一种统计假设,记作 H HA A:0 0或或H HA A:1 12 2;如果测验结果接受了无效假设,说明无显著差异,当如果测验结果接受了无效假设,说明无显著差异,当然备择假设被否定;反之,否定了无效假设,说明差异显然备择假设被否定;反之,否定了无效假设,说明差异显著,也就是接受了备择假设。著,也就是接受了备择假设。75.90 75.9075.90nxnxu/020 xx03
7、15.230/053.00975.0119.0 /020nxnxu01.058.2uP05.096.1uP315.2uPu0 x当试验的表面效应是试验误差的概率大于当试验的表面效应是试验误差的概率大于0.05时,即时,即P0.05,则则说明无效假设成立的可能性大,不能被否定,说明无效假设成立的可能性大,不能被否定,因而接受无效假设。因而接受无效假设。当试验的表面效应是试验误差的概率小于当试验的表面效应是试验误差的概率小于0.05时时,即,即P0.05,可以认为可以认为在一次试在一次试 验中试验表面效应是试验误差实际上是不可能的,验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效
8、假设因而否定原先所作的无效假设H0,接受备择假设,接受备择假设HA,即认为即认为试验的处理效应是存在的。试验的处理效应是存在的。在统计假设检验中,否定或接受无效假设的依据是在统计假设检验中,否定或接受无效假设的依据是“小小概率事件实际不可能性原理概率事件实际不可能性原理”。用来确定否定或接受无效假。用来确定否定或接受无效假设的概率标准叫设的概率标准叫显著性水平显著性水平(significance level),),记作记作。在试验研究中常取在试验研究中常取=0.05=0.05或或=0.01=0.01。差异测验显著水平的确定差异测验显著水平的确定当当0.010.050.010.05时,认为差异显
9、著,标记时,认为差异显著,标记“*”号,否定号,否定H H0 0;当当0.010.01时,便认为差异非常显著,标记时,便认为差异非常显著,标记“*”号号;当当0.050.05时,则认为其差异不显著,其真差为零,差数来时,则认为其差异不显著,其真差为零,差数来 自抽样误差。因而接受自抽样误差。因而接受H H0 0。究竟选用那个显著性水平呢究竟选用那个显著性水平呢?应根据试验要求或试验结论的重要性而定。应根据试验要求或试验结论的重要性而定。一般试验材料的变异系数大,难以控制的因素较多,试验误一般试验材料的变异系数大,难以控制的因素较多,试验误差大,选定差大,选定0.050.05即可。即可。对试验精
10、度要求较高,不允许反复或试验结论应用事关重大,对试验精度要求较高,不允许反复或试验结论应用事关重大,一般一般0.010.01,甚至选用,甚至选用0.0010.001。统计假设检验的步骤统计假设检验的步骤建立假设。对样本所属总体提出假设,包括无效假设建立假设。对样本所属总体提出假设,包括无效假设H0和和备择假设备择假设HA;确定显著水平确定显著水平。常用的显著水平。常用的显著水平0.05和和0.01;从无效假设从无效假设H0出发,根据样本提供信息构造适宜统计量,出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临由附
11、表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断。界值大小,根据小概率原理做出统计推断。在上述显著性检验中,对应于无效假设在上述显著性检验中,对应于无效假设 的备择假设为的备择假设为 。它包含了。它包含了 或或 两种可能。两种可能。因而有两个否定域,分别位于分因而有两个否定域,分别位于分布曲线的两尾。对两尾进行检验的方法称为布曲线的两尾。对两尾进行检验的方法称为双尾检验双尾检验.00:H0:AH00 这个假设检验的目的在于判断这个假设检验的目的在于判断与与0 0有无差异,而不考有无差异,而不考 虑谁大谁小。虑谁大谁小。这样,在这样,在水平水平上否定域有两个上否
12、定域有两个 和和 ,对称地分配在对称地分配在u u分布曲线的两侧尾部,每侧的概率为分布曲线的两侧尾部,每侧的概率为/2/2,如下图,如下图所示。这种利用两尾概率进行的检验叫所示。这种利用两尾概率进行的检验叫 双侧检验双侧检验(two-sided two-sided testtest),也叫),也叫双尾检验双尾检验(two-tailed testtwo-tailed test),),为双侧检验为双侧检验的临界的临界u u值。值。u,uu单尾测验单尾测验 例例:某酿醋厂曲种酿造醋的醋酸含量保证在某酿醋厂曲种酿造醋的醋酸含量保证在1212以上,则其以上,则其假设假设H H0 0:1212,H,HA
13、A:1212。如果选择的新曲种酿造醋的。如果选择的新曲种酿造醋的醋酸含量小于醋酸含量小于1212,H H0 0被否定,被否定,只能大于只能大于1212,若小于,若小于1212,便不符合规定的企业标准,没有推广价值。因此,只是在正态便不符合规定的企业标准,没有推广价值。因此,只是在正态曲线的右尾一个否定域。曲线的右尾一个否定域。又如又如:国家规定酿造白酒国家规定酿造白酒中的甲醇含量不得大于中的甲醇含量不得大于0.10.1,因此,其否定域,因此,其否定域只是在正态曲线的左侧只是在正态曲线的左侧才有意义。才有意义。这类测验称为这类测验称为单尾测验。单尾测验。3 样本平均数的假设检验样本平均数的假设检
14、验 在实际工作中我们往往需要检验一个样本平均数与已知在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一的总体平均数是否有显著差异,即检验该样本是否来自某一总体。总体。70.50210510512505nxxi530.2108nx067.110/850070.502/0nxu96.1u067.1u05.0 xSxt0t 统计量nSSx均数标准误 例例4-2 4-2 用山楂加工果冻,传统工艺平均每用山楂加工果冻,传统工艺平均每100 g100 g加工加工500g500g果冻,采用新工艺后,测定了果冻,采用新工艺后,测定了1616次,得知每次,得知每
15、100g100g山楂可出果山楂可出果冻平均为冻平均为 520g520g,标准差,标准差S S12g12g。问新工艺与老工艺在。问新工艺与老工艺在每每100g100g加工果冻的量上有无显著差异?加工果冻的量上有无显著差异?采用双侧采用双侧t t检验检验:本例总体方差未知,又是小样本。本例总体方差未知,又是小样本。(1 1)提出无效假设与备择假设)提出无效假设与备择假设 ,即新老工艺没有差异。,即新老工艺没有差异。,新老工艺有差异。,新老工艺有差异。00:H0:AHxx*667.635005200 xSuxt151611 ndf自由度31612 均数标准误nSSx(4)查临界)查临界t值,作出统计
16、推断值,作出统计推断 由由 =15,查,查t值表值表,得得 t0.01(15)=2.947,因为,因为|t|t0.01,P t22.735 t0.01(10)0.01(10)3.1693.169,P P 0.01 0.01,故应否定,故应否定无效假设无效假设H H0 0,即两种罐头的即两种罐头的SOSO2 2含量有高度显著差异,该批罐头含量有高度显著差异,该批罐头质量不合格。质量不合格。醇沉淀法(醇沉淀法(x1x1)27.5227.5227.7827.7828.0328.0328.8828.8828.7528.7527.9427.94超滤法(超滤法(x2)x2)29.3229.3228.152
17、8.1528.0028.0028.5828.5829.0029.00(1 1)建立假设)建立假设21:AH210:H(2 2)确定显著水平)确定显著水平0.050.05(两尾概率)(两尾概率)(3 3)计算)计算 15.281x61.282x)11()1()1()()(221121222211nnnnxxxxSxx2121222221212111)1()1(nnnnnxxnxx332.02121xxSxxt381.13332.061.2815.28 91516)1()1(21)()(nndf(4 4)查临界)查临界t t值,作出统计推断值,作出统计推断 当当dfdf=9=9时,查临界值得:时,查临界值得:t t 0.050.05(9 9)=2.262=2.262,|t t|1.381 1.381 0.050.05,接受,接受 ,表明两,表明两种工艺的粗提物中茶多糖含量无显著差异。种工艺的粗提物中茶多糖含量无显著差异。210:H