1、 日常分析中测定次数是很有限的,总体平均值日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,自然不为人所知。但是随机误差的分布规律表明,测定值总是在以测定值总是在以为中心的一定范围内波动,并有为中心的一定范围内波动,并有着向着向集中的趋势。因此,如何根据有限的测定结集中的趋势。因此,如何根据有限的测定结果来估计果来估计可能存在的范围(称之为置信区间)是可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与有实际意义的。该范围愈小,说明测定值与愈接愈接近,即测定的准确度愈高。但由于测定次数毕竟较近,即测定的准确度愈高。但由于测定次数毕竟较少,由
2、此计算出的置信区间也不可能以百分之百的少,由此计算出的置信区间也不可能以百分之百的把握将把握将包含在内,只能以一定的概率进行判断。包含在内,只能以一定的概率进行判断。对于经常进行测定的某种试样,由于已经积累对于经常进行测定的某种试样,由于已经积累了大量的测定数据,可以认为了大量的测定数据,可以认为是已知的。根据是已知的。根据(3-14)式并考虑)式并考虑u的符号可得:的符号可得:(3-14a)由随机误差的区间概率可知,测定值出现的概由随机误差的区间概率可知,测定值出现的概率由率由u决定。例如,当决定。例如,当u=1.96时。时。x在在-1.96至至+1.96区间出现的概率为区间出现的概率为0.
3、95。如果希望用单次测。如果希望用单次测定值定值x来估计来估计可能存在的范围,则可以认为区间可能存在的范围,则可以认为区间x1.96能以能以0.95的概率将真值包含在内。即有的概率将真值包含在内。即有(3-14b)uxux 由于平均值较单次测定值的精密度更高,因此由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有常用样本平均值来估计真值所在的范围。此时有 式(式(3-14b)和式(和式(3-17)分别表示在一)分别表示在一定的置信度时,以单次测定值定的置信度时,以单次测定值x或以平均值为中心或以平均值为中心的包含真值的取值范围,即的包含真值的取值范围,即的置信区
4、间。在置信的置信区间。在置信区间内包含区间内包含的概率称为置信度,它表明了人们对的概率称为置信度,它表明了人们对所作的判断有把握的程度,用所作的判断有把握的程度,用P表示。表示。u值可由表值可由表3-1中查到,它与一定的置信度相对应。中查到,它与一定的置信度相对应。(3-17)nuxuxx 在对真值进行区间估计时,置信度的高低要定在对真值进行区间估计时,置信度的高低要定得恰当。一般以得恰当。一般以95%或或90%的把握即可。的把握即可。式(式(3-14b)和式(和式(3-17)还可以看出置信区间)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对的大小取决于测定的精密度和对置信度的
5、选择,对于平均值来说还与测定的次数有关。当于平均值来说还与测定的次数有关。当一定时,一定时,置信度定得愈大,置信度定得愈大,u 值愈大,过大的置信区间值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表精密度越高和测定次数越多时,置信区间越小,表明明x或或越接近真值,即测定的准确度越高。越接近真值,即测定的准确度越高。例题例题1:x 是确定且客观存在的,它没有随机性。是确定且客观存在的,它没有随机性。而区间而区间xu或或 是具有随机性的,即它们是具有随机性的,即它们均与一定的置信度相联系。因此
6、我们只能说置信区间均与一定的置信度相联系。因此我们只能说置信区间包含真值的概率是包含真值的概率是0.95,而不能认为真值落在上述,而不能认为真值落在上述区间的概率是区间的概率是0.95。在实际工作中,通过有限次的测定是无法得知在实际工作中,通过有限次的测定是无法得知和和的,只能求出的,只能求出 和和S。而且当测定次数较少时,而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用数据的统计处理带来了困难。此时若用S代替代替从而从而对对作出估计必然会引起偏离,而且测定次数越少,作出估计必然会引起偏离,而且
7、测定次数越少,偏离就越大。如果采用另一新统计量偏离就越大。如果采用另一新统计量tP,f取代取代u(仅与仅与P有关有关),上述偏离即可得到修正。,上述偏离即可得到修正。x x xxxux t分布法:分布法:t值的定义:值的定义:(3-18)t分布是有限测定数据及其随机误差的分布规分布是有限测定数据及其随机误差的分布规律。律。t分布曲线见图分布曲线见图3-6,其中纵坐标仍然表示概率,其中纵坐标仍然表示概率密度值,横坐标则用统计量密度值,横坐标则用统计量t值来表示。显然,在值来表示。显然,在置信度相同时,置信度相同时,t分布曲线的形状随分布曲线的形状随f(f=n-1)而变而变化,反映了化,反映了t分
8、布与测定次数有关有实质。由图分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,可知,随着测定次数增多,t分布曲线愈来愈陡峭,分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当测定值的集中趋势亦更加明显。当f时,时,t分布分布曲线就与正态分布曲线合为一体,因此可以认为正曲线就与正态分布曲线合为一体,因此可以认为正态分布就是态分布就是t的极限。的极限。sxtfP,与正态分布曲线一样,与正态分布曲线一样,t分布分布曲线下面某区间的面积也表示随机曲线下面某区间的面积也表示随机误差在此区间的概率。但误差在此区间的概率。但t值与标值与标准正态分布中的准正态分布中的u值不同,它不仅值不同,它不仅与
9、概率还与测定次数有关。不同置与概率还与测定次数有关。不同置信度和自由度所对应的信度和自由度所对应的t值见表值见表3-2中。中。t值值P90%95%99%99.5%f(n-1)16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01
10、)601.672.002.66(2.87)1201.661.982.622.811.641.962.582.81 由表由表3-2中的数据可知,随着自由度的增加,中的数据可知,随着自由度的增加,t值逐渐减小并与值逐渐减小并与u值接近。当值接近。当f=20时,时,t与与u已经比已经比较接近。当较接近。当f时,时,tu,S。在引用在引用t值时,值时,一般取一般取0.95置信度。置信度。根据样本的单次测定值根据样本的单次测定值x或平均值分别表示或平均值分别表示的置信区间时,根据的置信区间时,根据t分布则可以得出以下的关系:分布则可以得出以下的关系:(3-18a)或或(3-19)stxfP,nstxst
11、xfPxfP,式(式(3-18a)和式(和式(3-19)的意义在于,真值)的意义在于,真值虽然不为所知(虽然不为所知(也未知),但可以期望由有限的也未知),但可以期望由有限的测定值计算出一个范围,它将以一定的置信度将真测定值计算出一个范围,它将以一定的置信度将真值包含在内。该范围越小,测定的准确度越高。值包含在内。该范围越小,测定的准确度越高。例例题题2:式(:式(3-19)是计算置信区间通常使用的关系)是计算置信区间通常使用的关系式。由该式可知,当式。由该式可知,当P一定时,置信区间的大小与一定时,置信区间的大小与tP,f、S、n均有关,而且均有关,而且tP,f与与S实际也都受实际也都受n的
12、影响,的影响,即即n值越大,置信区间越小。值越大,置信区间越小。例例3:平行测定的数据中,有时会出现一二个与其结平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值。对于果相关较大的测定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的取舍往往对平均值为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。和精密度造成相当显著的影响。对可疑值的取舍实质是区分可疑值与其它测定对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失,则无论此数据是否
13、如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判必须按照一定的统计方法进行检验,然后再作出判断。根据随机误差分布规律,在为数不多的测定值断。根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。否则就予以保留。将测定值由小至大按顺序排列,其中可疑值为将测定值由小至大按顺序排列,其中可疑值为x1
14、或或xn。求出可疑值与其最邻近值之差求出可疑值与其最邻近值之差xn-xn-1或或x2-x1,然然后用它除以极差后用它除以极差xn-x1,计算出统计量计算出统计量Q:或或(3-20)Q值越大,说明离群越远,远至一定程度时则应将值越大,说明离群越远,远至一定程度时则应将其舍去。故其舍去。故Q称为舍弃商。称为舍弃商。根据测定次数根据测定次数n和所要求的置信度和所要求的置信度P查查QP,n值表值表3-3。若。若QQP,n,则以一定的置信度弃去可疑值,反之则以一定的置信度弃去可疑值,反之则保留,分析化学中通常取则保留,分析化学中通常取0.90的置信度。的置信度。11xxxxQnnn112xxxxQn n
15、P345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49如果测定数据较少,测定的精密度也不高,因如果测定数据较少,测定的精密度也不高,因Q与与QP,n值接近而对可疑值的取舍难以判断时,最值接近而对可疑值的取舍难以判断时,最好补测好补测1-2次再进行检验就更有把握。次再进行检验就更有把握。如果没有条件再做测定,则宜用中位数代替平如果没有条件再做测定,则宜用中位数代替平均值报告结果。因是否取舍可疑值对平均值的影响均值报告结果。因是否取舍可疑值对平均值的影响较大,对中位值的影响较小。较大,对
16、中位值的影响较小。将测定值由小至大按顺序排列,其中可疑值为将测定值由小至大按顺序排列,其中可疑值为x1或或xn。先计算该组数据的平均值和标准偏差,再先计算该组数据的平均值和标准偏差,再计算统计量计算统计量G。若若x1可疑,可疑,(3-21)若若xn可疑,可疑,(3-21a)sxxG1sxxGn 根据事先确定的置信度和测定次数查表根据事先确定的置信度和测定次数查表3-4。若。若GGP,n,说明可疑值对相对平均值的说明可疑值对相对平均值的偏离较大,则以一定的置信度弃去可疑值,偏离较大,则以一定的置信度弃去可疑值,反之则保留。反之则保留。在运用格鲁布斯法判断可疑值的取舍时在运用格鲁布斯法判断可疑值的
17、取舍时,由于引入了,由于引入了t分布中最基本的两个参数己分布中最基本的两个参数己和和s,故该方法的准确度较故该方法的准确度较Q法高,因此得到法高,因此得到普遍采用。普遍采用。x 表表3-4GP,n值表值表测定次数测定次数置信度(置信度(P)测定次数测定次数置信度(置信度(P)n9599n959931.151.15122.292.5541.461.49132.332.6151.671.75142.372.6661.821.94152.412.7171.942.10162.442.7582.032.22172.472.7992.112.32182.502.82102.182.41192.532.8
18、5112.232.48202.562.88 用统计的方法检验测定值之间是否存在显著用统计的方法检验测定值之间是否存在显著性差异,以此推断它们之间是否存在系统误差,性差异,以此推断它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。定量分析中常用的有程称为显著性检验。定量分析中常用的有t检验法检验法和和F检验法。检验法。()t检验法用来检验样本平均值或两组数据的平检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异,从而对分析方法均值之间是否存在显著性差异,从而对分析方法的准确度作出评价。的准确度作出评价。当
19、检验一种分析方法的准确度时,采用该方法当检验一种分析方法的准确度时,采用该方法对某标准试样进行数次测定,再将样本平均值与标对某标准试样进行数次测定,再将样本平均值与标准值准值T进行比较。则置信区间的定义可知,经过进行比较。则置信区间的定义可知,经过n次次测定后,如果以平均值为中心的某区间已经按指定测定后,如果以平均值为中心的某区间已经按指定的置信度将真值的置信度将真值T包含在内,那么它们之间就不存包含在内,那么它们之间就不存在显著性差异,根据在显著性差异,根据t分布,这种差异是仅由随机分布,这种差异是仅由随机误差引起的。误差引起的。t可由下式计算:可由下式计算:(3-22a)若若ttP,f,说
20、明与说明与T之差已超出随机误差的界限,之差已超出随机误差的界限,就可以按照相应的置信度判断它们之间存在显著性就可以按照相应的置信度判断它们之间存在显著性差异。差异。xsTxt 进行显著性检验时,如置信度定得过低,则容进行显著性检验时,如置信度定得过低,则容易将随机误差引起的差异判断为显著性差异,如置易将随机误差引起的差异判断为显著性差异,如置信度定得过高,又可能将系统误差引起的不一致认信度定得过高,又可能将系统误差引起的不一致认同为正常差异,从而得出不合理的结论。在定量分同为正常差异,从而得出不合理的结论。在定量分析中,常采用析中,常采用0.95或或0.90的置信度。的置信度。在显著性检验中,
21、将具有显著性差异的测定值在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平,用在随机误差分布中出现的概率称为显著性水平,用表示,即这些测定值位于一定置信度所对应的随机表示,即这些测定值位于一定置信度所对应的随机误差界限之外。如置信度误差界限之外。如置信度P=0.95,则显著水平则显著水平=0.05,即即=1-P。例例1、用标准方法平行测定钢样中磷的质量分数、用标准方法平行测定钢样中磷的质量分数4次,其平均值为次,其平均值为0.087%。设系统误差已经消除,且。设系统误差已经消除,且=0.002%。(。(1)计算平均值的标准偏差;(计算平均值的标准偏差;(2)求)求
22、该钢样中磷含量的置信区间。置信度为该钢样中磷含量的置信区间。置信度为P=0.95。解解:(:(1)(2)已知)已知P=0.95时,时,u=1.96。根据根据%001.04%002.0nx%002.0%087.0%001.096.1%087.0 xux 例例2、标定、标定HCl溶液的浓度时,先标定溶液的浓度时,先标定3次,结果次,结果为为0.2001mol/L、0.2005mol/L和和0.2009mol/L;后来又后来又标定标定2次,数据为次,数据为0.2004mol/L和和0.2006mol/L。试分试分别计算别计算3次和次和5次标定结果计算总体平均值次标定结果计算总体平均值的的置信区置信区
23、间,间,P=0.95。解:标定解:标定3次时,次时,标定标定5次时,次时,故查表,30.4,/0004.0,/2005.02,95.0tLmolsLmolx0010.02005.030004.030.42005.0,nstxfP故查表,78.2,/0003.0,/2005.04,95.0tLmolsLmolx0004.02005.050003.078.22005.0,nstxfP 例例3、测定某试样中、测定某试样中SiO2质量分数得质量分数得s=0.05%。若测定的精密度保持不变,当若测定的精密度保持不变,当P=0.95时,欲使置信区时,欲使置信区间的置信限间的置信限,问至少应对试样平行测定,问至少应对试样平行测定多少次?多少次?解:根据式(解:根据式(3-19)和题设得:)和题设得:已知已知s=0.05%,故:故:查表查表3-2得知,当得知,当f=n-1=5时,时,t0.95,5=2.57,此时此时。即至少应平行测定。即至少应平行测定6次,才能满足次,才能满足题中的要求。题中的要求。%05.0,xfPt%05.0,nstxfP105.005.0nt16/57.2