1、第三章第三章 分析化学中的误差及数据处理分析化学中的误差及数据处理3.1 分析化学中的误差分析化学中的误差3.2 有效数字及其运算规则有效数字及其运算规则3.3 分析化学中的数据处理分析化学中的数据处理3.4 显著性检验显著性检验3.5 可疑值取舍可疑值取舍3.7 提高分析结果准确度的方法提高分析结果准确度的方法3.1 分析化学中的误差分析化学中的误差一、一、误差误差(Error)与准确度与准确度(Accuracy)%100TTirxxxE1.误差误差测定值测定值xi与真实值与真实值xT之间的差值之间的差值 误差的大小可用绝对误差绝对误差 E(Absolute Error)和相对相对误差误差
2、Er(Relative Error)表示。E=xi xT2.准确度准确度 (1)测定值与真值接近的程度测定值与真值接近的程度;(2)准确度高低常用误差大小表示准确度高低常用误差大小表示,误差小,准确度高。误差小,准确度高。例:用沉淀滴定法测纯例:用沉淀滴定法测纯NaCl中氯的百分含量为中氯的百分含量为60.53%。计算。计算E和和Er。解:纯解:纯NaCl中中Cl理论值为理论值为%2.0%100%66.60%13.0%100%13.0)%66.6053.60(%66.60%10099.2245.3545.35%100TrTTxEExxENaClClx 例:例:分析天平称量两物体的质量各为分析天
3、平称量两物体的质量各为1.6380 g 和和0.1637 g,假定两者的真实质量分别为假定两者的真实质量分别为1.6381 g 和和0.1638 g,绝对误差相等,相对误差并不一定相同。绝对误差相等,相对误差并不一定相同。%.%.00601006381100010%.%.0601001638000010则两者称量的绝对误差分别为:则两者称量的绝对误差分别为:(1.63801.6381)g=0.0001 g (0.16370.1638)g=0.0001 g两者称量的相对误差分别为:两者称量的相对误差分别为:3.讨论讨论(1)同样的绝对误差,被测定的量较大时,相对误差同样的绝对误差,被测定的量较大
4、时,相对误差就比较小就比较小,测定的准确度也就比较高测定的准确度也就比较高;(2)用相对误差来表示各种情况下测定结果的准确度用相对误差来表示各种情况下测定结果的准确度更为确切更为确切;(3)实际工作中,真值实际上是无法获得实际工作中,真值实际上是无法获得;常用纯物常用纯物质的理论值、标准样品值、或多次测定结果的平均质的理论值、标准样品值、或多次测定结果的平均值当作真值。值当作真值。二、二、偏差偏差(Deviation)与精密度与精密度(Precision)xxdii%100 xxxdir 1.偏差偏差个别测定结果个别测定结果 xi 与几次测定结果的平与几次测定结果的平均值的差。均值的差。绝对偏
5、差绝对偏差 di:测定结果与平均值之差;测定结果与平均值之差;相对偏差相对偏差 dr:绝对偏差在平均值中所占的百分率绝对偏差在平均值中所占的百分率或或 千分率。千分率。例:标定某一标准溶液的浓度,三次测定结果例:标定某一标准溶液的浓度,三次测定结果分别为:分别为:0.1827、0.1825、0.1828。求。求d和和dr。解:解:1827.031828.01825.01827.0 x0001.01827.01828.00002.01827.01825.001827.01827.0321ddd%06.0%1.00321rrrddd 各偏差值的绝对值的平均值,称为单次测定的平均各偏差值的绝对值的平
6、均值,称为单次测定的平均偏差,又称算术平均偏差(偏差,又称算术平均偏差(Average Deviation):):niniiixxndnd1111单次测定的相对平均偏差表示为单次测定的相对平均偏差表示为:%100 xddr例题例题例:两组数据 (1)X-X:0.11,-0.73,0.24,0.51,-0.14,0.00,0.30,-0.21 (2)X-X:0.18,0.26,-0.25,-0.37,0.32,-0.28,0.31,-0.27 n=8 d1=0.28 n=8 d2=0.28 2.标准偏差标准偏差(Standard Deviation)又称均方根偏差,当测定次数趋於无限多时,又称均
7、方根偏差,当测定次数趋於无限多时,称为称为总体标准偏差总体标准偏差,用,用表示如下:表示如下:nxni12)(为总体平均值,在校正了系统误差情况下,为总体平均值,在校正了系统误差情况下,即代表真值;即代表真值;n 为测定次数。为测定次数。s与平均值之比称为与平均值之比称为相对标准偏差相对标准偏差,以,以 sr(RSD)表示)表示:又称为又称为变异系数变异系数 CV(Coefficient of Variation)。xssr1000 112-)(nxxsnii(n-1)表示表示 n 个测定值中具有独立偏差的数目,又称为自由度。个测定值中具有独立偏差的数目,又称为自由度。有限次测定时,标准偏差称
8、为有限次测定时,标准偏差称为样本标准差样本标准差,以,以 s 表示:表示:3.精密度精密度(1)精密度:测定值之间相互接近的程度。精密度的大小)精密度:测定值之间相互接近的程度。精密度的大小常用偏差表示。常用偏差表示。(2)精密度的高低还常用重复性()精密度的高低还常用重复性(Repeatability)和再现性和再现性(Reproducibility)表示。表示。重复性重复性(r):同一操作者,在相同条件下,获得一系列结果同一操作者,在相同条件下,获得一系列结果之间的一致程度。之间的一致程度。再现性再现性(R):不同的操作者,在不同条件下,用相同方法获不同的操作者,在不同条件下,用相同方法获
9、得的单个结果之间的一致程度。得的单个结果之间的一致程度。(3)用标准偏差比用算术平均偏差更合理。)用标准偏差比用算术平均偏差更合理。对比:有两组测定值,判断精密度的差异。有两组测定值,判断精密度的差异。甲组甲组 2.9 2.9 3.0 3.1 3.1 乙组乙组 2.8 3.0 3.0 3.0 3.2计算:计算:平均值x平均偏差 d标准偏差 s甲组3.00.080.08乙组3.00.080.14平均偏差相同;标准偏差不同,两组数据的离散程度平均偏差相同;标准偏差不同,两组数据的离散程度不同;在一般情况下,以标准偏差或变异系数表示测不同;在一般情况下,以标准偏差或变异系数表示测定结果的精密度定结果
10、的精密度。例题例题用标准偏差比用平均偏差更科学更准确。例:两组数据 (1)X-X:0.11,-0.73,0.24,0.51,-0.14,0.00,0.30,-0.21 n=8 d1=0.28 s1=0.38 (2)X-X:0.18,0.26,-0.25,-0.37,0.32,-0.28,0.31,-0.27 n=8 d2=0.28 s2=0.29d1=d2,s1 s2三、三、准确度与精密度的关系准确度与精密度的关系精密度精密度 准确度准确度 好好 好好 好好 稍差稍差 差差 差差 很差很差 偶然性偶然性 结论:结论:精密度是保证准确度的先决条件;精密度是保证准确度的先决条件;精密度高不一定准确
11、度高;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。两者的差别主要是由于系统误差的存在。一个可靠的数据必须同时具备高精密度和高准确度一个可靠的数据必须同时具备高精密度和高准确度四、四、误差的分类及减免误差的方法误差的分类及减免误差的方法 系统误差或称可测误差系统误差或称可测误差(determinate error)偶然误差或称随机误差(偶然误差或称随机误差(random error)1.系统误差产生的原因、性质及减免系统误差产生的原因、性质及减免 由某些固定原因所造成的误差,使测定结由某些固定原因所造成的误差,使测定结果系统偏高或系统偏低。果系统偏高或系统偏低。(1)方法误差)方
12、法误差(Method Errors):如反应不完全;如反应不完全;干扰成分的影响;指示剂选择不当;干扰成分的影响;指示剂选择不当;(2)试剂或蒸馏水纯度不够;)试剂或蒸馏水纯度不够;(3)仪器误差:如容量器皿刻度不准又未经校)仪器误差:如容量器皿刻度不准又未经校正,电子仪器正,电子仪器“噪声噪声”过大等造成;过大等造成;(4)人为误差:如观察颜色偏深或偏浅,第二)人为误差:如观察颜色偏深或偏浅,第二次读数总是想与第一次重复等造成。次读数总是想与第一次重复等造成。产生的原因:产生的原因:系统误差的性质:系统误差的性质:(1)重复性:同一条件下,重复测定中,重复地出现;重复性:同一条件下,重复测定
13、中,重复地出现;(2)单向性:测定结果系统偏高或偏低;单向性:测定结果系统偏高或偏低;(3)可校正性:其大小可以测定,可对结果进行校正。可校正性:其大小可以测定,可对结果进行校正。系统误差的校正方法系统误差的校正方法:选择标准方法、提纯试剂和使用校正值等办法加选择标准方法、提纯试剂和使用校正值等办法加以消除。常采用对照试验和空白试验的方法。以消除。常采用对照试验和空白试验的方法。对照试验和空白试验:对照试验和空白试验:(1)对照试验:选择一种标准方法与所用方法作对比或选择)对照试验:选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验,找出校正值加以校正。与试样组成接近的标准试
14、样作试验,找出校正值加以校正。(2)空白试验:指除了不加试样外,其他试验步骤与试样试)空白试验:指除了不加试样外,其他试验步骤与试样试验步骤完全一样的实验,所得结果称为空白值。验步骤完全一样的实验,所得结果称为空白值。对试剂或实验用水是否带入被测成份,或所含杂质是否有对试剂或实验用水是否带入被测成份,或所含杂质是否有干扰可通过空白试验扣除空白值加以修正。干扰可通过空白试验扣除空白值加以修正。是否存在系统误差,常常通过回收试验加以检查。是否存在系统误差,常常通过回收试验加以检查。2.偶然误差产生的原因、性质及减免偶然误差产生的原因、性质及减免产生的原因:产生的原因:由一些无法控制的不确定因素引起
15、的。由一些无法控制的不确定因素引起的。(1)如环境温度、湿度、电压、污染情况等的变化引)如环境温度、湿度、电压、污染情况等的变化引起样品质量、组成、仪器性能等的微小变化;起样品质量、组成、仪器性能等的微小变化;(2)操作人员实验过程中操作上的微小差别;)操作人员实验过程中操作上的微小差别;性质:性质:时大时小,可正可负。时大时小,可正可负。减免方法:减免方法:无法消除。通过无法消除。通过增加平行测定次数增加平行测定次数降低降低;3.过失误差过失误差 由粗心大意引起由粗心大意引起,可以避免。可以避免。误差减免方法小结:误差减免方法小结:1.系统误差:必须消除系统误差:必须消除(1)方法误差方法误
16、差 采用标准方法,对比实验。采用标准方法,对比实验。(2)仪器误差仪器误差 校正仪器。校正仪器。(3)试剂误差试剂误差 作空白实验。作空白实验。2.偶然误差:偶然误差:不可避免,不可避免,服从统计规律。服从统计规律。尽量减小尽量减小 减小方法:增加平行测定次数。减小方法:增加平行测定次数。3.过失误差:完全避免过失误差:完全避免 避免方法:认真操作。避免方法:认真操作。五、五、公差公差 公差公差:生产部门对于分析结果允许误差的一种表示法 超差超差:分析结果超出允许的公差范围。需重做。公差的确定公差的确定:(1)组成较复杂的分析,允许公差范围宽一些;(2)一般工业分析,允许相对误差在百分之几到千
17、分之几;(3)而原子质量的测定,要求相对误差很小;(4)国家规定。钢中的硫含量分析的允许公差范围硫 的 质 量 分数(%)0.0200.0200.0500.0500.1000.1000.2000.200公 差(绝 对误差%)0.0020.0040.0060.0100.015 国家标准中,对含量与允许公差之关系常常用回归方程式国家标准中,对含量与允许公差之关系常常用回归方程式表示。表示。3.2 有效数字及其运算规则有效数字及其运算规则一、有效数字(significant figures)实际上能够测得到的数字实际上能够测得到的数字,只有最后一位是可疑的。,只有最后一位是可疑的。包括全部可靠数字及
18、一位不确定数字在内包括全部可靠数字及一位不确定数字在内 结果结果 绝对偏差绝对偏差 相对偏差相对偏差 有效数字位数有效数字位数 0.51800 0.00001 0.002%5 0.5180 0.0001 0.02%4 0.518 0.001 0.2%3 数据的位数与测定准确度有关。记录的数字不仅数据的位数与测定准确度有关。记录的数字不仅表示数量的大小,而且要正确地反映测量的精确程度表示数量的大小,而且要正确地反映测量的精确程度数据中零的作用数字零在数据中具有双重作用双重作用:(1)作普通数字用,如 0.5180 4位有效数字 5.18010-1 (2)作定位用:如 0.0518 3位有效数字
19、5.1810-2例例 1.0008 43.181 0.1000 10.98%0.05 2105 pH=0.07032不确定10.0384 1.98101054 0.00403600 100 lgK=7.55413有效数字的确定规则:有效数字的确定规则:(1)从前面数第一个非零数字起,后面)从前面数第一个非零数字起,后面的数字皆为有效数字;的数字皆为有效数字;(2)pH、pKa、pM的对数值,其有效数的对数值,其有效数字位数仅取决于小数部分数字的位数;字位数仅取决于小数部分数字的位数;(3)倍数和分数不是测量数据,不考虑)倍数和分数不是测量数据,不考虑有效数字位数。有效数字位数。m 台秤台秤(称
20、至称至0.1g):12.8g(3),0.5g(1),1.0g(2)分析天平分析天平(称至称至0.1mg):12.8218g(6),0.5024g(4),0.0500g(3)V 滴定管滴定管(量至量至0.01mL):26.32mL(4),3.97mL(3)容量瓶容量瓶:100.0mL(4),250.0mL(4)移液管移液管:25.00mL(4);量筒量筒(量至量至1mL或或0.1mL):26mL(2),4.0mL(2)读取滴定管读数:甲读取滴定管读数:甲23.43ml、乙乙23.42ml、丙丙23.44ml,前三位可准确读取,后一位估读,为可疑数字,但不前三位可准确读取,后一位估读,为可疑数字,
21、但不是臆造的,应该保留,四位皆为有效数字。是臆造的,应该保留,四位皆为有效数字。二、二、修约规则修约规则 四舍六入五成双规则四舍六入五成双规则四舍:四舍:3.148六入:六入:7.397五成双:五成双:75.5 0.014500 2.451 83.500001例:保留两位有效数字例:保留两位有效数字3.17.4760.0142.584 五成双是指被修约的那个数是五成双是指被修约的那个数是5,后面无,后面无任何数或后面的数皆为任何数或后面的数皆为“0”时有效,若后面时有效,若后面还有任何非还有任何非“0”数字时,总比数字时,总比5大,均应进大,均应进位。位。修约数字时只可一次修约到位,不能连修约
22、数字时只可一次修约到位,不能连续多次修约。续多次修约。2.34572.3(保留两位有效数字)(保留两位有效数字)()2.34572.3462.352.4(保留两位有效数(保留两位有效数字)(字)()三、三、有效数字的运算规则:有效数字的运算规则:(1)加减法)加减法:几个数据相加或相减时,它们的和或差的有效数字的保留,应以小数点后位数最小数点后位数最少少的数据为依据,即取决于绝对误差最大的那个数据。例:0.0121 绝对误差:0.0001 25.64 0.01 1.05782 0.0000126.7099226.710.0121+25.64+1.05782=26.70992=26.71(2)乘
23、除法)乘除法:几个数据的乘除运算中,所得结果的有效数字的位数应以有效数字位数最少有效数字位数最少的数据为依据,即取决于相对误差最大的那个数。例:例:(0.0325 5.103 60.0)/139.8=0.0325 0.0001/0.0325 100%=0.3%5.103 0.001/5.103 100%=0.02%60.06 0.01/60.06 100%=0.02%139.8 0.1/139.8 100%=0.07%0.071179184注意注意:在乘除法运算中,常会遇到8以上的大数,如:8.82,0.08345,0.921,在计算时应多算一位。10002460.12154.163)00.2
24、300.25(01000.0=0.00131(3)混合运算)混合运算:10000045.12.186)51.1575.20(2110005002.22.186)51.1575.23(210.4860.30693.3 分析化学中的数据处理分析化学中的数据处理总体总体样本样本数据数据抽样抽样观测观测统计处理统计处理总体(母体):所考察对象的某特性值的全体总体(母体):所考察对象的某特性值的全体样本:自总体中随机抽取的一组测量值样本:自总体中随机抽取的一组测量值样本容量:样本中所含测量值的数目样本容量:样本中所含测量值的数目 例如:分析某矿石中的铁含量,经取样、例如:分析某矿石中的铁含量,经取样、细
25、碎、缩分后,得到一定数量(如细碎、缩分后,得到一定数量(如500g)的试样,这的试样,这500g样品是供分析用的样品是供分析用的总体总体,如果从样品中取出如果从样品中取出8份试样进行平行分析,份试样进行平行分析,得到得到8个分析结果,则这一组分析结果就是个分析结果,则这一组分析结果就是样品的一个样品的一个随机样本,样本容量随机样本,样本容量为为8。一、一、数据的集中趋势数据的集中趋势11:niixxn 1 1.样样本本平平均均值值2.总体平均值:总体平均值:niinxn11lim(注:若,没有系统误差,则(注:若,没有系统误差,则 )Tx平均偏差:平均偏差:总体平均偏差:总体平均偏差:)20(
26、nnxxd)20(nnx2()1ixxns 样样本本标标准准差差:2()ixn 总总体体标标准准差差:(-1)nf为自由度,用表示为自由度,用表示相对标准差相对标准差(RSD,又称变异系数又称变异系数)CV=(s/)100%x1、频数分布 在相同条件下对某矿石样品中铜含量进行测定,共得到在相同条件下对某矿石样品中铜含量进行测定,共得到100个个测定值如下:测定值如下:1.36 1.49 1.43 1.41 1.37 1.40 1.32 1.42 1.47 1.39 1.41 1.36 1.40 1.34 1.42 1.42 1.45 1.35 1.42 1.39 1.44 1.42 1.39
27、1.42 1.42 1.30 1.34 1.42 1.37 1.36 1.37 1.34 1.37 1.46 1.44 1.45 1.32 1.48 1.40 1.45 1.39 1.46 1.39 1.53 1.36 1.48 1.40 1.39 1.38 1.40 1.46 1.45 1.50 1.43 1.45 1.43 1.41 1.48 1.39 1.45 1.37 1.46 1.39 1.45 1.31 1.41 1.44 1.44 1.42 1.47 1.35 1.36 1.39 1.40 1.38 1.35 1.42 1.43 1.42 1.42 1.42 1.40 1.41
28、1.37 1.46 1.36 1.37 1.27 1.47 1.38 1.42 1.34 1.43 1.41 1.41 1.41 1.44 1.48 1.55 1.37一、偶然误差的正态分布高斯分布曲线 观察这100个数据,看出:分析结果高高低低,参差不齐测量数据分散性;仔细观察,中间数据多,两头少测量数据的集中趋势。把100个数据按最大最小的差值,平均分成10等份(区间),计算每一个区间内测量值出现的次数及占总次数的比率频数:频数:是指每一范围内测量值出现的次数相对频数相对频数:指频数在测定总次数n中占的比率 分组(分组(%)频数频数 相对频数(频率)相对频数(频率)1.2651.295 1
29、 0.01 1.2951.325 4 0.04 1.3251.355 7 0.07 1.3551.385 17 0.17 1.3851.415 24 0.24 1.4151.445 24 0.24 1.4451.475 15 0.15 1.4751.505 6 0.06 1.5051.535 1 0.01 1.5351.565 1 0.01 90 1.00 相对频数分布直方图 正态分布曲线左图是相对频数分布直方图;当测量数据再增多,组(区间)划分再细,直方图形式逐渐趋于 一条直线,即正态分布曲线,它表示出了来自同一总体的无限多次测定的各种可能结果(或随机误差)的分布 横横坐标:测定值坐标:测定
30、值x或或x-;纵纵坐标:测定值的概率密度坐标:测定值的概率密度 特点特点:1.极大值在极大值在 x=处处.2.拐点在拐点在 x=处处.3.于于x=对称对称.4.4.x 轴为渐近线轴为渐近线.y:概率密度概率密度 x:测量值测量值 :总体平均值总体平均值x-:随机误差随机误差 :总体标准差总体标准差22()21()2xyfxe 2、正态分布高斯分布曲线 正态分布曲线规律:正态分布曲线规律:x=时,时,y值最大,体现了测量值的集中趋势。值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集平均值是最可
31、信赖值,能很好反映测量值的集中趋势。中趋势。反映测量值分布集中趋势。反映测量值分布集中趋势。曲线以曲线以x=这一直线为其对称轴,说明正误差这一直线为其对称轴,说明正误差和负误差出现的概率相等。和负误差出现的概率相等。当当x趋于趋于或或时,曲线以轴为渐近线。时,曲线以轴为渐近线。即小误差出现概率大,大误差出现概率小,出即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。现很大误差概率极小,趋于零。越大,测量值落在越大,测量值落在附近的概率越小。即精密附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,曲线也就
32、越平坦。反之,越小,测量值的分越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。散程度就越小,正态分布曲线也就越尖锐。反映测量值分布分散程度反映测量值分布分散程度。y12210两组精密度不同的测量值的正态分布曲线正态分布曲线仅依赖于正态分布曲线仅依赖于 和和两个基本参数。两个基本参数。其中,其中,表示数表示数据的分散程度。据的分散程度。小,小,曲线瘦高曲线瘦高大,大,曲线矮胖曲线矮胖同一总体,精密度不同同一总体,精密度不同 正态分布曲线正态分布曲线 N(,2)表示表示 曲线的形状取决于曲线的形状取决于 ,2;,2确定了,确定了,N(,2)也就定了。也就定了。不论怎样,不论怎样,与与 不同,
33、图形就不同。应用不同,图形就不同。应用起来起来 不方便。解决方法:坐标变换。不方便。解决方法:坐标变换。标准正态分布曲线标准正态分布曲线221()2uf xuxue 横坐标改用 表示横坐标改用 表示221:()2uyue 即即22()21()2xyf xe 00.10.20.30.4-4-3-2-10123468.3%95.5%99.7%u -3 -2 -0 2 3 x-3 -2 -+2 +3 x y标准正态分布曲线标准正态分布曲线 N(0,1)标准正态分布曲线标准正态分布曲线N(0,1)就是以就是以 为原点,为原点,u为单位的曲线,为单位的曲线,它对于不同的它对于不同的 和和 的任何测量值都
34、是通用的的任何测量值都是通用的(上图上图)。曲线下面积曲线下面积2201 1,0.3412uduueuss 当当时时|u|s2s0.6740.25001.0000.34130.6831.6450.45001.9600.47500.9502.0000.47732.5760.49870.9903.0000.49870.9970.5001.000正态分布概率积分表正态分布概率积分表y随机误差随机误差u出现的区间出现的区间(以以 为单位为单位)测量值出现的区间测量值出现的区间概概 率率 p(-1,+1)(-1,+1)68.3%(-1.96,+1.96)(-1.96,+1.96)95.0%(-2,+2)
35、(-2,+2)95.5%(-2.58,+2.58)(-2.58,+2.58)99.0%(-3,+3)(-3,+3)99.7%随机误差的区间概率随机误差的区间概率 P57表表例例 已知已知=1.75%,=0.10%,测量时无系统误差,测量时无系统误差,求求:(1)结果落在(结果落在(1.75 0.15)%范围内的概率?范围内的概率?(2)结果大于结果大于2.00%的概率?的概率?解:解:%62.04938.05000.0%00.24938.05.2%10.0%25.0%10.0%75.1%00.22%6.8643.025.1%10.0%15.0%10.0%75.11PPxuPxxu时:结果大于查
36、表得:)(查表得:)(单边检验 1 5 10 15 20 ns平平 的相对值(的相对值(s平平/s)0.00.20.40.60.81.0 221iixxnxns 当当n,s 1.平均值的标准差平均值的标准差n为一组测定的样本数为一组测定的样本数xxssnn 二、少量数据的统计处理二、少量数据的统计处理 平均值的精密度会随着测定次平均值的精密度会随着测定次数的增加而提高数的增加而提高 正态分布是无限次测量数据的随机误差的分布正态分布是无限次测量数据的随机误差的分布规律,而在实际工作中,由于测定次数有限,所以规律,而在实际工作中,由于测定次数有限,所以只知道样本平均值只知道样本平均值 和样本的标准
37、偏差和样本的标准偏差 s,而不知道而不知道总体平均值总体平均值 和总体标准偏差和总体标准偏差。只能用样本的标只能用样本的标准偏差准偏差s来估计测量数据的分散情况。来估计测量数据的分散情况。用用s代替代替,必然引起分布曲线变得平坦,从而,必然引起分布曲线变得平坦,从而引起误差。必须引用一个新因子引起误差。必须引用一个新因子t(置信因子)(置信因子)xsxtt t 分布曲线分布曲线f=n-1 f=f=10 f=2 f=1-3-2-10123ty(概率密度概率密度)xxxtnss随随f而改变而改变小结小结:xsxtxu t分布分布 正态分布正态分布有限次测量有限次测量 n20只知只知s 知道知道曲线
38、随曲线随f改变改变 曲线只有一条曲线只有一条概率与概率与t、f有关有关 概率仅与概率仅与u有关有关自由度自由度f degree of freedom (f=n-1)t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随分布曲线随自由度自由度f而改变。当而改变。当f趋近趋近时,时,t分布就趋近正态分布分布就趋近正态分布。置信度置信度Pconfidence degree 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围内的概率。范围内的概率。显著性水准显著性水准confidence level在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围以外的概率
39、范围以外的概率(lP)ta,f:t值与置信值与置信度度P及自由度及自由度f关系。关系。例:例:t005,10表示置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。t001,5表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。平均值的置信区间平均值的置信区间(confidence interval)当当n趋近趋近时:时:单次测量结果单次测量结果以样本平均值来估计总体以样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间:对于少量测量数据,即对于少量测量数据,即当当 n有限时,必须根据有限时,必须根据t分布进行统计处理:分布进行统计处理:它表示在一定
40、置信度下,它表示在一定置信度下,以平均值为中心,包括以平均值为中心,包括总体平均值总体平均值的范围。这的范围。这就叫就叫平均值的置信区间平均值的置信区间。uxnuxntsxtsxx 在实际工作中,当在实际工作中,当测定数据有限时,测定数据有限时,样本样本平均值的置信区间平均值的置信区间为:为:nStxfP,上式表明:上式表明:当测定值的误差呈当测定值的误差呈 t 分布时,在分布时,在一定置信度下,真值所在的置信区间。一定置信度下,真值所在的置信区间。若将置信度固定,当若将置信度固定,当测定的精密度越高和测定测定的精密度越高和测定次数越多时,置信区间越小,次数越多时,置信区间越小,表明表明x 或
41、或 越接越接近真值,即近真值,即测定的准确度越高。测定的准确度越高。xt 分布值表分布值表 t(f)f显显 著著 水水 平平 0.50 *0.10 *0.050.0111.006.3112.7163.6620.822.924.309.9330.772.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.36200.691.732.092.850.671.641.962.58 例:例:测定结果测定结果47.64%、47.69%、47.52%、47.55%,计算置信
42、度为,计算置信度为90%、95%、99%时总时总体平均值体平均值 的置信区间?的置信区间?解:解:)%23.060.47(84.5)%13.060.47(18.3)%09.060.47(35.231%08.0%60.473,01.03,05.0,3,10.0,ttnstxtnfsxfa为什么要对数据进行处理?为什么要对数据进行处理?个别偏离较大的数据(称为离群值或极值)是保留还是该个别偏离较大的数据(称为离群值或极值)是保留还是该弃去?弃去?测得的平均值与真值(或标准值)的差异,是否合理?测得的平均值与真值(或标准值)的差异,是否合理?相同方法测得的两组数据或用两种不同方法对同一试样测相同方法
43、测得的两组数据或用两种不同方法对同一试样测得的两组数据间的差异是否在允许的范围内?得的两组数据间的差异是否在允许的范围内?数据进行处理包括哪些方面?数据进行处理包括哪些方面?可疑数据的取舍可疑数据的取舍过失误差的判断过失误差的判断 分析方法的准确度(可靠性)分析方法的准确度(可靠性)系统误差的判断系统误差的判断3.4 显著性检验显著性检验 nsxt计存在存在“显著性差异显著性差异”指有明显的指有明显的系统误差系统误差检验方法有检验方法有t 检验法和检验法和F 检验法检验法1、t 检验法检验法平均值与标准值的比较平均值与标准值的比较如果t计t表,则存在显著性差异,若若 t计算计算 t表,不存在显
44、著性差异(表,不存在显著性差异(P=95%)(偶)(偶然误差引起的)然误差引起的)ntsxtsxx 例:例:用新方法分析结果:用新方法分析结果:10.74%、10.77%、10.77%、10.77%、10.81%、10.82%、10.73%、10.86%、10.81%,已知,已知=10.77%,试问采用新方法,是否引,试问采用新方法,是否引起系统误差?起系统误差?解:解:起系统误差无显著性差异,即没引,表计计表ttnsxtsxtafn43.19%042.0%77.10%79.10%042.0%79.1031.205.0892.两个平均值的比较相同试样、两种分析方法所得平均值的比较(缺标准值时)
45、相同试样、两种分析方法所得平均值的比较(缺标准值时)系统误差的判断 对两个分析人员测定相同试样所得结果进行评价;对两个分析人员测定相同试样所得结果进行评价;对两个单位测定相同试样所得结果进行评价;对两个单位测定相同试样所得结果进行评价;对两种方法进行比较,即是否有系统误差存在;对两种方法进行比较,即是否有系统误差存在;判断方法:判断方法:t 检验法;检验法;F 检验法检验法前提:前提:两个平均值的精密度没有大的差别。两个平均值的精密度没有大的差别。F 检验法检验法也称方差比检验方差比检验:22小小大大SSF 若 F计算 F表,被检验的分析方法存在较大的系统误差。212121nnnnSxxt合合
46、t 检验式检验式:n1 s1 n2 s2 1x2x21ss 2121212122212121222211)1()1()1()1()1()1()()nnnnsxxtnnnsnssnnxxxxssii计或,(总自由度偏差平方和:合并标准偏差P一定时,查t值表(f=n1+n2-2)若t计t表,则两组平均值存在显著性差异,否则不存在t 检验法两组平均值的比较两组平均值的比较表 3-4 置信度95%时 F 值fs 大fs 小2345678910234567891019.009.556.945.795.144.744.464.264.103.0019.169.286.595.414.764.354.073
47、.863.712.6019.259.126.395.194.534.123.843.633.482.3719.309.016.265.054.393.973.693.483.332.2119.338.946.164.954.283.873.583.373.222.1019.368.886.094.884.213.793.503.293.142.0119.378.846.044.824.153.733.443.233.071.9419.388.816.004.774.103.683.393.183.021.8819.398.785.964.744.063.633.343.132.971.8319
48、.508.535.634.363.673.232.932.712.541.00fs大:方差大的数据的自由度;fs小:方差小的数据的自由度。(f=n-1)比较两组数据的方差比较两组数据的方差s2 计算计算F值与表中值与表中F值(单边值)比较,值(单边值)比较,F计计F表表,则存在显著性差异。则存在显著性差异。F值大,存在显著性差异,值大,存在显著性差异,F值趋近于值趋近于1,则,则两组数据精密度两组数据精密度相差不大。相差不大。表中表中F值用于单侧检验,即检验某组数据的精值用于单侧检验,即检验某组数据的精密度是否大于或等于另一组数据的精密度时,密度是否大于或等于另一组数据的精密度时,置信度为置信
49、度为95%(a=0.05)。)。而用于判断两组数而用于判断两组数据的精密度是否有显著性差异,即一组数据的据的精密度是否有显著性差异,即一组数据的精密度可能精密度可能、=、T 表,弃去可疑值,反之保留。xsxxTsxxTn或1该法准确度较好,但要计算 及s,手续较烦x 例:上例中的数据用例:上例中的数据用Grubbs法判断,法判断,1.40这个这个数据是否保留(数据是否保留(P=95%)解:解:这个数据应保留查表得:,40.146.136.1066.031.140.1066.031.1,4,05.0,nananTTTTsxxTsx与上例结论不同,该与上例结论不同,该法可靠性较高法可靠性较高3.Q
50、 值检验法(1)数据排列 x1 x2 xn(2)求极差 xn x1(3)求可疑数据与相邻差:xn xn-1 或 x2 x1(4)计算:11211xxxxQxxxxQnnnn或(5 5)根据测定次数和要求的置信度,(如90%)查表3-6:(6 6)将 Q 与 Qx(如 Q90)相比,若 Q Qx 舍弃该数据,(过失误差造成)若 Q Qx 保留该数据,(偶然误差所致)例例 例例10中的数据用中的数据用Q检验法判断,检验法判断,1.40这个数这个数据是否保留(据是否保留(P=90%)解:解:这个数据应保留,查表得:表表40.176.0460.025.140.131.140.1QQQnQ结论同前例结论