1、第第3章章 分析化学中的误差及数据处理分析化学中的误差及数据处理3.1 分析化学中的误差分析化学中的误差3.2 有效数字及其运算规则有效数字及其运算规则3.3 分析化学中的数据处理分析化学中的数据处理3.4 显著性检验显著性检验3.5 可疑值取舍可疑值取舍3.6 回归分析法回归分析法3.7 提高分析结果准确度的方法提高分析结果准确度的方法1 准确度和精密度准确度和精密度绝对误差绝对误差:测量值与真值间的差值测量值与真值间的差值,用用 E表示表示E=x-xT3.1 分析化学中的误差分析化学中的误差准确度准确度:测定结果与真值接近的程度,用误差衡量。测定结果与真值接近的程度,用误差衡量。误差误差相
2、对误差相对误差:绝对误差占真值的百分比绝对误差占真值的百分比,用用Er表示表示Er=E/xT=x-xT/xT100真值(真值(xT):某一物理量本身具有的客观存在的):某一物理量本身具有的客观存在的真实数值。但绝对真值不可测真实数值。但绝对真值不可测理论真值:化合物的理论组成理论真值:化合物的理论组成约定真值:公认的量、单位约定真值:公认的量、单位相对真值:采用可靠的分析方法、精密仪器,相对真值:采用可靠的分析方法、精密仪器,平行分析得到的结果平行分析得到的结果偏差偏差:测量值与平均值的差值,用测量值与平均值的差值,用 d表示表示d=x-x精密度精密度:平行测定结果相互靠近的程度,用偏差衡量。
3、平行测定结果相互靠近的程度,用偏差衡量。di=0中位值中位值:将数据由小到大排列,奇数个测量值,取中将数据由小到大排列,奇数个测量值,取中间值;偶数个测量值,取中间相邻的的平均值间值;偶数个测量值,取中间相邻的的平均值全距(极差)全距(极差):测量数据中最大值与最小值的差值测量数据中最大值与最小值的差值平均偏差:平均偏差:各单个偏差绝对值的平各单个偏差绝对值的平均值 nxxdnii1相对平均偏差:相对平均偏差:平均偏差与测量平均值的比值平均偏差与测量平均值的比值%100%100%1xnxxxdnii相对平均偏差标准偏差:标准偏差:s 相对标准偏差:相对标准偏差:RSD112nxxsnii%10
4、0 xsRSD标准偏差通过平方运算,能将较大的偏差更显著地标准偏差通过平方运算,能将较大的偏差更显著地表现出来,能更好地反映测定值的精密度表现出来,能更好地反映测定值的精密度1x2x3x4x准确度与精密度的关系准确度与精密度的关系1x2x3x4x准确度与精密度的关系准确度与精密度的关系1.精密度好是准确度好的前提精密度好是准确度好的前提;2.精密度好不一定准确度高精密度好不一定准确度高系统误差系统误差!准确度及精密度都高准确度及精密度都高结果可靠结果可靠甲的准确度和精密度都好,结果可靠。乙的精甲的准确度和精密度都好,结果可靠。乙的精密度高,但是准确度低。丙的精密度和准确度密度高,但是准确度低。
5、丙的精密度和准确度都低。丁的精密度低,谈不上准确都低。丁的精密度低,谈不上准确2 系统误差与随机误差系统误差与随机误差系统误差系统误差:又称可测误差又称可测误差方法误差方法误差:溶解损失、终点误差溶解损失、终点误差用其他方法校正用其他方法校正 仪器误差仪器误差:刻度不准、砝码磨损刻度不准、砝码磨损校准校准(绝对、相对绝对、相对)操作误差操作误差:颜色观察颜色观察试剂误差试剂误差:不纯不纯空白实验空白实验主观误差主观误差:个人误差个人误差具具单向性、重现性、可校正单向性、重现性、可校正特点特点10随机误差随机误差:又称偶然误差又称偶然误差过失过失 由粗心大意引起,可以避免的。如果发由粗心大意引起
6、,可以避免的。如果发生,不能计入平均值生,不能计入平均值不可校正,无法避免,不可校正,无法避免,服从服从统计规律统计规律不存在系统误差的情况下,测定次数越多其不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定平均值越接近真值。一般平行测定4-6次次系统误差的传递:设测量值为系统误差的传递:设测量值为A、B、C,其绝对误,其绝对误差为差为EA、EB、EC,结果用,结果用R表示表示 a.加减法加减法 R=mA+nB-pC ER=mEA+nEB-pEC b.乘除法乘除法 R=mAnB/pC ER/R=EA/A+EB/B-EC/C c.指数运算指数运算 R=mAn ER/R=nEA/
7、A d.对数运算对数运算 R=mlgA ER=0.434mEA/A3 误差的传递误差的传递随机误差的传递:用随机误差的传递:用s表示表示 a.加减法加减法 R=mA+nB-pC sR2=m2sA2+n2sB2+p2sC2 b.乘除法乘除法 R=mAnB/pC sR2/R2=sA2/A2+sB2/B2+sC2/C2 c.指数运算指数运算 R=mAn sR/R=nsA/A d.对数运算对数运算 R=mlgA sR=0.434msA/A极值误差极值误差 最大可能误差最大可能误差 R=A+B-C ER=|EA|+|EB|+|EC|RAB/C ER/R=|EA/A|+|EB/B|+|EC/C|3.2 有
8、效数字及运算规则有效数字及运算规则1 有效数字有效数字:分析工作中实际能测得的数字,包括全分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内部可靠数字及一位不确定数字在内a 数字前数字前0不计不计,数字后计入数字后计入:0.03400b 数字后的数字后的0含义不清楚时含义不清楚时,最好最好用指数形式用指数形式表示表示:1000(1.0103,1.00103,1.000 103)c 自然数和常数自然数和常数可看成具有无限多位数可看成具有无限多位数(如倍数、分数关系如倍数、分数关系)d 数据的数据的第一位数大于等于第一位数大于等于8的的,可多计一位有效数字,如可多计一位有效数字,如
9、9.45104,95.2%,8.65e 对数与指数对数与指数的有效数字位数按尾数计的有效数字位数按尾数计,如如 pH=10.28,则则H+=5.210-11f 误差误差只需保留只需保留12位,单位变化,有效数字不变位,单位变化,有效数字不变m 分析天平分析天平(称至称至0.1mg):12.8228g(6),0.2348g(4),0.0600g(3)千分之一天平千分之一天平(称至称至0.001g):0.235g(3)1%天平天平(称至称至0.01g):4.03g(3),0.23g(2)台秤台秤(称至称至0.1g):4.0g(2),0.2g(1)V 滴定管滴定管(量至量至0.01mL):26.32
10、mL(4),3.97mL(3)容量瓶容量瓶:100.0mL(4),250.0mL(4)移液管移液管:25.00mL(4);量筒量筒(量至量至1mL或或0.1mL):25mL(2),4.0mL(2)2 有效数字运算中的修约规则有效数字运算中的修约规则尾数尾数4时舍时舍;尾数尾数6时入时入尾数尾数5时时,若后面数为若后面数为0,舍舍5成双成双;若若5后面还有后面还有不是不是0的任何数皆入的任何数皆入四舍六入五成双四舍六入五成双例例 下列值修约为四位有效数字下列值修约为四位有效数字 0.324 74 0.324 75 0.324 76 0.324 85 0.324 851 0.324 70.324
11、80.324 80.324 80.324 9禁止分次修约禁止分次修约运算时可多保留一位有效数字进行运算时可多保留一位有效数字进行 0.57490.570.5750.58加减法加减法:结果的结果的绝对误差绝对误差应不小于各项中绝对误差最大应不小于各项中绝对误差最大的数。的数。(与小数点后位数最少的数一致与小数点后位数最少的数一致)0.112+12.1+0.3214=12.5乘除法乘除法:结果的结果的相对误差相对误差应与各因数中相对误差最大的应与各因数中相对误差最大的数相适应数相适应 (与有效数字位数最少的一致与有效数字位数最少的一致)0.012125.661.05780.328432 3 运算规
12、则运算规则 33310.100025.000.100CaC024.10(CaCO)2O10sMmw =NaOH 30.1000 25.00 0.1000 24.10100.1/20.2351 100.0191599?例例3CaCO2HClCaClH COHCl()322过过量量0.0192H2O+CO23.3 有限数据的统计处理有限数据的统计处理l总体l样本l样本容量 n,自由度 fn-1l样本平均值 l总体平均值 ml真值 xTl标准偏差 sx1.总体标准偏差总体标准偏差 无限次测量;单次偏差均方根2.样本标准偏差样本标准偏差 s样本均值n时,s3.相对标准偏差相对标准偏差(变异系数RSD)
13、1 标准偏差标准偏差112nxxSniixnxnii12m%100 xSRSD4.衡量数据分散度:衡量数据分散度:标准偏差比平均偏差合理5.总体平均偏差与总体标准偏差的关系总体平均偏差与总体标准偏差的关系 0.79790.8 6.平均值的标准偏差平均值的标准偏差n=/n1/2,s n=s/n1/2s n与n1/2成反比系统误差:重复、单向、可校正系统误差:重复、单向、可校正随机误差:不可测量,无法避免。随机误差:不可测量,无法避免。单个误差没有规律,但是多次重复,可用统计方法研究单个误差没有规律,但是多次重复,可用统计方法研究0123456789100.000.020.040.060.080.
14、100.12yx1 随机误差的正态分布随机误差的正态分布测量值的频数分布测量值的频数分布 频数,相对频数,骑墙现象频数,相对频数,骑墙现象 分组细化分组细化 测量值的正态分布测量值的正态分布由于频率的总和为由于频率的总和为100%100%或或1 1,故该曲线下横轴上,故该曲线下横轴上的面积为的面积为100%100%或或1 1。:总体标准偏差总体标准偏差 随机误差的正态分布随机误差的正态分布 m m22/2)(21)(mxexfy离散特性:离散特性:各数据是分散的,波动的各数据是分散的,波动的集中趋势:集中趋势:有向某个值集中的趋势有向某个值集中的趋势m m:总体平均值总体平均值nxnii12m
15、mixnnin11lim:总体平均偏差总体平均偏差nxnii1m 0.797 0.797 正态分布正态分布 正态分布是最重要的一种概率分布。正态分布概正态分布是最重要的一种概率分布。正态分布概念是由念是由德国德国的数学家和天文学家的数学家和天文学家Moivre于于1733年年首次提出的,但由于德国数学家首次提出的,但由于德国数学家Gauss率先将其应率先将其应用于天文学家研究,故正态分布又叫高斯分布,高用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时斯这项工作对后世的影响极大,他使正态分布同时有了有了“高斯分布高斯分布”的名称。但现今德国的名称。但现今德
16、国10马克马克的印的印有有高斯头像的钞票,其上还印有正态分布的高斯头像的钞票,其上还印有正态分布的密度曲密度曲线线。这传达了一种想法:在高斯的一切科学贡献。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。中,其对人类文明影响最大者,就是这一项。x正态分布曲线的特征正态分布曲线的特征1、集中性:正态曲线的高峰位于正中央,即均数所在、集中性:正态曲线的高峰位于正中央,即均数所在的位置。的位置。2、对称性:正态曲线以均数为中心,左右对称,曲线、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。两端永远不与横轴相交。3、均匀变动性:正态曲线由均数所在处开始
17、,分别向、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。左右两侧逐渐均匀下降。4、正态分布有两个参数,即均数、正态分布有两个参数,即均数和标准差和标准差,可记作,可记作N(,):均数):均数决定正态曲线的中心位置;标准决定正态曲线的中心位置;标准差差决定正态曲线的陡峭或扁平程度。决定正态曲线的陡峭或扁平程度。越小,曲线越小,曲线越陡峭;越陡峭;越大,曲线越扁平。越大,曲线越扁平。5、u变换:为了便于描述和应用,常将正态变量作数据变换:为了便于描述和应用,常将正态变量作数据转换。转换。xN:随机误差符合正态分布(高斯分布)随机误差符合正态分布(高斯分布)(m m,)n 有限有
18、限:t分布分布 和和s 代替代替m m,xnstXm3.3.2 有限次测量数据的统计处理有限次测量数据的统计处理t分布曲线分布曲线曲线下一定区间的积分面积,即为该区间内随机误差出现的概率 f 时,t分布正态分布 某一区间包含真值(总体平均值)的概率(可能性)某一区间包含真值(总体平均值)的概率(可能性)置信区间:一定置信度(概率)下,以平均值为中心,置信区间:一定置信度(概率)下,以平均值为中心,能够包含真值能够包含真值m m的区间(范围)的区间(范围)置信度越高,置信区间越大置信度越高,置信区间越大 分析化学中,一般讲置信度定在分析化学中,一般讲置信度定在95%或或90%nstXm平均值的置
19、信区间平均值的置信区间 定量分析数据的评价解决两类问题定量分析数据的评价解决两类问题:(1)可疑数据的取舍可疑数据的取舍 过失误差的判断 方法:4d法、Q检验法和格鲁布斯(Grubbs)检验法 确定某个数据是否可用。(2)分析方法的准确性分析方法的准确性系统误差及偶然误差的判断 显著性检验显著性检验:利用统计学的方法,检验被处理的问题是否存在 统计上的显著性差异。方法:t 检验法和F 检验法 确定某种方法是否可用,判断实验室测定结果准确性可疑数据的取舍可疑数据的取舍 过失误差的判断过失误差的判断 4d法法 偏差大于偏差大于4d的测定值可以舍弃的测定值可以舍弃步骤步骤:求异常值求异常值(Qu)以
20、外数据的平均值和平均偏差以外数据的平均值和平均偏差 如果如果Qu-4d,舍去舍去 x11211XXXXQXXXXQnnnn或Q 检验法检验法步骤:步骤:(1)数据排列数据排列 X1 X2 Xn (2)求极差求极差 Xn-X1 (3)求可疑数据与相邻数据之差求可疑数据与相邻数据之差 Xn-Xn-1 或或 X2-X1 (4)计算:计算:(5)根据测定次数和要求的置信度,根据测定次数和要求的置信度,(如如90%)90%)查表:查表:不同置信度下,舍弃可疑数据的Q值表 测定次数测定次数 Q90 Q95 Q99 3 0.94 0.98 0.99 4 0.76 0.85 0.93 8 0.47 0.54
21、0.63 (6)将)将Q与与QX(如(如 Q90)相比,)相比,若若Q QX 舍弃该数据舍弃该数据,(过失误差造成)(过失误差造成)若若Q G 表表,弃去可疑值,反之保留。,弃去可疑值,反之保留。由于格鲁布斯由于格鲁布斯(Grubbs)检验法引入了标准偏差,故检验法引入了标准偏差,故准确性比准确性比Q 检验法高。检验法高。SXXGSXXGn1计算计算或基本步骤:基本步骤:(1)排序:)排序:1,2,3,4(2)求)求 和标准偏差和标准偏差s(3)计算)计算G值值:x分析方法准确性的检验(显著性检验)分析方法准确性的检验(显著性检验)b.由要求的置信度和测定次数由要求的置信度和测定次数,查表查表
22、,得得:t表表 c.t计计 t表表,表示有显著性差异表示有显著性差异,存在系统误差存在系统误差,被检验方法需要改进被检验方法需要改进 t计计 t表,表示有显著性差异两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样)计算计算值:值:新方法-经典方法(标准方法)两个分析人员测定的两组数据 两个实验室测定的两组数据 a 求合并的标准偏差:求合并的标准偏差:2)1()1(21221211nnSnSnS合211121|nnnnSXXt 合合合合检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测按照置信度和自由度查表(按照置信度和自由度查表(表表),),比较比较 F计算计算和和F表
23、表计算计算值:值:22小小大大计算计算SSF 统计检验的正确顺序统计检验的正确顺序:可疑数据取舍可疑数据取舍F 检验检验 t 检验检验目的目的:得到用于定量分析的标准曲线得到用于定量分析的标准曲线方法:最小二乘法方法:最小二乘法 yi=a+bxi+eia、b的取值使得残差的平方和最小的取值使得残差的平方和最小 ei2=(yi-y)2 yi:xi时的测量值时的测量值;y:xi时的预测值时的预测值 a=yA-bxA b=(xi-xA)(yi-yA)/(xi-xA)2 其中其中yA和和xA分别为分别为x,y的平均值的平均值7.5 回归分析法回归分析法0123456780.000.050.100.150.200.250.300.35y=a+bxr=0.9993Aconcentration相关系数相关系数R=(xi-xA)(yi-yA)/(xi-xA)2(yi-yA)2)0.53.7 提高分析结果准确度方法提高分析结果准确度方法选择恰当分析方法选择恰当分析方法(灵敏度与准确度)(灵敏度与准确度)减小测量误差减小测量误差(误差要求与取样量)(误差要求与取样量)减小偶然误差减小偶然误差(多次测量,至少(多次测量,至少3次以上)次以上)消除系统误差消除系统误差对照实验:标准方法、标准样品、标准加入对照实验:标准方法、标准样品、标准加入空白实验空白实验校准仪器校准仪器校正分析结果校正分析结果