1、北京化工大学北方学院理工院北京化工大学北方学院理工院授课教师:毕春燕3.13.1误差误差3.23.2有效数字及运算规则有效数字及运算规则3.33.3数据处理数据处理3.43.4显著性检验显著性检验3.53.5可疑值取舍可疑值取舍3.63.6回归分析法回归分析法3.73.7提高分析结果准确度的方法提高分析结果准确度的方法基本内容:误差的基本概念,准确度与精密度及基本内容:误差的基本概念,准确度与精密度及其关系;误差的分类、特点及其减免测定误差的其关系;误差的分类、特点及其减免测定误差的措施;有效数字及其运算规则;平均值的置信区措施;有效数字及其运算规则;平均值的置信区间,间,t t检验法、检验法
2、、F F检验法、检验法、Q Q检验法的应用;提高检验法的应用;提高分析结果准确度的方法。分析结果准确度的方法。重点:误差的特点及其减免测定误差的措施,平重点:误差的特点及其减免测定误差的措施,平均值的置信区间,均值的置信区间,t t检验法、检验法、F F检验法、检验法、Q Q检验法检验法的应用。的应用。难点:误差的分布规律,显著性检验难点:误差的分布规律,显著性检验 实验结果都有误差,误差自始实验结果都有误差,误差自始至终存在于一切科学实验的过程之至终存在于一切科学实验的过程之中。测量结果只能接近于真实值,而中。测量结果只能接近于真实值,而难以达到真实值。难以达到真实值。绝对误差绝对误差:测量
3、值与真值间的差值测量值与真值间的差值,用用 E表示表示E=x-xT3.1.1 误差与偏差误差与偏差误差误差相对误差相对误差:绝对误差占真值的百分比绝对误差占真值的百分比,用用Er表示表示Er=E/xT=x-xT/xT100真值(真值(xT):某一物理量本身具有的客观存在的):某一物理量本身具有的客观存在的真实数值。但真实数值。但绝对真值不可测绝对真值不可测理论真值:化合物的理论组成理论真值:化合物的理论组成约定真值:公认的量、单位约定真值:公认的量、单位相对真值:采用可靠的分析方法、精密仪器,相对真值:采用可靠的分析方法、精密仪器,平行分析得到的结果平行分析得到的结果3.1.1误差与偏差误差与
4、偏差偏差偏差:测量值与平均值的差值,用测量值与平均值的差值,用 d表示表示d=x-x精密度精密度:平行测定结果相互靠近的程度,用偏差衡量。平行测定结果相互靠近的程度,用偏差衡量。di=0中位值中位值:将数据由小到大排列,奇数个测量值,取中将数据由小到大排列,奇数个测量值,取中间值;偶数个测量值,取中间相邻的的平均值间值;偶数个测量值,取中间相邻的的平均值全距(极差)全距(极差):测量数据中最大值与最小值的差值测量数据中最大值与最小值的差值3.1.1误差与偏差误差与偏差平均偏差:平均偏差:各单个偏差绝对值的平各单个偏差绝对值的平均值 nxxdnii1相对平均偏差:相对平均偏差:平均偏差与测量平均
5、值的比值平均偏差与测量平均值的比值%100%100%1xnxxxdnii相对平均偏差标准偏差:标准偏差:s 相对标准偏差:相对标准偏差:RSD112nxxsnii%100 xsRSD标准偏差通过平方运算,能将较大的偏差更显著地标准偏差通过平方运算,能将较大的偏差更显著地表现出来,能更好地反映测定值的精密度表现出来,能更好地反映测定值的精密度准确度准确度 Accuracy Accuracy 准确度表征测量值与真实值的符合程度。准确度用准确度表征测量值与真实值的符合程度。准确度用误差误差表示。表示。精密度精密度 PrecisionPrecision精密度表征平行测量值的相互符合程度。精密度用精密度
6、表征平行测量值的相互符合程度。精密度用偏差偏差表示。表示。两者的关系:两者的关系:(1)(1)准确度是测量结果接近真值的程度,精密准确度是测量结果接近真值的程度,精密度表示测量的再现性;度表示测量的再现性;(2)(2)精密度是保证准确度的先决条件;精密度精密度是保证准确度的先决条件;精密度高不一定准确度高;高不一定准确度高;(3)(3)两者的差别主要是由于系统误差的存在。两者的差别主要是由于系统误差的存在。结论:结论:1 1、精密度是保证准确度的前提。、精密度是保证准确度的前提。2 2、精密度高,不一定准确度就高。、精密度高,不一定准确度就高。3 3、在消除系统误差的前提下,精密度好,准确、在
7、消除系统误差的前提下,精密度好,准确度就高。度就高。根据误差的来源与性质,可分为系统误差和偶然误差两类。1、系统误差、系统误差:又称可测误差又称可测误差方法误差方法误差:溶解损失、终点误差溶解损失、终点误差用其他方法校正用其他方法校正 仪器误差仪器误差:刻度不准、砝码磨损刻度不准、砝码磨损校准校准(绝对、相对绝对、相对)试剂误差试剂误差:不纯不纯空白实验空白实验操作误差操作误差:洗涤次数太多洗涤次数太多主观误差主观误差:个人误差个人误差具具单向性、重现性、可校正单向性、重现性、可校正特点特点2、随机误差、随机误差:又称偶然误差又称偶然误差过失过失 由粗心大意引起,可以避免的。如果发由粗心大意引
8、起,可以避免的。如果发生,不能计入平均值生,不能计入平均值不可校正,无法避免,不可校正,无法避免,服从服从统计规律统计规律不存在系统误差的情况下,测定次数越多其不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定平均值越接近真值。一般平行测定4-6次次公差:生产部门对分析结果误差允许的一种限量。公差:生产部门对分析结果误差允许的一种限量。范围的确定:范围的确定:1 1、根据实际情况对分析结果准确度的要求而定。、根据实际情况对分析结果准确度的要求而定。2 2、根据试样组成及待测组分含量而定。、根据试样组成及待测组分含量而定。3 3、根据分析方法所能达到的准确度而定。、根据分析方法
9、所能达到的准确度而定。1 1、系统误差的传递:设测量值为、系统误差的传递:设测量值为A A、B B、C C,其绝对误差为,其绝对误差为EAEA、EBEB、ECEC,结果用,结果用R R表示表示 a.a.加减法加减法 R=R=m mA+A+n nB-B-p pC C E ER R=mEmEA A+n nE EB B-pEpEC C b.b.乘除法乘除法 R=R=m mA An nB/B/p pC C E ER R/R=R=E EA A/A+/A+E EB B/B-/B-E EC C/C/C c.c.指数运算指数运算 R=R=m mA An n E ER R/R=/R=nEnEA A/A/A d.
10、d.对数运算对数运算 R=R=m mlgA lgA E ER R=0.434=0.434mEmEA A/A/A2、随机误差的传递:用、随机误差的传递:用s表示表示 a.加减法加减法 R=mA+nB-pC sR2=m2sA2+n2sB2+p2sC2 b.乘除法乘除法 R=mAnB/pC sR2/R2=sA2/A2+sB2/B2+sC2/C2 c.指数运算指数运算 R=mAn sR/R=nsA/A d.对数运算对数运算 R=mlgA sR=0.434msA/A极值误差极值误差:最大可能误差最大可能误差 R=A+B-C ER=|EA|+|EB|+|EC|RAB/C ER/R=|EA/A|+|EB/B
11、|+|EC/C|有效数字有效数字在分析工作中实际上能测在分析工作中实际上能测 量到的数字。量到的数字。它既表示数量的大小,也反映测量的准确程度。它既表示数量的大小,也反映测量的准确程度。有效数字有效数字:分析工作中实际能测得的数字,包括分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内全部可靠数字及一位不确定数字在内判断有效数字的位数的原则判断有效数字的位数的原则:1 1、包括全部可靠数字及一位不确定数字(最后一、包括全部可靠数字及一位不确定数字(最后一位)在内。位)在内。2 2、0 0至至9 9均为有效数字。均为有效数字。0的位置与有效数字的位置与有效数字小数:数字前面的小数:
12、数字前面的0 0只起定位作用,数字后面或只起定位作用,数字后面或数字之间的数字之间的0 0是有效数字是有效数字如:如:0.030800.03080共四位有效数字共四位有效数字整数:数字后面的整数:数字后面的0 0不一定是有效数字不一定是有效数字 如:如:3600036000有效数字的位数不确定有效数字的位数不确定3 3、变换单位时,有效数字的位数必须保持、变换单位时,有效数字的位数必须保持不变。不变。例如:例如:10.00ml 0.01000L;10.00ml 0.01000L;10.5L 1.0510.5L 1.0510104 4mlml4 4、自然数可看成具有无限多位数、自然数可看成具有无
13、限多位数(如倍数如倍数关系、分数关系关系、分数关系),可根据需要决定位数,可根据需要决定位数 ;常数亦可看成具有无限多位数,常数亦可看成具有无限多位数,如如 ,e e5 5、pHpH及及pKapKa等对数值,其有效数字仅取决等对数值,其有效数字仅取决于小数部分数字的位数。于小数部分数字的位数。例如:例如:pH=10.28,pH=10.28,换算成换算成HH+=5.2=5.21010-11-11 有效数字是两位而不是四位。有效数字是两位而不是四位。1.00080.1000pH=3.320.0903600五位有效数字五位有效数字四位有效数字四位有效数字二位有效数字二位有效数字二位有效数字二位有效数
14、字不确定不确定例例 题题四舍六入五成双四舍六入五成双尾数尾数4 4时舍时舍;尾数尾数6 6时入时入尾数尾数5 5时时,若后面数为若后面数为0,0,舍舍5 5成双成双;若若5 5后面还有后面还有不是不是0 0的任何数皆入的任何数皆入例例:下列值修约为四位有效数字下列值修约为四位有效数字 0.324 74 0.324 76 0.324 75 0.324 85 0.324 851 0.324 70.324 80.324 80.324 80.324 9禁止分次修约禁止分次修约运算时可多保留一位有效数字进行运算时可多保留一位有效数字进行 0.57490.570.5750.58加减法加减法:结果的结果的绝
15、对误差绝对误差应不小于各项中绝对误应不小于各项中绝对误差最大的数。差最大的数。(与小数点后位数最少的与小数点后位数最少的数一致数一致)0.112+12.1+0.3214=12.5 0.112+12.1+0.3214=12.5乘除法乘除法:结果的结果的相对误差相对误差应与各因数中相对误差应与各因数中相对误差最大的数相适应最大的数相适应 (与有效数字位数最少与有效数字位数最少的一致的一致)0.0121 0.012125.6425.641.057821.057820.3280.328432432 自总体中随机抽出的一组测量值称为自总体中随机抽出的一组测量值称为 所考察对象的全体称为所考察对象的全体称
16、为 样本中所含测定值的数目称为样本中所含测定值的数目称为样本的容量样本的容量,用用 n 表示表示。总体总体样本样本频数分布频数分布 某试样在相同条件下,测得其铁含量从某试样在相同条件下,测得其铁含量从1.26%1.26%至至1.56%1.56%,共,共100100个测量值。由于测量过程存在随机误个测量值。由于测量过程存在随机误差,其分析结果时高时低。差,其分析结果时高时低。为了研究随机误差的分布规律,将上述为了研究随机误差的分布规律,将上述100100个杂个杂乱无章的数据分为乱无章的数据分为1010组,每组的组距为组,每组的组距为0.03%0.03%,每组,每组中测量值出现的次数为中测量值出现
17、的次数为频数频数,频数除以数据总数为,频数除以数据总数为相对频数相对频数.为了避免骑墙数据可能跨在两个组中重复计算,为了避免骑墙数据可能跨在两个组中重复计算,分组时各组界的数值比测量值多取一位数。分组时各组界的数值比测量值多取一位数。s:s:总体标准偏差总体标准偏差 离散特性:离散特性:各数据是分散的,波动的各数据是分散的,波动的nxnii12s相对频数分布直方图的特点相对频数分布直方图的特点样本中,样本中,n 20n 2020时,时,d=0.797 sd=0.797 s 正态分布是最重要的一种概率分布。正态分布概正态分布是最重要的一种概率分布。正态分布概 念是由念是由德国德国的数学家和天文学
18、家的数学家和天文学家MoivreMoivre于于17331733年首次提出的,但由于德国数学家年首次提出的,但由于德国数学家GaussGauss率先率先将其应用于天文学家研究,故正态分布又叫高将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了使正态分布同时有了“高斯分布高斯分布”的名称。现的名称。现今德国今德国1010马克马克印有高斯头像的钞票,其上还印印有高斯头像的钞票,其上还印有正态分布的有正态分布的密度曲线密度曲线。这传达了一种想法:。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响在高斯的
19、一切科学贡献中,其对人类文明影响最大者,就是这一项。最大者,就是这一项。2023-9-212、正态分布:、正态分布:分析化学中测量数据一般符合正态分布,即高斯分布。分析化学中测量数据一般符合正态分布,即高斯分布。y表示概率密度,表示概率密度,x 测量值,测量值,总体平均值,总体平均值,总体标准偏差总体标准偏差222)(21)(ssxexfy1 1、集中性:正态曲线的高峰位于正中央,即均数、集中性:正态曲线的高峰位于正中央,即均数 所所在的位置。在的位置。2 2、对称性:正态曲线以均数、对称性:正态曲线以均数 为中心,左右对称,曲线为中心,左右对称,曲线两端永远不与横轴相交。两端永远不与横轴相交
20、。3 3、均匀变动性:正态曲线由均数、均匀变动性:正态曲线由均数 所在处开始,分别向所在处开始,分别向左右两侧逐渐均匀下降。左右两侧逐渐均匀下降。4 4、正态分布有两个参数,即均数、正态分布有两个参数,即均数 和标准差和标准差,可记作,可记作N N(,):均数):均数 决定正态曲线的中心位置;标准决定正态曲线的中心位置;标准差差 决定正态曲线的陡峭或扁平程度。决定正态曲线的陡峭或扁平程度。越小,曲线越小,曲线越陡峭;越陡峭;越大,曲线越扁平。越大,曲线越扁平。5 5、u u变换:为了便于描述和应用,常将正态变量作数据变换:为了便于描述和应用,常将正态变量作数据转换。转换。定义:定义:又由又由记
21、为 N(0,1)sx u 2u 2e21 xf y sdu dx s duu du e21 dx xf2u2 2u2e21 u y 0u随机误差的区间概率随机误差的区间概率正态分布曲线下的面积表示全部数据出现概率的总和。正态分布曲线下的面积表示全部数据出现概率的总和。随机误差在某区间的概率随机误差在某区间的概率 1 du e21 du u P2u -2sx u due21面积概率2uu02表表3-2 3-2 正态分布概率积分表正态分布概率积分表例例已知某试样中已知某试样中Co%的标准值为的标准值为=1.75%,=0.10%,若无系统误差存在,试求:分析结,若无系统误差存在,试求:分析结果落在果
22、落在1.75 0.15%范围内的概率范围内的概率解解|X-|X-1.75%|0.15%|u|=1.5 0.10%0.10%查表得概率为查表得概率为20.4332=86.6%(双边)(双边)0.000.100.200.300.40-3-2-10123uy解解:5.210.075.12u查表查表:u u 2.5 2.5 时,概时,概率为:率为:0.5 0.4938=0.0062=0.62%例:一样品,标准值为例:一样品,标准值为1.75%1.75%,测得,测得s s =0.10,0.10,求结果落在测量值大于求结果落在测量值大于2%2%的概率。的概率。86.6%86.6%0.62%平均值的标准偏差
23、:平均值的标准偏差:从总体中分别抽出从总体中分别抽出mm个样本个样本(通常进行分析只是从总体中抽出一个样本进行(通常进行分析只是从总体中抽出一个样本进行n n次平行测定),每个样本各进行次平行测定),每个样本各进行n n次平行测定。因次平行测定。因为有为有mm个样本,也就有个样本,也就有mm个平均值,个平均值,由由mm个样本计算得到的平均值个样本计算得到的平均值 来估计总体平均值来估计总体平均值 比只有一个样本(做比只有一个样本(做n n次测定)求得的平均值要次测定)求得的平均值要好。好。很显然,由很显然,由 ,计算得到的平均,计算得到的平均值的标准偏差值的标准偏差 一定比单个样本做一定比单个
24、样本做n n次测定得到次测定得到的标准偏差的标准偏差s s小。小。12,mXXX12,mXXXXsXs 可以用统计学方法证明:用可以用统计学方法证明:用mm个样本,每个样本个样本,每个样本作作n n次测量的平均值的标准偏差与单次测量的平均值的标准偏差与单次次测量结测量结果的标准偏差果的标准偏差s s 的关系为:的关系为:Xssn 对于无限次测定,则为对于无限次测定,则为XsXnss增加(过多)测量次数的增加(过多)测量次数的代价不一定能从减小误差代价不一定能从减小误差得到补偿。得到补偿。与与n n的平方根成反比,的平方根成反比,增加测定次数增加测定次数,可使平均可使平均值的标准偏差减小,但并值
25、的标准偏差减小,但并不能使精密度成比例提高,不能使精密度成比例提高,通常测量通常测量4 46 6次足以次足以Xs(1)t分布曲线分布曲线 正态分布是无限次测量正态分布是无限次测量数据的分布规律。对于有数据的分布规律。对于有限次测量数据则用限次测量数据则用t 分布曲分布曲线处理。线处理。用用 代替代替,纵坐标仍纵坐标仍为概率密度,横坐标则为为概率密度,横坐标则为统计量统计量t。xsxt图图3-6 t3-6 t分布曲线分布曲线 f f=1,5,=1,5,Xs t分布曲线下面表示一定区间内分布曲线下面表示一定区间内的积分面积,就是该区间内随机误的积分面积,就是该区间内随机误差出现的概率。这与标准正太
26、分布差出现的概率。这与标准正太分布曲线曲线u是一致的。是一致的。1)1).nn时,时,t t 分布分布=u=u分布分布2)2).f:f:自由度自由度f=(n-1)f=(n-1)3)3).t.t与与u u分布不同的是,分布不同的是,t t曲线形状随自由度曲线形状随自由度f f而变化而变化 4)4).P:P:置信度置信度,测量值落在测量值落在(+u)u)或或(+ts)ts)范围内的范围内的概率概率5)5).:.:危险率危险率(显著性水平显著性水平),),数据落在置信区间外的数据落在置信区间外的概率概率 =(1-P)=(1-P)6)6).t t:置信因子,随置信因子,随 减小而增大,置信区间变宽减小
27、而增大,置信区间变宽7)7).t t 随随P P和和f f而变化,当而变化,当f=20f=20时,时,t tuu t值与置信度值与置信度P及自由度及自由度f关系关系写作写作t t,f例:例:t005,10表示置信度为表示置信度为95%,自由度为,自由度为10时时的的t值。值。t001,5表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。t,f值表值表(双边双边)P,对于少量测量数据,即当对于少量测量数据,即当 n有限时,必须有限时,必须根据根据t分布进行统计处理:分布进行统计处理:含义:表示在一定置信度下,以含义:表示在一定置信度下,以平均值为中平均值为中心心,包括包括总体
28、平均值的范围。这就叫平均值总体平均值的范围。这就叫平均值的置信区间的置信区间。ntsxtsxx 例:例:测定未知试样中测定未知试样中Cl-的质量分数,的质量分数,4次结果为次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为。计算置信度为90%,95%和和99%时,总体平均值时,总体平均值的置信区间。的置信区间。解:解:%60.474%55.47%52.47%69.47%64.47x%08.01)(2nxxs)%23.060.47(.分析方法准确性的检验(显著性检验)分析方法准确性的检验(显著性检验)b.由要求的置信度和测定次数由要求的置信度和测定次数,查表查表,得得:
29、t表表 c.t计计 t表表,表示有显著性差异表示有显著性差异,存在系统误差存在系统误差,被检验方法需要改进被检验方法需要改进 t计计 t表表,表示无显著性差异,被检验方法可以采用表示无显著性差异,被检验方法可以采用 多以多以95%置信度为标准。置信度为标准。nSXt/计计算算.t t检验法检验法-系统误差的检测系统误差的检测 .平均值与标准值平均值与标准值()的比较的比较 步骤步骤:a.计算计算t 值值nstX例:例:采用某新方法测定基准明矾中铝的质量分数,采用某新方法测定基准明矾中铝的质量分数,9次次的分析结果为:的分析结果为:10.74%,10.77%,10.77%,10.77%,10.8
30、1%,10.82%,10.73%,10.86%,10.81%。已知。已知标准值为标准值为10.77%。试问采用该新方法是否引起系统误。试问采用该新方法是否引起系统误差差(置信度置信度95%)?解解:n=9,f=8 查表查表:P=0.95,f=8时,时,t0.05,8=2.31。t t t表表,表示有显著性差异表示有显著性差异.两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样)c.c.计算计算值:值:步骤:步骤:a.a.先用先用F F检验法检验两组精密度无显著性差异。检验法检验两组精密度无显著性差异。b.求合并的标准偏差:求合并的标准偏差:2)1()1(21221211nnSnSn
31、S合211121|nnnnSXXt 合合合合.检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测.按照置信度和自由度查表(按照置信度和自由度查表(表表),),c.比较比较 F计算计算和和F表表步骤:步骤:.计算计算值:值:22小小大大计算计算SSF 12(,)a ffFF计若若 则不存在显著性差异,否则存在显著性差异。则不存在显著性差异,否则存在显著性差异。置信度为置信度为95%时时F 值值(单边单边)2 3 4 5 6 7 8 9 10 f大大:大方差数据:大方差数据自由度自由度f小小:大方差数据:大方差数据自由度自由度单侧和双侧检验单侧和双侧检验 1 1)单侧检验)单侧检验 检验
32、某结果的精密度是否大检验某结果的精密度是否大于或小于某值于或小于某值,置信度为置信度为95%95%FF检验常用检验常用 2 2)双侧检验)双侧检验 检验两结果是否存在显著性检验两结果是否存在显著性差异,置信度为差异,置信度为90%90%tt检验常用检验常用 例:例:当置信度为当置信度为95%时,下列两组数据是否时,下列两组数据是否存在显著性差异?存在显著性差异?A A:0.098960.09896;0.098910.09891;0.099010.09901;0.09896 0.09896 n=4n=4B B:0.099110.09911;0.098960.09896;0.098860.0988
33、6;0.099010.09901;0.09906 0.09906 n=5n=5解解属两平均值的比较,先用属两平均值的比较,先用F检验检验精密度精密度,证,证明无差异之后,再用明无差异之后,再用t检验检验系统误差系统误差 _(2)XB=0.09900 SB2=92.510-10 S大大2 SB2 92.510-10(3)F计计=5.54 S小小2 SA2 16.710-10(4)查表查表F=9.12因因F计计F表表故故SA与与SB精密度精密度无显著性差异无显著性差异 102AA1016.71nxxiS 0.09896x (1)2 (6)查查 t0.05,7=2.36 t计计T表表,则异常值应舍去
34、,否则应保留。,则异常值应舍去,否则应保留。sxxT1sxxTnx例例:上例中上例中的数据用的数据用GrubbsGrubbs法判断,法判断,1.401.40这个数据是这个数据是否保留(否保留(P=95%P=95%)解:解:这个数据应保留这个数据应保留查表得:查表得:,40.1TT46.1TT36.1066.031.140.1sxxT066.0s31.1xn,a4,05.0n,an 与上例结论不同,该与上例结论不同,该法可靠性较高法可靠性较高格鲁布斯法优点,引人了正态分布格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数中的两个最重要的样本参数 及及s s,故,故方法的准确性较好。缺点是需要
35、计方法的准确性较好。缺点是需要计算算 和和s,s,手续稍麻烦。手续稍麻烦。xx一组数据,从小到大排列为:一组数据,从小到大排列为:x1,x2,xn-1,xn若若x1和和xn为异常值,则统计量为异常值,则统计量Q(舍弃商舍弃商)为:为:Q值越大,说明值越大,说明xn离群越远。当离群越远。当Q计算计算Q表表时,时,异常值应舍去,否则应予保留。异常值应舍去,否则应予保留。11xxxxQnnn112xxxxQn表表3-6 Q值表值表例:例:测测量得结果:量得结果:1.251.25、1.271.27、1.311.31、1.401.40,试问用,试问用Q Q检验法判断,检验法判断,1.401.40这个数据
36、是否这个数据是否保留(保留(P=90%P=90%)这个数据应保留,查表得:表表40.176.0460.025.140.131.140.1QQQnQQ Q检验法符合数理统计原理,特检验法符合数理统计原理,特别具有直观性和计算简便的优别具有直观性和计算简便的优点。点。测定次数限制在测定次数限制在3 31010次。次。2-803.6 回归分析法回归分析法分析化学中经常用工作曲线来获取未知物分析化学中经常用工作曲线来获取未知物的量的量,A与与C的关系是否为线形相关的关系是否为线形相关(各实验各实验点是否全部落在一条直线上点是否全部落在一条直线上?)用数理统计用数理统计方法找出各实验点误差最小的直线方法
37、找出各实验点误差最小的直线回归分析回归分析3.6.1 3.6.1 一元线性回归方程一元线性回归方程(linear regressionlinear regression)回归直线的方程中回归直线的方程中,a a为为线线的截矩的截矩,b b为直为直线的斜线的斜率,率,分别为分别为x x和和y y的的平均值,它平均值,它们们的值的值确确定之定之后后,一元线性,一元线性回归回归方方程及程及回回归直线就定了。归直线就定了。bxayxbynxbyaniinii11niiniiixxyyxxb121)()(xy2-82a.从一组数据出发确定这些变量间的定量关系从一组数据出发确定这些变量间的定量关系回归方程
38、的建立回归方程的建立b.评价和度量变量间的关系的密切程度评价和度量变量间的关系的密切程度相关系数检验相关系数检验c.应用回归方程应用回归方程,从一些变量值去估计另一变量值从一些变量值去估计另一变量值d.对回归方程的主要参数作进一步评价和比较对回归方程的主要参数作进一步评价和比较回归曲线的检验回归曲线的检验 回归方程的意义和用途回归方程的意义和用途2-833.6.2 相关系数相关系数1.r值计算值计算判断判断y与与x之间的相关性好坏的尺度之间的相关性好坏的尺度 2222yyxxyyxxyyxxbriiiiii2.r 值的物理意义值的物理意义a.当当 都在回归线上时都在回归线上时,r=1 完全相关
39、完全相关b.当当y与与x无相关性无相关性时时,r=0c.r在在01之间时之间时,y与与x有相关性有相关性,r愈接近愈接近1,相关性愈好相关性愈好iy3.相关系数的显著性检验相关系数的显著性检验a.求求r值值b.在一定置信度下在一定置信度下,当当 ,则则x和和y相关相关,所拟合的回归曲线有所拟合的回归曲线有意义意义,否则否则x与与y不相关不相关,所得回归方程不所得回归方程不可靠可靠表表计计rr例例 用吸光光度法测定合金钢中用吸光光度法测定合金钢中MnMn的含量,吸光度与的含量,吸光度与MnMn的含量的含量间有下列关系间有下列关系:MnMn的质量的质量g g:0 0,0.020.02,0.040.
40、04,0.06 0.08 0.10 10.12 0.06 0.08 0.10 10.12 未知样未知样吸光度吸光度A A 0.032 0.135 0.187 0.268 0.359 0.435 0.032 0.135 0.187 0.268 0.359 0.435 0.511 0.242 0.511 0.242 试列出标准曲线的回归方程并计算未知试样中试列出标准曲线的回归方程并计算未知试样中MnMn的含量。的含量。解解 此组数据中,组分浓度为零时,吸光度不为零,这可能是在此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量试剂中含有少量MnMn,或者含有其它在该测量波长下有吸光的
41、,或者含有其它在该测量波长下有吸光的物质。物质。设设MnMn含量值为含量值为x x,吸光度值为,吸光度值为y y,计算回归系数,计算回归系数a a,b b值。值。a=0.038 b=3.95a=0.038 b=3.95 标准曲线的回归方程:标准曲线的回归方程:y=0.38+3.95x r=0.9993ry=0.38+3.95x r=0.99930.1(5)为使为使Er0.1%,加大称样量,扩大,加大称样量,扩大10倍,倍,配制成配制成250mL(取取25mL即为即为0.024g的量的量)g024.01000M3121Vcm)3(722322322722OCrKOSNaOSNaOCrK3 减小随
42、机误差减小随机误差 在消除系统误差的前提下,平行测定次数愈在消除系统误差的前提下,平行测定次数愈多,平均值愈接近真实值。因此,增加测定次多,平均值愈接近真实值。因此,增加测定次数,可以提高平均值精密度。在化学分析中,数,可以提高平均值精密度。在化学分析中,对于同一试样,通常要求平行测定(对于同一试样,通常要求平行测定(parallel determination)35次。次。4 消除系统误差消除系统误差由于系统误差是由某种固定的原因造成的,因而由于系统误差是由某种固定的原因造成的,因而找出这一原因,就可以消除。找出这一原因,就可以消除。有下列几种方法。有下列几种方法。(1)对照试验对照试验-c
43、ontrast test(2)空白试验空白试验-blank test(3)校准仪器校准仪器-calibration instrument(4)分析结果的校正分析结果的校正-correction result(1)对照试验对照试验与标准试样的标准结果进行对照与标准试样的标准结果进行对照;标准试样、管理样、合成样、加入回收法。标准试样、管理样、合成样、加入回收法。与其它成熟的分析方法进行对照与其它成熟的分析方法进行对照;国家标准分析方法或公认的经典分析方法。国家标准分析方法或公认的经典分析方法。由不同分析人员,不同实验室来进行对照由不同分析人员,不同实验室来进行对照试验。试验。内检、外检。内检、外
44、检。(2)空白试验空白试验空白实验:在不加待测组分的情况下,按空白实验:在不加待测组分的情况下,按照试样分析同样的操作手续和条件进行实照试样分析同样的操作手续和条件进行实验,所测定的结果为空白值,从试样测定验,所测定的结果为空白值,从试样测定结果中扣除空白值,来校正分析结果。结果中扣除空白值,来校正分析结果。消除由试剂、蒸馏水、实验器皿和环境带消除由试剂、蒸馏水、实验器皿和环境带入的杂质引起的系统误差,但空白值不可入的杂质引起的系统误差,但空白值不可太大。太大。(3)(3)校准仪器校准仪器仪器不准确引起的系统误差,通过校准仪器仪器不准确引起的系统误差,通过校准仪器来减小其影响。例如砝码、移液管和滴定管等来减小其影响。例如砝码、移液管和滴定管等,在精确的分析中,必须进行校准,并在计算,在精确的分析中,必须进行校准,并在计算结果时采用校正值结果时采用校正值。(4)(4)分析结果的校正分析结果的校正校正分析过程的方法误差,例用重量法测校正分析过程的方法误差,例用重量法测定试样中高含量的定试样中高含量的SiOSiO2 2,因硅酸盐沉淀不,因硅酸盐沉淀不完全而使测定结果偏低,可用光度法测定完全而使测定结果偏低,可用光度法测定滤液中少量的硅,而后将分析结果相加。滤液中少量的硅,而后将分析结果相加。