1、分分 析析 化化 学学Analytical Chemistry 第第3 3章章分析化学中的误差与数据处理分析化学中的误差与数据处理 公平、公正,实事求是公平、公正,实事求是!无时不在,无时不在,无处不有。无处不有。3.1.1 真值真值xT (True value) 某一物理量本身具有的客观存在的真实值。真值是未知某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。但在特定情况下可以认为是已知的:的、客观存在的量。但在特定情况下可以认为是已知的:1.理论真值理论真值(如化合物的理论组成);(如化合物的理论组成);2.计量学约定真值计量学约定真值(如国际计量大会确定的长度、质量、(如
2、国际计量大会确定的长度、质量、物质的量单位等)由标准参考物质证书上给出的数值或有物质的量单位等)由标准参考物质证书上给出的数值或有经验的人用可靠方法多次测定的平均值,确认消除系统误经验的人用可靠方法多次测定的平均值,确认消除系统误差差 ;3.相对真值相对真值,认定精度高一个数量级的测量值作为低一级,认定精度高一个数量级的测量值作为低一级精度的测量值的真值,这种真值是相对比较而言的(如科精度的测量值的真值,这种真值是相对比较而言的(如科学实验中使用的标准试样及管理试样中组分的含量等)。学实验中使用的标准试样及管理试样中组分的含量等)。 精度:精度:顾名思义为精确度,表示近似精确的程度顾名思义为精
3、确度,表示近似精确的程度(精确到什么位数),所得值的小数位数越多,越(精确到什么位数),所得值的小数位数越多,越精确。一般来说,精确度代表了量具的最小读数,精确。一般来说,精确度代表了量具的最小读数,测量仪器都有精度的要求。比如分析天平如果精度测量仪器都有精度的要求。比如分析天平如果精度是千分之一,就是指天平可以称准至是千分之一,就是指天平可以称准至0.001克,即在克,即在0.001克位以前是准确数字而之后如果还有一位则是克位以前是准确数字而之后如果还有一位则是估读数。估读数。 1ixnx3.1.2 平均值(平均值( )Mean value n 次测量值的算术平均值虽不是真值,但比单次测量次
4、测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,它表示一组测定数据的集中趋势,是对结果更接近真值,它表示一组测定数据的集中趋势,是对真值的最佳估计:真值的最佳估计: 3.1.3 中位数(中位数(xM)Median value 将一组测量数据按从小到大的顺序排列,当测量值的将一组测量数据按从小到大的顺序排列,当测量值的个数个数n是奇数时,中间一个数据即为中位数是奇数时,中间一个数据即为中位数xM;当测量值的;当测量值的个数个数n为偶数时,中位数为中间相邻两个测量值的平均值。为偶数时,中位数为中间相邻两个测量值的平均值。它的优点是能简单直观说明一组测量数据的结果,且不受它的优点是能简单直
5、观说明一组测量数据的结果,且不受两端具有过大误差数据的影响;缺点是不能充分利用数据,两端具有过大误差数据的影响;缺点是不能充分利用数据,因而不如平均值准确。因而不如平均值准确。x3.1.4公差公差 公差公差是生产部门对分析结果误差允许的一种限量,是生产部门对分析结果误差允许的一种限量,如果误差超出允许的公差范围,该项分析工作就应如果误差超出允许的公差范围,该项分析工作就应重做。重做。 确定公差范围的因素:确定公差范围的因素:实际情况对分析结果准确度的要求。实际情况对分析结果准确度的要求。试样组成及待测组分含量。试样组成及待测组分含量。各种分析方法所能达到的准确度。各种分析方法所能达到的准确度。
6、3.1.5误差与偏误差与偏差差 误差(误差(E)Error,表示准确度高低的量。表示准确度高低的量。 对对B物质客观存在量为物质客观存在量为xT 的分析对象进行分析,得到的分析对象进行分析,得到n个个别测定值个个别测定值 x1,x2,x3, xn,对,对n 个测定值进行平均,得到测定结果的平均值,那么:个测定值进行平均,得到测定结果的平均值,那么: 个别测定值的误差为:个别测定值的误差为: 测定结果的绝对误差测定结果的绝对误差(Absolute error):表示测量值与真值():表示测量值与真值(xT)的差。)的差。 测定结果的相对误差测定结果的相对误差(Relative error):表示
7、误差在真值中所占的百分):表示误差在真值中所占的百分率。率。 测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。TiixxETxxE100%rTEExn 偏差偏差(deviation): 表示精密度高低的量。偏差小,表示精密度高低的量。偏差小,精密度高。精密度高。 偏差的表示有:偏差的表示有: 单次测定的偏差单次测定的偏差 单次测定结果的平均偏差单次测定结果的平均偏差 ,表示各,表示各单次测定偏差的
8、绝对值的平均值。单次测定偏差的绝对值的平均值。 单次测定结果的相对平均偏差单次测定结果的相对平均偏差 。 极差或全距极差或全距(range,R)R = xmax xmin,是一组测量数,是一组测量数据中最大值与最小值之差。用该法表示偏差,简单据中最大值与最小值之差。用该法表示偏差,简单直观,便于运算。直观,便于运算。 标准偏差标准偏差(standard deviation, s) 相对标准偏差相对标准偏差 (relative standard deviation,RSD,sr也称变异系数也称变异系数CV(Coefficient of Variance)iidxx11niiddn100%rddx
9、211niixxsn100%rssx 准确度准确度 (Accuracy ) 准确度表征测量值与真实值的符合程度。准确准确度表征测量值与真实值的符合程度。准确度用误差表示。度用误差表示。 精密度精密度 (precision) 精密度表征平行测量值的相互符合程度。精密精密度表征平行测量值的相互符合程度。精密度用偏差表示。度用偏差表示。例例1:1:滴定的体积误差滴定的体积误差VEEr20.00 mL 0.02 mL 0.1%2.00 mL 0.02 mL 1%例例2:称量误差:称量误差mEEr0.2000 g 0.2 mg 0.1%0.0200 g 0.2 mg 1%滴定剂体积应为滴定剂体积应为20
10、30mL称样质量应大于称样质量应大于0.2ga62.38%,62.32%0.06%TTxxxxE 例例3:测定含铁样品中:测定含铁样品中w(Fe), 比较结果的准确度。比较结果的准确度。A. 铁矿中,铁矿中,B. Li2CO3试样中试样中, ,A.B.arar100%0.06/ 62.380.1100%0.002/ 0.0425 %TTExExEE a0.042%,0.044%0.002%TTxxxxE例例4 4:基准物:硼砂基准物:硼砂 : Na2B4O710H2O Mr=381 碳酸钠碳酸钠 Na2CO3 :Mr=106 选那一个更能使测定结果准确度高?选那一个更能使测定结果准确度高? (
11、不考虑其他原因,只考虑称量)(不考虑其他原因,只考虑称量)准确度与精密度的关系准确度与精密度的关系例例:A、B、C、D 四个分析工作者对同一铁标样四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图中的铁含量进行测量,得结果如图 示,比较其准确度与精密度。示,比较其准确度与精密度。36.00 36.50 37.00 37.50 38.00测量点测量点平均值平均值真值真值DCBA表观准确度高,精密度低表观准确度高,精密度低准确度高,精密度高准确度高,精密度高准确度低,精密度高准确度低,精密度高准确度低,精密度低准确度低,精密度低(不可靠)(不可靠) 结论:结论:1.精
12、密度是保证准确度的前提。精密度是保证准确度的前提。2.精密度高,不一定准确度就高。精密度高,不一定准确度就高。3.两者的差别主要是由于系统误差的存在导两者的差别主要是由于系统误差的存在导致准确度差;随机误差的存在导致精密度致准确度差;随机误差的存在导致精密度差。差。 4.准确度反映了测量结果的正确性,精密准确度反映了测量结果的正确性,精密度反映了测量结果的重现性。度反映了测量结果的重现性。3.1.7系统误差和随机误差系统误差和随机误差 在定量分析中,对于各种原因导致的误差,在定量分析中,对于各种原因导致的误差,根据误差的来源和性质的不同,可以分为:根据误差的来源和性质的不同,可以分为:系统误差
13、系统误差(systematic error):由比较固定的由比较固定的原因引起的误差。原因引起的误差。 随机误差随机误差(randon error):随机偶然,难以控随机偶然,难以控制,不可避免的误差。制,不可避免的误差。 过失误差过失误差( gross error):操作者粗心大意引操作者粗心大意引起的误差。又叫错误误差。起的误差。又叫错误误差。系统误差与随机误差的比较系统误差与随机误差的比较项目项目系统误差(可测误差)系统误差(可测误差)随机误差(偶然误差随机误差(偶然误差产生原因产生原因固定因素,有时不存在固定因素,有时不存在不定因素,总是存在不定因素,总是存在分类分类方法误差、仪器与试
14、剂方法误差、仪器与试剂误差、主观误差误差、主观误差环境的变化因素、主环境的变化因素、主观的变化因素等观的变化因素等性质性质重现性、单向性(或周重现性、单向性(或周期性)、可测性期性)、可测性服从概率统计规律、服从概率统计规律、不可测性不可测性影响影响准确度准确度精密度精密度消除或减消除或减小的方法小的方法校正校正增加测定的次数增加测定的次数(一)(一) 系统误差系统误差 1 特点:特点: (1)对分析结果的影响比较恒定(单向性); (2)在同一条件下,重复测定, 重复出现(重复性) ; (3)影响准确度,不影响精密度; (4)可以消除。 (5)可以测定(可测性)。2产生的原因(1 1)方法误差
15、)方法误差选择的方法不够完善 例: 重量分析中沉淀的溶解损失 滴定分析中指示剂选择不当(2 2)仪器误差)仪器误差仪器本身的缺陷 例: 天平两臂不等,砝码未校正 滴定管,容量瓶未校正 (3 3)试剂误差)试剂误差所用试剂有杂质 例:去离子水不合格 试剂纯度不够; (含待测组份或干扰离子)(4 4)主观误差)主观误差操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅 滴定管读数不准(二)(二) 偶然误差偶然误差 1. 1. 特点:特点: (1)不恒定; (2)难以校正; (3)服从正态分布 2. 2. 产生的原因产生的原因 (1)偶然因素; (2)滴定管等读数(三)(三) 过失误差过失误差(四
16、)误差的减免(四)误差的减免 1.方法误差 采用标准方法,对照实验(标准方法,标准样品,标准加入) 2.仪器误差 校正仪器(绝对,相对) 3.试剂误差 作空白实验 不可避免,服从统计规律,增加平行测定的次数 确系发生,数据必舍。提高工作责任心!重做!重做! 3.1.8 3.1.8 误差的传递误差的传递分析结果通常是经过一系列测量步骤之后分析结果通常是经过一系列测量步骤之后获得的,其中每一步骤的测量误差都会反获得的,其中每一步骤的测量误差都会反映到分析结果中去。映到分析结果中去。设分析结果设分析结果Y Y 由测量由测量值值A A、B B、C C 计算获得,测量值的绝对误差计算获得,测量值的绝对误
17、差分别为分别为 E EA A、E EB B、E EC C,相对误差分别为,相对误差分别为E EA A/A/A、E EB B/B/B、E Ec c/C/C, , 标准偏差分别为标准偏差分别为S SA A、S SB B、S SC C, ,计算结果计算结果Y Y的绝对误差为的绝对误差为E EY Y,相对误差为,相对误差为E EY Y/Y/Y,标准偏差为,标准偏差为s sY Y,k ki i为常数。为常数。 系统误差的传递系统误差的传递1.加减法 2.乘除法 3.指数关系 4.对数关系 Y=m An Y=mlg A EY/Y=n EA/A EY = 0.434 m EA/AabcYaAbBcCYkk
18、A k B k CEk Ek Ek ECEBEAEYECABkYCBAY 随机误差的传递随机误差的传递 1.加减法 2.乘除法3.指数关系 4.对数关系 22222AsnYsmAYAYnAsmsAmYAY434. 0lg2222222CcBbAaYcbasksksksCkBkAkkY22222222CsBsAsYsCABmYCBAY极值误差极值误差 CcBbAaYcbaEkEkEkECkBkAkkYmax1,)(CEBEAEYECABmYCBAYmax,2)(3.2有效数字及其运算规则有效数字及其运算规则1. 有效数字的意义及位数有效数字的意义及位数2. 有效数字的修约规则有效数字的修约规则3
19、. 运算规则运算规则4. 分析化学中数据记录及结果表示分析化学中数据记录及结果表示 实验过程中常遇到实验过程中常遇到: (1 1)数目:如测定次数;倍数;系数;分数。)数目:如测定次数;倍数;系数;分数。 (2 2)测量值或计算值。数据的位数与测定准确度有关。)测量值或计算值。数据的位数与测定准确度有关。记录的数不仅表示数量的大小,而且要正确地反映测量记录的数不仅表示数量的大小,而且要正确地反映测量的精确程度。如:的精确程度。如: 结果结果 绝对偏差绝对偏差 相对偏差相对偏差 有效数字位数有效数字位数 0.51800 0.51800 0.00001 0.00001 0.002% 50.002%
20、 5 0.5180 0.5180 0.0001 0.0001 0.02% 40.02% 4 0.518 0.518 0.001 0.001 0.2% 30.2% 33.2.1 有效数字的意义及位数有效数字的意义及位数有效数字有效数字significant figure 实际能测到的数字。在有效数字中实际能测到的数字。在有效数字中, 只只有最后一位数是不确定的、可疑的。有效有最后一位数是不确定的、可疑的。有效数字的位数由仪器准确度决定,它直接影数字的位数由仪器准确度决定,它直接影响测定的相对误差。响测定的相对误差。 分析结果中的有效数字是:实际测定的分析结果中的有效数字是:实际测定的数值包含一位
21、不确定数字数值包含一位不确定数字(可疑数字或欠准可疑数字或欠准数字数字)。有效位数:有效位数: 从数值左方非零数字算起到最后一位可疑从数值左方非零数字算起到最后一位可疑数字,确定有效位数的位数。数字,确定有效位数的位数。可疑数字:可疑数字: 通常理解为,它可能有通常理解为,它可能有1或或0.5单位的单位的误差误差(不确定性不确定性)。 有效数字的记录:有效数字的记录: 1.几个重要物理量的测量精度:几个重要物理量的测量精度: 天平天平(1/10000): Ea=0.0001g 滴定管:滴定管: 0.01mL pH计:计: 0.01单位单位 光度计:光度计: 0.001单位单位 电位计:电位计:
22、 0.0001 V(E) m 台秤台秤(称至称至0.1g):12.8 g(3), 0.5 g(1), 1.0 g(2) 分析天平分析天平(称至称至0.1 mg):12.8218 g(6), 0.5024 g(4), 0.0500 g(3) V 数据中零的作用数据中零的作用: :(1)数字零在数据中具有数字零在数据中具有: 作作普通数字普通数字用:如用:如 0.5180,4位有效数字,位有效数字, 可记可记为为 5.180 10-1;作;作定位定位用如用如 0.0518,3位有效数字,位有效数字,可记为可记为5.18 10-2。2.几项规定几项规定:(2)数字前的数字前的0不计,数字后的不计,数
23、字后的0计入计入 :0.02450(4位位)。(3)数字后的数字后的0含义不清楚时,含义不清楚时, 最好用指数形式表最好用指数形式表示示 : 1000 (1.0103 ,1.00103,1.000 103 )。 零的具体作用零的具体作用: *在在1.0008中,中,“0” 是有效数字;是有效数字; *在在0.0382中,中,“0”定位作用,不是有效数字;定位作用,不是有效数字; *在在0.0040中,前面中,前面3个个“0”不是有效数字,不是有效数字, 后面一个后面一个“0”是有效数字。是有效数字。 *在在3600中,一般看成是中,一般看成是4位有效数字,但它可能是位有效数字,但它可能是2位或
24、位或3位有效数字,分别写位有效数字,分别写3.6103,3.60103或或3.600103较好。较好。自然数可看成具有无限多位数自然数可看成具有无限多位数(如倍数关如倍数关系、分数关系系、分数关系);常数亦可看成具有无限;常数亦可看成具有无限多位数,如多位数,如: 。改变单位不改变有效数字的位数,如:改变单位不改变有效数字的位数,如:,e 24.01 mL 24.0110-3 L 0.0250 g 25.0 mg 2.50104 g数据的第一位数大于等于数据的第一位数大于等于8 的的, 可按多一位有效数字对待,可按多一位有效数字对待,如如 9.45104, 95.2%, 8.6 。对数与指数的
25、有效数字位数按尾数计,对数与指数的有效数字位数按尾数计, 如如 10-2.34 (2位位); pH=11.02, 则则H+=9.510-12 mol/L。误差误差(任何形式)(任何形式)只需保留只需保留12位。位。化学平衡计算中,结果一般为两位有效数字化学平衡计算中,结果一般为两位有效数字(由于由于k值一般值一般为两位有效数字为两位有效数字)。常量分析法(常量分析法(10%)一般为)一般为4 位有效数字位有效数字(Er0.1%),半),半微量分析法(微量分析法(1%10%)一般为)一般为3 位有效数字,微量分析位有效数字,微量分析(1%)为)为23位。位。 数字修约数字修约(rounding
26、date)是指舍弃多余数字的过程,是指舍弃多余数字的过程,按照国家标准采用按照国家标准采用“四舍六入五成双四舍六入五成双”的规则。的规则。“四舍六入五成双四舍六入五成双”规则:当测量值中被修约的数规则:当测量值中被修约的数字等于或小于字等于或小于4时,该数字舍去;等于或大于时,该数字舍去;等于或大于6时,时,进位;等于进位;等于5时(时(5后面无数字或是后面无数字或是0时),如进位时),如进位后末位数字为偶数则进位,舍去后末位数字为偶数后末位数字为偶数则进位,舍去后末位数字为偶数则舍去。则舍去。5后面有不是后面有不是0的数字时,则进位。的数字时,则进位。修约数字时,只允许对原测量值一次修约到所
27、需要修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约。的位数,不能分次修约。8.5498.5 (8.5498.558.6是错的是错的) 3.2.2 有效数字的修约规则有效数字的修约规则 0.32554 0.3255 0.36236 0.3624 10.2150 10.22 150.65 150.6 75.5 76 16.0851 16.093.2.3 运算规则运算规则n加减法加减法 几个数据相加或相减时,有效数字位数的保留,几个数据相加或相减时,有效数字位数的保留,应以小数点后位数最少的数据为准,其他的数据均应以小数点后位数最少的数据为准,其他的数据均修约到这一位。其根据是小数
28、点后位数最少的那个修约到这一位。其根据是小数点后位数最少的那个数的绝对误差最大。例:数的绝对误差最大。例:0.0121+25.64+1.05782=? 绝对误差绝对误差 0.0001 0.01 0.00001 在加合的结果中总的绝对误差值取决于在加合的结果中总的绝对误差值取决于25.64。 0.01+25.64+1.06=26.71一般计算方法一般计算方法: 先修约,后计算。先修约,后计算。n乘除法乘除法 几个数据相乘除时,有效数字的位数应以几个几个数据相乘除时,有效数字的位数应以几个数据中有效数字的位数最少的那个数据为准。其根数据中有效数字的位数最少的那个数据为准。其根据是有效数字位数最少的
29、那个数的相对误差最大。据是有效数字位数最少的那个数的相对误差最大。例:例: 0.0121 25.64 1.05782=? 相对误差相对误差 0.8% 0.4% 0.009% 结果的相对误差取决于结果的相对误差取决于 0.0121,因它的相对误差最,因它的相对误差最大,所以大,所以 0.012125.61.06=0.328一般计算方法一般计算方法: 可以先修约,后计算;也可以可以先修约,后计算;也可以先计算,后修约(计算器)。先计算,后修约(计算器)。n复杂运算复杂运算(对数、乘方、开方等)对数、乘方、开方等) 例:例:pH=5.02, H+? pH5.01 时,时, H+9.772410-6
30、mol L-1 pH5.02 时,时, H+9.549910-6 mol L-1 pH5.03时,时, H+9.332510-6 mol L-1 H+ 9.510-6 mol L-1报告结果报告结果: 与方法精度一致与方法精度一致, 由误差最大的由误差最大的一步确定。一步确定。如如 :称样:称样0.0320 g, 则则w(NaCl) = 99%(3位位); 称样称样0. 3200 g, 则则w(NaCl) = 99.2%(4位位); 光度法测光度法测w(Fe), 测量误差约测量误差约5%, 则则 w(Fe) = 0.064% (2位位),要求称样,要求称样 准至准至3位有效数字即可。位有效数字
31、即可。 合理安排操作程序,实验既准又快!合理安排操作程序,实验既准又快!1.总体与样本总体与样本总体(或母体):总体(或母体):在统计学中,对于所考察在统计学中,对于所考察的对象的某特性值的全体,称为的对象的某特性值的全体,称为总体总体。个体:个体:组成总体的每个单元称为组成总体的每个单元称为个体个体。样本(子样):样本(子样):自总体中随机抽取的一组测自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)称量值(自总体中随机抽取的一部分个体)称为为样本样本。样本容量:样本容量:样品中所包含测量值(个体)的样品中所包含测量值(个体)的数目称为数目称为样本容量样本容量,用,用n表示。表示。
32、 3.3分析化学中的数据处理分析化学中的数据处理例如:分析延河水总硬度,依照取样规则,例如:分析延河水总硬度,依照取样规则,从延河中取来供分析用的从延河中取来供分析用的2000 mL样品水,样品水,这这2000mL样品水是供分析用的样品水是供分析用的总体总体,如果,如果从样品水中取出从样品水中取出20个试样进行平行分析,得个试样进行平行分析,得到到20个分析结果,则这组分析结果就是延河个分析结果,则这组分析结果就是延河样品水的一个样品水的一个随机样本随机样本,样本容量样本容量为为20。2.随机变量随机变量 来自同一总体的无限多个测量值都是随机出来自同一总体的无限多个测量值都是随机出现的,叫做现
33、的,叫做随机变量随机变量。 3.3.1 3.3.1 随机误差的正态分布随机误差的正态分布频数分布(频数分布(frequency distribution)正态分布(正态分布(normal distribution ) 1.频数分布:频数分布: 测定某样品测定某样品100次,因有偶然误差存次,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现的机会最多。化趋势,即在平均值附近的数据出现的机会最多。 频率密度直方图和频率密度多边形频率密度直方图和频率密度多边形0.00.51.01.52.02.53.03.598.8
34、598.9599.0599.1599.2599.3599.4599.5599.6599.7599.8599.95100.05100.15测量值(测量值(%)频率密度频率密度87%(99.6%0.3)99.6%(平均值)(平均值)例:分析某镍试样,共测定90个数据(输至Excel中)粗看,杂乱无章细看,大部分介于1.57-1.67;小至1.49,大至1.74极少;基本上是围绕平均值1.62上下波动。直方图05101520251.5151.5451.5751.6051.6351.6651.6951.7251.755其他测定值频数频率在单元格K1-K9中分别输入1.515;1.545;1.575;1
35、.605;1.635; 1.665;1.695;1.725;1.755(意思是把上面数据分成9组));03. 0949. 174. 1组数极差组距 为避免骑墙现象,组界值 比测定值多取一位。选取【工具】、【数据分析】,再选【直方图】并输入相应的数值,可画出频率或频数直方图。1.从横轴看:对称,正、负误差出现的机会相等;从横轴看:对称,正、负误差出现的机会相等;2.从纵轴看:大误差比小误差出现的机会少,极大的从纵轴看:大误差比小误差出现的机会少,极大的 误差出现的机会极少。误差出现的机会极少。规律:测量数据既集中又分散!规律:测量数据既集中又分散!平均值1.62特点:特点:离散特性离散特性 用标
36、准偏差用标准偏差s来表示。来表示。 计算标准偏差时,对单次测量值的偏差加以平方,计算标准偏差时,对单次测量值的偏差加以平方,这样做不仅能避免单次测量偏差相加时正负抵消,这样做不仅能避免单次测量偏差相加时正负抵消,更重要的是大偏差能显著地反应出来,因而可以更重要的是大偏差能显著地反应出来,因而可以更好地说明数据的分散程度。当测定次数为无限更好地说明数据的分散程度。当测定次数为无限多次时,各测量值对总体平均值多次时,各测量值对总体平均值的偏离,用总体的偏离,用总体标准偏差标准偏差来来表示:表示:2ixn21ixxsn集中趋势集中趋势 用算术平均值用算术平均值 来表示:来表示: 当测定次数无限增多时
37、,所得平均值即为总体平均当测定次数无限增多时,所得平均值即为总体平均值值: 若没有系统误差,则总体平均值若没有系统误差,则总体平均值就是真值就是真值xT, 此此时,总体平均偏差时,总体平均偏差为:为:x11niixxn用统计学方法可以证明:当测定次数非常多用统计学方法可以证明:当测定次数非常多(大于大于20)时,总体标准偏差时,总体标准偏差与总体平均偏差与总体平均偏差有下列关有下列关系:系:=0.7970.80。但应当指出:当测定次数较。但应当指出:当测定次数较少时,少时,与与之间的关系就与此式相差颇大了。之间的关系就与此式相差颇大了。11limninixn nix11,limnniiiiTn
38、xxxnnnxx 无系统误差的前提下样本:总体:即:有限次数!无限次数!2222()();11100%iiiiiirxxxdnnxxdxsnnnnssx相对标准偏差:二、正态分布二、正态分布: :测量数据一般符合正态分布规律,即高斯分布。测量数据一般符合正态分布规律,即高斯分布。) 1 (e21)x(fy222)x( -总体平均值,表示无限次测量值集中的趋势。总体平均值,表示无限次测量值集中的趋势。 -总体标准偏差,表示无限次测量分散的程度。总体标准偏差,表示无限次测量分散的程度。y-概率密度概率密度x-个别测量值个别测量值(x- )- 随机误差随机误差 正态分布是法国数学家正态分布是法国数学
39、家A. de Moivre 提出的,德国提出的,德国数学家数学家Gauss在研究天文学中的观测误差时导出的正态分在研究天文学中的观测误差时导出的正态分布曲线即布曲线即Gauss曲线。所以正态分布又叫曲线。所以正态分布又叫Gauss误差定律。误差定律。正态分布的密度函数是:正态分布的密度函数是: 正态分布曲线规律:正态分布曲线规律:* x=时,时,y值最大,此即分布曲线的最高点。值最大,此即分布曲线的最高点。说明误差为零的测量值出现的概率最大。体说明误差为零的测量值出现的概率最大。体现了测量值的集中趋势。大多数测量值集中现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信
40、在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。赖值,能很好反映测量值的集中趋势。反反映测量值分布的集中趋势。映测量值分布的集中趋势。* 曲线以曲线以x=这一直线为其对称轴,说明正误差这一直线为其对称轴,说明正误差和负误差出现的概率相等。和负误差出现的概率相等。* 当当x趋于趋于-或或+时,曲线以时,曲线以轴为渐近线。即轴为渐近线。即小误差出现的概率大,大误差出现的概率小,小误差出现的概率大,大误差出现的概率小,出现很大误差的概率极小,趋于零。出现很大误差的概率极小,趋于零。* 越大,测量值落在越大,测量值落在附近的概率越小。即精附近的概率越小。即精密度越差时,测量值的
41、分布就越分散,正态密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,分布曲线也就越平坦。反之,越小,测量越小,测量值的分散程度就越小,正态分布曲线也就越值的分散程度就越小,正态分布曲线也就越尖锐。尖锐。反映测量值分布的分散程度。反映测量值分布的分散程度。特点特点:1.极大值在极大值在 x = 处。处。2.拐点在拐点在 x = 处。处。3.于于x = 对称。对称。4.x 轴为渐近线。轴为渐近线。 y-概率密度概率密度 x-测量值测量值 -总体平均值总体平均值(x-):): 随机误差随机误差 - 总体标准偏差总体标准偏差22()21()2xyfxe 随机误差的规律:随机误差的规律:定
42、性:定性:小误差出现的概率大小误差出现的概率大, 大误差出现的概率小大误差出现的概率小, 特大特大误差出现的概率极小误差出现的概率极小;正、负误差出现的概率相等。正、负误差出现的概率相等。定量:定量:某段曲线下的面积则为概率。某段曲线下的面积则为概率。概率密度:概率密度:?0.0 5.0 10.0 15.0 20.0 25.0 15.8015.9016.0016.1016.20概率密度1=0.047 2=0.023 x随机误差的正态分布测量值的正态分布0 x- 正态分布曲线 N( ,2)曲线的形状取决于 和2, 和2确定了, N( ,2)也就定了。标准正态分布曲线N(0,1)后面详细介绍。22
43、2)x(e21y051015.8015.9016.0016.1016.20 xy0.0 5.0 10.0 15.0 20.0 25.0 15.8015.9016.0016.1016.20 xy总体标准偏差 相同,总体平均值不同。总体平均值相同,总体标准偏差不同。原因:1、总体不同。2、同一总体,存在系统误差。原因:同一总体,精密度不同。 不论怎样,与不同,图形就不同。应用起来不方便。解决方法:坐标变换!标准正态分布曲线标准正态分布曲线221( )2uf xuxue 横坐标改用 表示横坐标改用 表示221:()2uyue 即即令:可变为: ,xdxududxdu则) 1 (e21)x(fy222
44、)x(222222()2222211( )2211( )( )221( )(2),(0,1)2xuuuuyf xeef x dxedueduu duyueN以表示。00.10.20.30.4-4-3-2-10123468.3%95.5%99.7%u -3 -2 - 0 2 3 x- -3 -2 - + +2 +3 x y标准正态分布曲线标准正态分布曲线 N (0,1)标准正态分布曲线标准正态分布曲线N(0,1)就是以就是以 为原点,为原点, 为单位的曲线,它对于不同的为单位的曲线,它对于不同的 和和 的任何测量的任何测量值都是通用的,如上图所示。值都是通用的,如上图所示。曲线下面积曲线下面积:
45、 2201, 1,0.34132uuu dueduuSS 当当时时| u |S2S0.6740.25001.0000.34130.6831.6450.45001.9600.47500.9502.0000.47732.5760.49870.9903.0000.49870.9970.5001.000正态分布概率积分表正态分布概率积分表y随机误差的区间概率随机误差的区间概率 正态分布曲线与横坐标正态分布曲线与横坐标-到到+之间所夹的面积,代之间所夹的面积,代表所有数据出现概率的总和,其值应为表所有数据出现概率的总和,其值应为1,即概率,即概率P为:为:2/21( )2uPudueduS图7-5 正
46、态 分 布 概 率 积 分 图| |面 积| |面 积| |面 积0.00.10.20.30.40.50.60.70.80.90.00000.03980.07930.11790.15540.19150.22580.25800.28810.35191.01.11.21.31.41.51.61.71.81.90.34130.36430.38490.40320.41920.43320.44520.45540.46410.47132.02.12.22.32.42.52.62.72.82.90.47730.48210.48610.48930.49180.49380.49530.49650.49740.4
47、987| u |面积| u 面积| u 面积| u 面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.49870.50000.5000.19151.5000.43322.5000.4938随机误差出现的区间随机误差出现的区间u(以(以 为单位)为单位)测量值测量值x出现的区间出现的区间概率概率%(-1, +1) -1 , +1 68.3(-1.96, +1.96) -1.96 , +1.96 95.0(-2, +2) -2 , +2 95.5(-2.58, 2.58) -2.58 , +2.58
48、 99.0(-3, +3) -3 , +3 99.7测量值与随机误差的区间概率测量值与随机误差的区间概率0.000.100.200.300.40-3-2-10123yxu正态分布概率积分表(部分数值)ux例例1. 已知某试样中质量分数的标准值为已知某试样中质量分数的标准值为1.75%,=0.10%,又已知测量时没有系统误差,又已知测量时没有系统误差,求分析结果落在求分析结果落在(1.750.15)%范围内的概率。范围内的概率。解:解:例例2. 同上例,求分析结果大于同上例,求分析结果大于2.00%的概率。的概率。解:属于单边检验问题。解:属于单边检验问题。 5 . 1%10. 0%15. 0%
49、10. 0%75. 1xxu5 . 2%10. 0%75. 1%00. 2xu查表:u=1.5 时,概率为:2 0.4332 = 0.866 = 86.6 %查表:u 2.5 时,概率为:0.5 0.4938 = 0.0062 = 0.62% 例例3:根据正态分布概率积分表根据正态分布概率积分表, 计算单次测量值的计算单次测量值的偏差绝对值分别小于偏差绝对值分别小于1 和大于和大于1 的概率。的概率。解解:(1)单次测量值的偏差绝对值小于单次测量值的偏差绝对值小于1 的概率,即:的概率,即:图中蓝色阴影部分),属于双边内侧检验(;即:)()(脱绝对值符号:现1u1u1x1x1x1x1x1x,1
50、xuxxuu= 1,面积,面积0.3413,故,故P=0.3413 2=68.26%查表:(2)单次测量值的偏差绝对值大于)单次测量值的偏差绝对值大于1 的概率,即:的概率,即:1 ,1111111 0.3413 231.74%xuxuxxxxxuuP 现脱绝对值符号:()()即:;,属于双边外侧检验(图中无阴影部分)故: 例例4:已知某金矿试样中含金量的标准值为:已知某金矿试样中含金量的标准值为12.2 g/T, = 0.2 g/T, 求分析结果小于求分析结果小于11.6 g/T的概率。的概率。解解: 既然不是绝对值小于,而仅仅是小于,属单边检验。既然不是绝对值小于,而仅仅是小于,属单边检验