1、 1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59
2、 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69第二节第二节 随机误差的正态分布随机误差的正态分布 绘制频率分布直方图的绘制频率分布直方图的步骤步骤:1 1、测定值排序,算出、测定值排序,算出极差极差R R 2 2、确定组数、组距、确定组数、组距:组距组距=极差极差/组数组数 组值范围组值范围:将组界值较测定值多取一位(以保证:将组界值较测定值多
3、取一位(以保证 每个数据只能进入某一组内。)每个数据只能进入某一组内。)3 3、统计、统计频数频数:测定值落在每组内的个数叫频数。:测定值落在每组内的个数叫频数。算出算出频率频率:频率:频率(相对频数)相对频数)=频数频数/样本容量样本容量 频率密度频率密度=频率频率/组距组距 4 4、将组值范围、频数和频率列表,、将组值范围、频数和频率列表,绘频数分布直方图绘频数分布直方图 分组(分组(%)频数频数 频率频率 1.485-1.515 2 0.022 1.515-1.545 6 0.067 1.545-1.575 6 0.067 1.575-1.605 17 0.189 1.605-1.635
4、 22 0.244 1.635-1.665 20 0.222 1.665-1.695 10 0.111 1.695-1.725 6 0.067 1.725-1.755 1 0.011 90 1.00频率分布直方图频率分布直方图结论:结论:测定数据既有分散性测定数据既有分散性;又有集中性又有集中性.二、测量值与随机误差的正态分布二、测量值与随机误差的正态分布测量值正态分布测量值正态分布N(,2)的概率密度函数的概率密度函数 1=0.047 2=0.023 x随机误差的正态分布随机误差的正态分布测量值的正态分布测量值的正态分布0 0 x-222)(21)(xexfy总体标准偏差总体标准偏差 相同,
5、相同,总体平均值总体平均值 不同不同总体平均值总体平均值 相同,总相同,总体标准偏差体标准偏差 不同不同原因:原因:1 1、总体不同、总体不同2 2、同一总体,存在系统、同一总体,存在系统误差误差原因:原因:同一总体,精密度不同同一总体,精密度不同正态分布曲线特点:正态分布曲线特点:1 1、小误差出现的概率大,大误差出现的概率小;特别大的误、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。差出现的概率极小。2 2、正误差出现的概率与负误差出现的概率相等。、正误差出现的概率与负误差出现的概率相等。3 3、x=x=时,时,y y 值最大,体现了测量值的集中趋势。集中的程值最大,
6、体现了测量值的集中趋势。集中的程度与度与 有关。有关。平均值平均值222)(21xeyx三、标准正态分布曲线三、标准正态分布曲线 N N(0,1)(0,1)2221)(ueuy令:令:正态分布函数转换成标准正态分布函数:正态分布函数转换成标准正态分布函数:68.3%95.5%99.7%uxu四、随机误差的区间概率四、随机误差的区间概率区间概率区间概率P P用一定区间的积分面积表示该范围内测量值出现的用一定区间的积分面积表示该范围内测量值出现的概率概率.从从,所有测量值出现的总概率,所有测量值出现的总概率P P为为1 1随机误差出现的区间随机误差出现的区间u u(以(以 为单位)为单位)测量值出
7、现的区间测量值出现的区间概率概率%(-1,+1)-1,+1)(-1-1 ,+1+1 )68.368.3(-1.96,+1.96)(-1.96,+1.96)(-1.96-1.96 ,+1.96+1.96 )95.095.0(-2,+2)(-2,+2)(-2-2 ,+2+2 )95.595.5(-2.58,2.58)(-2.58,2.58)(-2.58-2.58 ,+2.58+2.58 )99.099.0(-3,+3)(-3,+3)(-3-3 ,+3+3 )99.799.7xu2/2012uuedu概率出现特别大误差的概率是很小的。出现特别大误差的概率是很小的。误差界限误差界限0.000.100.
8、200.300.40-3-2-10123uy例:例:(1 1)解解5.110.015.0 xu查表查表:u=u=1.5 1.5 时,概率为:时,概率为:2 2 0.4332=0.866=86.6%0.4332=0.866=86.6%(2)解解5.210.075.12u查表:查表:u 2.5 u 2.5 时,概率为:时,概率为:0.5 0.4938=0.0062 0.5 0.4938=0.0062=0.62%=0.62%一样品,标准值为一样品,标准值为1.75%1.75%,测得,测得 =0.10,=0.10,求结果落在求结果落在1.751.750.15%0.15%概率;概率;测量值大于测量值大于
9、2%2%的概率。的概率。86.6%0.62%P频数直方图频数直方图(n n为有限次)为有限次)n正态分布正态分布),(2xu标准正态分布标准正态分布纵纵坐坐标标频数频数横横坐坐标标测量值测量值(以组距(以组距为单位)为单位)概率密度概率密度测量值测量值概率密度概率密度ue21y222x)(e21y2u2x随机误随机误差的正差的正态分布态分布曲线曲线概率密度概率密度x根据根据U U求区间概率、求区间概率、测定值出现的区间测定值出现的区间一一、t t 分布曲线分布曲线无限次测量,得到无限次测量,得到 xu有限次测量,得到有限次测量,得到xs snsxsxtxt t 分布曲线分布曲线0.000.10
10、0.200.300.40-3-2-10123uyu u 分布曲线分布曲线第三节第三节 有限数据的统计处理有限数据的统计处理 1 1正态分布正态分布描述无限次测量数据描述无限次测量数据 t t 分布分布描述有限次测量数据描述有限次测量数据 2 2正态分布正态分布横坐标为横坐标为 u u,t t 分布分布横坐标为横坐标为 t t3 3两者所包含面积均是一定范围内测量值出现的概率两者所包含面积均是一定范围内测量值出现的概率P P 正态分布:正态分布:P P 随随u u 变化;变化;u u 一定,一定,P P一定一定 t t 分布:分布:P P 随随 t t 和和f f 变化;变化;t t 一定,概率
11、一定,概率P P与与f f 有关,有关,xusxtutf注:为总体均值为总体均值 为总体标准差为总体标准差S S为有限次测定值的标准差为有限次测定值的标准差f=n-1f=n-1两个重要概念两个重要概念置信度置信度(置信水平置信水平)P)P:某一某一 t t值时,测量值出现在值时,测量值出现在t ts s范围范围 内的概率内的概率显著性水平显著性水平:落在此范围之外的概率落在此范围之外的概率 =1-Pt tp,fp,ft t0.95,10 0.95,10 表示置信度为表示置信度为95%95%、自由度为、自由度为1010的的t t值值t t0.90,40.90,4 表示置信度为表示置信度为90%9
12、0%、自由度为、自由度为4 4的的t t值值t t 分布值表分布值表 t(f)f显显 著著 水水 平平 0.50 *0.10 *0.050.0111.006.3112.7163.6620.822.924.309.9330.772.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.36200.691.732.092.850.671.641.962.58二、平均值的置信区间二、平均值的置信区间 置信区间:置信区间:一定置信度下,以测量结果为中心,包括总体均值一定置
13、信度下,以测量结果为中心,包括总体均值 的可信范围。的可信范围。平均值的置信区间:平均值的置信区间:一定置信度下,以测量结果的均值为中心,一定置信度下,以测量结果的均值为中心,包括总体均值的可信范围。包括总体均值的可信范围。置信限:置信限:置信区间的界限。置信区间的界限。置信区间范围越小,测定准确度越高置信区间范围越小,测定准确度越高(1 1)由单次测量结果估计)由单次测量结果估计的置信区间的置信区间(2 2)由多次测量的样本平均值估计)由多次测量的样本平均值估计的置信区间的置信区间(3 3)由少量测定结果均值估计)由少量测定结果均值估计的置信区间的置信区间 nstxstxxx =x=xu u
14、(,)xuxunn 例例:分析铁矿石中分析铁矿石中w w(Fe)(Fe)的结果的结果:n=4,x=35.21%,=0.06%求求:的的95%95%置信区间。置信区间。0.0510.95,0.05,1.960.06%0.06%(35.21%1.96,35.21%1.96)44(35.15%,35.27%)u (,)xuxunn 解解:的置信区间为的置信区间为x例:例:测测w(Fe):n=4,=35.21%,s=0.06%求求:(1):(1)置信度为置信度为95%95%时时 的置信区间的置信区间;(2)(2)置信度为置信度为99%99%时时 的置信区间的置信区间.解解:0.05(1)10.95,0
15、.05,(3)3.1895%:0.06%0.06%(35.21%3.18,35.21%3.18)44 (3 5.11%,35.1=3%)t 得得的的置置信信区区间间0.01(2)10.99,0.01,(3)5.8499(35.03%,35.):39%t 得得 的的置置信信区区间间结果表明置信度高则置信区间大结果表明置信度高则置信区间大.三、三、显著性检验显著性检验(1 1)对含量真值为)对含量真值为T T 的某物质进行分析,得到平均值的某物质进行分析,得到平均值x0 Tx(2 2)用两种不同的方法、或两台不同的仪器、或两个不同的实验)用两种不同的方法、或两台不同的仪器、或两个不同的实验 室对同
16、一样品进行分析,得到平均值室对同一样品进行分析,得到平均值021 xx21,xx问题:是由随机误差引起,或存在系统误差?问题:是由随机误差引起,或存在系统误差?0Tx021 xx显著性显著性检验检验显著性差异显著性差异非显著性差异非显著性差异系统误差系统误差校正校正随机误差随机误差正常正常显著性检验显著性检验但但,f,f1.1.平均值与标准值的比较平均值与标准值的比较t t 检验法检验法假设不存在系统误差,那么假设不存在系统误差,那么T是由随机误差引起的,测量误差应满足是由随机误差引起的,测量误差应满足t t分布,分布,0Txxsxt/nsTx,根据根据 计算出的计算出的t t 值应落在指定值
17、应落在指定的概率区间里。否则,假的概率区间里。否则,假设不满足,表明存在着显设不满足,表明存在着显著性差异。著性差异。t t 检验法的方法检验法的方法(1)(1)根据根据 算出算出t t值值;nsTx,(2)(2)给出显著性水平或置信度给出显著性水平或置信度(3)(3)将计算出的将计算出的t t值与表上查得的值与表上查得的 t tp,fp,f值进行比较,值进行比较,习惯上说习惯上说 表明有系统误差存在。表明有系统误差存在。表计tt表示表示 落在落在 为中心的某为中心的某一指定概率之外。在一次测一指定概率之外。在一次测定中,这样的几率是极小的,定中,这样的几率是极小的,故认为是不可能的,拒绝接故
18、认为是不可能的,拒绝接受。受。x例例:某化验室测定某化验室测定CaO的质量分数为的质量分数为30.43%的某样品中的某样品中CaO的含的含量,得如下结果:量,得如下结果:%05.0%,51.30,6sxn问此测定有无系统误差?问此测定有无系统误差?(给定给定 =0.05)解解:9.3605.043.3051.30nsxsxtx计算57.25,05.0ttfa,比较:比较:表计算tt说明说明 和和T T有显著差异,此测定有系统误差。有显著差异,此测定有系统误差。假设:假设:=T =T 2 2、两组平均值的比较、两组平均值的比较两个实验室对同一标样进行分析,得到:两个实验室对同一标样进行分析,得到
19、:111,snx和和222,snx假设不存在系统误差,那么:假设不存在系统误差,那么:T212)1()1(21222211212121nnsnsnsnnnnsxxtpp 是由于随机误差引起的,应满足自由度是由于随机误差引起的,应满足自由度 f f=(n=(n1 1+n+n2 2 2 2)的的 t t 分布,分布,021 xx两组平均值的比较的方法两组平均值的比较的方法1 1、F F 检验法检验两组实验数据的精密度检验法检验两组实验数据的精密度S S1 1和和S S2 2之间有无显著差异之间有无显著差异22小大计算ssF查表查表表计算FF精密度无显著差异。精密度无显著差异。2 2、t t 检验确
20、定两组平均值之间有无显著性差异检验确定两组平均值之间有无显著性差异2)1()1(21222211212121nnsnsnsnnnnsxxtpp计算查表查表2)(21nnfftta,表比较比较表计算tt非显著差异,无系统误差非显著差异,无系统误差例例:用两种不同的方法测定合金中镍的质量分数用两种不同的方法测定合金中镍的质量分数(),所得的,所得的 结果如下:结果如下:第一法第一法 1.261.26,1.251.25,1.221.22 第二法第二法 1.351.35,1.311.31,1.331.33,1.341.34试问两种方法之间是否有显著性差异试问两种方法之间是否有显著性差异(因属因属双边检
21、验双边检验,P P0.90)?0.90)?解:解:;%021.0s%,24.1x,3n111%017.0s,33.1x,4n22253.1017.0021.0ssF2222小大置信度置信度95%95%时部分时部分F F值(单边)值(单边)置信度置信度90%90%时部分时部分F F值(双边)值(双边)f大 f小23456219.0019.1619.2519.3019.3339.559.289.129.018.94 46.946.596.396.166.0955.795.415.195.054.9565.144.764.534.394.28四、可疑值的取舍四、可疑值的取舍极差极差近邻差近邻差1n1
22、nnxxxxQ1.Q 1.Q 检验法检验法 Dixons Q-testDixons Q-test(1 1)将测量的数据按)将测量的数据按nxxxx.,321其中可疑数据可能是其中可疑数据可能是X X1 1或或X Xn n。(2 2)计算)计算Q Q值:值:(3 3)由)由Q Q值表查值表查Q Qp,np,n若若XnXn为可疑值,为可疑值,若若X X1 1为可疑值,为可疑值,1n12xxxxQ(4 4)判断)判断:若若 Q Q计计QQP,nP,n 则该可疑数据应舍弃;则该可疑数据应舍弃;若若 Q Q计计 QGGGP,nP,n,说明可疑值对平均值偏离较大,则以一定的置信度说明可疑值对平均值偏离较大,则以一定的置信度将其舍去。将其舍去。x2 2、计算该组数据的平均值、计算该组数据的平均值3 3、计算统计量、计算统计量G G。和标准偏差和标准偏差s s。小结小结 随机误差的分布规律:正态分布、随机误差的分布规律:正态分布、t t分布分布 置信度与置信区间的含义,置信度与置信区间的含义,的置信区间的计算的置信区间的计算 显著性检验的含义和方法显著性检验的含义和方法(t(t检验法、检验法、F F法法)可疑值的取舍:可疑值的取舍:Q Q检验法和格鲁布斯法等检验法和格鲁布斯法等