1、第二章第二章 试验检测数据处理学习内容简介试验检测数据处理学习内容简介o 抽样检验基础抽样检验基础o 数据的处理数据的处理o 数据的处理特征与概率分布数据的处理特征与概率分布o 可疑数据的剔除可疑数据的剔除 o 数据的表达方法和数据分析数据的表达方法和数据分析 o 误差的基本概念误差的基本概念1.1.检验是什么检验是什么? ?o 检验是指通过测量、试验等质量检测方法,将工程产品与其质量要求相比较并作出质量评判的过程。o 工程质量检验是工程质量控制的一个重要环节,是保证工程质量的必要手段。第一段第一段 抽样检验基础抽样检验基础第一节第一节 检验分全数检验和抽样检验两大类检验分全数检验和抽样检验两
2、大类:。1.全数检验全数检验是对一批产品中的每一个产品进行检验,从而判断该批产品是对一批产品中的每一个产品进行检验,从而判断该批产品 质量状况质量状况,如单个产品。如单个产品。优点优点-可靠性好,缺点可靠性好,缺点:工作量大,难以实现。工作量大,难以实现。2.抽样检验抽样检验是从一批产品中抽出少量的单个产品进行检验,从而判断该是从一批产品中抽出少量的单个产品进行检验,从而判断该批产品质量状况批产品质量状况, ,如批量产品。如批量产品。 。优点优点-数理统计,很强的科学性和经济性数理统计,很强的科学性和经济性,缺点缺点:对对数理统计方法有很强数理统计方法有很强的依赖性的依赖性,要靠可靠性相关因素
3、保证要靠可靠性相关因素保证.1.1适用全数检验之场合适用全数检验之场合o 1.批量很少,抽样检验失去意义时,(比如桥梁支座)o 2.容易检验,而且效果显著者,(比如桩身完整性),o 3.不允许有不良品存在,若有不良品容易引起人命或重大伤害者,(桥梁的承载力)o 4.对生产技术没有信心又无法对顾客作质量保证时(新材料,新工艺)o 5.制程中之在制品容易引起后加工之困难,甚至造成不良品的主要因素(桥基,桥墩的坐标)1.2适用抽样检验检验之场合o 1.产量大,连续性生产无法做全数检验时(沙石材料)o 2.希望减少检验时间和经费者(路基强度)o 3.产量多,允许有某种程度之不良品存在者(路基的某些尺寸
4、)o 4.欲刺激生产者提高质量时(分项工程完工时)o 5.需做破坏性试验才能检验时(混凝土梁强度)1.3抽样检验在公路工程运用o 公路工程不同于一般产品、它是一个连续的整体,且采用的质量检测手段又多属于破坏性的。所以,就公路工程质量检验而言,对于桥梁基础,路基强度等重要构件是每项必检外,其余的量大面广的工程不可能采用全数检验,而只能采用抽样检验。o 从待检工程中抽取样本,根据样本的质量检查结果,推断整个待检工程的质量状况。抽样检验抽样检验是从一批产品中抽出少量的单个产品进行检验是从一批产品中抽出少量的单个产品进行检验第二节第二节抽样检验抽样检验概述概述o 1 1. .由来由来 二次世界大战时期
5、,美国二次世界大战时期,美国军方军方采购军火时在检验采购军火时在检验人员极度缺乏的情况下,为保证其大量购入军火的品质,人员极度缺乏的情况下,为保证其大量购入军火的品质,专门组织一批优秀数理统计专家、依据数学统计理论,专门组织一批优秀数理统计专家、依据数学统计理论,建立厂一套产品建立厂一套产品抽样抽样检验模式。满足战时的需要。检验模式。满足战时的需要。o 2.2.概念概念 o 抽样是根据抽样是根据合同或标准合同或标准所确定的方案,从被检批商所确定的方案,从被检批商品中抽取一定数量有品中抽取一定数量有代表性代表性的、用于检验的单位商品的的、用于检验的单位商品的过程,又称取样或拣样过程,又称取样或拣
6、样 。2.2抽样检验抽样检验用语用语o 总体:也称为母体,研究对象的全体。总体可以是有限的,也可以是无限的。o 个体:组成总体的每一个单位。o 样本:从总体中抽取的部分个体称为样本。o 抽样:抽取样本的过程。2.3抽样检验在公路工程中的运用o (1)(1)抽样检验可严把材料关抽样检验可严把材料关!(!(进场材料抽样检验进场材料抽样检验) )o (2)抽样检验可严把公路工程材料半成品控制抽样检验可严把公路工程材料半成品控制!(!(钢筋接钢筋接头及焊接骨架的抽样检验头及焊接骨架的抽样检验) )o (3)(3)抽样检验可严把公路工程工艺试验关抽样检验可严把公路工程工艺试验关! !o (3)抽样检验可
7、严把公路工程施工过程的质量控制关抽样检验可严把公路工程施工过程的质量控制关! !o (5)抽样检验可科学评价公路工程的质量抽样检验可科学评价公路工程的质量! !2.4:保证抽样检验可靠性相关因素保证抽样检验可靠性相关因素o 质量检验的目的在于准确判断工程质量状况,以促进工程质量的提高。下面3个因素密切相关:o o (1 1)质量检验手段的可靠性)质量检验手段的可靠性o (2 2)抽样检验方法的可行性)抽样检验方法的可行性o (3 3)抽样检验方案的科学性)抽样检验方案的科学性2.5:抽样检验分类抽样检验分类1.抽样检验分为抽样检验分为:非随机抽样和随机抽样两类。非随机抽样和随机抽样两类。2.非
8、随机抽样非随机抽样-进行人为有意识的挑选取档进行人为有意识的挑选取档可信度低可信度低3.随机抽样随机抽样-排除人为主观因素,使待检总体中每一个产排除人为主观因素,使待检总体中每一个产品具有同等被抽取到的机会。品具有同等被抽取到的机会。-数据代表性强,可靠性保数据代表性强,可靠性保证证-广泛使用广泛使用2.6随机抽样的意义o 随机抽样排除了人的主观因素,使待检总体中的每一个产品具有同等被抽取到的机会。只有随机抽取的样本才能客观地反映总体的质量状况。o 这类方法所得到的数据代表性强,质量检验的可靠性得到了基本保证。因此,随机抽样是以数理统计的原理,根据样本取得的质量数据来推测、判断总体的一种科学抽
9、样检验方法,因而被广泛使用。2.7.抽样检验方案设计方法抽样检验方案设计方法抽抽样样检检验验的的方方法法简单随机抽样简单随机抽样系统抽样系统抽样 分层抽样分层抽样 2.8抽样检验方案设计方法抽样检验方案设计方法: :简单随机抽样的应用简单随机抽样的应用o 简单随机抽样也称为纯简单随机抽样也称为纯随机抽样随机抽样,是指从总体,是指从总体N N个个单位中任意抽取单位中任意抽取n n个单位作为样本个单位作为样本, ,使每个可能的样本被使每个可能的样本被抽中的抽中的概率相等概率相等的一种抽样方式。的一种抽样方式。 o 简单随机抽样是其它抽样方法的简单随机抽样是其它抽样方法的基础基础, , 在理论上最在
10、理论上最容易处理容易处理, ,而且当总体单位数而且当总体单位数N N不太大不太大时时, ,实施起来并不实施起来并不困难。困难。o 但在实际中但在实际中, ,若若N N相当大时相当大时, ,简单随机抽样就不是很容易简单随机抽样就不是很容易办到的。首先它要求有一个包含全部办到的。首先它要求有一个包含全部N N个单位的抽样框;个单位的抽样框;其次用这种抽样得到的样本单位较为分散其次用这种抽样得到的样本单位较为分散, ,调查不容易调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多实施。因此,在实际中直接采用简单随机抽样的并不多。抽样方法抽样方法随机抽样随机抽样指总体中每一个个体都有同等可能的机
11、会被抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。抽样当品种不多时,随机抽样是一种有效的抽样方法;2.9抽样检验方案设计方法抽样检验方案设计方法: :系统抽样的方法系统抽样的方法o 系统抽样系统抽样就是把总体的元素编号排序后,再计算就是把总体的元素编号排序后,再计算出某种间隔,然后按一固定抽取元素来组成样本的方法。出某种间隔,然后按一固定抽取元素来组成样本的方法。o 适合用于总体及样本规模都较大的情况。它与简单随机适合用于总体及样本规模都较大的情况。它与简单随机抽样一样都要有完整的抽样框。抽样一样都要有完整的抽样框。o 比如
12、在比如在30003000名学生中抽取名学生中抽取100100名,则先将这名,则先将这30003000名的名名的名单依次编上编号,再根据公式单依次编上编号,再根据公式K K(抽样间距)(抽样间距)=N=N(总体(总体规模)规模)/n/n(样本规模)(样本规模)=3000/100=30=3000/100=30,即每隔,即每隔3030名抽名抽1 1名。名。 抽样方法抽样方法系统抽样系统抽样从总体中每隔K个个体抽取一个个体的抽样方法,比值K是总体容量N与样本容量n之比;当产品特别多时,并且易作某种次序的整理时,系统抽样比分层当产品特别多时,并且易作某种次序的整理时,系统抽样比分层抽样好;抽样好; 1,
13、 2, . K K+ 1, K+2, ., 2K 2K + 1, 2K+2, ., 3K 直到 N为止例,从具有1000个个体的总体中抽取50个个体。2.10抽样检验方案设计方法抽样检验方案设计方法: :分层抽样的方法分层抽样的方法o 分层抽样分层抽样是要先把所有元素按某种特征或标志是要先把所有元素按某种特征或标志(比如年龄、性别、职业或地域等)划分成几个类型或(比如年龄、性别、职业或地域等)划分成几个类型或层次,在在其中采用前两种方法抽取一个子样本,所有层次,在在其中采用前两种方法抽取一个子样本,所有子样本构成了总的样本。子样本构成了总的样本。o 比如,在以学校进行抽样调查,可先把总体分为男
14、生和比如,在以学校进行抽样调查,可先把总体分为男生和女生,然后,采用简单随机抽样方法或系统抽样的方法,女生,然后,采用简单随机抽样方法或系统抽样的方法,分别从男生和女生中各抽分别从男生和女生中各抽100100名,这样,由这名,这样,由这200200名学名学生所构成的就是一个由分成抽样所得到的样本。生所构成的就是一个由分成抽样所得到的样本。 抽样方法抽样方法分层抽样分层抽样分层抽样是先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。抽样样本当到货产品较多时,分层抽样是一种有效的抽样方法;当到货产品较多时,分层抽样是一种
15、有效的抽样方法;2.11随机抽样检验举例随机抽样检验举例 不断移动的不断移动的物品在抽取样本时,可用一定间隔的抽取样本或设定时间物品在抽取样本时,可用一定间隔的抽取样本或设定时间抽取样本方法,但一定间隔本身也要随机规定为宜抽取样本方法,但一定间隔本身也要随机规定为宜“此可谓时间分布均此可谓时间分布均均性。均性。 在已经在已经包装好包装好零部件的箱中取样尽可能用上、中、下层均等取样零部件的箱中取样尽可能用上、中、下层均等取样 ,如纸箱是一捆捆包装的从顶部抽样当然方便、但并不合理。如纸箱是一捆捆包装的从顶部抽样当然方便、但并不合理。 如果是如果是流体物品流体物品、尽可能搅拌均勺后再取样。、尽可能搅
16、拌均勺后再取样。 按按比例抽样比例抽样,如果组成,如果组成个批的产品的原材料来源不同、生产日期个批的产品的原材料来源不同、生产日期与班组不问。有可能对产产品品质有较大影响,此时应把此批产品分为与班组不问。有可能对产产品品质有较大影响,此时应把此批产品分为若干层按比例在各层抽险即是尽可能抽检到每批材料、每个生产日若干层按比例在各层抽险即是尽可能抽检到每批材料、每个生产日期与每个班组期与每个班组。2.12抽样的方法应用举例抽样的方法应用举例例:假如有一批产品,共例:假如有一批产品,共100箱,每箱箱,每箱20件,从中选择件,从中选择200个样品,个样品,方法如下:方法如下:1单纯随机抽样单纯随机抽
17、样-在总体中,直接抽取样本的方法,如从整批中,任在总体中,直接抽取样本的方法,如从整批中,任意抽取意抽取200件。件。2系统随机抽样系统随机抽样-有系统地将总体分成若干部分,然后从每一个部分有系统地将总体分成若干部分,然后从每一个部分抽取一个或若干个个体,组成样本,如从整批中,先分成抽取一个或若干个个体,组成样本,如从整批中,先分成10组,每组,每组组10箱,然后分别从各组中任意抽取箱,然后分别从各组中任意抽取20件。件。3分层抽样分层抽样-将工程或工序分成若干层,如从整批中,分别从每箱中将工程或工序分成若干层,如从整批中,分别从每箱中任意抽取任意抽取2件。件。4密集群抽样密集群抽样-不适合公
18、路工程,如从整批中,任意抽取不适合公路工程,如从整批中,任意抽取10箱,对这箱,对这10箱进行全数检验。箱进行全数检验。2.132.13抽样的方法应用抽样的方法应用公路工程质量检验举例举例o 抽样检验的目的,就是根据样本取得的质量数据来推测样本所属的一批产品或工序的质量状况,并判断该批产品或该工序是否合格。o 根据公路工程质量检验评定标准(JTJ071一98),公路工程质量评定采用合格率与评分的方法,也就是根据检测值是否符合质量标准进行评定,按合格率计分。o 对于路基路面压实度、弯沉值,路面结构层厚度,半刚性基层材料强度,水泥混凝土抗折强度等检验项目,应采用数理统计的方法进行评定计分。第二段第
19、二段 数据的处理数据的处理1.11.1有效数字含义有效数字含义o 有效数字:有效数字就是实际能测到的数字。o 有效数字的位数与分析过程所用的分析方法、测量方法、测量仪器的准确度有关。我们可以把有效数字这样表示:o有效数字所有的可靠的数字+ 一位可疑数字表示含义:如果有一个结果表示有效数字的位数不同,说明用的称量仪器的准确度不同。1.21.2有效数字含义在各学科中的不同解释有效数字含义在各学科中的不同解释1.数学观点数学观点:有效数字是一个近似数的精度有效数字是一个近似数的精度,有效数字的位有效数字的位数越多数越多,相对数字的位数越多相对数字的位数越多,相对相对(绝对绝对)误差就越小。误差就越小
20、。2.科学实验中两类数:科学实验中两类数:一类数是其有效位数均可认为无限制,即它们的每位数一类数是其有效位数均可认为无限制,即它们的每位数是确定的,如是确定的,如。另一类数是用来表示测量结果的数,其末位数往往是估另一类数是用来表示测量结果的数,其末位数往往是估读得来,有一定的误差或不确定性。读得来,有一定的误差或不确定性。1.31.3有效数字含义在测量中的解释有效数字含义在测量中的解释 1. 1.在正常量测时一般只能估读到仪器最小刻度的在正常量测时一般只能估读到仪器最小刻度的1/101/10。 2. 2.量测结果数字位数太多,会超出仪器精度范围,不必太多。量测结果数字位数太多,会超出仪器精度范
21、围,不必太多。 3. 3.如游标卡尺测圆柱直径为如游标卡尺测圆柱直径为32.47mm32.47mm,此数值前三位是确定的数字,此数值前三位是确定的数字,而第四位是估计值,称此数值有效数字为四位。而第四位是估计值,称此数值有效数字为四位。 1.41.4有效数字含义在测量中的解释有效数字含义在测量中的解释4.4.有效数字有效数字-由数字组成的一个数,除最末一位数是不确切值或可由数字组成的一个数,除最末一位数是不确切值或可疑值外,其余均为可靠性正确值,则组成该数的所有数字包括末疑值外,其余均为可靠性正确值,则组成该数的所有数字包括末位数字在内称为有效数字,除有效数字外,其余均为多余数字。位数字在内称
22、为有效数字,除有效数字外,其余均为多余数字。8.8.对于对于0 0这个数字,可能是有效数字,也可能是多余数字,如这个数字,可能是有效数字,也可能是多余数字,如30.05 30.05 1.02010 0.00320 120001.02010 0.00320 120009.9.一般约定,末位数的一般约定,末位数的0 0指的是有效数字。如指的是有效数字。如32.470mm32.470mm2.5定义:数字修约 修约规则o 在进行具体的数字运算前,通过省略原数值的最后若干位数字,调整保留的末位数字,使最后所得到的值最接近原数值的过程称为数字修约。o 指导数字修约的具体规则被称为数字修约规则o 数值修约时
23、应首先确定“修约间隔(要几位数)”和“进舍规则(如何进位)”一经确定,修约值必须是“修约间隔”的整数倍。然后指定表达方式,即选择根据“修约间隔”保留到指定位数2.6修约间隔(要几位数) : 修约间隔(要几位数)是指确定修约保留位数的一种方式。修约间隔的数值一经确定,修约值即应为该数值的整数倍。o 例如指定修约间隔为0.1,修约值即应在0.1的整数倍中选取,相当于将数值修约到一位小数o 修约数字时只允许一次修约,不能分次修约2.7数值修约进舍规则简介o (1)撰写文稿时常常需要对测定和计算的所得数值进行修约。o (2)过去简单地采用“ 四舍五人”的方法不够精确。应依据任数值的修约规则, 按“四舍
24、六入五看齐, 奇进偶不进”的方法修约。o 拟舍弃数字的最左一位数字小于5不含5时, 则舍去, 即保留的各位数字不变。o 例如:将12.1498修约到一位小数, 得12.1。将12.1498修约到两位有效数字, 得122.82.8有效数字修约举例有效数字修约举例例:将下列数字修约为4位有效数字。 修约前修约后 o0.526647-0.5266o0.36266112-0.3627o10.23500-10.24o250.65000-250.6o18.085002-18.09o351746-35172.9修约间隔修约间隔修约间隔是指确定修约保留位数的一种方式修约间隔是指确定修约保留位数的一种方式 ,修
25、约值为该数值的,修约值为该数值的整数倍。整数倍。0.5单位修约指修约间隔为指定数位的单位修约指修约间隔为指定数位的0.5单位,即修约到指定数单位,即修约到指定数位的位的0.5单位。单位。0.2单位修约是指修约间隔为指定数位的单位修约是指修约间隔为指定数位的0.2单位,即修约到指定单位,即修约到指定数位的数位的0.2单位。单位。2.102.10修约间隔举例修约间隔举例o 例1:将下表中的数值(A)修约到个数位的0.5单位。2.11数值修约注意事项数值修约注意事项拟舍去的数字并非单独的一个数字时,不得对该数值拟舍去的数字并非单独的一个数字时,不得对该数值连续进行修约,连续进行修约,例如例如 ,将,
26、将15.4546修约成整数时,修约成整数时,不应按不应按15.454615.45515.4615.516进行进行,应按应按15.454615进行修约。进行修约。第三节第三节数据的统计特征与概率分布数据的统计特征与概率分布3.1数据的统计特征量数据的统计特征量1.用来表示统计数据分布及其某特性的特征量分为两类:用来表示统计数据分布及其某特性的特征量分为两类:2.一类表示数据的集中位置,如算术平均值、中位数等一类表示数据的集中位置,如算术平均值、中位数等3.一类表示数据的离散程度,主要有极差、标准离差等一类表示数据的离散程度,主要有极差、标准离差等4.两类的联合:变异系数等两类的联合:变异系数等1
27、.算术平均值算术平均值 算术平均值是表示一组数据集中位置最有用的统计特征量,经常用算术平均值是表示一组数据集中位置最有用的统计特征量,经常用样本的算术平均值来代表总体的平均水平。样本的算术平均值则样本的算术平均值来代表总体的平均水平。样本的算术平均值则用用 表示表示。niixnx11x1.1.算术平均值算术平均值例1o 说明某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测值(共10个测点)分别为58,56,60,53,48,54,50,61,57,55(摆值)。求摩擦系数的算术平均值。o 解:由上式知,摩擦系数的算术平均值为:2.中位数中位数 在一组数据,按其大小次序排序,以排在正中间的一个数
28、表示总体在一组数据,按其大小次序排序,以排在正中间的一个数表示总体的平均水平,称之为中位数,或称中值,用的平均水平,称之为中位数,或称中值,用 表示。表示。o n 为奇数时,正中间的数只有一个;为奇数时,正中间的数只有一个;o n为偶数时,正中间的数有两个,取这两个数的平均值作为中位为偶数时,正中间的数有两个,取这两个数的平均值作为中位数数.)(21)(21221为偶数为奇数nxxnxxnnnx2 2中位数中位数值值例1o 说明某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测值(共10个测点)分别为58,56,60,53,48,54,50,61,57,55(摆值)。求摩擦系数的中位数中位数o
29、解:由上式知,摩擦系数的中位数中位数为:55.53.极差极差 只反映产品的平均水平是不够的,需了解数据波动范围的大小,可只反映产品的平均水平是不够的,需了解数据波动范围的大小,可用极差表示,表示在一组数据中最大值与最小值之差,记作用极差表示,表示在一组数据中最大值与最小值之差,记作 RminmaxxxR.极差极差例1 o 说明某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测值(共10个测点)分别为58,56,60,53,48,54,50,61,57,55(摆值)。求摩擦系数的极差极差o 解:由上式知,摩擦系数的极差极差为:61-48=134.标准偏差标准偏差standard deviation
30、标准偏差有时也称标准离差、标准差或称均方差,它是衡量样本数据标准偏差有时也称标准离差、标准差或称均方差,它是衡量样本数据波动性(离散程度)的指标。在质量检验中,总体的标准偏差波动性(离散程度)的指标。在质量检验中,总体的标准偏差()一般不易求得。常用样本的标准偏差)一般不易求得。常用样本的标准偏差S。1)(12nxxSnii. .标准偏差标准偏差例1 o 说明某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测值(共10个测点)分别为58,56,60,53,48,54,50,61,57,55(摆值)。求摩擦系数的标准偏差标准偏差o 解:由上式知,摩擦系数的标准偏差标准偏差为:4.135.变异系数变
31、异系数coefficient 标准偏差是反映样本数据的绝对波动状况,当测量较标准偏差是反映样本数据的绝对波动状况,当测量较大的量值时,绝对误差一般较大;测量较小的量值时,大的量值时,绝对误差一般较大;测量较小的量值时,绝对误差一般较小。因此,用相对波动的大小,即变异绝对误差一般较小。因此,用相对波动的大小,即变异系数更能反映样本数据的波动性。变异系数用系数更能反映样本数据的波动性。变异系数用C CV V表示表示S为标准偏差为标准偏差, 算术平均值。算术平均值。 。 xSCv变异系数变异系数例1 o说明某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测值(共10个测点)分别为58,56,60,53
32、,48,54,50,61,57,55(摆值)。求摩擦系数的变异系数变异系数o解:由上式知,摩擦系数的变异系数变异系数为:4.13/55.2X100=7.48%o例:甲路段例:甲路段 C CV V = 4.13/52.2 =7.48% ,S = 4.13/52.2 =7.48% ,S甲甲=4.13 =4.13 乙路段乙路段 C CV V =4.27/60.8 =7.02%,S =4.27/60.8 =7.02%,S乙乙=4.27=4.27o从标准偏差看从标准偏差看, S, S甲甲 S S乙乙。但从变异系数分析,。但从变异系数分析,o V V甲甲 V V乙乙,说明甲路段的摩擦系数相对波动比乙路段的
33、大,面,说明甲路段的摩擦系数相对波动比乙路段的大,面层抗滑稳定性较差。层抗滑稳定性较差。 第二节第二节 可疑数据的取舍原则可疑数据的取舍原则o 由检测人员提供的测定数据, 有时在同一样本数据中, 往往可能有一个或数个过大或过小的数据。过去检测人员根据主观的判断加以取舍。结果,数据的取舍因人而异,缺乏统一的准则,给工程质量的评定带来了一定的随意性。o 近年来,工程人员在进行分析数据之前,应用数理统计方法判别其真伪,并决定取舍,常用的方法有拉依达法、肖维纳特法、格拉布斯法等。其中应用格拉布斯法进行可疑数据取舍,能使检测人员所提供的检测报告中的成果资料和数据相对可靠。2.12.1、拉依达法、拉依达法
34、( (三倍均方差法三倍均方差法) )o 拉依达法拉依达法假定测量结果服从正态,根据顺序统计量来确定可疑数据的取舍。做n 次重复试验,测得结果为x1,xi,xn,服从正态分布。o 为了检验xi(i=1,2,n)中是否有可疑数据,可将xi按其值由小到大顺序重新排列得:x(1)x(2)x(n)根据顺序统计原则,给出标准化顺序统计量g2.12.1、拉依达法、拉依达法( (三倍均方差法三倍均方差法) )1.当试验次数较多时,可简单地用当试验次数较多时,可简单地用3倍标准差(倍标准差(3S)作为确定可疑数)作为确定可疑数据取舍的标准。据取舍的标准。2.当某一测量数据(当某一测量数据( )与其测量结果的算术
35、平均值()与其测量结果的算术平均值( )之差大于)之差大于3倍标准偏差时,用公式表示为倍标准偏差时,用公式表示为 则该测量数据应舍弃。则该测量数据应舍弃。3. 取取3S的理由是:根据随机变量的正态分布规律,在多次试验中,的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在测量值落在 3S与与 + 3S之间的概率为之间的概率为99.73%,出现在此范围之,出现在此范围之外的概率为外的概率为0.27%,也就是在近,也就是在近400次试验中才能遇到一次,这种次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在事件为小概率事件,出现的可能性很小,几乎是不可能。因
36、而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。舍弃。xixSxxi3xx4.另外,当测量值与平均值之差大于另外,当测量值与平均值之差大于2倍标准偏差(即倍标准偏差(即 xI 2S)时,则该测量值应保留,但需存疑。)时,则该测量值应保留,但需存疑。5.5.拉依达法简单方便,不需查表,但要求较宽拉依达法简单方便,不需查表,但要求较宽, ,当试验检测次数较多当试验检测次数较多或要求不高时可以应用,当试检测次数较少时或要求不高时可以应用,当试检测次数较少时( (如如n n10),10),在一组在一组测量值中即使混有异常值,也无
37、法舍弃测量值中即使混有异常值,也无法舍弃x6.6.例例 2-7 2-7 试验室进行同配比的混凝土强度试验,其试验结果为试验室进行同配比的混凝土强度试验,其试验结果为(n=10n=10):):25.825.8、25.425.4、31.031.0、25.525.5、27.027.0、24.824.8、25.025.0、26.026.0、24.524.5、23.0MP23.0MPa a,试用,试用3S3S法判别其取舍。法判别其取舍。解:分析上述解:分析上述1010个测量数据,个测量数据,x xminmin=23.0 MP=23.0 MPa a和和xmax=31.0 MPa MPa最可疑。最可疑。故应
38、首先判别故应首先判别x xminmin和和xmax 。经计算:经计算: =25.8MPa25.8MPa,S=2.1MPa2.1MPa因因 x xmin min - - =31.0-25.8= 5.2MPa =31.0-25.8= 5.2MPa 3S = 6.3MPa3S = 6.3MPaxxmax =23.0-25.8= 2.8MPa=23.0-25.8= 2.8MPa 3S = 6.3MPa3S = 6.3MPa故上述测量数据均不能舍弃故上述测量数据均不能舍弃. .xxx2.1 格拉布斯法简介o 格拉布斯法假定测量结果服从正态,根据顺序统计量来确定可疑数据的取舍。做n 次重复试验,测得结果为
39、x1,xi,xn,服从正态分布。o 为了检验xi(i=1,2,n)中是否有可疑数据,可将xi按其值由小到大顺序重新排列得:x(1)x(2)x(n)根据顺序统计原则,给出标准化顺序统计量g:2.2 格拉布斯法简介o 当最小值可疑x(1)时,则o 当最大值可疑x(n)时,则o 式中: 测量值的算术平均值;o S测量值的标准偏差。 Sxxg11 Sxxgnn可疑数据的取舍方法格拉布斯法o 根据格拉布斯统计量的分布,在指定的显著水平(一般=0.05)下,求得判别可疑值的临界值 (,n),格拉布斯的判别标准为:o ggo(,n)o 则可疑值x(1)是异常的,应予舍去。o go(,n)称为格拉布斯系数,其
40、值列于表1 中。可疑数据的取舍方法格拉布斯法可疑数据的取舍方法格拉布斯法o 某水泥混凝土路面, 用回弹仪测定混凝土面板强度,其o 检测结果为(n=10):25.8、25.4、31.0、25.5、27.0、24.8、25.0、26.0、24.5、23.0(Mpa)。以此10 个样本数据为算例,介绍格拉布斯法在公路工程成果资料整理上对可疑数据取舍的初步应用。o 1)检测数据按从小到大排列如下:23.0,24.5,24.8,25.0,25.4,25.5,25.8,26.0,27.0,31.0。o 2)计算特征数据量 =25.8 MPa,S=2.1 MPa可疑数据的取舍方法格拉布斯法o 3)计算顺序统
41、计量o 按常规首先怀疑其中的最大值31.0 和最小值23.0 可疑,其顺序统计量分别为:可疑数据的取舍方法格拉布斯法o 由于g(10)g(1),首先判断x(10)=31.0o 4)选定显著水平=0.05,并根据=0.05 和n=10,由表1 查得:o 5)判别o 由于 ,所以x(10)=31.0为异常值,应予舍弃。o 仿照上述方法继续对余下的9 个数据进行判别,经计算没有异常值。数据的统计方法(表示方法)公路工程的运用 o 直方图直方图也称质量散布图,是展现质量散布规律的一种工具。o 在正常情况下,其散布规律为:质量散布的数值总是靠近中心值得为最多,然后向两方疏散,离中心值越远的越少。o 重要
42、用途是:阐发质量特性的散布状态,预测和控制生产历程的质量及测定工序本事,讨论正态散布图使用。数据的统计方法(表示方法)公路工程的运用o 管理图管理图也称控制图,是质量管理的重要工具,使用历程是:在生产历程举行当中,每隔肯定时间,抽取一个或几个样品,丈量其偏差,然后在事先拟订好地控制图上管理,从点的散布状态和变更趋向来推测本次事情的质量状态,同时,细密控制生产历程,实时发明异常情况,警备不及格项目孕育发生。o 重要用途是:阐发工艺历程是否稳固,控制工序质量,预防不及格出现,制止浪费,测定工序本事。频数直方图频数直方图以坐标横轴表示组距,坐标纵轴表示频数,所画出的矩形图称为频数直方图,简称直方图。
43、订货码洋订货码洋11.405 11.505 11.605 11.705 11.805 11.905 12.005 12.105 12.205 12.305 12.405 频数正常型直方图正常型直方图看直方图时应着眼于图形的整体形状,根据形状判断它是正常型还是异常型。正常型直方图具有“中间高,两边低,左右对称”的特征,它的形状像“山”,字。因此,根据客户订货特性值的频数分布所画出来的直方图是正常型时,就可初步判断为经营过程是稳定的,或供货能力是充足的。直方图在标准范围内的情况直方图在标准范围内的情况直方图的分布范围直方图的分布范围B位于标准范围位于标准范围T内,但有余量内,但有余量;直方图的分布
44、中心与标准中直方图的分布中心与标准中心近似重合,这是理想的直方图。此时,销售处于正常管理状态。心近似重合,这是理想的直方图。此时,销售处于正常管理状态。TB SL ( S )( L ) Su不正常直方图不正常直方图孤岛型直方图孤岛型直方图双峰型直方图双峰型直方图折齿型直方图折齿型直方图绝壁型直方图绝壁型直方图第六节第六节 误差的基本概念误差的基本概念基本概念基本概念基本概念一、误差一、误差1绝对误差绝对误差-实测值与被测之量的真值之差,即实测值与被测之量的真值之差,即绝对误差的性质:绝对误差的性质:(1)有单位的,与测量时采用的单位相同。)有单位的,与测量时采用的单位相同。(2)能表示测量的数
45、值是偏大还是偏小以及偏离程度。)能表示测量的数值是偏大还是偏小以及偏离程度。(3)不能确切地表示测量所达到的精确程度)不能确切地表示测量所达到的精确程度0LLL2相对误差相对误差(1)定义指绝对误差与被测真值(或实际值)的比值)定义指绝对误差与被测真值(或实际值)的比值(2)相对误差不仅表示测量的绝对误差,而且能反映出测量时达到)相对误差不仅表示测量的绝对误差,而且能反映出测量时达到的精度。的精度。(3)性质:)性质:是无单位的,通常以百分数表示,而且与测量所采用的单位无关。是无单位的,通常以百分数表示,而且与测量所采用的单位无关。而绝对误差,则测量单位改变,其值也变。而绝对误差,则测量单位改
46、变,其值也变。能表示误差的大小和方向,相对误差大时,绝对误差也大。能表示误差的大小和方向,相对误差大时,绝对误差也大。能表示测量的精确程度。能表示测量的精确程度。(4)通常用相对误差来表示测量误差。)通常用相对误差来表示测量误差。%100%1000LLLL三、误差的来源三、误差的来源误差原因:误差原因:1装置误差装置误差-设备本身设备本身2环境误差环境误差-如温度、湿度等如温度、湿度等3 3人员误差人员误差-个人习惯和生理引起的个人习惯和生理引起的4 4方法误差方法误差-未按操作方法引起的未按操作方法引起的注:由不同的人,在不同的实验室,使用不同仪器,按照规定试验方注:由不同的人,在不同的实验
47、室,使用不同仪器,按照规定试验方法,误差属于法,误差属于再现性再现性。四、误差的分类四、误差的分类误差就其性质而言,分为系统误差、随机误差(或称偶然误差)和过误差就其性质而言,分为系统误差、随机误差(或称偶然误差)和过失误差(或称粗差)失误差(或称粗差)1系统误差系统误差-在同一条件下,多次重复测试同一量时,误差的数值和在同一条件下,多次重复测试同一量时,误差的数值和正负号有较明显的规律。正负号有较明显的规律。-在测试前已存在,且在试验过程中,在测试前已存在,且在试验过程中,始终偏离一个方向,在同一试验中其大小和符号相同。(始终偏离一个方向,在同一试验中其大小和符号相同。(检测装置检测装置本身
48、性能不完善本身性能不完善)2随机误差随机误差-在相同条件下,多次重复测试同一量时,出现误差的数在相同条件下,多次重复测试同一量时,出现误差的数值和正负号没有明显的规律,它是由许多难以控制的微小因素造成值和正负号没有明显的规律,它是由许多难以控制的微小因素造成的。(的。(其中测量方法不完善,测量者对仪器使用不当,环境条件变其中测量方法不完善,测量者对仪器使用不当,环境条件变化化)3 过失误差过失误差-明显地歪曲试验结果,如测错、读错、记错或计算错误明显地歪曲试验结果,如测错、读错、记错或计算错误等。等。五、精密度、准确度和精确度五、精密度、准确度和精确度1只有当系统误差和随机误差都很小时才能说精确度高。精确度是只有当系统误差和随机误差都很小时才能说精确度高。精确度是对系统误差和随机误差的综合描述。对系统误差和随机误差的综合描述。2不能说数值越多,精确度越高。不能说数值越多,精确度越高。