1、1确定目标选择分析的程序、分析的数量、取样的部位、时间和费用的限制、可使用的人员和设备收集样本、减少合适的测试部分完成初步的工作(溶解、调整条件分离干扰物),从测试部分取得数据从数据选取最佳值,估计数值的可靠性,评定模型的正确性,若有需要修正模型的正确性并重复整个过程模型计划样本分析评定图1 一个总的分析过程24-1 采样的基本概念和理论 采样理论是指如何进行试样采集的数理统计理论。研究取样方式和样本类型的目的是选取尽可能少的样本而使所获得的结果又能最大程度地反映被研究总体。4-1-1 随机采样与随机样本 1 概念: 指等概率地从总体中采集的试样。目标总体:欲根据采样与分析作出相应结论的目标对
2、象;母总体:实际被采集试样的对象。二者之间很少一致,随机采样是一种尽可能缩小这种差别的方法。即总体的每一部分都有相等的被选概率。3 随机取样是有一定难度的,任意取的一个样本不是一个随机样本。另一方面,通过一定的规则选择的样本很可能表现出该规则的系统误差,甚至在很有利的情况下都会发生无意识的选择和系统误差。4实际应用:将分析对象全体划分成不同编号的部分,再根据随机数表进行采样。例:有80瓶构成一个总体,现要随机取样10个样本,首先把80瓶随机编号,然后从随机数表的任一部分相邻取数。例可得到37,78,16,06,57,12,46,22,90,97。再往下取两位数字78,67;再往下取一位数字39
3、,这样构成10个数字: 37,78,16,06,57,12,46,22,67,395表1 部分随机数表:05 57 23 06 26 23 08 66 16 11 75 28 81 56 14 62 82 45 65 80 36 02 76 55 63 37 78 16 06 57 12 46 22 90 97 78 67 39 06 63 60 51 02 07 16 75 12 90 41 16 23 71 15 08 82 64 87 29 01 20 46 72 05 80 19 27 47 15 76 51 58 67 06 80 54 42 67 98 41 67 44 28 71
4、 45 08 19 47 76 30 26 72 33 69 92 51 95 23 26 85 76 05 83 03 84 32 62 83 27 48 83 09 19 84 90 20 20 50 87 74 93 51 62 10 23 30 67 以均匀间隔从无规样本中取样常被用来代替随机取样,但由于该方法比随机取样更会产生系统误差,所以不推荐使用。8)/)(/(/) 1 () 1 ()/(/2s2s20222a2s20sassaassnnnnnn式可写作则设 2 随机取样的理论分析对于随机采样,如果ns个样本中的每一个被分析了na次则其总方差0为:9从此式我们可以得出下述结论:(
5、1)对于给定的、ns和na,总方差将随采样方差增加而增加;(2)对于给定的总分析次数(ns na ),如不考虑分析成本,则随机采样应尽可能保证采样次数多。如对6个随机样本进行两次分析要比对4个随机样本进行3次分析的总方差要小。(3)随机采样的总方差是的线性函数。 当很小,即分析测定的方差比采样方差小得多时,(/na)(s2/na)比起( s2/ns)来就可以忽略。对于这样的情况,Youden指出,当分析误差下降到采样误差的1/3或更低时,再进一步改善分析误差已无意义,即宁可使用快速简便的、精密度不高但能与采样误差匹配的方法进行分析。)/)(/(/2s2s20sasnnn1012)3(43434
6、12)2(626262222022220ssssss次方差分析个随机样品进行次方差分析个随机样品进行113 在总成本要求下分析 次数和采样次数的计算2202a202s2a2s20s)(0)2()(/(/1)/(/) 1 (CCCassaaaaaasasassaasssaCCndndCnCnCnCnnnnCnnCnC得令最佳的样本分析次数:条件下使总成本最小时,可得到在固定方差进行微分并令其等于零对此式就)得:带入式(得考虑式:为:则总成本:和分别为和分析一次试样的成本设采集一个样本的成本aassCnCCn122022/)(2,aassaassaasssnnCnCCnCnnCnCn)式代入得:将
7、(得由求采样的数目134-1-2 规则取样与规则样本(系统采样)系统采样指为了检验某些系统假设而采集的试样。 例如材料组分随时间、温度或空间位置不同而呈现变化。一般是间隔一定的区间(时间、空间、区域)采样,间隔不一定是等距的,有时事先可预期总体成分是不均匀的,系统采样要尽量减少这种不均匀性的影响。对于这样的情况可采用分层采样。 如果以规则的方式收集这种样本,则每个样本都可认为是代表一个在具体条间下的独立的分立总体。但是,所得的结果仍然可用统计的方法来测定差异的显著性。14 例如:分析一个大容器内的粉末样本时,因为已知粉末物质由于粒度和重度的不同,有分层作用,影响粉末物质的均匀性。所以取样时,是
8、从上、中、下三个部位取样。对棒状材料取样时,往往在两端、1/4、1/2和3/4五个部位横向取样,同时对横截面进行取样。 又如:对土壤中某些物质进行普查时,应按土壤类型、成土母质、成土过程和成土条件等分区取样,这样可达到取较少的样本而分析结果又能反映总体真实情况的目的。154-1-3 分层采样 当分析对象可划分为若干采样单元时,可随机从总体的全体采样,亦可分层或分步采样。 当被划分的各采样单元之间试样成分的变化显著大于每一单元内部成分变化的情况时,分层采样是最好的选择。 分层采样是先将分析对象划分成不同的部分或层,然后对不同的层次进行随机采样。此时总方差为:)/()/(/22220asbasbs
9、bbnnnnnn层数nb每层采样次数ns每个样品分析次数na16 这些方差都是未知的,但如果对所有采样样本都进行分析以后,通过方差分析的方法就可将他们分别估计出。设xkji表示第k层的第j个样品的第i个某一目标的化学成分测定值。 表示第k层的第j个样品的测定均值,对于整个分层采样的过程,我们有nbnsna个样本,则 的估计值可由下式给出:kjx2aanikjikjasbnknjnikjkjinxxnnnxxabsa11112a) 1()(V222,asb17估计值。是试误差相对独立,则与分析测的贡献。如设采样误差它还包含了的估计,总体采样方差这样的计算已不是单纯估计可得到层内的采样方差层对于第
10、)/(V) 1()(,12221112aasSassnjkjksbnknjkkjsbnVnxxnnxxVnsbs18的估计值。是,分析测试的方差的贡献它还包含了层内采样和的估计值,并不就是同理,这样计算的方差式求出:对于层间方差,可由下)/()/(1)(2222111112asassbbsnjkjkasbnknjnikjibnkkbnnnnxxnnnxxnxxVsbsab19bsabsbbsabsabsabsabsbbsabsanknjnikjkjinknjkkjankkasnknjnikkjkjinknjnikkkjnknjnikkjkjkjinknjnikjkjinknjkkjankkas
11、nknjnikkkjkjkjinknjnikjiasbxxxxnxxnnxxxxxxxxxxxxxxxxnxxnnxxxxxxxxnnn11121121211111111111121121211121112)()()()(2)(2)(2)()()()()()()(解式:有如下的离差平方和分样本的离差平方和,实际上,对于所有的200)(0)()(2)(211111111111bsabsabsbsanknjnikjkjinknjnikjkjinknjkjanknjnikjkjkjixxxxxxnxxxx其中交叉项:210)(20)(2)(2)(222)(2111111111111111111111
12、1bsabsbssasabssaabsbbsanknjnikkjkjkjiksksnkkanjkksnkkaasnjnjnikjianjnikjinkkanjasnjnikjianikjinkkanjkkjnkkanknjnikkkjxxxxxnxnxxnxxnxxnnnxnxxxnnnxnxxxnxxxxnxxxx交叉相:)()()()()()()(交叉项:22bsabsbbsanknjnikjkjinknjkkjankkasasbnknjnikjixxxxnxxnnxnnnx11121121221112)()()(21112211121112111111211121111112211121
13、112222)2()xnnnxxnnnxnnnxxxxxxxxxxxxxxxxasbnknjnikjiasbasbnknjnikjinknjninknjnikjinknjnikjinknjninknjnikjinknjnikjikjinknjnikjinknjnikjibsabsabsabsabsabsabsabsabsabsa(2324 如果分析对象是均匀分布的总体,分层采样将等同于随机采样,但如果层间方差与层内方差显著不同时,分层采样将明显优于随机采样。25例:某生产过程需要控制产品的水分含量,采样测得水含量为25个单位,标准偏差为6个单位(以0.1%为一个单位)。此结果被认为不合格,波动
14、性过大。工程技术人员认为是分析结果不可靠,而分析人员认为是过程控制不当,产品质量不稳定。 采样分析的过程如下:从大宗批量中随机选取15批(b=15),每批采2个样(s=2),每个样做两次分析(a=2)即共作60次分析。262713. 7,53.28,92. 0222bsa从该表可以算得28 可见最大的方差来源于采样一步。分析测试结果的方差不大,而工艺流程中批之间的波动大致也是合格的。检查原因发现,按采样规程规定,对每批试样,均应随机选取5个滚筒,从每个滚筒中用特制的取样器垂直切取能代表各层次的产品,将5份试样充分混合后,再从中取样。但这项规定在采样中并未得到遵循,每批样仅从一个滚筒中取样置于样
15、瓶中即作为该批试样的代表样。解决采样问题重新采样进行分析后,测试结果指标显示产品是正常合格的。 13. 7,53.28,92. 0222bsa从该表可以算得29当各个小总体或各个层的大小和方差都不等时,要想使总体平均值的估计无偏及估计值的方差最小,从每层中选取的样本数与层的大小及其标准偏差成正比:例:一批由相同数目的1L和5L容器组成的石油货品,1L容器中硫含量为1010-6,标准偏差为210-6, 5L容器中硫含量为1510-6,标准偏差为310-6,如果分析误差可以忽略不计,那么为了能以最小采样误差求得该货品硫含量的无偏估计值,对于总计24个样本来说,最佳的采样方法是什么?niiiiiiw
16、wnn100)()(302042442421324310351021241021)()()(51221112666120210110121121nwwwnnnwwwnnnww为:那么简单代表采样方案略不计,如果各层的方差可以忽层的大小:31 例如:有8筒粉末样品,可设想将之分装到960000个小瓶中,即使随机抽取1%的样本,也要分析9600瓶。现采用分层采样方法,8筒之间的差异要比一筒内部的差异大,所以8筒中均要抽样;一筒内部的差异主要由粉状物质的粒度和重度等不完全一致所造成的,因此从一筒的上、中、下三个部位取样能充分反映筒内的不均匀性;进一步想象,筒中上、中、下三部分各由100层构成,每层中
17、的粉末物质都要分装到400只瓶子中去,可以合理地认为400只瓶子间是均匀一致的,即400瓶中任意一瓶都代表本层。在100层中若用随机数表抽取5%的样本,这样只需分析120瓶(835)即可。分析样本减少到原来的1.25%,然而仍能保持分析结果的可靠性。随机取样与分层取样的结合324-1-4 代表性采样与代表样本 代表性采样一般是指特定的分析项目所设计的采样。 “代表样本”这个术语经常用来表示能显示总体平均特性的单个样本,显然这样的样本不能用随机方式选取。一个名副其实的代表样本仅适用于两种情况:1)这是对某特定目的事先定义具有代表性的样本。例如,美国危险废物管理系统规定七条对废物(包括粘稠液体、固
18、体、污染液、蓄水池中的污染液等)的取样规则,按这些规则取得的样本,美国环保局认为是废物的代表。332)是对真正均匀样本的取样。 虽然测量代表样本可以降低分析的价格,但由此获得的信息一般不如从总体的随机样本中获得的信息多。但有一种情况例外,即在取样前已化大力气将总体搞均匀了。 总体的均匀化是困难的,通常只有在为了产生几个具有相似基本特性的子样时,才采用这种方法。344-1-5 复合样本 复合样本可以看作是产生一个代表样本的特殊方式。许多取样步骤基于如下假设:要求信息仅仅是平均组分,它们可以通过测量适当制备或收集的复合样本而获得。 精心制备固体复合样本的步骤包括成熟的甚至已经标准化的粉碎、碾磨、混
19、合和掺和。35 4-1-6 子样:对于单次测定的要求来讲,分析实验室所收到的样本一般过大,需要取子样才能进行测定。为了重复测定或为了用不同的技术测定不同的组分,需要从样本中取出所需要的实验部分。为了使结果互相一致,这样的试验部分必须十分相似。364-2 质量检验的采样方法松分布、超几何分布)概率分布:离散型(泊标检验适用范围:一般质量指是否合格缺陷数来判断一批产品中不合格数或定义:根据综合性样本态分布)概率分布:连续型(正验破坏性检验适用范围:质量指标检产品是否合格。或样本方差来判断一批指标的样本均值定义:根据不同的质量计数抽样检验计量抽样检验质量检验采样方法371x- x不同精密度测量值的正
20、态不同精密度测量值的正态 分布曲线分布曲线2 2 1 0222/)(21)(xexfyY计量抽样检验(Sampling of Variables) 在考虑这种检验的采样时,首先需要确定合格产品的相应定量标准,今假设待测组分含量这一变量服从正态分布,并设产品中有效成分x的最低含量标准为x0,抽样检验的标准差为,可计算对应于任意真实含量的x的u值,即标准正态分布值。)(0 xxu38 从标准正态分布可计算实际含量为 x 时,该批试样被接受的概率P。例如:某工厂购买氟硅酸原料,要求H2SiF6的含量不得低于350g/L,分析方法单次测定的标准偏差为10g/L,根据计算得到的u值,可得下表数据。表5
21、不同实际含量x的试样被接受的概率)(0 xxu39310350360350 x被检测产品的成分实际含量,认为是真值,x0规定值。产品被接受的概率为检测值大于x0的概率。40 从表可以看到,含量为340g/L的原料有15.9%的概率被接受,如果希望这样的原料的接受概率降低至2%,可采用两种方法。第一,提高含量接受标准,从正态分布表上查,当P=2%,u=2.05,Lgxxxxu/5 .3601034005. 2000 即将接受标准改为360g/L后,在原有分析方法的偏差不变的情况下,实际含量为340g/L的原料被接受的概率将降低至2%。41方法二 改善标准偏差标准偏差与采样和测定次数相关,即:%.
22、2/340,44/1034035005. 2/:,/10,0的原料的概率降低至将接受实际含量为可在原订接受标准下次采样分析即进行解得可求得采样次数的表达式中代入将本例为准偏差为分析方法一次测定的标LgnnnxxunuLgn42 一般情况下,采样方差大于分析方差,所以“分析方法单次测定的标准偏差”可以理解为每次对产品只取一个样进行检验,多次检验之间的方差;而平均值的标准偏差可以理解为每次取多个样检验,多次检验平均值之间的标准偏差。这些方差一般由以往的数据积累而得到4444342413343332312242322211141312114321:xxxxxxxxxxxxxxxxxxxxxxxxn多
23、个采样单个采样样1样1样2样3样4平均值的标准偏差与单次测量标准偏差之间的关系43 采用序贯采样法可减少检验工作量。先取少量试样作定量分析检验,如结果显示指标显然在要求的范围内或之外,即可做出合格或不合格的判断;如果分析结果靠近指标边缘,则做进一步的采样检验,直至有把握做出判断。 序贯检验按如下步骤进行。取一组共n个试样分析得出平均值 ,将 与接受或拒绝标准比较,令x0为给定的生产者风险值(第一类错误,以真为假,即生产者风险)对应的 值,xr为给定的消费者风险值(第二类错误,以假当真,即消费者风险)对应的 值,今考察 与下述 x1 和 x2 的关系:xxx合格产品被拒概率不合格产品被接受概率x
24、x44第一类错误() 将客观上符合假设H0判为不符合假设H0而予以接受的错误,即“以真为假”的错误; 就是犯这类错误的概率,就通常所说的显著性水平。第二类错误() 将客观上不符合假设H0当作符合假设H0而予以接受的错误,即“以假为真”; 表示犯这种错误的概率。 当样本大小一定时,大时就小,故不能做到、同时都小。通常固定=0.01或0.05,通过增加样本容量来减少。当0.05时,认为有显著统计意义,当0.01时,认为有极为显著的统计意义。451 2 1 2 1 2 46能给出肯定的判断。直至得到的值,算累计的,继续采样分析,再计如接受该批产品。,可做出判决,拒绝或或如得。可根据原有记录资料求化情
25、况的标准差,为表征整批试样成分变其中xxxxxxxxxxxhxxhhxxnxhxxnxsrsrsrr1221022021202101/ )1ln(/ )1ln(:2)(2)(47 用序贯抽样法可进行较少试样数进行质量判决,如产品批的真值恰为x0,此时需要采集的试样数为:.)(1ln1ln2)(1ln1ln)1(2:)(1ln1ln)1(22022/ )(20220200所需的采样数值均小于一次抽样检验这几个值为或居于两者之间时的值为而当nxxnxxnnxxxxnrxxxrxxrrxxrr48例如对上述例题进行计算:设生产者风险=0.05,消费者风险=0.102 .347103502815. 1
26、)(2815. 110. 04 .333103506648. 1)(6648. 105. 0000rrrxxxxuuxxxxuu)(,当)(,当4941606.762)2 .3474 .333(12)(28124.592)2 .3474 .333(12)(06.768 .3624 .33305. 010. 01ln10/ )1ln(24.592 .3474 .33310. 005. 01ln10/ )1ln(:20210120222021hxxnxhxxnxxxhxxhrrrsrs其中50值与该范围比较。两个样品测定值的累积时:当采第二份样进行分析75706.762)8 .3624 .333(
27、22)(62124.592)2 .3474 .333(22)(202101hxxnxhxxnxrr90)2 .3474 .333(10. 005. 01ln05. 010. 01ln200)(1ln1ln233)2 .3474 .333(10. 005. 01ln10. 005. 010. 01ln90. 0200)(1ln1ln)1(2:28)2 .3474 .333(05. 010. 01ln05. 010. 005. 01ln95. 0200)(1ln1ln)1(222022/ )(2202220200rxxxrxxrrxxxxnxxnnxxxxnrr值为或居于两者之间时的值为而当采样数
28、514-2-2 计数抽样检验 这种检验方法多用于以件计数的产品检验,例如用看谱镜确定某种杂质存在或不存在,由于这里只有一个比较信息量(合格或不合格),较定量分析提供的信息量低,这种情况的采样检验需用下述方法进行。 对于一批共N个试样,如其中不合格的占p%,合格的占q%,取n个试样找到c个不合格试样的概率Pc可按超几何分布计算为:nNcnpNNcpNPc52 而采集n个试样检验,如规定其中只有少于或等于a个不合格时可接受,则被接受概率为:acaccanNcnpNNcpNPP00nNcnpNNcpNPc53这种结果表述如下表曲线,作图,可得对批中不合格的百分数以可计算为:即可用上式,此时)时,足够
29、大(例如一般当可用二项式分布:,即值很大时上式计算量大当OCPecnpennpPPnNNppPLimLimNnaacnpcacnpcaacnnnccN10!)(1!)(10)1 ()(54表6 产品不合格率与接受概率的关系55 由表可以看出,如制定的抽样检验方案时取50个样检验,出现1个或无不合格品时接受该批试样,这并不意味着产品的不合格率一定小于2%;不合格率为4%的产品批,仍有40.6%的概率被接受,这就是消费者风险。 反之,1%合格率产品,有(1-0.910)即9%的概率被拒绝,这就是生产者风险。 要完全消除这两者的风险,只有对试样进行全数检验,而这需要耗费很大的人力和物力,一般情况下是
30、不可取的。56 序贯抽样检验能减少达到相同的风险水平需要的采样个数。设a是给定生产者风险(1-)对应的整批产品予以接受时不合格产品百分数,这个可接受水平称AQL(acceptable quality level)。 r是与消费者风险相对应的整批不合格品百分数的允许界限LIPD(lot tolerance percent defective)。今取n个试样检验,如发现有a个不合格,将a与a1、a2比较:)/ln(/ )1ln()/ln(/ )1ln()/ln(;212211ararararhhssnhasnha57 如aa2,拒收该批产品;如a在a1与a2之间,继续采样并重新计算a1、a2进行判
31、决。 对质量符合AQL的一批产品,采样数的期望值为aashhn)1()(21对质量恰为LTPD的一批产品,则有:shhnrr)1()(12 采样数的期望值最大为(h2h1/s),此时质量水平趋近于s。58例:取500个样检验,当不合格品大于10时拒收,则拒收含1.5%(a=0.015)不合格品的生产者风险为(1-0.863) = 0.137;接受3.0%( r= 0.03)不合格品的消费者风险为0.118,此时可算得:nsnhansnhashharararar0216. 06531. 20216. 08413. 20216. 0015. 0/03. 0ln015. 003. 0)/ln(653
32、1. 2015. 0/03. 0ln0137. 0/ )118. 01ln()/ln(/ )1ln(8413. 2015. 0/03. 0ln118. 0/ )137. 01ln()/ln(/ )1ln(22112159 这时,采样数的最大期望值为349,即维持同样水平的生产者风险与消费者风险,在最不利的情况下亦无需采集500个试样进行检验。按此法检验,可先采150个样检验,此时a1=0(如无不合格品,则接受),a2=6(如大于或等于6个不合格品,则拒收),如不合格品在a1与a2之间,再采集150个样,此时a1=4, a2=9,余类推。对质量恰符合AQL(1.5%不合格率)的产品,采样数的期望值为314,对恰符合LTPD的产品,采样数的期望值为237。在确保所需的产品质量标准下,此法显然能减少检验工作量,降低生产成本。3490216. 0/8413. 26531. 2/:12shh采样数的最大期望值60 结语:采用科学的检验方法,是发达国家如日本生产厂商确保其产品质优(退货率低,即低),且成本合理(尽可能低的)的诀窍。而有的生产部门由于分析检验人员缺乏统计采样知识,不能理解或拒不使用本章论及的采样方法,沿用一些缺乏科学根据的采样方法,例如“固定比例抽检法” ,导致产品质量长期不能改善( 高)或生产成本高(高)。显然,普及有关采样理论知识,具有重要的实际意义。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。