1、2022-4-27六西格玛基本统计六西格玛基本统计六西格玛基本统计六西格玛基本统计基础统计理论目录4 1235 统计目的数据分类统计概述基本图表六西格玛度量的种类六西格玛基本统计第一部分第一部分统计目的统计目的六西格玛基本统计你看到了什么?六西格玛基本统计你需要整个图片!六西格玛基本统计数据的重要性数据的重要性数据是来自观察的数据是来自观察的,由一个过程所搜集得来的数据可让由一个过程所搜集得来的数据可让我们描绘过程我们描绘过程,了解过程了解过程,改善过程甚至控制过程改善过程甚至控制过程.Data 数据驱动决策和行动数据驱动决策和行动六西格玛基本统计数据对六西格玛很重要使用统计学来解决真实的问题
2、使用统计学来解决真实的问题真实的真实的解决方案解决方案统计学统计学解决方案解决方案统计学问题统计学问题真实的问题真实的问题 把问题转换为数字 (Y) 定义 Y 的规格(可接受范围) 理解(xi) 与流程输出(Y)的关系Y = f(x1, x2, x3.) 影响流程表现的关键因子是什么? 找到因子(xi)的水平和操作窗口, 保证输出 (Y) 是在可接受范围内 控制输入 (xi) 避免输出/缺陷六西格玛基本统计统计思想所有作业是相互关联的工序的系统所有作业是相互关联的工序的系统例) 线路板作业过程原料投入贴插装清洗喷胶所有工序中都存在散布所有工序中都存在散布可避免原因不可避免原因同样原料同样生产工
3、艺同样作业者同样方法发生散布发生散布统计思想是 遵守以下四种根本原则的学习,思考和实践的一种哲学。六西格玛基本统计 调查散布和减少散布的活动调查散布和减少散布的活动减少工序散布的活动减少产品质量散布顾客满足费用降低考虑判断失误的错误考虑判断失误的错误注意从样本数据的结果判断时发生错误统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是统计思想不是单纯的数字组合或计算,而是为质量革新而思考的方法,也是思考的过程。思考的过程。统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维统计思想不是统计知识或工具,更不是软件的具体操作,而是学会用统计思维看待和分析问题,避免只看
4、到表面层次的现象就去下结论作决策。看待和分析问题,避免只看到表面层次的现象就去下结论作决策。统计思想统计思想举例:去年公司的顾客满意率为80%,今年调查了100位顾客,有85位顾客表示满意,满意率达到85%。能否说今年的顾客满意率比去年提高了5%?六西格玛基本统计当重复测量时当重复测量时,经常产生不同的结果经常产生不同的结果,这就是偏差这就是偏差偏差的类型:偏差的类型: 通常原因的偏差:通常原因的偏差: 测量中的差异是被期望的并可以预测的测量中的差异是被期望的并可以预测的 特殊原因的偏差特殊原因的偏差(随机随机): 测量中的差异是不可预测的测量中的差异是不可预测的偏差偏差六西格玛基本统计我们是
5、期望能够观察出偏差的,如果没有偏差那肯定会有问题我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题如果所有的区域的产品的销售量完全相同如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真我们将怀疑数据的真实性实性.偏差的存在使我们的工作更有挑战性偏差的存在使我们的工作更有挑战性我们通常不相信来源于单个数据的结果我们通常不相信来源于单个数据的结果,通常收集多个数据并注意通常收集多个数据并注意收集的方法以减少偏差收集的方法以减少偏差结论:偏差是自然存在的结论:偏差是自然存在的,被期望的并是统计的基础被期望的并是统计的基础偏差偏差六西格玛基本统计统计领域用下列方法处理偏差统计领域用下列方法处
6、理偏差 描述型统计描述型统计-用图表或总结性的数字用图表或总结性的数字(中心值中心值,方差方差,标准偏差标准偏差)来描述一系列数据的特征来描述一系列数据的特征. 统计推论统计推论-当结果的差异可能因为随机偏差或不能归属为随当结果的差异可能因为随机偏差或不能归属为随机偏差时所作的决定。机偏差时所作的决定。(置信区间和假设检验置信区间和假设检验) 试验设计试验设计(DOE)-收集并分析数据,以估计过程并改变效果收集并分析数据,以估计过程并改变效果. 统计领域中偏差的处理统计领域中偏差的处理六西格玛基本统计过程偏差 确定过程是否稳定 如果过程不稳定,鉴别并消除不稳定的要因 确定过程的平均值的位置 -
7、 它在目标线上吗?如果不在,确定影响平均值的变量,并决定最优的设置以达到目标值 估计总散布的幅度 - 与顾客的要求(规格限)比起来,是可接受的吗? 如果不是, 确定散布源,而后消除或减少他们对过程的影响。 六西格玛基本统计第二部分第二部分数据分类数据分类六西格玛基本统计数据的种类 不间断的 总是可以以更小的单位来测量 经常与测量系统一起出现不可以以更小的单位来测量只能选择几个有限的数值连续型的连续型的离散型的离散型的举例 时间, 重量, 金额, 长度举例 二元的: 男/女, 好/坏, Yes/no 分类的: 周一-周日, 地点 (Paris, London, Beijing, .) 计数: 一
8、张发票上的错误数目, 一个月内发生意外的次数六西格玛基本统计连续型数据连续型数据u 益处益处 :1.能够为使用相对小范围抽样的过程提供详细的信息能够为使用相对小范围抽样的过程提供详细的信息2.适用于低缺陷率适用于低缺陷率3. 能够预估发展趋势和情况能够预估发展趋势和情况u 缺点缺点 :1.通常较难得到数据通常较难得到数据2.分析更为复杂分析更为复杂六西格玛基本统计离散型数据离散型数据u 益处益处 : 容易得到数据容易得到数据,并且计算方法简单并且计算方法简单2. 数据容易理解数据容易理解3. 数据随时可得数据随时可得u 缺点缺点 :1.无法显示缺陷怎样发生及过程如何变化无法显示缺陷怎样发生及过
9、程如何变化2.不适合低缺陷率不适合低缺陷率(需要大量的抽样需要大量的抽样)3.不能预测发展趋势和情况不能预测发展趋势和情况六西格玛基本统计数据类型比较数据类型比较连续型数据离散型数据连续数据计数数据通常为正态分布通常为二项式分布或泊松分布实际数值合格/不合格实际定义严谨数据定义较差需少量抽样需大量抽样六西格玛基本统计练习: 这是什么种类的数据 ?申请贷款所需要的时间每张发票上的错误数目每张发票上的缺陷百分比一天内销售酒的数量导线的长度办公室的地点申请贷款所需要的时间 (天)销售人员一天内拜访的客户数量赢得招标的百分比销售人员的销售额销售人员的名字六西格玛基本统计第三部分第三部分统计概述统计概述
10、六西格玛基本统计l总体总体 想要测量对象的全部想要测量对象的全部l参数参数 用总体的所有数据计算出的数值用总体的所有数据计算出的数值(如均值如均值, 标准差标准差), 称为总体的参数称为总体的参数 x参数参数总体平均值总体平均值总体标准差总体标准差总体总体统计学基本术语统计学基本术语六西格玛基本统计统计学基本术语统计学基本术语l样本样本 从总体抽出的部分数据从总体抽出的部分数据l统计量统计量 用样本的所有数据计算出的数值用样本的所有数据计算出的数值(如均值如均值, 标准差标准差), 称为样本的统计量称为样本的统计量x统计量统计量样本平均值样本平均值样本标准差样本标准差s总体总体样本样本六西格玛
11、基本统计描述计量型数据集描述计量型数据集一组计量型数据能显示以下一组计量型数据能显示以下3个特性个特性:中央趋势中央趋势 (均值均值, 中值中值, 众数众数)变异变异(全距全距, 标准差标准差, 方差方差)形状形状六西格玛基本统计参数和统计量符号参数和统计量符号Mean 均值均值Variance 方差方差Standard Deviation标准差标准差Proportion 比例比例总体(参数)总体(参数)样本(统计量)样本(统计量) s s2 2s sp p六西格玛基本统计数据位置测量数据位置测量中心趋势中心趋势均值均值中值中值众数众数四分值四分值六西格玛基本统计样本均值样本均值若样本(样本量
12、为若样本(样本量为n)的观测值为)的观测值为x1,x2,xn,则样本均则样本均值为:值为: 类似地,一个有着大量但限个(类似地,一个有着大量但限个(N个)观测值的总体,个)观测值的总体,其总体均值其总体均值 为:为:均值均值六西格玛基本统计练习三练习三10个连接线的拉拔强度为个连接线的拉拔强度为 : 230 240 236 248 252 278 265 262拉拔强度的均值是多少?拉拔强度的均值是多少?10个观测值的均值为:个观测值的均值为:均值均值六西格玛基本统计练习四练习四199X年一个行动中,战机进行了年一个行动中,战机进行了3000次战斗,总共次战斗,总共用时用时6900小时。那末每
13、次战斗平均用时多少?小时。那末每次战斗平均用时多少?每次战斗平均用时为:每次战斗平均用时为:注意所使用的符号注意所使用的符号均值均值六西格玛基本统计l 均值的计算使用了每个观测值;每个均值的计算使用了每个观测值;每个观测值对均值都有影响。观测值对均值都有影响。l 所有观测值对均值的偏差的总和为零。所有观测值对均值的偏差的总和为零。l 均值对极端的观测值很敏感,极端值均值对极端的观测值很敏感,极端值会导致均值向他偏移。会导致均值向他偏移。X x x x x x x6 3 5 1 2 7 46 62 24 4均值的特性均值的特性六西格玛基本统计 将一组观测值按大小顺序排列,位于中心的数将一组观测值
14、按大小顺序排列,位于中心的数值即为中值值即为中值l 若观测值的个数为偶数,则中值为中间若观测值的个数为偶数,则中值为中间2个数值的平均个数值的平均l 若观测值的个数为奇数,则位于中心的数值即中值若观测值的个数为奇数,则位于中心的数值即中值中值中值六西格玛基本统计样本中值样本中值 l 假如假如x (1),x (2) ,x (n) )是按大小排序的样本值,则样本中是按大小排序的样本值,则样本中值为:值为: l 中值的优点是不受极端大或极端小的观测值的影响。中值的优点是不受极端大或极端小的观测值的影响。中值中值六西格玛基本统计练习五练习五 假设一个样本观测值为假设一个样本观测值为 : 3 1 2 4
15、 7 8 6l 样本均值和样本中值是多少?样本均值和样本中值是多少?l 这这2个值是测量数据中心趋势的合理指标吗?个值是测量数据中心趋势的合理指标吗? 中值中值六西格玛基本统计(b) 假如最后一个数值改变为假如最后一个数值改变为 : 3 1 2 4 7 8 2680l 则样本平均值和样本中值是多少?则样本平均值和样本中值是多少?l 据此你有何结论?据此你有何结论? 中值中值六西格玛基本统计Median vs Mean 中值与均值中值与均值l 因为中值不象均值对极端值敏感,因此,当有极端因为中值不象均值对极端值敏感,因此,当有极端大或极端小值时,中值比均值更能代表数据的位置大或极端小值时,中值比
16、均值更能代表数据的位置l 典型的例子是一个城市居民的收入中位值典型的例子是一个城市居民的收入中位值中值中值六西格玛基本统计中值有时会有欺骗性中值有时会有欺骗性50%-50% Rule ? 一半一半准则?一半一半准则?l 以下一组数据的中值是多少?以下一组数据的中值是多少? 2,2,2,2,2,2,90l 可以用一半一半准则吗?可以用一半一半准则吗?六西格玛基本统计l 众数是样本中出现次数最多的观测值。众数是样本中出现次数最多的观测值。l 众数可以是唯一的,也可以有不止一个,有众数可以是唯一的,也可以有不止一个,有时并不存在众数。时并不存在众数。众数众数六西格玛基本统计练习六练习六如果样本观测值
17、为:如果样本观测值为:(a) 6 9 13 5 8 13 4 6 13 1 10 13 6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13 4 3 7 2 6 8 1众数是什么?众数是什么? 具有一个众数,两个众数或多于两个众数分布的数据分具有一个众数,两个众数或多于两个众数分布的数据分布叫什么布叫什么?(单峰分布单峰分布)众数众数六西格玛基本统计为何使用众数为何使用众数?l 当观测值为分类式当观测值为分类式(如名义数据如名义数据, 序列数据序列数据)时时.众数是描众数是描述数据位置的最好的指标述数据位置的最好的指标.l典型的例子是典型的例子是,一个公司内员工收入的众数一
18、个公司内员工收入的众数众数的重要信息众数的重要信息l当众数不止当众数不止1个时个时,从中抽取样本的总体通常是多个总体从中抽取样本的总体通常是多个总体 的混合的混合众数众数六西格玛基本统计均值、中值、众数的比较均值、中值、众数的比较MOMeMeMO正态分布正态分布偏上分布偏上分布偏下分布偏下分布MOMeMOMeMOMe六西格玛基本统计四分值四分值l 将一组按大小顺序排列的数据平均分为四部分将一组按大小顺序排列的数据平均分为四部分,分界点分界点即四分值即四分值. 第一四分值第一四分值(低四分值低四分值),约约25%的观测值小于它的观测值小于它.第二四分值第二四分值,约约50%的观测值小于它的观测值
19、小于它, 即中值即中值.第三四分值第三四分值(高分值高分值),约约75%的观测值小于它的观测值小于它.六西格玛基本统计练习七练习七 以下为以下为20个电灯泡失效期间的观测值个电灯泡失效期间的观测值, 已按递增顺序排列已按递增顺序排列.210 216 252 300 366 454 624 720 816 924 12161296 1392 1488 1542 2480 2856 3192 3528 3710请确定三个四分值请确定三个四分值.计算方法:先确定位置再计算四分值计算方法:先确定位置再计算四分值Q1的位置:的位置:(n+1)/4Q2的位置:的位置:2(n+1)/4=(n+1)/2Q3的
20、位置:的位置:3(n+1)/4四分值四分值六西格玛基本统计答案答案 Q1的位置:的位置:(n+1)/4=(20+1)/4=21/4=5.25Q2的位置:的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5Q3的位置:的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75则:则:Q1=366+(454-366)*0.25=388Q2=924+(1216-924)*0.5=1070Q3=1542=(2480-1542)*0.75=2245.5四分值四分值六西格玛基本统计数据散布的测量数据散布的测量(变异变异)lRange 极差极差lVariance 方差方差lSta
21、ndard Deviation 标准差标准差lInter-Quartile Range 四分植极差四分植极差 六西格玛基本统计极差极差l样本极差为样本中最大和最小观测值之间的差别样本极差为样本中最大和最小观测值之间的差别,即即:l极差是测量数据散布或变异的最简单的方法极差是测量数据散布或变异的最简单的方法l但它忽略了最大和最小值之间的所有信息但它忽略了最大和最小值之间的所有信息r =xmax - xmin六西格玛基本统计l试考虑以下的试考虑以下的2个样本个样本: 10 20 50 60 70 90 and 10, 40, 40, 40, 90l具有相同的极差具有相同的极差(r= 80)l但是但
22、是,第二个样本的变异只是第二个样本的变异只是2个极端数值的变异个极端数值的变异,而在第而在第1个样本个样本,中间的数值也有相当大的变异中间的数值也有相当大的变异. l当样本量较小当样本量较小(n10)时时,极差丢失信息的问题不是很严重极差丢失信息的问题不是很严重极差极差六西格玛基本统计方差与标准差方差与标准差l若若x1, x2, ,xn 是一个具有是一个具有N个观测值的样本个观测值的样本,则样本则样本方差为:方差为:l样本标准差是样本方差的算术平方根样本标准差是样本方差的算术平方根,即即:六西格玛基本统计方差计算方差计算练习八:练习八:计算下列观测值的方差和标准差计算下列观测值的方差和标准差.
23、30 50 70 90 110 130 六西格玛基本统计i xi xi-x (xi-x)2 1 30 -50 25002 50 -30 9003 70 -10 1004 90 10 1005 110 30 9006 130 50 2500方差计算方差计算六西格玛基本统计方差与标准差方差与标准差l再考虑以下再考虑以下2个样本个样本. Sample A : 10 20 50 60 70 90 Sample B : 10 40 40 40 40 90 Sample A Sample BRange 极差极差 80 80Variance 方差方差 ? ?Standard Deviation 标准差标准差
24、 ? ? 六西格玛基本统计l类似于样本方差类似于样本方差S2,用总体的所数据计算出总体变异用总体的所数据计算出总体变异总体方差总体方差(2)l总体的标准差总体的标准差()是总体方差的算术平方根是总体方差的算术平方根l 对于包含对于包含N个数值的有限总体个数值的有限总体,其方差为其方差为: 2=方差与标准差方差与标准差六西格玛基本统计方差特性方差特性l 方差计算使用了所有观测值,每个观测值对方差都有方差计算使用了所有观测值,每个观测值对方差都有影响影响l 方差对极端值很敏感,因平方的缘故,极端大的观测方差对极端值很敏感,因平方的缘故,极端大的观测值会严重的放大方差。值会严重的放大方差。六西格玛基
25、本统计四分值极差四分值极差l 四分值极差是测量散布的另一指标:四分值极差是测量散布的另一指标:IQR=Q3-Q1l 四分值极差不如极差对极端值敏感四分值极差不如极差对极端值敏感l 当分布显著不对称时,用它衡量散布会更好当分布显著不对称时,用它衡量散布会更好l 样本(样本(10,20,50,60,90)和()和(10,40,40,40,90)的四分值极差分别是)的四分值极差分别是40和和0.六西格玛基本统计正态分布正态分布l正态分布是一种具有特定的、非常有用的特性的数据分布正态分布是一种具有特定的、非常有用的特性的数据分布 l这些特性对我们理解所研究之过程的特性十分有用这些特性对我们理解所研究之
26、过程的特性十分有用l大部分自然现象和人造过程是正态分布或可有正态分布描述大部分自然现象和人造过程是正态分布或可有正态分布描述六西格玛基本统计标准正态分布标准正态分布标准正态分布标准正态分布,也叫也叫Z分布分布,有下列参数有下列参数:Z代表距离均值的标准差的数量代表距离均值的标准差的数量=0 =1 -4 -3 -2 -1 1 2 3 4 六西格玛基本统计特性特性 1 :只需知道下述两项参数就可完整描述正态分:只需知道下述两项参数就可完整描述正态分布布均值均值标准差标准差分布分布 1分布分布 2分布分布 3此三项正态分布有何区别?此三项正态分布有何区别?正态分布正态分布六西格玛基本统计正态曲线和概
27、率正态曲线和概率特性特性 2 :曲线下面的面积可用来估算某一特定事件发生:曲线下面的面积可用来估算某一特定事件发生 的累积概率的累积概率得到在两个值之间的某个得到在两个值之间的某个价值的累积概率价值的累积概率99.73%95%68%离均值的标准差数目离均值的标准差数目样本值的概率样本值的概率40%-30%-20%-10%-0%-六西格玛基本统计正态分布特点正态分布特点-3-2-112368%95%99.73%Standard Deviation标准差标准差Average标准差标准差六西格玛基本统计正态曲线下的区域正态曲线下的区域分析过程能力时分析过程能力时,我们运用正态曲线下的区域预测超过我们
28、运用正态曲线下的区域预测超过规格界限的产品所占的比例规格界限的产品所占的比例.5%5%规格上限规格上限USL规格下限规格下限LSL六西格玛基本统计标准差的经验规则标准差的经验规则l 当一组数据不是最理想正态分布时当一组数据不是最理想正态分布时, ,前述累积概率规则仍可前述累积概率规则仍可 应用应用l比较理论比较理论( (理想理想) )正态分布和经验正态分布和经验( (现实现实) )分布分布Number of Standard Deviations 标准差数目Theoretical Normal 理论正态Empirical Normal经验正态+/- 168%60-75%+/- 295%90-9
29、8%+/- 399.7%99-100%六西格玛基本统计长期和短期能力(Z-偏差)ZLT=ZST-1.5 Sigma水平 短期DPMO 长期DPMO 1158655.3691462.5 2 22750.1308537.5 3 1350.0 66807.2 4 31.7 6209.7 5 0.3 232.7 6 0.0018 3.4六西格玛基本统计第四部分第四部分基本图表基本图表六西格玛基本统计这是什么? 4.5 3.9 1.4 5.6 3.3 6.0 4.0 4.6 6.7 7.9 5.0 3.6 5.6 3.5 6.8 5.6 6.0 5.4 6.6 6.6 0.0 5.0 3.7 3.6 5
30、.8 4.3 3.0 5.4 5.3 8.5 4.5 4.1 2.5 3.6 4.2 4.2 3.0 4.3 7.0 5.6 3.6 3.9 5.3 4.5 5.7 3.2 4.1 3.9 4.9 7.2 6.8 3.7 3.7 4.9 5.9 3.9 4.2 2.2 3.7 6.7 2.6 3.7 2.2 3.8 2.2 4.6 4.4 6.0 4.5 7.5 4.2 3.8 3.0 4.9 4.7 4.4 8.3 4.9 6.8 7.6 5.7 3.7 3.6 5.6 4.0 4.7 3.9 2.9 5.0 6.8 4.2 5.3 6.5 2.9 3.1 3.2 3.9 5.7 7.6 7
31、.0 顾客等待时间顾客等待时间例如例如: 你是你是 Pizza Hut 的一个门店的经理的一个门店的经理. 你要求你的助理记录每个顾客的等待时间你要求你的助理记录每个顾客的等待时间, 今天今天你已经有了你已经有了100个数据个数据. 六西格玛基本统计观察顾客等待时间观察顾客等待时间(Rate)(Rate)打开打开RATE RATE 转换为变量转换为变量. .六西格玛基本统计时间序列图垂直轴(Y)显示被测变量的规模每个点代表一每个点代表一个实际的价值个实际的价值点是用一条线连点是用一条线连接帮助视觉分析接帮助视觉分析运行秩序运行秩序等待时间等待时间(分钟分钟)水平轴水平轴(X)反映了一段时间或序
32、列反映了一段时间或序列顾客等待时间顾客等待时间六西格玛基本统计观察顾客等待时间观察顾客等待时间(Rate)(Rate)打开打开RATE RATE 转换为变量转换为变量. .六西格玛基本统计等待时间(分钟)等待时间(分钟)一个类别或等待的一个类别或等待的时间间隔时间间隔Class “j”Class “k”Class “l”频率频率六西格玛基本统计产生具有正态曲线的直方图产生具有正态曲线的直方图六西格玛基本统计频率最高频率最高频率频率(数量的点数量的点)等待时间等待时间(分钟分钟)顾客等待时间的直方图顾客等待时间的直方图水平轴水平轴(x)显示测量范围的变量显示测量范围的变量钟形曲线纵轴纵轴(y)显
33、示的频率显示的频率六西格玛基本统计观察顾客等待时间观察顾客等待时间(Rate) RATE 作为变量作为变量.六西格玛基本统计Minitab 结果结果采集100位顾客实际的等待时间,作图如上。每一个点代表一个具有给定值输出的“事件”。随着点的积累,顾客等待时间的实际表现的特性可被看作一个 “分布”。 六西格玛基本统计l是各分布差异容易把握的数据调查方法是各分布差异容易把握的数据调查方法. 让我们顾客等待时间让我们顾客等待时间打开文件打开文件 用列用列RATE RATE 作为变量作为变量六西格玛基本统计Minitab 结果结果90%75%50%25%10%Outlierl箱线图可以体现数据扩散性及
34、中心箱线图可以体现数据扩散性及中心. . 箱线图中的中心线不是箱线图中的中心线不是 而是而是 . . 六西格玛基本统计第五部分第五部分六西格玛度量的种类六西格玛度量的种类六西格玛基本统计 Defect 缺陷缺陷 Unit 单位单位 Opportunity 机会机会 DPU(Defects Per Unit) 单位的缺陷数单位的缺陷数 DPO(Defects Per Opportunities) 单位缺陷机会数单位缺陷机会数 DPMO(Defects Per Million Opportunities) 百万单位缺陷机会百万单位缺陷机会 RTY(Rolled Throughput Yield)
35、过程通过率过程通过率(受率受率) Sigma Level (Z值值) Z值值的转换方法的转换方法 Cp&Cpk (工程能力指数工程能力指数)6Sigma度量的种类度量的种类六西格玛基本统计 Defect(缺陷缺陷): - 所有诱发顾客不满足的所有诱发顾客不满足的 - 所有与规定基准不一样的所有与规定基准不一样的 - 所有导致产品和服务质量下降的所有导致产品和服务质量下降的 Unit(单位单位) - 产品和服务等流程过程中的对象或传递给顾客的最终产品和产品和服务等流程过程中的对象或传递给顾客的最终产品和 服务服务(一块单板一块单板,一批原材料一批原材料,一个合同一个合同,一笔贷款一笔贷款,一份报
36、表等一份报表等) Opportunity(机会机会) - 一个产品和服务可能脱离基准的机会数一个产品和服务可能脱离基准的机会数 - 是可测量的是可测量的用语的意思用语的意思六西格玛基本统计 DPU (Defects Per Unit): - 单位缺陷数单位缺陷数 - 例如例如:一个数据报表上有一个数据报表上有100个数据个数据,其中有其中有5个数据错误个数据错误 -DPU= Defects/ Unit=5/1=5 DPO (Defects Per Opportunities) - 机会缺陷数机会缺陷数(每个机会出现缺陷的概率每个机会出现缺陷的概率) - 例如例如:一个数据报表上有一个数据报表上
37、有100个数据个数据,其中有其中有5个数据错误个数据错误 - DPO= Defects/(Unit数数*Opportunity)=5/(1*100)=0.05 DPMO (Defects Per Million Opportunities) - 百万机会缺陷百万机会缺陷(PPM) - DPMO=DPO*1,000,000=50000PPM用语的意思用语的意思六西格玛基本统计注意:机会只有在被评价时才计算为机会注意:机会只有在被评价时才计算为机会n例例) ZXJ10) ZXJ10交换机中的一种单板在生产过程中缺陷发生的机会数为交换机中的一种单板在生产过程中缺陷发生的机会数为100,000100,
38、000次次. .但是在正常生产过程中只对其中但是在正常生产过程中只对其中1,0001,000次机会进行评价次机会进行评价, ,且且在一个单板中发现了在一个单板中发现了1010个缺点个缺点. .n下列计算中哪一个正确下列计算中哪一个正确? ?DPO = 10/100,000DPO = 10/1,000例题例题六西格玛基本统计下面单板例子中计算下面单板例子中计算DPUDPU与与DPMO.DPMO.圆圈表示评价元器件的个圆圈表示评价元器件的个数数, ,黑色表示功能失效元器件黑色表示功能失效元器件. .例题例题六西格玛基本统计一个单位发生的总缺点机会数一个单位发生的总缺点机会数1,000,000 x
39、DPU=DPMO 一般说一般说6 SIGMA水平时把不良率说成水平时把不良率说成3.4DPMO比比3.4PPM更恰当更恰当 适于互相不同的适于互相不同的Process或产品间或产品间,制造范筹和非制造范筹间的比较制造范筹和非制造范筹间的比较 DPMO的计算的计算例题例题六西格玛基本统计总缺点数总缺点数=DPU总生产单位数总生产单位数DPU的计算的计算例题例题六西格玛基本统计例题:例题:为了掌握固定资产申购过程的现况,整理了今年为了掌握固定资产申购过程的现况,整理了今年1月份到月份到6月份月份的固定资产申购单,总共有的固定资产申购单,总共有678份,每份申购单要求事业部填份,每份申购单要求事业部
40、填写写12项内容的信息,经过整理发现共有项内容的信息,经过整理发现共有124项填写不完整,项填写不完整,68项填写有错误。请问填写固定资产申购单过程的项填写有错误。请问填写固定资产申购单过程的DPU、DPO、DPMO为多少?过程能力为多少为多少?过程能力为多少Sigma?例题例题六西格玛基本统计DPMO 计算例计算例适用连续性的数据适用连续性的数据不良率不良率= 0.02275Probability of良品率良品率= 0.97725规格上限规格上限DPMO = 0.02275 * 1,000,000 = 22,750适用离散性的数据适用离散性的数据n缺点数缺点数n某一某一PCB有有800个熔
41、接点与个熔接点与200个部品个部品n此此PCB中发现中发现6个焊接不良点与个焊接不良点与2个不良部品个不良部品nDPMO =(6+2)/(800+200) * 百万百万 = 8,000例题例题六西格玛基本统计RTY:一个产品或服务过程提供无缺陷的概率一个产品或服务过程提供无缺陷的概率 例题例题 2. 某一投诉处理由某一投诉处理由 A, B, C, D, E 五个作业构成五个作业构成,各作业的各作业的 通过率为通过率为0.99, 0.95, 0.90, 0.90, 0.95.ABCDE0.990.950.900.900.95计算投诉处理的通过率计算投诉处理的通过率?直通率直通率六西格玛基本统计数
42、据种类的确认数据种类的确认离散型数据离散型数据Unit的确认的确认计算计算 DPU计算计算 DPO计算计算 DPMO连续型数据连续型数据正态性验证正态性验证数据转换数据转换(必要时必要时)工程能力分析工程能力分析(利用利用MINITAB)引出引出DPMODPMO值在值在 Sigma Chart转换为转换为Z值值,掌握掌握SIGMA水平水平大家是大家是否记得否记得Z值是值是怎么来怎么来的的?SIGMA水平水平(Z值值)的计算程序的计算程序六西格玛基本统计1) 离散型数据的离散型数据的SIGMA水平水平n缺陷数据(泊松分布)的缺陷数据(泊松分布)的情况情况n求求DPMOn从从SIGMA表读对应于表
43、读对应于DPMO的的 Z.st值值n过程通过率数据的情况过程通过率数据的情况n计算过程每一个步骤的通过计算过程每一个步骤的通过率率n求出整个过程的通过率求出整个过程的通过率n从从SIGMA表读百万个表读百万个 = (收率收率)*1,000,000相对应的相对应的Z.st值值n不良率(二项分布)数据不良率(二项分布)数据的情况的情况n从不良率计算从不良率计算PPMnPPM=(不良不良率率)*1,000,000n从从SIGMA表读与表读与PPM值一值一样的样的 DPMO值相应的值相应的Z.st值值.SIGMA水平水平(Z值值)的计算程序的计算程序六西格玛基本统计2) 连续型数据的连续型数据的SIGMA水平水平USLZ.st .stLSL规格中心规格中心规格中心和规格上限或下限间的距离是规格中心和规格上限或下限间的距离是标准偏差的多少倍标准偏差的多少倍?SIGMA水平水平(Z值值)的计算程序的计算程序2022-4-27六西格玛基本统计