1、16Sigma数据及统计基础 数据介绍2六西格马突破步骤 定义测量分析改进控制步骤步骤 1 - 选择输出特性选择输出特性 - 定义过程输入定义过程输入/输出变量输出变量步骤步骤 2 - 确定绩效标准确定绩效标准步骤步骤 3 - 定义测量系统定义测量系统步骤步骤 4 - 建立过程能力建立过程能力步骤步骤 5 - 定义绩效目标定义绩效目标步骤步骤 6 - 定义差异来源定义差异来源步骤步骤 7 - 查找潜在因素查找潜在因素步骤步骤 8 - 发掘变量之间相互关系发掘变量之间相互关系步骤步骤 9 - 建立操作公差范围建立操作公差范围步骤步骤 10 - 重新验证重新验证测量系统测量系统步骤步骤 11 -
2、重新计算过程能力重新计算过程能力步骤步骤12 - 实施过程控制实施过程控制3数据基础: 需要考虑的问题 什么是数据? 什么是不同类型的数据? 为什么连续性的数据更好? 什么是数据采集计划? 怎样是一个合理的分组?4数据 对某物的一个单独事实或对事实对某物的一个单独事实或对事实的收集称之为的收集称之为数据数据事物的信息5l计数型数据计数型数据(不连续的数据不连续的数据) -类别-是, 否-通过, 不通过-合格 / 不合格-好的 / 有缺陷的-计算机设备故障,缺陷的次数l计量型计量型 (连续性连续性)数据数据-连续性数据小数的位数反映出数与数之间的绝对距离时间,财务费用,长度,宽度数据的类型6离散
3、型数据和连续性数据不合格不合格合格合格电路电路温度温度温度计温度计时间时间连续性数据样例连续性数据样例离散型数据样例离散型数据样例NO-GOGO卡尺卡尺数量数量单价单价描述描述 共计共计1$10.00$10.003$1.50$4.5010$10.00$10.002$5.00$10.00装货单装货单7离散型数据和连续性数据 对于某一过程为获得相同的理解水平对于某一过程为获得相同的理解水平 离散型数据离散型数据 提供有限的信息提供有限的信息 连续性数据连续性数据 提供丰富的信息提供丰富的信息8这是什么? 假设: 我每班生产3000-4000件零件,一天3班我通过目视检查零件合格/不合格 问题: 我
4、是否可以只认为这是离散型数据吗? 也许不是: 我可以计算每班的缺陷百分比,这样每周就可获得15个“连续性”的读数 如果你有类似的数据,请同你的黑腰带一起谈论此类数据的局限性/注意事项。9或者这种情况? 我可将我的产品分成10类,1代表最好,10代表报废 问题: 我可以采用此法吗? 是的, 但必须值得注意的是你只有10个分类 指导: 至少有10中类别. 每一种类别之间的“距离”应该是尽可能是一致的。10或者这种情况? 对发货是否及时进行测量 我可以采用对每一批进行离散型测量:是否及时或不及时? 但是我也可以,在许多情况下,采用计数性数据:测量其提前/延迟的小时数/天数。11数据 & 统计重要性:
5、重要性: 数据数据, 自身, 并不并不 提供信息. 你必须对数据进行 处理处理 来提供信息. 我们采用 统计统计 对数据进行处理.12不连续性不连续性 (计数计数)连续性连续性 (计量计量)连续性连续性(计量计量)不连续性不连续性(计数计数)输出输出输入输入Chi-square变差分析变差分析,T-检验检验判别式分析判别式分析逻辑性回归分析逻辑性回归分析相关性分析相关性分析简单回归分析简单回归分析统计技术 统计技术适用于不同数据类别的组合。统计技术适用于不同数据类别的组合。这些统计工具通常用于过程改善。你们会即将了解这些工具这些统计工具通常用于过程改善。你们会即将了解这些工具。比例测试比例测试
6、13好, 但哪里才能得到我们的数据呢? 若完成真实的项目,我们需要真实的数据 真实的数据可能是散乱的,糟糕的,并难于寻找 其中一个基本的工具是明确什么是你所需要的,并设计出简单明了的计划或表格进行收集相关数据14数据采集计划所需回答的问题 你想知道过程的什么方面? 你如何计划你所需要知道的? 什么样类型的工具会产生你所期望的情形? 什么类型的数据需要收集工具? 在生产过程中造成变差可能的原因有哪些? (Xs) 在生产过程存在循环吗? 谁负责收集数据?15数据采集计划所需回答的问题(继续) 你将用多长时间来获得你所需要的数据? 你将怎样对测量系统进行评价? 操作定义是否足够详细? 你将怎样展现数
7、据? 数据是否可以得到? 如果不行,你将会怎样制定你的数据采集表? 数据采集将发生在何处? 你的数据采集计划是怎样的你的数据采集计划是怎样的? 16数据采样计划模型回回 答答 关键关键 问题问题计划计划执行数据执行数据 采集采集 计划计划17合理的分组一个合理的分组是将相似类别的事物进行逻辑性的筛选,例如:工序,天数,班次,小时,操作工,单位,零件,原材料批,等。 一个确定的合理化分组必须是用于制定的工序或项目 一旦合理化分组在数据采集计划中建立,研究的周期就很容易确定。 采用合理化分组可以帮助我们确定在研究过程中所出现变差的原因。18更多的关于合理化分组 合理分组之所以被这样定义是因为它们仅
8、包括普通原因所产生的变差。(正态随机变差) 合理化分组代表短期数据短期数据。一般来讲,合理化分组的类型包括:操作工变更, 工装变更, 材料变更, 启动循环, 午饭前后, 等. 如果收集的数据超过上述条件,其中就可能会包含一些隐藏的或不确定的应被归于特殊原因的因素 另外,合理化分组仅适用于正常的生产方式,而不需人为的添加写特殊因素,例如:试生产19数据基础: 需解答的问题 什么是数据? 什么是不同类型的数据? 为什么连续性的数据会更好? 什么是数据采集计划? 什么是合理的分组?20数据基础: 问题总结 数据是相关主题的单个事实或事实的集合体 数据有两种:计数型和计量型 计量型数据之所以比计数型数
9、据好是因为其所提供的信息要更丰富。 一个数据采样计划是采集同项目有关的,必要的数据大纲 合理分组是对某一过程的相同类别负荷逻辑的挑选。21数据基础: 课程总结 一个周全、严密的数据采集计划能够确保记录正确的数据并观测到所有变差的原因 当可靠的数据用于分析,统计的意义将会被得到验证。 对于数据采集人员,数据收集计划必须浅显易懂 数据采集练习是必须的22数据基础: 输出 根据你项目中所涉及的问题拟订一个周全的数据采集计划。 小组的所有成员必须对为什么,何处,何时和怎样采集数据有一致的理解 可靠数据的采集是对项目进展的推动 对数据的处理可以提供所需的相关信息23数理统计基础 统计基础24六西格马突破
10、步骤 定义测量分析改进控制步骤步骤 1 - 选择输出特性选择输出特性 - 定义过程输入定义过程输入/输出变量输出变量步骤步骤 2 - 确定绩效标准确定绩效标准步骤步骤 3 - 定义测量系统定义测量系统步骤步骤 4 - 建立过程能力建立过程能力步骤步骤 5 - 定义绩效目标定义绩效目标步骤步骤 6 - 定义差异来源定义差异来源步骤步骤 7 - 查找潜在因素查找潜在因素步骤步骤 8 - 发掘变量之间相互关系发掘变量之间相互关系步骤步骤 9 - 建立操作公差范围建立操作公差范围步骤步骤 10 - 重新验证重新验证测量系统测量系统步骤步骤 11 - 重新计算过程能力重新计算过程能力步骤步骤12 - 实
11、施过程控制实施过程控制25数据基础: 所需解答的问题 什么是统计? 什么是居中趋势的测量? 任何测量变差? 为什么我们须关注稳定性? 什么是分布,什么是正态分布? 为什么“曲线下方的区域”是重要的? Z-bench和 Cpk有何区别? 样本同母体之间的关系是怎样的?26统计 统计是对数据的组织,分析和解释 每步的码数 每加仑英里数 统计使成百上千的的单个数据便得有意义。27统计 测绘数据的益处统计是工具统计是工具. 象其它工具一样,它们同样可以被误用,导致令人误解的,歪曲的,或不正确的结论。仅能够计算是不够的,我们必须对数据作出正确的解释。统计中一项重要的分析工具就是不断描绘数不断描绘数据据。
12、28变异性, 中心度, 和稳定性 变异变异 某一过程的差异有多大?众所周知,每一过程都会有一定的移动,但不是每一个移动都会得到完全相同的结果。 通常我们采用标准变差对过程的差异进行衡量。这是我们的重点。 其它关于差异的参数有: 极差 (最大之与最小值之差) 偏差 平方和291n)X(Xn1i2isminmaxRange1n)X(Xn1i2i2s变异性的测量 - 公式极差极差: 在某一数据集合中最大值同最小值之间的数字化的距离样本方差样本方差 (s2 ; s2 ): 每一单个数据同均值的差的平方和的平均值标准偏差标准偏差 (s ; s): 方差的平方根。通常表示数据的分散程度。它越小,数据分散程
13、度越小,加工精度越好。计算机可以胜任所有艰难的工作30变异性练习 你可将上周每天的生产分为3组(3班) 导师会要求采用极差极差测量方式来计算每一组的差异。 然后计算该组数的整体差异,再次采用极差极差的方式。为什么整组数的极差值会大于任何一组数的极差值? 再计算该组数的标准偏差31变差的组成部分普通原因: 任何过程中都有“活跃的因素” 这正是我们在3组/班每组内所看到的 为减少此类的变差,我们通常需要对过程或技术进行变更特殊原因: 该变差是由于某一“确定”的输入,如:每班采用不同的标准值,材料供应商发生变更,工装变更等 这正是我们在组与组之间所看到的 为减少此类变差,我们通常需要改善和加强对过程
14、的控制32变异性, 中心度, 和稳定性居中居中 中心趋势的测量中心趋势的测量 过程处于何处?“平均数”位于何处? 通常对中心趋势的测量为均值(m)(发音为mu),经常被称为X 这是传统的算术平均法,全部相加再平均。 其它中心趋势的测量值: 中数中数: 表示数据的分布中心位置 众数众数: 在一组数发生频率最高的值nnnnxx133测量中心度 - 练习计算下列每组数的均数,中数和众数。并记录在指定位置序号数列1数列2数列3A539B661C431D548E531F746G41610H741I657J331K3410统计数列1数列2数列3中位数中值重数34变异性, 中心度, 和稳定性 稳定性稳定性(
15、在改善之前其过程必须是稳定的在改善之前其过程必须是稳定的) 过程长期的表现如何? 稳定性是代表恒定的平均数并可预测未来变异如果过程是稳定的,其变差将会围绕一定的平均值来回摆动。过程可能好可能坏,但是你可以对其发展趋势进行预测并对取得进步进行测量。 只有稳定的过程才能被测量。某一过程过程能力每天都有差异,你又如何确定其能力呢?35有关稳定性的问题5152523242526ObservationmetersRun Chart for meters21222253545ObservationFeetRun Chart for Feet这两个过程大概的均值是多少?如果该数据来源于某一周,那在下周这两个
16、过程的均值会如何?36201001451351251151059585756555Sample NumberSample MeanX-bar Chart for Machine AX=100.7138.462.932010011010090Sample NumberSample MeanX-bar Chart for Machine B11X=101.0108.593.4220100120115110Sample NumberSample MeanX-bar Chart for Machine CX=115.0119.7110.4统计 一般练习机器A,B,C生产同样的产品(极差图受控),每个产
17、品输出差异的目标值为100mm。1. 哪些设备显现出变异?2. 每台设备中值在何处?3. 哪些设备具有可预测性?4. 哪些设备具有特殊原因的变异?5. 对于今天的工令你将采用哪台设备进行生产?6. 大体哪台设备最容易稳定?37统计 - 改进过程流程 依据下列步骤采用数据对过程进行改善。首先进行步骤依据下列步骤采用数据对过程进行改善。首先进行步骤1(稳定性稳定性),步骤二通常为,步骤二通常为(差异差异),需在步骤,需在步骤3(中心定置中心定置)之前完成。之前完成。1) 确定过程是否稳定。确定过程是否稳定。如果不稳定,确定并剔除导致不稳定的因素。2) 评估所有变异性的级别评估所有变异性的级别. 根
18、据计数规范要求是否可接收?如果不能接收,确定变异性的来源并消除或减少其对过程的减少。3) 确定过程中值所在的位置。确定过程中值所在的位置。 若没有达到目标,确定影响中值的相关因素并优化设置以达到目标值。38变异是敌人 今天早上你所在教室的温度为50华氏度,你是否感觉舒适? 那么,现在我将温度提高之90华氏度,你现在又感觉如何? 你有什么问题吗?今天,室平均温度已为70华氏度客户对变异的敏感度要高于中值39如果设置相关工程目标分别为1.000”及1.002”; 那么每边的间隙为.001”。 (.002” 总共)转轴技术规范轴套 1.002” -.000”/+.005”轴 1.000” -.005
19、”/+.000”轴套内径 - 轴外径 = 间隙 1.002” - 1.000” = .002” (total)Exactly to Nominal = OK 4轴套间隙轴与轴套的实例 40 如果你采用全公差,那么你可能会有.995”的轴, 及1.007” 的轴套,对于每边的间隙为.006” (总共为.012” ) Take Away: 变异是敌人,其加大了间隙使其发出异响并过早磨损。(但在公差之内就是合格的吗?)转轴轴套内径 - 轴外径 = 间隙 1.007” - .995” = .012” (总共)在公差范围之内,但是预期间隙的6倍轴套间隙实例继续41分布 我们可以对相同的变差,多次、通过产
20、品、不同的机器等,以点绘数据描述或归纳任何过程特性 这些数据的积累可被视为一种数据的分配并通过点图,柱状图,或正态分布来显现。42 : : . . . : . . : : :.: : . : . : . .:.:.:.:.:.: : . -+-+-+-+-+-GPM 49.00 49.50 50.00 50.50 51.00点图 & 柱状图51 . 350. 850. 349. 849. 348. 84030201 00GP MFrequency4352.051.551.050.550.049.549.048.548.0正态分布 正态分布假设使有限数据采集近似于无限数据采集。44正态分布世上大
21、部分的过程都属于正态分布 大部分的数据多集中在中心线附近 离中心线或中值越远,相关的数据点也会越少。确定一个完整的正态分布,你只需要两条信息: 你需要知道该分布的中心位于何处。我们通常用中值来表示 你需要知道该分布的宽度。宽度即为变差,这些点同中心的距离。我们通常用标准偏差来反映。45正态分布 - 属性正态分布的两种属性:(1): 我们已经阐述过通过中值和标准偏差对正态分布进行完整描述。(2): 曲线下面的区域通常用于估计某一事件发生的可能的累积概率。我们会着重于理解第一项。稍后介绍第二项。46正态分布 特性 1 当我们知道某一过程中值或中心时,很显然就可以对正态分布的中心进行定位。 但我们如
22、何知道标准偏差让我们完成正态曲线的绘制?+/- 1 标准偏差包含所有事件的 68.26%+/- 2标准偏差包含所有事件的95.44%+/- 3标准偏差包含所有事件的99.73%47正态曲线特性43210-1-2-3-440%30%20%10% 0%样件数据可能性样件数据可能性标准偏差距离中心值的数值标准偏差距离中心值的数值99.73%95%68%Point ofInflection备注: 尽管该曲线看上去终止于+/- 3 西格马,但实际上是在延续的。48正态曲线 - 练习 11816141210864240%30%20%10% 0%什么是中值?什么是标准偏差?英寸0s1s2s3s-1s-2s-
23、3s距离中值的标准偏差数49正态曲线 - 练习 243210-1-2-3-440%30%20%10% 0%什么是中值?什么是标准偏差?50正态曲线 - 练习 3161310741-2-5-840%30%20%10% 0%中值是什么?标准偏差是什么?51正态曲线 - 练习 41614.51311.5108.575.5440%30%20%10% 0%中值为多少?标准偏差为多少?52正态曲线 - 练习 540%30%20%10% 0%设中值为20且标准偏差为5请填空53怎样知道数据是正态的? 测试给定数据是否为“正态”的测试方法通常称之为正态可能性点图。若分布接近与正态,该图会呈现为一条直线。 观察
24、下列正态可能性绘图和柱状图 该直线是否代表一组正态分布的数据? 直方图是否象正态或钟形曲线?1101009080706050403020100500C1FrequencyNormal Probability Plots1069686766656463626.999.99.95.80.50.20.05.01.001ProbabilityNormalp-value: 0.328A-Squared: 0.418Anderson-Darling Normality TestN of data: 500Std Dev: 10Average: 70Normal Distribution54正态可能性绘图
25、(继续)807060504030201003002001000C3FrequencyNormal Probability Plots130120110100908070603002001000C2FrequencyNormal Probability Plots13012011010090807060.999.99.95.80.50.20.05.01.001ProbabilityPos Skewp-value: 0.000A-Squared: 46.447Anderson-Darling Normality TestN of data: 500Std Dev: 10Average: 70Pos
26、itive Skewed Distribution80706050403020100.999.99.95.80.50.20.05.01.001ProbabilityNeg Skewp-value: 0.000A-Squared: 43.953Anderson-Darling Normality TestN of data: 500Std Dev: 10Average: 70Negative Skewed Distribution 你对下列柱状图及正态可能性绘图的看法如何?1 501 0050.999.99.95.80.50.20.05.01.001ProbabilityM ysteryp-va
27、lue: 0.000A-Squared: 27.108Anderson-Darling Normality TestN of data: 500Std Dev: 32.3849Average: 100M ystery Distribution55Z 刻度刻度 = 单位单位 是标准偏差是标准偏差10864131412-1-2-33210USLZ = X - m Z 转化将一组正态分布转化为标准正态分布,即转化将一组正态分布转化为标准正态分布,即中值为中值为0,标准偏差为,标准偏差为1.0Z = 13 - 10 2= 1.5Z 转化1610假设某一过程Mu = 10 Std Dev = 2问题 1
28、: 如果我的公差为13,距离中值的英尺数为多少?问题2:如果标准偏差为2,公差离中值有几个标准偏差?X 刻度刻度 = 单位单位 是英尺是英尺56Z scale = 单位单位是标准偏差是标准偏差8641412-1-2-33210Z = X- m Z 转化 - 练习1610X scale = 单位单位是英尺是英尺XZ?110?6?-3?1.5?-2.2513?15.5?4? -4 第一个问题, 中值和标准偏差是什么?57正态分布 特性 2再回顾一下正态分布的两种特性:1): 我们已经阐述过通过中值和标准偏差对正态分布进行完整描述。(2): 曲线下面的区域通常用于估计某一事件发生的可能的累积概率我们
29、现在讨论第二项 58概率通常用概率一词描述样本同母本之间的关系。概率是纽带将样本对母本的预测联系起来。对一个独立的变量,用概率表现为0,1间的实数来确定某一特定输出的可能性同所有可能输出的比较。对于 (6) 面骰子: P (roll=6) = 1/6 = 0.1666对于一枚硬币: P (flip=head) = 1/2 = 0.500所有现有因素的概率之和应为159正态曲线概率43210-1-2-3-440%30%20%10% 0%Probability of sample value距离中值的标准偏差数距离中值的标准偏差数99.73%95%68%重要概念重要概念: 在标准正态曲线下的面积为
30、在标准正态曲线下的面积为 1.000例如:68% 的点是落在正负一个标准偏差之间的。60Z 刻度刻度 = 单位单位标准偏差标准偏差8641412-1-2-33210概率 - 练习1610X 刻度刻度 = 单位单位英尺英尺根据上页的信息,回答下列问题:X z% X右半部分的面积% X左半部分的面积1012141686461Z scale = 单位单位标准偏差标准偏差8641412-1-2-33210概率 练习方法1610X scale = 单位单位英尺英尺68%16%16%对于 X = 12, Z = +1右侧曲线下方的面积为16%,左侧为16+68 = 84%或者对于1个 其所占的面积为68%
31、的一半,将此34%同中值的左半部50%相加,即为84%62Z 表 老师将会示范如何使用Z表 介绍如何查找曲线下任何一点的面积 Excel 和 Minitab 做此项工作十分迅捷63Z-表练习 请查出在曲线下方,下列各Z值左侧及右侧的面积。1.1, 2.4, 3.2, 0.45, -2.2, -1.75 对于给定过程中值为20并标准偏差为4,请查出下列各X值左右两侧在曲线下方面积。22, 26, 20, 18, 1464标准化标准化Z转换转换:ZXZZms4754512 5.ZXms缺陷为上限的右侧47.5Z 转换 - 应用假设轴外径的正态分布为中值为45,标准偏差为1。客户所要求的上限为(47
32、.5). 那么该工序的DPMO 为多少?从Z表可以查出,该轴小于47.5的概率为99.37%, 还而言之缺陷率为0.63%DPMO = .0063 x 1,000,000 = 6,300已知分布状况和规范,即可对过程能力进行预测!6510864131412-1-2-33210USLZ = 13 - 10 2= 1.5Z 转化 DPMO 计算1610假设某一过程的m = 10 及 Std Dev = 2问题: 如果公差为13,生产的缺陷率为多少?(曲线下方红色区域) 回答: 采用 Z表 或 Minitab 得 Z =1.5 缺陷概率缺陷概率为为6.68%66108641412-1-2-33210
33、Z = 8 - 10 2= -1Z 转化DPMO 对公差下限的计算1610同一过程 m = 10及 Std Dev = 2问题: 如果下限为8,该生产的缺陷率为多少?(曲线下方绿色区域)回答:采用Z表或Minitab 的Z=-1缺陷概率缺陷概率为为 15.87%LSL = 86710864131412-1-2-33210USLZ 转化DPMO 计算 Z bench1610问题: 如果上限为13并且下限为8,该过程的缺陷率为多少?(曲线下方红色和绿色的区域)回答:采用Z表和Minitab得Z=1.5 & Z=-1将两边的缺陷概率相加超出上限的超出上限的缺陷概率缺陷概率为为 6.68%LSL低于下
34、限的低于下限的概率为概率为15.87%68108641412-1-2-33210Z TransformationZ Bench Calculation for Combined Defects1610问题: P. USL = 6.68 %P. LSL = 15.87%P. Total = 22.55%如果将所有的缺陷置于一侧,对应缺陷的起始位置距离中值有几个标准偏差?回答: 采用 Z 表或 Minitab 得 p=.2255缺陷概率缺陷概率共计共计 22.55%.从从Z表或表或Minitab查得查得 Z = .7511.50.7569108641412-1-2-332101610缺陷的总缺陷的
35、总概率概率为为 22.55%从从Z表和表和Minitab查得查得 Z = .7511.50.75缺陷的总概率为缺陷的总概率为22.55% (位于曲线右位于曲线右侧下方侧下方)Zbench 为 0.75, 你可以在中心线同所研究的区域之间即+0.75 标准偏差处画置界限Z 转化Z Bench 计算用于组合的缺陷7010864131412-1-2-33210USLZ Bench 同 Cpk & Ppk比较1610LSLZ bench 考虑所有的缺陷Cpk 和 Ppk 仅考虑距离公差限最近的缺陷部分71mean=X“母体参数母体参数”“样本统计样本统计”m =平均值s = standard devi
36、ationSamples = 标准偏差母体 同 样本的比较母体母体: 指在某一统计分析中研究对象的全体样本样本: 从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体。样本统计近似于母体参数Millionmarbles100marbles72Sample母本与样本的比较 母本母本: 是研究对象的全体. 由于其数量,对它的测量是困难而昂贵的。 样本样本: 是母本的一个小的子集 是随机抽取以充分代表母本 一旦过程发生某一变更,新的样本可以很容易取得,并用于确定改进是否有效 备注备注: 通常情况下,母本参数(s = 母本标准偏差)及(m = 母本中值) 会被样本统计中的( s = 样本标准偏差
37、)和 (X bar = 样本中值)所替代样本是对母本观测的窗口73数据基础: 统计课程总结 理解数据分布的中值和标准偏差中值被广泛地用于过程改善,因为: 中值反应了所有数值的影响 标准偏差最佳量化了过程变异性 理解正态分布及如何用曲线下方的面积来解释缺陷的百分率74数据基础: 统计课程总结 根据所获得的数据,理解过程的典型顺序 首先稳定过程; 其次消除不正常的变差; 第三步减少正常的变差; 第四步将过程置于中心.75基础数据基础: 所需回答的问题 什么是统计? 什么是中心度的测量? 任何对变差进行测量? 为什么需要关注过程的稳定性? 什么是分布,正态分布? 为什么“位于曲线下方的面积”很重要?
38、 Z-bench和 Cpk的区别? 样本同母体之间的纽带是什么?76基础问题: 统计问题汇总 统计是对数据的组织,分析和解释 对数据中心趋势的测量包括中值,中位数和重数 对计量型数据的测量包括极差,变异及标准偏差 如果过程不稳定,就不可能从中获得相关信息。因为我们得不到准确的中值及标准偏差,也就无法确定该过程的基线。77数据基础: 问题总结 (续页.) 分布是对数据的累积,通常视为一种测绘,以反映该过程的变异性及稳定性。正态分布表现为数据具有不变的中值并有可预测的变异。它为一种钟形的曲线 给定正态分布和公差限,曲线下方的面积用于对缺陷百分率的预测。它同样可以提供计算公式,例如:Zbench或Cpk Zbench 考虑上下限两侧的缺陷,但Cpk和Ppk只是针对两侧中较差的一侧。78Basic Data: 问题 (续页) 结果发生的概率或可能性是样本数据对母本特性的预测的纽带。换而言之,样本的中值和标准偏差通常用于预测母本的中值和标准偏差。