1、spc中级统计分析管理工具统统 计计 过过 程程 分分 析析基基 础础 知知 识识 数据统计分析目的和作用 数据67666564636261609876543210数数据据频频率率数数据据直直方方图图636064626364636266646062616562636663676463626563656162646361平均值:63.1最大值:67最小值:60样本数:30666462609876543210数数据据频频率率均值63.1标准差1.729N30数数据据直直方方图图正态性拟合数据的分类和特点 压力泵的一组读数(Mpa):200,215.3,211.5,218.2,220 产品表面刮伤数
2、(处):1,5,3,6,8,101)连续的读数,不一定是整数,一般需要专用的量具、仪器进行测量后读数计量性的数据2)不连续的数据,自然数,一般通过计数得到,不一定需要专用的量具、仪器来测量计数性的数据ONOFF统计分析的关键参数?中级统计分析中的关键参数 计量性数据 度量分布位置的参数 均值 中位数 众数 度量离散程度的参数 标准差 极差 计数性数据 度量分布中的比例 度量分布中的比率中级统计分析技术应用数据类型数据类型单样本单样本双样本双样本成对样本成对样本多个样本多个样本可视化工具可视化工具圆点图箱式图散布图圆点图等值线Tukey均值多变量散点图直方图箱式图差异分析圆点图茎叶图箱式图位置检
3、验位置检验(正态假设正态假设)单样本t检验双样本t检验成对样本t检验方差分析ANOVA位置检验位置检验(无分布假无分布假设设)Fisher检验Tukey末数检验Fisher检验Kruskal-Wallis检验Wilcoxon检验Kruskal-Wallis检验Wilcoxon检验变异检验变异检验 单样本2检验F检验Bartlett(正态)Levene(无分布假设)比例检验比例检验 单样本比例双样本比例检验或相关P控制图+置信区间比率检验比率检验柏松比率检验U控制图+置信区间可可 视视 化化 工工 具具Visualize Tools计量性数据的分布可视化 圆点图:检查并比较分布 箱式图:检查并比
4、较分布 比较变量的汇总或单个值 直方图 检查并比较分布 茎叶图 检查并比较分布圆点图 使用点图估计数据的形状和中心趋势。点图与直方图类似,分为多个区间。但是,具有少量数据时,点图可能比直方图更有用,原因在于:一般情况下,点图比直方图包含的区间更多。每个点都表示单独的观测值(或者少量观测值)。点图对于比较数据组也非常有用。点图-单变量示例您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个点图来评估数据并确定样本与目标值 18 的接近程
5、度。36322824201612扭扭矩矩圆圆点点图图洗发水瓶盖扭力解释结果解释结果大多数瓶盖紧固时的扭矩在 14 到 24 之间。只有 1 个瓶盖很松,扭矩小于 11。但是,分布呈正向偏斜,有些瓶盖拧得过紧。许多瓶盖需要大于 24 的扭矩才能打开,5 个瓶盖的扭矩大于 33,这几乎是目标值的两倍。点图-多变量示例您的公司在 2 台机器上生产塑料管件,您想检验管件直径的一致性。您要测量 2 台机器在 3 周内生产的管件,每周各测量 10 个管件。创建一个内部含组(按机器分组每个星期的符号)的点图来检验分布情况。解释结果解释结果机器 2 生产的管件的直径在各周似乎都比较稳定。但是,机器 1 生产的
6、管件的直径变异性每周都在增加:第 1 个星期的直径范围约为 4.3 到 5.2 第 2 个星期的直径范围约为 5.0 到 7.0 第 3 个星期的直径范围约为 4.9 到 8.8箱图四分位数四分位数 四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评估数据集的展开和中心趋势这是了解数据的重要前期步骤。下四分位数(Q1)25%的数据小于等于此值。第二个四分位数(Q2)中位数。50%的数据小于等于此值。上四分位数(Q3)75%的数据小于等于此值。四分位间距下四分位数与上四分位数之间的距离(Q3-Q1);因此,它跨越数据中间部分,即50%。Q1:计算k=(n+1)/4,如果结果是整数
7、,那么 Q1=Xk,否则 Q1=1/2(XINT(k)-1+XINT(k)+1)。Q2:计算k=2(n+1)/4,如果结果是整数,那么 Q2=Xk,否则 Q2=1/2(XINT(k)-1+XINT(k)+1)。Q3:计算k=3(n+1)/4,如果结果是整数,那么 Q3=Xk,否则 Q3=1/2(XINT(k)-1+XINT(k)+1)。IQR:Q3-Q1例如,对于以下数据:7,9,16,36,39,45,45,46,48,51,求:Q1,Q2,Q3,IQR。结果如下:Q1=14.25Q2(中位数)=42Q3=46.50四分位间距=46.50-14.25,或 32.25箱图 箱线图(也称为方框须
8、线图)可用来评估和比较样本分布。25%25%25%25%最大值:Q3+1.5(Q3-Q1)最小值:Q1-1.5(Q3-Q1)Q3:3rd四分位数Q2:中位数:2nd 四分为数Q1:1st 四分位数异常点:箱图两边的胡须长度不能够超过1.5(Q3-Q1),超过着两根胡须的观察值使用不同的符号表示箱图示例-单变量您想要检验地毯产品的总体耐用性。地毯产品的样本放在四所住宅内,然后测量 60 天后的耐用性。创建一个箱线图来检验耐用性得分的分布情况。22.520.017.515.012.510.07.55.0耐耐用用性性耐耐用用性性 的的箱箱线线图图该箱线图显示:耐用性得分的中位数为 12.95 四分位
9、数间距为 10.575 到 17.24。没有出现异常值。间距为 7.03 到 22.5。中位数上方较长的上部须线和较大的方框表明数据略呈正偏斜分布-分布的右尾长于左尾箱图示例-多变量绘制前面点图中所用多变量的例子。您的公司2台设备都生产塑料管件,您很关心直径的一致性问题。您要测量每台机器在 3 周内生产的管件,每周各测量 10 个管件。创建一个箱线图来检验分布情况。机 器21第 3 个 星 期第 2 个 星 期第 1 个 星 期第 3 个 星 期第 2 个 星 期第 1 个 星 期987654数数据据第第 1 1 个个 星星 期期,第第 2 2 个个 星星 期期,第第 3 3 个个 星星 期期
10、 的的 箱箱 线线 图图直方图-示例与观察用于检查样本数据的形状和分布情况。直方图将样本值划分为许多称为区间 的间隔。条形表示落于每个区间内的观测值的数量(频率)。示例:您为一家洗发精制造商工作,您需要确保瓶盖的紧固程度适当。如果瓶盖扣得过松,则有可能在装运过程中脱落。如果扣得过紧,消费者可能很难打开(尤其是在洗浴过程中)。您随机抽取一些瓶子样本,并检测打开瓶盖所需的扭矩。创建一个直方图来评估数据并确定样本与目标值 18 的接近程度。3632282420161214121086420扭扭矩矩频频率率扭扭矩矩 的的直直方方图图直直 方方 图图正常型正常型说明:中间高,两边低,有集中趋势.结论:左
11、右对称分配(常态分配),显示制程在正常运转直直 方方 图图缺齿型(凹凸不平型)缺齿型(凹凸不平型)说明:高低不一,有缺齿情形。不正常的分配,系因测定值或换算方法有偏差,次数分配不当所形成。结论::稽查员对测定值有偏好现象,如对5、10之数字偏好;或是假造数据。测量仪器不精密或组数的宽度不是倍数时亦有此情况直直 方方 图图切边型(断裂型)切边型(断裂型)说明:有一端被切断结论:原因为数据经过全检过,或制程本身有经过全检过,会出现的形状。若剔除某规格以上时,则切边在靠近右边形成直直 方方 图图离岛型离岛型说明:在右端或左端形成小岛.结论:测定有错误,工程调节错误或使用不同原料所引起。一定有异常原因
12、存在,只在去除,即可合乎制和要求,制出合规格的制品直直 方方 图图高原型高原型说明:形状似高原状。结论:不同平均值的分配混在一起,应层别之后再做直方图比较直直 方方 图图双峰型双峰型说明:有两个高峰出现.结论:有两种分配相混合,例如两部机器或两家不同供应商,有差异时,会出现此种形状,因测定值受不同的原因影响,应予层别后再作直方图直直 方方 图图偏态型(偏态分配)偏态型(偏态分配)说明:高处偏向一边,另一边低,拖长尾巴。可分偏右边,偏左边偏右边:例如,微量成分的含有率等,不能取到某值以下的值时,所出现的形状.偏左边:例如,成分含有高纯度的含有率等,不能取到某值以上的值时,就会出现的形状.结论:尾
13、巴拖长时,应检讨是否在技术上能够接受,工具磨损或松动时,亦有此种现象发生.茎叶图-基础 该图类似于直方图,只不过它不是使用条形而是使用实际数据值的数字来表示每个区间(行)的频率 比直方图更简单,不用计算 可以对数据进行重新组织,直方图不可 不用电脑可手工直接进行绘制 快速可视化将数据4 55 166 756茎叶图-示例 55454966534158566063 4591 55386 6603作业题 如果数字为小数怎么做法呢?601.4601.6598.0601.4599.4600.0600.2601.2598.4599.0601.2601.0600.8597.6601.6599.4601.25
14、98.4599.2598.8茎叶图显示茎叶图显示:EX.茎叶图 EX.N =20叶单位=0.10 1 597 6 4 598 044 5 598 8 9 599 0244 9 599(2)600 02 9 600 8 8 601 022244 2 601 66变量变量 平均值平均值 最小值最小值 中位数中位数 最大值最大值EX.599.99 597.60 600.10 601.60散布图 用于通过相对于一个变量绘制另一个变量来图示说明两个变量之间的关系。散点图也可用于绘制随时间变化的变量。简单形式分组(两组数据)简单+拟合分组+拟合散布图-简单示例No.12345678910X26101418
15、2226303438Y481216202428323640403020100403020100X XY YY Y 与与 X X 的的 散散 点点 图图散点图+拟合-示例您很关心公司生产的相机电池是否能够很好地满足顾客的需要。市场调查显示,如果两次放电之间等待的时间超过 5.25 秒,顾客就会变得很不耐烦。您收集了分别使用过不同时间的电池的一个样本,并在每个电池放电后立即测量了其剩余电压(放电后电压),还测量了各电池再次放电之前必须等待的时间(放电恢复时间)。创建一个散点图来检查结果。在 5.25 秒的临界放电恢复时间处包括一条参考线。1.51.41.31.21.11.00.97.57.06.5
16、6.05.55.04.54.03.5放放 电电 后后 电电 压压放放电电恢恢复复5.25放放 电电 恢恢 复复 与与 放放 电电 后后 电电 压压 的的 散散 点点 图图1.51.41.31.21.11.00.97.57.06.56.05.55.04.54.03.5放放 电电 后后 电电 压压放放电电恢恢复复5.25放放 电电 恢恢 复复 与与 放放 电电 后后 电电 压压 的的 散散 点点 图图计数型数据的分布可视化 条形图 饼图条形图 用于比较数据类别的某种度量。每个条形都可以表示某个类别的计数、某个类别的函数(如平均值、合计或标准差)或某个表格中的汇总值。颜色_1水平_1蓝色红色高低高低
17、3.02.52.01.51.00.50.0计计数数颜颜色色_ _1 1,水水平平_ _1 1 的的图图表表颜色密度蓝色高红色低红色低蓝色高红色高红色低蓝色低条形图您是一家生产汽车门板的公司的质量工程师。每周都有一些门板因喷漆瑕疵而被拒收。您怀疑时间段与瑕疵类型之间存在一定的关系。创建一个条形图以确定每种喷漆瑕疵的门板拒收数,并按时间段聚类。选择递减顺序以查看按从最大到最小排列的最外层类别。瑕疵数期间污迹其他草稿钳杆周末夜间傍晚日期周末夜间傍晚日期周末夜间傍晚日期周末夜间傍晚日期20151050百百分分比比瑕瑕疵疵数数,期期间间 的的图图表表所有数据内的百分比。饼图 用于显示每个数据类别相对于整
18、个数据集的比率。简简 单单 假假 设设 检检 验验 分分 析析Basic Hypothesis Test Analysis假设检验基础知识 原材料改变前后产品参数是否一致?过程参数改变前后产品质量是否有变化?缺陷分类和比例是否随着某些因素而存在差异?同样的产品不同的生产线生产,只见是否有差异?几条生产线不同的生产班次的产品之间有无变异?假 设 检 验假设检验的流程定义检验目标声明原假设:H0 VS HA选择风险、和样本量n收集数据并检验假设检验统计和置信区间计算P值P5 或单侧:Ha5双侧:Ha5什么是、和P?几个基本概念 置信度:估计的可信程度。置信区间:对于随机变量,如果1(x1,x2,x
19、n)、2(x1,x2,xn)是来自于样本观测值的两个统计量,存在一个概率1-,使得P(1,2)=1-.那么,随机区间1,2叫做在置信概率1-上的置信区间。置信概率:1-区间估计:随机变量的置信区间1,2Xbar置信下限置信上限1-/2/2两个风险和P值解释正确结论概率:1-错误I概率:错误II概率:正确结论概率:1-接受Ho接受HaHo为真Ha为真结 论事 实第一种风险:拒真概率第二种风险:纳假概率宁可让十个罪人脱逃不可让一个好人受罪!P 值值确定否定假设检验中原假设的适当性。P 值范围介于 0 到 1 之间。p 值越小,错误地否定原假设的概率就越小。进行任何分析之前,请先确定 alpha(a
20、)水平。常用值为 0.05。如果检验统计量的 p 值小于 alpha,则可否定原假设。由于 p 值在假设检验中具有不可或缺的作用,因此 p 值被用于许多统计领域,其中包括基本统计量、线性模型、可靠性和多元分析。关键是要了解每个检验中原假设和备择假设所代表的内容,然后使用 p 值来帮助做出否定原假设的决定。a&b类类错误错误 与与 客户客户 的的 关系关系检验 效率 E=0.8a 类 错误 好的产品 被误认为是 次品。成本:返工 报废虚 警 b 类错误残次品 漏过 检验流向 客户。成本:。漏报 假设检验的选择计数数据计量数据假设检验位置检验变异检验T 检验单样本2水平 双样本2水平 ANOVA
21、检验多样本?水平 单样本 T双样本 T 比率检验比例检验单样本 X2双样本 F正态性检验和转换处理 正态检验的方法 直方图 圆点图 概率纸 手/自动正态转换的方法 1/X SQRT(X)Lg(X)BOX-COX 自动转换数据的正态转换和应用案例 案例分析 BOX-COX转换演示及其分析计量性数据计量性数据假设检验分类 位置位置检验检验(正态假设正态假设)单样本t检验 双样本t检验 成对样本t检验 方差分析ANOVA 变异变异检验检验 单样本2检验 双样本F检验 Bartlett(正态)Levene(无分布假设)抽样的概念抽样的概念总体总体研究对象的全部为什么我们要抽样?抽样 为什么 必须 随机
22、?抽样 误差 的 可能 性。抽样数量 的 决定 基于抽样,我们可以对总体进行推断样本样本:总体 的 一部分-子集1994Dr.MikelJ.HarryV3.0均值相等 的 假设检验 以下的 直方图 展示 两个国家 A 和 B 的 居民身高两个样本 的 大小 为 100,测量单位 为 英寸 国家 B 的 居民平均身高 比 国家 A 高吗?Country A国家A Country B 国家B inch 英寸60.0 62.064.066.068.070.072.074.076.078.080.0假设的假设的 特性特性 原假设原假设(Ho):通常描述 过程状态 提出 假设 基于证据 拒绝或接受备择假
23、设备择假设(Ha):通常描述不同 使用 Minitab 1994Dr.MikelJ.HarryV3.0假设检验 有罪无罪 案例 美国司法系统常被用来作为假设检验的 例子。在美国,除非有确凿证据,否则我们 只能认为 对象无罪。原假设:“此人 无罪。”我们需要强有力的证据来说服陪审团。如果真相已知时如果真相已知时,假设推断的结果会是什么?假设推断的结果会是什么?Ho:此人无罪 Ha:此人有罪单样本t检验 对九个小配件进行了测量。根据历史经验,小配件的测量数据的分布接近于正态,但假设不知道s。为了检验总体平均值是否为5并获得平均值的90%置信区间,需要使用t过程。值 4.9 5.1 4.6 5.0
24、5.1 4.7 4.4 4.7 4.6结果结果:单样本单样本 T:值值 mu=5 与 5 的检验 平均值变量 N 平均值 标准差 标准误 90%置信区间 T P值 9 4.7889 0.2472 0.0824 (4.6357,4.9421)-2.56 0.034单样本t检验的用途 根据刚才的例子,总结一下单样本t检验的使用场合 计量性数据 正态分布(近似)单个样本的位置(均值)检验 目标值已知双样本t检验案例 为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(Damper=1)和热活化气闸(Damper=2)
25、。能耗数据(BTU.In)堆叠在一列中,另外还有一个分组列(Damper),包含用于表示总体的标识符或下标。假设进行了方差检验,并且没有发现方差不等的证据。现在,您要确定是否有证据证明这两种设备之间的差值不为零,以比较出这两种设备的功效。炉子炉子.MTW双样本双样本 T 检验和置信区间检验和置信区间:气闸内置能量消耗气闸内置能量消耗,气闸气闸 气闸内置能量消耗 双样本 T 平均值气闸 N 平均值 标准差 标准误差1 40 9.91 3.02 0.482 50 10.14 2.77 0.39差值=mu(1)-mu(2)差值估计:-0.235差值的 95%置信区间:(-1.450,0.980)差值
26、=0(与)的 T 检验:T 值=-0.38 P 值=0.701 自由度=88两者都使用合并标准差=2.8818双样本t检验的用途 根据刚才的例子,总结一下双样本t检验的使用场合 计量性数据 正态分布(近似)两个样本的位置(均值)检验方差分析ANOVA is 对对平均值平均值比较比较用来确定因变量(“Y”)与单个或多个自变量(“Xs”)间关系的统计显著性的方法,其中(“Xs”)具有两个或多个水平。是确定每一水平的响应变量值的均值是否来自同一总体的一种方法。(它们有所不同吗?)筛选潜在的关键少数“Xs”的方法使用方差分析的三种假设使用方差分析的三种假设1.对于因素水平的每一组合对于因素水平的每一组
27、合,残差值的均值为残差值的均值为0.0这意味着我们所拟合的方程(或模型)正确,没有其它变量影响结果。“观测”值(圆圈)和“预计”值(数组平均值,水平线)间的差额为“残差”。2.残差必须独立,并呈正态分布残差必须独立,并呈正态分布残差(或误差)即是实际观测的“Y”值和预计的数学模型的“Y”值。残差表明模型何处与数据不相匹配。当比较平均值时,正态性往往不成问题。因为中心极限定理表明,平均值趋向正态分布。当比较变差时,正态性非常重要。(方差齐性:对于正态数据,应用“Bartlett”检验法,对于非正态数据,应用“Levene”检验法)另一个需要关注的问题(除平均值的相等性之外)是方差的相等性。“X”
28、转变成不同水平时,可能降低变差,提高Z值。可以用Bartlett或Levene检验法来检验方差的相等性。3.方差必须相等方差必须相等(或接近相等或接近相等)单样本ANOVA分析 您设计了一项试验来评估四种试验性地毯产品的耐用性。您将这些地毯产品中每种的一个样本分别铺在四个家庭,并在60天后测量其耐用性。由于您要检验平均值是否相等并评估平均值之间的差异,因此您使用包含多重比较的单因子方差分析过程(堆叠形式的数据)。通常,您会选择适用于数据的一种多重比较方法。但是,此处选择了两种方法来展示Minitab的功能。单因子方差分析单因子方差分析:耐用性耐用性 与与 地毯地毯 来源 自由度 SS MS F
29、 P地毯 3 146.4 48.8 3.58 0.047误差 12 163.5 13.6合计 15 309.9S=3.691 R-Sq=47.24%R-Sq(调整)=34.05%平均值(基于合并标准差)的单组 95%置信区间水平 N 平均值 标准差 -+-+-+-+1 4 14.483 3.157 (-*-)2 4 9.735 3.566 (-*-)3 4 12.807 1.506 (-*-)4 4 18.115 5.435 (-*-)-+-+-+-+10.0 15.0 20.0 25.0合并标准差=3.691双样本ANOVA分析 作为一位生物学家,您正在研究生活在两个湖中的浮游动物。您在实验
30、室中放置了十二个容器,每六个容器一组分别装有取自两个湖的水。您在每个容器中添加了三种营养补充物质中的一种,30天后对单位体积水中的浮游动物进行计数。您使用双因子方差分析检验总体平均值是否相等,这相当于检验是否有显著证据证明存在交互作用和主效应。双因子方差分析双因子方差分析:浮游动物浮游动物 与与 补充补充,湖湖 来源 自由度 SS MS F P补充 2 1918.50 959.250 9.25 0.015湖 1 21.33 21.333 0.21 0.666交互作用 2 561.17 280.583 2.71 0.145误差 6 622.00 103.667合计 11 3123.00S=10.
31、18 R-Sq=80.08%R-Sq(调整)=63.49%平均值(基于合并标准差)的单组 95%置信区间补充 平均值 -+-+-+-+-1 43.50 (-*-)2 68.25 (-*-)3 39.75 (-*-)-+-+-+-+-30 45 60 75 平均值(基于合并标准差)的单组 95%置信区间湖 平均值 -+-+-+-+-可移动的高秤 51.8333 (-*-)玫瑰花 49.1667 (-*-)-+-+-+-+-42.0 48.0 54.0 60.0Lake 1Lake 2Lake 3ANOVA的用途 根据刚才的例子,总结一下ANOVA检验的使用场合 计量性数据 正态分布(近似)两个或
32、以上样本的位置(均值)检验ANOVA分析特点 方差分析将用于检验两个总体平均值相等性的双样本t检验扩展到更一般的比较两个以上平均值相等性的原假设,即相对于它们并非全都相等。允许模型同时具有定性和定量变量。双因子方差分析可在按两个变量或因子对处理进行分类时检验总体均值是否相等。对于此过程,数据必须平衡(所有单元必须有相同数量的观测值),因子必须是固定的。更加灵活、准确,可以分析各因子之间的交互作用。练习题 根据公司产品特点准备需要的典型数据进行案例分析 同一产品两个供应商,针对某一特性进行分析 公司内部同一产品不同批次的同一产品特性分析。单方差卡方检验 您在一家制造飞机发动机的高精度部件(包括测
33、量长度必须为15英寸的金属销栓)的工厂任质量控制检验员。安全法规定,销栓长度的方差不得超过0.001in2。以前的分析表明,销栓长度服从正态分布。您收集了100个销栓的样本,并对其长度进行了测量,以便进行假设检验并为总体方差创建一个置信区间。单方差检验结果单标准差检验和置信区间单标准差检验和置信区间:销长度销长度 H0:西格玛=0.001Ha:西格玛不0.001 基本统计量变量N标准差方差销长度1000.02670.00071595%置信区间95%单侧置信区间变量 方法 标准差上限 方差上限销长度 标准 0.0303 0.000919 调整的 0.0295 0.000869检验变量 方法 卡方
34、 自由度 P 值销长度 标准 70.77 99.00 0.014 调整的 112.64 157.57 0.003结果分析:由于数据来自正态分布总体,因此请参考标准方法。单侧假设检验的 p 值为 0.014。此值足够低,可以否定原假设,并可推断销长度的方差小于 0.001。通过考查 95%的置信上限,可以使总体方差的估计值更确切,该置信上限提供总体方差可能低于的值。从此分析中应该能推断出,销栓长度的方差足够小,可以满足规范并确保乘客安全。双样本方差检验 正态分布:F检验 非正态分布的任何连续分布:LEVENE检验双样本方差检验案例 为了提高家庭暖气系统的效率,进行了一项旨在评估两种设备功效的研究
35、。安装其中一种设备后,对房舍的能耗进行了测量。这两种设备分别是电动气闸(气闸1)和热活化气闸(气闸2)。能耗数据(气闸内置能量消耗)堆叠在一列中,另外还有一个分组列(气闸),包含用于表示总体的标识符或下标。您要比较两个总体的方差,以便构造用于比较两个气闸的双样本t检验和置信区间。检验结果等方差检验:气闸内置能量消耗与气闸95%标准差Bonferroni置信区间气闸N下限标准差上限1402.406553.019874.027262502.254472.767023.56416 F检验(正态分布)检验统计量=1.19,p值=0.558 Levene检验(任何连续分布)检验统计量=0.00,p值=0
36、.996对于该能耗示例来说,p 值 0.558 和 0.996 都大于 a 的合理选择范围,因此无法否定方差相等的原假设。也就是说,这些数据并未提供足够证据证明两个总体的方差不相等。因此,使用双样本 t 过程时假定方差相等是合理的。关于P值的解释 P值,通常称之为可获得的置信水平去跟比较。P值就是一个指标来衡量样本证据对拒绝假设H0的支持程度。一般地,P值越小则表示拒绝零假设H0的样本证据的分量越重。特别地,P值是导致H0被拒绝的最小值。任何值P值拒绝H0。P值也是一种从相同样本容量样本中统计试验出来的比例,并且这种样品是从相同的分布中取得的,这种是在假设H0为真的情况下统计试验产生的一个极端
37、值。综综 合合 分分 析析 案案 例例General Analysis Case Study综合应用案例分析 一名工厂领班选择了五个代表预期测量值范围的部件。每个部件都通过布局检查进行了测量以确定其参考(主要)值。然后,一名操作员将每个部件随机测量了12次。您使用方差分析法从量具 R&R 研究中获得了过程变异(16.5368)。部件参考值响应部件参考值响应部件参考值响应122.7365.85109.1122.5365.75109.3122.4365.95109.5122.5365.95109.3122.73665109.4122.3366.15109.5122.53665109.5122.53
38、66.15109.5122.4366.45109.6122.4366.35109.2122.63665109.3122.4366.15109.4245.1487.6243.9487.7244.2487.8245487.7243.8487.8243.9487.8243.9487.8243.9487.7243.9487.8244487.5244.1487.6243.8487.7直方图分析结果1.00.50.0-0.5-1.01612840X_B Bi ia as s频频率率B Bi ia as s 的的直直方方图图(平均值的 95%t 置信区间)单样本的t检验分析单样本单样本 T:Bias mu=
39、0与0的检验(a=0.05)平均值变量N平均值标准差标准误95%置信区间TPBias60-0.05330.44430.0574(-0.1681,0.0615)-0.930.356请大家计算出t统计量的t值为多少?软件综合分析结果1086421.00.50.0-0.5-1.0参参 考考 值值偏偏倚倚0回归95%置信区间数据平均偏倚偏倚线性1050百百分分比比常量0.736670.072520.000斜率-0.131670.010930.000自变量系数系数标准误P量具线性S0.23954R-Sq71.4%线性2.17735线性百分率13.2平均-0.0533330.30.08920.491667
40、3.00.00040.1250000.80.35460.0250000.20.6678-0.2916671.80.00010-0.6166673.70.000参考偏倚%偏倚P量具偏倚量具名称:研究日期:报表人:公差:其他:占占 过过 程程 变变 异异 的的 百百 分分 比比响响应应 的的量量具具线线性性和和偏偏倚倚研研究究稳定性研究的结果1211109876543210.500.250.00-0.25-0.50样样 本本样样 本本 均均 值值_X=-0.053UCL=0.269LCL=-0.3761211109876543211.20.90.60.30.0样样 本本样样 本本 极极 差差_R=
41、0.559UCL=1.181LCL=0111611111B Bi ia as s 的的 X Xb ba ar r-R R 控控 制制 图图跟线性的结果有无联系?ANOVA(交叉)法选择了 10 个代表过程变异预期范围的部件。3 名操作员以随机顺序测量这 10 个部件,每个部件测量 3 次。1A0.29 1A0.411A0.642A-0.562A-0.682A-0.583A1.343A1.173A1.274A0.474A0.504A0.645A-0.805A-0.925A-0.846A0.026A-0.116A-0.217A0.597A0.757A0.668A-0.318A-0.208A-0.1
42、7结果输出包含交互作用的双因子方差分析表包含交互作用的双因子方差分析表 来源 自由度 SS MS F P部件 9 88.3619 9.81799 492.291 0.000操作员 2 3.1673 1.58363 79.406 0.000部件*操作员 18 0.3590 0.01994 0.434 0.974重复性 60 2.7589 0.04598合计 89 94.6471删除交互作用项选定的 Alpha=0.25结果输出量具量具 R&R 方差分量来源 方差分量 贡献率合计量具 R&R 0.09143 7.76 重复性 0.03997 3.39 再现性 0.05146 4.37 操作员 0.
43、05146 4.37部件间 1.08645 92.24合计变异 1.17788 100.00 结果输出研究变异%研究变来源 标准差(SD)(6*SD)异(%SV)合计量具 R&R 0.30237 1.81423 27.86 重复性 0.19993 1.19960 18.42 再现性 0.22684 1.36103 20.90 操作员 0.22684 1.36103 20.90部件间 1.04233 6.25396 96.04合计变异 1.08530 6.51180 100.00可区分的类别数(ndc)=4图标输出部件间再现性重复量具 R&R100500百百 分分 比比%贡献%研究变异1.00.
44、50.0样样 本本 极极 差差_R=0.342UCL=0.880LCL=0ABC20-2样样 本本 均均 值值_X=0.001UCL=0.351LCL=-0.348ABC1098765432120-2部部 件件CBA20-2操操 作作 员员10 9 8 7 6 5 4 3 2 120-2部部 件件平平 均均ABC操作员量具名称:研究日期:报表人:公差:其他:变变 异异 分分 量量R R 控控 制制 图图(按按 操操 作作 员员)X Xb ba ar r 控控 制制 图图(按按 操操 作作 员员)测测 量量 部部 件件测测 量量 操操 作作 员员 操操 作作 员员 乘乘 部部 件件 交交 互互
45、作作 用用测测量量 的的量量具具 R R&R R (方方差差分分析析)单比例检验 使用单比率可计算置信区间并执行比率的假设检验。例如,汽车部件制造商声称,其火花塞的缺陷率低于2%。可以取火花塞的随机样本确定实际缺陷率是否与声称的缺陷率一致。对于比率的双尾检验:H0:p=p0与H1:pp0,其中,p是总体比率,p0是假设值。县地区检察官想竞选州地区检察官职位。她已决定,如果她的党派成员中支持她的人超过 65%,她就放弃县检察官职位,而竞选州检察官职位。您需要检验 H0:p=.65 与 H1:p .65。作为竞选活动管理者,您收集了 950 名随机选择的党派成员的数据,并发现有 560 人支持该候
46、选人。您进行了一项比率检验,以确定支持者的比率是否大于必需比率 0.65。此外,还构造了 95%的置信限,以确定支持者比率的下限。单比率检验和置信区间单比率检验和置信区间 p=0.65 与 p 0.65 的检验样本 X N 样本 p 95%下限 精确 P 值1 560 950 0.589474 0.562515 1.000结果说明什么?p 值 1.0 表示,数据与原假设一致(H0:p=0.65),即支持候选人的党派成员的比率不大于 0.65 这一必需比率。作为活动管理者,您建议她不要竞选州地区检察官职位。单比率检验(POISSON)为单样本Poisson过程中事件的发生率和平均发生次数计算置信
47、区间,并进行发生率等于指定值的假设检验。Poisson过程描述某一事件在给定的时间、面积、体积等范围内的出现次数。单比率检验案例 公司A生产电视机,在过去十年中,该公司对每个季度生产的有缺陷屏幕的单元数进行了计数。管理层规定,每季度20个缺陷单元是可接受的最大比率,他们想确定其工厂是否满足这一规定。单样本 Poisson 率:缺陷 A 的检验和置信区间 比率检验=20 与比率 20 合计出变量 现数 N 出现率 95%上限 精确 P 值缺陷 A 713 40 17.8250 18.9628 0.001 观测值的 长度=1。p 值 为 0.001。因此,应否定原假设并推断出,总体缺陷率小于 20
48、。通过考查 95%的置信上限,可以使总体比率的估计更确切,该上限提供总体缺陷率可能低于的值。从此分析中,有足够的理由相信,每个季度的缺陷屏幕数小于 18.9628。从而可以得出结论,公司 A 生产的电视机满足其季度缺陷规定。练习题 根据公司产品特点准备需要的典型数据进行案例分析 供应商改善前后的对比分析 公司过程改进前后的对比分析 合格率的对比分析 课程回顾与巩固Q&ATHEEND只要我们脚踏实地,一丝不苟地对待品质,金灿灿的奖杯一定属于我们大家!生活中的辛苦阻挠不了我对生活的热爱。22.10.322.10.3Monday,October03,2022人生得意须尽欢,莫使金樽空对月。12:50
49、:3812:50:3812:5010/3/202212:50:38PM做一枚螺丝钉,那里需要那里上。22.10.312:50:3812:50Oct-223-Oct-22日复一日的努力只为成就美好的明天。12:50:3812:50:3812:50Monday,October03,2022安全放在第一位,防微杜渐。22.10.322.10.312:50:3812:50:38October3,2022加强自身建设,增强个人的休养。2022年10月3日下午12时50分22.10.322.10.3精益求精,追求卓越,因为相信而伟大。2022年10月3日星期一下午12时50分38秒12:50:3822.1
50、0.3让自己更加强大,更加专业,这才能让自己更好。2022年10月下午12时50分22.10.312:50October3,2022这些年的努力就为了得到相应的回报。2022年10月3日星期一12时50分38秒12:50:383October2022科学,你是国力的灵魂;同时又是社会发展的标志。下午12时50分38秒下午12时50分12:50:3822.10.3每天都是美好的一天,新的一天开启。22.10.322.10.312:5012:50:3812:50:38Oct-22相信命运,让自己成长,慢慢的长大。2022年10月3日星期一12时50分38秒Monday,October03,2022