1、A阶段绿带教材(最新)DM阶段回顾与试题讲解阶段回顾与试题讲解 多变量分析多变量分析 第一章第一章 概述概述练习制作多变量图多变量图与控制图基本概念及作用多变量分析变异来源分类分析应用数据采集要求使用环境变异的2个来源3种分类多变量分析数据采集抽样要求组内、组间、组外的含义Minitab制作多变量图路径方差组分分析方差组分分析方差组分分析用途分析实例、练习交叉与嵌入的混合结构嵌入结构交叉结构因子的数据结构工具工具三种数据结构及相关分析方法方差组分分析四大用途Minitab进行方差组分分析路径模块目标模块目标流程图/鱼骨图筛选DOE因果矩阵与FMEA多变量/方差组分/中心极限定理优化DOE通过优
2、化并控制关键X达到流程优化和控制的目的6Sigma改进过程中的漏斗效应改进过程中的漏斗效应假设检验30-50个X10-15个X8-10个X4-8个关键X3-6个关键X应用环境应用环境变异的来源变异的来源单件产品内部批次内单件产品之间不同批次之间不同操作员之间不同生产设备之间设备生产转换前后不同时间段测量系统的重复性测量系统的再现性校准前后的稳定性不同测量人员之间量程范围内的线性度来自流程的变异来自测量系统的变异变异什么是多变量分析?什么是多变量分析?多变量分析:基本概念及作用多变量分析:基本概念及作用从多个角度通过图表观察造成流程绩效指标变异的原因观察流程的短期与长期能力间的差距及造成差距的主
3、要原因与方差组分分析一起使用,可以明确流程变异的根本原因 流程绩效指标随流程输入和流程指标变化的图标展示 在生产中对当前流程水平进行过程能力分析的手段 流程稳定性的直观观察多变量分析的作用是什么?多变量分析的作用是什么?多变量图多变量图R内:单元内部的变化范围R间:单元间的差别R时:不同时间段的差别图为某注塑车间随时间(15 18 21)的不同,注塑强度差异的多变量图R内R间R间多变量分析:多变量图多变量分析:多变量图通常在一个图表上展示2-4个X对连续变量Y的影响多变量图与控制图的比较多变量图与控制图的比较9:0010:0011:00 12:00A、单元内的变异是最大来源9:0010:001
4、1:00 12:00B、单元间的变异是最大来源9:0010:0011:00 12:00 C、时间造成的变异最大多变量分析:与控制图的比较多变量分析:与控制图的比较有助于发现将流程稳定在最佳条件下的一些有用线索条件:在流程中存在很多变异的情况下,优点:有助于发现造成变异甚至失控的来源优点:可以揭示流程的稳定性与可控性缺点:不能直接发现造成失控的根本原因综综合合控制图控制图多变量图多变量图变异来源变异来源变异来自流程的变异1、单件产品内部2、批次内单件产品之间3、不同批次之间4、不同操作员之间5、不同生产设备之间6、设备生产转化前后7、不同时间段8、来自测量系统的变异1、测量系统的重复性2、测量系
5、统的再现性3、校准前后的稳定性4、不同测量人员之间5、量程范围内的线性度6、多变量分析:应用环境多变量分析:应用环境顺序空间时间 来自单件内部的 变异,来自同一 批次不同单件间 的变异 化工厂的不同反 应容器之间 不同的设备或操 作员工之间 连续生产的单件之间 不同的生产安排之间 不同的原料或批次之间 固定间隔的不同时间段,如每小时,班组,日,星期等 短时间间隔(小时,班组)与长时间间隔(日、星期)的比较等常见变异来源分类常见变异来源分类多变量分析:应用环境多变量分析:应用环境设备2设备1位置 顺序时间1时间1 时间间隔常见的变异来源图示常见的变异来源图示多变量分析:应用环境多变量分析:应用环
6、境揭示常见的变异来源产品单元内,单元之间,批次之间,人员,设备,班组,时间,原料,生产调整等。测量系统的重复性与再现性分析理解测量误差的来源。应用举例应用举例多变量分析:应用环境多变量分析:应用环境如果要确定是时间因素带来的变异,进行多变量分析时应尽量采用系统抽样系统抽样的方式(定时或固定间隔采样)为了充分暴露问题,应尽量使用长期数据长期数据,考虑了各个造成变异的因素后,才能客观反映问题的来源,一般要求样本的方差达到样本的方差达到流程总变异的流程总变异的80%以上以上。抽样指导原则:1、空间/位置原因变异每个单件上至少选择两个位置每个单件上至少选择两个位置2、顺序每个批号或每个时间段至少选取每
7、个批号或每个时间段至少选取3个连续生产的部件个连续生产的部件3、时间因素至少挑选至少挑选20个固定间隔的抽样时间段个固定间隔的抽样时间段多变量分析数据采集要求多变量分析数据采集要求多变量分析:应用环境多变量分析:应用环境应用应用Minitab画多变量图画多变量图v黑带老王希望了解培训和经历对员工生产率的影响,根据与项目团队的交流发现员工在岗时间(1-5年)和培训项目(有基础培训与专家培训两种),分别为40和80小时。对工件的加工时间用来衡量生产率。v部分相关数据如图所示。v数据在Minitab 文件multivariate-crossed.maw中。v打开文件按下图进行练习。多变量分析:图形制
8、作多变量分析:图形制作vStatQuality ToolsMulti-Vary ChartvResponse:TimevFactor1:Training HoursvFactor2:Experience v点击“Options”并选择所有三项(包括Display individual Data Points)vOK应用应用Minitab画多变量图画多变量图多变量分析:图形制作多变量分析:图形制作应用应用Minitab练习,你能得出什么结论?练习,你能得出什么结论?多变量分析:图形制作多变量分析:图形制作E Ex xp pe er ri ie en nc ce eT Ti im me e5313
9、00250200150100Traininghours04080P Pr ro od du uc ct ti iv vi it ty y s st tu ud dy y同等经历与培训的员工似乎仍有一定程度的差别:50-80分钟。有一年经验的员工通过培训可最大程度地提高生产率:平均降低约175分钟工作经验的影响:第一年到第三、五年平均降低约40分钟,第三、五年的差别不大多变量分析:图形制作多变量分析:图形制作再练习一次,但两个因子的顺序互换vStatQuality ToolsMulti-Vary ChartvResponse:TimevFactor1:Experience vFactor2:Tr
10、aining Hoursv点击“Options”并选择所有三项(包括Display individual Data Points)vOK应用应用Minitab练习练习“多变量分析多变量分析”多变量分析:练习多变量分析:练习多变量分析:练习多变量分析:练习应用应用Minitab练习,你能得出什么结论?练习,你能得出什么结论?方差组分分析方差组分分析 第一章第一章 概述概述交叉结构交叉结构举例举例注意内容注意内容三种因子数据结构三种因子数据结构交叉结构:根据具体生产运营情况,有完全交叉的因子关系嵌入结构:因子间存在从属关系交叉与嵌入混合结构:交叉与从属结构混合的情形在进行多变量分析前应该特别注意数
11、据是如何收集的及因子之间的相互关系在一次MSA分析中,由3个检验员对10个部件进行了MSA分析。要求:3个检验员对所有10个部件都重复测量 对于测量结果来说,部件和质检员都是造成偏差的来源 由于所有的检验员和所有部件都组合过,是典型的交叉结构 其它交叉结构实例:试验设计中的全因子试验模型方差组分方差组分分析:因子数据结构分析:因子数据结构交叉结构交叉结构图示图示 1 1 2 1 3 2 1 2 1 2 2 1 2 1 3 2 1 2 1 2 检验员部件测量次数 1 1 2 1 3 2 1 2 1 2 2 1 2 1 3 2 1 2 1 2 检验员部件测量次数方差组分方差组分分析:因子数据结构分
12、析:因子数据结构在超市购买洗发水,香皂,罐装饮料等,都可以发现一个产品序列号。产品的序列号可以追踪到生产日期和批次。再生产商内部,任何一件产品只能来自某个批次,某个生产线,某班组,某批原料。同一批次的产品只能来自某个生产线,可能属某班组,某批原料。几个班组可能只是在某个生产线工作(如不同地域)所有生产线可能在同时只处理同一批原料。这就可能构成完全嵌入的从属关系。嵌入式结构嵌入式结构举例举例方差组分方差组分分析:因子数据结构分析:因子数据结构嵌入式结构嵌入式结构图示图示 2 1 1 2 2 1 3 2 1 1 2 1 2 1 2 1 3 2 1 2 1 2 1原料批次生产线班组批次单件产品编号可
13、能一样但实际上是不同的方差组分方差组分分析:因子数据结构分析:因子数据结构因子数据结构不同,采用的定量分析方法就不同因子数据结构不同,采用的定量分析方法就不同方差组分分析可用于:方差组分分析可用于:识别最大的变异来源通过对最大变异来源的消除达到改善流程的目的为改善阶段流程的优化确定方向建立更有效的样本采集计划交叉结构采用方差分析(包括固定模型和随机模型)的方法分析通嵌入结构采用方差组分分析可以把各个来源所造成的变异进行分离,并计算出各自为总体的偏差(以方差计算)所带来的份额有多少方差组分方差组分分析:用途分析:用途方差组分分析方差组分分析举例举例v某化工厂黑带小张意图减少洗发水罐装量偏差过大的
14、问题。罐装是在不同工厂,不同设备及有不同班组的员工进行。为了定量了解上述原因对罐装量(以克为单位)变异的影响,小张分别到四个工厂的四个班组中随机抽取了四位操作员,每位操作员工作时抽取三个样品(每间隔800个生产产品)进行了分析。v这是一个典型的嵌入式结构,可借助完全嵌入结构的方差分析(即方差组分分析)定量研究成果作为该结果。v文件名称为:shapooweight.mtw.方差组分方差组分分析:分析案例分析:分析案例多变量分析:举例多变量分析:举例交叉结构分析应用工具之一方差组分方差组分分析:分析案例分析:分析案例S Sh hi if ft tW We ei ig gh ht t4321122.
15、2122.1122.0121.9121.8121.7121.6121.5121.4121.34321432143211234Operator1234M Mu ul lt ti i-V Va ar ri i C Ch ha ar rt t f fo or r W We ei ig gh ht t b by y O Op pe er ra at to or r -P Pl la an nt tPanel variable:Plant班组间变异班组间变异操作员间变异操作员间变异内部变异内部变异工厂间变异工厂间变异多变量分析结论多变量分析结论方差组分方差组分分析:分析案例分析:分析案例请注意输入顺序:
16、从高级开始逐级下沿进行定量分析方差组分分析方差组分分析Minitab应用应用方差组分方差组分分析:分析案例分析:分析案例Nested ANOVA:Weight versus Plant,Shift,Operator,Sample Analysis of Variance for Weight Source DF SS MS F PPlant 3 0.7411 0.2470 5.743 0.011Shift 12 0.5162 0.0430 1.302 0.249Operator 48 1.5865 0.0331 2.582 0.000Sample 128 1.6385 0.0128Total
17、191 4.4824工厂间及操作员之间的变异是造成变异的显著原因。方差组分分析方差组分分析举例举例方差组分方差组分分析:分析案例分析:分析案例Variance Components Source Var Comp.%of Total StDevPlant 0.004 17.26 0.065Shift 0.001 3.37 0.029Operator 0.007 27.40 0.082Sample 0.013 51.97 0.113Total 0.025 0.157 Expected Mean Squares 1 Plant 1.00(4)+3.00(3)+12.00(2)+48.00(1)2
18、Shift 1.00(4)+3.00(3)+12.00(2)3 Operator 1.00(4)+3.00(3)Sample 1.00(4)各因素对总变异的贡献比例及绝对量。获得上述数据结论的计算方法。方差组分分析方差组分分析举例举例方差组分方差组分分析:分析案例分析:分析案例v同一操作员随时间进行会有不同的罐装量,这是造成变异的最大原因v不同员工罐装量有区别,应研究培训或操作规程的制定执行情况v不同工厂罐装数量有不同之处,应调查原因是什么v不同班组之间没有明显的区别方差组分分析方差组分分析结论结论方差组分方差组分分析:分析案例分析:分析案例v绿带李小姐负责供应商质量管理工作,她需要了解是否存
19、在供绿带李小姐负责供应商质量管理工作,她需要了解是否存在供应商与本公司之间对某产品某项指标的检验结果是否相同。由应商与本公司之间对某产品某项指标的检验结果是否相同。由于供应商来自另外一个国家,来料的品质检验难以按照交叉检于供应商来自另外一个国家,来料的品质检验难以按照交叉检验的方式进行。为此,李小姐要求供应商在其两个生产基地验的方式进行。为此,李小姐要求供应商在其两个生产基地各各自选五件产品自选五件产品,并各随机选择一个检验员进行重复测量。在本,并各随机选择一个检验员进行重复测量。在本公司公司也选了五件产品也选了五件产品,也挑选了一位检验员进行了重复测量。也挑选了一位检验员进行了重复测量。v结
20、果汇总到文件结果汇总到文件nestedr&r.mtw中。请用多变量分析及方差组中。请用多变量分析及方差组分分析进行研究。然后采用嵌入式分分析进行研究。然后采用嵌入式R&R(StatQuality ToolsGage R&R Study(nested)验证。验证。多变量分析及方差组分分析多变量分析及方差组分分析练习练习方差组分方差组分分析:分析案例分析:分析案例多变量图可以展示造成变异的来源多变量图可以展示造成变异的来源方差组分分析可以定量研究变异的来源方差组分分析可以定量研究变异的来源数据结构决定了采用的分析模型数据结构决定了采用的分析模型(1)交叉结构:方差分析、)交叉结构:方差分析、MSA
21、测量系统分析测量系统分析“StatQuality ToolsGage Stady或或Attribute Agreement Analysis”(2)嵌入结构:方差组分分析;)嵌入结构:方差组分分析;“StatANOVARandom DataNormal”产生100行9(n=9)列随机数,均值=5、标准差=3叠加数据:叠加数据:“DataStackColumns.”产生数据叠加数据中心极限定理:引入练习中心极限定理:引入练习数据的均值数据的标准差“”X“”或“”=5.1347=2.9483计算数据的均值(计算数据的均值()、标准差()、标准差()、观察数据分布:)、观察数据分布:“StatBas
22、ic StatisticsGraphical Summary”12.510.07.55.02.50.0-2.5MedianMean5.45.35.25.15.04.9Anderson-Darling Normality TestVariance8.6923Skewness-0.077111Kurtosis-0.217788N900Minimum-3.7342A-Squared1st Quartile3.1655Median5.11843rd Quartile7.0824Maximum13.454595%Confidence Interval for Mean4.94180.275.327695
23、%Confidence Interval for Median4.88795.388495%Confidence Interval for StDev2.81813.0912P-Value0.684Mean5.1347StDev2.948395%Confidence IntervalsSummary for 数据值中心极限定理:引入练习中心极限定理:引入练习“StatBasic Statistics Display Descriptive Statistics.”Descriptive Statistics:数据值数据值 Variable N N*Mean SE Mean StDev 数据值
24、900 0 5.1347 0.0983 2.9483数 据 值Frequency12.510.07.55.02.50.0-2.5706050403020100Mean5.135StDev2.948N900Histogram(with Normal Curve)of 数据值=5.1347=2.9483中心极限定理:引入练习中心极限定理:引入练习产生数据的均值数据:产生数据的均值数据:“CalcRow Statistics”从C1-C9列随机抓9个数(每列1个),求平均值,从而得出一组平均值的数据中心极限定理:引入练习中心极限定理:引入练习计算均值数据的均值、均值数据的标准差、观察均值数据的分布:
25、“StatBasic StatisticsGraphical Summary”均值数据的均值XX76543MedianMean5.45.35.25.15.04.9Anderson-Darling Normality TestVariance0.9477Skewness-0.034552Kurtosis-0.104255N100Minimum2.7110A-Squared1st Quartile4.4422Median5.13673rd Quartile5.7999Maximum7.584895%Confidence Interval for Mean4.94150.115.327995%Con
26、fidence Interval for Median4.90365.387795%Confidence Interval for StDev0.85481.1309P-Value0.993Mean5.1347StDev0.973595%Confidence IntervalsSummary for 均值均值数据的标准差5.13470.9735XX中心极限定理:引入练习中心极限定理:引入练习“StatBasic Statistics Display Descriptive Statistics.”均 值Frequency7654320151050Mean5.135StDev0.9735N100
27、Histogram(with Normal Curve)of 均值Descriptive Statistics:Descriptive Statistics:均值均值 Variable N N*Mean SE Mean StDev均值 100 0 5.1347 0.0974 0.97355.13470.9735XX中心极限定理:引入练习中心极限定理:引入练习比较比较“”与与“”;比较;比较“”与与“”;XX已知:=5.1347;=2.9483;n=9;所以:15.13472.948320.98280.97359XXn()()5.13470.9735XX;结论:(1)样本均值的均值=总体均值 (
28、2)样本均值的标准差=总体标准差/组数的开方 (3)随着n增加,对任何分布,均值的分布越趋向正态分布中心极限定理:引入练习中心极限定理:引入练习n按以下步骤进行练习:打开Minitab从“Chi2”产生数据计算C1-C9的均值,将结果存储到C10列:“CalcRow Statistics.”叠加C1-C9,将结果存储到C11列:“DataStackColumns”建立C10与C11的直方图:“StatBasic StatisticsGraphical Summary”或 “StatBasic Statistics Display Descriptive Statistics.”或 “Graph
29、Random DataChi-Square”练习非正态分布的中心极限定理练习非正态分布的中心极限定理中心极限定理:引入练习中心极限定理:引入练习中心极限定理的定义中心极限定理(1):样本均值的标准差=样本的标准差/均值的样本容量的开方nx=总体的标准差总体的标准差n=均值的样本容量均值的样本容量 =均值的标准误差x中心极限定理(2):随着n增加,对任何分布,均值的分布越趋向正态分布v置信区间源自中心极限定理。v中心极限定理和置信区间是推断统计决策的基本工具。v中心极限定理是统计推断的基本概念。我们可以通过该定理用样本的数据推断总体的特性。中心极限定理定义:第一部分此概念对正态和非正态同样成立v
30、如果容量为n的随机样本取自一个均值为标准差为的分布,则样本的均值将形成一个小的分布,新分布的均值与原分布相同,但标准差将缩小为 。n 总体分布 样本分布 x -Xmeanmean(X)XXnXxxZZ/nv某公式揭示了“样本均值”的变化,比单个个体观察的变化要小(为样本容量的平方根)vSEmean 样本均值分布变差,比原始总体小(对任何n1的总体)个体组成的总体样本均值组成的总体Note Note 注意注意如果未知,样本量大于30,则样本标准差s可以用至上述公式中。那么,标准误差的估计值为:x nS中心极限定理定义:第一部分v我们常依赖从测量系统(MS)读取的一个数据,此数据用来估计“真实”质
31、量特性。v可以利用中心极限定理,从同一部分读取两次以上数据并取平均,以减少测量系统的误差。xn)(meanMSnMS2Total2Parts2MS=+=likewiseRecall:%Contribution of MS=22)(TotalmeanMS中心极限定理定义:第一部分实际应用v测量系统的精度将提高,因为样本容量(重复测量的次数)的平方根。v这当然不是逃避修理量仪的借口!跟老师进行以下练习:v从正态分布中,产生100行9列数据v1、Mean(均值)=50;Standard Deviation(标准差)=9 2、将前9列的均值都储存在C10;将前9列的数据都累叠在C11中心极限定理定义:
32、第一部分练习作C10,C11的直方图,并进行正态检验,对比其结果,可以得到什么结论?练习:二项分布结果会怎样?v产生100行9列 随机二项分布数据,Calc/Random Data/Binomial 使用Trials=20,p=0.3求每行平均,存在C10列 CalcRow Statistics将C1-C9列累叠在C11列 DataStackColumn,正态性检验.分别作C10,C11列的直方图 分别求C10,C11列的标准差。比较两图及其标准差,有何异同?中心极限定理定义:第一部分练习 随着n增加,对任何分布,均值的分布越趋向正态分布。中心极限定理定义:第二部分中心极限定理,使我们可以假定
33、:对正态分布,中心极限定理,使我们可以假定:来自任何分布的样本均值分布都近似于正态分布,只要“n”足够大(对于任何分布要求n30)样本均值本身也是正态分布,且与样本容量无关均值标准误差告诉我们,随着样本容量的增加,样本均值的标准差将减小,将有助于计算置信区间。n卡方分布(选择自由度=4)n指数分布(任选均值)1)对各种样本容量,分别预测均值的标准误。2)同时生成直方图和描述统计来验证你的预测。3)样本容量增加时出现什么现象?练习非正态分布的中心极限定理练习非正态分布的中心极限定理从下面2个分布中选择一个分布,重做非正态分布的中心极限定理的练习,使n分别等于9,16,36。中心极限定理定义:第二
34、部分练习n分成小组掷色子n首先进行单个投掷,投掷100次,将结果记录到Minitab.n然后进行五个同时投掷,投掷100次,将平均值记录到Minitab.n最后进行十个同时投掷,投掷100次,将平均值记录到Minitab.n分别作出三次结果的直方图。n分别对三次结果进行正态检验。n展示小组结论。中心极限定理练习中心极限定理练习中心极限定理定义:第二部分练习Introduction To Hypothesis Testing假设检验简介假设检验简介 第二章第二章 假设检验假设检验突破性改善特性化优化定义测量改善分析控制确定原因是否真实。验证解决方案是否有效。确定重大改变发生的时间。假设检验简介:
35、概念及作用假设检验简介:概念及作用6Sigma线路图假设检验完成本章节后,学员能够对抽样对象总体的均值,方差,比例进行假设检验学习目标过程A过程B缺陷品之数量为什么进行假设检验?两个过程差异是否显著?Production Line12168173178183Within(mm)1线和2线生产的产品的平均宽度存在差异吗?它真的存在差异吗?假设检验简介:概念及作用假设检验简介:概念及作用n我们对抽样中的数据进行分析,区分很容易出现的结果和很难出现的结果。n如果很难出现的结果出现了,我们可以这样解释n出现了罕见的结果,或者事物并不是我们想象的那样统计推论指导 n假设有人声称报考音乐学院的女生会比男生
36、多;如果从1000个学生的抽样中得到下列结果,你会对以上声明的正确性得出什么样的结论?a)505个女生?b)980个女生?n505个女生 通常都是在1000个学生中有500个女学生。505 个女生跟500非常相近,我们不会支持报考音乐学院的女生比男生多的声明。n980个女生 一般不会发生1000个学生中有980个女生的情况。这种情况有两种解释:一是一般不会发生的异常事件发生了,或者是更让人信服的解释,报考音乐学院的女生的确比男生更多的声明是正确的。假设检验推论举例假设检验简介:概念及作用假设检验简介:概念及作用如果报考音乐学院的学生不存在性别上优先选择,那将与抽样结果是否有显著的不同呢?抽样结
37、果505 out of 1000 通常的情况 500 out of 1000 显著性区别n假设是对于一些未知事实的陈述或声明n统计假设是就对象总体特性(例如均值,方差和比例)的声明或陈述。n在许多问题中,都需要n传统的决策方式是基于具有高风险的主观意识,统计检验为我们提供了一个客观的解决方案。n假设检验为我们的决策将一个实际问题转换成一个统计问题。什么是假设检验?nA、建立零假设和备选假设。nB、决定显著性水平。nC、随机抽取具有代表性的样本nD、计算P值。nE、比较P值和显著性水平。nF、得出结论。假设检验基本步骤假设检验简介:概念及作用假设检验简介:概念及作用假设检验简介:零假设与被选假设
38、假设检验简介:零假设与被选假设零假设与被选假设零假设被选假设说明关于一个总体参数(如均值)的一个陈述必须包含等号如果零假设不正确,则该陈述必须成立;通常是我们要证明的假设举例H0:=40mm(过程均值同目标相等)H1:40mm(过程均值同目标不相等)实际进行假设检验时,假设包含两个互补的陈述,即:零假设(H0)、备选假设(H1),备选假设也叫研究假设。n例如:H0-氧化物平均厚度等于200 angstroms H1-氧化物的平均厚度不等于200 angstroms当检验总体均值时序号零假设备选假设1H0:=target valueH1:target value2H0:target valueH
39、1:target value3H0:target valueH1:B(材料A的寿命比材料B长)例一是双边检验,例二是单边检验,为什么?假设检验简介:零假设与被选假设假设检验简介:零假设与被选假设声明声明H0 and H1零假设和备选假设零假设和备选假设两个部门服务投诉率有所不同H0:pA =pB(两个部门的服务投诉率没有不同)H1:pA pB(两者有所不同)用配方A的润滑油的粘度比用配方B的更稳定A2 B2(A的方差大于或等于B的方差)A2 B2(A的方差小于B的方差)更多举例练习零假设与被选假设n根据提供的例子,陈述零假设和备选假设n练习1:缺陷比例某个产品有两条生产线,你想找出两条生产线的
40、缺陷率是否不同。写出比例的假设声明:P(A)代表生产线A的缺陷率;P(B)代表生产线B的缺陷率 H0:H1:n练习2:塑料强度你将测试塑料A的样本以确认它的压力强度是否大于30kg/cm2 H0:H1:假设检验简介:零假设与被选假设假设检验简介:零假设与被选假设n只要进行假设检验,在决策时就会有风险。两种错误(风险):I类错误(也叫风险):当零假设正确时,否定零假设的概率 I I类错误(也就风险):当归零检验错误时,肯定零假设的概率假设检验简介:风险评估假设检验简介:风险评估I类和II类错误 真实情况真实情况决策正确决策I I类错误I 类错误正确决策零假设真零假设伪不否定零假设否定零假设H0:
41、被告无罪H1:被告有罪以下情况是什么类型错误?v 当被告无罪的时候,陪审团得出有罪结论?v 当被告有罪的时候,陪审团得出无罪结论?n当零假设真时,否定零假设的错误vI类错误发生的概率叫做显著水平,由代表。v常见水平:=0.05;检出能力是否定错误的零假设的概率vPower=1-(Type II);检出能力是I类错误减去II类错误。I类错误发生概率Powern当零假设假时,接受零假设的错误Null HypothesisDecisionTrue FalseFail to Reject H0CorrectP=1-Type II error P=Reject H0Type I error P=Corr
42、ectP=1-置信度Power假设检验简介:风险评估假设检验简介:风险评估抽取数据是否有足够的证据确保否定零假设?作为假设检验的结果,我们或者 1、否定零假设 2、无法否定零假设决定假设检验简介:假设检验总结假设检验简介:假设检验总结假设检验的理解从假设检验中得到两个结论:1、如果P值比小就否定零假设;声明应该同下列陈述相似:“在水平没有足够的证据证明备选假设是正确的”。2、如果P值比大就无法否定零假设:声明应该同下列陈述相似:在水平没有足够的证据证明备选假设是正确的。解释P值H0:过程均值等于目标值H1:过程均值不等于目标值850851.6目标值样本均值?P-value=0.017被选假设成
43、立假如过程均值与目标值相同,只有1.7%的机会得到这种样本数据。选择何种检验决定于数据的分布类型和比较的类型应用假设检验类型比较均值1sample t Test;1sample z Test;2sample t TestANOVA检验比较方差F Test,Bartletts Test;Levenes Test比较比例或百分比1 proportion Test2 proportion Test假设检验类型假设检验简介:假设检验总结假设检验简介:假设检验总结几种常见的假设检验1、检验总体均值是否等于目标值2、检验两个总体均值是否相等。3、检验两个以上总体均值是否相等4、检验方差是否相等5、检验两个
44、总体比率是否相等6、检验关联性(多比例)Testing of Mean均值比较均值比较第二章第二章 假设检验假设检验 情况情况1检验整体均值和目标数值是否相等。第二章第二章 假设检验假设检验n对计量型数据进行假设检验时:抽样数量n 30时,就算是大 抽样数量n Basic Statistics1-sample Z E)比较p值和重要水平。P-value=0.797,=0.05;所以我们不能否定零假设。数据不能提供足够的证据否定平均强度等于2.85磅。举例分析均值比较:一个大样本均值检验均值比较:一个大样本均值检验收集数据并计算P值我们选择1-sample Z 检验,因为我们检验的是一个样本的均
45、值和一个特定值(2.85)是否相等,且它是个大样本(n 30)One-Sample Z:force Test of mu=2.85 vs not=2.85The assumed standard deviation=0.1Variable N Mean StDev SE Mean force 49 2.84633 0.10049 0.01429Variable 95%CI Z Pforce (2.81833,2.87433)-0.26 0.797P-value=0.797,=0.05;所以我们不能否定零假设。数据不能提供足够的证据否定平均强度等于2.85磅。Minitab输出结论n我们现在展示
46、进行假设检验的细节n我们在检验关于抽样对象均值的声明n由于n 30,根据中心极限定理,抽样均值的分布接近正态分布。由于1.96-0.2630),我们可以用S替代,我们使用抽样标准作为预测,那么:均值比较:一个大样本均值检验均值比较:一个大样本均值检验n在下列情况下,要运用单样本t检验检验抽样对象均值和目标数值是否相等,并且抽样数量少未知数据正态分布Example:Metal wafer 举例:金属薄片n问题:A.哪个更加合适?单边检验还是双边检验?B.为什么在这个例子中使用的是1 sample t test 1 sample t,而不是1-sample Z test?小样本分析均值比较:一个小
47、样本均值检验均值比较:一个小样本均值检验假设检验和重要水平n建立零假设和备选假设 H0:=3cm H1:3cmn决定显著水平,=0.05n随机选择样本数据从18个样本中:y=3.003 S=0.0031注意:因为t检验要求数据为正态,我们下一步是要进行正态检验n我们首先使用Anderson-Darling 检验评估正态分布nStatBasic StatisticNormality test正态性检验P值计算d)计算P值,使用Minitab:StatBasic Statistics1-Sample tOne-Sample T:Thickness Test of mu=3 vs not=3Vari
48、able N Mean StDev SE Mean Thickness 18 3.00294 0.00310 0.00073 Variable 95%CI T PThickness (3.00140,3.00448)4.04 0.001e)因为0.001 0.05,我们否定零假设。f)数据提供了足够的证据证明平均厚度不等于3厘米。均值比较:一个小样本均值检验均值比较:一个小样本均值检验n例子中包括随机样本中的10个测量:962 925 940 971 952 937 947 951 926 974,样本均值是否对目标值950具有代表性?n假设:H0:=950;H1:950。n如果pBasic
49、Statistic Normality test 2、T检验:StatBasic Statistic 1-sample tOne-Sample T:C1 Test of mu=950 vs not=950Variable N Mean StDev SE Mean C1 10 948.500 17.070 5.398Variable 95%CI T PC1 (936.289,960.711)-0.28 0.787由于P 值大于临界置信水平(本例中为0.05),或者说,由于均值的置信区间包含了目标值,我们可以做出下述结论:我们没有足够的证据拒绝零假设。n我们没有足够的证据拒绝零假设。n是否可以说零
50、假设是正确的(总体均值的真值=950)?不!n但是,我们通常在假定零假设是正确的情况下执行操作。结论均值比较:一个小样本均值检验均值比较:一个小样本均值检验情况情况2检验两个抽样对象的均值是否相等第二章第二章 假设检验假设检验双对象总体均值::大样本n双样本Z检验用于检验两个抽样对象总体均值,并且每个抽样数量都较大。nMinitab软件不提供双样本Z检验。所以,我们必须使用双样本T检验。n标准双样本Z检验或T检验用于互相独立的两个样本。n当样本是相互依赖的时候我们要使用成对T检验。独立样本:例如,两个公司的交货期依赖样本:热处理前后同一产品的硬度均值比较:双样本检验均值比较:双样本检验两个独力
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。