1、六西格玛统计工具介绍(二)六西格玛统计工具介绍(二)20142014年年2 2月月2精益六西格玛理论体系全景图客户客户流程描述流程描述控制计划控制计划测量系统测量系统控制控制过程能力过程能力分析分析多变量多变量分析分析实验设计实验设计VoC分析分析失效模式分析失效模式分析流程图流程图(I/O)因果矩阵因果矩阵统计过程统计过程控制控制定性分析定性分析 定量分析定量分析头脑风暴头脑风暴+KJ失效树失效树鱼骨图鱼骨图Why-Why分析分析PFMEA对标分析对标分析访谈访谈现场调研现场调研流程观察流程观察回归分析回归分析软件使用软件使用项目管理项目管理精益六西格玛意识精益六西格玛意识统计基础统计基础精
2、益工具精益工具基本图表基本图表精益六西格玛持续改进体系精益六西格玛持续改进体系精益六西格玛推行综合管理精益六西格玛推行综合管理3课程大纲n假设检验概述假设检验概述n相关与回归相关与回归4统计基础-数据类型n计数型数据(离散型数据,属性型数据):通常表示事物的分类计数型数据(离散型数据,属性型数据):通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器 A, 机器 B, 机器 C白班/中班/夜班n计量型数据计量型数据 (连续型数据):通常是通过测量仪器测量得到的数(连续型数据):通常是通过测量仪器测量得到的数据据压力时间长度重量5目录n假设检验相关基础概念假设检验相关基础概念总体参数及样本
3、统计量推定置信区间n假设检验介绍假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T 与配对T的区别 n讨论及问答讨论及问答6假设检验相关基础概念n总体参数与样本统计量总体参数与样本统计量s= 样本标准差X= 样本平均值 参数 估计 统计量 = 总体平均值= 总体标准差抽样(Sampling)AABDDDCCCCBAAAAAAABBBBBBCCCCCCDDDDDDD7估计的概念n点估计:通过抽样用一个具体的值估计总体的参数点估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋月饼的保质期是3个月点估计的种类:平均的估计、标准差、方差的估计、比率的估
4、计等n区间估计:通过抽样用一个具体的值估计总体的参数区间估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋的月饼的保质期是1-6个月8置信区间n置信区间的概念(置信区间的概念(Confidence Interval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1- )%n置信水平(置信水平(Confidence Level)是指区间估计时,能够包含总体参数的能力水平,即1- 。05. 0z05. 0z%90%5%5%1525. 0z25. 0z%50%25%25=0.5(50%)=0.1(10%)信赖水准信赖区间误 差9置信区间n90%的置
5、信区间举例如下图的置信区间举例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均n95%置信区间的解释:置信区间的解释:大约100个置信区间中有95个会包含总体参数, 或者我们有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间 总体的平均样本 1样本 2 样本 1010置信区间n置信区间的计算置信区间的计算通用公式:置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式( 知道的时候):样本的置信区间公式(不知道,只能计算S):样本的平均遵循t分布nZX2/nStXn 1, 2/11置信区间nMinit
6、ab中置信区间的计算中置信区间的计算这些都可以计算出置信区间12假设检验n假设检验的目的假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。是为了解决选择的困难性n假设检验的意义假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部门最需要的工具之一。13假设检验n假设检验的概念假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法n假设检验术语假设检验术语假设设定:对要进行判断的情况进行假设设定H0 -Null Hypothesis:说明没有变化或者差异的设定Ha- Alternative
7、 Hypothesis:说明有变化或者差异的设定n假设设定练习:假设设定练习:为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性14假设检验n假设检验的种类假设检验的种类单边检验 One-sided hypothesisOne-sided hypothesis双边检验 TwoTwo-sided hypothesis-sided hypothesis15n假设检验的两种错误假设检验的两种错误第1种 错误 (TypeError, -风险)不顾Null Hypothesis 真实. Null Hypothesis放弃的错误 把良品判断为不良的时候(误判)
8、既, 可以说生产者危险1- 就是置信区间 第2种 错误 ( TypeError, -风险) : 不顾Null Hypothesis 假的. Null Hypothesis接受的错误 不良品当成良品的时候( 漏失 ) 即, 可以说顾客危险1- 是检定力,即检出能力16n假设检验的两种错误说明假设检验的两种错误说明你的判定你的判定接受接受 H Ho o真真实实情情况况H Ho o 对对H Ho o 错错I I类错误类错误 (-风险风险)IIII类错误类错误 (-风险风险)正确正确正确正确拒绝拒绝 H Ho o17n假设检验的两种错误举例假设检验的两种错误举例陪审团的判决陪审团的判决他无罪他无罪事实
9、事实实际清白实际清白他有罪他有罪实际有罪实际有罪正确正确正确正确I I类错误类错误 (-风险)风险)后果: II II 类错误类错误 (-风险)风险)后果: :18假设检验n假设检验原理假设检验原理假设检验其实是个比较的过程两种假设的比较,是A还是B?我们总是用H0 来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0 放弃H0 的决策不会总是正确的 ,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大?于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value)19假设检验n假设
10、检验原理假设检验原理(续续)知道了做出放弃H0 的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0 的决策呢?于是我们需要提前设定一个风险判断标准 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01 、0.05、0.1 等但我们通常设定 为0.05这也就是我们通常拿P值和0.05 进行大小比较的原因。如果P0.05 接受H0; P0.05 放弃H0 (P Low H0 Go) 理解练习为什么正态检验,等方差检验P要大于0.05?20假设检验n假设检验原理假设检验原理(续续) (Significance Level)置信水平:风险判断标准P-value 做出放弃H0 的决
11、策犯错误的最大风险值p 值Ho 选择域选择域Ho弃却域弃却域 Ho选择域选择域Ho弃却域弃却域 p值P值值 接受接受H0不能做决策不能做决策 ,不能说有差异,不能说有差异TPT TPT 21假设检验n假设检验步骤假设检验步骤假设假设 设定设定检定统计量选择检定统计量选择留意水准留意水准 决定决定p-value 计算计算(弃却域弃却域 , 检定统计量检定统计量 计算计算)判定(统计结论)判定(统计结论)p-value 0.05 时 Ho 接受P-值 0.05 时 Ho 放弃正态数据标准偏差的置信区间一个总体两个以上的总体2 Sample t(方差相等)2 Sample t(方差不相等) 1 Sa
12、mple t 或者1 Sample ZHo: 1 = (平均值)H1: 1 (平均值)Stat - Basic Stats - 1 Sample-t (不知道时候) 1Sample Z (知道时候)1 Sample-Sign 或者 1 Sample-WilcoxonMann-Whitney Test两个以上的总体两个母集团1-Proportion2-Proportion一个总体两个总体两个以上的总体非正态数据等 方差YesNoKruskal-Wallis Test一个总体一个总体两个以上的总体Ho: M1 = M2H1: M1 M2Stat - Nonparametric - Mann-Whi
13、tneyHo: M1 = M2 = M3 = .H1: 至少一个是不一样Stat - Nonparametric - Kruskal-WallisHo: 1 = 2H1: 1 2Stat - Basic Stats - 2-Sample t “assume equal variances”“假定等方差选择按钮” 不选择 Test for Equal Variances(Levenes Test) Test for Equal Variances(F Test or Bartletts Test)Ho: 1 = 2 = 3 = .H1: 至少有一个不一样Stat - Anova - Test f
14、or Equal Variances两个总体比较的时候 用F-testHo: 1 = (标准差)H1: 1 (标准差)标准差的置信区间使用Minitab 路径 Stat -Basic Statistics - Display Descriptive Stats计量型数据数据稳定性研究(控制图)配对T(Paired T)Ho: D =0 (差值)H1: D 0 (差值)要对差值进行正态性检验Minitab 路径 Stat -Basic Statistics Paired t test (配对T)假设检验-常用路径图23假设检验 - 单样本T检验24“单样本t检验”解决什么问题?典型的问题为典型的
15、问题为: “我们抽取了新坐席员我们抽取了新坐席员Bob的的30通电话录音数据,想知道坐席员通电话录音数据,想知道坐席员A的的话后整理时长的平均值是否刚好等于考核要求的话后整理时长的平均值是否刚好等于考核要求的25秒?秒?”当然问题也可以是当然问题也可以是“Bob的平均整理时长大于的平均整理时长大于25秒吗?秒吗?”或者或者“Bob的平均整理时长刚好小于的平均整理时长刚好小于25秒吗?秒吗?”251. 建立零假设和备选假设:平均整理时间等于目标值平均整理时间不等于目标值2. 决定显著性水平: = 0.05(5%)3. 随机抽取30通电话的整理时间数据作为样本4. 选取适合方法计算P值(参考下页详
16、细步骤)5. 依据P值结果做出结论秒25:0=H秒25:1H按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设 H0n如果P值小于a,推翻零假设 H026选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n25不是正态分布是正态分布单样本T检验单样本T检验单样本T检验先把数据转换为正态后再使用单样本T检验检验数据正态性数据不稳定应先解决稳定性问题NOYES算出P值样本数据n个27分析路线图 单样本T28步骤1: 检验稳定性29步骤1: 检验稳定性是否有任何明显的变化趋势或模式,足以证明数据并非来自单一的总体/流程?212223242526272829Bob36912
17、15182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob 的 单个测量Bob 的 单个测量01234“Bob”的移动控制范围3691215182124273033样本平均数=1.20控制下限=0.00控制上限=3.91Bob 的 移动控制范围Bob 的 移动控制范围控制图控制图30步骤2: 检验正态性31步骤2: 检验正态性32步骤 3: 检验均值假设值实际估计值df标准差2524.8482290.86932检验统计量p 值 |t|p 值 tp 值 0.05),或者说,),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论:由于均值的置信区间包
18、含了目标值,我们可以作出下述结论:n我们没有足够的证据拒绝零假设。我们没有足够的证据拒绝零假设。n是否可以说零假设是正确的(是否可以说零假设是正确的(Bob的均值的均值=25秒)?秒)? 不!不!n但是,我们通常在假定零假设是正确的情况下执行操作。但是,我们通常在假定零假设是正确的情况下执行操作。34延伸如果问题是如果问题是: “Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”如何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?35假设检验 - 双样本t检验36“双样本t检验”解决什么问题?典型的问题为典型的问题为: “我们各抽取了坐席员我们各抽取了
19、坐席员Bob和和Jane的的30通电话样本,想知道坐席员通电话样本,想知道坐席员A和和B的平均话后整理时长是否的平均话后整理时长是否相等相等?”当然问题也可以是当然问题也可以是“Bob的平均整理时长的平均整理时长大于大于Jane的平均整理时的平均整理时长吗?长吗?”或者或者“Bob的平均整理时长的平均整理时长小于小于Jane的平均整理时长的平均整理时长吗?吗?”371. 建立零假设和备选假设: Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值2. 决定显著性水平: = 0.05(5%)3. 随机抽取Bob和Jane各30通电话的整理时间数据作为样本4. 选取适合方法计算
20、P值(参考下页详细步骤)5. 依据P值结果做出结论按照以下步骤完成n如果P值大于或等于0.05,不能推翻零假设 H0n如果P值小于a,推翻零假设 H0JaneBob:1HJaneBob:0H=38选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n2539样本量n在获取数据并试图得出一些陈述之前在获取数据并试图得出一些陈述之前, 我们需要确定进行这种检验我们需要确定进行这种检验数要多少数据数要多少数据.n记住记住, 我们有一些基于估计值的抽样我们有一些基于估计值的抽样“经验方法经验方法 Rules of Thumbn并不要求并不要求Bob和和Jane的两组样本量一定是相同的的
21、两组样本量一定是相同的n注意注意: 我们将在以后的模块中讲解样本量的计算我们将在以后的模块中讲解样本量的计算40工具或统计工具或统计 最小样本量最小样本量 平均值5 - 10 标准偏差 25 - 30 有缺陷的比例 (P) 100 并且 nP = 5 直方图 或帕累托图 50 散点图 25 控制图 20不同工具的样本量通常41步骤1: 检验稳定性42步骤1: 检验稳定性212223242526272829Bob3691215182124273033样本平均数=24.85控制下限=21.67控制上限=28.03Bob 的 单个测量Bob 的 单个测量01234“Bob”的移动控制范围369121
22、5182124273033样本平均数=1.20控制下限=0.00控制上限=3.91Bob 的 移动控制范围Bob 的 移动控制范围2223242526272829Jane3691215182124273033样本平均数=25.45控制下限=22.89控制上限=28.00Jane 的 单个测量Jane 的 单个测量-0.50.00.51.01.52.02.53.03.5“Jane”的移动控制范围3691215182124273033样本平均数=0.962控制下限=0.000控制上限=3.143Jane 的 移动控制范围Jane 的 移动控制范围43步骤2: 检验正态性44步骤2: 检验正态性45
23、步骤2: 检验正态性位置离差类类 型型参参 数数25.4460730.9880899估估 计计25.0771140.78692179 95 5% % 下下 限限25.8150321.32830439 95 5% % 上上 限限参参 数数 估估 计计 Shapiro-Wilk W 检验0.974329W W 0.6630p p 值值 W W注:Ho = 数据来自 正态 分布。小 p 值拒绝 Ho。拟拟 合合 优优 度度 检检 验验正正 态态 拟拟 合合位置离差类类 型型参参 数数24.8482070.8693181估估 计计24.5235980.69233099 95 5% % 下下 限限25.
24、1728151.16863759 95 5% % 上上 限限参参 数数 估估 计计 Shapiro-Wilk W 检验0.932453W W 0.0571p p 值值 Fp 值 F2.4882t 检验t 检验等方差检验等方差检验50步骤4:均值检验 51步骤4:均值检验 232425262728整理时长BobJane坐席员R 平方调整 R 平方均方根误差响应均值观测值 (或权重和)0.0964490.0808710.93060125.1471460拟合汇总拟合汇总Jane-Bob假定方差相等差分差的标准误差差的置信上限差的置信下限置信0.597870.240281.078840.116890.
25、95t 比率DFp 值 |t|p 值 tp 值 t2.488207580.0157*0.0079*0.9921-0.8-0.40.00.40.8t 检验t 检验52结论的陈述n由于由于P值小于临界置信水平(本例中值小于临界置信水平(本例中P=0.01570.05,我们可以作,我们可以作出下述结论:出下述结论:n我们有足够的证据拒绝零假设我们有足够的证据拒绝零假设53假设检验 多样本比较54n假设检验用于比较假设检验用于比较数据样本的数据样本的nANOVA检验陈述的原假设(检验陈述的原假设(null hypothesis)是所有样本的均是所有样本的均值都相同值都相同Ho: a = b = c =
26、 d = e nANOVA检验陈述的备择假设(检验陈述的备择假设(alternate hypothesis) 是至少有是至少有一个均值是不同的一个均值是不同的Ha: 至少一对至少一对 是不同的是不同的方差分析 ANOVA55“方差分析(ANOVA)”解决什么问题?典型的问题为典型的问题为: “我们各抽取了坐席员我们各抽取了坐席员Bob,Jane和和Walt的各的各30通电话样本,想知通电话样本,想知道坐席员的平均话后整理时长是否道坐席员的平均话后整理时长是否相等相等?”561. 建立零假设和备选假设: Ho: Bob = Jane = san 三个坐席员的平均值彼此相等 Ha: 至少一对 是不
27、同的 至少一个坐席员得平均值和其他人不同2. 决定显著性水平: = 0.05(5%)3. 随机抽取Bob和Jane各30通电话的整理时间数据作为样本4. 选取适合方法计算P值(参考下页详细步骤)5. 依据P值结果做出结论按照以下步骤完成57选取适合方法计算P值详细过程使用控制图检验样本数据稳定性样本量不足,n2558步骤1 & 2 不再重复n步骤步骤1:稳定性检验:稳定性检验分别使用控制图检验三名坐席员样本数据的稳定性n步骤步骤2:正态性检验:正态性检验分别使用分布图检验三名坐席员样本数据的正态性59堆叠数据 60步骤3: 等方差检验610.00.20.40.60.81.0标准差BobJane
28、Walt座席员BobJaneWalt水平水平303030计数计数0.86931810.98808990.9806127标准差标准差0.72742580.78016180.8059338均值的绝对差的平均均值的绝对差的平均0.70814670.77818000.8023567中位数的绝对差的平均中位数的绝对差的平均OBrien.5Brown-ForsytheLeveneBartlett检验检验0.34790.22920.17060.2863F 比率F 比率2222分子自由度分子自由度878787.分母自由度分母自由度0.70710.79570.84340.7510p 值 Fp 值 FWelch
29、方差分析检验均值是否相等。该法允许标准差呈不等44.7405F 比率F 比率2分子自由度分子自由度57.786分母自由度分母自由度 Fp 值 F等方差检验等方差检验步骤3: 等方差检验P-值!62步骤4:均值检验 6323242526272829处理时长BobJaneWalt座席员R 平方调整 R 平方均方根误差响应均值观测值 (或权重和)0.5071620.4958320.94756525.7927490拟合汇总拟合汇总座席员误差C. 合计来源来源28789DFDF80.3858178.11547158.50128平方和平方和40.19290.8979均方均方44.7643F 比率F 比率
30、Fp 值 F方差分析方差分析BobJaneWalt水平水平303030数值数值24.848225.446127.0839均值均值0.173000.173000.17300标准误差标准误差24.50425.10226.74095% 下限95% 下限25.19225.79027.42895% 上限95% 上限标准误差使用合并的误差方差估计值单因子方差分析均值单因子方差分析均值单因子方差分析单因子方差分析处理时长 关于 座席员 的单因子分析处理时长 关于 座席员 的单因子分析步骤4:均值检验 64步骤4:均值检验 23242526272829处理时长BobJaneJaneWalt座席员每对比较t 统
31、计量0.0565ANOVA: 我们了解到什么?n有一个操作员与其它操作员之间存在差异有一个操作员与其它操作员之间存在差异n同样我们可以从菱形图看到同样我们可以从菱形图看到, Walt 用的时间比其它两位操作员用用的时间比其它两位操作员用的长一些的长一些n现在我们需要问现在我们需要问 “为什么为什么?”n致使长于整体周期的根源是致使长于整体周期的根源是CWalt么么?n你将如何找到答案你将如何找到答案?66假设检验 - 非正态(非参数检验)67Mann-Whitney 检验n查看工作表查看工作表 2- Non-Normal Shipping 中的数据中的数据n我们希望了解在周末和工作天期间发货的
32、时间是否有差异我们希望了解在周末和工作天期间发货的时间是否有差异 遵循分析路径图研究稳定性研究形状研究散布(离散程度)68研究稳定性-3-2-101234567周末发货48 122028364452样本平均数=1.72控制下限=-2.09控制上限=5.54周末发货 的 单个测量周末发货 的 单个测量-10123456“周末发货”的移动控制范围48 122028364452样本平均数=1.43控制下限=0.00控制上限=4.68周末发货 的 移动控制范围周末发货 的 移动控制范围-2-101234工作天发货48 122028364452样本平均数=1.27控制下限=-1.20控制上限=3.73工
33、作天发货 的 单个测量工作天发货 的 单个测量-0.50.00.51.01.52.02.53.03.5“工作天发货”的移动控制范围48 122028364452样本平均数=0.928控制下限=0.000控制上限=3.030工作天发货 的 移动控制范围工作天发货 的 移动控制范围69研究正态性0123456.01.05.10.25.50.75.90.95.99-3-2-10123正态分位数图00.511.522.533.5.01.05.10.25.50.75.90.95.99-3-2-10123正态分位数图 Shapiro-Wilk W 检验0.905821W W 0.0008 *p p 值值
34、W W注:Ho = 数据来自 正态 分布。小 p 值拒绝 Ho。拟拟 合合 优优 度度 检检 验验 Shapiro-Wilk W 检验0.921539W W 0.0027 *p p 值值 Fp 值 F1.9618t 检验t 检验等方差检验等方差检验研究等方差性71p-值值! P值不低值不低, 所以我们说所以我们说, 没没有差异有差异. 工作天发货周末发货水水 平平5050计计 数数2317.002733.00得得 分分 和和46.340054.6600得得 分分 均均 值值-1.4301.430( (均均 值值 - -均均 值值 0 0) )/ /标标 准准 0 02733S S1.43047
35、Z Z0.1526P P 值值 | |Z Z| |二二 样样 本本 检检 验验 , , 成成 近近 似似 正正 态态 分分 布布2.0561卡卡 方方1D DF F0.1516p p 值值 卡卡 方方 检检 验验单单 因因 子子 检检 验验 , , 卡卡 方方 近近 似似W Wi il lc co ox xo on n / / K Kr ru us sk ka al l- -W Wa al ll li is s 检检 验验 ( 秩秩 和和 )Wilcoxon/Kruskal Wallis检验72工作天发货周末发货水平水平5050计数计数23.00027.000得分和得分和0.4600000.5
36、40000得分均值得分均值-0.7960.796(均值-(均值-均值0)/标准0均值0)/标准027S S0.79599Z Z0.4260P 值|Z|P 值|Z|二样本检验, 成近似正态分布二样本检验, 成近似正态分布0.6336卡方卡方1DFDF0.4260p 值 卡方检验p 值 卡方检验单因子检验, 卡方近似单因子检验, 卡方近似中位数检验(大于中位数的个数)中位数检验(大于中位数的个数)p-值! P值不低, 所以我们说, 没有差异. 中位数检验73总结n全面的数据分析包括查看稳定性,形状,散布(离散程度),居中全面的数据分析包括查看稳定性,形状,散布(离散程度),居中(中心趋势)和相关性
37、(中心趋势)和相关性nT-检验检验 (单样本单样本, 双样本双样本) 检查居中检查居中, ANOVA (2个或个或2个以上样本个以上样本) 检查检查居中居中n等方差检验检查离散程度等方差检验检查离散程度n检验关系是下一步如要检查的检验关系是下一步如要检查的卡方检验74比例数据检验75单比例检验例:缺陷品率 3 单比例检验.jmp以前,合同审批发现的不合格率为12%对过程进行了变更。从新过程抽样300个产品,其中45个存在缺陷是不合格品请问:过程是否得到了改善76单比例检验步骤1.) 建立备选假设和零假设12. 0:0NewPH新过程产生12%或更多的的缺陷率12. 0:1NewPH新过程的缺陷
38、率少于12%77单比例检验步骤2.) 决定显著性水平 = 0.053.) 随机抽取数据抽样数量为300发现有45个产品为缺陷品。78b.) 决定显著性水平:a = 0.05c.) 随机抽取数据:抽样数量为300,发现有45个为缺陷品。d.) 计算P值:分析分析 分布分布 检验概率检验概率单比例检验步骤79e.) 比较P值和显著性水平:P-value =0.9507 a = 0.05 0.951 0.05f.) 结论:所以我们不能否定零假设,流程没有得到改善!单比例检验步骤80卡方分析81检验相互关系:卡方检验n当当y y和和 x x都是属性数据,要检验相互关系时使用都是属性数据,要检验相互关系
39、时使用n我们假设变量是独立的。我们假设变量是独立的。Ho: 数据是独立的 (不相关)Ha: 数据不独立 (相关)n如果如果p p值值 0.05, c所以,我们否定零假设。因为比较计算的卡方和临界值这种查表的方法并不方便,更常使用的方法利用软件直接计算 卡方值对应的P值(概率值)89nJMP 软件计算P值n用JMP建立列联表和P数值n分析 以X拟合YP值90因为P值=0.000,小于 = 0.05,我们将否定零假设,既学院招生与性别之间并不是独立的,观察马赛克图可以看到教育学院女生比例较高结论JMP输出学院工程教育商务51228.1351.4170.4321511.8126.0929.57127
40、6.9812.7524.6138921.3747.2175.3935719.6235.8461.8722012.0926.7038.1372739.9551628.3557731.7099654.7382445.271820性别计数合计百分比列百分比行百分比男女列列联联表表1820数数 目目2D DF F140.47587- - 对对 数数 似似 然然0.1121R R 平平 方方 ( (U U) )似然比Pearson检检 验验280.952273.076卡卡 方方.0001* 卡卡 方方 检检 验验检检验验性别0.000.250.500.751.00工程教育商务学院男女马赛克图马赛克图91
41、JMP输出进一步扩展使用“对应分析”可以看到,图中相距比较近说明而这之间具有紧密关系,例如教育学院和女生而这相距很近,而工程学院和男生距离很近。说明教育女生比例高,工程男生比例高92卡方检验注释n卡方检验是我们本周将学到的卡方检验是我们本周将学到的“较易分析较易分析”工具的一种,但它并工具的一种,但它并不如其他假设检验那样不如其他假设检验那样“富有洞察力富有洞察力”属性数据的结果n对于卡方检验,为了满足假设,期望频率必须至少为对于卡方检验,为了满足假设,期望频率必须至少为5如果该值小于5 , 将告警n数据必须确保随机性数据必须确保随机性注意其他隐藏的因子 (Xs)93范例: 贷款审批通过率JM
42、P 工作表结构我们的信用审批部处理小宗商业贷款申请。许多申请得到批准,但有一些被拒绝。部门经理猜想拒绝率可能与该申请是哪天被处理的有关。她的猜想正确吗?打开文件打开文件 5- Loan Approval.JMP 94范例: 贷款审批通过率日期周二周三周四周五周一89.66667-1.66670.28742119.33331.666670.14371112-10.0833252410.0417710.3333-3.33331.07532420.66673.333330.5376251695.06252332-92.5313912-30.7500272430.3750293631483660120
43、180审批结果计数预期值偏差单元格 Chi2拒绝通过列列 联联 表表审批结果0.000.250.500.751.00周二周三周四周五周一日期拒绝通过马赛克图马赛克图180数数 目目4D DF F5.3011451- - 对对 数数 似似 然然0.0463R R 平平 方方 ( (U U) )似然比Pearson检检 验验10.60210.888卡卡 方方0.0314 *0.0279 *p p 值值 卡卡 方方 检检 验验检检 验验P值值 卡方检验p 值 卡方检验左侧右侧双侧Fisher 精确检验Fisher 精确检验0.0014*0.99960.0022*概率概率Prob(审批结果 2=通过)
44、 在 日期 2=其它天 的情况下比在 周五 的情况下大Prob(审批结果 2=通过) 在 日期 2=周五 的情况下比在 其它天 的情况下大各 日期 2 的 Prob(审批结果 2=通过) 不同对立假设对立假设检验检验P值值 卡卡 方方 检检 验验检检 验验较高的P值表示剩下的几天没有明显的相互关系。星期五才是我们要找的!100还有哪些情况我能使用卡方检验?n行政流程充满属性数据例如:行政流程充满属性数据例如:职能:职能: (Y) 和和 (X)人力资源: 病假天数和员工或部门财会: 错误的费用报告数和员工或部门销售: 失去的销售额和帐户或区域或国家后勤: 迟到的交货次数和配送中心或国家呼叫中心:
45、 错过的客户电话数和公司人员或班次安装: 反复服务电话数和区域技术(field tech)采购: 订单的交货天数和供应商库存: 零件数和配送中心 101实际意义n明确问题明确问题“我关心吗?我关心吗?”nP值可能显示统计上的意义值可能显示统计上的意义样本容量越大,p值越小对非常大的样本容量而言,即使很小的差异或相互关系通常都比较显著在实际上这些细小的差异可能并不显著n通过关注组间差异评估实际的显著性通过关注组间差异评估实际的显著性n差异是否大到有所影响?差异是否大到有所影响?如果是,那么在实际中这些差异就是显著的。的因子可以用于操作流程的因子可以用于操作流程102相关性分析与简单线性回归103
46、相关性n从这张图我们可以看出什么?从这张图我们可以看出什么?n这些变量是否相关?这些变量是否相关?15014013012011010090807060260250240230AdvertismentsSales104相关性:它对我们意味着什么?当我们提到相关性时,我们怎么想?当我们提到相关性时,我们怎么想?n广告投入是否与销售量有关?广告投入是否与销售量有关?n资本的利用与定价是否有关?资本的利用与定价是否有关?n你认为奥运会溜冰项目两个裁判员之间有多大的相关性?你认为奥运会溜冰项目两个裁判员之间有多大的相关性?n为什么当我携带雨伞时,天色看起来都不会下雨呢?为什么当我携带雨伞时,天色看起来都
47、不会下雨呢?105相关性与回归分析n当当y和和x都是连续数据都是连续数据,检验相互关系时使用检验相互关系时使用n假设变量不相关假设变量不相关。 Ho: 数据独立 (不相关)Ha: 数据不独立 (相关)n如果如果p值值 0.05, 拒绝拒绝 Ho106X X 数据数据单一 X多元 Xs Y Y 数据数据单一 Y 多元 Ys 多变量分析(注:此表和多变量图表不同)X X数据数据离散 连续 Y Y 数据数据离散 连续 卡方检验卡方检验逻辑逻辑 回归回归ANOVAANOVA均值均值/ /中位数检验中位数检验回归分析回归分析X X 数据数据离散 连续 Y Y 数据数据离散 连续多元回归多元回归逻辑逻辑
48、回归回归多元多元 中位数检验中位数检验2, 3, 4 way.2, 3, 4 way.ANOVAANOVA逻辑逻辑 回归回归多重多重 何时使用相关性和回归分析107相关定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。法。也代表两个变量间的线性关联程度。由一个相关系数也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个)来衡量两个变量间的联系强度,在这里变量间的联系强度,在这里-1 R 1 。按照惯例,按照惯例, R 表示表示 真实的真实的 系数,系数, R 表示我们的最佳估算。表示我们的最佳估算。 108nR
49、值取值范围从-1.0到 +1.0,即 -1 R 1 ,R值越接近+1或-1说明线性相关性越强nR 0 意味着一个正线性相关,即是 Y 随着 X 的增加而增加。nR=-1意味着一个完全负线性关系nR=1 意味着一个完全正线性关系nR=0 意味着无线性关系。相关系数:R10912011010090807060504011010090807060504030InputOutputR-Squared = 0.876Y = 9.77271 + 0.745022XStrong Positive Correlation90807060504085756555InputOutputR-Squared = 0.
50、115Y = 56.6537 + 0.181987XWeak Positive Correlation8070605040302010011010090807060504030InputOutputR-Squared = 0.876Y = 99.1754 - 0.745022XStrong Negative Correlation50403020100110100908070605040InputOutputR-Squared = 0.359Y = 90.3013 - 0.645418XModerate Negative Correlation60504030201085756555Input