1、直方现分布I直方图分析方法优选直方现分布I直方图分析方法二、直方图的制作二、直方图的制作1.收集数据并记录 例10.2-1:2.找出数据中的最大值、最小值 最大值xmax=63,最小值xmin=38,3 求极差(R)则极差R=xmaxxmin=6338=25,区间S,L=xmin,xmax称为散布范围。4.确定分组数(k)参照上表,取k=9总数分组数k5050100100250250以上5761071210-20也可按史特吉斯公式:k=1+3.32lg n 计算 本例 n100,同样取 k95.求组距(h)组距h,即组与组之间的间隔,等于极差R除以组数 kxxhminmax本例中,378.29
2、2593863h 6.确定各组界限 为确定边界,通常从最小值开始。把最小值放在第一组的中间位置上,则本例中,最小值xmin=38,组距h=3,故组界为)2()2(minminhxhx7.计算各组的组中心值wi 中心值wi是每组中间的数值,其计算公式为 某组的中心值(wi)=(某组的上限+某组的下限)/2 组号组界组中值w频数f累计频数相对累计频率%136.539.538222239.542.541244342.545.544162020445.548.547183838548.551.550236161651.554.553177878754.557.556159393857.560.5593
3、9696960.563.56241001008统计各组频数,作频数分布表 将所有原始数据,按其数值大小归入相应的组中,并统计各组的数据个数,即频数fi。各组频数填好后检查一下其总数是否与数据个数相符,避免重复或遗漏。9画直方图将频数分布表图表化,以横轴表示数值的变化,纵轴表示频数;横轴与纵轴各取适当的单位长度。再将各组的组界分别标在横轴上,各组界应为等距分布;以各组内的次数为高,组距为宽;在每一组上画成矩形,则完成直方图;在图的右上角记入相关数据履历(数据总数n,平均值x,标准差),并划出规范的上、下限;填入必要事项产品名称、工序名称、时间、制作日期、制作者等。记载所依据的相关内容。因果图由质
4、量问题(特性、结果)和影响因素(原因)两部分组成。2、相关系数的几何意义如:两台机器,两家不同供应商,两种工艺等生产的产品混在一起时。横轴上按频数从大到小列出各项名称,其他项记在最右边。13:30 15:30组数的宽度不是倍数时。按原材料的供应商、批次、材质、产地、大小、成分、储存时间等进行分类。配合其他手法活用,更能得到效果,如:检查表、排列图等。3以x,y的最大值及最小值建立xy坐标系,并决定适当刻度,便于绘点。当 越大时,表明x,y为线性相关越显著。正常型:中间高,两边低,左右 近似对称 工序处于稳定状态(e)不相关 (f)非线性相关4 排列图(pareto diagram)为什么过程波
5、动这么大?组距h=27/7=3.138 142 148 145 140 141 139 140 141 138138 139 144 138 139 136 137 137 131 127138 137 137 133 140 130 136 128 138 132145 141 135 131 136 131 134 136 137 133134 132 135 134 132 134 121 129 137 132130 135 135 134 136 131 131 139 136 135例8.2-2:某厂成品尺寸规范为130至160mm,今按随机抽样方式抽取60个样本,其测定值如表,试
6、制作直方图。解:R=148-121=27 k=1+3.32log n1+3.32 log 60=1+3.32(1.78)=6.9即约可分为6组或7组,本例取7组。组距h=27/7=3.86mm,取组距h4mm 第一组下界限可取为xmin(h/2)1212119;下界限也可取xmin测量单位/2,本例测量单位为mm,故可取下限为xmin0.5120.5,而上限则为124.5mm。第二组的上界限值就是第二组的下界限值,第二组的下界限值加上组距就是第二组的上界限值,也就是第三组的下界限值,依此类推,可定出各组的组界。求组中点,作频数分布表画直方图 三、直方图的观察和分析三、直方图的观察和分析 1.判
7、断分布类型正常型与异常型常见的六种异常型频数直方图:锯齿型 陡壁型孤岛型高原型双峰型偏态型 异常型:工序中有异常原因正常型:中间高,两边低,左右 近似对称 工序处于稳定状态1)孤岛型出现这种情况是夹杂了其他分布的少量数据。如原料发生变化;设备短时间故障;中间有不熟练的人员参与加工;测量有错误;工序调节错误等所引起。出现这种分布,表明一定有异常原因存在,只要去除,就可满足过程要求,生产出符合规范的产品。因测量值不同的原因影响,应先分层后再作直方图。正常型:中间高,两边低,左右 近似对称 工序处于稳定状态2找出x,y的最大值及最小值。80%,90%,100%13:30 15:30如何防止不合格品的
8、产生?将所搜集的数据,按不良原因、不良状况、不良项目、不良发生的位置等不同区分标准而加以整理、分类,从中寻求占最大比率的原因、状况或位置,按其大小顺序排列后所作出的累积值柱形图。设计收集数据所使用的表单,确定分层的标志;也可按史特吉斯公式:k=1+3.测量方法有问题或读错数据;2、相关系数的几何意义当 越大时,表明x,y为线性相关越显著。出现这种情况是夹杂了其他分布的少量数据。为确定边界,通常从最小值开始。出现这种分布,表明一定有异常原因存在,只要去除,就可满足过程要求,生产出符合规范的产品。否则,应追查原因与结果是否受到其他因素干扰。下界限也可取xmin测量单位/2,本例测量单位为mm,故可
9、取下限为xmin0.61某材料的得率与反应温度有密切关系,今测量五对数据,试进行分析。步骤3:画出横轴和纵轴。2)双峰型如:两台机器,两家不同供应商,两种工艺等生产的产品混在一起时。因测量值不同的原因影响,应先分层后再作直方图。观察值来自两个总体,即当两种不同分布(且其平均值相差较大)混在一起时,常出现这种形状。数据分组太多;量仪误差太大;测量方法有问题或读错数据;假造数据;测量仪器误差过大;设备/工装异常;组数的宽度不是倍数时。3)矩齿型4)陡壁型经全数检查后,剔除不合格品后的数据作图。5)偏态型当下限(或上限)受到规范等因素限制时;工具磨损或松动时。当尾巴拖长时,应检查是否在技术上能够接受
10、。上限偏右下限偏左6)平顶型多总体混在一起;缓变因素起作用;质量指标的均匀变化。四、直方图使用的注意事项四、直方图使用的注意事项1、异常值应去除后再分组;2、直方图是从样本测量值推测总体分布的最简单有效的方法;3、应取得时间、原料、测量者、设备、环境条件等方面的详细的数据资料;4、进行过程管理及分析改善时,可利用分层法,将更容易找出问题的症结点。8.3 8.3 因果图因果图 一、因果图的概念一、因果图的概念 所谓因果图是一种用来分析一个问题的特性(结果)与影响其特性的因素(原因)的图。它把影响产品质量的诸因素之间的因果关系清楚地表示出来,使人一目了然,便于采取措施解决,因此,因果图广泛应用于制
11、造业和服务业中。因果图是日本著名质量管理学者石川馨博士提出,所以又称“石川图”,特性要因图或鱼刺图。二、因果图的分类二、因果图的分类原因追求型W HY?对策追求型HOW?生产效率为什么这么低?为什么废品率这么高?为什么员工流动率这么高?为什么顾客投诉这么多?为什么过程波动这么大?如何提高生产效率?如何防止不合格品的产生?如何降低生产成本?如何提高过程的有效性和效率?32lg n 计算70 80 90 100 110测量方法有问题或读错数据;2-2:某厂成品尺寸规范为130至160mm,今按随机抽样方式抽取60个样本,其测定值如表,试制作直方图。如制作目的、制作日期、制作者、参与人员等。因测量值
12、不同的原因影响,应先分层后再作直方图。因测量值不同的原因影响,应先分层后再作直方图。32log n1+3.异常型:工序中有异常原因设计收集数据所使用的表单,确定分层的标志;确定收集数据方法和期间,并按分类项目,在期间内收集数据。R=148-121=27按原材料的供应商、批次、材质、产地、大小、成分、储存时间等进行分类。2、相关系数的几何意义从排列图可看出哪一项目有问题,其影响度如何,以判断问题的症结所在,并针对问题点采取改善措施,故又称为ABC图。质量管理方法导入及培训用;在横轴上按频数大小画出直方柱。因果图由质量问题(特性、结果)和影响因素(原因)两部分组成。最大值xmax=63,最小值xm
13、in=38,2-2:某厂成品尺寸规范为130至160mm,今按随机抽样方式抽取60个样本,其测定值如表,试制作直方图。中央 左侧三如何绘制因果图三如何绘制因果图 因果图由质量问题(特性、结果)和影响因素(原因)两部分组成。1、确定特性。在未绘制之前,首先应决定问题或质量的特性是什么?因果图的绘制步骤:6.记载所依据的相关内容。如制作目的、制作日期、制作者、参与人员等。5、分析标出的原因是否有遗漏,然后圈出主要的原因以作进一步讨论或采取对策;4、依据大要因再细分中要因,依据中要因细分更小的小要因,直到能采取措施为止;3、大略记载各类原因。一般工序问题常从5M1E等方面着手寻找;2、绘制骨架;顾顾
14、客客抱抱怨怨环境环境菜菜服务服务价格偏高价格偏高分量少分量少感觉不新鲜感觉不新鲜品种少品种少没有特色没有特色卫生间卫生间桌椅摆放不合理桌椅摆放不合理餐具餐具料料数量不够数量不够调料调料分量少上错菜上错菜服务态度差服务态度差门脸不大方门脸不大方不合口味不够洁净不够洁净碗筷漏勺杯盘底料不浓底料不浓服务不周全服务不周全服务不及时服务不及时墙壁装饰墙壁装饰给菜单时间长上菜时间长撤空盘慢没有给送餐巾纸没有给送茶水 顾客抱怨原因因果图五因果图的应用五因果图的应用 因果图不止在发掘原因而已,还可据此整理问题,找出最重要的问题点,并依循原因找出解决问题的方法。其用途可依目的分类:改善分析用;制定标准用;管理用
15、;质量管理方法导入及培训用;配合其他手法活用,更能得到效果,如:检查表、排列图等。因果图要实现“重要的因素不遗漏”和“不重要的因素不要绘制”两方面的要求,可以利用排列图确定重要的因素,最终的因果图往往越小越好。8.4 排列图(pareto diagram)1、意大利经济学家pareto “关键的少数关键的少数”,“排列图法则”。2、美国经济学者劳伦兹使用累积分配曲线来描绘“排列图法则”,即经济学中的Lorenz曲线。3、朱兰博士将劳伦兹曲线应用于质量管理上,同时 提出“关键的少数,次要的多数”的见解,并借用Pareto的名字,将此定义为排列图。4、石川馨博士将其引入到质量管理活动中使用,从而成
16、为质量管理七大工具之一,在现场得到广泛使用。一、排列图的由来一、排列图的由来二、排列图的概念排列图的概念 将所搜集的数据,按不良原因、不良状况、不良项目、不良发生的位置等不同区分标准而加以整理、分类,从中寻求占最大比率的原因、状况或位置,按其大小顺序排列后所作出的累积值柱形图。从排列图可看出哪一项目有问题,其影响度如何,以判断问题的症结所在,并针对问题点采取改善措施,故又称为ABC图。三、作排列图的步骤作排列图的步骤步骤1:确定所要调查的问题及如何收集数据。确定所要调查的问题是哪一类问题;然后确定哪些数据是必要的,以及如何对数据进行分类;确定收集数据方法和期间,并按分类项目,在期间内收集数据。
17、步骤2 依分类项目,对数据进行整理,做成统计表。步骤3:画出横轴和纵轴。左边纵轴,标上件数(频数)或不良数、不良率,或损失金额等的刻度,最大刻度为总件数(总频数)。右边纵轴,标上累积比率(频率)的刻度,最大刻度为100。横轴与纵轴应成适度比例,横轴不宜长于纵轴。横轴上按频数从大到小列出各项名称,其他项记在最右边。在横轴上按频数大小画出直方柱。步骤4:在每个直方柱右侧上方,标上累积值(累积频数和累积频率百分比),描点,用实线连接,画出累积频数折线(帕累托曲线)。步骤5:在图上记入必要的事项,如标题(目的)、数据收集期间、单位、作图人姓名以及数据合计数等。根据排列图确定主要因素、有影响因素和次要因
18、素。80%,90%,100%和A线、B线、C线。四、排列图的分类四、排列图的分类按用途分分析现象用排列图 分析原因用排列图 质量时间成本安全人机料法环测量8.5分层法 分层法就是把混杂在一起的不同类型数据按其不同的目的分类,即将数据分类统计,以便找出其统计规律的方法。通常,将分层法与其他质量管理的统计方法一起联用。一、分层法的概念二、分层法的分类分层法的分类 按部门或单位分层按生产过程或区域分层按操作者分层按机械、设备分层按作业条件分层按时间分层按加工的时间进行分类按原材料分层按原材料的供应商、批次、材质、产地、大小、成分、储存时间等进行分类。按测量因素分层三、分层法的实施步骤三、分层法的实施
19、步骤选定调查的对象;设计收集数据所使用的表单,确定分层的标志;确定数据的收集点,培训员工如何填写表单;记录数据;整理数据、分层归类;画分层直方图或其他统计图表;比较分析与最终推论。四、分层法的运用方法四、分层法的运用方法 分层法可以单独应用,也可以和排列图、直方图、因果图、控制图、散布图等QC工具结合使用,进行比对分析,这样效果往往更佳。设备人员方法砂模砂孔设备人员方法钢水含渣保温帽方案浇注口钢水温度缩孔设备人员方法时间裂痕铸造不合格率偏高解:1)绘制直方图如下:样本序号08:3010:3013:3015:30时间左中右左中右左中右左中右位置1234566.06.25.86.06.06.36.
20、06.15.86.26.35.96.16.15.86.26.35.96.16.56.36.26.46.56.16.96.36.76.46.46.26.76.36.56.56.36.37.06.36.76.66.36.26.56.46.76.56.46.46.96.76.96.66.66.16.36.56.66.76.96.46.56.56.76.56.76.26.36.66.76.56.8周一1234566.16.26.16.36.25.96.06.26.46.06.35.56.36.46.55.95.95.86.05.96.36.16.45.85.96.06.36.16.65.96.16.3
21、6.36.26.46.26.36.26.96.46.36.46.46.76.86.66.66.86.16.56.66.66.26.36.76.36.86.57.06.66.66.16.76.26.86.56.86.46.96.46.96.6周二1234566.35.66.46.06.26.26.35.76.45.86.26.06.26.16.36.16.16.16.26.36.26.06.36.26.06.26.25.96.06.26.26.36.26.06.16.26.56.56.76.56.76.86.26.47.06.46.66.76.36.46.66.36.56.86.46.16.56
22、.66.26.96.46.36.56.86.36.86.66.56.66.76.66.8周三1234566.36.16.06.35.96.06.16.16.06.35.95.86.16.06.36.36.16.06.46.46.36.16.36.36.36.46.26.26.36.26.26.56.25.96.16.06.56.16.26.76.26.46.66.26.16.56.46.56.66.26.56.76.36.56.76.26.56.26.46.77.06.16.56.26.56.76.66.06.56.16.56.8周四1234566.06.16.35.86.06.46.16.1
23、6.16.06.06.26.26.36.35.75.96.36.06.06.46.86.56.36.16.36.46.66.66.26.06.26.56.86.46.26.36.66.66.36.66.76.46.56.66.46.56.86.26.46.86.36.57.06.46.56.56.46.66.76.36.56.86.47.07.06.46.56.66.46.96.7周五第二组的上界限值就是第二组的下界限值,第二组的下界限值加上组距就是第二组的上界限值,也就是第三组的下界限值,依此类推,可定出各组的组界。为什么过程波动这么大?按原材料的供应商、批次、材质、产地、大小、成分、储存时
24、间等进行分类。3、大略记载各类原因。3、大略记载各类原因。61某材料的得率与反应温度有密切关系,今测量五对数据,试进行分析。因果图由质量问题(特性、结果)和影响因素(原因)两部分组成。如制作目的、制作日期、制作者、参与人员等。以各组内的次数为高,组距为宽;则极差R=xmaxxmin=6338=25,区间S,L=xmin,xmax称为散布范围。横轴上按频数从大到小列出各项名称,其他项记在最右边。步骤1:确定所要调查的问题及如何收集数据。如:两台机器,两家不同供应商,两种工艺等生产的产品混在一起时。因果图由质量问题(特性、结果)和影响因素(原因)两部分组成。3以x,y的最大值及最小值建立xy坐标系
25、,并决定适当刻度,便于绘点。确定数据的收集点,培训员工如何填写表单;80%,90%,100%下界限也可取xmin测量单位/2,本例测量单位为mm,故可取下限为xmin0.2、相关系数的几何意义因果图不止在发掘原因而已,还可据此整理问题,找出最重要的问题点,并依循原因找出解决问题的方法。(2)以纸张厚度的测量位置分层,即以左、中、右分层后再绘制直方图。中央 左侧右侧 根据位置分层后,仍有超出规范值的现象,且各位置的离散程度与平均值相比,并无明显的差异。(3)再以抽取样品进行测量的时间类别予以分层,即绘制上午0830、1030,与下午1330、1530的分层后的直方图。8:30 10:3013:3
26、0 15:30 根据测量时间分层可看出,早班上午时段的厚度平均分布偏规范下限较多,又以08:30时的不足厚度最多;所以可判定纸张厚度不够是因生产时间不同差异所引起,并应从早上的作业情况再予以调查分析,以寻找改善对策。8.6 散布图(scatter diagram)散布图又称为相关图,是用来分析两个对应变量之间是否存在相关关系的一种作图法。它通过将两种对应的变量的数据用点绘在xy平面上,能大概掌握两个变量之间是否有关联及关联的程度如何。一、散布图的概念一、散布图的概念散布图的作用:1.确定各因素对产品有无影响及影响大小 2.如果两变量相关程度很大,则对其中一个的观察可以代替另一个变量的观察;或直
27、接控制某一变量来间接控制另一变量的变化。二、散布图的制作方法1收集成对的数据(x1,y1),(x2,y2),整理成数据表。2找出x,y的最大值及最小值。3以x,y的最大值及最小值建立xy坐标系,并决定适当刻度,便于绘点。4将数据依次点于xy直角坐标系中,两个数据重复时以*表示,三个及以上数据重复时以表示。5必要时,可将相关资料注记在散布图上。6散布图的注意事项是否有异常点。有异常点时,不可任意删除该异常点,除非异常的原因已确实掌握。是否需分层。数据的获得常常因为操作人员、方法、材料、设备或时间等的不同,而使数据的关联性受到扭曲。全体时低度关联,分层后高度关联。全体时高度关联,分层后低度关联。散
28、布图是否与原有技术、经验相符。否则,应追查原因与结果是否受到其他因素干扰。三、散布图的判读(a)强正相关 (b)弱正相关 (c)强负相关 (d)弱负相关(e)不相关 (f)非线性相关四、相关与回归分析 1.为了能从定量方面精确地度量两变量之间的线性相关程度,需计算相关系数。相关系数r的计算公式:yyxxxylllrniniiixxxnxxxl12122)(x的偏差平方和 niniiiyyynyyyl12122)(y的偏差平方和 niniiiiixyyxnyxyyxxl11)(x与y的偏差积之和 其中:niixnx11niiyny112、相关系数的几何意义相关系数在-1和+1之间取值,即当 时,
29、x,y为完全线性相关;当 时,x,y为完全线性无关;当 越大时,表明x,y为线性相关越显著。11r1r0rr例8.61某材料的得率与反应温度有密切关系,今测量五对数据,试进行分析。反应温度xi()70 80 90 100 110得 率yi(%)25 28 33 36 38X(反 应 温 度)12011010090807060Y(%)403836343230282624解:1)画出散布图 由图观察分析知,反应温度与得率成正相关。2)计算相关系数 Ixi()yi(%)xi2yi2xi yi1234570809010011025283336384900640081001000012100625784
30、1089129614441750224029703600418045016041500523214740/59032 2、相关系数的几何意义相关系数在-1和+1之间取值,即计算各组的组中心值wi本例 n100,同样取 k9则极差R=xmaxxmin=6338=25,区间S,L=xmin,xmax称为散布范围。因果图由质量问题(特性、结果)和影响因素(原因)两部分组成。当 时,x,y为完全线性相关;2-2:某厂成品尺寸规范为130至160mm,今按随机抽样方式抽取60个样本,其测定值如表,试制作直方图。如制作目的、制作日期、制作者、参与人员等。3以x,y的最大值及最小值建立xy坐标系,并决定适当
31、刻度,便于绘点。相关系数r的计算公式:右边纵轴,标上累积比率(频率)的刻度,最大刻度为100。因测量值不同的原因影响,应先分层后再作直方图。即约可分为6组或7组,本例取7组。然后确定哪些数据是必要的,以及如何对数据进行分类;(2)以纸张厚度的测量位置分层,即以左、中、右分层后再绘制直方图。2、相关系数的几何意义为什么过程波动这么大?散布图是否与原有技术、经验相符。数据的获得常常因为操作人员、方法、材料、设备或时间等的不同,而使数据的关联性受到扭曲。全体时高度关联,分层后低度关联。质量指标的均匀变化。中央 左侧出现这种情况是夹杂了其他分布的少量数据。4将数据依次点于xy直角坐标系中,两个数据重复
32、时以*表示,三个及以上数据重复时以表示。将所有原始数据,按其数值大小归入相应的组中,并统计各组的数据个数,即频数fi。因测量值不同的原因影响,应先分层后再作直方图。画分层直方图或其他统计图表;2、直方图是从样本测量值推测总体分布的最简单有效的方法;也可按史特吉斯公式:k=1+3.即约可分为6组或7组,本例取7组。2、美国经济学者劳伦兹使用累积分配曲线来描绘“排列图法则”,即经济学中的Lorenz曲线。根据位置分层后,仍有超出规范值的现象,且各位置的离散程度与平均值相比,并无明显的差异。设计收集数据所使用的表单,确定分层的标志;2、相关系数的几何意义将所有原始数据,按其数值大小归入相应的组中,并
33、统计各组的数据个数,即频数fi。则极差R=xmaxxmin=6338=25,区间S,L=xmin,xmax称为散布范围。4将数据依次点于xy直角坐标系中,两个数据重复时以*表示,三个及以上数据重复时以表示。质量管理方法导入及培训用;出现这种分布,表明一定有异常原因存在,只要去除,就可满足过程要求,生产出符合规范的产品。100090541500)(212122niniiixxxnxxxl1183255238)(212122niniiiyyynyyyl3403290514740)(11niniiiiixyyxnyxyyxxl19898.01181000340yyxxxylllr则:因此,反应温度x与得率y之间强正相关。