统计方法基础知识概述课件.ppt

上传人(卖家):晟晟文业 文档编号:4215115 上传时间:2022-11-20 格式:PPT 页数:70 大小:569.50KB
下载 相关 举报
统计方法基础知识概述课件.ppt_第1页
第1页 / 共70页
统计方法基础知识概述课件.ppt_第2页
第2页 / 共70页
统计方法基础知识概述课件.ppt_第3页
第3页 / 共70页
统计方法基础知识概述课件.ppt_第4页
第4页 / 共70页
统计方法基础知识概述课件.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

1、统计方法基础知识概述一 统计方法及其用途二 产品质量波动三 统计数据及其分类四 总体与样本五 随机抽样方法六 统计特征数七 两类错误和风险一 统计方法及其用途(一)什么是统计方法(二)统计方法的性质(三)统计方法的用途(一)什么是统计方法统计方法统计方法:是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。描述性统计方法:描述性统计方法:是对统计数据进行整理和描述的方法;常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等。推断性统计方法:推断性统计方法:是在对统计数据描述的基础上,进一步对其所反

2、映的问题进行分析、解释和作出推断性结论的方法。(二)统计方法的性质1.描述性利用统计方法对统计数据进行整理和描述,以便展示统计数据的规律;统计数据可用数量值加以度量,如平均数、中位数、极差和标准差等,亦可用统计图表予以显示,如条形图、折线图、频数直方图、频数曲线等。2.推断性统计方法都要通过详细研究样本来达到了解、推测总体状况的目的,因此它具有由局部推断整体的性质。3.风险性统计方法既然要用部分推断整体,那么这种由推断而得出的结论就不会是百分之百正确,即可能有错误。犯错误就要担风险。(三)统计方法的用途1.提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差)2.比较两事物的差异;(

3、假设检验、显著性检验、方差分析、水平对比法)3.分析影响事物变化的因素;(因果图、调查表、散布图、分层法、树图、方差分析)4.分析事物之间的相互关系;(散布图、试验设计法)(三)统计方法的用途5.研究取样和试验方法,确定合理的试验方案;(抽样方法、抽样检验、试验设计、可靠性试验)6.发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图)7.描述质量形成过程。(流程图、控制图)二 产品质量波动(一)正常波动(二)异常波动(一)正常波动正常波动是由随机原因引起的产品质量波动;仅有正常波动的生产过程称为处于统计控制状态,简称为控制状态或稳定状态。(二)异常波动异常波动是

4、由系统原因引起的产品质量波动;有异常波动的生产过程称为处于非统计控制状态,简称为失控状态或不稳定状态。(二)异常波动引起产品波动的原因主要来自六个方面(5 M1E):人(Man):操作者的质量意识、技术水平、文化素养、熟练程度、身体素质等;机器(Machine):机器设备、工夹具的精度、维护保养状况等;材料(Material):材料的化学成分、物理性能和外观质量等;方法(Method):加工工艺、操作规程和作业指导书的正确程度等;测量(Measure):测量设备、试验手段和测试方法等;环境(Environment):工作场地的温度、湿度、含尘度、照明、噪声、震动等;三 统计数据及其分类(一)计

5、量数据(二)计数数据(一)计量数据 凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据。如:长度、容积、质量、化学成分、温度、产量、职工工资总额等。计量数据一般服从正态分布。(1)正态分布的定义及其特征分布)正态分布的定义及其特征分布密度函数为:密度函数为:记为记为:其中其中 为平均数,为平均数,为方差。为方差。222)(21)(xexpX),(2N正态分布正态分布正态分布的概率分布密度曲线为:正态分布的概率分布密度曲线为:重要特性:重要特性:A.正态分布密度函数曲线是单峰、正态分布密度函数曲线是单峰、对称的钟形曲线;对称的钟形曲线;B.21)()(xfxxf最大值是:

6、处取得最大值,在C.正态分布有两个参数:正态分布有两个参数:和正态分布的概率分布函数为正态分布的概率分布函数为(2)标准正态分布标准正态分布1,02221)(ueu分布密度函数:注意:注意:对于任何一个服从正态分布对于任何一个服从正态分布的随机变量的随机变量X,都可以通过标准化变换:,都可以通过标准化变换:将其变换为服从正态分布的随机变量。将其变换为服从正态分布的随机变量。),(2NXU(3)正态分布的概率计算)正态分布的概率计算A.标准正态分布的计算:标准正态分布的计算:)()()(1221uuuUuPB.一般正态分布的概率计算:一般正态分布的概率计算:服从正态分布服从正态分布N 的随机变量

7、的随机变量X在在 内取值的概率内取值的概率=服从服从标准正态分布的随机变量标准正态分布的随机变量U在在 ),(221,xx/)(,/)(21xx关于一般正态分布,经常用到以下几个概率:关于一般正态分布,经常用到以下几个概率:0.6826 0.9545 0.9973 0.95 0.99(二)计数数据凡是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3,等自然数的这类数据。计数数据还可细分为记件数据和记点数据。记件数据是指按件计数的数据,如不合格品数、彩色电视机台数、质量检测项目数等;记点数据是指按缺陷点(项)计数的数据,如疵点数、砂眼数、气泡数、单位(产品)

8、缺陷数等。(二)计数数据记件数据一般服从超几何分布或二项分布,记点数据一般服从泊松分布。当数据以百分率表示时,要判断它是当数据以百分率表示时,要判断它是计量数据还是计数数据,应取决于给出数计量数据还是计数数据,应取决于给出数据的计算公式的分子据的计算公式的分子。1.超几何分布超几何分布 在产品质量检验的不放回抽样中,若在产品质量检验的不放回抽样中,若N 件产品中有件产品中有D件不合格品,则抽检件不合格品,则抽检n件件时所得不合格品数出现的概率服从超时所得不合格品数出现的概率服从超几何分布,其概率分布为:几何分布,其概率分布为:nNknDNkDCCCkXP)(),min(,2,1,0nDk,例例

9、 设有设有100件产品,其中有件产品,其中有5%的不合格品,今从中不放回的的不合格品,今从中不放回的随机抽取随机抽取15件,求恰有件,求恰有2件不件不合格品的概率。合格品的概率。解:解:100件产品中有不合格品件产品中有不合格品=100 5%=5,随机抽取的,随机抽取的15件产品所出现的件产品所出现的不合格数不合格数X服从超几何分布,其概率分服从超几何分布,其概率分布为:布为:1377.0)2(15100215510025CCCXP二项分布来源于独立重复试验;二项分布来源于独立重复试验;每次试验结果出现的概率都不依赖于其每次试验结果出现的概率都不依赖于其它各次试验的结果;它各次试验的结果;对于

10、对于n次独立的试验,如果每次试验只次独立的试验,如果每次试验只有两个可能结果:有两个可能结果:A与与 A2.二项分布二项分布设随机变量所有可能取的值为零和正整设随机变量所有可能取的值为零和正整数:数:0,1,2,,n,且有,且有其中其中p0,q0,p+q=1,则称随机变量,则称随机变量服从参数为服从参数为n和和p的二项分布,记作的二项分布,记作B(n,p)。knkknnqpCkP)(k=0,1,2,n 注意:注意:一批产品,批量为无限大,一批产品,批量为无限大,假定产品总体的不合格品率为假定产品总体的不合格品率为P。从总体中抽取容量为从总体中抽取容量为n的样本,样的样本,样本中恰含有本中恰含有

11、x个不合格品的概率服个不合格品的概率服从二项分布。从二项分布。二项分布由二项分布由n和和p两个参数决定:两个参数决定:(1)当)当p值较小且值较小且n不大时,分布是不大时,分布是偏倚的。但随着偏倚的。但随着n的增大的增大,分布逐,分布逐渐趋于对称,如图所示;渐趋于对称,如图所示;图图 n值不同的二项分布比较值不同的二项分布比较图图 p值不同的二项分布比较值不同的二项分布比较(2)当)当p值趋于值趋于0.5时,分布趋于对称,时,分布趋于对称,如上图所示;如上图所示;(3)对于固定的)对于固定的n及及p,当,当k增加时,增加时,Pn(k)先随之增加并达到其极大值,以先随之增加并达到其极大值,以后又

12、下降。后又下降。(4)服从二项分布服从二项分布B(n,p)的随机的随机变量之平均数变量之平均数、标准差、标准差与与参数参数n、p有如下关系:有如下关系:=np,npq在在n较大,较大,np、nq较接近时,二较接近时,二项分布近似于正态分布;当项分布近似于正态分布;当n时,二项分布的极限分布时,二项分布的极限分布是正态分布。是正态分布。在产品质量检验中,当采取有放回的抽样在产品质量检验中,当采取有放回的抽样时,这时样本中取到的次品数的概率服时,这时样本中取到的次品数的概率服从二项分布。不放回的抽样在样本量相从二项分布。不放回的抽样在样本量相对总体很小时,也可以近似看作为放回对总体很小时,也可以近

13、似看作为放回抽样,超几何分布可利用二项分布来近抽样,超几何分布可利用二项分布来近似计算概率。似计算概率。3.泊松分布泊松分布若随机变量只取零和正整数值若随机变量只取零和正整数值0,1,2,且其概率分布为且其概率分布为 k=0,1,其中其中0;e=2.7182是自然对数的底数,是自然对数的底数,则称服从参数为则称服从参数为的泊松分布,记为的泊松分布,记为XP()。ekkXPk!)(泊松分布的重要特征:泊松分布的重要特征:即即=。2是泊松分布所依赖的唯一参数。是泊松分布所依赖的唯一参数。值值愈小分布愈偏倚,随着愈小分布愈偏倚,随着的增大,分的增大,分布趋于对称布趋于对称(如图所示如图所示)。在实际

14、工。在实际工作中,当作中,当20时就可以用正态分布时就可以用正态分布来近似地处理泊松分布的问题。来近似地处理泊松分布的问题。图图 不同不同的泊松分布的泊松分布应当注意,二项分布的应用条件也应当注意,二项分布的应用条件也是泊松分布的应用条件。是泊松分布的应用条件。二项分布要求二项分布要求n 次试验是相互独立次试验是相互独立的,这也是泊松分布的要求。的,这也是泊松分布的要求。对于二项分布,在对于二项分布,在n,p0,且,且 =(较小常数较小常数)情况下,二项分布情况下,二项分布趋于泊松分布。在这种场合,泊趋于泊松分布。在这种场合,泊松分布中的参数松分布中的参数用二项分布的代用二项分布的代之。之。n

15、p在质量管理中,泊松分布的在质量管理中,泊松分布的典型用途是用作单位产品上典型用途是用作单位产品上所发生的缺陷数的数学模型。所发生的缺陷数的数学模型。例:在产品的加工过程中,观察产例:在产品的加工过程中,观察产品在装配中发现的缺陷,经统计品在装配中发现的缺陷,经统计每台产品的平均装配缺陷每台产品的平均装配缺陷数数 ,试求在检验中发现,试求在检验中发现恰有恰有1个缺陷的概率是多大?个缺陷的概率是多大?5.03033.06065.05.0!15.0!)1(5.011eekXPkk解:解:5.0四 总体与样本总体(母体):是指在某一次统计分析中研究对象的全体。个体:组成总体的每个单元(产品)叫做个体

16、。有限总体:被研究对象是有限的,如一批产品的总数;无限总体:被研究对象是无限的,如某个企业、某个生产过程从前、现在、将来生产的全部产品。四 总体与样本样本(子样):是指从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(产品);样本是由1个或若干个样品组成的。样本容量(样本大小):样本中所含的样品数目,常用n表示。总体容量(总体大小):总体中所含的个体数,常用N表示。四 总体与样本抽样:是指从总体中随机抽取样品组成样本的活动过程。随机抽样:是指要使总体中的每一个个体(产品)都有同等机会被抽取出来组成样本的活动过程。四 总体与样本数据、样本和总体的关系数据、样本和总体的关系无限总体无限总

17、体有限总体有限总体工序一批产品一批半成品样本样本数据数据判断判断目的目的总体总体样本样本数据数据对工序进行分析控制对一批产品质量进行判断,确定是否合格五 随机抽样方法(一)简单随机抽样法(二)系统抽样法(三)分层抽样法(四)整群抽样法(一)简单随机抽样法又叫随机抽样法,是指总体中的每个个体被抽到的机会是相同的。优点:抽样误差小缺点:抽样手续比较繁杂。(二)系统抽样法又叫等距抽样法或机械抽样法。优点:操作简便,实施不易出差错。缺点:容易出较大偏差。不适用场合:总体发生周期性变化的场合,不宜使用这种方法。(三)分层抽样法也叫类型抽样法。它是从一个可以分成不同于总体的总体(或称为层)中,按规定的比例

18、从不同层中随机抽取样品(个体)的方法。优点:样本的代表性比较好,抽样误差比较小。缺点:抽样手续有时较简单随机抽样还要繁杂。适用场合:常用于产品质量验收。(四)整群抽样法又叫集团抽样法。是将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽取若干群,并由这些群中的所有个体组成样本。优点:抽样实施方便。缺点:代表性差,抽样误差大。适用场合:常用在工序控制中。案例 某种成品零件分装在20个零件箱内,每箱各装50个,总共是1000个。如果想从中取100个零件作为样本进行测试研究。简单随机抽样简单随机抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法从

19、中抽出编号毫无规律的100个零件组成样本。系统抽样系统抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法先决定起始编号,按相同的尾数抽取100个零件组成样本。分层抽样分层抽样:20箱零件,每箱都随机抽取5个零件,共100个组成样本。整群抽样整群抽样:先从20箱零件随机抽出2箱,该2箱零件组成样本。六 统计特征数(一)样本平均值(二)样本中位数(三)样本方差(四)样本标准偏差(五)样本极差表示数据的集中位置表示数据的离散程度(一)样本平均值niixnx1_1如果从总体中抽取一个样本,得到一批数据X 1,X 2,X 3.X n,则样本的平均值:样本的算术

20、平均值;n :样本大小。x(二)样本中位数把收集到的统计数据X 1,X 2,X 3,.X n,按大小顺序重新排列,排在正中间的那个数就叫作中位数,用符号 来表示。当 n 为奇数时,正中间的数只有一个;当 n 为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。数据:数据:1,5,3,6,8中位数中位数=?如果是偶数个数据如果是偶数个数据1,5,7,3,6,8呢?呢?想象在什么情况下分别用均想象在什么情况下分别用均值、中位数值、中位数?当数据呈现对称钟形分布或近似对称当数据呈现对称钟形分布或近似对称钟形分布时钟形分布时 均值均值但当数据分布的偏离度较大(出现但当数据分布的偏离度较大

21、(出现极端情况)时极端情况)时 中位数中位数(三)样本方差样本方差是衡量统计数据分散程度的一种特征数,其计算公式:S 2:样本方差;:某一数据与样本平均值之间的偏差。(四)样本标准偏差国际标准化组织规定,把样本方差的正平方根作为样本标准偏差,用符号 S 来表示。其计算公式:(五)样本极差极差是一组数据中最大值与最小值之差。常用符号 R 表示,其计算公式:R =X max -X min七 两类错误和风险第一类错误(弃真错误):把质量好的一批成品当作质量坏的一批成品去看待、处理的错误 :第一类错误的概率值,也叫第一类错误的风险率。七 两类错误和风险第二类错误(取伪错误):把质量坏的一批成品当作质量好的一批成品去看待、处理的错误:第二类错误的概率值,也叫第二类错误的风险率。能否举例举例说明统计质量控制中存在的两类错误?

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计方法基础知识概述课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|