1、第1页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-2Rev.2.0MeasureDefineAnalyzeImproveControl方法论方法论q Measure 概要概要q Project Y q 基础统计基础统计q 测定测定System 分析分析q Six Sigma 测度测度q 工程能力分析工程能力分析q Process Map&特性要因图特性要因图q FDM第2页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-3Rev.2.0基础统计
2、基础统计q 学习目标学习目标1.为了确认为了确认DATA的特性,理解测定的基本概念和的特性,理解测定的基本概念和 利用利用Minitab的基础统计量计算的方法。的基础统计量计算的方法。2.理解导入概率分布确认概率概念,利用理解导入概率分布确认概率概念,利用Minitab从概率分布求从概率分布求3.概率值的方法。概率值的方法。第3页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-4Rev.2.0基础统计的必要性基础统计的必要性l 在测定阶段中收集材料以分析的方法使用。l 把工程的Xs与 Ys特性化资料用数值显示。l 用以前
3、的工程和执行DATA推定未来时使用。l 高级统计性问题解决方法的基础而使用。l 基本统计概念不是根据直观而是创出根据事实的语言。第4页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-5Rev.2.0资料的测度资料的测度 标本(Sample):为了统计性处理,从母集团中实际抽出的观测值或测定值的集合。母集团(Population):对关心的所有集团的所有个体的观测值或测定值的集合。(对有权者的投票结果,一日生产量,特定制品的不良率。)今年参加数能考试的全部学生数是约 80万名。为了调查与去年对比考试问题的 难度,在各地区任
4、意抽出 2,000名调查了成绩。这时的母集团和标本是什么?是参加考试的全体学生数约 80万名 各地区任意抽出的2,000名例例 母集团和标本母集团和标本q第5页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-6Rev.2.0资料的测度资料的测度 2 S2 S对母集团特性的推论对母集团特性的推论母平均母平均 :母分散母分散 :母标准偏差母标准偏差 :标本平均标本平均 :标本分散标本分散 :标本标准偏差标本标准偏差 :母数(Parameter):表示母集团的特性值(母平均,母分散等)统计量(Statistic):根据从标本中
5、计算的标本特性值,可以推定 母集团的特性。(标本平均,标本分散等)抽出抽出(Sampling)AAAAAAABBBBBBCCCCCCDDDDDDDAABDDDCCCCBx第6页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-7Rev.2.0 对资料中心的测度,包括平均,中央值,最频值等。对资料中心的测度,包括平均,中央值,最频值等。.xxxxnn 12 例)制品完成所需AF 的7个工程。下面测定了每工程所需要的时间。求每工程所需要的平均时间。2 2 1 3 2 9 3077 极端值极端值 30分对平均分对平均的影响大的影
6、响大!平均平均(Mean)n 个观测值的平均是,观测值的总合除于观测值个数 对于 极端值很敏感(outlier)。平均 :2 2 1 3 2 9 30A B C D E F G(单位:分)x 观测值总合观测值数=计算)计算)中心位置中心位置资料的测度资料的测度q第7页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-8Rev.2.0 中央值中央值(Median)DATA按从小到大顺序按从小到大顺序(n)排列时,中间位置的值少受极端值排列时,中间位置的值少受极端值(Outlier)的影响的影响。最频值最频值(Mode)DAT
7、A频度数频度数(Frequency)大的大的 少受极端值少受极端值(Outlier)的影响。的影响。例例)前面问题中最频值是多少前面问题中最频值是多少?在2,2,1,3,2,9,30中频度数 2值为 3,拥有最多 的频度,因此最频值是 2。中央值,最频值中央值,最频值少受检端值的少受检端值的 影响。影响。2和 3的平均2.5资料的测度资料的测度第8页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-9Rev.2.0显示资料离中心位置分散多少的测度,代表性的有分散、标准偏差、显示资料离中心位置分散多少的测度,代表性的有分散、
8、标准偏差、4 4分位数等。分位数等。B B汽车每汽车每L L 平均行驶距离比平均行驶距离比 A A汽车高,但分布的散布图大,汽车高,但分布的散布图大,所以不能说所以不能说 一定是一定是B B汽车好汽车好!A A 汽车汽车B B 汽车汽车下面是 测定A,B汽车每L 行驶 距离的DATA分析。各位喜欢什么样的汽车?AB例例)统计分析中只考虑平均判断会得到错误的结果,应考虑资料分散程度的散布图。散布图散布图资料的测度资料的测度q第9页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-10Rev.2.0分散和标准偏差是资料离平均值
9、的距离,表示资料分散的程度。可以使用各资料值和平均的差异,即把偏差都合起来的方法,但如下例经常成为0,所以使用距离的 乘方,即,偏差的乘方。3040506070 xix)(xxi假如,从 点到 的乘方距离是 ,分散被定义为平均乘方距离(按统计理由 分母不是 n,而是使用 n-1)niinxxs122)1(niinxxs12)1(标准偏差取乘方根分散的形态。分散分散(Variance)与标准偏差与标准偏差(Standard deviation)xix2)(xxi例例)资料 :4 8 7 5 2 6 3 平均 5 偏差的合 :(-1)+3+2+0+(-3)+1+(-2)=0 标本分散:标准偏差 :
10、资料的测度资料的测度第10页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-11Rev.2.0 4分位数分位数(Quartile):资料按顺序排列时,被资料按顺序排列时,被 4等分的数。等分的数。4 分位范围分位范围(IQR:Interquartile Range):Q3-Q1Q1:第 1/4分位数(First quartile)=相当于25%的值Q2:第 2/4分位数(Second Quartile:中央值)=相当于 50%的值Q3:第 3/4分位数(Third Quartile)=相当于75%的值例例)有如下有如下D
11、ATA时,求时,求4分位数和分位数和 IQR.2,8,20,4,9,5,4,3,计算计算)按顺序排列 :Q1=3.25Q2(中央值)=4.5Q3=8.752 3 4 4 5 8 9 20 范围范围(Range):在一组在一组DATA中,把最大值和最小值的间隔用数值表示。中,把最大值和最小值的间隔用数值表示。=最大值最大值 最小值最小值资料的测度资料的测度第11页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-12Rev.2.0Basic StatisticsA事业部 90 51 48 92 79 98 67 61 68
12、70 44 49 50 98 71B事业部 83 26 32 99 63 92 92 69 45 67 80 60 73 40 38例题例题 1以下是 A,B事业部对各 15名进行大约4周的 GB教育后,Test 的结果。1)利用Display Descriptive Statistics 求全部 DATA 的基础统计量。2)利用Store Descriptive Statistics 求各事业部DATA 的基础统计量。资料的测度资料的测度q第12页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-13Rev.2.01)D
13、isplay Descriptive Statistics:显示统计量和显示统计量和Graph.Work sheet里里DATA输入输入Step 1(score.mtw)资料的测度资料的测度第13页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-14Rev.2.0Stat Basic Statistics Display Descriptive StatisticsStep 2选择变量列选择变量列使用使用Group变量变量列时列时Check选择选择Graph资料的测度资料的测度第14页,共45页。Proprietary
14、to Samsung Electronics CompanyMeasure-基础统计-15Rev.2.0Session 结结果果确确认认Step 3平均,标准偏差,4分位数 Q1:数据按从小到大顺序排列时,25%位置的数(第1/4分位数)48.75 Q3:数据按从小到大顺序排列时,75%位置的数(第3/4分位数)84.75 Mean:对观测值的平均 66.50资料的测度资料的测度 Median:对观测值的中央值 67.50 StDev:对观测值的标准偏差 21.01第15页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-
15、16Rev.2.0Graph 结果确认结果确认Step 4HistogramBox Plot信赖区间信赖区间 Graph(平均平均)正态性检定正态性检定基础统计量基础统计量4分位数分位数平均,标准偏差,中央值的平均,标准偏差,中央值的信赖区间信赖区间信赖区间信赖区间 Graph(中央值中央值)资料的测度资料的测度第16页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-17Rev.2.0Mean:平均SE of Mean:平均的标准误差Standard deviation:标准偏差Variance:分散First Quar
16、tile:分位数(Q1)Median:中央值Third Quartile:分位数(Q3)Interquartile range:4分位间 范围(Q3-Q1)Sum:合Minimum:最小值Maximum:最大值Range:范围 Statistics(统计量统计量)资料的测度资料的测度第17页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-18Rev.2.0Stat Basic Statistics Store Descriptive StatisticsStep 1选择变量列选择变量列选择选择Group变变量列量列选择希
17、望的统计选择希望的统计量量2)Store Descriptive Statistics:计算的统计量保存在计算的统计量保存在Work sheet里里资料的测度资料的测度第18页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-19Rev.2.0Work sheet 结果确认结果确认Step 2基础统计量按Group别也能求!资料的测度资料的测度第19页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-20Rev.2.0 计量型计量型DATA:DATA:
18、能测定的品质特性的值。能测定的品质特性的值。例例)强度强度(kg/cm(kg/cm2 2),),重量重量(kg),(kg),长度长度(cm),(cm),温度温度(C)C)等计量型等计量型DATADATA。DATADATA的形态的形态 计数型计数型DATA:DATA:按个数能数的品质特性的值按个数能数的品质特性的值 例例)缺点数,不良品数等计数型缺点数,不良品数等计数型DATADATA。一,二,三一,二,三能数啊能数啊!有测定单位吧有测定单位吧q概率分布概率分布第20页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-21R
19、ev.2.0 对有发生可能的所有情况特定事件A发生的可能性,即,无数次反复进行同样的实验时,发生某事情的比率。标本空间标本空间(Sample space):(Sample space):在实验或观察中所有可能发生的实验结果的集合。思想或事件思想或事件(Event):(Event):标本空间的部分集合,有某特定观心的实验结果的集合。例例)想一想掷两个骰子。P(A)P(A)=思想思想 标本空间标本空间标本空间标本空间 S=(1,1),(1,2),(6,6):36种所有实验结果的集合。事件事件(Event):标本空间的部分集合。E1=第一个骰子出现1时=(1,1),(1,2),(1,3),(1,4)
20、,(1,5),(1,6)掷两个骰子时第一个骰子出现掷两个骰子时第一个骰子出现1情况的概率情况的概率P(E1)P(E1)=P(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)=6/36=1/6 概率概率(Probability)(Probability)q概率分布概率分布第21页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-22Rev.2.0 概率变量概率变量(Random Variable)硬币出现的情况,即,可以认为标本空间是 (前面,前面),(前面,后面),(后面,前面),(后面,后面).这时,
21、假如把概率变量 X 为硬币前面出现的个数,为硬币前面出现的个数,(前面,前面)情况时,概率变量 X是 2.因此概率变量X可以如下表示。X(前面前面,前面前面)=2,X(前面前面,后面后面)=1,X(后面后面,前面前面)=1,X(后面后面,后面后面)=0 概率变量对应概率变量对应 标本空间的数。标本空间的数。q概率分布概率分布 例例)想一想掷两个硬币的情况。想一想掷两个硬币的情况。对标本空间的各个值赋予实数的函数。对标本空间的各个值赋予实数的函数。第22页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-23Rev.2.0X
22、=x012个事件(后,后)(前,后),(后,前)(前,前)P(X=x)1/42/41/411/21/4012在这里 X叫叫 概率变量,给概率变量值对应概率的关系叫概率变量,给概率变量值对应概率的关系叫 概率分布。概率分布。概率分布概率分布前例的概率分布用表和Graph表示如下。P(X=0)=1/4,P(X=2)=1/4,P(X=1)=1/2 下面求概率变量下面求概率变量 X X 为为 1 1的概率。的概率。X=1的情况意味着硬币前面出现的个数为一个,因此出现(前面,后面),(后面,前面)的两种情况,概率是全部4种情况中的两种即可知1/2 ,所以给各个的概率变量值对应概率如下。第23页,共45页
23、。Proprietary to Samsung Electronics CompanyMeasure-基础统计-24Rev.2.0 概率分布概率分布(Probability Distribution)给概率变量的数值对应概率的关系,有计量型概率分布和计数型概率分布。q 缺点数DATA:泊松分布 注意 现场的连续性DATA一般随正态分布。但信赖性DATA是随指数分布或 Weibull分布的情况多,在只规定单侧规格或工程有异常情况时,DATA 一般也不按正态分布。概率分布的种类 计数型 概率分布:概率变量 X是计数型概率变量时 不良品DATA:二项分布 计量型 概率分布:概率变量 X是计量型概率变
24、量时 正态分布概率分布概率分布第24页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-25Rev.2.0连续概率分布连续概率分布正态分布是最自然的分布,某一定范围内的所有实数值都可以取的概率分布,是计量型概率分布中最有代表性的分布。-概率密度函数是平均 为 中心对称的钟模样。-分布的模样和位置用分布的平均和分散决定。-从社会性,自然性现象出来的分布大部分与 正态分布类似。-拥有平均,分散 2 的正态分布如下表示 正态分布的概率密度函数),(2NXxexfx-,21)(222)(121=1 12121221 随随 与与 的
25、正态分布模样的正态分布模样 1 2,1=21=2,1 2 1 2,1 2 计量型概率分布计量型概率分布q第25页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-26Rev.2.0ZX=-ms为了使概率计算容易,把正态分布标准化为平均 =0,标准偏差 =1 Z Z 变换:正态分布的标准化 用标准化的概率变量 Z 表示-2-3+3+2+100100909080807070120120110110130130ZX=-100100-1-2-3321计量型概率分布计量型概率分布第26页,共45页。Proprietary to Sa
26、msung Electronics CompanyMeasure-基础统计-27Rev.2.0 平均是 20,标准偏差是 5的正态分布中,使用Minitab求下面各概率。.(a)P(X15),即 X15的概率?(b)P(X30),即 X30的概率?(c)P(Xx)=0.90的 x值?例题例题 2 2计量型概率分布计量型概率分布第27页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-28Rev.2.0 Probability density(概率密度函数概率密度函数)输入 x 概率密度函数 f(x)值计算 Cumulati
27、ve probability Inverse cumulative probability Minitab的概率分布中求概率值的方法的概率分布中求概率值的方法x)(xFxx)(xF输入x 累积概率 F(x)值计算输入累积概率 F(x)值 计算相关 x值f(x)计量型概率分布计量型概率分布第28页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-29Rev.2.0(a)P(X(a)P(X1515),),即即 X15 X Probability Distribution NormalCalc Probability Distr
28、ibution NormalStep 1Step 1选择累积概率选择累积概率输入平均和输入平均和标准偏差标准偏差输入系数输入系数常数输入在常数输入在特定列时特定列时 Minitab Minitab 实习实习 计量型概率分布计量型概率分布第29页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-30Rev.2.0Session 结果解释结果解释Step 2Step 2x=15x=15P X15=P X-20515-205=P Z Probability Distribution NormalStep 1(b)P(X 30),
29、即即 X 30 的概率是的概率是?选择累积概率选择累积概率输入平均和输入平均和标准偏差标准偏差输入常数输入常数系数输入系数输入在特定列时在特定列时计量型概率分布计量型概率分布第31页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-32Rev.2.0 Session 结果确认结果确认Step 2x=30P X 30=P X-20530-205=P Z 2 =1-PZ 2=0.0228PZ 2是从全体宽度 1减掉PZ 2 部分的宽度就行!0.02281-PX 30=1-0.9772 =0.0228 计量型概率分布计量型概率分
30、布第32页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-33Rev.2.0(c)P(X Probability Distribution NormalStep 1选择逆累积概率选择逆累积概率输入平均和标准偏差输入平均和标准偏差输入常数输入常数常数输入常数输入在特定列时在特定列时计量型概率分布计量型概率分布第33页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-34Rev.2.0 Session 结果确认结果确认Step 20.90 x=26.40
31、78PX 26.4078=0.90 计量型概率分布计量型概率分布第34页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-35Rev.2.0离散概率分布离散概率分布 两项分布(Binomial Distribution)(Binomial Distribution)与良/不良或成功/失败一样的两个要素中,显示其中一个的施行中利用。结果只分为良品/不良品或成功/失败两种的实验进行了n次反复施行时,成功次数X 随二项分布。q00.10.20.30.405101520p=0.1p=0.2p=0.3p=0.4p=0.5例例)n=1
32、5)n=15 的二项分布中,显示随的二项分布中,显示随p p值概率值的图表。值概率值的图表。计数型概率分布计数型概率分布第35页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-36Rev.2.0 现场的两项分布现场的两项分布 n个的制品中纳期内给消费者送到的制品数。在平均不良率为 p的工程中取出的n个制品包含的不良品数。p:发生特定现象的概率,)1()()(xnxppxnxXpxfnx,1,0(1-p):不发生的概率,)1()!(!xnxppxnxn两项分布的平均,分散,标准偏差两项分布的平均,分散,标准偏差:平均:np
33、,分散:np(1-p),标准偏差:)1(pnp计数型概率分布计数型概率分布第36页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-37Rev.2.0 A公司生产的制品不良概率是 0.01.把这制品各10个一捆销售,不良品一个以上时可以换。这时一捆被换的概率是多少?计算计算)P(X 2)=1-P(X 1)=1-P(X=0)-P(X=1)=1-0.010 0.9910-0.011 0.999 =1-0.90438-0.09135 =0.00427 10 010 1例题例题 3 3二项分布是现场的不二项分布是现场的不良品良品D
34、ATADATA时时多使用吧多使用吧!计数型概率分布计数型概率分布第37页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-38Rev.2.0 P(X P(X 2)=1-P(X 2)=1-P(X 1)1)选择累积概率选择累积概率输入施行次数输入施行次数输入欲求概率的值输入欲求概率的值输入原有的概率输入原有的概率Calc Probability Distribution Binomial DistributionCalc Probability Distribution Binomial DistributionStep 1S
35、tep 1 Minitab Minitab 实习实习计数型概率分布计数型概率分布第38页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-39Rev.2.0关于关于P(X 1 的的 概率概率因此,因此,知道知道P(X 2)=1-P(X 1)=1-0.9957 =0.0043 Session 结果确认结果确认Step 2计数型概率分布计数型概率分布第39页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-40Rev.2.0 泊松分布泊松分布(Poisso
36、n Distribution)(Poisson Distribution)适用于按时间或空间发生频率低的稀奇事件的每单位发生数等适用的分布。例)机器一天的故障次数,每单位时间打来的电话次数,制品的每单位面积 缺点数,交叉路上一天发生的交通事故数,大量生产制品的不良数。一般 在n大,p小时适用00.20.40.60.8105101520缺点数缺点数dpu=0.1dpu=1.0dpu=2.0dpu=2.5dpu=4.0例)显示随每单位缺点数(dpu)值的概率值的图表。计数型概率分布计数型概率分布第40页,共45页。Proprietary to Samsung Electronics Company
37、Measure-基础统计-41Rev.2.0,.2,1,0,!)()()(xxmexXPxfxm 概率质量函数概率质量函数平均发生次数:m 平均和分散平均和分散平均:E(X)=m(=dpu),分散:V(X)=m(=dpu)在半导体工程生产的 wafer每单位面积平均缺点数是每 2.5cm21个。在这工程中生产 10cm2的wafer 时,wafer 有两个缺点数的概率是?计算计算)10cm2 wafer平均缺点数 :wafer有两个缺点数的概率 因此,能知道概率是 0.1465.例题例题 4 41465.04exp!24)2(2Xp4 5.2/10m计数型概率分布计数型概率分布第41页,共45
38、页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-42Rev.2.0Calc Probability Distribution Poisson DistributionStep 1选择出现选择出现缺点的概率缺点的概率 输入平均缺点数输入平均缺点数输入欲求概率的值输入欲求概率的值Session 结果确认结果确认Step 2 Minitab 实习实习计数型概率分布计数型概率分布第42页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-43Rev.2.0概率分布的种
39、类及活用概率分布的种类及活用概率分布概率分布 计计量量型型计计数数型型正态分布正态分布 t t 分布分布 ChiSquareChiSquare 检定检定F F 分布分布泊松分布泊松分布二项分布二项分布 对母平均/母比率的推定与检定 -知道母分散时 -不知道母分散,但标本的数大时 对母平均的推定与检定 -不知道母分散时 -知道母分散,但标本的数小时 对母分散的推定与检定 根据分割表的独立性检定 对两个母分散差的推定与检定 分散分析中与要因相关的留意性检定 对母比率的推定与检定 例)不良率 对单位时间或单位面积别发生事件概率的推定与检定 例)每单位缺点数活用活用 第43页,共45页。Proprie
40、tary to Samsung Electronics CompanyMeasure-基础统计-44Rev.2.0练习问题练习问题1.预示各位的作业现场或生活周边可以得到的DATA,2.分类它们的类型。2.某工程的不良率是 5%,从这工程中生产的制品中取 大小 15的样品时,求不良品包含 3个以下的概率。(使用Minitab )3.信用卡公司的请求书作成部门要管理请求书中出现的失误。一个 请求书发生的失误随 0.05的泊松分布时,任意选择的请求书中失误为 3个以下的概率是多少?(使用 Minitab)第44页,共45页。Proprietary to Samsung Electronics CompanyMeasure-基础统计-45Rev.2.04.在充电工程中生产的制品重量是平均 5 kg,标准偏差 0.5kg.求在其中抽出一个制品时,重量在 5 kg以上 5.5 kg以下的概率。5.进口检查中被检查的部品中不合格部品的比率是 10%。调查 100个部品时,(a)不合格制品数为 15个以下的概率?(b)不合格制品数为 25个以上的概率?练习问题练习问题第45页,共45页。