1、现代制造系统 第第7 7章章 制造数据的建模与分析(制造数据的建模与分析(1 1- -2 2) 东北大学秦皇岛分校东北大学秦皇岛分校 黄亮黄亮 n-xyz 制造系统的研究可分为分析与综合两个阶段:制造系统的研究可分为分析与综合两个阶段: 系统分析的目的是了解系统的运行原理,以便能系统分析的目的是了解系统的运行原理,以便能 够对新的系统设计方案的执行效果进行预测,是够对新的系统设计方案的执行效果进行预测,是 系统设计的基础。其主要工作为制造系统的建模系统设计的基础。其主要工作为制造系统的建模 与性能评价与性能评价(第(第7 7、8 8、9 9章)。章)。 系统综合的目的就是根据系统系统综合的目的
2、就是根据系统 分析掌握的分析掌握的原理,构造出新的原理,构造出新的 更优秀的制造系统。其主要工更优秀的制造系统。其主要工 作为制造系统的设计与控制作为制造系统的设计与控制 (第(第1010、1111章)。章)。 使用制造系统模型具有重要意义:使用制造系统模型具有重要意义: (1 1)有利于加速新系统的研究开发;)有利于加速新系统的研究开发; (2 2)可降低实验成本;)可降低实验成本; (3 3)有利于保证安全;)有利于保证安全; (4 4)节省时间,提高效率;)节省时间,提高效率; (5 5)简化操作,易于理解。)简化操作,易于理解。 课程第课程第7 7章至第章至第9 9章按照从制造数据、制
3、造过程到制章按照从制造数据、制造过程到制 造企业的顺序,由局部到整体,从简单到复杂,逐造企业的顺序,由局部到整体,从简单到复杂,逐 步介绍制造系统建模领域的常见模型,以及这些模步介绍制造系统建模领域的常见模型,以及这些模 型的性能分析方法。型的性能分析方法。 很显然,这门课程涉及到的模型不是实物模型或很显然,这门课程涉及到的模型不是实物模型或 比例模型,而都是由信息构造的虚拟模型。比例模型,而都是由信息构造的虚拟模型。 这样,不管模型有多复杂,其根本上都是由数据这样,不管模型有多复杂,其根本上都是由数据 组成的,这些数据的来源包括组成的,这些数据的来源包括 (1 1)直接测量得到的;)直接测量
4、得到的; (2 2)间接计算得到的;)间接计算得到的; (3 3)通过预测得到的。)通过预测得到的。 本章将按此分类分成三节介绍这些数据的建模方本章将按此分类分成三节介绍这些数据的建模方 法。法。 第第7 7章章 制造数据的建模与分析制造数据的建模与分析 第第7 7章章 制造数据的建模与分析制造数据的建模与分析 7.1 7.1 直接测量数据模型直接测量数据模型 7.2 7.2 间接计算数据模型间接计算数据模型 7.3 7.3 预测数据模型预测数据模型 复习真值:复习真值: 在某一时刻和某一状态下,在某一时刻和某一状态下, 某量的客观值或实际值。某量的客观值或实际值。 绝对意义上,真值一般是未知
5、的;绝对意义上,真值一般是未知的; 相对意义上,真值是可以获得的,例如:相对意义上,真值是可以获得的,例如: 公理,例如平面三角形三内角之和为公理,例如平面三角形三内角之和为180180; 国家标准,国际标准;国家标准,国际标准; 高精度仪器所测之值;高精度仪器所测之值; 多次实验值的多次实验值的平均值平均值。 复习平均值:复习平均值: 有很多种,在制造系统建模领域,我们通常只有很多种,在制造系统建模领域,我们通常只 使用算术平均值(使用算术平均值(arithmetic meanarithmetic mean) 思考:为什么平均值就接近真值?思考:为什么平均值就接近真值? 121 . n i
6、ni x xxx x nn 既然平均值只是近似地表达真值,那如何评价这既然平均值只是近似地表达真值,那如何评价这 种近似的准确程度呢?种近似的准确程度呢? 相关概念:误差。相关概念:误差。 误差的计算方法有很多,制造系统建模领域最误差的计算方法有很多,制造系统建模领域最 常用的是样本标准差(常用的是样本标准差(standard deviationstandard deviation)。)。 2 1 () 1 n i i xx S n 当真值本身也是不确定数据时,均值与标准差难当真值本身也是不确定数据时,均值与标准差难 以充分描述真值,这时常使用概率分布函数。以充分描述真值,这时常使用概率分布函
7、数。 例如,正态分布的概率密度函数:例如,正态分布的概率密度函数: 不确定性数据的表达方式:不确定性数据的表达方式: (1 1)均值;)均值; (2 2)均值)均值 + + 标准差;标准差; (3 3)概率分布函数。)概率分布函数。 以上方式的表达效果越来越好,以上方式的表达效果越来越好, 但相应的计算也越复杂,但相应的计算也越复杂, 并且对样本数量的要求也越来越大。并且对样本数量的要求也越来越大。 直接测量数据有哪些?直接测量数据有哪些? 直接测量数据指生产管理文档中直接记载的数据,直接测量数据指生产管理文档中直接记载的数据, 服务于服务于制造过程建模制造过程建模的主要有的主要有 (1 1)
8、活动持续时间,例如某道工序的加工时)活动持续时间,例如某道工序的加工时 间、装配时间,某种原料的采购时间等。间、装配时间,某种原料的采购时间等。 (2 2)事件发生频率,例如订单或客户的到达)事件发生频率,例如订单或客户的到达 频率,出现不合格品的频率,设备出现故障的频率,出现不合格品的频率,设备出现故障的 频率等。频率等。 (3 3)资源消耗数量,例如铸造一个零件消耗)资源消耗数量,例如铸造一个零件消耗 的铸铁重量,设备工作一小时消耗的平均电量的铸铁重量,设备工作一小时消耗的平均电量 等。等。 7.1 7.1 直接测量直接测量数据模型数据模型 什么样的概率分布函数适合描述制造系统中的不确什么
9、样的概率分布函数适合描述制造系统中的不确 定性数据?定性数据? 首先是首先是“实践出真知实践出真知”, 记录一定数量的实际生产数据,记录一定数量的实际生产数据, 然后转化成概率密度函数或累积分布函数,然后转化成概率密度函数或累积分布函数, 得到的概率分布通常称为经验分布(得到的概率分布通常称为经验分布(empirical empirical distributiondistribution)。)。 经验分布来源于实际数据,因此准确度较高,缺点是经验分布来源于实际数据,因此准确度较高,缺点是 信息存储量较大,需要数据表记录。信息存储量较大,需要数据表记录。 (1 1)对活动持续时间的模拟)对活动
10、持续时间的模拟 案例案例1 1:记录某种零件:记录某种零件170170次采购所需的时间,得次采购所需的时间,得 到统计数据如下:到统计数据如下: 时间时间 次数次数 比例比例 时间时间 次数次数 比例比例 时间时间 次数次数 比例比例 5 5天天 1 1 0.6%0.6% 1111天天 3737 22.3%22.3% 1717天天 1 1 0.6%0.6% 6 6天天 1 1 0.6%0.6% 1212天天 3030 18.1%18.1% 1818天天 1 1 0.6%0.6% 7 7天天 2 2 1.2%1.2% 1313天天 2020 12.0%12.0% 1919天天 1 1 0.6%0
11、.6% 8 8天天 1010 6.0%6.0% 1414天天 1111 6.6%6.6% 2020天天 0 0 0.0%0.0% 9 9天天 1212 7.2%7.2% 1515天天 3 3 1.8%1.8% 2121天天 2 2 1.2%1.2% 1010天天 3333 19.9%19.9% 1616天天 4 4 2.4%2.4% 2222天天 1 1 0.6%0.6% (1.11.1)经验分布()经验分布(empirical distributionempirical distribution) 将统计数据转换成经验分布,将统计数据转换成经验分布, 得到案例得到案例1 1中零件采购时间的概
12、率密度函数为中零件采购时间的概率密度函数为 -5% 0% 5% 10% 15% 20% 25% 12345678910 11 12 13 14 15 16 17 18 19 21 22 23 采购时间(天)采购时间(天) 与上述与上述经验分布的经验分布的概率密度函数概率密度函数 对应的累积分布函数为对应的累积分布函数为 0% 20% 40% 60% 80% 100% 120% 123456789 10 11 12 13 14 15 16 17 18 19 21 22 23 采购时间(天)采购时间(天) 除了(除了(1.11.1)经验分布,人们还常使用标准分布)经验分布,人们还常使用标准分布 (
13、standard distributionstandard distribution)来描述不确定数据。)来描述不确定数据。 常用来描述活动持续时间的标准分布有:常用来描述活动持续时间的标准分布有: (1.21.2)均匀分布()均匀分布(uniform distributionuniform distribution);); (1.31.3)三角形分布()三角形分布(triangular distributiontriangular distribution);); (1.41.4)正态分布()正态分布(normal distributionnormal distribution);); (1
14、.51.5)指数分布()指数分布(exponential distributionexponential distribution);); (1.61.6)爱尔朗分布()爱尔朗分布(Erlang distributionErlang distribution)。)。 使用标准分布的好处是信息存储量较小,并且其中使用标准分布的好处是信息存储量较小,并且其中 有些能够支持分析类过程模型的快速计算,缺点是有些能够支持分析类过程模型的快速计算,缺点是 与实际分布的差异较大(相对于经验分布)。与实际分布的差异较大(相对于经验分布)。 (1.21.2)均匀分布()均匀分布(uniform distribu
15、tionuniform distribution) 定义:定义: 概率密度函数概率密度函数 累积分布函数累积分布函数 服从服从均匀分布的均匀分布的x落在区间落在区间a, b中长度相等的任一中长度相等的任一 子区间内的可能性是相等的,所谓的均匀指的就子区间内的可能性是相等的,所谓的均匀指的就 是这种等可能性。在实际问题中,当我们无法区是这种等可能性。在实际问题中,当我们无法区 分在随机变量分在随机变量x 取不同值的可能性有何不同时,我取不同值的可能性有何不同时,我 们可以假定们可以假定x 服从均匀分布。服从均匀分布。 ( ; , )()/()F x a bxabaaxb ( ; , )1/()f
16、 x a bbaaxb 分别使用区间分别使用区间9,139,13 来构造均匀分布,来构造均匀分布, 用来模拟案例用来模拟案例1 1中的零件采购时间,得到概率密度中的零件采购时间,得到概率密度 函数图为函数图为 -5% 0% 5% 10% 15% 20% 25% 30% 123456789 10 11 12 13 14 15 16 17 18 19 21 22 23 采购时间(天)采购时间(天) 经验分布 均匀分布 与上述均匀分布的概率密度函数与上述均匀分布的概率密度函数 对应的累积分布函数图为对应的累积分布函数图为 0% 20% 40% 60% 80% 100% 120% 1 2 3 4 56
17、 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23 采购时间(天)采购时间(天) 经验分布 均匀分布 均匀分布总结:均匀分布总结: 均匀分布的概率密度函数和累积分布函数从形均匀分布的概率密度函数和累积分布函数从形 状上看与经验分布的差异较大,因此用于实际状上看与经验分布的差异较大,因此用于实际 生产活动时间的模拟可能产生较大的误差,仅生产活动时间的模拟可能产生较大的误差,仅 用于用于模拟持续时间较短的活动。模拟持续时间较短的活动。 均匀分布的优点在于产生随机数方便(甚至可均匀分布的优点在于产生随机数方便(甚至可 以用骰子模拟),很多软件开发工具提供的随以
18、用骰子模拟),很多软件开发工具提供的随 机数函数都直接产生区间机数函数都直接产生区间0,10,1上的均匀分布,上的均匀分布, 是产生其它复杂概率分布的基础。是产生其它复杂概率分布的基础。 (1.31.3)三角形分布()三角形分布(triangular distributiontriangular distribution) 定义:定义: 概率密度函数概率密度函数 累积分布函数累积分布函数 a称之为下限,称之为下限,b称之为上限,称之为上限,c称之为众数。称之为众数。 2 2 () ()() ( ; , , ) () 1 ()() xa axc ba ca F x a b c bx cxb ba
19、 bc 2() ()() ( ; , , ) 2() ()() xa axc ba ca f x a b c bx cxb ba bc 令令a =7=7,b =17=17,c =11=11,使用三角形分布来模拟,使用三角形分布来模拟案例案例1 1 中的零件采购时间,得到概率分布函数图为中的零件采购时间,得到概率分布函数图为 -5% 0% 5% 10% 15% 20% 25% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 三角形分布 与上述三角形分布的概率密度函数图与上述三角形分布的概率密度函数图 对应的累积分布函数图为对应的累积分布函数图为 0
20、% 20% 40% 60% 80% 100% 120% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 三角形分布 三角形分布三角形分布总结:总结: 三角形分布的概率密度函数和累积分布函数从三角形分布的概率密度函数和累积分布函数从 形状上看与经验分布的很接近,但在变化趋势形状上看与经验分布的很接近,但在变化趋势 上存在着一定的误差。上存在着一定的误差。 在仿真类过程模型中,三角形分布经常被用于在仿真类过程模型中,三角形分布经常被用于 模拟生产活动时间,但不如正态分布应用得多。模拟生产活动时间,但不如正态分布应用得多。 相对于正态分布,三角形分布的
21、优点在于计算相对于正态分布,三角形分布的优点在于计算 相对简单,并且可以描述概率密度函数出现相对简单,并且可以描述概率密度函数出现 “偏心偏心”的情况。的情况。 (1.41.4)正态分布()正态分布(normal distributionnormal distribution) 正态分布又名高斯分布(正态分布又名高斯分布(Gaussian distributionGaussian distribution),), 是数学、物理和工程是数学、物理和工程领域应用得非常广泛的一种概领域应用得非常广泛的一种概 率分布,其定义:率分布,其定义: 概率密度函数概率密度函数 累积分布函数累积分布函数 其中,
22、参数其中,参数为概率分布的均值,为概率分布的均值,为概率分布的为概率分布的 标准差。标准差。 2 2 2 1 ( ; ,) 2 x f xe 2 2 2 1 ( ; ,) 2 t x F xedt 卡尔卡尔 弗里德里希弗里德里希 高斯(高斯(C. F. GaussC. F. Gauss) (19771977- -18551855)德国数学家、物理学家、天文学家、大地测)德国数学家、物理学家、天文学家、大地测 量学家,近代数学奠基者之一。量学家,近代数学奠基者之一。 高斯在历史上影响之大,可以和阿基米德、牛顿、欧拉并列,高斯在历史上影响之大,可以和阿基米德、牛顿、欧拉并列, 有有“数学王子数学王
23、子”之称。除了计算出标准正态分布之外,高斯之称。除了计算出标准正态分布之外,高斯 还发现了最小二乘法,证明了数论中的二次互反律,提出了还发现了最小二乘法,证明了数论中的二次互反律,提出了 微分几何中的正投影理论等等,贡献十分之多。微分几何中的正投影理论等等,贡献十分之多。 为了纪念高斯,为了纪念高斯,19891989年至年至20012001年流通的年流通的1010元德国马克纸币上元德国马克纸币上 印有高斯的肖像。印有高斯的肖像。 以两种参数对案例以两种参数对案例1 1中的零件采购时间进行模拟,得中的零件采购时间进行模拟,得 到概率密度函数图为到概率密度函数图为 案例案例1 1中中170170次
24、采购时间的均值是次采购时间的均值是11.4911.49天,标准差是天,标准差是2.572.57, 以此构造正态分布记作正态分布以此构造正态分布记作正态分布1 1; 以均值以均值1111、标准差、标准差1.81.8构造正态分布记作正态分布构造正态分布记作正态分布2 2。 -5% 0% 5% 10% 15% 20% 25% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 正态分布1 正态分布2 与上述正态分布的概率密度函数图与上述正态分布的概率密度函数图 对应的累积分布函数图为对应的累积分布函数图为 0% 20% 40% 60% 80% 100% 1
25、20% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 正态分布1 正态分布2 正态分布总结:正态分布总结: 正态分布的概率密度函数和累积分布函数从形正态分布的概率密度函数和累积分布函数从形 状上看与经验分布的很接近,比三角形函数的误状上看与经验分布的很接近,比三角形函数的误 差还小,但不适合描述分布的差还小,但不适合描述分布的“偏心偏心”情况。情况。 不一定是与样本数据的均值和标注差一致正态不一定是与样本数据的均值和标注差一致正态 分布拟合的最好,实际中往往需要反复调整参数分布拟合的最好,实际中往往需要反复调整参数 来追求更高的拟合效果,是个优
26、化问题,常用统来追求更高的拟合效果,是个优化问题,常用统 计软件提供相关的优化功能。计软件提供相关的优化功能。 在仿真类过程模型中,正态分布经常被用于模在仿真类过程模型中,正态分布经常被用于模 拟生产活动时间,是应用得最多的一种标准分布。拟生产活动时间,是应用得最多的一种标准分布。 (1.51.5)指数分布()指数分布(exponential distributionexponential distribution) 定义:定义: 概率密度函数概率密度函数 累积分布函数累积分布函数 指数分布也称作负指数分布,常用来描述连续两指数分布也称作负指数分布,常用来描述连续两 次事件之间的时间间隔,参数
27、次事件之间的时间间隔,参数表示事件发生的平表示事件发生的平 均频率,既是函数的均值,也是方差。均频率,既是函数的均值,也是方差。 0 ( ; ) 0 0 x ex f x x ( ; )1 x F xe 案例案例1 1中中170170次采购时间的均值是次采购时间的均值是11.4911.49天,天, 以以1/11.491/11.49为为 构造指数函数,构造指数函数, 则概率密度函数图为则概率密度函数图为 -5% 0% 5% 10% 15% 20% 25% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 指数分布 与上述指数分布的概率密度函数图与上述
28、指数分布的概率密度函数图 对应的累积分布函数图为对应的累积分布函数图为 0% 20% 40% 60% 80% 100% 120% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 指数分布 指数分布总结:指数分布总结: 指数分布的概率密度函数和累积分布函数从形指数分布的概率密度函数和累积分布函数从形 状上看与经验分布差异非常大,但由于其良好状上看与经验分布差异非常大,但由于其良好 的计算特性,能够极大地简化多个指数分布函的计算特性,能够极大地简化多个指数分布函 数之间的合并运算,因此仍广泛地应用于以排数之间的合并运算,因此仍广泛地应用于以排 队网络
29、为代表的分析类模型中。队网络为代表的分析类模型中。 指数分布仅在活动持续时间较短的情况下模拟指数分布仅在活动持续时间较短的情况下模拟 误差较小,误差较小,对于案例对于案例1 1这种误差较大的情况,这种误差较大的情况, 实际应用时也常使用(常数实际应用时也常使用(常数+ +指数分布)的方指数分布)的方 式模拟,如下:式模拟,如下: 将案例将案例1 1中的生产活动时间用(常数中的生产活动时间用(常数10 + 10 + 参数参数 为为3.53.5的指数分布)模拟,的指数分布)模拟, 得到概率密度函数图为得到概率密度函数图为 -5% 0% 5% 10% 15% 20% 25% 30% 35% 1 3
30、5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 指数分布 与上述(固定值与上述(固定值 + 指数分布概率密度)函数图指数分布概率密度)函数图 对应的累积分布函数图为对应的累积分布函数图为 0% 20% 40% 60% 80% 100% 120% 1 3 5 7 9 11 13 15 17 19 22 采购时间(天)采购时间(天) 经验分布 指数分布 (1.61.6)爱尔朗分布()爱尔朗分布(Erlang distributionErlang distribution) 爱尔朗分布按阶次分类,爱尔朗分布按阶次分类,k阶爱尔朗分布的概率密阶爱尔朗分布的概率密
31、 度函数为度函数为 一阶爱尔朗分布为指数分布,即指数分布为爱尔一阶爱尔朗分布为指数分布,即指数分布为爱尔 朗分布朗分布的特例;而的特例;而3030阶以上的爱尔朗分布近似于阶以上的爱尔朗分布近似于 正态分布。正态分布。 1 () 0 ( ; )(1)! 0 0 k k kk t t fxk t 与指数分布类似,爱尔朗分布在排队理论中也有与指数分布类似,爱尔朗分布在排队理论中也有 一定的应用:一定的应用: 案例案例1 1:k个服务台串行处理个服务台串行处理1 1件任务,各个服务台件任务,各个服务台 的服务时间相互独立,并且都服从相同参数的指的服务时间相互独立,并且都服从相同参数的指 数分布,则数分
32、布,则k个服务台的总服务时间服从个服务台的总服务时间服从k阶爱尔阶爱尔 朗分布。朗分布。 案例案例2 2:k个串行完成的任务个串行完成的任务在在1 1个个服务台处理,各服务台处理,各 个任务的服务时间相互独立,并且都服从相同参个任务的服务时间相互独立,并且都服从相同参 数的指数分布,则数的指数分布,则k个任务的总服务时间服从个任务的总服务时间服从k阶阶 爱尔朗分布。爱尔朗分布。 (2 2)对事件发生频率的模拟)对事件发生频率的模拟 除模拟活动时间之外,离散事件动态系统中另一除模拟活动时间之外,离散事件动态系统中另一 个需要模拟的重要对象是事件发生的频率,例如个需要模拟的重要对象是事件发生的频率
33、,例如 订单的到达频率、不合格品出现的频率等。订单的到达频率、不合格品出现的频率等。 除了(除了(2.12.1)经验分布外,通常情况下,事件的发)经验分布外,通常情况下,事件的发 生与否可以看做是重复生与否可以看做是重复n n次的伯努利试验,则事件次的伯努利试验,则事件 的发生概率服从(的发生概率服从(2.22.2)二项分布;)二项分布; 当实验次数很大,并且事件的发生概率很低时,当实验次数很大,并且事件的发生概率很低时, 二项分布又近似等于(二项分布又近似等于(2.32.3)泊松分布。)泊松分布。 (2.22.2)二项分布()二项分布(binomial distributionbinomia
34、l distribution) 二项分布用于表达二项分布用于表达n次试验中正好得到次试验中正好得到k次成功的次成功的 概率,因此常用于模拟每批产品中的不合格品数概率,因此常用于模拟每批产品中的不合格品数 量量(第第3.33.3节节)。)。 其概率密度函数为其概率密度函数为 累积分布函数为累积分布函数为 ! ( ; , )(1) !()! kn k n f k n ppp k nk 1 1 0 ! ( ; , )()(1) !()! p n kk n F k n pnkttdt k nk (2.32.3)泊松分布()泊松分布(Poisson distributionPoisson distrib
35、ution) 在二项分布的伯努利试验中,如果试验次数在二项分布的伯努利试验中,如果试验次数n很大,很大, 二项分布的概率二项分布的概率p很小,且乘积很小,且乘积=np比较适中,则事比较适中,则事 件出现的次数的概率可以用泊松分布来逼近。事实件出现的次数的概率可以用泊松分布来逼近。事实 上,二项分布可以看作泊松分布在离散时间上的对上,二项分布可以看作泊松分布在离散时间上的对 应物。应物。 由于泊松分布比二项分布计算简单些,在制造系统由于泊松分布比二项分布计算简单些,在制造系统 建模的实际应用中经常代替二项分布。特别是对一建模的实际应用中经常代替二项分布。特别是对一 段时间内某事件发生频率的模拟,
36、泊松分布比二项段时间内某事件发生频率的模拟,泊松分布比二项 分布也更符合实际情况,例如对订单到达频率、设分布也更符合实际情况,例如对订单到达频率、设 备故障频率等事件的模拟。备故障频率等事件的模拟。 泊松分布的概率密度函数为泊松分布的概率密度函数为 能够证明,当某种事件在一段时间内的发生频率能够证明,当某种事件在一段时间内的发生频率 服从泊松分布时,这些事件的发生间隔时间服从服从泊松分布时,这些事件的发生间隔时间服从 指数分布。指数分布。 上述性质使得泊松分布经常在排队网络模型中用上述性质使得泊松分布经常在排队网络模型中用 于模拟订单或顾客的到达频率。于模拟订单或顾客的到达频率。 ( ; )
37、! x f xe x 西莫恩西莫恩 德尼德尼 泊松(泊松(Simeon Denis PoissonSimeon Denis Poisson) (17811781- -18401840),法国数学家、物理学家和力学家。),法国数学家、物理学家和力学家。 泊松最重要的贡献即为提出描述泊松最重要的贡献即为提出描述 随机现象的一种常用分布随机现象的一种常用分布泊泊 松分布;松分布; 在固体力学领域,泊松以材料的在固体力学领域,泊松以材料的 横向变形系数横向变形系数泊松比而知名;泊松比而知名; 除此之外,泊松还解决了许多热除此之外,泊松还解决了许多热 传导、静电学、静磁学和引力学传导、静电学、静磁学和引
38、力学 等方面的问题;等方面的问题; 在光的波动说验证实验中出现于在光的波动说验证实验中出现于 圆板阴影中央的亮斑也以他命名。圆板阴影中央的亮斑也以他命名。 (3 3)对资源消耗量的模拟)对资源消耗量的模拟 相对于活动持续时间和事件发生频率,制造系统相对于活动持续时间和事件发生频率,制造系统 中资源的消耗相对稳定(例如一个零件总是固定中资源的消耗相对稳定(例如一个零件总是固定 需要一套毛坯),因此采用概率函数进行模拟的需要一套毛坯),因此采用概率函数进行模拟的 相关研究较少。相关研究较少。 对于存在不确定性的资源消耗(例如原料的采购对于存在不确定性的资源消耗(例如原料的采购 价格存在浮动),常用
39、的模拟手段即为价格存在浮动),常用的模拟手段即为均值均值,也,也 有一些研究使用(有一些研究使用(3.13.1)经验分布、()经验分布、(3.23.2)均匀)均匀 分布或(分布或(3.33.3)正态分布进行模拟。)正态分布进行模拟。 直接测量数据的建模方法:直接测量数据的建模方法: (1 1)对于活动持续时间的模拟:)对于活动持续时间的模拟: 经验分布;均匀分布;三角形分布;正态分布;经验分布;均匀分布;三角形分布;正态分布; 指数分布指数分布;爱尔朗分布。;爱尔朗分布。 (2 2)对于事件发生概率的模拟:)对于事件发生概率的模拟: 经验分布;二项分布(常用于模拟不合格品数经验分布;二项分布(
40、常用于模拟不合格品数 量);量);泊松分布泊松分布(常用于模拟订单或客户的达(常用于模拟订单或客户的达 到频率)。到频率)。 (3 3)对于资源消耗量的模拟:)对于资源消耗量的模拟: 均值均值;经验分布;均匀分布;正态分布。;经验分布;均匀分布;正态分布。 直接测量数据模型的评价:直接测量数据模型的评价: 除了经验分布直接依据样本数据产生外,各种标除了经验分布直接依据样本数据产生外,各种标 准分布都是对样本数据的一个近似模拟,即用一准分布都是对样本数据的一个近似模拟,即用一 个连续的函数拟合一系列离散的点,函数曲线与个连续的函数拟合一系列离散的点,函数曲线与 离散点的差异大小即为模型好坏的评价
41、标准。离散点的差异大小即为模型好坏的评价标准。 上述评价问题称为:拟合优度检验。上述评价问题称为:拟合优度检验。 例如例如实验设计实验设计中提及的正态分布拟合质量的中提及的正态分布拟合质量的 检验方法:卡方检验。检验方法:卡方检验。 拟合优度检验:判断某标准分布符合一组样本数据。拟合优度检验:判断某标准分布符合一组样本数据。 常用方法(常用方法(SPSSSPSS等常用统计软件提供):等常用统计软件提供): K K- -S S检验(检验(KolmogorovKolmogorov- -Smirnov testSmirnov test),), 音译作科尔莫格洛夫音译作科尔莫格洛夫- -斯莫洛夫检验;
42、斯莫洛夫检验; A A- -D D检验(检验(AndersonAnderson- -Darling testDarling test),), 音译作安德森音译作安德森- -达林检验。达林检验。 -0.05 0 0.05 0.1 0.15 0.2 0.25 05101520 经验分布正态分布 实际数据的采集:实际数据的采集: 实际生产中使用操作指示单(又称作业票)记实际生产中使用操作指示单(又称作业票)记 录和管理生产数据。样单举例如下图:录和管理生产数据。样单举例如下图: 从操作指示单中采集的最重要数据是实动工时,从操作指示单中采集的最重要数据是实动工时, 是制造系统建模的基础数据。采集时可根
43、据操作是制造系统建模的基础数据。采集时可根据操作 指示单的下发与回收时间计算。指示单的下发与回收时间计算。 其次重要的是合格品数。由于不合格品率通常很其次重要的是合格品数。由于不合格品率通常很 低,多数时候合格品数即为原料数量,需要额外低,多数时候合格品数即为原料数量,需要额外 记录这个数据的时候很少。记录这个数据的时候很少。 作业票作业票 ( (加工前加工前) ) 信息系统信息系统 作业票作业票 ( (加工后加工后) ) 基本基本 生产活动生产活动 下发下发 回收回收 管理信息系统简化并加快了数据采集工作。管理信息系统简化并加快了数据采集工作。 虚拟数据的产生:虚拟数据的产生: 在利用制造系
44、统模型进行仿真预测时,很多情况在利用制造系统模型进行仿真预测时,很多情况 下,仅根据采集到的实际生产数据难以构造出足下,仅根据采集到的实际生产数据难以构造出足 够数量或多样化的实验数据,这时可以参照采集够数量或多样化的实验数据,这时可以参照采集 到的实际生产数据,构造虚拟生产数据用于仿真。到的实际生产数据,构造虚拟生产数据用于仿真。 通常的步骤为通常的步骤为 (1 1)采集实际生产数据;)采集实际生产数据; (2 2)将实际生产数据转化成经验分布或某种)将实际生产数据转化成经验分布或某种 标准分布;标准分布; (3 3)利用)利用经验或标准分布产生虚拟生产数据。经验或标准分布产生虚拟生产数据。
45、 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 01020304050 取值 概率 0至1之间的 随机值 随机参数的一个生产值 随机参数的 概率分布函数 利用经验或标准分布产生虚拟生产数据:利用经验或标准分布产生虚拟生产数据: 首先利用均匀分布首先利用均匀分布产生产生0 0- -1 1之间之间的随机数,的随机数, 之后以上述随机数为变量,求经验概率函数的之后以上述随机数为变量,求经验概率函数的 反函数。反函数。 第第7 7章章 制造数据的建模与分析制造数据的建模与分析 7.1 7.1 直接测量数据模型直接测量数据模型 7.2 7.2 间接计算数据模型间接计算数
46、据模型 7.3 7.3 预测数据模型预测数据模型 7.2 7.2 间接计算数据模型间接计算数据模型 在制造系统中,间接计算得到数据主要是投入资源在制造系统中,间接计算得到数据主要是投入资源 (设备、能源、资金等)与获得收益(产量增加、(设备、能源、资金等)与获得收益(产量增加、 生产周期缩短、不合格品率降低等)之间的关系。生产周期缩短、不合格品率降低等)之间的关系。 这些关系数据无法直接测量,而是通过其它直接测这些关系数据无法直接测量,而是通过其它直接测 量数据建立起关系模型,间接计算解得。量数据建立起关系模型,间接计算解得。 用于描述数据之间关系的常用模型是多项式模型,用于描述数据之间关系的
47、常用模型是多项式模型, 相关的建模与分析工作称为回归分析。回顾相关的建模与分析工作称为回归分析。回顾实验实验 设计设计中回归分析的分类:中回归分析的分类: 一元线性回归;一元非线性回归;一元线性回归;一元非线性回归; 多元线性回归;多元非线性回归。多元线性回归;多元非线性回归。 一元线性回归的应用案例:一元线性回归的应用案例: 当某种零件仅需单个工人生产时,当某种零件仅需单个工人生产时, 其产量通常与生产人数呈线性关其产量通常与生产人数呈线性关 系。系。 案例案例1 1:某散热器生产车间采用手工方式处理串:某散热器生产车间采用手工方式处理串 片工序,该工序配置人数与串片数量的对应关系片工序,该工序配置人数与串片数量的对应关系 经测量如下表,求工人人数与日串片量的关系。经测量如下表,求工人人数与日串片量的关系。 工人数工人数 1 1 2 2 3 3 4 4 5 5 6 6 7 7 日串片量日串片量 7