1、数数 学学 建建 模竞赛模竞赛 讲讲 座座东南大学数学系东南大学数学系 陈恩水陈恩水2010.0609年年B题题“眼科病床的合理安排眼科病床的合理安排”解题思路解析解题思路解析 全国大学生数学建模竞赛开始于全国大学生数学建模竞赛开始于19941994年。它是教育部主办的两项规年。它是教育部主办的两项规模最大的大学生课外科技活动。模最大的大学生课外科技活动。数模竞赛每年一次数模竞赛每年一次电子竞赛两年一次电子竞赛两年一次其他的竞赛均由行业协会或各部委其他的竞赛均由行业协会或各部委主办。主办。数模竞赛由各赛区组织。全国由数模竞赛由各赛区组织。全国由3030各赛区各赛区。分本科组与专科组进行。分本科
2、组与专科组进行。20092009年全国参赛队年全国参赛队1500015000多队。多队。江苏赛区与北京赛区江苏赛区与北京赛区20092009年共有来自年共有来自5555所所本科院校本科院校904904队,队,2323所专科学校所专科学校132132队参赛队参赛。参赛队参赛队5050以上:东大、矿大、南大以上:东大、矿大、南大 4040队以上队以上 解放军理工、南邮、河海、信大解放军理工、南邮、河海、信大 全国全国1 1等奖等奖1.8%1.8%左右,全国二等奖左右,全国二等奖7%7%左右。左右。省省1 1等奖等奖5%5%,2 2等奖等奖10%10%,3 3等奖等奖13%13%左右。左右。各校通过
3、周末讲座、暑假培训提高竞赛技能各校通过周末讲座、暑假培训提高竞赛技能。问题与背景问题与背景 见附件见附件 源数据信息源数据信息 门诊情况门诊情况 (人数与时间)(人数与时间)入院情况入院情况 手术情况手术情况 出院情况出院情况 评阅原则 本题解题方法比较多,结果也未必一致,评阅时主要以解题过程中体现出的对问题的理解程度与建模能力为依据。该问题是随机问题,主要是统计方法 寻找统计规律(主要指随机变量之间的联 系,随机变量分布,随机事件的概率或频率 等。)本题特点:信息全,数据量不大,开放性强,问题明确,任务多,可以参考文献少。建模准备 数据分析与检验数据分析与检验门诊情况门诊情况 等待入院等待入
4、院 等待手术等待手术 术后恢复术后恢复原方案先到先服务原方案先到先服务 病床有效利用率不高病床有效利用率不高病人到达人数服从分布(画频数(率)直方图病人到达人数服从分布(画频数(率)直方图),分布检验,分布参数提取(重要信息),分布检验,分布参数提取(重要信息);各类就诊病人占总就诊病人比例各类就诊病人占总就诊病人比例 各类病人每天出院情况各类病人每天出院情况 白内障病人入院后白内障病人入院后1-2天即可做手术,但是统天即可做手术,但是统计该指标得白内障单眼病人需要等待计该指标得白内障单眼病人需要等待2.38天,天,白内障双眼病人需要等待白内障双眼病人需要等待3.63天,远大于天,远大于1-2
5、天天。拟合优度法检验(卡方检验或拟合优度法检验(卡方检验或F检验)检验)术后住院时间分布:正态分布术后住院时间分布:正态分布 分布分布 先验分布(非重要信息);先验分布(非重要信息);估计估计5类病人住院时间的均值与方差。检验。类病人住院时间的均值与方差。检验。术前住院时间过长,关键信息。术前住院时间过长,关键信息。理论分析认为:每天就诊人数与出院人数基本理论分析认为:每天就诊人数与出院人数基本相等,可以做到队长不变的理想情况。相等,可以做到队长不变的理想情况。原方案的分析原方案的分析 先门诊先入院,不存在插队情况,对各类先门诊先入院,不存在插队情况,对各类病人都公平。病人都公平。术前等待时间
6、长,入院等待时间长。方案术前等待时间长,入院等待时间长。方案不合理的地方。不合理的地方。第第 一一 问问评价指标可分两类:效率指标和公平评价指标可分两类:效率指标和公平性指标,这两个指标可以有各种不同性指标,这两个指标可以有各种不同的定义,其合理性是评分依据。的定义,其合理性是评分依据。效率指标效率指标平均术前住院时间,或平均术前住院时间,或病床有效利用率。也可以是等待入院病床有效利用率。也可以是等待入院时间等。时间等。不必要引入过多实质上相同的指标。不必要引入过多实质上相同的指标。公平性指标公平性指标“插队人数比例插队人数比例”。(容易被忽略也可以有不同理解)(容易被忽略也可以有不同理解)原
7、方案的唯一准则,自然有其合理性。原方案的唯一准则,自然有其合理性。第第 二二 问问 本问主要考核能否给出一个相对合本问主要考核能否给出一个相对合理的病床安排模型,主要目标为:提理的病床安排模型,主要目标为:提高病床有效利用率以及提高公平度。高病床有效利用率以及提高公平度。就提高病床有效利用率而言,就提高病床有效利用率而言,病人术后住院时间是一个不可优化的病人术后住院时间是一个不可优化的量,所以只能在术前等待时间上作文量,所以只能在术前等待时间上作文章。经对问题的分析可知:对白内障章。经对问题的分析可知:对白内障病人的入院时间加以限制成为提高效病人的入院时间加以限制成为提高效率的必然选择。率的必
8、然选择。本问主要解决方法是仿真方法,大致可分本问主要解决方法是仿真方法,大致可分为为“先仿真,再优化先仿真,再优化”与与“边仿真,边优化边仿真,边优化”两类,前者是先确定若干种住院规则,然后根两类,前者是先确定若干种住院规则,然后根据仿真统计结果选出较优规则;后者是先确定据仿真统计结果选出较优规则;后者是先确定一个优化原则,然后在仿真时,对每一个排队一个优化原则,然后在仿真时,对每一个排队病人按照该优化原则决定住院先后。显然后者病人按照该优化原则决定住院先后。显然后者要更好一些。要更好一些。优化的入院规则优化的入院规则 规则一:按照病人的可入院时间,在确定规则一:按照病人的可入院时间,在确定一
9、周中某天哪个病人入院时,病人采用服一周中某天哪个病人入院时,病人采用服务制(白内障除外);务制(白内障除外);规则二:优先排急症病人;规则二:优先排急症病人;规则三:白内障病人的术前住院时间为规则三:白内障病人的术前住院时间为112 2天;视网膜疾病、青光眼两类病人术前住天;视网膜疾病、青光眼两类病人术前住院时间为院时间为2-32-3天;外伤手术有空床即安排入天;外伤手术有空床即安排入院,第二天手术;院,第二天手术;规则四:选择一周为一周期;规则四:选择一周为一周期;规则五:周六、周日除了外伤病人以外,优先规则五:周六、周日除了外伤病人以外,优先安排白内障(双眼)病人入院安排白内障(双眼)病人
10、入院 。根据以上准则及原来的方案通过计算机模拟给根据以上准则及原来的方案通过计算机模拟给出一段时间的模拟,分别计算评价指标,说明出一段时间的模拟,分别计算评价指标,说明方案的优劣。方案的优劣。各类病人的平均住院时间缩短各类病人的平均住院时间缩短1-21-2天天 ,公平性,公平性下降下降5%5%左右(模拟值)。左右(模拟值)。仿真注意事项 如何产生就诊人的队列(计算插队时用)如何处理出院分布 如何根据出院情况及入院准则安排入院 计算总等待人数 计算插队人数 计算床位有效利用率第第 三三 问问 此问希望学生给出一个满足一定置信度(例如:此问希望学生给出一个满足一定置信度(例如:90%90%)的预约
11、住院时间区间,区间长度越短越好。)的预约住院时间区间,区间长度越短越好。一种自然的想法是通过同类病人术后住院时间的一种自然的想法是通过同类病人术后住院时间的概率分布从理论上得到这一区间,但这样做的一个困概率分布从理论上得到这一区间,但这样做的一个困难是已处于术后住院状态的该类病人的继续住院时间难是已处于术后住院状态的该类病人的继续住院时间不服从同一分布,从而将该类病人(含已住院与未住不服从同一分布,从而将该类病人(含已住院与未住院)的预计住院时间求和后的随机变量的分布不知道。院)的预计住院时间求和后的随机变量的分布不知道。设当前时刻为设当前时刻为T0T0,当前排队人数为,当前排队人数为P P,
12、预计,预计住住 院时刻为院时刻为T T,病人每日出院人数的统计平均,病人每日出院人数的统计平均值为值为,则,则011PTT 设一个已出院病人实际住院时刻为设一个已出院病人实际住院时刻为T1T1,通过仿真统计,通过仿真统计一段时间内所有病人的一段时间内所有病人的1TT根据根据90%90%的置信度确定两个阈值的置信度确定两个阈值 ,(0)从而得到当前病人的预计住院时间区间为从而得到当前病人的预计住院时间区间为,TT。现有等待人数 条件下第第 四四 问问 模拟与计算 模拟一、三,二、四方案,三、五方案 计算三种方案的两个评价指标值,说明方 案的优劣。结果:一、三方案较差,三、五方案效率最高,公平性不
13、好,二、四方案二者兼而有之。第第 五五 问问主要有三种模型:主要有三种模型:一、仿真计算模型:床位分配只有有限种组合情形,可一、仿真计算模型:床位分配只有有限种组合情形,可以通过穷举仿真方法得到各种组合的评价指标统计值,再以通过穷举仿真方法得到各种组合的评价指标统计值,再比较得到最佳组合方案。此方案计算量较大,且模型通用比较得到最佳组合方案。此方案计算量较大,且模型通用性有一定局限。性有一定局限。二、服务强度平衡模型:当各分类系统的服务强度相等二、服务强度平衡模型:当各分类系统的服务强度相等时,效果最佳。可以通过建立条件极值模型,利用拉格朗时,效果最佳。可以通过建立条件极值模型,利用拉格朗日方
14、法证明这一结论。日方法证明这一结论。三、排队论近似模型:通过经验公式将系统近似为系统,三、排队论近似模型:通过经验公式将系统近似为系统,然后利用排队论的现成结论写出优化模型。然后利用排队论的现成结论写出优化模型。比如:(比如:()51iiMinZT51iiM inZT 51/,1/iiiiiiiiijjumututT 近似模型的参数确定较困难(如各类病人 的入院等待时间)。需要通过仿真实现。最好用仿真模型综综 合合 评评 述述 数据检验是本问题中必须做的,但被许多参赛数据检验是本问题中必须做的,但被许多参赛队所忽略,从而意外成为区分点之一。队所忽略,从而意外成为区分点之一。公平性指标被许多人忽
15、略,反映出对问题本质公平性指标被许多人忽略,反映出对问题本质认识不到位。效率指标也可以适当精简。认识不到位。效率指标也可以适当精简。优化模型的多样性是本题目最大的亮点,涌现优化模型的多样性是本题目最大的亮点,涌现许多意料之外的解法。许多意料之外的解法。入院时间的预测区间完成不好,大部分队没有入院时间的预测区间完成不好,大部分队没有置信度概念,不少队给出的区间与当前队长无置信度概念,不少队给出的区间与当前队长无关。关。第五问理论深度较深,完成得好的不多,第五问理论深度较深,完成得好的不多,存在模型与求解存在模型与求解“两张皮两张皮”的现象,以及捏造的现象,以及捏造数据结果的现象,反映出一些学风问题,计算数据结果的现象,反映出一些学风问题,计算能力的欠缺也是一个原因。能力的欠缺也是一个原因。