1、1. 数据分析模型数据分析模型怎样表述、解读、分析、发现规律?怎样表述、解读、分析、发现规律?现实生活中的现实生活中的数据数据:数量繁多数量繁多、杂乱无章杂乱无章. . 找出有代表性的数值或者利用图形表述,分析、找出有代表性的数值或者利用图形表述,分析、 解释相关的实际现象解释相关的实际现象. . 利用统计方法通过大量数据探索、发现研究对象利用统计方法通过大量数据探索、发现研究对象 的数量规律的数量规律. . (本书提高篇第(本书提高篇第7章)章)1.1 薪金到底是多少薪金到底是多少1.2 评选举重总冠军评选举重总冠军1.3 估计出租车的总数估计出租车的总数1.4 解读解读CPI1.5 NBA
2、赛程的分析与评价赛程的分析与评价全国全国 大学生数学建模竞赛大学生数学建模竞赛2008年年D题题1. 数据分析模型数据分析模型1.1 薪金到底是多少薪金到底是多少日常生活中遇到日常生活中遇到的的数据数据:一个班一个班的的考试成绩及按成绩的排考试成绩及按成绩的排 名名一个年级全部男同学的身高一个年级全部男同学的身高超市中各个品牌牙膏一个月的销量超市中各个品牌牙膏一个月的销量公司里每位职工一个月的薪金公司里每位职工一个月的薪金用用几几个数简明地个数简明地表示表示一组数据一组数据整体整体的大小的大小.n个数据的代表数个数据的代表数平均数平均数 n个数据的算术平均值个数据的算术平均值.n 个数据的个数
3、据的代表数代表数中位数中位数 n个数据从小到大个数据从小到大(或从大到小)(或从大到小)排序排序 位于正中的数位于正中的数.若若n为偶数,取位于正中的为偶数,取位于正中的2个数的平均值个数的平均值.众数众数 n个数据中出现次数最多的那个个数据中出现次数最多的那个(或几个或几个)数数.3个个代表数代表数反映一组数据反映一组数据整体整体大小的大小的不同侧面不同侧面. 某公司某公司100位位职工的月薪职工的月薪/千元千元月薪月薪402520151086543人数人数126812171824102 薪金到底是多少薪金到底是多少平均数平均数 :8.6千元千元.中位数中位数 :6千元千元(第第50、51人
4、都是人都是6000元元).众数众数 : 5千元千元(5千元千元的人数最多)的人数最多).公司高层对外宣传公司高层对外宣传.工会干部为职工争取福利工会干部为职工争取福利.税务部门调查个人所得税的起征点税务部门调查个人所得税的起征点.3个代表数的特点个代表数的特点平均数平均数 平等利用每一数据的信息,反映数据整体平等利用每一数据的信息,反映数据整体 大小大小;有方便的计算公式,应用最广有方便的计算公式,应用最广.受少数特大或特小数据影响,受少数特大或特小数据影响,会会失去代表性失去代表性.中位数中位数 只取决于按大小排列的位置,不受特大或只取决于按大小排列的位置,不受特大或 特小数据影响,能反映数
5、据的中等水平特小数据影响,能反映数据的中等水平.未未充分利用信息充分利用信息; 数据量大时计算较繁数据量大时计算较繁.众数众数 常作为选择常作为选择 “最多最多” , “最佳最佳”的依据的依据.未未充分利用信息充分利用信息; “并列第一并列第一”时时无法无法做做唯一抉择唯一抉择.如何选用代表数与与10年前同龄男生身高作对比年前同龄男生身高作对比, 估计增长量估计增长量.数据:数据:某高三年级全部男同学的身高某高三年级全部男同学的身高.定制校服尺寸的参考定制校服尺寸的参考.数据:数据:生产小组生产小组15个工人每人一天生产零件的数目个工人每人一天生产零件的数目与其他小组比较,作为评选先进的参考与
6、其他小组比较,作为评选先进的参考.制定标准日产量,使多数人能超产制定标准日产量,使多数人能超产.平均数平均数众数众数平均数平均数中位数中位数数据数据:班上班上20名学生一次考试成绩名学生一次考试成绩:15人人80分,分, 2人人90分,分,1人人10分,分,1人人15分,分,小李小李75分分.如何选用代表数与其他班级或本班以前成绩对比与其他班级或本班以前成绩对比.小李衡量自己小李衡量自己的的标准标准.其他代表数其他代表数平均分平均分74分分中位数中位数80分分高于平均分高于平均分! 倒数第倒数第3名名! 跳水比赛的评分标准跳水比赛的评分标准7位裁判位裁判的的分数去掉一个最高分和一个最低分,剩下
7、分数去掉一个最高分和一个最低分,剩下5个分数个分数的的总和乘以动作难度系数,为最后得分总和乘以动作难度系数,为最后得分.中位数和平均数的结合中位数和平均数的结合哪种解读更有道理哪种解读更有道理 某股份制公司某股份制公司50名职工和名职工和5位股东近位股东近3年的利润分配年的利润分配年份年份职工薪金总额职工薪金总额/万元万元股东分红总额股东分红总额/万元万元201130010020124001502013500200职工薪金职工薪金股东分红股东分红5004003002001002011 2012 2013a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2
8、012 2013b. 增长率增长率/% 职工职工薪金薪金股东股东分红分红403020102011 2012 2013c.人人均均/(万元万元/人人) 公司老板:公司老板:职职工薪金比股东工薪金比股东分红增长得更分红增长得更多、更快,可多、更快,可谓有福同享谓有福同享.哪种解读更有道理哪种解读更有道理 工会负责人工会负责人:2013年职工薪金年职工薪金增长到增长到167%,股东分红增长到股东分红增长到200%,应更顾,应更顾及职工利益及职工利益.职工职工:与股东与股东人人均分红相比,均分红相比,职工职工人人均薪金均薪金增长得太慢,增长得太慢,呼吁大幅度增呼吁大幅度增加职工的薪金加职工的薪金.职工
9、薪金职工薪金股东分红股东分红5004003002001002011 2012 2013a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2012 2013b. 增长率增长率/% 职工职工薪金薪金股东股东分红分红403020102011 2012 2013c.人人均均/(万元万元/人人) 哪种解读更有道理哪种解读更有道理 职工薪金职工薪金股东分红股东分红5004003002001002011 2012 2013 a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2012 2013 b. 增长率增长率/%职工薪金均值职
10、工薪金均值股东分红均值股东分红均值403020102011 2012 2013 c. 均值均值/(万元万元/人人)k=0,1,2 (2011, 2012, 2013)xk职工薪金总额职工薪金总额, yk股东分红总额股东分红总额xk斜率斜率大于大于yk斜率斜率yk/y0斜率斜率大于大于xk/x0斜率斜率斜率相差斜率相差5倍倍职工薪金职工薪金增长快增长快股东分红股东分红增长快增长快股东股东人人均分红增长快均分红增长快数值随时间的变化可以用绝对增长数值随时间的变化可以用绝对增长或或相对增长相对增长表示表示, 二者说明二者说明同同一问题的不同侧面一问题的不同侧面.小结与评注小结与评注同样的一组数据可以
11、有同样的一组数据可以有不同的表述和解读不同的表述和解读办法办法,取决于取决于要说明什么问题要说明什么问题,达到什么目的达到什么目的.3个常用的代表数个常用的代表数:平均数、中位数和众数平均数、中位数和众数,具有具有各自各自的特点和用法的特点和用法.举重举重1.2 评选举重总冠军评选举重总冠军依靠运动员全身力量完成依靠运动员全身力量完成的体育项目的体育项目按照运动员体重划分按照运动员体重划分级别级别进行比赛进行比赛.赛艇赛艇拳击拳击摔跤摔跤每个级别都每个级别都有有一个一个冠军冠军.能评选出一个能评选出一个“总冠军总冠军”吗?吗?56kg, 62kg, 69kg, 77kg, 85kg, 94kg
12、, 105kg, 105kg以上以上. 1.2 评选举重总冠军评选举重总冠军男子举重比赛按运动员体重男子举重比赛按运动员体重 (上限上限)分为分为8个级别个级别:问题问题每个级别设每个级别设3个项目:抓举、挺举个项目:抓举、挺举、总成绩总成绩.每个级别每个级别、每个项目都产生、每个项目都产生一个冠军一个冠军.同一项目同一项目 (如抓举如抓举) 的的8个冠军个冠军中中怎样怎样选出选出“总冠军总冠军”?不同级别冠军成绩不同级别冠军成绩按体重按体重 “折合折合”到到某个标准级别,某个标准级别,比较比较折合成绩折合成绩,选出最高的作为,选出最高的作为总冠军总冠军.1.2 评选举重总冠军评选举重总冠军问
13、题分析问题分析比赛比赛产生产生各级别冠军成绩的各级别冠军成绩的实际值实际值建立体重与举重成绩的建立体重与举重成绩的数学模型数学模型计算各级别冠军举重成绩的计算各级别冠军举重成绩的理论值理论值计算实际值与理论值的计算实际值与理论值的比值比值构造一个简单、合适的指标作为构造一个简单、合适的指标作为折合成绩折合成绩各级别冠军折合成绩最各级别冠军折合成绩最高的高的为为总冠军总冠军数据收集数据收集利用举重比赛的利用举重比赛的世界纪录世界纪录建立建立数学模型数学模型.62 kg级级抓举抓举153 kg石智勇(中国)石智勇(中国)2002.6.28世界大学生举重锦标赛世界大学生举重锦标赛挺举挺举182 kg
14、乐茂盛(中国)乐茂盛(中国)2002.10.2第第14届亚洲运动会届亚洲运动会总成绩总成绩 327 kg金恩国(朝鲜)金恩国(朝鲜)2012.7.31伦敦第伦敦第30届奥运会届奥运会69 kg级级抓举抓举165 kg马尔科夫(保加利亚)马尔科夫(保加利亚)2000.9.20悉尼第悉尼第27届奥运会届奥运会挺举挺举198 kg廖辉廖辉(中国)(中国)2013.10.23 2013年世界举重锦标赛年世界举重锦标赛总成绩总成绩 358 kg廖辉(中国)廖辉(中国)2013.10.23 2013年世界举重锦标赛年世界举重锦标赛级别级别项目项目纪录纪录纪录保持者纪录保持者日期日期比赛名称比赛名称多年积累
15、下来的世界记录与某一次比赛成绩相比,多年积累下来的世界记录与某一次比赛成绩相比,更能避免偶然性更能避免偶然性.不同级别成绩的差别基本上由运动员体重决定不同级别成绩的差别基本上由运动员体重决定.不掌握创造记录的运动员的实际体重不掌握创造记录的运动员的实际体重.因为因为体重越大、举得越重,比赛时运动员体重体重越大、举得越重,比赛时运动员体重都会调整到非常接近各级别的上限都会调整到非常接近各级别的上限.105 kg以上级未设上限,只在其余以上级未设上限,只在其余7个级别中选总冠军个级别中选总冠军. 数据收集数据收集利用举重比赛的利用举重比赛的世界纪录世界纪录建立建立数学模型数学模型.用用每个级别的每
16、个级别的上限上限代表运动员的实际体重代表运动员的实际体重.世界记录与体重数据世界记录与体重数据的的散点图散点图数据分析数据分析大致呈线性关系大致呈线性关系大级别成绩的增加变慢大级别成绩的增加变慢线性关系有所改进线性关系有所改进幂函数幂函数(幂次小于幂次小于1)可能更合适可能更合适556065707580859095100105110100150200250300350400450 x 抓举+ 挺举* 总成绩世世界界记记录录体重体重普通坐标普通坐标1.71.751.81.851.91.9522.12.22.32.42.52.62.7x 抓举+ 挺举* 总成绩世世界界记记录录体重体重对数坐标对数坐
17、标建立举重建立举重总成绩总成绩y与与运动员运动员体重体重w的的数学数学模型模型模型模型建立建立模型模型1 线性模型线性模型 最小二乘法编程计算最小二乘法编程计算 k = 2.7039-60k 430/160= 2.69估算估算线性模型线性模型-60-40-20020406080100120050100150200250300350400450wyyw430160模型模型2 幂函数模型幂函数模型 运动生理学运动生理学确定幂函数的幂次确定幂函数的幂次举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型s 肌肉截面积肌肉截面积l 身体尺寸身体尺寸最小二乘法编程计算最小二乘法编程计算 k =
18、20.4711幂函数模型幂函数模型 14151617181920212223300320340360380400420440w2/3 yyw2/3模型模型3 幂函数改进模型幂函数改进模型 举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型最小二乘法最小二乘法举重过程中力量的损失及身体尺寸的变化举重过程中力量的损失及身体尺寸的变化.50名顶尖运动员成绩名顶尖运动员成绩的的统计分析统计分析幂函数幂函数改进改进模型模型 非肌肉部分举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型5060708090100110300350400450线性模型线性模型506070809010011
19、0250300350400450500幂函数模型幂函数模型 5060708090100110250300350400450幂函数幂函数改进改进模型模型 级别级别总成绩纪录总成绩纪录线性模型线性模型幂函数模型幂函数模型幂函数改进模型幂函数改进模型56 kg级级305 kg313.6486 (-2.76%)299.6405 (1.79%)298.2689 (2.26%)62 kg级级327 kg329.8718 (-0.87%)320.6784 (1.97%)324.3317 (0.82%)69 kg级级358 kg348.7988 (2.64%)344.3827 (3.95%)350.2363
20、(2.22%)77 kg级级379 kg370.4298 (2.58%)370.5121 (2.56%)375.7952 (1.12%)两个幂函数模型比线性模型改进两个幂函数模型比线性模型改进不大不大. .1.71% 2.32% 1.47%总平均误差总平均误差评选总冠军评选总冠军wi (i=1, 2, , 7) 从轻到重从轻到重7个级别个级别的的体重体重(上限上限)线性模型线性模型幂函数模型幂函数模型 幂函数幂函数改进改进模型模型 各级别冠军的各级别冠军的理论成绩理论成绩yi 一次比赛中各级别冠军的一次比赛中各级别冠军的实际成绩实际成绩级别级别i冠军在评选总冠军中冠军在评选总冠军中实力实力以以
21、线性模线性模型型为例为例评选总冠军评选总冠军任取级别任取级别i=4 (w4=77kg级级)为为标准标准使使 z4=y4与与实力实力成正比的成正比的指标指标按按7个级别冠军的折合成绩排名,第一者为个级别冠军的折合成绩排名,第一者为总冠军总冠军. 将体重折合成将体重折合成77kg级后级别级后级别i冠军的实际成绩冠军的实际成绩.折合成绩折合成绩模型中系数模型中系数k随世界纪录的刷新而改变随世界纪录的刷新而改变.评选总冠军评选总冠军折合成绩折合成绩线性模型线性模型幂函数模型幂函数模型 幂函数幂函数改进改进模型模型 评选评选2008年北京奥运会男子举重比赛年北京奥运会男子举重比赛总冠军总冠军 级别级别
22、冠军获得者冠军获得者总成绩总成绩折合成绩及名次折合成绩及名次线性模型线性模型幂函数模型幂函数模型幂函数改进模型幂函数改进模型56 kg级级龙清泉(中)龙清泉(中)292 kg344.8621(7) 361.0644 (5) 367.8969 (4)62 kg级级张湘祥(中)张湘祥(中)319 kg358.2213(6) 368.5729 (3) 369.6175 (3)69 kg级级廖辉(中)廖辉(中)348 kg369.5814(2) 374.4039 (1) 373.3957 (1)77 kg级级史才秀(韩)史才秀(韩)366 kg366.0000(3) 366.0000 (4) 366.
23、0000 (6)85 kg级级陆永(中)陆永(中)394 kg372.2621(1) 368.8735 (2) 371.7543 (2)94 kg级级伊利亚(哈)伊利亚(哈)406 kg361.1818(5) 355.4413 (6) 362.5143 (7)105 kg级级阿拉姆诺夫(白)阿拉姆诺夫(白)436 kg362.0121(4) 354.5581 (7) 367.7366 (5)69 kg级级廖辉(中)廖辉(中)348 kg369.5814(2) 374.4039 (1) 373.3957 (1)3个模型中都个模型中都只有一个只有一个以因子形式出现的以因子形式出现的系数系数k,可以
24、在可以在构造折合成绩构造折合成绩时消去时消去,便于评选便于评选总冠军总冠军.小结与评注小结与评注举重成绩与体重举重成绩与体重关系关系的数学模型的数学模型是评选总冠军是评选总冠军方法的基础方法的基础.通过世界纪录通过世界纪录数据观察数据观察和和机理分析机理分析分别分别建立建立线性模型、幂函数模型和幂函数改进模型线性模型、幂函数模型和幂函数改进模型.1.3 估计出租车的总数估计出租车的总数一些人喜欢一些人喜欢记驶过身旁记驶过身旁的的汽车汽车牌牌号号.两难境地的决策两难境地的决策与朋友打赌的与朋友打赌的“骰子骰子”共识共识:出现出现任何号码汽车的任何号码汽车的机会机会相同相同.随意记下驶过的随意记下
25、驶过的10辆出租车牌号:辆出租车牌号:0421, 0128, 0702, 0410, 0598, 0674, 0712, 0529, 0867, 0312估计这座城市出租车的总数估计这座城市出租车的总数.出租车牌号从某一个数字出租车牌号从某一个数字0101按顺序发放按顺序发放.1.3 估计出租车的总数估计出租车的总数问题分析问题分析0 x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x10个号码从小到大重新排列个号码从小到大重新排列. x0, x 区间内全部整数值区间内全部整数值 总体总体x1, x2, , x10 总体的一个总体的一个样本样本根据样本和根据样本和x0对总体
26、的对总体的x作出估计作出估计.起始号码起始号码(已知已知)终止号码终止号码(未知未知)出租车总数为出租车总数为 x-x0+1起始号码起始号码x0平移为平移为0001模型建立模型建立总体总体 全部号码全部号码0001, 0002, , x样本样本 总体中的总体中的n个号码从小到大排列个号码从小到大排列 x1, x2, , xn建立由建立由x1, x2, , xn估计估计x的模型的模型基本假定基本假定:每个每个xi 取自总体中任一号码的概率相等取自总体中任一号码的概率相等. x出租车总数出租车总数1.3 估计出租车的总数估计出租车的总数模型模型1 平均值模型平均值模型模型建立模型建立总数是样本均值
27、的总数是样本均值的2倍倍模型模型2 中位数模型中位数模型x0=1 x1 x2 x3 xn-1 xn xx1-1x-xn假定假定:样本的最小值与最大值在总体中对称样本的最小值与最大值在总体中对称.模型模型3 两端间隔对称模型两端间隔对称模型x1-1=x-xn模型模型4 平均间隔模型平均间隔模型把起始号码和样本排成数列:把起始号码和样本排成数列:1, x1, x2, , xn,相邻两数相邻两数有有n个间隔个间隔:x1 1, x2 x1 1, , xn xn-1 1n个间隔个间隔的的平均值平均值作为作为xn与与x间隔的估计间隔的估计模型模型5 区间均分模型区间均分模型将总体区间将总体区间1, x平均
28、分成平均分成 n 份份.每个小区间长度每个小区间长度假定假定:样本中每个样本中每个xi 都位于小区间的中点都位于小区间的中点.x xn应是小区间长度的一半应是小区间长度的一半计算与分析计算与分析第第1样本样本: 0321, 0028, 0602, 0310, 0498, 0574, 0612, 0429, 0767, 0212第第2样本样本:0249, 0739, 0344, 0148, 0524, 0284, 0351, 0089, 0206, 0327设设定定x0 =0001 模型模型1 模型模型2 模型模型3 模型模型4 模型模型5最大最大相差相差第第1样本样本8709267948438
29、07134第第2样本样本651610827812778217相差相差221316333129用用5个模型估计出租车总数个模型估计出租车总数x不合理不合理 (x = 651, 610 739)6516100739不稳定(相差大)不稳定(相差大)1. 平均值模型平均值模型2. 中位数模型中位数模型3. 两端间隔对称模型两端间隔对称模型4. 平均间隔模型平均间隔模型5. 区间均分模型区间均分模型计算与分析计算与分析用全部样本,有用全部样本,有统计依据统计依据数值模拟数值模拟样本估计结果与总体对比样本估计结果与总体对比, 评价各评价各个个模型模型.用用5个模型分别对个模型分别对每个每个样本估计总体样本
30、估计总体x.画画m个样本估计的个样本估计的x的直方图的直方图,分析分析x的分布的分布.给定总体给定总体1, 2, , x,x=1000从从总体总体中中取取n=10个数为一个样本个数为一个样本,共,共m=200个个样本样本对每个模型对每个模型计算计算m个样本估计的个样本估计的x的的平均值平均值、标准差标准差及平均值及平均值与真值与真值x=1000间间的误差的误差 模型模型1模型模型2模型模型3模型模型4模型模型5平均值平均值1023.21037.41010.01005.6962.3平均值误差平均值误差23.237.410.05.6-37.7标准差标准差170.1261.0126.390.987.
31、0 模型模型1模型模型2模型模型3模型模型4模型模型5平均值平均值986.5985.4980.8992.9950.1平均值误差平均值误差-13.5-14.6-19.2-7.1-49.9标准差标准差181.4271.1107.986.682.8数值模拟数值模拟第第1次次 模拟模拟第第2次次 模拟模拟总体总体x=1000,每个样本每个样本 n=10, m=200个个样本样本平均值误差平均值误差小小 标准差标准差大大标准差标准差小小平均值误差平均值误差大大 模型模型4 (平均间平均间隔模型隔模型)较优较优.5.690.9-7.186.650060070080090010001100120013001
32、4001500051015202530354045模型120040060080010001200140016001800051015202530354050060070080090010001100120013001400010203040506070模型2模型3663709755801847893939985103110770102030405060706356797237678118558999439871031010203040506070模型4模型5数值模拟数值模拟第第1 1次模拟的直方图次模拟的直方图左低右高的非对称型左低右高的非对称型左右对称左右对称型型模型模型中中起始号码已知起始
33、号码已知(平移至平移至1),限制了应用范围限制了应用范围.小结与评注小结与评注5个模型个模型中中平均值和中位数模型用平均值和中位数模型用到到一点统计一点统计,其他其他3个模型来自常识个模型来自常识, 后者后者竟然竟然较前者更优较前者更优.数值模拟数值模拟是是模型检验模型检验的重要方法的重要方法: 给定总体通给定总体通过模拟产生样本过模拟产生样本, 根据模型得到总体参数根据模型得到总体参数, 进行进行比较和评价比较和评价.问题:问题:哪些模型可以推广到起始号码未知哪些模型可以推广到起始号码未知的情况?的情况?与与“估计出租车的总数估计出租车的总数”相关的历史事实相关的历史事实二战中一支盟军二战中
34、一支盟军的的指挥部急需掌握德军指挥部急需掌握德军坦克的数量坦克的数量.盟军俘获了若干辆德军坦克,得到它们的盟军俘获了若干辆德军坦克,得到它们的序列号码序列号码.情报人员获知这支情报人员获知这支部队的部队的坦克号码坦克号码按顺序编排按顺序编排.以俘获的坦克号码为以俘获的坦克号码为样本样本,估计估计出坦克出坦克总量总量.英美情报机构通过捕获德军武器英美情报机构通过捕获德军武器的的序列编号,对军用序列编号,对军用轮胎、枪支、装甲车等众多装备的产量做出估计轮胎、枪支、装甲车等众多装备的产量做出估计.战后将估计值与从档案中得到的实际产量进行比较,战后将估计值与从档案中得到的实际产量进行比较,多数估计的多
35、数估计的误差在误差在10%以内以内!1.4 解读解读CPICPI (Consumer Price Index) 居民消费价格指数居民消费价格指数每月每月9日左右国家统计局日左右国家统计局发布上月全国发布上月全国CPI数据数据.反映购买消费品和服务项目时价格变动趋势的数字反映购买消费品和服务项目时价格变动趋势的数字.观察通货膨胀水平的重要指标观察通货膨胀水平的重要指标.从从数学建模的思路,按照数据分析方法解读数学建模的思路,按照数据分析方法解读CPI.按照时间顺序解读按照时间顺序解读CPI环比环比价格指数价格指数 以以上月为基期上月为基期进行对比进行对比消除季节变化和节日对价格的影响消除季节变化
36、和节日对价格的影响同比同比价格指数价格指数反映当前价格的波动反映当前价格的波动以以上年同月为基期上年同月为基期进行对比进行对比通常公布价格指数通常公布价格指数增长率增长率(%),方便方便了解价格上涨幅度了解价格上涨幅度2011.3环比增长率环比增长率-0.2%2011.2环比增长率环比增长率1.2%基期指数基期指数1002011.3同同比增长率比增长率5.4%环比指数环比指数101.2 (2011.1为为100)同同比指数比指数105.4 (2010.3为为100)环比指数环比指数99.8(2011.2为为100)月份月份 k123456789101112环环比比 (%) 1.0 1.2 0.
37、2 0.1 0.1 0.3 0.5 0.30.5 0.1 0.2 0.3全国全国2011年年CPI各月份各月份环比增长率环比增长率环比环比价格指数价格指数pk某年某年k月环比增长率月环比增长率(%)Pk 以上年以上年12月为基期月为基期, 本本年年k月月的的价格指数价格指数pk为正为正Pk上升上升, pk为负为负Pk下降下降pk涨幅回落涨幅回落Pk上升变缓上升变缓024681012-1-0.500.511.5pk(%)024681012100101102103104105Pk2011CPI环比环比月份月份k12345678910111220114.9 4.95.45.3 5.5 6.4 6.5
38、 6.2 6.1 5.54.24.1 20124.5 3.23.63.4 3.0 2.2 1.8 2.0 1.9 1.72.02.5qk某年某年k月同比增长率月同比增长率(%)同比同比价格指数价格指数全国全国2011, 2012年年CPI各月份各月份同同比增长率比增长率123456789101112123456720112012qk(%)2012年比年比2011年每月价年每月价格上涨的幅度明显减少格上涨的幅度明显减少.qk(j) j年年k月月同比同比指数指数环比环比价格指数价格指数与与同比同比价格指数价格指数的关系的关系pk(j) j年年k月月环比环比指数指数xk(j) j年年k月价格指数(以
39、月价格指数(以j-2年年12月为基期)月为基期)从从1月到月到k月以上年同一月以上年同一时期时期为基期进行对比为基期进行对比.累计累计价格指数价格指数月份月份k123456789101112同同比比 (%) 4.5 3.23.63.4 3.0 2.2 1.8 2.0 1.9 1.72.02.5累计累计(%) 4.5 3.93.83.7 3.5 3.3 3.1 2.9 2.8 2.72.72.6全国全国2012年年CPI各月份各月份同同比比增长率增长率和和累计累计增长率增长率第第k月的累计是月的累计是1月月至至k月同比的平均值月同比的平均值 (k=1,2,12)几几个月的价格指数个月的价格指数以
40、其各以其各个月价格指数的平均值个月价格指数的平均值度量度量.年年价格指数价格指数每年每年1至至12月同比的平均值月同比的平均值年年20032004200520062007200820092010201120122013 (%) 3.91.81.54.85.9-0.73.35.42.62.6 CPI100103.9 105.8 107.4 112.5 119.1 118.3 122.2 128.8 132.2 135.6全国全国2004年至年至2013年年CPI的增长的增长200320042005200620072008200920102011201220130246CPI年 增 长 率 (%)
41、20032004200520062007200820092010201120122013100110120130140CPI从从2003年到年到2013年年全国全国CPI增长增长35%每年与上年比较的增长率每年与上年比较的增长率按照分类结构解读按照分类结构解读CPI与与许多人许多人对物价的亲身感受有对物价的亲身感受有较大差距较大差距.近近10年年CPI平均平均年增长率不过年增长率不过3.5%.原因之一原因之一 :CPI由由国家统计局对全国居民家庭国家统计局对全国居民家庭衣食住行各类消费品和服务价格衣食住行各类消费品和服务价格综合加工综合加工得到得到.消费品和服务项目分消费品和服务项目分8大类大
42、类,约约700个代表品种个代表品种.权重权重根据居民家庭用于各种消费品和服务项根据居民家庭用于各种消费品和服务项目的开支占总消费支出的比重确定目的开支占总消费支出的比重确定.CPI由价格及其权重二者共同决定由价格及其权重二者共同决定.大类大类中类中类权重权重 (%)1食品食品 粮食、油脂、肉禽及其制品、水产品、蛋、粮食、油脂、肉禽及其制品、水产品、蛋、鲜菜、鲜果、液体乳及乳制品鲜菜、鲜果、液体乳及乳制品31.792烟酒及用品烟酒及用品烟草、酒烟草、酒3.493衣着衣着服装、鞋服装、鞋8.524家庭设备及维修家庭设备及维修服务服务 耐用消费品、家庭服务及加工维修耐用消费品、家庭服务及加工维修服务
43、服务5.645医疗保健个人用品医疗保健个人用品中药材及中成药、西药、医疗保健服务中药材及中成药、西药、医疗保健服务9.646交通和通讯交通和通讯交通工具、车用燃料及零配件、通讯工具、交通工具、车用燃料及零配件、通讯工具、通讯服务通讯服务9.957娱乐教育文化用品及娱乐教育文化用品及服务服务教育服务、文娱用耐用消费品及服务、文化教育服务、文娱用耐用消费品及服务、文化娱乐类、旅游娱乐类、旅游13.758居住居住建房及装修材料、住房租金、水、电、燃料建房及装修材料、住房租金、水、电、燃料17.22我国消费品和服务项目的类别及权重我国消费品和服务项目的类别及权重(2011年年)按照分类结构解读按照分类
44、结构解读CPI 居住次之居住次之上世纪上世纪80年代食品权重年代食品权重约约60%, 每次调整每次调整都下降都下降.随着人们生活水平的提高及消费结构的变化,随着人们生活水平的提高及消费结构的变化,权重每权重每5年、年、10年会有较大的调整年会有较大的调整.居住中并不包含居住中并不包含近年近年飞涨的购房支出,官方的飞涨的购房支出,官方的解释是购房属于投资而非消费解释是购房属于投资而非消费.按照分类结构解读按照分类结构解读CPI大类大类食品食品烟酒烟酒 衣着衣着 家庭家庭 医疗医疗 交通交通 教育教育 居住居住权重权重(%) 31.79 3.498.525.649.649.9513.75 17.2
45、2食品权重最大食品权重最大教育教育、娱乐娱乐第三第三vi 第第i大类价格指数大类价格指数v CPI总水平总水平wi 第第i大类权重大类权重v v的增长率的增长率vi vi的增长率的增长率wi ,vi ,vi 按照分类结构解读按照分类结构解读CPI每个月每个月CPI总水平的环比总水平的环比、同比指数同比指数v及及增长率增长率v 权重对权重对CPI总水平的大小有很大影响,引起总水平的大小有很大影响,引起对权重数值合理性的对权重数值合理性的研究研究和和讨论讨论.权重随时调整的具体情况不能为权重随时调整的具体情况不能为民众民众及时掌握及时掌握.利用每个月公布的利用每个月公布的CPI数据数据校核权重校核
46、权重是否变化是否变化、估算估算调整后的调整后的权重权重, 成为成为关注关注者者、研究者的课题研究者的课题.按照分类结构解读按照分类结构解读CPI对对权重权重的关注和讨论:的关注和讨论:几种校核与估算几种校核与估算权重权重的方法的方法1. 利用公布的利用公布的vi, wi计算计算v ,检查与公布的检查与公布的v是否相符是否相符月月份份食品食品v1烟酒烟酒v2衣着衣着v3家庭家庭v4医疗医疗v5交通交通v6教育教育v7居住居住v8总水平总水平v总水平总水平计算值计算值12.91.42.51.51.8-0.30.52.92.01.980226.01.12.11.61.80.22.02.83.23.1
47、65532.71.02.31.61.7-0.31.72.92.12.046644.00.82.51.61.5-1.11.52.92.42.343553.20.52.51.61.5-1.21.33.02.12.058564.90.32.31.51.4-0.71.43.12.72.640475.00.22.21.41.2-0.11.32.82.72.629584.702.21.41.201.22.62.62.488996.1-0.22.31.41.1-0.21.92.63.13.0022106.5-0.22.41.51.0-0.62.52.63.23.1766115.9-0.22.01.31.0-
48、0.52.82.63.02.9917124.1-0.42.11.40.9-0.12.92.82.52.50502013年年CPI同比分类和总水平增长率同比分类和总水平增长率如果如果计算值与公布的计算值与公布的v相符,不能说明所有的相符,不能说明所有的wi没有改变没有改变.如果如果稍有稍有不符,无法确认是否数字舍入误差所致不符,无法确认是否数字舍入误差所致.几种校核与估算几种校核与估算权重权重的方法的方法公布的指数只有公布的指数只有2位有效数字,对计算结果影响很大位有效数字,对计算结果影响很大.1. 利用公布的利用公布的vi, wi计算计算v ,检查与公布的检查与公布的v是否相符是否相符 2.
49、利用公布的利用公布的vi及其对及其对v的影响计算权重,的影响计算权重,检查检查与原与原有有的的wi是否相符是否相符几种校核与估算几种校核与估算权重权重的方法的方法2013年年1月食品同比上涨月食品同比上涨2.9%,影响总水平约,影响总水平约0.95%月月 123456789101112v12.96.02.74.03.24.95.04.76.16.55.94.1v0.951.980.881.331.051.591.611.541.982.111.921.33w10.328 0.330 0.326 0.336 0.328 0.325 0.322 0.328 0.325 0.325 0.325 0.
50、324由由2013.112公布的公布的v1和和v计算计算w1原原有有w1=0.3179 2. 利用公布的利用公布的vi及其对及其对v的影响计算权重,的影响计算权重,检查检查与原来的与原来的wi是否相符是否相符几种校核与估算几种校核与估算权重权重的方法的方法如果数据完整,可以对各个权重如果数据完整,可以对各个权重wi分别分别计算、校核计算、校核.由于公布数据的有效数字所限,舍入误差由于公布数据的有效数字所限,舍入误差对结果有不小影响对结果有不小影响.3. 利用公布的利用公布的n个月的个月的vi和和v作作拟合拟合,估计权重估计权重.vik, vk (i=1,8, k=1, n)用用MATLAB命令