1、 复习大题中国商业联合会数据分析专业委员会数据分析师认证培训课程 主观题1一元回归复习题:主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图主观题1一元回归复习题:(1)绘制散点图,并计算相关系数,说明二者之间的关系;步骤:展示分析-散点图-计算相关系数ExcelDatahoop相关系数的值介于-1与+1之间,即-1r+1。当r0时,表示两变量正相关,当r0时,表示两变量为负相关。当|r|=1时,表示 两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两变量间无线性相关关系。r仅仅是x与
2、y 之间线性关系的一个度量,它不能用于描述非线性关系。r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。当r0.8时,可视为高度相关;当0.5r0.8时,可视为中度相关;当0.3r0.5时,视为低度相关;当r0.3时,说明两个变量之间的相关程度极弱。人均人均GDP与人均消费水平间的相关系数为与人均消费水平间的相关系数为0.998,说明两者间存在强烈的正相关关系。,说明两者间存在强烈的正相关关系。主观题1一元回归复习题:(2)人均GDP作自变量,人均消费水平作因变量,求出估计的回归方程,并解释回归系数的实际意义;Excel:xy309.0693.734利用系数表中的结果
3、,回归方程为利用系数表中的结果,回归方程为 ,其含义是人均,其含义是人均GDP每增加每增加1元,人均消费水平增加元,人均消费水平增加0.309元。元。主观题1一元回归复习题:(3)计算判定系数,并解释其意义;R2:判定系数/拟合优度(Y的总变动由X带来的有多少)Excel:判定系数是判定系数是0.996,说明方程解释人均消费,说明方程解释人均消费水平变化的水平变化的99.6%可以由人均可以由人均GDP的变化来的变化来解释。解释。主观题1一元回归复习题:(4)检验回归方程线性关系的显著性(a=0.05);F检验:回归线性关系检验(P值)T检验:回归系数检验(X对y的影响)小于拒绝,大于不拒绝:原
4、假设,假设Excel:系数表中的系数表中的Sig./P-value值值a,说明回,说明回归方程的线性关系显著性。归方程的线性关系显著性。主观题1一元回归复习题:(5)如果某地区的人均GDP为5000元,预测其人均消费水平;步骤:预测分析Excel输入公式得出结果人均人均GDP为为5000元时,人均消费水平为元时,人均消费水平为2278.107元元主观题1一元回归复习题:(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。人均消费水平人均消费水平95%的置信区间为的置信区间为1990.749,2565.464和预测区间为和预测区间为1580.463,2975.75。主观题2
5、多元回归复习题:主观题2多元回归复习题:分析主观题2多元回归复习题:分析R2:判定系数/拟合优度(Y的总变动由X1、X2、X3带来的有多少,每增加一个变量,不管相不相关,拟合优度就会提高,因此要调整拟合优度)F检验:回归线性关系检验(概率P值/sig)原假设H0:所有系数都为0 H1:至少一个不为0T检验:回归系数检验(X1、X2、X3对y的各自影响)多重共线性-主观题2多元回归复习题:分析 主观题2多元回归复习题:分析去掉X1主观题2多元回归复习题:分析单独X2单独X3主观题2多元回归复习题:分析 销售价格的预测值以及销售价格的预测值以及95%的置信区间和预测区间见上表。的置信区间和预测区间
6、见上表。回归方程为回归方程为21163.0961.0653.11xxy去掉的原则之一:模型对数据较好的拟合,如果去掉后拟合数据差异较大就不合适去掉主观题3哑变量回归复习题:主观题3哑变量回归分析:回归方程为回归方程为 y=732.06+111.22x1+458.68x2男性职工的平均月薪是男性职工的平均月薪是732.06+458.68=1191,女性职工的平均月薪是,女性职工的平均月薪是732.06,男性职工的平均月薪与女性职工的平均月薪之间的差值是男性职工的平均月薪与女性职工的平均月薪之间的差值是 458.68。工龄每增加工龄每增加1年,男性或女性月薪的平均增加值年,男性或女性月薪的平均增加
7、值111.22。主观题4 已知某厂家的产量和生产费用数据,如下表,请根据生产费用和产量数据进行如下分析:(所有结果保留两位小数)(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。(2)根据回归分析结果,写出判定系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2)(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。主观题4(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计
8、回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。:通过线性回归分析结果可以看出,线性回归方程Y=aX+b检验结果F检验p值=3.06*10-9,X回归系数检验结果p=3.06*10-9,均小于0.05,因此F检验和T检验均通过,所以可以做线性回归,根据结果列出回归方程为Y=5.12X+276.24。其中X的系数为5.12,截距为276.24,因此可以看出产量增加1,,生产费用增加5.12。得分点:列出F检验的p值和X系数检验的p值;列出回归方程Y=5.12X+276.24;解释含义主观题4(2)根据回归分析结果,写出判定
9、系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2):根据回归结果可以看出调整后的R2=0.86,R2代表模型的拟合度,它越接近1代表拟合度越好,根据此模型的R2的值可以看出模型拟合度良好。得分点:列出R2的值;解释含义主观题4(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。根据题目可知,当X=180时,Y=5.12*180+276.24=1197.84Datahoop预测分析:主观题5一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运费作出预测。该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了
10、15个路程大致相同、而货物类型不同的运输费用数据 (1)写出运输费用与货物类型之间的线性方程。(2)对模型中的回归系数进行解释。(3)检验模型的线性关系是否显著(a=0.05)主观题5(1)写出运输费用与货物类型之间的线性方程。回归方程:y=4.543+7.082x主观题5(2)对模型中的回归系数进行解释。回归方程:y=4.543+7.082x 解释:“易碎品”的预期运输费用比非易碎品的预期运输费用多7.082元(3)检验模型的线性关系是否显著(a=0.05)p0.05,所以通过检验主观题6 某厂生产甲乙两种产品,都经过A、B两个工序,分别有A1、A2和B1、B2两台设备。甲产品可在A、B任何
11、一种设备上加工,乙产品可在工序A的任一种设备上加工,但B工序只能在B1设备上加工。单位产品的工序加工时间、原材料费用、售价,以及各设备的单位时间加工费用、设备有效使用时间如下表所示。要求:合理安排生产计划,使该厂获利最大。主观题6 1.列生产计划方案:变量设置:甲产品的四种方案A1B1、A1B2、A2B1、A2B2的产量分别为X11、X12、X21、X22;乙产品的两种方案A1B1、A2B1的产量分别为Y11、Y212.目标函数:获利=收入-成本(两项:原材料和设备加工费)收入-原材料成本(1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21)设备加工费
12、0.05*(x11+x12)*5+y11*10)+0.03*(x21+x22)*7+y21*9)+0.06*(x11+x21)*6+(y11+y21)*8)+0.11*(x12+x22)*4max(1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21)-0.05*(x11+x12)*5+y11*10)-0.03*(x21+x22)*7+y21*9)-0.06*(x11+x21)*6+(y11+y21)*8)-0.11*(x12+x22)*4主观题6规划结果:X11、X12、X21、X22分别为0、965、0、785,Y11、Y21分别为0、500,总利润
13、为1023.9元。约束条件:5*(x11+x12)+10*y11=60007*(x21+x22)+9*y21=100006*(x11+x21)+8*(y11+y21)=40004*(x12+x22)=0,且为整数主观题7 某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。主观题7 某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。主观题7 某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PE
14、RT图和线性规划的方法求解下面的问题。主观题8 假设一个地区的总悬浮微粒(TSP)来源于当地的三个工厂。若工厂1 和工厂2 燃煤TSP 排放因子为95kg/t(煤),工厂3 的TSP 排放因子为85kg/t(产品)。工厂3 产量为250000 t(产品)/a,工厂1 和工厂2 的燃煤量分别为400,000 t/a 和300,000t/a,为了满足环境质量要求,TSP 最大允许排放量为17,600,000kg/a,各种除尘设备效率和各种除尘方法的费用如下表所示:要求:以最小的治理费用达到环境目标。主观题8 变量设置:工厂1四种方案X10X11X14X15费用分别为C100.0,C111.0,C142.0,C152.8,工厂2四种方案X20X21X24X25费用分别为C200.0,C221.4,C242.2,C253.0,工厂3五种方案X30X31X32X33X34费用分别为C300.0,C311.1,C321.2,C331.5,C343.0目标函数:min=1.0 x11+2.0X14+2.8X15+1.4X21+2.2X24+3.0X25+1.1X31+1.2X32+1.5X33+3.0X34