1、统计学实践作业参数估计练习题1. 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据见book3.1表。求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119.4观测数36最大(1)6.4最小(1)0.5置信度(90.0%)0.453184918置信区间2.86348174
2、83.769851585平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119.4观测数36最大(1)6.4最小(1)0.5置信度(95.0%)0.544524915置信区间2.7721417513.861191582平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119
3、.4观测数36最大(1)6.4最小(1)0.5置信度(99.0%)0.730591706置信区间2.586074964.0472583732. 某机器生产的袋茶重量(g)的数据见book3.2。构造其平均重量的置信水平为90%、95%和99%的置信区间。 平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(90.0%)0.090932905置信区间3.238590
4、9053.420456714平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(95.0%)0.109978959置信区间3.219544853.439502769平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2
5、.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(99.0%)0.150015812置信区间3.1795079973.4795396223. 某机器生产的袋茶重量(g)的数据见book3.3。构造其平均重量的置信水平为90%、95%和99%的置信区间。 平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(90.0%)0.0250229
6、13置信区间3.2649770873.315022913平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(95.0%)0.030073895置信区间3.2599261053.320073895平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域
7、0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(99.0%)0.040375775置信区间3.2496242253.330375775资料整理练习题1. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见表book1.1。要求:(1)制作一张频数分布表;(2)绘制统计图,反映评价等级的分布。 计数项:xtxt汇总A14B21C32D18E15(空白)总计1002. 某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见bo
8、ok1.2。要求:(1)根据销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算出累积频数和累积频率;累计频数累计频率-104922.50%105-114945.00%115-1241172.50%125+11100.00%(2) 绘制统计图,反映分布情况。3. 北方某城市1月2月份各天气温的记录数据见book1.3。(1)对上面的数据进行适当的分组。(2)绘制统计图,说明该城市气温分布的特点.接收频率累积 %-102640.00%-51563.08%015
9、86.15%5593.85%104100.00%其他0100.00%说明:该城市气温在逐步回暖,整体偏冷。多变量资料整理练习题下面是有关“北京地区大学生掌上阅读状况调查”的部分题目,(1)性别:1男 2女(2)学级:1 大专 2 大一 3大二 4大三 5大四 6研一 7研二 8 博士生(3)月生活费:1 600元以下 2 6001000元 3 10001500元 4 15002000元 5 2000元以上(4)手机类型:1 低端机 2 中端机 3高端机 4智能机 5 其他(5)运营商:1 中国移动 2 中国联通 3中国电信 4中国网通被调查者对这5个题目的回答如数据表book1.8。1.分析不
10、同性别学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。2.分析不同学级的学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。3. 分析不同性别学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。4.分析不同学级的学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。求和项:手机类型q4手机类型q4性别q112345总计12266156240104942119221323615567总计331583694762510611由题可知,男生选择智能机的比较多,而女生选择高端机的比较多。求和项:手机类型q4手机类型q4学级12345总计1310344565
11、23165480153310521028852574640638852025314114681020966182160105718124869811总计331583694762510612专的孩子偏爱智能机大一孩子偏爱智能机大二孩子偏爱高端机大三孩子偏爱智能机大四孩子偏爱高端机研一孩子偏爱智能机研二孩子偏爱智能机博士生只有一人使用低端机求和项:运营商q5运营商q5性别q11234总计11356642052150766232总计285142644373男生偏爱中国移动 女生偏爱中国移动求和项:运营商q5运营商q5学级1234总计1161026235286337632311145432865483
12、43489635439720222811总计285142644374专到博都是选择中国移动的人最多,其次是中国联通,选择电信和网通的用户较少多元线性回归练习题1. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近8个月的销售额与广告费用数据见book7.1表。(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。检验回归方程的线性关系是否显著(a =0.05);检验各回归系数是否显著(a =0.05) 。SUMMARY OUTPUT回归统计Mult
13、iple R0.958663444R Square0.9190356Adjusted R Square0.88664984标准误差0.642587303观测值8方差分析dfSSMSFSignificance F回归分析223.4354077911.717703928.377768390.001865242残差52.0645922080.412918442总计725.5Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept83.230091691.57386895252.882478944.57175E-0879.1843327587.2
14、7585063电视广告费用 /万元2.2901836210.3040645567.5318993130.0006532321.5085607973.071806445报纸广告费用 /万元1.3009890980.3207015974.0566966620.0097607980.4765993992.125378798SUMMARY OUTPUT回归统计Multiple R0.807807408R Square0.652552809Adjusted R Square0.594644943标准误差1.215175116观测值8方差分析dfSSMSFSignificance F回归分析116.640
15、0966216.6400966211.268811340.015288079残差68.8599033821.476650564总计725.5Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept88.637681161.58236713156.015876092.174E-0984.7657682892.50959404电视广告费用 /万元1.6038647340.477780793.3569050240.0152880790.4347772592.7729522091回归方程为:y=1.60x+88.642回归方程:y=2.29x1+
16、1.30x2+83.23F值0.001865小于0.05,回归方程的线性关系显著对于x1的系数:p值0.00065小于0.05,显著对于x2的系数:p值0.009761小于0.05,显著2. 一家房地产评估公司想对某城市的房地产销售价格y1与地产的评估价值x1、房产的评估价值x2和使用面积x3建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据见book7.2表。(1)写出估计的多元回归方程。(2)检验回归方程的线性关系是否显著(a =0.05)。(3)检验各回归系数是否显著(a =0.05) 。SUMMARY OUTPUT回归统计Multiple R0.94736
17、2461R Square0.897495632Adjusted R Square0.878276063标准误差791.6823283观测值20方差分析dfSSMSFSignificance F回归分析387803505.4629267835.1546.696969663.87913E-08残差1610028174.54626760.909总计1997831680Coefficients标准误差t StatP-valueLower 95%Intercept148.700454574.4213240.258870010.799036421-1069.0183470.8147381830.51198
18、85071.5913212360.13109905-0.2706289580.8209795420.2111765023.8876462720.0013073610.3733053580.1350410120.0658633122.0503222040.057088036-0.004582972回归方程:y=0.81x1+0.82x2+0.135x3+148.7对于回归方程:F值远远小于0.05,所以回归方程式显著对于x1:0.13大于0.05,不显著对于x2:0.001小于0.05,显著对于x3:0.057大于0.05,不显著所以回归方程为:y+=0.82x2+148.73. 某农场通过试验
19、取得早稻收获量与春季降雨量和春季温度的数据见book7.3表。(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。解释回归系数的实际意义。(2)检验回归方程的线性关系是否显著(a =0.05)。(3)检验各回归系数是否显著(a =0.05) 。SUMMARY OUTPUT回归统计Multiple R0.995651103R Square0.991321119Adjusted R Square0.986981679标准误差261.4310342观测值7方差分析dfSSMSFSignificance F回归分析231226615.2615613307.63228.44446237.53
20、23E-05残差4273384.742568346.18563总计631500000Coefficients标准误差t StatP-valueLower 95%上限 95.0%Intercept-0.590996232505.0042289-0.001170280.99912229-1402.7075161401.525523x122.386461299.6005435312.3317910310.080094808-4.26892079949.04184339x2 327.671712898.797924623.316584980.02947241353.36469864601.978727
21、回归方程为:y=22.39x1+327.67x2-0.59对于回归方程:F值远远小于0.05,所以回归方程显著对于回归系数x1:0.08大于0.05,不显著对于回归系数x2:0.029小于0.05,显著方差分析练习题1.从3个总体中各抽取容量不同的样本数据,得到的数据见book5.1表。检验3个总体的均值之间是否有显著差异?(a =0.01)方差分析:单因素方差分析SUMMARY组观测数求和平均方差列 1579015861.5列 2460015036.66666667列 33507169121方差分析差异源SSdfMSFP-valueF crit组间618.91666672309.458333
22、34.6573996660.0408772394.256494729组内598966.44444444总计1216.916667114.657399665551844.256494729142560.0408772387618210.01,不能拒绝原假设2. 某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见book5.2表。试分析三个企业生产的电池的平均寿命之间有无显著差异? (a =0.05)方差分析:单因素方差分析SUMMARY组观测数求和平均方差列 151532.5列 2522
23、244.428.3列 351503010列 4521342.615.8方差分析差异源SSdfMSFP-valueF crit组间5475.631825.2128.98939932.02553E-113.238871522组内226.41614.15总计570219128.9893992932863.238871522361092.02552624576458E-113.466800111594280.0007973045991419313.238871522361090.001644272361008310.05拒绝原假设,不同方式推销商品的效果差异显著方式一的方差最小,应选方式一5. 五个地
24、区每天发生交通事故的次数如表book5.5,由于是随机抽样,有一些地区的样本容量较多(如南部和西部),而有些地区样本容量较少(如东部)。试以0.01的显著性水平检验各地区平均每天交通事故的次数是否相等?方差分析:单因素方差分析SUMMARY组观测数求和平均方差列 145714.256.25列 256613.26.7列 356412.83.7列 46559.1666666676.966666667列 566711.166666674.566666667方差分析差异源SSdfMSFP-valueF crit组间82.63717949420.659294873.6761349440.02022880
25、44.368815174组内118.0166667215.61984127总计200.6538462253.676134943999650.01不能拒绝原假设,没有足够证据证明验各地区平均每天交通事故的次数相等分布特征分析第一部分1. 某百货公司6月份各天的销售额数据(单位:万元) 见book2.1。(1)计算该百货公司日销售额的均值、中位数、众数;(2)计算日销售额的标准差。 某百货公司平均274.1标准误差3.86595812中位数272.5众数#N/A标准差21.17472469方差448.3689655峰度-0.211917734偏度0.195086998区域86最小值236最大值32
26、2求和8223观测数30最大(1)322最小(1)236置信度(95.0%)7.9067720222. 将某地区120家企业按利润额进行分组,结果如表book2.2,计算120家企业利润额的均值、标准差和离散系数。平均426.6666667标准误差10.63352695中位数450众数450标准差116.4844515方差13568.62745峰度-0.624699913偏度0.208442033区域400最小值250最大值650求和51200观测数120最大(1)650最小(1)250置信度(95.0%)21.05544515离散系数0.2730104333. 25个网络用户的年龄(单位:周
27、岁)数据如表book2.3,计算网民年龄的众数、中位数、均值和标准差。平均24标准误差1.33041347中位数23众数19标准差6.652067348方差44.25峰度0.772705131偏度1.080110357区域26最小值15最大值41求和600观测数25最大(1)41最小(1)15置信度(95.0%)2.745838427第二部分1. 某地区粮食生产情况如表book2.4所示,计算该地区粮食平均亩产量、亩产量的标准差。平均286标准误差8.027100562中位数325众数325标准差80.27100562方差6443.434343峰度-0.393495826偏度-0.128212
28、443区域300最小值125最大值425求和28600观测数100最大(1)425最小(1)125置信度(95.0%)15.92750862. 某公司下属的三个企业计划完成情况如表book2.5,计算该公司的平均计划完成程度。实际产量/件计划产值1.24503751.053153000.9536138011261055平均计划完成程度1.0672985783. 某工业企业某车间工人加工零件情况如表book2.6,要求确定该车间工人加工零件数的众数、中位数、均值和标准差。 平均44.3标准误差1.208179196中位数45众数45标准差12.08179196方差145.969697峰度1.04
29、9323481偏度0.452252788区域60最小值15最大值75求和4430观测数100最大(1)75最小(1)15置信度(95.0%)2.3972895794.两个生产车间工人按某产品日产量(件)分组资料如表book2.7,分析两个车间日产量的平均水平,并说明其代表性的优劣。车间总产量340356车间日产量平均值8.511.86666667第二车间的产量平均值高,因此第二车间生产好于第一车间。假设检验练习题1.经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了20个框
30、架测得比值数据见book4.1表。 在显著性水平a=0.05时能否认为该厂生产的工艺品框架宽与长的平均比例为0.618? 列1平均0.6583标准误差0.020855783中位数0.6215众数0.606标准差0.093269897方差0.008699274峰度3.362449574偏度1.777452646区域0.38最小值0.553最大值0.933求和13.166观测数20最大(1)0.933最小(1)0.553置信度(95.0%)0.043651655H0:u=0.618,H1:u0.6180.04030.0208557831.9323177662.0930240542.093024049854861.932317766不能拒绝原假设2.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者在面积相等、土壤等条件相同的20块田地,分别施用新旧两种肥料,得到新肥料所生产的产量数据见book4.2。通过计算得出对应旧肥料所生产的平均产量为100公斤,检验新肥料的产量是否显著高于旧肥料。(显著性水平a=0.05)平均100.7标准误差1.098084457中位数101众数98标准差4.91078298方差24.11578947峰度1.126259505偏度-0.610870917区域21最小值88最大值109求和2014观测数20最大(