1、第2章 定量资料的统计描述案例2-1(P27)答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下:离散程度指标:四分位间距=P75-P25=8.9-4.7=4.2umol/kg。故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umo
2、l/kg,思考与练习(P31)1. 答:(1) NRangeMinMaxMean胸围12012.749.161.855.120某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布GroupFrequencyPercentCumulative Percent49.0-1.8.850.0-43.34.251.0-86.710.852.0-65.015.853.0-1915.831.754.0-1815.046.755.0-1411.758.356.0-2621.780.057.0-108.388.358.0-97.595.859.0-43.399.261.0-62.01.8100.0To
3、tal120100.0(2) Descriptive StatisticsNRangeMinMaxMeanStd. Deviation胸围12012.749.161.855.1202.3188(3) 利用频数分布表数据计算均数和标准差(4). 2. 答:该资料最大值为一不确定值,根据此特点,宜用中位数和四分位间距进行统计描述.M=16.5(天)P25=15(天)P75=20(天)Q=20-15=5(天)3. 答:根据资料中血凝抑制抗体滴度指标呈等比数列变化的特点,计算其平均滴度应选用几何均数,由于是频数表资料,故用加权法计算几何均数。四、综合分析题(P393)第一题NRangeMinMax尿总
4、砷176.5703.0102.5805176名燃煤型砷中毒患者尿砷含量(ug/L)的频数分布 FrequencyPercentCumulative Percent0.01-8447.747.7 0.06-4123.371.0 0.11-2514.285.2 0.16-11、火药是我国的四大发明之一,我国古代的黑火药是硝石、硫黄、木炭以及一些辅料等粉末状物质的均匀混合物。迄今为止,可以考证的最早的火药配方是“伏火矾法”。42.387.5 0.21-710、日食:当月球运动到太阳和地球中间,如果三者正好处在一条直线上时,月球就会挡住太阳射向地球的光,在地球上处于影子中的人,只能看到太阳的一部分或全
5、部看不到,于是就发生了日食。日食时,太阳被遮住的部分总是从西边开始的。4.0二、问答:91.5一、填空: 0.26-6、重新使用是指多次或用另一种方法来使用已用过的物品,它也是减少垃圾的重要方法。52.894.33、除了我们日常生活产生的家庭垃圾外,工厂、学校、医院、建筑工地等每天也在产生大量的垃圾。 0.31-21.123、我国是世界上公认的火箭的发源地,早在距今1700多年前的三国时代的古籍上就出现了“火箭”的名称。95.520、对生活垃圾进行分类、分装,这是我们每个公民的义务。只要我们人人参与,养成良好的习惯,我们周围的环境一定会变得更加清洁和美丽。 答:火柴燃烧、铁钉生锈、白糖加热等。
6、0.36-答:无色无味,比空气重,不支持燃烧。31.797.2 0.41-21.198.3 0.51-1.698.9 0.56-0.6121.1100.0 Total176100.0 由上图可见,该资料集中位置偏向左侧,为正偏态分布,可考虑作对数变换: Y=lg(尿总砷)NRangeMinMaxY1761.7552-1.9914-.2362Tests of Normality(正态性的检验)Kolmogorov-Smirnov(a)Shapiro-WilkStatisticdfSig.StatisticdfSig.尿总砷.200176.000.724176.000Y.035176.200(*)
7、.987176.112* This is a lower bound of the true significance.a Lilliefors Significance CorrectionDescriptive StatisticsNRangeMinMaxMeanStd. DeviationY1761.7552-1.9914-.2362-1.1831.3969结果中的Mean表示尿总砷对数值的均数为-1.1831,求其反对数,得几何均数G=0.0656(ug/L)。第二题解:(1) 已知健康人的血清胆固醇服从正态分布,故采用正态分布法制定95%的参考值范围。下限:上限:故该市45-55岁健
8、康男性居民的血清胆固醇的95%的参考值范围为(2.96mmol/L, 6.72mmol/L)(2) 45-55岁健康男性居民的血清胆固醇的分布为正态分布,且仅知样本均数和样本标准差,则先按下式求得z值,再查附表二的标准正态分布下的面积求得曲线下某区间的面积。 查标准正态分布曲线下的面积表(附表2)得: 即该市45-55岁健康男性居民中,血清胆固醇在3.25-5.25mmol/L范围内的比例为61.79%。(3) 即该市45-55岁健康男性居民中,血清胆固醇低于3.80mmol/L所占的比例为14.01%。第三题NRangeMinMaxSI12093.9253.06146.98GroupFrequencyPercentCumulative Percent50-32.52.5 60-32.55.0 70-32.57.5 80-97.515.0 90-1210.025.0 100-97.532.5 110-2722.555.0 120-2117.572.5 130-2319.291.7 140-108.3100.0 Total120100.0