1、一、一、资资料料简简化的基本技化的基本技术术 二、集中二、集中趋势测趋势测量量 三、离散三、离散趋势测趋势测量量四、四、单变单变量推量推论统计论统计1 1、频数频数分布分布2 2、频频率分布率分布3 3、累、累计频数计频数和累和累计计百分率百分率4 4、对对比比值值l所所谓频数谓频数分布分布(Frequency DistributionFrequency Distribution),是指一是指一组数组数据中取不同据中取不同值值的的个个案的次案的次数数分布情分布情况况,通常以,通常以频频数数分布表的形式表分布表的形式表达达。l频数频数分布表的主要作用是分布表的主要作用是简简化化资资料,可以料,可
2、以清清楚地楚地了解到了解到调查数调查数据所放映出的信息。据所放映出的信息。1、频数分布、频数分布(简写(简写f)学生所在院系4422.022.022.021.01.023.02814.014.037.03015.015.052.031.51.553.521.01.054.5136.56.561.021.01.062.0105.05.067.02211.011.078.073.53.581.573.53.585.052.52.587.5168.08.095.594.54.5100.0200100.0100.0电信学院工程力学系机械学院化工学院应用数学系物理系管理学院人文学院外语系土木水利材料工程
3、系船舶工程学院建筑艺术学院软件学院动力工程系TotalValidFrequencyPercentValid PercentCumulativePercent2 2、频频率分布(率分布(简写简写%)l所所谓频谓频率分布率分布(Percentages DistributionPercentages Distribution),指的就是指的就是一一组数组数据中不同取据中不同取值值的的频数频数相相对对于于总数总数的比率分的比率分布情布情况况。l频数频数分布是不同分布是不同类别类别在在总总体中的体中的绝对数绝对数量分布,量分布,而而频频率分布率分布则则是不同是不同类别类别在在总总体中的相体中的相对对分布
4、分布(相(相对对比重)。比重)。l通通过频过频率分布,可以比率分布,可以比较较同一同一类别类别在不同整体中在不同整体中的分布情的分布情况况的的异异同。同。您的性别(大连理工大学)16482.082.482.43517.517.6100.019999.5100.01.5200100.0男女TotalValidSystemMissingTotalFrequencyPercentValid PercentCumulativePercent性别(钢铁学院)30360.660.660.619739.439.4100.0500100.0100.0男女TotalValidFrequencyPercentVa
5、lid PercentCumulativePercentl累累计计次次数数(简写简写成成cfcf),),就是把次就是把次数数向上或向下向上或向下逐逐级级累加起累加起来来,向上的叫向上累,向上的叫向上累计计次次数数(cfcf),),向下的叫向下累向下的叫向下累计计次次数数(cfcf)。)。l累累计计百分率(百分率(简写简写成成c%c%),),就是把各就是把各级级的百分率的百分率数值数值向上或向下逐向上或向下逐级级累加起累加起来来。l适用于定序、定距适用于定序、定距层层次而不适用于定次而不适用于定类层类层次的次的统统计计分析方法。分析方法。3、累计频数和累计百分率、累计频数和累计百分率调查对象文化
6、程度分布调查对象文化程度分布fcf cf%c%c%小学及以下小学及以下初中初中高中或中专高中或中专大专大专大学及以上大学及以上50752501507560055047522575501253755256008.312.541.72512.510091.779.237.512.58.320.862.587.5100合计合计600100文化程度664.44.44.429619.819.924.364443.043.367.631020.720.888.41268.48.596.8473.13.2100.0148999.5100.07.51496100.0小学以下小学初中高中或中专大专大学及以上To
7、talValidSystemMissingTotalFrequencyPercent Valid PercentCumulativePercentl所所谓对谓对比比值值就是就是两变两变量量值值的比的比值值。l例如某大例如某大学学有男生有男生1800018000人、女生人、女生60006000人,人,则该则该校男生校男生与与女生的女生的对对比比值值就是就是3 3:1 1,即每有,即每有1 1名女生名女生就有就有3 3名男生。名男生。l新生人口的性新生人口的性别别比通常用比通常用对对比比值值表示。如新生表示。如新生婴儿婴儿性性别别比比为为108108,即表示新生男、女,即表示新生男、女婴儿婴儿比比
8、为为108 108:100100,亦即每出生,亦即每出生100100名女名女婴婴,就有,就有108108名男名男婴婴出出生。生。l比比 例:例:l百分率:百分率:l千分率:千分率:l万分率:万分率:100Nf1000Nf10000NfNf例例2.9 中国中国1999年国内生产总值年国内生产总值主词主词宾词宾词横横行行标标题题纵行纵行标题标题例例2.10 2.10 中国中国1999年国内生产总值年国内生产总值复合表:交叉分组列表复合表:交叉分组列表 某某饭店顾客满意情况调查饭店顾客满意情况调查居住状态*口味感觉 CrosstabulationCount741154912820长 住 者暂 住 者
9、居 住状 态Total味 道 好味 道 不 好口 味 感 觉Total居 住 状 态暂住者长住者Count7.57.06.56.05.55.04.54.03.5口 味 感 觉味道好味道不好(三)统计表的编制规则(三)统计表的编制规则90年代产量变化图90年代产量变化图0 020002000400040006000600019901990 19911991 19921992 19931993 19941994 19951995 19961996 19971997 19981998 19991999 20002000年度年度千万千万90年代产量变化图90年代产量变化图100010001500150
10、02000200025002500300030003500350040004000450045001990199019921992 1994199419961996 1998199820002000年度年度千万千万不同的刻度不同的刻度1996年各国税率对比图1996年各国税率对比图0 0101020203030404050506060加拿大加拿大法国法国德国德国意大利意大利日本日本美国美国瑞典瑞典国家国家税率()税率()1996年各国税率对比图1996年各国税率对比图0 0101020203030404050506060瑞典瑞典法国法国意大利意大利德国德国加拿大加拿大日本日本美国美国国家国家税
11、率()税率()某旅游景点19841998年旅客人数某旅游景点19841998年旅客人数050100150200250旅客人数(万人)旅客人数(万人)多余的笔墨多余的笔墨惊人的人口增长惊人的人口增长l所所谓谓集中集中趋势测趋势测量法,就是找出一量法,就是找出一个个典型典型值值或代或代表表值来值来代表代表变变量的分布,以反映量的分布,以反映这组数这组数据向据向这个这个典型典型值值集集结结的情的情况况。l当当根据根据这个这个典型典型值来值来估估计计或或预测预测每每个研个研究究对对象象(即(即个个案)的案)的数值时数值时,所,所发发生的生的错误错误的的总总和是最和是最小的。小的。1 1众数众数(Mod
12、eMode)2 2中位中位数数(MedianMedian)3 3均均值值(MeanMean)l所所谓众数谓众数(简写简写成成MoMo),),简单说简单说就是一就是一组数组数据中据中出出现现次次数数最多的最多的值值。l求求众数众数的步的步骤骤是是这样这样:首先首先将将原始原始数数据制成据制成频数频数分布表;分布表;然后在然后在频数频数一一栏栏中找出最大的中找出最大的频数频数;最后找到最大的最后找到最大的频数频数所所对应对应的的标标志志值值,这这一一标标志志值值就是就是众数众数。1众数(众数(Mode)大连市公众科学素养调查调查对象居住地996.66.66.61047.07.013.615010.
13、010.023.615110.110.133.7755.05.038.714910.010.048.722214.814.863.527318.218.281.824916.616.698.4241.61.6100.01496100.0100.0中山区西岗区沙河口区甘井子区旅顺区金州区普兰店瓦房店庄河长海TotalValidFrequencyPercentValid PercentCumulativePercentMo瓦房店市瓦房店市l由由组组距分距分组资组资料求料求众数众数的方法:的方法:组组中中值值法法 首先也通首先也通过观过观察找出最高的察找出最高的频数频数;然后根据最高的然后根据最高的
14、频数频数找到找到它它所所对应对应的的组组;最后求出最后求出该组该组的的组组中中值值即即为众数为众数。l众数众数适合于分析定适合于分析定类变类变量,量,当当然也可以用然也可以用来来分析分析定序、定距定序、定距变变量的量的资资料。料。2xm上限下限组中值:大连市公众科学素养调查调查对象家庭总的可支配收入15510.410.410.433822.622.633.039426.326.459.425216.816.976.315010.010.086.3986.66.692.9442.92.995.8231.51.597.4191.31.398.711.7.799.47.5.599.92.1.1100
15、.0149399.8100.03.21496100.02000元以下20005000元500010000元1000015000元1500020000元2000025000元2500030000元3000035000元3500040000元4000050000元50000100000元100000元以上TotalValidSystemMissingTotalFrequencyPercentValid PercentCumulativePercentMo7500or 公式公式l所所谓谓中位中位数数(简写简写成成MdMd),),就是在一就是在一个个按按值值的大的大小小顺顺序排列的序列中位于中央位置的
16、序排列的序列中位于中央位置的哪个数值哪个数值。l其意其意义义是:在整是:在整个数个数据中,有一半据中,有一半数数据的据的值值在在它它之上(比之上(比它它大),另一半大),另一半数数据的据的值值在在它它之下(比之下(比它它小)。小)。2中位数(中位数(Median)l求算中位求算中位数数的步的步骤骤是:先是:先将将各各个数值个数值按由小到大按由小到大的的顺顺序排列起序排列起来来,然后找出位于中央位置的那,然后找出位于中央位置的那个个值值,即中位,即中位数数。l某班某班5 5名名学学生的年生的年龄龄由小到大排列如下:由小到大排列如下:1616,1717,1818,1919,2020lMdMd位置位
17、置=(1)根据原始数据求算中位数)根据原始数据求算中位数 321521Nl某班有某班有6 6名名学学生,其年生,其年龄龄由小到大分由小到大分别别是:是:1616,1 17 7,1818,1919,2020,2121 则则MdMd位置位置=(6+16+1)/2=3.5/2=3.5,即中央位置位于第三即中央位置位于第三学学生和第四生和第四学学生之生之间间,所以所以MdMd=(18+1918+19)/2=18.5/2=18.5。l在一在一组数组数据中,可能有据中,可能有许许多相同的多相同的数值数值。如果是。如果是这种这种情情况况,可以先,可以先统计统计出次出次数数分布,然后求出中分布,然后求出中位位
18、数数。l其步其步骤骤也是先求出也是先求出数数据序列的中据序列的中间间位置,然后再位置,然后再找出其所找出其所对应对应的的值值即中位即中位数数。l某班有某班有3535名名学学生,其年生,其年龄龄分布在分布在17201720岁岁之之间间,各年各年龄龄的人的人数数如表如表4-84-8所示。求所示。求该该班班学学生年生年龄龄分分布的中位布的中位数数?某班学生年龄情况的频数分布表某班学生年龄情况的频数分布表年龄年龄人数(人数(f)向上累加次数(向上累加次数(cf)向下累加次数(向下累加次数(cf)1718192071411372132353528143合计合计35l第一步是先算出中位第一步是先算出中位数
19、数所在的中央位置:所在的中央位置:MdMd位置位置=(35+135+1)/2=18/2=18,即第,即第1818个数值个数值所在位置。所在位置。l第二步就是列出累加次第二步就是列出累加次数数,可以,可以从从上到下列出向上上到下列出向上累加次累加次数数(如表中第三列),也可以(如表中第三列),也可以从从下往上列出下往上列出向下累加次向下累加次数数(如表中第四列)。(如表中第四列)。l第三步我第三步我们从们从上往下找(或上往下找(或从从下往上找),看所下往上找),看所计计算出的中算出的中间间位置最先落入位置最先落入哪个哪个累加次累加次数内数内,再由此,再由此找出相找出相对应对应的中位的中位数数。l
20、具体方法是先列出累加次具体方法是先列出累加次数数,然后按上述方法确,然后按上述方法确定中位定中位数数所在的所在的组组,最后利用下述公式,最后利用下述公式计计算出中算出中位位数数的的值值:l中位中位数数MdMd=lL L为为中位中位数数所在所在组组的下限的下限值值,N N为为全部全部个个案案数数目,目,为为中位中位数数所在所在组组的的频数频数,为为中位中位数数所在所在组组前一前一组组的累的累计计次次数数,w w为为中位中位数数所在所在组组的的组组距。距。(2)用分组资料求算中位数)用分组资料求算中位数WfmcfNLm)2()1(mf)1(mcf某系有某系有100名学生,调查资料显示各学生的月均生
21、名学生,调查资料显示各学生的月均生活费在活费在100800元之间,以元之间,以100元为间距分组统元为间距分组统计结果如下表所示:计结果如下表所示:某系学生月均生活费情况频数分布表某系学生月均生活费情况频数分布表月均生活费(元)月均生活费(元)人数(人数(f)组组中中值值()向上累加次数(向上累加次数(cf)1002002013003014004015005016006017007018005183025107515025035045055065075052353788895100合计合计100mx根据上表来求中位数:根据上表来求中位数:第一步,列出向上累加次数(表中第四列数第一步,列出向上累
22、加次数(表中第四列数值),然后求出中位数的位置:值),然后求出中位数的位置:Md位置位置=(1001)/2=50.5 第二步,根据向上累加次数分布,第第二步,根据向上累加次数分布,第50.5个个数值在第三组即数值在第三组即300400的组内。的组内。第三步,利用上述公式计算出中位数的值:第三步,利用上述公式计算出中位数的值:中位数中位数=WfcfNLm)2(m)1(=391(元)(元)l均均值值即平均即平均数数是使用的最多的是使用的最多的统计值统计值。l定距定距变变量量数数据可以做加据可以做加减运减运算,因此可以算,因此可以将变将变量量的各的各个数值个数值加起加起来来,所得之和再除以,所得之和
23、再除以调查对调查对象象数数目,求得一目,求得一个个平均的平均的数值数值,这这就是平均就是平均数数(简写简写成成 )。)。3均值(均值(Mean)xl(1 1)根据原始)根据原始数数据求算平均据求算平均数数。这种这种情情况况下求算下求算平均平均数数的公式是:的公式是:nxx其中其中x表示各个个案数值之和,表示各个个案数值之和,n表示全部个案数目。表示全部个案数目。l某班某班8 8名名学学生的年生的年龄龄分分别别是:是:1818、1919、2020、2121、2020、1818、1717根据公式他根据公式他们们的平均年的平均年龄龄是:是:=(18+19+19+20+21+20+18+1718+19
24、+19+20+21+20+18+17)/8=19/8=19从这个结从这个结果知果知这这8 8名名学学生的平均年生的平均年龄龄是是1919岁岁。xl平均平均数数表明了表明了资资料的集中料的集中趋势趋势,有估,有估计计或或预测预测作作用。例如用。例如从从8 8名名学学生中任意抽取一名生中任意抽取一名学学生,生,应应估估计计其年其年龄龄是是1919岁岁。从长远来从长远来看,用平均看,用平均数来数来估估计计定定距距变变量的量的资资料,可能犯的料,可能犯的错误错误最小。最小。l当当一一组数组数据中出据中出现现很多相同的很多相同的数值时数值时,则则可以先可以先统计统计出次出次数数(f f)的分布,再求取次
25、的分布,再求取次数与数与相相对应标对应标志志值值之之间间的乘的乘积积(fxfx),然后用各然后用各个个乘乘积积的的总总和除和除以以个个案案总数总数(即(即频数频数之和)得出平均之和)得出平均数数,其公式,其公式是:是:nfxx3.183532011191418717nfxx可见该班学生的平均年龄是可见该班学生的平均年龄是18.3岁。岁。某班学生年龄情况的频数分布表某班学生年龄情况的频数分布表年龄年龄人数(人数(f)向上累加次数(向上累加次数(cf)向下累加次数(向下累加次数(cf)1718192071411372132353528143合计合计35l在在调查调查收入、年收入、年龄龄等方面情等方
26、面情况时况时,常常得到,常常得到组组距距形式的形式的资资料。料。这种这种情情况况下求算平均下求算平均数数的公式是:的公式是:(2)根据分组资料求出平均数)根据分组资料求出平均数 nfxxm其中其中f表示每组的次数,表示每组的次数,表示组中值,表示组中值,n表示个案数。表示个案数。mx某系学生月均生活费情况频数分布表某系学生月均生活费情况频数分布表月均生活费(元)月均生活费(元)人数(人数(f)组组中中值值()向上累加次数(向上累加次数(cf)10020020130030140040150050160060170070180051830251075150250350450550650750523
27、53788895100合计合计100mx32410075056507550104502535030250181505nfxxml总总的的来说来说,如果,如果对调查资对调查资料料进进行集中行集中趋势测趋势测量,一量,一般情般情况况下:下:定定类变类变量的量的测测量可以用量可以用众数众数;定序定序变变量可以用量可以用众数众数,但以中位,但以中位数较数较适宜,;适宜,;定距定距变变量可以用量可以用众数众数,也可以用中位,也可以用中位数数,但以平均,但以平均数数最适宜。最适宜。三、离散趋势测量 l所所谓谓离散离散趋势测趋势测量,就是求出特量,就是求出特别别的的数值来数值来表示表示一一个变个变量的量的个
28、个案案与个与个案之案之间间的差的差异异情情况况,反映,反映这这一一组数组数据相互之据相互之间间的离散程度。的离散程度。l这种测这种测量方法,量方法,与与集中集中趋势测趋势测量法相互量法相互补补充,充,从从两个两个不同的不同的侧侧面描述和揭示一面描述和揭示一组数组数据的分布情据的分布情况况,共同反映出共同反映出资资料分布的特征。料分布的特征。l集中集中趋势测趋势测量法所求出的是一量法所求出的是一个个最能代表最能代表变变量量数数据据资资料集中情料集中情况况的的值值,但其代表性往往取,但其代表性往往取决决于于个个案之案之间间的差的差异异情情况况,即离散程度。如果,即离散程度。如果个个案相互案相互之之
29、间间的差的差异异很大,那很大,那么众数么众数、中位、中位数数或平均或平均数数的的代表性就代表性就会会大打折扣。大打折扣。l某某学学校校举举行智力行智力竞赛竞赛,各系,各系选选派派5 5名名学学生生参参加。加。结结果其中有三果其中有三个个系的成系的成绩绩分分别别如下:如下:社科系:社科系:76 78 81 82 8376 78 81 82 83 数学数学系:系:62 74 80 86 9862 74 80 86 98 化化学学系:系:32 78 91 99 10032 78 91 99 100虽然这三个系参赛队的平均成绩都是虽然这三个系参赛队的平均成绩都是80分,但分,但显然这个显然这个80分对
30、社科系参赛队选手的成绩的代分对社科系参赛队选手的成绩的代表性最高,而对化学系参赛队选手的代表性最表性最高,而对化学系参赛队选手的代表性最低。低。离散指离散指标标1 1、定、定类变类变量:量:异众异众比率(比率(V V)2 2、定序、定序变变量:四分位差(量:四分位差(Q Q)3 3、定距、定距变变量:全距(量:全距(极极差)差)标标准差(准差(S S)(方差)(方差 S S2 2)4 4、离散系、离散系数数CVCVl所所谓异众谓异众比率(比率(简写简写成成V V),),就是一就是一组数组数据中非据中非众数众数的次的次数数相相对对于于总总体全部体全部个个案的比例。其案的比例。其计计算公式是:算公
31、式是:Nf-NVmoN是全部个案数目,是全部个案数目,是众数的次数,二者之差是众数的次数,二者之差(N-)就是非众数的次数。就是非众数的次数。mofmofl例:前述大例:前述大连连市公市公众众科科学学素素养调查调查对养调查调查对象居住象居住地中,地中,MoMo瓦房店市,其瓦房店市,其异众异众比率比率为为:82.014962731496Nf-NVmo当异众比率越大,众数的代表性也就越小。当异众比率越大,众数的代表性也就越小。当异众比率越小,则众数的代表性就越大。当异众比率越小,则众数的代表性就越大。大连市公众科学素养调查调查对象居住地996.66.66.61047.07.013.615010.0
32、10.023.615110.110.133.7755.05.038.714910.010.048.722214.814.863.527318.218.281.824916.616.698.4241.61.6100.01496100.0100.0中山区西岗区沙河口区甘井子区旅顺区金州区普兰店瓦房店庄河长海TotalValidFrequencyPercentValid PercentCumulativePercent2 2定序定序变变量:四分位差(量:四分位差(Q Q)Q1Q2(Md)Q325252525QQ3-Q1l在上在上图图所表示的四所表示的四个个等分中,等分中,Q2Q2就是中位就是中位数数
33、(MMd d),),其其两边两边各有各有50%50%的的个个案。而且在中位案。而且在中位数数的的两两旁的旁的Q1Q1和和Q3Q3之之间间,也共有,也共有50%50%(25%+25%25%+25%)的的个个案。案。l四分位差的意四分位差的意义义就在于,就在于,Q1Q1与与Q3Q3的差的差异异越大,越大,即四分位差越大,就表示有即四分位差越大,就表示有50%50%的的个个案分布就越案分布就越远远离中位离中位数数,因而中位,因而中位数数的代表性就越小,用的代表性就越小,用它它来来估估计计或或预测预测所犯的所犯的错误错误就就会会越大。越大。l求算四分位差求算四分位差时时。首先要求出。首先要求出Q1Q1
34、的位置和的位置和Q3Q3的的位置,公式分位置,公式分别别是:是:41N1Q的位置41N3Q3)(的位置 然后计算出在这两个位置上的值的差异,然后计算出在这两个位置上的值的差异,结果即四分位差。结果即四分位差。l例:例:某甲班某甲班1111名名学学生年生年龄龄如下:如下:1717岁岁、1818岁岁、1818岁岁、1919岁岁、1919岁岁、2020岁岁、2020岁岁、2121岁岁、2121岁岁、2222岁岁、2222岁岁,求其四分位差。求其四分位差。第一步:求出第一步:求出Q1、Q3的位置的位置 941N3Q3)(的位置341NQ1的位置第二步:找到数值数列中第二步:找到数值数列中Q1、Q3所对
35、应的数值所对应的数值Q118 Q321 第三步:计算出四分位差第三步:计算出四分位差Q=Q3-Q1=21-18=33定距变量:标准差(S)(方差 S2)l对对于定距于定距变变量,量,测测量离散程度最量离散程度最简单简单的方法是的方法是计计算全距(又叫算全距(又叫极极差),即一差),即一组数组数据中最大据中最大值与值与最最小小值值之差。之差。l社科系:社科系:83-76=783-76=7(分)(分)数学数学系:系:98-62=3698-62=36(分)(分)化化学学系:系:100-32=68100-32=68(分)(分)l由于全距只考由于全距只考虑两个极虑两个极端的端的数值数值,而,而没没有考有
36、考虑虑到到其其它数值它数值,因此代表性不高。,因此代表性不高。l所所谓标谓标准差(准差(简写简写成成S S),),就是先就是先将将一一组数组数据中据中各各数数据(据(x x)与与其平均其平均数数()之差的平方和除以)之差的平方和除以全部全部个个案案数数目(目(N N),),再取其平方根。其再取其平方根。其计计算公算公式式为为:xNxx2)(S公式中,公式中,x与与 的差就表示以平均数为代表值时会的差就表示以平均数为代表值时会引起的偏差或错误。引起的偏差或错误。x 如果公式不开方,即方差如果公式不开方,即方差S2,含义相同。含义相同。l标标准差的意准差的意义义就在于,如果其就在于,如果其值值越大
37、,即各越大,即各个数个数值与值与平均平均数数的差的的差的总总和越大,就表明和越大,就表明变变量量数值数值的的离散程度越大,而平均离散程度越大,而平均数数的代表性就越低;的代表性就越低;l相反,相反,标标准差的准差的值值越小,就表明越小,就表明变变量量数值数值的离散的离散程度越小,而平均程度越小,而平均数数的代表性也就越高。的代表性也就越高。Nxx2)(S(社科系)92.25)8083()8082()8081()8078()8076(2222242.13)(S2(数学系)Nxx24.28)(S2(化学系)Nxxl对对于有于有频数频数分布的分布的资资料,求算其料,求算其标标准差的公式稍准差的公式稍
38、有不同:有不同:222)(SxNfxNxxf其中其中f是是x所对应的频数。所对应的频数。某班学生年龄情况的频数分布表某班学生年龄情况的频数分布表年龄年龄人数(人数(f)向上累加次数(向上累加次数(cf)向下累加次数(向下累加次数(cf)1718192071411372132353528143合计合计353.18x503.0)(S222xNfxNxxf(2)根据组距分组资料求算标准差l这种这种情情况况下求算下求算标标准差的公式如下:准差的公式如下:222)(xNfxNxxfSmm其中其中 是每一组的组中值,是每一组的组中值,f是该组的次数。是该组的次数。mx某系学生月均生活费情况频数分布表某系学
39、生月均生活费情况频数分布表月均生活费(元)月均生活费(元)人数(人数(f)组组中中值值()向上累加次数(向上累加次数(cf)1002002013003014004015005016006017007018005183025107515025035045055065075052353788895100合计合计100324x4.286)(222xNfxNxxfSmml离散系离散系数数也也称为变称为变差系差系数数,是一,是一种种相相对对的离散量的离散量数数。它它使我使我们们能能够对够对同一同一总总体中体中两种两种不同的离散不同的离散量量数进数进行比行比较较,或者,或者对两个对两个不同不同总总体中的同
40、一离体中的同一离散量散量数进数进行比行比较较。l定定义义(计计算):算):标标准差准差与与平均平均数数的比的比值值,用百分,用百分比表示。比表示。100XSCVl例:一例:一项调查结项调查结果,某市人均月收入果,某市人均月收入为为920920元,元,标标准差准差为为170170元;人均住房面元;人均住房面积为积为1212平方米,平方米,标标准差准差为为2.52.5平方米。平方米。试试比比较该较该市人均月收入和人均市人均月收入和人均住房情住房情况哪况哪一一个个差差异异程度比程度比较较大。大。人均月收入的离散系数为:人均月收入的离散系数为:5.18100920170100XSCV人均住房面积的离散
41、系数为:人均住房面积的离散系数为:8.20100125.2100XSCVl例:例:对对广州和武广州和武汉两汉两地居民生活地居民生活质质量量调查发现调查发现,广州居民月平均收入广州居民月平均收入为为25002500元,元,标标准差准差为为450450元;武元;武汉汉居民平均收入居民平均收入为为15001500元,元,标标准差准差为为3 35050元。元。试试比比较较,广州市和武,广州市和武汉汉市居民相互之市居民相互之间间收入差收入差异异程度程度哪个哪个更大一些。更大一些。(广州)181002500450100XSCV(武汉)3.231001500350100XSCV案例案例 大大学毕业学毕业生表
42、生表现现l1 1、问题问题的提出的提出 振振兴兴大大学学是一所是一所综综合性大合性大学学,有三,有三个个附附属学属学院,分院,分别别是商是商贸学贸学院、生物院、生物学学院和院和医学医学院。近期院。近期该该校管理校管理层层为为了了解社了了解社会对会对本校本校学学生的生的满满意程度,以此促意程度,以此促进进本校本校教学教学改革,改革,进进行了一行了一项对项对本校本校毕业毕业生的生的调查调查。调查调查者者随随机抽机抽查查了了4848名名毕业毕业生生组组成成样样本,要求他本,要求他们们所在的工所在的工作作单单位位对对其工作表其工作表现现、专业专业水平和外水平和外语语水平三水平三个个方面方面的表的表现进
43、现进行行评评分,分,评评分由分由0 0到到1010,分,分值值越大表明越大表明满满意意程度越高。收集有程度越高。收集有关样关样本本数数据如表据如表3-13-1和表和表3-23-2。续续前表前表学生学生编号编号工作工作表现表现专业专业水平水平外语外语水平水平学生学生编号编号工作工作表现表现专业专业水平水平外语外语水平水平256 66 66 6378 88 82 2267 78 84 4387 76 63 3277 77 77 7398 88 85 5287 75 52 24010107 75 5299 96 62 24110107 76 6308 87 76 6429 96 67 7319 98
44、 84 4437 74 47 7327 74 45 5448 84 45 5339 97 79 9458 86 66 6349 96 65 54610108 86 6358 89 95 5479 98 87 7367 76 66 6488 85 57 7工作表现专业水平外语水平专业水平外语水平工作表现专业水平外语水平764838949627498587346763966859627526377395466995765658649457475286484962666848957777976687675882745478859564510867636610768796757商贸学院生物学院医学院工
45、作表现787687997991087889表3-2 分学院评分汇总表分学院评分汇总表 校管理层希望在调查分析报告中阐述以下几个问题:&用人单位对该校毕业生哪个方面最为满意?哪个方面最不满意?应在哪些方面做出教学改革?&用人单位对该校毕业生哪个方面的满意程度差别最大?什么原因产生的?&社会对三个学院的毕业生的满意程度是否一致?能否提出提高社会对该校毕业生的满意程度的建议?l2 2、数数据描述和分析据描述和分析图一 样本学生所属学院构成样本学生所属学院构成医学院医学院29%29%生物学院生物学院35%35%商贸学院商贸学院36%36%(1 1)从图一可看出,随机抽取的)从图一可看出,随机抽取的48
46、48名学生是由附属商贸名学生是由附属商贸学院、生物学院和医学院毕业生组成,各学院学生毕业生人学院、生物学院和医学院毕业生组成,各学院学生毕业生人数分别是数分别是1717人、人、1717人和人和1414人,分别占样本的人,分别占样本的35.4%35.4%、35.4%35.4%和和29.2%29.2%,可见各学院抽取毕业生人数大致相同,样本具有一,可见各学院抽取毕业生人数大致相同,样本具有一定代表性。定代表性。工工 作作表表 现现专专 业业水水 平平外外 语语水水 平平平均平均数数8.0428.0426.3756.3755.0835.083中位中位数数8 86 65 5众数众数7 76 65 5标
47、标准差准差1.0311.0311.3621.3621.7731.773方差方差1.0621.0621.8561.8563.1443.144极极差差4 45 57 7最小最小值值6 64 42 2最大最大值值10109 99 9求和求和386386306306244244计数计数484848484848表3-3 48名毕业生描述统计表名毕业生描述统计表(2)从表)从表3-3可以看出:可以看出:a.a.用人单位对振兴大学毕业生的工用人单位对振兴大学毕业生的工作表现评估分最高,而外语水平作表现评估分最高,而外语水平评估分最低。两者的平均评估分评估分最低。两者的平均评估分相差相差2.962.96分,由
48、此可见用人单位分,由此可见用人单位最满意该校毕业生的工作表现,最满意该校毕业生的工作表现,最不满意毕业生的外语水平。这最不满意毕业生的外语水平。这反映出毕业生适应能力比较强,反映出毕业生适应能力比较强,也反映出振兴大学在培养学生社也反映出振兴大学在培养学生社会实践能力方面卓有成效。从用会实践能力方面卓有成效。从用人单位对毕业生外语水平评分普人单位对毕业生外语水平评分普遍偏低看,反映出该校的外语教遍偏低看,反映出该校的外语教学方面存在严重问题,今后需要学方面存在严重问题,今后需要在外语方面加大力度进行改革。在外语方面加大力度进行改革。b.用人单位对振兴大学毕业生的外语水平评估分差异最大,样本评估
49、分的标准差为1.77分,毕业生的外语水平评估分最高达9分,最低才2分,相差7分,这说明了振兴大学毕业生外语程度相差悬殊,参差不齐,这可能是该校在招生中忽视对学生外语成绩的考虑所致。工作表现专业水平外 语水 平平均平均数数85.8244.765中位中位数数865众数众数766标标准差准差1.1180.9511.602方差方差1.250.9042.566极极差差435最小最小值值642最大最大值值1077求和求和1369981计数计数171717工工 作作表表 现现专专 业业水水 平平外外语语水水 平平8.1437.2143.85787.548650.9491.3691.5120.9011.874
50、2.286344752109611410154141414工 作表 现专 业水 平外语水 平86.4125.2948757841.0611.4601.6111.1252.1322.596446643108913610990171717商贸学院商贸学院生物学院生物学院医学院医学院表34(3)用人单位对三个学院的毕业生评价是不一致的:a.工作表现方面:三个学院毕业生在这一方面的表现相差不大,均达到了8分以上,受到用人单位好评。评估分最高的是医学院的毕业生,平均分为8.14分,标准差为0.95分,是三个学院中离散程度最小的,可见该学院毕业生工作表现普遍较好。b.专业水平方面:用人单位对三个学院毕业生