1、概念:概念:综合反映总体各单位标志值的差异程度综合反映总体各单位标志值的差异程度或离散程度。变异指标或离散程度。变异指标越大,表明数据越分散、越大,表明数据越分散、不集中;变异指标越小,表明数据越集中,不集中;变异指标越小,表明数据越集中,变动范围越小。变动范围越小。变异指标反映现象总体总单位变变异指标反映现象总体总单位变量分布的离中趋势。量分布的离中趋势。1PPT课件 它是反映总体中它是反映总体中各单位标各单位标志值差异程度的综合指标。志值差异程度的综合指标。变异指标(标志变动度)变异指标(标志变动度),平均指标说明总体各单位变量值分布的集中趋势;平均指标说明总体各单位变量值分布的集中趋势;
2、平均指标是说明总体各单位某一数量标志一般水平的综合指平均指标是说明总体各单位某一数量标志一般水平的综合指标。标。但是,平均指标将总体各单位标志值的差异抽象化了,是但是,平均指标将总体各单位标志值的差异抽象化了,是总体各单位标志总体各单位标志值的代表水平,它不能反映总体各单位标志值值的代表水平,它不能反映总体各单位标志值的差异情况。例如,的差异情况。例如,变异指标说明总体各单位变量值分布的离中趋势或分散程度。变异指标说明总体各单位变量值分布的离中趋势或分散程度。工人姓名工人姓名 甲甲 乙乙 丙丙 丁丁 戊戊 460 460 520 520 600 600 700 700 850850奖金额(元)
3、奖金额(元)数量标志数量标志标志值(变量值)标志值(变量值)平均奖金平均奖金=626626(元)(元)2PPT课件离中趋势的概念:离中趋势的概念:指总体中各单位标志值背离分布中心(平均数)的指总体中各单位标志值背离分布中心(平均数)的程度,也就是总体各单位标志值之间差异程度,用标志程度,也就是总体各单位标志值之间差异程度,用标志变异指标反映其大小。变异指标反映其大小。平均数平均数3PPT课件 (3 3)试问)试问A、C 两门课程平均两门课程平均考分更有代表性?考分更有代表性?表表 例如,例如,A课程课程考分:考分:65 70 75 80 8565 70 75 80 85 (分)(分)7575A
4、x B课程课程考分:考分:68 70 76 80 8168 70 76 80 81(分分)7 75 5Bx学生学生序号序号 各课程考分各课程考分(分)(分)xAxBxC甲甲乙乙丙丙丁丁戊戊 65 65 70 70 75 75 80 80 85 8568687070767680808181 79 79 85 85 90 90 95 95100100合合 计计 375375375375449449 (1 1)试计算)试计算A、B、C三门课程三门课程的平均考分。的平均考分。(2 2)试问)试问A、B两门课程平均两门课程平均考分哪个更有代表性?考分哪个更有代表性?65657575 85 85 B 组组
5、 A 组组变异大变异大变异小变异小4PPT课件 标志变异指标与平均数的代表性成反比,表明总体各单位标志变异指标与平均数的代表性成反比,表明总体各单位标志值的分散程度。即标志变异指标数值越大,平均数的代标志值的分散程度。即标志变异指标数值越大,平均数的代表性越小。例表性越小。例 1.1.它是衡量平均数代表性的尺度。它是衡量平均数代表性的尺度。2.2.它可以反映社会经济活动过程的均衡性或稳定它可以反映社会经济活动过程的均衡性或稳定性程度。性程度。3.3.它还是抽样分析和相关分析的重要指标。它还是抽样分析和相关分析的重要指标。注意:注意:标志变异指标的作用是在与平均指标结合中产生标志变异指标的作用是
6、在与平均指标结合中产生的,离开了平均指标,它就失去了意义。而它与平均指标的,离开了平均指标,它就失去了意义。而它与平均指标相结合,则可全面反映总体的特征,并对平均指标的代表相结合,则可全面反映总体的特征,并对平均指标的代表性做出评价。性做出评价。5PPT课件例:某车间两个生产小组各人日产量(件)如下:例:某车间两个生产小组各人日产量(件)如下:甲组:甲组:20 40 60 70 80 100 12020 40 60 70 80 100 120 乙组:乙组:67 68 69 70 71 72 7367 68 69 70 71 72 73 甲、乙两组工人的平均产量都为70件。通过观察可以看出,甲组
7、数据的变异程度较大,乙组数据的变异程度较小。也可以用图示的方法观察产量的变异情况:举例举例:衡量平均数代表性衡量平均数代表性6PPT课件甲组甲组乙组乙组结论:结论:标志变异程度和平均数的代表性呈反比关系。标志变异程度和平均数的代表性呈反比关系。产量差异产量差异程度较大程度较大产量差异产量差异程度较小程度较小7PPT课件举例:举例:反映社会经济活动过程的均衡性反映社会经济活动过程的均衡性观察:哪个厂供货比较均衡?观察:哪个厂供货比较均衡?钢厂钢厂供货计划完成百分比供货计划完成百分比(%)(%)季度总供货计季度总供货计划执行结果划执行结果一月一月二月二月三月三月甲厂甲厂100323434乙厂乙厂1
8、00203050表表8PPT课件(一)变异指标的种类(数值)(一)变异指标的种类(数值)绝对指标(与原变量值名数相同)绝对指标(与原变量值名数相同)相对指标(表现为无名数)相对指标(表现为无名数)全距全距平均差平均差标准差标准差全距全距系数系数平均差平均差系数系数标准差标准差系数系数 三、变异指标的计算方法三、变异指标的计算方法 9PPT课件分类:分类:全距全距 平均差平均差 标准差标准差 变异系数变异系数10PPT课件全距全距 R R(rangerange):测定标志变异程度的最测定标志变异程度的最简单的指标,它是标志的简单的指标,它是标志的最大值和最小值之差最大值和最小值之差,反,反映总体
9、标志值的变动范围。映总体标志值的变动范围。公式:全距最大标志值最小标志值公式:全距最大标志值最小标志值 RXmaxXmin评价:评价:从计算可知,全距仅取决于从计算可知,全距仅取决于两个极端两个极端数值数值,不能全面反映总体各单位标志值变异的程度,不能全面反映总体各单位标志值变异的程度,也不能拿来评价平均指标的代表性。也不能拿来评价平均指标的代表性。11PPT课件计算:R=XmaxXmin例、甲同学成绩全距例、甲同学成绩全距R=93 70=22(分分)乙同学成绩全距乙同学成绩全距R=98 51=47(分分)特点:计算方便,易于理解;特点:计算方便,易于理解;易受极端数值的影响。易受极端数值的影
10、响。12PPT课件计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)9090以下以下9090100100100100110110110110以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计18182490024900Xf 解:4080120109010110minmaxXXR对于组距数列,全距计算公式为:对于组距数列,全距计算公式为:RR最高组的上限值最高组的上限值最低组的下限值最低组的下限值表表13PPT课件全距的特点全距的特点 全距是测定标志变
11、动度的一种粗略方法。全距是测定标志变动度的一种粗略方法。优点:优点:计算简单,含义明确,对于测定对称分计算简单,含义明确,对于测定对称分布的数列具有特殊优点。布的数列具有特殊优点。缺点:缺点:它主要取决于极端数值,带有较大的偶它主要取决于极端数值,带有较大的偶然性,然性,往往不能充分反映现象的实际离散程度。往往不能充分反映现象的实际离散程度。14PPT课件2、用于比较不同总体数值的均衡性或、用于比较不同总体数值的均衡性或平均数的代表性;平均数的代表性;在两个总体或两组数据平均数相等时,要比较其平均数代表性大小,这时:全距较大的总体,其标志变异程度也较大,平均数的代表性较小,或社会经济活动过程的
12、均衡性或稳定性较差;反之,则相反。全距的作用全距的作用1、经常应用于生产过程的质量控制;、经常应用于生产过程的质量控制;15PPT课件平均差平均差A.DA.D (average deviationaverage deviation):):是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。简单平均差:A.D=加权平均差A.D=Nxxffxx16PPT课件根据未分组资料计算根据未分组资料计算 表表试问试问A、B 两课程的平均考分更有代表性?两课程的平均考分更有代表性?学生学生序号序号 考分(分
13、)考分(分)xAxB甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 858568687070767680808181合计合计 375375375375 AAxx平均数离差平均数离差-10-10-5-5 0 0 5 5 10 10解:解:BAxx离差绝对值离差绝对值 平均数离差平均数离差离差绝对值离差绝对值nxxDAAAA.(分分/人人)6 65 53 30 0nxxDABBB.(分分/人人)4 4.8 85 52 24 4 A.DAA.DB故,学生故,学生B 课程平均考分比课程平均考分比A 课程平均考分更有代表性。课程平均考分更有代表性。AAxx 10 10 5 5 0 0 5
14、5 10 103030BBxx-7-7-5-5 1 1 5 5 6 6BBxx 7 7 5 5 1 1 5 5 6 6242417PPT课件)(721007200公斤算术平均数:fXfX)(6.6100660.公斤平均差:ffXXDA556575852752275337512757200-17-73138524513519566018PPT课件不易受极端数值的影响,能较好地反映全不易受极端数值的影响,能较好地反映全部单位标志值的实际差异程度;平均差弥补了全距部单位标志值的实际差异程度;平均差弥补了全距之不足,它考虑了所有的标志值。之不足,它考虑了所有的标志值。用绝对值的形式消除各标志值与算术平
15、均数离用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于数学处理和参与统计分析运算。差的正负值问题,不便于数学处理和参与统计分析运算。3 3.平均差的特点平均差的特点 0 0 或或 0 0fxxxx)()(19PPT课件评价:评价:平均差意义明确,计算容易,平均差意义明确,计算容易,反应灵敏。但计算时要用绝对值,不适合反应灵敏。但计算时要用绝对值,不适合代数运算,因此在进一步统计分析中应用代数运算,因此在进一步统计分析中应用较少。较少。20PPT课件标准差标准差 (standard deviationstandard deviation):各:各单位标志值对其算术平均数的离差的单位
16、标志值对其算术平均数的离差的平方平方的的算术平均数的算术平均数的平方根平方根,反映的是各标志值对,反映的是各标志值对其平均数的平均差异程度。其平均数的平均差异程度。标准差是描述数标准差是描述数据离散程度的最常用的差异量。据离散程度的最常用的差异量。分类:简单标准差分类:简单标准差 加权标准差加权标准差21PPT课件公式公式:简单平均差:简单平均差:=加权平均差:=22PPT课件简捷计算:标志值数值较大、平均值未知,以A为假定平均数(一般取靠近中间的标志值或组中值)22nAXnAX未分组资料:22ffAXffAX分组资料:dffffdAXdAX22组距数列:23PPT课件学生学生序号序号 课程(
17、分)课程(分)xAxB甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 858568687070767680808181合计合计 375375375375 306306 136136平均数离差平均数离差离差平方离差平方平均数离差平均数离差离差平方离差平方BBxx-10-10-5-5 0 0 5 5 10 10 100 100 25 25 0 0 81 81 100 100-7-7-5-5 1 1 5 5 6 6 49 49 25 25 1 1 25 25 36 36问问A、B 那一门课程的平均考分更有代表性?那一门课程的平均考分更有代表性?解:解:nxx2A)(nxx2B)(因为因
18、为B课程标准差较小,所以课程标准差较小,所以B课程平均分比课程平均分比A课程平均分代表性大。课程平均分代表性大。2)AAxx(2)BBxx(AAxx分82.72.615306分分07.52.275136【例例2 2】根据未经分组的资料根据未经分组的资料表表75BAxx24PPT课件【例例】根据某车间根据某车间200200名工人加工零件的资料,计算工名工人加工零件的资料,计算工人的生产零件标准差。人的生产零件标准差。按零件数按零件数分组分组(个个)职工人职工人数数(人人)f)f404050505050606060607070707080808080909020204040808050501010
19、-合合 计计200200根据变量数列资料计算根据变量数列资料计算表表25PPT课件标准差计算表标准差计算表按零件数分按零件数分组组(个个)职工人数职工人数(人人)f)f组中组中值值x x40405050505060606060707070708080808090902020404080805050101045455555656575758585-19.5-19.5-9.5-9.50.50.510.510.520.520.5380.25380.2590.2590.250.250.25110.25110.25420.25420.25760576053610361020205512.55512.54
20、202.54202.5合合 计计2002002095020950 xx 2xxfxx2将表中计算结果代入公式,得到:将表中计算结果代入公式,得到:)(23.1020020950个ffxx2)(表表4-4-333326PPT课件1085XfX108521085XfX210855565758595105115-3-2-10123-30-38-500272824-399410149907650027567237127PPT课件)(85.1416439165371 222公斤 ddffffdAXdAX28PPT课件1 1、反映某总体各单位某种标志值的离散程度;、反映某总体各单位某种标志值的离散程度;2
21、 2、用于比较不同总体数值的均衡性或平均数的、用于比较不同总体数值的均衡性或平均数的代表性;代表性;在两个总体或两组数据平均数在两个总体或两组数据平均数相等相等时,要比较其平均时,要比较其平均数代表性大小,这时:数代表性大小,这时:标准差较大的总体,其标志变异程度也较大,标准差较大的总体,其标志变异程度也较大,平均数的代表性较小,或社会经济活动过程的平均数的代表性较小,或社会经济活动过程的均衡性或稳定性较差;反之,则相反。均衡性或稳定性较差;反之,则相反。3 3.标准差的作用标准差的作用 29PPT课件评价评价:标准差是表示一组数据离散程度的最好指:标准差是表示一组数据离散程度的最好指标,是统
22、计分析中最常用的差异量。标,是统计分析中最常用的差异量。标准差具备一个良好的差异量应具备的条件,如:标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。算等等。标准差表示一组数据的离散程度,须注意必须是标准差表示一组数据的离散程度,须注意必须是同一类数据同一类数据(即同一种测量工具的测量结果),而且(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。被比较样本的水平比较接近。30PPT课件 数据数据1 1:1 1、2 2、3 3、4 4、5 5 数据数据2 2:1010、2020、3030、4
23、040、5050显然显然,这两组数据的差别程度相同,而它们水平不同或平这两组数据的差别程度相同,而它们水平不同或平均数不同,这时就不能用绝对指标(标准差)比均数不同,这时就不能用绝对指标(标准差)比较它们的差异程度大小。较它们的差异程度大小。这时这时就要计算离散系数指标来比较它们之间的差别程度就要计算离散系数指标来比较它们之间的差别程度大小。大小。31PPT课件 如果如果两个数列平均水平两个数列平均水平不同,或不同,或两个数列标志值两个数列标志值的计量单位不同时的计量单位不同时,要比较其数列的变动度(即比较,要比较其数列的变动度(即比较其数列平均数的代表性大小),怎么办?其数列平均数的代表性大
24、小),怎么办?注意:这时需消除平均水平不同或计量单位不注意:这时需消除平均水平不同或计量单位不同的影响,同的影响,计算标志变异系数计算标志变异系数。是总体中变异指标与其算术平均是总体中变异指标与其算术平均数之比,以反映标志值差异的相对水平。数之比,以反映标志值差异的相对水平。变异系数变异系数(V):):)()xRD算算术术平平均均数数或或或或A A变变异异指指标标变变异异系系数数(32PPT课件标准差系数标准差系数离散系数指标的种类离散系数指标的种类100XDAVDA100XV在实际工作中运用最为广泛的是标准差系数指标。在实际工作中运用最为广泛的是标准差系数指标。%100XRVR33PPT课件
25、注意:注意:标准差与标准差系数的不同应用条件:标准差与标准差系数的不同应用条件:在比较两个不同数列(总体)标志变异程度大小在比较两个不同数列(总体)标志变异程度大小(或说明其平均数代表性大小)时,当(或说明其平均数代表性大小)时,当其平均水平相其平均水平相同同时,可直接时,可直接计算标准差计算标准差进行比较;当进行比较;当其平均水平不其平均水平不相同(或其计量单位不同)相同(或其计量单位不同)时,需消除平均水平不同时,需消除平均水平不同或计量单位不同的影响,计算或计量单位不同的影响,计算标准差系数标准差系数进行比较。进行比较。34PPT课件根据根据表:表:学生学生序号序号 考分(分)考分(分)
26、xAxC甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 85858080858590909595100100合计合计 375375450450 平均数离差平均数离差AAxx-10-10-5-5 0 0 5 5 10 10 解:解:7 75 5Ax离差平方离差平方2)AAxx(平均数离差平均数离差离差平方离差平方CCxx2)CCxx(-10-10-5-5 0 0 5 5 10 10 100 100 25 25 0 0 25 25 100 100 250 250 100 100 25 25 0 0 25 25 100 1002502509 90 0Cxnxx2A)(7 7.0 07
27、75 52 25 50 0nxx2C)(7 7.0 07 75 52 25 50 00 0.0 09 94 43 37 75 57 7.0 07 7xVA0 0.0 07 78 86 69 90 07 7.0 07 7xVC VAVC故,故,C 组平均考分更有代表性。组平均考分更有代表性。试问试问A、C 课程平均考分哪个更有代表性?课程平均考分哪个更有代表性?35PPT课件又如又如,甲、乙两个农场有关资料如甲、乙两个农场有关资料如 表表4-354-35:指指 标标甲农场甲农场乙农场乙农场 亩数(亩)亩数(亩)平均亩产量(斤平均亩产量(斤/亩亩 标准差(斤标准差(斤/亩)亩)80008000 6
28、00 600 15 151000010000 800 800 18 180 0.0 02 25 56 60 00 01 15 5甲甲xV0 0.0 02 22 25 58 80 00 01 18 8乙乙xV解:解:V甲甲V乙故,乙农场的粮食平均亩产量更有代表性。故,乙农场的粮食平均亩产量更有代表性。36PPT课件乙组大于甲组。散程度大于乙组,而是计算表明,并非甲组离乙甲计算离散系数来比较:组的水平相差悬殊,应都是不妥的。因为这两数代表性高于甲组,于乙组,或乙组的平均而断言甲组离散程度大乙甲件乙,件乙,乙组:件甲,件甲,甲组:资料:件产量两组不同水平的工人日%7.48%100%1.10%1004
29、1.319752.8075706560)(73.41V 707.07V )()7(X 2 )07(7 )70(X 例例37PPT课件小结:在两个总体或两组数据平均数小结:在两个总体或两组数据平均数不相等不相等时,时,要比较其平均数代表性大小,这时:要比较其平均数代表性大小,这时:标准差系数较大的总体,其标志变异程度也较标准差系数较大的总体,其标志变异程度也较大,平均数的代表性较小,或社会经济活动过大,平均数的代表性较小,或社会经济活动过程的均衡性或稳定性较差;反之,则相反。程的均衡性或稳定性较差;反之,则相反。也就是说标准差系数和标志值的离散程度成正也就是说标准差系数和标志值的离散程度成正大,
30、和平均数的代表性或现象的均衡性成反比。大,和平均数的代表性或现象的均衡性成反比。38PPT课件例如:两种不同水稻品种,分别在例如:两种不同水稻品种,分别在5 5个田块上试种,其产量如下:个田块上试种,其产量如下:要求:要求:分别计算两品种的单位面积产量。分别计算两品种的单位面积产量。计算两品种亩产量的标准差和标准差系数。计算两品种亩产量的标准差和标准差系数。假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广 甲品种乙品种田块面积产量田块面积产量1.2 1.2 1.11.11.01.00.90.90.80.8600495445540420
31、1.51.41.21.00.784077054052045039PPT课件因因V乙乙V甲,故乙品种具有较大稳定性,宜于推广甲,故乙品种具有较大稳定性,宜于推广40PPT课件应用条件:应用条件:当所对比的两个数列的平均水平当所对比的两个数列的平均水平高低相同时,就采用全距、平均差或标准差进行高低相同时,就采用全距、平均差或标准差进行对比分析,对比分析,当所对比的两个数列的水平高低不同当所对比的两个数列的水平高低不同时,时,其数值的大小不仅受各单位标志值差异程度其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响,而且受到总体单位标志值本身水平高低的影响;为了对比
32、分析不同水平的变量数列之间的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的标志值的变异程度,就必须消除数列水平高低的影响,影响,这时就要计算变异系数这时就要计算变异系数。41PPT课件是非标志:一个总体只能分为具有某一标志值的单位和不具有某标志值得单位两组。这种用“是”“否”“有”“无”来表示的标志称是非标志。是非标志表现:用“1”表示是用“0”表示非用p表示是出现的次数占总次数的比重用q表示非出现的次数占总次数的比重42PPT课件总体按所研总体按所研究标志不同究标志不同变量总体变量总体(研究数量标志)(研究数量标志)属性总体属性总体(研究品质标志)(研究品
33、质标志)在属性总体中,当所研究的标志,其表现只有两种属在属性总体中,当所研究的标志,其表现只有两种属性,性,即即“是是”或或“非非”时,将该属性总体称为时,将该属性总体称为是非标志是非标志总体。总体。例如:例如:学生按性别分组学生按性别分组男生男生女生女生(是)(是)(非)(非)企业按经济类型分组企业按经济类型分组国有企业国有企业集体企业集体企业(是)(是)个体企业个体企业其它企业其它企业(非)(非)(一)什么是是非标志总体(一)什么是是非标志总体43PPT课件 在在是非标志(属性)总体中,设总体有是非标志(属性)总体中,设总体有N个单位,其个单位,其中有中有N1个单位具有某种性质或属性(是的
34、属性),有个单位具有某种性质或属性(是的属性),有N0个单位不具有某种性质或属性(非的属性),个单位不具有某种性质或属性(非的属性),即即N1+N0=N 则,则,成成数数 NNP1 成成数数NNQ0即总体中即总体中具有某一属性的单位具有某一属性的单位数占总体单位数的比重数占总体单位数的比重即总体中不即总体中不具有某一属性的单具有某一属性的单位数占总体单位数的比重位数占总体单位数的比重 1QPPQ1 44PPT课件 由于由于品质标志(是非标志)品质标志(是非标志)的表现不能用数值的表现不能用数值表示,为了研究问题表示,为了研究问题方便,我们可以将方便,我们可以将品质标志(是非标志)品质标志(是非
35、标志)数量化数量化。即用。即用1 1表示单位标志表示单位标志为为“是是”的标志值的标志值(即具有某种性质的单位的(即具有某种性质的单位的标志值标志值););用用0 0表示单位表示单位标志为标志为“非非”的标志值的标志值(即不具有某种性质的单位的标志值)。(即不具有某种性质的单位的标志值)。表表4-364-36属性(是非标志)属性(是非标志)总体的平均数:总体的平均数:FXFXpPNNNNN10101PNNXp1FFXFXFX性性 别别标志值标志值 X 单位数单位数F频率(频率(概率)概率)FF 男(是)男(是)女(非)女(非)1 10 0N1 N0 P=N1 N Q=N0 N合合 计计 N1
36、145PPT课件性性 别别标志值标志值 X 单位数单位数F频率(频率(概率)概率)FF 男(是)男(是)女(非)女(非)1 10 0N1 N0 P=N1 N Q=N0 N合合 计计 N1 1FFXXx2)(属性(是非标志)总体的标准差:属性(是非标志)总体的标准差:FFXXpp2)()(PPp1NNPNP010122)()(QPPP22)()(01)()()(PPPP10122)(11PPPP)()(PP1表表4-4-373746PPT课件0 0.2 25 50 0.5 50 0.5 5)1(PPp2注意:当注意:当 P =0.50.5时,时,(最大)(最大)(PPp1218.0)95.01(95.095.054002095400380203804000101PQPXNNQNNPNNNpP所以有:,则件,件,件,己知47PPT课件是非标志的算术平均数:=p是非标志的标准差:=Xqp*)1(*pp48PPT课件