1、1第三章第三章 集中量集中量第一节第一节 算术平均数算术平均数 第二节第二节 中位数和百分位数中位数和百分位数 第三节第三节 众数众数 第四节第四节 其他度量其他度量23小贴士小贴士4小贴士小贴士集中趋势1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定5第一节第一节 算术平均数算术平均数 一、算术平均数的概念一、算术平均数的概念算
2、术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。6算术平均数的特性:第一,观察值的总和等于算术平均数的N倍第二,各观察值与算术平均数之差的总和等于零。第三,若一组观察值是由两部分(或几部分)组成,这组观察值的算术平均数可以由组成部分的算术平均数而求得。7小贴士小贴士算术平均数:1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于称名数据和顺序数据8二、均值的计算方法二、均值的计算方法 9简单均值 (算例)原始数据:1059136810加权均值(算例)表表3-8 某车间某车间50名工人日加工零件均值计算表名工人日加工
3、零件均值计算表按零件数分组按零件数分组组中值(组中值(Xi)频数(频数(Fi)XiFi105110110115115120120125125130130135135140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计合计506160.011均 值 (数学性质)1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小12均 值 (数学性质)3.每一个数加一个常数 C,所得均值等于原均值加上 常数 C 4.每一个数乘以一个常数 C,所得均值等于原均值乘 以常数 C13
4、三、均值的应用及其优缺点三、均值的应用及其优缺点优点:反应灵敏;计算简单、严密确定;适合进一步代数运算;受抽样变动的影响较小。缺点:易受极端数据的影响;出现模糊不清得数据时,无法计算。应用:数据同质性原则;一组数据中每个数据都比较准确、可靠;无极端值的影响;而且还要通过它计算其他统计量。14第二节第二节 中位数中位数 一、中位数的概念:一、中位数的概念:中位数是位于依一定大小顺序排列的一组数据中央位置的数值,大于及小于这一数值各有一半数据分布着。15小贴士小贴士1.集中趋势的测度值之一2.排序后处于中间位置上的值,记为 Md3.不受极端值的影响4.主要用于顺序数据,也可用数值型数据,但不能用于
5、称名数据5.各变量值与中位数的离差绝对值之和最小,即16 二、中位数的计算方法二、中位数的计算方法 1、原始数据的计算方法 17 顺序数据的中位数(算例)【例3.4】解表表3-4 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计30018原始数据的中位数(5个数据的算例)原始数据:24 22 21 26 20排 序:20 21 22 24 26位 置:1 2 3 4 519原始数据的
6、中位数(6个数据的算例)原始数据:10 5 9 12 6 8排 序:5 6 8 9 10 12位 置:1 2 3 4 5 620根据位置公式确定中位数所在的组采用下列近似公式计算:该公式假定中位数组的频数在该组内均匀分布2.频数分布表计算法 21频数分布表的中位数(算例)表表3-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计50【例3.5】22三、百分位数的概念及其计算方法三、百分
7、位数的概念及其计算方法1.百分位数的概念百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。在教育测量中,常通过计算某个原始分数所属的百分位数来说明、解释、评价它在团体中的位置。2.百分位数的计算方法23四、中位数的特点与应用四、中位数的特点与应用优点:简单、容易理解,稳健。缺点:不稳定、受抽样影响大;计算时不用所有数据;计算时要对数据先排序;总数乘以众数不等于数据的总和;不能作进一步代数运算。应用:一般用在下列情形:当数据有极端值;两端数据或个别数据不清楚;需要快速估计一组数据的代表值。24第三节第三节 众数(众数(mode)25一、众数的概念要点一、众数的概念要点1.集中趋势的测度
8、值之一2.出现次数最多的变量值,用 M0 表示3.不受极端值的影响4.可能没有众数或有几个众数5.有理论众数与粗略众数 26众数的不唯一性无众数原始数据原始数据:10 5 9 12 6 8一个众数多于一个众数27二、众数的计算方法二、众数的计算方法1.用观察法直接寻找粗略众数例如,一组原始数据2、4、3、6、4、5、428 称名数据的众数(算例)表表3-1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告1
9、12519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100【例3.1】解29 顺序数据的众数(算例)【例3.2】表表3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0302.用公式求理论众数的近似值:(1)皮尔逊的经验法:频数分布呈正态或接近正态时才能使用。31(2)金氏插补法 众数的值
10、与相邻两组频数的分布有关 该公式假定众数组的频数在众数组内均匀分布 相邻两组的频数相等时,众数组的组中值即为众数相邻两组的频数不相等时,众数采用下列近似公式计算32数值型分组数据的众数(算例)表表3-3 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数105110110115115120120125125130130135135140358141064381630404650合计合计5033三、众数的特点与应用三、众数的特点与应用优点:简单、容易理解。缺点:不稳定、受分组影响;计算时不用所有数据;总数乘以众数不等于数据
11、的总和;不能作进一步代数运算。应用:一般用在下列情形:需要快速确定一组数据的代表值;数据不同质;当数据有极端值;34小贴士小贴士35小贴士小贴士1.众数众数不受极端值影响不受极端值影响具有不惟一性具有不惟一性数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用2.中位数中位数不受极端值影响不受极端值影响数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用3.平均数平均数易受极端值影响易受极端值影响数学性质优良数学性质优良数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用363.4 其他度量其他度量一、加权平均数一、加权平均数加权平均数是不同数据(或平均数)的平均数。计算公式有两种
12、形式:37二、几何平均数二、几何平均数 1.集中趋势的测度值之一集中趋势的测度值之一2.N 个变量值乘积的个变量值乘积的 N 次方根次方根3.主要用于计算平均发展速度主要用于计算平均发展速度4.计算公式为计算公式为38几何平均数的应用几何平均数的应用学习进步率学习进步率【例例3.9】在一项有关阅读能力的实验中,得到这样的在一项有关阅读能力的实验中,得到这样的结果。阅读的遍数与每遍理解的程度依次是:第一结果。阅读的遍数与每遍理解的程度依次是:第一遍为遍为40,第二遍为,第二遍为52,第三遍为,第三遍为65,第四,第四遍为遍为75,第五遍为,第五遍为86,第六遍为,第六遍为97。在该。在该实验研究
13、中被试阅读能力的平均进步率是多少?阅实验研究中被试阅读能力的平均进步率是多少?阅读能力的平均增加比率又是多少。读能力的平均增加比率又是多少。39计算步骤和过程计算步骤和过程阅读遍数阅读遍数理解程度理解程度(%)增加比率增加比率比例比例(Xi/Xi-1)对数对数lg(Xi/Xi-1)140(X1)252(X2)1.3000.1139365(X3)1.2500.0969475(X4)1.1540.0621586(X5)1.1470.0594697(X6)1.1280.0523合计合计N65.9790.3846lgMg=0.3846/5=0.07692;Mg=1.19377表表3-940【例例3.1
14、0】有一个学生第一周记住有一个学生第一周记住20个英文单词,个英文单词,第二周记住第二周记住23个,第三周记住个,第三周记住26个,第四周记住个,第四周记住30个,第五周记住个,第五周记住34个,问该生学习记忆英文单个,问该生学习记忆英文单词的平均进步率是多少?词的平均进步率是多少?32111211NNNNNXXXXMgXXXX6 11197197;lglg;405401.1938.NNXMgMgXMg41几何平均数的应用几何平均数的应用人数、经费增加率人数、经费增加率【例例3.11】某校连续四年的毕业人数为:某校连续四年的毕业人数为:980、1100、1200、1300人,问毕业生平均增长率
15、是多少?若该校人,问毕业生平均增长率是多少?若该校毕业生一直按此增长率变化,问再过五年后的毕业人数毕业生一直按此增长率变化,问再过五年后的毕业人数是多少?是多少?123434,980,1100,1200,13001300/9801.098767NXXXXMg51300(1.098767)2082()人42【例例3.12】某校某校1950年的教育经费是年的教育经费是10万元,万元,1982年的教育经费是年的教育经费是121万元,问该校教育经费万元,问该校教育经费年增长率是多少?若一直按此比率增加,年增长率是多少?若一直按此比率增加,1990年年该校的教育经费是多少?该校的教育经费是多少?1333
16、210,121,121/101.081.XXMg8121(1.081)225.63()万元43三、调和平均数三、调和平均数 1.集中趋势的测度值之一集中趋势的测度值之一2.均值的另一种表现形式均值的另一种表现形式3.一组数据倒数的算术平均数的倒数一组数据倒数的算术平均数的倒数4.易受极端值的影响易受极端值的影响5.用于用于 比率数据,描述学习速度比率数据,描述学习速度6.不能用于称名数据和不能用于称名数据和 顺序数据顺序数据7.计算公式为计算公式为44调和平均数的应用调和平均数的应用主要用来描述学习速度方面的问题主要用来描述学习速度方面的问题反应指标一般有两种形式:反应指标一般有两种形式:(1
17、)学习任务量相同而所用时间不等;(2)学习的时间相同,而工作量不等。先求出单位时间的工作量,其调和平均就是平先求出单位时间的工作量,其调和平均就是平均学习速度均学习速度45【例例3.13】():调和平均数的应用举例调和平均数的应用举例123456123456101010101010,.0.81.01.21.52.55.065111111HXXXXXXMXXXXXX46【例例3.14】()解解:调和平均数的应用举例调和平均数的应用举例12345612345612,10,8,6,4,2.64.9111111HXXXXXXMXXXXXX47小贴士小贴士表表4-4 数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型称名数据称名数据 顺序数据顺序数据 等距数据等距数据 比率数据比率数据适适用用的的测测度度值值众数众数中位数中位数均值均值均值均值 众数众数 众数众数调和平均数调和平均数 中位数中位数几何平均数几何平均数 中位数中位数众数众数 -