1、NxNxxxniiN121nxnxxxxniin121该该班班4040名同学统计学的平均成绩为:名同学统计学的平均成绩为:分)(23.774030894075787064nxxKiiKiiiKKKffxffffxfxfx11212211 简写为:简写为:fxfniikiiikkkffxffffxfxfxx11212211fxfx 简写为:ffxxffx样本均值:总体均值:ff)(5.76403060分fxfxf某班级某班级40名同学统计学的考试成绩名同学统计学的考试成绩:该班该班40名同学统计学的平均成绩为:名同学统计学的平均成绩为:ff)(5.761.09525.0854.0752.0650
2、5.055分ffxx 加权均值(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下:甲组:甲组:考试成绩(考试成绩(x):0 20 100 人数分布(人数分布(f):):1 1 8 乙组:乙组:考试成绩(考试成绩(x):0 20 100 人数分布(人数分布(f):):8 1 1分)甲(8210810012010fxfx分)乙(1210110012080fxfx6%40 10%90 15%14032.412%4090 140270 xfxf相对数的平均数相对数的平均数【例例】某公司所属某公司所属11个企业资金利润率分组资料如下表,个企业资金利润率分组资料如下表,要求计算该公
3、司要求计算该公司11个企业的平均利润率:个企业的平均利润率:该公司该公司10个企业的平均利润率为个企业的平均利润率为:0)(xx0)(fxx均值的数学性质1.数值观测值与均值的离差之和等于0或2.数值观测值与均值的离差平方和最小最小)min()(2xx最小)min()(2fxx或3.均值易受极端值的影响1.用于数值型分组数据 2.众数的值与相邻两组频数的分布有关3.相邻两组的频数相等时,众数组的组中值即为众数4.相邻两组的频数不相等时,众数采用下面的计算公式:分组数据的众数分组数据的众数(要点及计算公式)112oMLd 212oMUd 分组数据的众数分组数据的众数 (例题分析)(33.4331
4、00)1842()3042(3042400万元oM【例例】某地区120家企业按利润额进行分组,结果如下:min1eniiMx三、中位数三、中位数(median)(一)中位数的概念(一)中位数的概念21n中位数位置2n中位数位置(二)中位数的位置(二)中位数的位置521921n位置5.5211021n位置102021080960中位数12memfSMLdf分组数据的中位数(要点及计算公式)1.用于数值型分组数据 2.根据位置公式确定中位数所在的组3.下限与上限计算公式分别为:12memfSMUdf)(19.42610042492120400元eM分组数据的中位数 (例题分析)【例例】某地区120
5、家企业按利润额进行分组,结果如下:4)1(341ULnQnQ位置位置434ULnQnQ位置位置(二)分位数的位置(二)分位数的位置5.74)19(35.2419UL位置位置QQ15652163015008152850780ULQQ25.84)110(375.24110UL位置位置QQ5.1532)15001630(25.015005.772)750780(75.0750ULQQeoeoeeMMXMMMMX)(2)2或()3(21)2(3123oeoeeoMMXXMMXMM)3(21)2(3123oeoeeoMMXXMMXMM则:离散程度就是测度各变量值远离其中心值的程度,有以下的作用:1.判断
6、平均数对一组数据代表性的高低2.离散程度的测度值可以对社会经济活动过程的节奏性 和均衡性进行评价3.离散程度的测度值是统计推断理论中一个很重要的基础指标4.离散程度的测度值是衡量风险大小的重要指标22()XN2()XN22()Xff(二)总体方差和标准差方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式2()Xff总体标准差(例题分析)含义:含义:【例例】某班级某班级40名同学统计学的考试成绩名同学统计学的考试成绩:分)(14.1075.102404110)(2ffx分5.76x样本方差和标准差方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式22()1xxsn2()1xx
7、sn22()1xxfsf2()1xxfsf方差的数学性质1.变量的方差等于变量平方的平均数减去变量平均数的平方 22()XX22.各变量值对算术平均数的方差,小于等于对各变量值对算术平均数的方差,小于等于对任意常数的方差任意常数的方差 2()XXN2()XAN四、标准分数1.标准分也称标准化值2.对某一个值在一组数据中相对位置的度量3.可用于判断一组数据是否有离群点4.用于对变量的标准化处理5.计算公式为xzxxzs经验法则表明:当一组数据对称分布时约有68.27%的数据在平均数加减1个标准差的范围之内约有95.00%的数据在平均数加减1.96个标准差的范围之内约有95.45%的数据在平均数加
8、减2个标准差的范围之内约有99.73%的数据在平均数加减3个标准差的范围之内 经验法则vxsvs)(19.309)(25.53611万元万元sx)(09.23)(5215.3222万元万元sx偏态与峰态分布的形状偏态偏态峰态峰态(一)偏态的概念(一)偏态的概念1.统计学家统计学家Pearson于于1895年首次提出年首次提出 2.数据分布偏斜程度的测度,数据分布的数据分布偏斜程度的测度,数据分布的不对称性称为偏态。不对称性称为偏态。3.偏态系数偏态系数=0为为对称分布对称分布 偏态系数偏态系数0为为右偏分布右偏分布 偏态系数偏态系数0为为左偏分布左偏分布二、偏态系数二、偏态系数(skewnes
9、s coefficient)1.根据原始数据计算根据原始数据计算2.根据分组数据计算根据分组数据计算33)(nsxxSK33)()(sffxxSK(一)峰态的概念(一)峰态的概念1.统计学家统计学家Pearson于于1905年首次提出年首次提出2.数据分布扁平程度的测度,反映数据分数据分布扁平程度的测度,反映数据分布的尖峭程度(与正态分布比较)。布的尖峭程度(与正态分布比较)。3.峰态系数峰态系数=0为为峰度适中峰度适中 峰态系数峰态系数0为为尖峰分布尖峰分布(二)峰态系数(二)峰态系数(kurtosis coefficient)1.根据原始数据计算根据原始数据计算4224)3)(2)(1()1()(3)()1(snnnnxxxxnnKii2.根据分组数据计算根据分组数据计算44)()(sffxxK第三章结束了第三章结束了!