1、2022-10-30西南科技大学生命科学与工程学院周海廷制作1用Excel进行描述统计分析 实验三2022-10-30西南科技大学生命科学与工程学院周海廷制作2集中趋势的测定与分析集中趋势的测定与分析 1均值函数均值函数均值函数主要包括算术平均数、调和平均数和几何平均数。(1)算术平均数语法:AVERAGE(number1,number2,.)其中:Number1,number2,.为需要计算平均值的1到30个参数,参数可以是数字,或者是涉及数字的名称、数组和引用,如果数组或单元格引用参数中包含文字、逻辑值或空单元格,这些值将被忽略,但包含零值的单元格将计算在内。2022-10-30西南科技大
2、学生命科学与工程学院周海廷制作3(2 2)调和平均数)调和平均数语法:HARMEAN(number1,number2,.)其中:Number1,number2,.为需要计算其平均值的 1 到 30 个参数。(3 3)几何平均数)几何平均数语法:GEOMEAN(number1,number2,.)其中:Number1,number2,.为需要计算其平均值的1到30个参数。2022-10-30西南科技大学生命科学与工程学院周海廷制作42 2中位数(中位次数)函数中位数(中位次数)函数语法:语法:MEDIAN(number1,number2,.)MEDIAN(number1,number2,.)如果
3、参数集合中包含有偶数个数字,函数MEDIAN()将返回位于中间的两个数的平均值。3 3众数函数众数函数语法:语法:MODE(number1,number2,.)MODE(number1,number2,.)如果数据集合中不含有重复的数据,则MODE()函数返回错误值N/A。4 4最大(小)值函数最大(小)值函数语法:语法:MAX(number1,number2,.)MAX(number1,number2,.)MIN(number1,number2,.)如果参数不包含数字,函数MAX(MIN)返回0。2022-10-30西南科技大学生命科学与工程学院周海廷制作5例18-1:某商场家用电器销售情况
4、如图1所示。图18-1 某商场家用电器销售情况 2022-10-30西南科技大学生命科学与工程学院周海廷制作6(1)计算各种电器的全年平均销售量,如图2所示。图18-2 家用电器销售量平均数 2022-10-30西南科技大学生命科学与工程学院周海廷制作7(2)计算各种电器销售量的中位数,如图3所示。图18-3 家用电器销售量中位数 2022-10-30西南科技大学生命科学与工程学院周海廷制作8(3)计算各种电器销售量的众数,如图4所示。图18-4 家用电器销售量众数 2022-10-30西南科技大学生命科学与工程学院周海廷制作9离中趋势的测定与分析离中趋势的测定与分析 1 1样本标准差样本标准
5、差语法:语法:STDEV(number1,number2,.)STDEV(number1,number2,.)其中:Number1,number2,.为对应于构成总体样本的 1 到 30 个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数组单元格的引用。2022-10-30西南科技大学生命科学与工程学院周海廷制作102 2总体标准差总体标准差语法:语法:STDEVP(number1,number2,.)STDEVP(number1,number2,.)其中:Number1,number2,.为对应于样本总体的1到30个参数。可以不使用这种用逗号分隔参数的形式,而用单一数组,即对数
6、组单元格的引用。当样本数较多(n30)时,函数STDEV()和STDEVP()计算结果差不多相等。2022-10-30西南科技大学生命科学与工程学院周海廷制作11例18-2:使用例18-1资料,计算各家电销售量的总体标准差,如图18-5所示。样本标准差的计算方法与总体标准差相同。图18-5 计算总体标准差 2022-10-30西南科技大学生命科学与工程学院周海廷制作123 3 四分位数与四分位距四分位数与四分位距语法:语法:QUARTILE(array,quart)QUARTILE(array,quart)array:需要求四分位数值的数组或数字型单元格区域。quart:决定返回哪一个四分位值
7、。quart值 函数QUARTILE返回值 0最小数值 1第一个四分位数(第25个百分排位)2中分位数(第50个百分排位)3第三个四分位数(第75个百分排位)4最大数值 表1 Quart值与QUARTILE返回值的对应关系 2022-10-30西南科技大学生命科学与工程学院周海廷制作13四分位距是总体中第四分位距是总体中第3 3四分位数与第四分位数与第1 1四分位数之四分位数之差。差。例18-3:使用例1资料,计算四分位数和四分位距,如图18-6所示。图18-6 计算四分位数和四分位距 2022-10-30西南科技大学生命科学与工程学院周海廷制作14分布形态的测定与分析分布形态的测定与分析 分
8、析总体次数的分布形态有助于识别整个总体的数量特征。总体的分布形态可以从两个角度考虑,一是分布的对称程度,另一个是分布的高低。前者的测定参数称为偏度或偏斜度偏度或偏斜度,后者的测定参数称为峰度峰度。2022-10-30西南科技大学生命科学与工程学院周海廷制作151 1偏度函数偏度函数语法:语法:SKEW(number1,number2,.)SKEW(number1,number2,.)其中:Number1,number2.为需要计算偏斜度的1到30个参数。2 2峰度函数峰度函数语法:语法:KURT(number1,number2,.)KURT(number1,number2,.)其中:Numbe
9、r1,number2,.为需要计算峰值的1到30个参数。2022-10-30西南科技大学生命科学与工程学院周海廷制作16例18-4:使用例18-1资料,计算各家电销售量的偏度和峰度,如图7所示。图18-7 销售量的偏度和峰度 2022-10-30西南科技大学生命科学与工程学院周海廷制作17偏度为0时为正态分布,正值时为正偏态(峰向左倾),负值时为负偏态(峰向右倾),峰度为0时为正态峰,正值时为尖峰,负值时为平峰。2022-10-30西南科技大学生命科学与工程学院周海廷制作18参数估计 2022-10-30西南科技大学生命科学与工程学院周海廷制作19总体均值区间估计的基本内容总体均值区间估计的基
10、本内容1总体方差总体方差2已知,求已知,求的置信区间的置信区间当总体方差2已知时,在置信度为的情况下,可以构造总体均值的置信区间为:利用利用Excel计算总体均值置信区间计算总体均值置信区间nzxnzx22,2022-10-30西南科技大学生命科学与工程学院周海廷制作202总体方差总体方差2未知,求未知,求的置信区间的置信区间当总体服从正态分布,总体方差2未知时,要用样本方差代替2来建立置信区间。这时,新的统计量不服从标准正态分布,而是服从于自由度为的t分布,在置信度为的情况下,可以构造均值的置信区间为:nstxnstx22,2022-10-30西南科技大学生命科学与工程学院周海廷制作21例2
11、0-1:从某班男生中随机抽取10名学生,测得其身高(cm)分别为170、175、172、168、165、178、180、176、177、164,以95%的置信度估计本班男生的平均身高。(1)建立工作表,将以上数据录入。(2)分别计算样本个数、样本的平均数、样本标准差、样本标准误差、对应于置信度95%的概率度、抽样极限误差、置信区间的上、下限。计算结果如图20-1所示。2022-10-30西南科技大学生命科学与工程学院周海廷制作22图20-1 总体均值置信区间的计算 2022-10-30西南科技大学生命科学与工程学院周海廷制作23必要抽样容量的计算公式必要抽样容量的计算公式在其他条件相同的情况下
12、,抽样单位数越多,抽样误差越小,抽样单位数越少,抽样误差越大。确定抽样数目,应考虑以下几个问题:(1)被调查总体的标志变动程度(2)对推断精确度的要求,即被允许的抽样误差范围。(3)对推断把握程度的要求。(4)抽取调查单位的方式。利用利用Excel计算必要样本单位数计算必要样本单位数 2022-10-30西南科技大学生命科学与工程学院周海廷制作24用样本均值估计总体均值时所允许的最大绝对误差是抽样极限误差,它表示抽样误差的可能范围,又称允许误差。如果用表示抽样极限误差,则那么样本容量n 的大小则为nz22222zn2022-10-30西南科技大学生命科学与工程学院周海廷制作25例20-2:某县
13、进行农村经济情况调查,已知农户平均年收入标准差为30元,要求把握程度(置信度)为95.45%,抽样极限误差为5元,计算应抽取的样本户数?(1)建立“样本容量计算”工作表。(2)分别计算与置信度95.45%对应的z值、样本容量并对其取整。计算结果如图20-2所示。2022-10-30西南科技大学生命科学与工程学院周海廷制作26图20-2 必要样本容量计算 2022-10-30西南科技大学生命科学与工程学院周海廷制作27总体标准差及方差的估计总体标准差及方差的估计 方差估计的内容和工作表函数1 1大样本情况下总体标准差的区间估计大样本情况下总体标准差的区间估计只要样本足够大,样本标准差s就服从正态
14、分布,其均值近似等于总体标准差,其标准差 ,所以在置信度为时,的置信区间为:ns2)(nzsnzs2,2222022-10-30西南科技大学生命科学与工程学院周海廷制作282 2小样本情况下正态总体方差的置信区间小样本情况下正态总体方差的置信区间设为来自均值为、方差为2的正态总体,、2均为未知,则2的点估计量为,且,那么置信度为时总体方差的置信区间为)1()1(222nxsn11,112222212nxsnnxsn2022-10-30西南科技大学生命科学与工程学院周海廷制作29Excel提供了两个用于方差估计的工作表函数。(1 1)卡方分布函数)卡方分布函数语法:CHIDIST(x,degre
15、es_freedom)其 中:x 为 用 来 计 算 分 布 的 数 值,degrees_freedom为自由度。(2 2)卡方分布反函数)卡方分布反函数语法:CHIINV(probability,degrees_freedom)其中:probability为卡方分布的单尾概率,degrees_freedom 为自由度。2022-10-30西南科技大学生命科学与工程学院周海廷制作30总体方差的置信区间总体方差的置信区间例3:对某机床生产的一批模具随机抽取20件进行尺寸检测,其尺寸的标准差为0.5毫米,假定总体服从正态分布,以95%的置信度估计这批模具尺寸的方差的置信区间。由于总体方差未知,且又
16、是小样本,所以使用分布进行区间估计。在95%的置信度下,分布的右侧置信度为0.025,左侧置信度为0.975。2022-10-30西南科技大学生命科学与工程学院周海廷制作31(1)建立“方差区间估计”工作表,输入相关数据。(2)分别计算卡方右侧临界值、卡方左侧临界值、总体方差上限、总体方差下限、总体标准差上限、总体标准差下限。计算结果如下图所示。2022-10-30西南科技大学生命科学与工程学院周海廷制作32假设检验 2022-10-30西南科技大学生命科学与工程学院周海廷制作33假设检验的基本思想和步骤假设检验的基本思想和步骤 1 假设检验的基本思想假设检验的基本思想假设检验是根据样本的信息
17、来判断总体分布是否具有指定的特征。在数理统计中,把需要用样本判断正确与否的命题称为一个假设。根据研究目的提出的假设称为原假设,记为H0;其对立面假设称为备择假设(或对立假设),记为HA。提出假设之后,要用适当的统计方法决定是否接受假设,称为假设检验或统计假设检验。2022-10-30西南科技大学生命科学与工程学院周海廷制作34例21-1:某厂为了提高其产品的寿命进行了工艺改革,从生产的一大批产品中随机抽取10只,测得其样本均值小时,已知旧工艺条件下的产品寿命服从正态分布N(200,52),试问新产品的寿命与旧产品的寿命是否一致。一般说来,工艺条件的变化只影响均值,而对方差影响不大。因此,可以认
18、为新产品寿命服从正态分布N(,52),是未知的,而=200是否成立也是未知的。2022-10-30西南科技大学生命科学与工程学院周海廷制作35如果原如果原假设=200=200成立,那么成立,那么x x N N(200,5(200,52 2),从而,从而由单个总体的抽样分布的结论可知:由单个总体的抽样分布的结论可知:,统计量,统计量)10/25,200(101101Nxxkk)1,0(10/5200Nxz对于给定的=0.05,令,或 95.0110/52002zxP05.0 10/52002zxP2022-10-30西南科技大学生命科学与工程学院周海廷制作36由于观测值 ,因此统计量z的观测值z
19、0满足 而由前可知,是一个小概率。8.204x2096.1306.310/52008.204Zz2022-10-30西南科技大学生命科学与工程学院周海廷制作372 2 假设检验的基本步骤假设检验的基本步骤(1)构造假设(2)确定检验的统计量及其分布(3)确定显著性水平(4)确定决策规则 (5)判断决策 2022-10-30西南科技大学生命科学与工程学院周海廷制作381 1 构造检验统计量构造检验统计量设总体X服从正态分布N(,2),方差2已知,可以通过构造一个服从正态分布的统计量z来进行关于均值的假设检验。设是来自正态总体X的一个简单随机样本,样本均值为,根据单个总体的抽样分布结论,选用统计量
20、 总体标准差已知条件下均值总体标准差已知条件下均值双侧检验双侧检验 niixnx11nxz/2022-10-30西南科技大学生命科学与工程学院周海廷制作39例21-2:某大学一年级新生女生的身高服从正态分布,平均身高为162.5cm,标准差为6.9cm。若从全校女生中随机抽取50名组成随机样本,平均身高为165.2cm,则在=0.05的显著性水平上,是否有理由相信女生总体的平均身高有所改变。设原假设H0:=162.5;备择假设H1:162.5。(1)建立“双侧检验”工作表,输入已知数据。(2)分别计算标准误差和统计量z值,计算结果如图21-1所示。2022-10-30西南科技大学生命科学与工程学院周海廷制作40图21-1 计算结果 2022-10-30西南科技大学生命科学与工程学院周海廷制作41Thank you very much!Thank you very much!