1、社会统计学社会统计学Social Statistics社会统计学社会统计学Social Statistics课件格式和使用方法说明课件格式:一级标题,一、22号黑体加粗,红色二级标题,(一)、22黑体,蓝色三级标题,1、22号黑体,黑色正文22号宋体,黑色。仅重点文字加粗或变色。使用方法:点击课件总目录中的章标题左边的数字,可直接跳至相应章。点击各章首页的章目录中的各节左边的数字,可跳至相应各节。点击每页右下方的箭头,可直接回到课件总目录。(此页可删)1 绪论 单变量的描述统计分析 两个类别变量关系的描述统计 两个尺度变量关系的描述统计 类别变量与尺度变量关系的描述统计 概率与随机变量的概率分
2、布 大数定律、中心极限定理与抽样分布 参数估计 假设检验的基本原理 总体均值与方差的假设检验 两个类别变量关系的假设检验 两个尺度变量关系的假设检验 类别变量与尺度变量关系的假设检验 非参数检验 抽样 时间序列目录目录2345679810111213141516第十三章类别变量与尺度变量关系第十三章类别变量与尺度变量关系的假设检验的假设检验一元方差分析一元方差分析 1一元方差分析的原理2方差分析方法Exe本章习题一一、一元方差分析的统计思想一元方差分析的统计思想 类别变量与尺度变量之间关系的分析方法是比较在自变量取不同值时,因变量的平均值是否有差异。如果当自变量取不同值时,因变量的平均值有较大
3、差异,则认为自变量与因变量有相关。如果上述分析是基于随机样本数据计算的,而且分析的目的是要把样本的计算结果推论总体,就应用方差分析法进行假设检验。方差分析的目的是明确在样本中当自变量取不同类别时,因变量平均值的差异达到多大时能够确认总体中各个类别因变量的平均值差异显著。方差分析的思想是将样本的全部离差平方和分解为组间离差平方和和组内离差平方和。组间离差平方和组间离差平方和反映的是各类别均值的差异,它由自变量决定,自变量对因变量的影响作用越大组间离差平方和就越大。如果组间离差平方和大而组内离差平方和小,说明因变量的离散程度主要是由自变量导致的,可以认为当自变量取不同水平时因变量平均值的差异显著,
4、两个变量存在相关。第十三章类别变量与尺度变量关系的假设检验一元方差分析 第一节 一元方差分析的原理二二、离差平方和的分解离差平方和的分解 设有两个变量x和y。x为类别变量,共分为 个类别。y为尺度变量。现从中作如下随机抽样:A1类中抽n1个,A2类中抽n2个,Am类中抽nm个。然后计算每个类别变量 的平均值。第十三章类别变量与尺度变量关系的假设检验一元方差分析 第一节 一元方差分析的原理组平均值组平均值 二二、离差平方和的分解离差平方和的分解1、总离差的平方和TSS对所有的观测值计算总平均值 总离差的平方和:总离差的平方和:所有个案相对于总平均值的离差平方和。2 2、组内离差平方和(剩余平方和
5、)、组内离差平方和(剩余平方和)WSS WSS:每一类别中的个案相对于这个类别平均值的离差平方和,也称为剩余平方和。它反映的是除自变量以外其它因素所导致的变化。3 3、组间离差平方和、组间离差平方和BSSBSS:以每一组的平均值取代了该组的全部个案之后,计算的相对于总平均值的离差平方和。它反映的是自变量对因变量的影响。4 4、三者关系、三者关系:【例例13-1】计算【例5.2】中不同文化程度的居民住房面积分布的平均值与离差平方和。【例例13-1】计算【例5.2】中不同文化程度的居民住房面积分布的平均值与离差平方和。【例例13-1】计算【例5.2】中不同文化程度的居民住房面积分布的平均值与离差平
6、方和。一一、方差分析的假定条件方差分析的假定条件(一)等方差性等方差性假定指的是总体中自变量X的每一个取值 所对应的Y的分布都具有相同的方差,即 第十三章类别变量与尺度变量关系的假设检验一元方差分析 第二节 方差分析方法一一、方差分析的假定条件方差分析的假定条件(一)等方差性p使用SPSS统计软件进行分析时,通过选项可以选择等方差性检验.p简单的判断方法是在k个样本方差中最大方差与最小方差相比不超过3倍即可以视为总体的分布等方差。即:p当总体不满足等方差假定时,则意味着总体中的各个类别之间存在显著差异,则无需再做均值是否相等的检验。p等方差性假定实际上是要求总体中各个类别的平均值具有可比性。如
7、果两个类别的离散程度差异过大,即便它们的均值相等,也不应该得出两个类别无显著差异的结论。【例例13-213-2】用【例5.2】中的数据检验总体中不同文化程度的居民住房面积分布是否具有等方差性。可见可见例【5.2】中不同文化程度的居民住房面积分布满足等方差假定。一一、方差分析的假定条件方差分析的假定条件(二)正态性p正态性假定指的是在总体中当X取值为Ai时,对应的 的分布应为正态。p如果总体分布为未知,可以根据样本值来估计总体分布。当样本容量足够大时,可以制作当 时因变量分布的直方图。通过直方图看其是否满足正态分布。如果样本容量不够大。当 时,的个数太少,看不出分 布 特 征 时,可 以 将 观
8、 测 值 减 去 各 自 所 在 组 的 均值:,然后将所有的 作成直方图。也可以采用非参数检验的方法根据样本分布检验总体是否服从正态分布(见第十四章,第一节)。第十三章类别变量与尺度变量关系的假设检验一元方差分析 第二节 方差分析方法一一、方差分析的假定条件方差分析的假定条件(二)正态性p正态性假定指的是在总体中当X取值为Ai时,对应的 的分布应为正态。第十三章类别变量与尺度变量关系的假设检验一元方差分析 第二节 方差分析方法二二、方差分析的方法方差分析的方法(一)方差分析的原假设与备择假设因为方差分析的目的是要明确总体中当自变量取不同类别时因变量均值的差异是否显著。因此方差分析的原假设是:
9、,即总体中各个类别的均值相等。备择假设为:至少有一个类别的均值与其它类别不相等。(二)方差分析检验的统计量在原假设成立的条件下,样本中各个类别的均值差异很大的可能性是很小的。如果用样本观察值计算的F统计量的值很大,比如远远大于1。就意味着在总离差平方和中组间离差平方和占的比例大,因变量的离散程度主要是由自变量导致的。我们就拒绝原假设,认为在总体中各个类别的平均值差异显著。二二、方差分析的方法方差分析的方法(三)根据小概率标准确定临界值、接受域和拒绝域第十三章类别变量与尺度变量关系的假设检验一元方差分析 第二节 方差分析方法对于给定的显著性水平 ,通过查F分布表可以确定临界值 由于F值越大,越有
10、利于拒绝原假设。F值越小,越有利于接受原假设。因此F检验是一个单侧检验。拒绝域为:二二、方差分析的方法方差分析的方法(四)确定是否拒绝原假设 第十三章类别变量与尺度变量关系的假设检验一元方差分析 第二节 方差分析方法如果如果利用样本数据计算的F值小于 ,可以接受原假设,认为总体中各个类别的平均值无显著差异。如果如果利用样本数据计算的F值大于 ,就拒绝原假设。此时,可以确定总体中当自变量取不同水平时,各个类别因变量平均值的差异显著。也可以认为至少有一个类别的因变量的平均值与其它类别相比差异显著。【例例13-313-3】利用【例5.2】的数据检验该城市中不同文化程度的居民住房面积是否有显著差异。(
11、)解解:已知 m=6 n=46例13-1中已经计算得:查表得:结论结论:因为 。所以,拒绝原假设,不同文化程度居民的住房面积有显著差异。原假设和备择假设:三三、F F检验与相关比率的关系检验与相关比率的关系(四)确定是否拒绝原假设相关比率 是描述类别变量与尺度变量关系的特征值。是基于消减误差比例的思想建构的。但它与F检验具有一致性。p相同点相同点:在 和F的计算公式的分子中都含有组间离差平方和BSS。所以如果计算的F值较大,相关比率的值也会较大。p不同点:不同点:比率所描述的是组间离差平方和在总离差平方和中所占的比例。而F值描述的是平均组间离差平方和是平均组内离差平方和的几倍。如果F检验的结果能够拒绝原假设,就认为相关比率也达到了显著性水平。第十三章 类别变量与尺度变量关系的假设检验一元方差分析 本章习题 参见教材习题13-1到13-6。