1、第九章 资料的统计分析()单变量分析单变量描述统计单变量推论统计一、单变量描述统计1、频数分布与频率分布频数分布:频数分布:一组数据中取不同值的个案的次数分布情况频数分布的作用频数分布的作用频率分布:频率分布:一组数据中不同取值的频数相对于总数的比率分布情况。通常以百分比的形式表达。频数分布与频率分布比较频数分布与频率分布比较职业类别人数工人4干部6教师3商人5农民2合计20表表9-1 某班学生父亲的职业分布某班学生父亲的职业分布职业类别百分比工人20干部30教师15商人25农民10合计100表表9-2 某班学生父亲职业分布某班学生父亲职业分布一、单变量描述统计2、集中趋势分析集中趋势分析指的
2、是用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。最常见的集中量数有算术平均数(简称平均数,也称为均值)、众数和中位数三种。(1)平均数)平均数nXXnXffXfX如果是组距分组形式的资料,先求出组中值,然后带入上述公式。2下限上限组中值P.64,例4一、单变量描述统计2、集中趋势分析(2)众数)众数:众数是一组数据中出现次数最多(即频数最高)的那个数值。众数的求法:A.单值分组资料:频数最大者所对应的标志值 B.组距分组资料:组中值法 摘补法一、单变量描述统计2、集中趋势分析(3)中位数:)中位数:把一组数据按值的大小顺序排列起来,处于中央位置的那个数
3、值就叫中位数。中位数的求法:A.单值分组数据(n+1)2=(150+1)2=75.5B.组距分组数据讨论:平均数与中位数比较讨论:平均数与中位数比较年龄(岁)人数(频数)累计频数累计频数1710101501825351401950851152040125652120145252251505合计150ifcf2nLm1m中位数收入(元)职工数累计频数100-1991010200-2991020300-3994060400-4992080500-59920100合计10025.37499402050300中位数一、单变量描述统计3、离散趋势分析 与集中量数分析相反,离散量数分析指的是用一个特别的数
4、值来反映一组数据相互之间的离散程度。离散数分析的作用常见的离散量数统计量有全距、标难差、异众比率、四分位差等。其中,标准差、异众比率、四分位差分别与平均数、众数、中位数相对应,判定和说明平均数、众数、中位数代表性的大小。一、单变量描述统计3、离散趋势分析(1)全距:)全距:一组数据中最大值与最小值之差。全距的作用及其局限(2)标准差:)标准差:一组数据对其平均数的偏差平方的算术平均数的平方根标准差的计算A.根据原始资料计算B.单值分组数据资料计算C.组距分组资料计算:先计算出各组的组中值,然后按单值分组资料计算公式和方法计算即可。nXXS2nfXXS2一、单变量描述统计3、离散趋势分析(3)异
5、众比率:)异众比率:一组数据非众数的次数相对于全部单位的比率。异众比率的意义与作用(4)四分位差:)四分位差:先将一组数据按大小排列成序,然后将其4等分,去掉序列中最高的1/4和最低的1/4后,中间的一半数值之间的全距。(5)离散系数:离散系数:标准差与平均数的比值。离散系数的作用nfnVRm13QQQ%100XSCV二、单变量推论统计 什么是推论统计?推论统计的主要内容?1、区间估计 区间估计的含义 区间估计的可靠性与精确性(1)总体均值的区间估计其中 为样本平均数,S为样本标准差,为置信度 所对应的Z值,n为样本规模nSZX)1(X)1(Z1二、单变量推论统计(1)总体均值的区间估计例 调
6、查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为186元,标准差为42元。求95的置信度下,全厂职工的月平均工资的置信区间是多少?解:将调查资料代入总体均值的区间估计公式得 查表得故,总体均值的置信区间为即183.26188.74元90042186)1(Z96.1)1(Z9004296.1186二、单变量推论统计(2)总体百分比的区间估计 例6 从某工厂随机抽取枷名工人进行调查结果表明女工的比例为 20。现在要求在如的置信技下,估计全厂工人中女工比例的置信区间。解 代入公式得 即16.7%23.3%400%)201(%2065.1%20nppZp)1()1(二、单变
7、量推论统计2、假设检验 假设检验的含义 假设检验的依据小概率原理 假设检验的步骤:(1)建立虚无假设和研究假设,通常是将原假设作为虚无假设;(2)根据需要选择适当的显著性水平a(即概率的大小),通常有。a0.05,a0.01等;(3)根据样本数据计算出统计值,并根据显著性水平查出对应的临界值;(4)将临界值与统计值进行比较,以判定是接受虚无假设,还是接受研究假设。二、单变量推论统计2、假设检验(1)总体均值的假设检验例 某单位职工上月平均收入为210元,本月调查7100名职工,平均月收,为220元,标准差为15元。问该单位职工本月平均收入与上月相比是否有变化?解 首先建立虚无假设(用 表示)和
8、研究假设(用 表示),即有:选择显著性水平 a=0.05,查表得 计算统计量 由于 Z=6.67 ,所以,拒绝虚无假设,接受研究假设。即从总体上说,该单位职工月平均收入与上月相比有变化。0H1H96.1Z)205.0(210:210:10MHMH67.610015210220nSM-XZ96.1Z)205.0(二、单变量推论统计2、假设检验(2)总体百分比的假设检验例 一所大学全体学生中抽烟者的比例为35%,经过学习和戒烟宣传后,随机抽取100名大学生进行调查,结果发现抽烟者为25名。问戒烟宣传是否收到成效?解 设 选择显著性水平 a=0.05,查表得 计算统计量 由于 ,所以,拒绝虚无假设,接受研究假设。即从总体上说,戒烟宣传收到了成效。56.1Z)05.0(35.0:35.0:1100pHpH1.210035.0135.035.025.0n)p-(1pp-pZ0001.2Z65.105.0Z