1、第十四章 统计分析社会调查教程目录第一节 统计分析概述第二节 描述统计与推断统计第三节 单变量统计分析第四节 双变量统计分析第五节 多变量统计分析简介目的与过程 第一节 统计分析概述一、统计分析的目的统计分析就是运用统计学原理和方法处理调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。统计分析的主要目的是:1、简化和描述数据。在社会调查中,搜集的数据多种多样,数量庞大。在撰写调查报告时,没有必要也没有可能罗列每个数据,而是运用统计分析方法将调查数据简化后再描述出来。2、用样本推断总体。在随机抽样调查中,对样本的调查只是手段而不是目的,真正的目的
2、在于通过对样本分析获得的统计量,来推断总体参数。2 24 4第一节第一节 统计分析概述统计分析概述 3 35 5二、统计分析的过程在数据录入和清理之后,数据的统计分析,大致要经过两个过程:1、数据预处理,就是在统计分析之前对清理后的数据做预备性处理。预处理,一般包括缺损值处理、加权处理、变量重新编码、数据重新排序,以及创造新变量等等。数据预处理工作,有的在统计分析之前完成,有的伴随着统计分析过程逐步进行。在进行许多数据预处理工作时,一般的统计软件都有专门的程序可供调用。2、数据统计分析,就是调用统计软件中的各种统计程序对数据进行分析,包括单变量、双变量、多变量统计分析,以及制作统计图、统计表等
3、一系列工作。2 24 4第一节第一节 统计分析概述统计分析概述 3 35 5三、统计分析的层次统计分析可按照不同标准划分层次。按照统计分析的性质,可分为描述统计和推断统计;按照统计分析涉及变量的多少,可分为单变量统计分析、双变量统计分析和多变量统计分析。1、描述统计与推断统计描述统计,就是运用数字(如频数、百分比、平均值),以及图、表等形式汇总所收集来的数据信息。描述统计的目的是在不歪曲或丢失大量信息的情况下,将数据信息简化为更易理解的形式。2、单变量、双变量、多变量统计分析在社会调查中,通常会涉及多个变量。但是,在统计分析中,究竟是进行单变量统计分析,还是进行双变量统计分析或多变量统计分析,
4、则取决于研究者的意图和目的。2 24 4第一节第一节 统计分析概述统计分析概述 3 35 5描述统计 推断统计 抽样分布 第二节 描述统计与推断统计描述统计和推断统计这一对概念,与描述性研究和解释性研究这一对概念容易产生混淆。描述性研究是关于“是什么”的研究,而解释性研究则是要说明“为什么”的研究,这与描述统计和推断统计的含义有某些联系。但是,这两对概念的含义是不同的:描述统计不等于描述性研究。描述统计与样本、总体有关,而与变量多少无关。描述统计主要计算样本的统计量,它可以是单变量统计分析,也可以是双变量或多变量统计分析,唯独不对总体做推断。描述性研究则只涉及变量多少,而不涉及样本或总体问题。
5、由于描述性研究只做描述不做解释,通常只涉及单个变量,不涉及变量之间的关系。推断统计与解释性研究也不同。推断统计是用样本统计量推断总体的统计方法,它可以是描述性研究,也可以是解释性研究。第二节第二节 描述统计与推断统描述统计与推断统计计4 41 1 3 35 5一、描述统计与推断统计二、推断统计与抽样分布与描述统计相比,推断统计的理论和方法更加复杂。推断统计是运用样本统计量对总体进行推断的一种统计分析方法。它的前提是,样本数据必须来自随机抽样调查。这就是说,只有用随机方法抽取的样本,其样本统计量才具备推断总体的资格。抽样分布是统计推断的关键。所谓抽样分布,是指在一个总体中重复抽取许多大小一样的样
6、本的统计量而形成的分布。抽样分布说明了特定统计量可能值的概率。每个样本统计量都有一个抽样分布,常见的如样本均值的抽样分布、样本比例的抽样分布。第二节第二节 描述统计与推断统描述统计与推断统计计4 41 1 3 35 5三、推断统计的两种基本形式推断统计有两种基本形式,即参数估计与假设检验。1、参数估计人们通常把样本计算出来的统计值称为样本统计量,简称统计量,而把总体统计值称为参数。所谓参数估计,就是运用样本统计量对总体参数进行推断或估计的统计过程与统计方法。参数估计包括点值估计与区间估计两种方法。点值估计区间估计 第二节第二节 描述统计与推断统描述统计与推断统计计4 41 1 3 35 5三、
7、推断统计的两种基本形式2、假设检验假设检验是以抽样分布原理为基础,检验调查样本中的统计特性是否在总体中同样存在的一种统计方法。它是推断统计中最重要也是最常用的方法。假设检验与参数估计一样,都是从样本出发来推断总体,但两者又存在着区别。参数估计是用具体的样本统计量(如平均数、标准差、百分比等)来推断总体参数;而假设检验则是检验样本中的事实、关系在总体中是否也存在。第二节第二节 描述统计与推断统描述统计与推断统计计4 41 1 3 35 5集中量数分析 离散量数分析 单变量统计推断第三节 单变量统计分析一、集中量数分析所谓集中量数分析,是指用一个具体的统计量反映一组数据向该统计量集中趋势的统计方法
8、。它所表示的是一组数据集中的程度或水平。集中量数有平均数、中位数、众数、四分位数、百分位数,以及倒数平均数、几何平均数等。其中,常用的集中量数是平均数、中位数和众数。2 24 41 1 第三节第三节 单变量统计分单变量统计分析析5 5二、离散量数分析所谓离散量数,就是表示一组数据变异程度或分散程度的量数。离散量数越大,表示数据分布范围越广,越不集中,越不整齐;离散量数越小,则表示数据分布范围越集中,变动程度越小。离散量数有多种,如方差与标准差、全距、四分位差、异众比率、离散系数、偏度系数等。其中,常用的是方差与标准差、全距、异众比率、离散系数和偏度系数。2 24 41 1 第三节第三节 单变量
9、统计分单变量统计分析析5 5三、单变量统计推断单变量分析不仅可做统计描述,而且能进行统计推断。单变量统计推断与双变量、多变量统计推断,在统计原理上是一样的,但在统计方法和目的上不同。因此,对单变量统计推断问题应该进行专门的阐述。1、参数估计参数估计(主要是区间估计)是用样本统计量来估计总体参数,它通常只涉及一个变量,当然也有涉及两个变量的,如相关系数的区间估计等,只是较少用到而已。在单变量分析中,参数估计实际上可分为三种情况或类型,即总体平均数的参数估计、总体比率的参数估计和总体方差的参数估计。三大区间估计类型中的每一大类型又可分成为若干小类型,各种区间估计类型所要求的数据分布条件和统计计算方
10、法都各不相同。2 24 41 1 第三节第三节 单变量统计分单变量统计分析析5 5三、单变量统计推断2、假设检验在单变量分析范围内,假设检验可分为三大基本类型,即总体均值的假设检验、总体比率的假设检验、总体方差的假设检验。三大假设检验类型中的每一大类型又可分为两种小类型,即单样本总体假设检验和双样本差异的总体假设检验。单样本总体假设检验,就是对单个样本的统计量(如平均数、比率、方差)是否可推断总体的检验;双样本差异的总体假设检验,就是对两样本统计量的差异(如平均数之差、比率之差、方差之差)是否在总体中也存在的检验,亦即要证明两样本的差异是否由来自两个不同的总体造成。2 24 41 1 第三节第
11、三节 单变量统计分单变量统计分析析5 5内容与方法第四节 双变量统计分析一、双变量统计分析的内容双变量统计分析分为相关关系和因果关系两种形式。1、两变量间的相关关系两变量间的相关关系,是指当一个变量发生变化时,另一个变量也随之发生变化。必须指出,两个变量之间存在相关关系,只强调它们之间存在着相互影响的关系,而不清楚也不在乎它们变化的先后,因而也无所谓前因后果的问题。社会现象之间的相关关系,从不同角度可区分为不同类型:按照相关方向的不同,可分为正相关和负相关。按照相关强度的不同,可分为完全相关、不相关和不完全相关。按照相关形式的不同,可分为线性相关和非线性相关。2 2第四节第四节 双变量统计分析
12、双变量统计分析1 1 3 35 5一、双变量统计分析的内容2、两变量间的因果关系两变量间的因果关系,是指一变量的变化可以确定为另一变量变化的原因的关系。自然科学中,确定现象之间的因果关系比较容易。在社会研究中,要确定两个变量之的因果关系则比较困难。因为,要确定两个变量之间的因果关系,必须同时满足三个条件:两变量间必须存在相关关系,它是因果关系的必要条件,但不是充分条件。必须确定自变量变化在前,因变量变化在后,即先有原因,后有结果。必须确定变量之间的关系,不是由于第三个变量的存在而呈现出的一种假关系。2 2第四节第四节 双变量统计分析双变量统计分析1 1 3 35 5二、双变量统计分析的方法在双
13、变量统计分析中,由于变量的测量层次不同,因而计算两变量相关系数的方法和假设检验的方法也不相同。变量的测量层次,可分为定类、定序、定距、定比四种类型,这样就形成了多种不同测量层次变量的两两组合。为了便于全面了解双变量分析方法,可把两变量测量层次类型和与之相应的相关测量方法、假设检验方法列成一个一览表。1、定类-定类(或定序)变量分析2、定序-定序变量分析3、定类(或定序)-定距变量分析4、定距-定距变量分析2 2第四节第四节 双变量统计分析双变量统计分析1 1 3 35 5二、双变量统计分析的方法一览表2 2第四节第四节 双变量统计分析双变量统计分析1 1 3 35 5多元回归分析 多元方差分析
14、 第五节 多变量统计分析简介一、多变量相关分析2 24 41 1 3 3多变量相关分析是相对于双变量相关分析而言的。在双变量分析中,是用一个统计量反映两个变量间的相关关系。当变量达到三个或三个以上时,相关关系的分析就属于多变量相关分析或多元相关分析了。从本质上说,多变量相关分析与双变量相关分析一样,也是用一个统计量(如偏相关系数、复相关系数等)来简化和反映多个变量之间的相互依存关系,只是这种关系更加复杂而已。与多变量相关分析直接有关的方法。有偏相关分析、复相关分析和典型相关分析等。第五节第五节 多变量统计分析简介多变量统计分析简介二、多元回归分析多元回归分析是研究两个或两个以上自变量和一个因变
15、量之间的关系,并用自变量解释与预测因变量的多变量统计分析方法。在社会研究中,应用较多的是多元线性回归分析方法和Logistic回归分析方法等。1、多元线性回归分析,是多元回归分析方法中的基本形式,它的应用通常对数据有比较严格的要求。例如,它要求各自变量之间不能存在高度的线性相关性。此外,它还要求自变量和因变量均为定距(比)变量。如果自变量为定类或定序变量,则可将其转化为虚拟变量后再进行多元线性回归分析。由于在社会研究中,很多数据难以完全符合这些要求,因而多元线性回归分析方法的应用受到了很大的限制。2、Logistic回归分析,是自变量为定距、定比变量(或虚拟变量),因变量为定类、定序变量条件下
16、的多元回归分析方法。Logistic回归分析方法的广泛运用,促进了社会定量研究的突破性发展。由于社会研究中的数据,很多时候是以定类与定序的属性数据形式出现的,采用多元线性回归分析存在诸多缺陷,Logistic回归分析方法的出现,弥补了多元线性回归分析的局限,目前已经得到了广泛的使用。2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介三、多元方差分析多元方差分析是对多个定类变量(自变量)与多个定距变量(因变量)关系的多元分析方法,其分析的统计原理与方法同一元方差分析相似,只是程序更加复杂。2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介四、因
17、子分析因子分析是一种从众多相关变量中抽取若干个共同因子,从而使复杂数据得以简化的多变量统计分析方法。被抽取的因子,称为公共因子。因子分析的作用主要表现在两个方面:其一,探索数据的基本结构和变量之间的关系。其二,用公共因子简化数据,以便于做进一步分析。2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介五、对数型模型分析对数线性模型分析,是在自变量和因变量都是定类或定序变量时,用以分析它们之间相互关系的多元统计分析方法,它处理的是以交互分类表形式出现的定类或定序数据。2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介六、结构方程模型分析结构方程模
18、型分析,是一种用于建立、估计、检验因果关系模型的功能强大的多元统计分析方法,它把因子分析、回归分析、路径分析、方差分析等多种多变量统计分析方法有机地整合在一起,形成了一种思路新颖、用途广泛的综合性统计分析技术。2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介七、多层线性模型分析多层线性模型分析,是专门用于对具有层次结构特性的数据进行多元分析的统计方法。这种方法在欧美的产生和发展已有了不短时间,目前国内不少社会研究采用了这一统计分析方法2 24 41 1 3 3第五节第五节 多变量统计分析简介多变量统计分析简介推荐阅读书目李沛良社会研究的统计应用北京:社会科学文献出版社,卢淑华社会统计学版北京:北京大学出版社,萨尔金德爱上统计学重庆:重庆大学出版社,安德森,等商务与经济统计版北京:机械工业出版社,艾格瑞斯蒂,芬蕾社会科学统计方法版北京:电子工业出版社,穆尔,等统计学的世界版北京:中信出版社,制 作:John交流QQ:505783264本章结束
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。