1、社会学定量研究方法Quantitative Research Methods in Sociology社会学硕士生专业课2定量研究方法概论定量研究方法概论 1研究设计研究设计 2相关分析相关分析3回归分析回归分析4因子分析因子分析5方差分析方差分析6列联表分析列联表分析7社会网络分析社会网络分析8结构方程分析结构方程分析9课程主要内容31. 卢淑华卢淑华. 社会统计学社会统计学,北京大学出版社,北京大学出版社,200X2. 李沛良李沛良. 社会研究的统计应用社会研究的统计应用,社科文献出版社,社科文献出版社,20013. 艾尔艾尔巴比巴比社会研究方法社会研究方法,邱泽奇译,华夏出版社,邱泽奇译
2、,华夏出版社,2000 4. 风笑天风笑天.现代社会调查方法现代社会调查方法,华中科技大学出版社,华中科技大学出版社,20055. 谢宇谢宇.社会学方法与定量研究社会学方法与定量研究,社科文献出版社,社科文献出版社,20066. 刘军刘军.社会网络分析导论社会网络分析导论.社会科学文献出版社社会科学文献出版社,20047. 刘军刘军.整体网分析讲义:整体网分析讲义:UCINET软件实用指南软件实用指南,格致出,格致出版社,版社,20098. 尹海洁,刘耳尹海洁,刘耳.社会统计软件社会统计软件SPSS 15.0 for Windows 简明简明教程教程,社科文献出版社,社科文献出版社,20089
3、. 黄芳铭黄芳铭. 结构方程模式结构方程模式:理论与应用理论与应用.中国税务出版社,中国税务出版社,200510.侯杰泰侯杰泰, 温忠麟温忠麟, 成子娟成子娟. 结构方程模型及其应用结构方程模型及其应用. 教育科学出教育科学出版社版社. 2004参考文献4课程大致进度:课程大致进度:1.1. 社会学定量研究方法概述社会学定量研究方法概述 3 3学时学时2.2. 研究设计研究设计 6 6学时学时3.3. 相关分析相关分析 3 3学时学时4.4. 回归分析回归分析 6 6学时学时5.5. 因子分析因子分析 3 3学时学时6.6. 方差分析方差分析 6 6学时学时7.7. 列联表分析列联表分析 3
4、3学时学时8.8. 社会网络分析社会网络分析 6 6学时学时9.9. 结构方程分析结构方程分析 9 9学时学时需用软件:需用软件:SPSSSPSS,AMOSAMOS,UCINETUCINET考核方式:考核方式:出勤出勤5 5分,课堂参与分,课堂参与5 5分,平时作业分,平时作业2020分,随堂开卷考试分,随堂开卷考试7070分。分。具体安排5第第1 1讲讲 社会学定量研究方法概述社会学定量研究方法概述 一、社会研究方法的体系存在存在知识论知识论实证主义实证主义/ /人文主义人文主义调查调查/ /实验实验/ /文献文献/ /观察观察种类众多种类众多6第第1 1讲讲 社会学定量研究方法概述社会学定
5、量研究方法概述 一、社会研究方法的体系本体论:本体论:Ontology,关于存在关于存在being的学问。古希腊罗马哲学中,本的学问。古希腊罗马哲学中,本体论研究主要探究世界的本原或基质。体论研究主要探究世界的本原或基质。认识论:认识论:Epistemology ,又称知识论,探讨人类认识的本质、结,又称知识论,探讨人类认识的本质、结构,认识与客观实在的关系构,认识与客观实在的关系 ,认识的前提和基础,认识发生、发展,认识的前提和基础,认识发生、发展过程及其规律,认识的真理标准等问题的哲学学说。过程及其规律,认识的真理标准等问题的哲学学说。方法论:方法论:Methodology ,对研究方式方
6、法一般原理的系统探讨与评对研究方式方法一般原理的系统探讨与评价,它只涉及科学发现与检验的原理和逻辑而不涉及具体的事实。价,它只涉及科学发现与检验的原理和逻辑而不涉及具体的事实。研究方式:研究方式:Research Paradigm ,在某种方法论指导下,对一在某种方法论指导下,对一系列具体方法与技术的总称。一般可分为四种:调查法、实验法、系列具体方法与技术的总称。一般可分为四种:调查法、实验法、观察法观察法/个案法、文献法。个案法、文献法。具体方法与技术:具体方法与技术:Ways & Technics ,具体的操作层面的方法、具体的操作层面的方法、技术和技巧等。技术和技巧等。7第第1 1讲讲
7、社会学定量研究方法概述社会学定量研究方法概述 二、什么是社会学定量研究方法1 1、含义:、含义:本体论:本体论:客观对象是是“属性”和“数量”两种信息的有机统一体,即“内容”和“形式”的统一体。认识论:认识论:定量研究的基本功能是从总体层面解答某种社会存在有多少、是多少。方法论:方法论:定性或定量并非元方法区分,定量研究以定性研究为先导,定量研究往往以“中层理论”的检验为目的。 具体方法与技术层面:具体方法与技术层面:定量研究高度依赖统计学、调查学、计算机学等辅助学科。82 2、定量研究与定性研究的区别:、定量研究与定性研究的区别:理论模式理论模式为理论检验(4)(4)理论建构主要目标主要目标
8、解释因果关系(5)理解社会现象分析方法分析方法为统计分析(6)文字描述主要方式主要方式为实验和调查(7)实地研究资料收集方法主要资料收集方法主要采用量表、问卷和结构性观察(8)参与观察和深度访谈等逻辑过程逻辑过程为演绎推理(3)归纳推理研究范式研究范式为科学范式(2)(2)自然范式哲学基础哲学基础为实证主义(1)人文主义9第第1 1讲讲 社会学定量研究方法概述社会学定量研究方法概述 三、常用定量研究方式:实验法1、实验法的逻辑思路【概念层次概念层次】因因果果【建构建构】【操作层次】自变量自变量因变量因变量无关变量无关变量无关变量无关变量【操弄操弄】【测量测量】【控制控制】10第第1 1讲讲 社
9、会学定量研究方法概述社会学定量研究方法概述 三、常用定量研究方式:实验法2、实验法举例:劳动报酬对劳动效率的影响工作内容工作内容总人数总人数公开报酬公开报酬分组后报酬分组后报酬前段时间前段时间后段时间后段时间帮图书馆录帮图书馆录入数据入数据19每小时12美元10人为12美元每小时40.7本差不多9人为20美元每小时51.7本帮自然灾害帮自然灾害移民研究中移民研究中心募捐心募捐23每小时10美元10人为10美元每小时募捐6.4美元差不多13人为20美元每小时募捐11美元11第第1 1讲讲 社会学定量研究方法概述社会学定量研究方法概述 四、常用定量研究方式:调查法1、调查法的逻辑思路提出问题提出问
10、题研究假设研究假设收集资料收集资料验证假设验证假设理论分析理论分析 发现问题发现问题操作化操作化归纳归纳测量测量理论理论假设假设实践实践经验经验概括概括12第第1 1讲讲 社会学定量研究方法概述社会学定量研究方法概述 2、调查法举例:社会资本对再就业的影响四、常用定量研究方式:调查法再就业中的社会资本:效用与局限再就业中的社会资本:效用与局限 From From 社会学研究社会学研究2002.42002.4自变量自变量因变量因变量社会资本社会资本人力资本人力资本其它控制变量其它控制变量再就业机会获得再就业机会获得再就业质量再就业质量网络资源网络资源规模规模构成构成嵌入资源量嵌入资源量使用情况使
11、用情况教育教育职称职称党员党员干部干部性别性别年龄年龄工资收入工资收入职业声望职业声望单位所有制单位所有制多元回归分析多元回归分析13第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)确定选题后如何展开研究?具体来说:确定选题后如何展开研究?具体来说:如何细化研究内容?如何细化研究内容?如何收集实证资料?如何收集实证资料?如何分析实证资料?如何分析实证资料?14一、如何细化研究内容?一、如何细化研究内容?文献文献综述综述概念概念操作化操作化命题命题操作化操作化研究研究假设假设理论理论框架框架调查调查问卷问卷研究内容研究内容第第2 2讲讲 研究设
12、计研究设计(Research Design)(Research Design)15一、如何细化研究内容?一、如何细化研究内容?文献文献综述综述理论框架理论框架概念操作化概念操作化命题操作化命题操作化研究假设研究假设(1)文献综述的内涵:)文献综述的内涵:系统的识别、寻找、考察和总结与课题相关的学术文献。系统的识别、寻找、考察和总结与课题相关的学术文献。(2)文献综述的的作用:)文献综述的的作用:“站在巨人的肩膀上站在巨人的肩膀上”;寻找创新点;寻找创新点(3)文献综述的过程:)文献综述的过程:阅读阅读摘要摘要批判批判(4)文献搜集的)文献搜集的6个步骤个步骤感兴趣的现象或问题领域感兴趣的现象或
13、问题领域宽泛查阅相关文献宽泛查阅相关文献初步确定初步确定研究问题研究问题进一步查阅更为专业的文献进一步查阅更为专业的文献进一步明确研究进一步明确研究问题问题查阅近期专题文献和经典文献查阅近期专题文献和经典文献调查问卷调查问卷16一、如何细化研究内容?一、如何细化研究内容?文献综述文献综述理论框架理论框架概念概念操作化操作化命题操作化命题操作化研究假设研究假设5指标指标index1某事物某事物object4意项意项indicator2概念概念conceptconcept3变量变量variable达成共识达成共识数学思想数学思想具体观测具体观测归类提炼归类提炼意项意项1 1意项意项2 2意项意项3
14、 3意项意项4 4意项意项5 5意项意项6 6指标指标1 1指标指标2 2指标指标3 3抽象定义抽象定义操作定义操作定义调查问卷调查问卷17一、如何细化研究内容?一、如何细化研究内容?文献综述文献综述概念概念操作化操作化命题操作化命题操作化研究假设研究假设理论框架理论框架5 5体制内收入体制内收入体制外收入体制外收入达成共识达成共识数学思想数学思想具体观测具体观测归类提炼归类提炼2 2与一定的与一定的教育水平教育水平和收入水和收入水平对应的平对应的社会位置社会位置3 3教育水平教育水平收入水平收入水平4 4工资工资奖金奖金兼职兼职礼物礼物1 1社会经社会经济地位济地位调查问卷调查问卷18一、如
15、何细化研究内容?一、如何细化研究内容?文献综述文献综述理论框架理论框架概念操作化概念操作化命题命题操作化操作化研究假设研究假设含义:含义:把抽象的命题变为可测量的命题。或,对概念关系的操作化。把抽象的命题变为可测量的命题。或,对概念关系的操作化。方法:方法:依据实证观察或理论分析,把命题中变量取值的关系表达出来。依据实证观察或理论分析,把命题中变量取值的关系表达出来。命题操作化举例:命题操作化举例:抽象命题:抽象命题:爱国主义情感越强烈,学习热情越高。爱国主义情感越强烈,学习热情越高。命题操作化命题操作化1 1:参加升国旗的次数越多,主动自习的次数越多。参加升国旗的次数越多,主动自习的次数越多
16、。命题操作化命题操作化2 2:渴盼台湾回归的程度越高,上课主动回答问题的次数越多。渴盼台湾回归的程度越高,上课主动回答问题的次数越多。命题操作化命题操作化3 3: 调查问卷调查问卷19一、如何细化研究内容?一、如何细化研究内容?文献综述文献综述理论框架理论框架概念操作化概念操作化命题操作化命题操作化研究研究假设假设理论框架理论框架含义:含义:基于理论分析或基于理论分析或/ /和经验事实,对变量关系的猜测。和经验事实,对变量关系的猜测。特点:特点:针对性针对性可检验性可检验性概念明确性概念明确性分类:分类:根据抽象层次分:理论假设、统计假设根据抽象层次分:理论假设、统计假设根据在假设检验中的作用
17、分:原假设、备择假设(根据在假设检验中的作用分:原假设、备择假设(研究假设研究假设)调查问卷调查问卷20一、如何细化研究内容?一、如何细化研究内容?文献综述文献综述理论理论框架框架概念操作化概念操作化命题操作化命题操作化研究假设研究假设理论框架理论框架调查问卷调查问卷再就业中的社会资本:效用与局限。再就业中的社会资本:效用与局限。 社会学研究社会学研究2002.42002.4自变量自变量因变量因变量社会资本社会资本人力资本人力资本其它控制变量其它控制变量再就业机会获得再就业机会获得再就业质量再就业质量网络资源网络资源规模规模构成构成嵌入资源量嵌入资源量使用情况使用情况教育教育职称职称党员党员干
18、部干部性别性别年龄年龄工资收入工资收入职业声望职业声望单位所有制单位所有制多元回归分析多元回归分析21一、如何细化研究内容?一、如何细化研究内容?文献综述文献综述理论框架理论框架概念操作化概念操作化命题操作化命题操作化研究假设研究假设调查调查问卷问卷问卷(问卷(questionnairequestionnaire)是社会调查中用来收集资料的一种)是社会调查中用来收集资料的一种工具,它通过精心设计的问题表格来测量人们的特征、行为工具,它通过精心设计的问题表格来测量人们的特征、行为和态度。收集有关社会现象和社会行为的各种资料。和态度。收集有关社会现象和社会行为的各种资料。 研究内容研究内容调查问卷
19、调查问卷理论框架理论框架研究假设研究假设22二、如何收集实证资料?二、如何收集实证资料?1 1、如何选定被调查对象:抽样方法、如何选定被调查对象:抽样方法样本样本抽样(随机性)抽样(随机性)推论(统计规律性)推论(统计规律性)总体总体第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)23二、如何收集实证资料?二、如何收集实证资料?1 1、如何选定被调查对象:抽样方法、如何选定被调查对象:抽样方法简单随机抽样(满足等概率抽样)简单随机抽样(满足等概率抽样)系统抽样系统抽样分层抽样分层抽样整群抽样整群抽样多段抽样多段抽样 偶遇抽样偶遇抽样判断抽样判
20、断抽样定额抽样定额抽样雪球抽样雪球抽样 概率抽样概率抽样非概率抽样非概率抽样抽样方法抽样方法的基本类型的基本类型第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)24二、如何收集实证资料?二、如何收集实证资料?2 2、如何向被调查者收集资料?、如何向被调查者收集资料?个别发送法个别发送法集中填答法(整群抽样)集中填答法(整群抽样)邮寄填答法邮寄填答法网络填答法网络填答法当面访问法当面访问法电话访问法电话访问法街头访问法街头访问法网络访问法网络访问法自填问卷法自填问卷法结构访问法结构访问法调查法中的常用调查法中的常用资料收集方法资料收集方法第第2
21、 2讲讲 研究设计研究设计(Research Design)(Research Design)25三、如何分析实证资料?三、如何分析实证资料?1 1、数据背后的变量、数据背后的变量美国学者史蒂文森(美国学者史蒂文森(S.S.StevensS.S.Stevens)19511951年提出的变量分类法年提出的变量分类法 定类测量定类测量定序测量定序测量 学历定距测量定距测量 智商定比测量定比测量 年龄1 12 23 34 4 性别第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)26三、如何分析实证资料?三、如何分析实证资料?常用统计常用统计分析方法
22、分析方法集中趋势描述集中趋势描述(平均数(平均数/ /众数众数/ /中位数)中位数)离散趋势描述离散趋势描述(标准差(标准差/ /异众比率异众比率/ /四分位差)四分位差)参数估计参数估计(点估计(点估计/ /区间估计)区间估计)假设检验假设检验统计描述统计描述统计推论统计推论2 2、常用的定量数据分析方法、常用的定量数据分析方法第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)27三、如何分析实证资料?三、如何分析实证资料?3 3、如何选择定量数据分析方法、如何选择定量数据分析方法确定变量的测量层次:确定变量的测量层次: 定类、定序还是定距变
23、量?定类、定序还是定距变量?确定单次统计分析涉及到的变量数量:确定单次统计分析涉及到的变量数量: 单变量、双变量还是多变量?单变量、双变量还是多变量?确定数据来源:确定数据来源: 抽样(统计推论)、普查(统计描述)还是个案?抽样(统计推论)、普查(统计描述)还是个案?确定变量分布:确定变量分布: 正态正态/ /非正态?连续(定距数据)非正态?连续(定距数据)/ /离散(定类数离散(定类数据)?据)?第第2 2讲讲 研究设计研究设计(Research Design)(Research Design)28第第3 3讲讲 相关分析(相关分析(correlation analysiscorrelati
24、on analysis)一、相关分析的含义一、相关分析的含义相关分析相关分析是研究现象之间是否存在某种依存关系,是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相并对具体有依存关系的现象探讨其相关方向以及相关程度。关程度。相关分析是研究相关分析是研究随机变量随机变量之间的相关关系的一之间的相关关系的一种统计方法。种统计方法。事物之间有相关,不一定是事物之间有相关,不一定是因果关系因果关系,也可能,也可能仅是伴随关系。但如果事物之间有因果关系,仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。则两者必然相关。 29二、相关分析的分类二、相关分析的分类1 1、按
25、相关的程度分为完全相关、不完全相关和不相关、按相关的程度分为完全相关、不完全相关和不相关 2 2、按相关的方向分为正相关和负相关、按相关的方向分为正相关和负相关 3 3、按相关的形式分为线性相关和非线性相关、按相关的形式分为线性相关和非线性相关 4 4、按影响因素的多少分为单相关和复相关、按影响因素的多少分为单相关和复相关5 5、按具体分析方法可分三种:、按具体分析方法可分三种:n线性相关分析:对定距变量间的关系进行分析,线性相关分析:对定距变量间的关系进行分析,spssspss中使用中使用BivariateBivariate过程。过程。 n偏相关分析偏相关分析 :对两相关变量之外的某一或某些
26、影响相关的其:对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。他变量进行控制,输出控制其他变量影响后的相关系数。 spssspss中使用中使用PartialPartial过程。过程。 n距离分析:可对变量内部各观察单位间的数值进行距离相关分距离分析:可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合优度。常用于考察预测值对实际值的拟合优度。spssspss中使用中使用DistancesDistances过程。过程。
27、 第第3 3讲讲 相关分析(相关分析(correlation analysiscorrelation analysis)30三、不同测量层次的变量的相关分析三、不同测量层次的变量的相关分析变量变量层次层次相关相关测量法测量法假设假设检验检验SPSSSPSS实现方法实现方法定类定类定类定类以卡方为基础: C V以PRE为基础:卡方CrosstabBivariate定类定序定类定序非参数检验定序定序定序定序Spearman等级相关系数Gamma等级相关系数Z t定类定距定类定距方差分析相关比率EtaF tAnovaCrosstab定序定距定序定距定距定距定距定距回归分析,积矩相关(Pearson)
28、F tBivariate31四、相关系数的评价临界值四、相关系数的评价临界值|r|0.95 |r|0.95 存在显著性相关;存在显著性相关;|r|r| 0.8 0.8 高度高度相关;相关;0.50.5 |r|r|0.8 0.8 中度中度相关;相关;0.30.3 |r|r|0.50.5 低度低度相关;相关;|r|r|0.3 0.3 关系极弱,可以认为不关系极弱,可以认为不相关相关32第第4 4讲讲 回归分析(回归分析(Regression AnalysisRegression Analysis)一、含义与应用场合处理随机变量间的因果关系,线性回归分析通常用于分析处理定距变量和定距变量之间的关系。
29、二、回归分析与相关分析的关系1、都研究线性的非确定性关系,但回归分析关注因果。2、回归系数仅反映增量X与y均值增量的关系,即3、相关系数反映真实数据与回归直线的靠拢程度。yb x 33第第4 4讲讲 回归分析(回归分析(Regression AnalysisRegression Analysis)三、线性回归分析的假定1、正态性假定: 的误差 服从正态分布。可考察残差直方图和累计概率图。2、等方差性假定: ,可考察以SRESID为Y轴,以ZPRED为X轴的散点图。3、独立性假定: 可利用残差图示法。4、无自相关性假定: 可利用残差图示法。5、随机误差项与x的不相关性假定: 可考察D-W值,取值
30、范围0到4,约等于2时说明不相关。Xii2Var()=iiXE()=0iCov(,)0 ()ijij (,)0iiCovX34第第4 4讲讲 回归分析(回归分析(Regression AnalysisRegression Analysis)四、线性回归分析的检验1、方程检验:考察方差分析结果即可,看sig值即可。2、系数检验:偏回归系数与常数项检验,看各自对应的sig值即可。ANOVAb1705.28011705.28057.898.000a176.720629.4531882.0007RegressionResidualTotalModel1Sum ofSquaresdfMean Squar
31、eFSig.Predictors: (Constant), 教育a. Dependent Variable: 声望b. Coefficientsa32.0405.3455.994.0012.920.384.9527.609.000(Constant)教育Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 声望a. 35第第4 4讲讲 回归分析(回归分析(Regression AnalysisRegression Analysis)五、非标准化系数与标准化系
32、数1、非标准化线性回归方程: 上式中: 表示k个自变量的回归方程式的截距;b为偏回归系数,即控制其它变量后xi对y的效果。2、标准化回归方程:上式中:截距为0;B为标准化偏回归系数,比较xi的相对效果。1212kkkyabbbXXXka1212kkyBBBXXXCoefficientsa32.0405.3455.994.0012.920.384.9527.609.000(Constant)教育Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 声望a. 3
33、6第第4 4讲讲 回归分析(回归分析(Regression AnalysisRegression Analysis)六、SPSS回归分析输出摘要表1、R为复相关系数,即所有x与y的相关程度。2、R平方为判定系数(PRE):所有x可解释掉的y的方差。3、调整后判定系数:消除了自变量个数及样本量大小对R平方的影响,即:2(1)21kn kckRR Model Summary.952a.906.8905.427Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 教育a. 37第第4 4讲讲 回
34、归分析(回归分析(Regression AnalysisRegression Analysis)七、共线性诊断:有3个或3个以上自变量时,自变量间是否相关考察自变量是否存在共线性的主要方法有:1、计算某X变量的容忍度:太小,例如小于0.1,则表示该自变量与其它自变量的关系较强。 (Ri是Xi与其它自变量的复相关系数)2、计算方差膨胀因子:0VIF1不存在共线性;10VIF100严重共线性;3、条件指数(CI):30到100中度共线性;100以上高度共线性。4、方差比例(VP):21iiTR 1VIFiT38一、因子分析的含义用不可观测的公共因子综合高相关性的原始变量。开始于1904年Charl
35、es Spearman对学生成绩的研究。二、作用1、基于变量间的相关系数,对变量进行降维:R型因子分析2、基于个案的因子得分,对样本中个案的进行评价(分类、排序等):Q型因子分析三、因子分析的假定1、变量为定距变量2、变量间为直线关系3、对总体分布无要求第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)39四、一般因子分析模型第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)其中:向量X表示原始变量X1,X2.F为公共因子 为特殊因子A为因子负载矩阵,AFXij(,)a(,)rijijX FCov
36、X F40五、变量的共同度和特殊度(剩余方差)第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)1、变量的共同度:所有公因子Fi解释变量Xi方差的比例。2222i12h.iiimaaa m是公共因子的个数2、变量的特殊度(剩余方差)2iVar(X )( )iihVar变量的总方差=共同度+特殊度41六、公共因子 的方差贡献第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)1、公共因子 对原始变量 所提供的方差总和2222i1j2jpjg.aaa j是原始变量的个数2、公共因子 的平均方差=方差总和/
37、原始变量个数平均方差的作用:衡量公共因子的相对重要性jFjFjFiX42七、因子数量的确定方法第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)1、系统默认方法:提取特征值大于1时的公共因子可根据特征值变化碎石图判断,曲线变缓时停止提取公因子。2、根据理论研究确定公因子数量验证型因子分析中,可直接在统计软件中指定需要提取的公因子数量。3、根据所有公因子能解释的原始变量的方差比例确定85%以上即可。4、根据单个公因子所解释的平均方差确定小于5%者不用43八、公因子的求解方法第第5 5讲讲 因子分析(因子分析(Factor AnalysisFacto
38、r Analysis)第1步:计算简单相关系数,小于0.3变量舍弃。第2步:主成分法最常用。其他方法有:极大似然法,公因子轴法,等等。第3步:因子旋转方法有两类,正交旋转中最常用Varimax方法,目的是找出多个因子,以简化原始变量;斜交旋转中最常用Quartimax,目的是找出一个最强大的因子。(李沛良,2001:342)原始变量相关矩阵公因子及因子载荷矩阵因子旋转因子得分44九、“假定”检验第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)1、KMO检验:越接近1越好。目的有二:样本量是否充足;偏相关是否很小。2、Bartlett球形检验:显
39、著则说明相关矩阵不是单位矩阵,不存在多重共线性。十、因子得分即,公共因子在每一个样本个案上的得分,需用原始变量 的现行表达式来表示 。参见李沛良(2001:339),何晓群(2008:204,221)iXjF45第第5 5讲讲 因子分析(因子分析(Factor AnalysisFactor Analysis)十、因子得分1、含义:公共因子在每一个样本个案上的得分,需用原始变量 的现行表达式来表示 。iXjF1FA RX因子估分值=因子载荷矩阵*原始变量的相关矩阵*原始变量向量2、软件计算:SPSS中的位置为ScoresSave as Variables46第第6 6讲讲 方差分析方差分析(AN
40、OVA)(ANOVA)一、含义一、含义通过比较不同组的均值,判断定类变量对定距变量的影响。通过比较不同组的均值,判断定类变量对定距变量的影响。二、方差分析所处理的变量层次二、方差分析所处理的变量层次1 1、定类、定类定距定距2 2、定序、定序定距定距三、方差分析的假定三、方差分析的假定1 1、等方差性:、等方差性:自变量的每个取值自变量的每个取值 对应的因变量取对应的因变量取值值 的分布都具有相同的方差。的分布都具有相同的方差。(样本间方差可能不相等,但最大方差不能超过最小方差(样本间方差可能不相等,但最大方差不能超过最小方差的的2 2到到3 3倍。)倍。)iAiy47第第6 6讲讲 方差分析
41、方差分析(ANOVA)(ANOVA)四、方差分析的检验四、方差分析的检验1 1、三种平方和:、三种平方和:TSS=BSS+RSSTSS=BSS+RSS总平方和总平方和TSS:所有误差。:所有误差。组间平方和组间平方和BSS:已被自变量解释掉的误差。:已被自变量解释掉的误差。组内平方和组内平方和RSS:未被自变量解释掉的误差。:未被自变量解释掉的误差。iy2 2、 分布正态形:分布正态形:自变量的每个取值对应的因变量的自变量的每个取值对应的因变量的分布都呈正态性。(该假设并不重要)分布都呈正态性。(该假设并不重要)211()inmijijTSSyy211()inimijijyy211()inmi
42、ijyy48第第6 6讲讲 方差分析方差分析(ANOVA)(ANOVA)四、方差分析的检验四、方差分析的检验2 2、原假设、原假设 成立时:成立时:012:.mH1(1 ,)BSSmRSSn mFF mnm 若若 F F 大于临界值(统计软件中可直接看大于临界值(统计软件中可直接看Sig.Sig.),则原),则原假设不成立。假设不成立。49第第6 6讲讲 方差分析方差分析(ANOVA)(ANOVA)六、方差分析中变量相关程度的测量六、方差分析中变量相关程度的测量相关比率相关比率Correlation Ratio( )Correlation Ratio( )2Eta1212EEBSSTSS RS
43、SETSSTSSEta五、多重比较五、多重比较1 1、Post Hoc Post Hoc 各组均值的两两比较各组均值的两两比较2 2、ConstractsConstracts各组均值的两两比较均值的任意比较(多项各组均值的两两比较均值的任意比较(多项式比较)式比较)SPSSSPSS中的位置:中的位置:分析分析描述统计描述统计交叉表交叉表统计量统计量50第第7 7讲讲 列联表分析列联表分析(Contingency Table)(Contingency Table)一、含义:一、含义:列联表列联表(Contingency Table)又称交叉分类表又称交叉分类表(Crosstabs),主,主要用于
44、呈现定类变量。要用于呈现定类变量。爱好 * 年龄段 CrosstabulationCount201023252035602102032274057124戏曲歌舞球赛爱好Total老年中年青年年龄段Total二、列联表研究主要关注两个问题:二、列联表研究主要关注两个问题:变量间是否相关?变量间是否相关?进行统计检验进行统计检验如果相关,则相关程度如何?如果相关,则相关程度如何?计算列联强度计算列联强度51三、基本原理三、基本原理1 1、假设、假设Y Y的分类与的分类与X X的分类无关的分类无关,即,即: : 联合分布联合分布= =边缘分布边缘分布 X X 边缘分布边缘分布*ijijPPP2 2、
45、在假设基础上求期望频次:、在假设基础上求期望频次:*ijnnijijijnEnPnPP 第第7 7讲讲 列联表分析列联表分析(Contingency Table)(Contingency Table)52第第7 7讲讲 列联表分析列联表分析(Contingency Table)(Contingency Table)三、基本原理三、基本原理3 3、比较观察频次、比较观察频次 与期望频次与期望频次 的差异:的差异:差异过大则说明差异过大则说明Y Y与与X X相关,通过构建卡方统计量进行比较。相关,通过构建卡方统计量进行比较。ijEijn四、列联强度四、列联强度1 1、 :根据卡方值计算:根据卡方值
46、计算只适合定类变量;只适合定类变量;2 2、 :基于:基于PREPRE计算计算适合任何层次变量间的相关性测适合任何层次变量间的相关性测量。量。CV 2()2211(1 ,1)ijijijcrnEEijXXrc 53一、社会网络分析的含义一、社会网络分析的含义社会网络是社会行动者(社会网络是社会行动者(social actor)及其关系的集合。)及其关系的集合。社会网络分析(社会网络分析(SNASNA)是对社会关系数据进行定量分析的专门技术。)是对社会关系数据进行定量分析的专门技术。第第8 8讲讲 社会网络分析(社会网络分析(Social Network AnalysisSocial Netwo
47、rk Analysis)54邻居邻居亲属亲属同事同事朋友朋友你你55二、社会网络的类型二、社会网络的类型1 1、根据研究对象和研究内容的不同,常用的社会网络有:、根据研究对象和研究内容的不同,常用的社会网络有:n研究大学生或公司职员时:研究大学生或公司职员时:n情感网络;情报网络;咨询网络;信任网络。情感网络;情报网络;咨询网络;信任网络。n研究农民工社会支持时:研究农民工社会支持时:n社会支持网(实际支持网、情感支持网、社会交往支持网)社会支持网(实际支持网、情感支持网、社会交往支持网)n社会讨论网(婚姻讨论网、生育讨论网、避孕讨论网和养社会讨论网(婚姻讨论网、生育讨论网、避孕讨论网和养老讨
48、论网)老讨论网) n研究企业关系时:研究企业关系时:n资金借贷网;专利转让网;董事共享网。资金借贷网;专利转让网;董事共享网。第第8 8讲讲 社会网络分析社会网络分析56二、社会网络的类型二、社会网络的类型2 2、根据研究取向的不同,常用的社会网络有:、根据研究取向的不同,常用的社会网络有:自我网(自我网(Ego networkEgo network):):自我网也叫自我网也叫“自我中心网自我中心网”,Ego-Ego-centric Networkcentric Network,以关系网络中的某焦点个体(,以关系网络中的某焦点个体(focal nodefocal node)为)为参照点,将该点
49、以及与该点有联系的点相连接而形成的网络。自我参照点,将该点以及与该点有联系的点相连接而形成的网络。自我网主要从微观角度,研究关系的影响或关系的影响因素。网主要从微观角度,研究关系的影响或关系的影响因素。整体网(整体网(Whole networkWhole network):):关系网络中所有个体形成的网络。关系网络中所有个体形成的网络。整体网主要从宏观角度,研究社会网的结构问题。整体网主要从宏观角度,研究社会网的结构问题。举例如下:举例如下:第第8 8讲讲 社会网络分析社会网络分析57班级整体网班级整体网小周个体网小周个体网选择所有相关行动者选择所有相关行动者抽样选择部分相关行动者抽样选择部分
50、相关行动者由小周提供名单由小周提供名单58三、社会网络数据的类型三、社会网络数据的类型1 1、ScottScott(20002000)将社会科学中的数据分为三类:)将社会科学中的数据分为三类:属性数据(属性数据(Attribute DataAttribute Data): :指的是行动者的态度、观点指的是行动者的态度、观点以及行为等方面的数据,它们一般被视为个人或者群体所具有以及行为等方面的数据,它们一般被视为个人或者群体所具有的财产、性质、特点等属性。的财产、性质、特点等属性。 关系数据(关系数据(Relational DataRelational Data): :是关于联系、接触、联络、是
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。