1、Spss统计应用实务-问卷分析与应用统计主要内容统计基本原理与常用统计方法统计基本原理与常用统计方法 统计基本思想及基本概念统计基本思想及基本概念 统计数据整理与显示方法统计数据整理与显示方法 统计描述统计描述 统计推断统计推断-参数估计假设检验参数估计假设检验 多变量关系研究多变量关系研究-相关与回归,单(双)因素方差分析相关与回归,单(双)因素方差分析 常用的统计模型:因子分析、聚类分析常用的统计模型:因子分析、聚类分析定量研究与统计分析定量研究与统计分析 量化研究的基本概念量化研究的基本概念 量表分析步骤量表分析步骤 数据的建立数据的建立 量表项目分析量表项目分析 量表效度与信度量表效度
2、与信度 信度与效度的概念信度与效度的概念 信度与效度的检验方法信度与效度的检验方法统计应用实例及统计应用实例及EXCEL、Spss统计基本原理与常用统计方法统计基本原理与常用统计方法 1.1统计基本思想与基本概念统计基本思想与基本概念1.1.1 什么是统计学?什么是统计学?统计学是用以(1)收集数据、(2)分析数据、(3)由数据得出结论的一组概念、原则和方法。1.1.2 统计学的基本思想统计学的基本思想 随机性和规律性:关系密切的孪生子 规律性中的随机性1.1.3 统计学的中几个基本概念统计学的中几个基本概念变量、值和个体变量、值和个体 定义:分类分类:定类变量、定序变量、定距变量、定比变量随
3、机事件和随机变量随机事件和随机变量 总体、样本总体、样本总体参数和样本统计量总体参数和样本统计量概率概率统计基本原理与常用统计方法统计基本原理与常用统计方法 1.1统计学的基本思想与基本概念统计学的基本思想与基本概念1.1.4 统计研究的基本过程统计研究的基本过程 数据收集数据收集-数据整理数据整理-数据分析数据分析1.1.5 数据收集数据收集观测数据和实验数据观测数据和实验数据变量的定义和变量的选择变量的定义和变量的选择数据收集的方法:数据收集的方法:文献资料法、调查法、测量等选择合适的样本选择合适的样本:简单的随机抽样、分层抽样、整群抽样收集数据时的错误和误差收集数据时的错误和误差衡量某一
4、调查的结果所要考查的因素:衡量某一调查的结果所要考查的因素:样本是否是合适的样本响应率(response rate)提问题时所用的实际措辞在调查中该问题被安排在什么地方?访问员是谁抽样误差抽样误差(sample error)、系统误差、过失误差、随机误差系统误差、过失误差、随机误差未响应误差未响应误差(nonresponse error)响应误差响应误差(response error)15119690481216频数可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布不同品牌饮料的频数分布不同品牌饮料的构成不同品牌饮料的构成可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%
5、露露18%统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法1.2.1 数据的分类定类变量-分类数据定序变量-顺序数据定距变量-数值型数据时间序列数据多变量数据1.2.2分类数据的整理与展示频数与频数分布图示:条型图、饼图统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法1.2.3顺序数据的整理与展示累积频数累积频数累积频率累积频率回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(
6、户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非 常 不 满非 常 不 满意意 不满意不满意 一般一般 满意满意 非常满意非常满意21997864387.033.026.021.312.7211201
7、982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计合计300100.0统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向下累积向下累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理
8、与展示方法不同数据类型整理与展示方法8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法1.2.4数值型数据整理与展示方法数据的分组等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展
9、示方法统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法组距分组确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。实例直方图直方图下的面积之和等于1折线图折线图与直方图下的面积相等!茎叶图箱线图不同数据分布的箱线图统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法1.2.5时间序列数据-线图 年份年份城镇居民城镇居民农村居民农村居民19911992199319942019201920192019201920001700.62026.62577.43496.242
10、83.04838.95160.35425.15854.06280.0708.6 784.0 921.61221.01577.71926.12091.12162.02210.32254.4线图 城乡居民家庭人均收入 城乡居民家庭人均收入020004000600080001991199219931994199519961997199819992000年份收入城镇居民农村居民统计基本原理与常用统计方法统计基本原理与常用统计方法 1.2不同数据类型整理与展示方法不同数据类型整理与展示方法1.2.5多变量数据-雷达图 项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭
11、设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务39.1810.018.796.367.9012.5610.015.17 49.305.754.525.245.5811.1815.473.14雷达图2000年城乡居民家庭人均消费支出构成2000年城乡居民家庭人均消费支出构成01020304050食品衣着家庭设备用品及服务医疗保健交通通讯娱乐教育文化服务居住杂项商品与服务城镇居民 农村居民总结条条 形形 图图 饼饼 图图 环环 形形 图图汇汇 总总 表表品品 质质 数数 据据直直 方方 图图折折 线线 图图分分 组组 数
12、数 据据茎茎 叶叶 图图箱箱 线线 图图原原 始始 数数 据据线线 图图时时 序序 数数 据据雷雷 达达 图图多多 元元 数数 据据数数 值值 型型 数数 据据数数 据据 的的 类类 型型统计基本原理与常用统计方法统计基本原理与常用统计方法 1.3描述统计描述统计1.3.1数据集中趋势测度指标众数(Mode)中位数(Median)、分位数(quartile)平均数(Mean)1.3.2数据离散趋势测度指标异众比率全距(Range)四分位距(quartile deviation)标准差(Std.deviation)方差(Variance)变异系数(离散系数)1.3.4数据偏态与峰态测度指标偏态系
13、数、峰态系数1.3.5相对位置测量标准分数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度sxxzii众数、中位数、平均数与分布众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用数据类型数据类型分类数据分类数据 顺序数据顺序数据间隔数据间隔数据适适用用的的测测度度值值相对位置-标准分家庭编家庭编号号人均月收入(人均月收入(元)元)标准化值标准化值 z 1234567891500 750 7801080 85
14、0 960200012501630 0.695-1.042-0.973-0.278-0.811-0.556 1.853 0.116 0.996经验法则表明:当一组数据对称分布时约有68%的数据在平均数加减1个标准差的范围之内约有95%的数据在平均数加减2个标准差的范围之内约有99%的数据在平均数加减3个标准差的范围之内 应用标准分制定评价标准数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测度度值值偏态与峰态分布的形状EXCEL统计实例统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布1.4.2参数估计1.4
15、.3假设检验参数估计假设检验统计方法描述统计推断统计统计推断的过程统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布抽样方式简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布抽样分布1.在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布 2
16、.是一种理论分布3.随机变量是 样本统计量样本统计量样本均值,样本比例,样本方差等4.结果来自容量相同的所有可能样本5.提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布示意统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布样本均值的抽样分布3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布样本均值的抽样分布3.53
17、.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.1抽样与抽样分布样本均值的抽样分布5.2X625.02X中心极限定理 xn x 统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.2参数估计 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量XXzX2统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.由样本统计量所构造的总体参数的估计区间称为置信
18、区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个xxX置信区间实例一个由大学四年级男生组成的样本中,平均身高是71英寸,标准差是2.1英寸。用这组数据的构造的总体平均身高的95%的置信区间是70.4英寸71.6英寸之间。美国成年男的身高的均值是69.1英寸,你如何理解这个置信区间?从这个置信区间来看,大学四年级男生的身高和所有男性身高是否有区别?统
19、计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断915.096.14.212nzx统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断1.4.3假设检验假设检验的基本原理某种带有概率性质的反证法,即:小概率事件在一次观察中实际上不可能发生的统计原则。假设备择假设与原假设所犯的两种错误及显著性水平1“弃真”错误 2“取伪”错误统计量及拒绝域基本步骤1 提出原假设H0 2 选择计算统计量 3 取a=0.05或0.01并计算临界值 4 比较判断得出结论单侧检验与双侧检验什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体
20、均值总体均值、比比例例、方差方差等分析之前必需陈述什么是假设检验?(hypothesis test)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理原假设(null hypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.总是有符号,或4.表示为 H0H0:=某一数值 指定为符号=,或 例如,H0:10cm1.研究者想收集证据予以支持的假设2.也称“研究假设”3.总是有符号 ,或 4.表示为 H1H1:某一数值,或 某一数值例如,H1:”或“”的假设检验,称为单侧检验或
21、单尾检验(one-tailed test)备择假设的方向为“”,称为右侧检验右侧检验 双侧检验与单侧检验(假设的形式)假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0两类错误与显著性水平假设检验中的两类错误1.第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平2.第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有
22、罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误(b b)拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-b b)错误和 b 错误的关系你不能同时减你不能同时减少两类错误少两类错误!影响 b 错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平 当 减少时增大3.总体标准差 当 增大时增大4.样本容量 n当 n 减少时增大显著性水平(significant level)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的 值有
23、0.01,0.05,0.104.由研究者事先确定假设检验中的小概率原理 什么是小概率?什么是小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定统计量与拒绝域1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 点估计量的抽样标准差假设值点估计量标准化检验统计量显著性水平和拒绝域(双侧检验)/2 显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(双侧检验)显著性水平和拒绝域(单侧检验)显
24、著性水平和拒绝域(左侧检验)显著性水平和拒绝域(左侧检验)显著性水平和拒绝域(右侧检验)显著性水平和拒绝域(右侧检验)决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与 水平的临界值进行比较3.作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0什么是P 值?(P-value)1.在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设H0之间不一致的程度3.被称为观察到的(或实测的)显著性水平4.决策规则:若p值,拒绝 H0双侧检验的P 值左侧检验的P
25、值右侧检验的P 值假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值值作出决策统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断均值假设检验1.单样本t检验检验某个变量的总体均值与指定的检验值之间是否存在显著差异。前提要求是样本来自的总体应服从正态分布。例1:随机抽样得到若干个周岁儿童身高的样本数据。现在需要通过这些样本数
26、据,分析周岁儿童的平均身高是否为75厘米?例2:已知某运动饮料中,维生素C含量服从正态分布,按规定,维生素C的平均含量不得小于21毫克。现从一批饮料中抽取17罐,平均C含量为23毫克,标准差为3.98毫克,问该批饮料维生素C含量是否合格?统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断均值假设检验1.独立样本t检验就是根据样本数据对它们来自的两独立总体的均值是否有显著差异进行推断。这个检验的前提要求是:(1)两样本应是相互独立的。即从一总体中抽取一批样本对从另一总体中抽取一批样本没有任何影响。(2)样本来自两总体应服从正态分布。例:从北京和上海两个城市,分别随机抽取
27、若干个周岁儿童身高的样本数据,现在需要分析两城市周岁儿童的平均身高是否存在显著差异。例:现将各方面条件及技术水平基本相似的12名跳远运动员随机的分成两组,分别实施不同的训练,半年后,每人增长的成绩如下(单位:厘米)1517 12 16 11 138 9 9 10 8 7试问两种训练的效果是否有显著性差异?(=0.01)统计基本原理与常用统计方法统计基本原理与常用统计方法 1.4统计推断统计推断均值假设检验1.配对样本t检验是根据样本数据对样本来自的两配对总体的均值是否有显著差异进行推断。前提要求:一是,两样本应是配对的。(两样本观察值数目相同;其次,两样本的观察值的顺序不能随意更改)二是,样本
28、来自的两样本总体应服从正态分布。统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究1.5.1基本思路问题一:从数据看变量间有关系吗?问题二:如果变量间有关系,这个关系有多强?问题三:是否不仅在样本中,而且在总体 中也有这种关系?问题四:这个关系是不是因果关系?1.5.2两分类变量:列联表 卡方检验例:不同的国家的人们用同样的眼光来看待陌生人吗?调查的问题:“一般说来,你是同意大多数人都是可信赖的呢,还是认为和人们相处时再怎么小心也不过分?”统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究 国家国家 丹麦法国法国总计总
29、计对他人态度信任信任625206831怀疑怀疑3607631123 总计总计9859691954 国家国家 丹麦法国法国对他人态度信任信任6421怀疑怀疑3679 总计总计10098510096943.0统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究1.5.2两分类变量:列联表 卡方检验信任怀疑丹麦法国2067636253600200400600800丹麦法国62520636076302004006008001000丹麦法国信任怀疑625206360763020040060080010001200丹麦法国怀疑信任有没有关系?两变量关系的强度?总体中关系
30、?提出零假设检验零假设 p-值判断)统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究1.5.3一分类变量(自变量)与数值型变量的方差分析实例:下表汇总了儿童看护花费的数据资料。请用方差分析的方法来判断不同看护方式之间的收费是否也不相同。解:第一、看看两变量之间的关系(作图)第二、具体分析两变量之间的强度 第三、描述总体的这种关系,进一步分析这种不同产生的原因。14435N=看护私人家庭日托保姆亲属每小时费8.07.57.06.56.05.55.04.5152ANOVA每小时费 SSdfMSFSig.组间 10.03933.346 8.543.003组内
31、4.70112.392 Total 14.73915 统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究1.5.4两数值型变量的相关与回归分析从右图看数据关系?如果一种食物如果含有两倍于另一种食物的脂肪,其热量是否也为另一食物的两倍。食物热量脂肪玉米饼 1104炸薯片 1206奶酪味小吃 1206炸面饼圈 1648苹果馅饼 43019爆玉米花 19211冰激凌 17512巧克力条饼干23612奶酪饼干 42926鸡翅膀 31821奶酪面包圈 24911花生酱杯 28116干烤花生 16014巧克力条 1479奶酪或花生酱2109麦片条 1205统计基本原理
32、与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究1)作散点图看有没有关系脂肪(克)3020100热量(卡)500400300200100统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究2)求关系强度-相关系数相关系数r是在-1到1之间的描述两数值变量间关系强度的一个指标。我们把它称为线性相关系数(linear correlation coefficient)、(Pearsons correlation coefficient)或乘积相关系数(product-moment correlation coefficient)相关系数
33、的性质(正负及大小)一般认为:r(-.78,-1)很强的负相关,r(.78,1)很强正相关;r(-.30,-.78),r(.30,.78)表示一个适中的关系;r(-.25,.25)关系很弱。散点图与相关系数 由散点图可以看出相关程度的强弱;另外可以发现异常值,所以在进行相关分析和回归分析之前,应作一散点图观测一下数据。对r相关系数的解释 r 到底又有怎样的含义,另外R的平方又代表了什么意义?统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究3)进一步研究两变量关系形式-回归分析在使误差值取得最小时即:值取得最小时,我们就可根据“最小二乘法原理”来确定a,b
34、的值。)2iiyyxYyyyyybxayyy yy xy3.151.16统计基本原理与常用统计方法统计基本原理与常用统计方法 1.5多变量关系研究多变量关系研究判定系数-方程拟合优度指标总体相关性检验-方差分析表系数的假设检验-T检验自变量(脂肪含量)残差变量因变量(热量)?来源平方和比例脂肪含量131878083贡献率残差27182017贡献率总计159060100统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型1.6.1因子分析模型多指标设计的带来的问题:1、增加收集的工作量,使分析工作变得烦琐2、耗费大量的人力物力,但存在大量的信息重叠。解决办法:采用
35、因子分析减少指标,而不造成重要信息的丢失。它将众多指标综合成几个较少的几个综合指标,这些综合指标称为因子变量。统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子变量的特点统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析简介1、因子分析数学模型及相关概念假设研究的变量为P个(x1,x2,xp)其中xi是平均数为0标准差为1的标准化变量;F1,F2,Fm为m个因子变量mP,于是有:A为因子载荷为因子载荷矩阵,矩阵,aij为因为因子载荷,子载荷,E为为特殊因子。特殊因子。统计基本原理与常用统计方法统计基本原理与常用统计
36、方法 1.6统计高级模型统计高级模型因子分析相关概念统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤1、确定待分析的原有若干变量是否适合作因子分析。采用相关分析方法得出变量的相关系数矩阵统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤1、确定待分析的原有若干变量是否适合作因子分析。采用相关分析方法得出变量的相关系数矩
37、阵统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤1、确定待分析的原有若干变量是否适合作因子分析。统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤2、确定因子变量和因子载荷矩阵 采用主成分分析的方法 统计基本原理与常用统计方法统计基本原理与常用统计方法 1.6统计高级模型统计高级模型因子分析的步骤3、因子变量命名解释 研究问题引入(小学五年级数学学习情况)研究问题、假设及统计方法研究问题、假设及统计方法问卷设计与分析问卷的项目分析-反向重新计分问卷的项目分析-计算各维度总和问卷的项目分析-分析各题目区分度对各维度总分进行排序,找27%低分组和27%高分组进行独立样本T检验,差异不显著的应该删除该题目.或者对各题目分数与总分数进行相关性检验,把不显著相关的题目删除效度分析专家效度(适合,修改后适合,不适合)计算适合的比率评价专家效度效标效度:和某一有效标准的测量值进行相关分析内容效度:分析题目的难度和区分度结构效度:因子分析探讨主因素结构和理想结构的一致性.信度分析信度:分析各维度的信度系数以及总量表的信度系数重测信度分半信度:将变量按奇偶分半记分,求两部分间的相关系数