1、SPSSv浙江师范大学教育学院心理系v康春花课程框架v一、教育统计与测量预备知识v二、相关分析v三、假设检验(独立总体)v四、假设检验(相关总体)v五、方差分析基础v六、一元线性回归分析v七、多元统计分析v八、问卷的质量分析v九、卡检验v十、复选题的处理与分析教材与参考资料v教材:v张敏强 著 教育与心理统计学人民教育出版社v参考资料:v1.张厚粲 著 心理与教育统计学北京师范大学出版社v2.金瑜 著 心理测量华东师范大学出版社教学目标v1.明白教育与心理统计学在教育与心理科学研究中的地位与作用;v2.掌握各种统计分析法的使用条件,能依据不同的研究问题选择正确的统计分析法;v3.根据研究目的,
2、能正确解释各种统计分析结果;v4.理解各种统计分析法的相同与不同,结合研究问题,能巧妙地运用多种统计分析法为研究服务。一、教育统计与测量的预备知识v(一)教育与心理统计学的研究对象与性质v教育与心理统计学:是把数理统计的理论与方法应用到教育与心理领域,研究教育与心理现象的一门应用统计学,它是我们正确认识教育与心理现象数量特征的重要工具。v(二)统计方法在教育领域中的作用v1.教育与心理统计是教育科学研究的工具v2.学习教育与心理统计有利于教育行政和管理工作者正确掌握情况,进行科学决策v3.教育与心理统计是教育评价不可缺少的工具v4.学习教育与心理统计有利于训练科学的推理与思维方法v1.教育与心
3、理统计是教育科学研究的工具v(1)研究范式与方法v 在社会科学研究中,其方法从总体上讲可以概括为质的研究方法(qualitative research)和量的研究方法(quantitative research)两种,这两种方法是不能相互取代的,而是相互补充的。研究范式与方法 图1-1心理与教育研究的一般过程v(2)心理、教育科学研究与理论构建v a 归纳理论的构建v 归纳理论是从对研究数据的观察和分析中发展出来的能够解释现象或变量之间关系的概括性理论。归纳理论构建的逻辑基础是归纳推理,即从特殊到一般,从事实到理论。v 研究者要观测、分析大量的事实,更主要的是要善于从复杂的数据中寻找具有普遍意
4、义的模式或规律。v如:美国社会心理学家格罗克1967年进行的关于宗教信仰的大规模调查,从大量数据事实中探讨了四个变量(性别、婚姻状况、年龄、家庭收入)与宗教信仰程度的关系,最后得出结论:在社会生活中最大程度地被剥夺了成功感和满足感的人倾向于信仰宗教,以获得慰藉和补偿(宗教的社会剥夺理论)。vb 演绎理论的构建v 演绎理论是从某些一般性的规律出发对于某些特殊事件建立的理论。演绎理论的逻辑基础是演绎推理,即从一般到特殊,从理论到特殊事件。v演绎理论的一般步骤是:va 选择研究课题,并确定一般性理论的应用范围;vb 确定研究的变量并使之操作化;vc 收集和分析有关变量之间关系的命题;vd 从命题出发
5、进行逻辑推理,得出逻辑推理。v如:从社会心理学中“人际交往对个人价值取向与行为方式的影响”理论出发来考察独生子女的心理和行为特点。v当然这些分析还需要调查和实验的研究来加以验证。天然的无选择的人际关系社会的个人选择的人际关系独生子女可能成长为较有独立性、自我定向以及灵活应付社会的能力较强的人少多v c 机能理论的构建v 机能理论是指综合了归纳与演绎的成分,既强调数据,又强调解释的理论。v 事实上,在具体的研究中,归纳和演绎经常是结合在一起的。图1-2心理与教育研究中的归纳和演绎天然的无选择的人际关系社会的个人选择的人际关系独生子女可能成长为较有独立性、自我定向以及灵活应付社会的能力较强的人少多
6、调查或实验比较独生子女与非独生子女在独立性、自我定向和应付社会等方面的能力强弱独生子女心理与行为理论归纳演绎vd 模型理论的构建 v 模型理论的构建以类比为基础,在认知心理学中运用比较多。v 教育工作者对教育问题的研究不仅从定性的角度去认识,而且越来越注意从定量的角度去分析。v 而教育与心理统计学正是为实证主义研究(量的研究)服务的。这可以从以下量的研究的流程图中看出。教育与心理学量化研究流程图理论基础或研究目的(可验证的假设)量表研究实验研究选用通用量表发展或修订新量表预测项目分析效度分析信度分析正式量表正式测试数据统计分析量表的质量分析量表编制技术实验设计技术推断统计分析多元统计分析描述统
7、计分析非参数检验撰写研究成果v如:v研究课题:中学生时间管理倾向、心理健康与学业成绩之间的关系研究。v研究假设1:中学生的时间管理倾向、心理健康与学业成绩之间存在显著的相关关系;v研究假设2:对中学生时间管理倾向的训练能提高中学生的时间管理技能、心理健康程度和学业成绩。v研究方法:v 收集资料的方法:问卷调查法v 实验法v 分析资料的方法:利用SPSS对数据资料进行统计分析(相关分析、t检验)v研究工具:时间管理倾向量表v MHT量表v 学业测量量表(考试卷)v实验设计:实验组、对照组前后测设计v2.学习教育统计有利于教育行政和管理工作者正确掌握情况,进行科学决策v3.教育统计是教育评价不可缺
8、少的工具v 教育评价质量的获取、整理、解释及评价结果的质量分析,都离不开统计方法。v4.学习教育统计有利于训练科学的推理与思维方法v 统计研究是以大量数据并通过严密的逻辑推理去说明事物的本质,而不是靠个别事实。v(三)教育与心理统计学的内容v1.描述统计v 描述统计,主要研究如何将实验或调查得到的大量数据简缩成有代表性的数字,使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。v例如:v 描述学业考试中全校或班级的考试状况(平均成绩)、描述学生的升学率、及格率或优秀率等。v2.推断统计v 推断统计是以描述统计为基础,以解决由局部到全体的推论问题,
9、即通过对一组统计量的计算分析,推论该组数据所代表的总体特征。v例如:v 随机抽取某校若干名学生的考试成绩,推断该校学生成绩与全市该类学生考试成绩的差异性。v(四)统计概念和术语v1.随机现象与随机变量v 随机现象是一种不确定性现象.如考试、心理测验等。存在随机误差。v 我们把具有变化规律的表示随机现象各种结果的变量称为随机变量。如学生的身高、体重、性别、智商、成绩等等。v 随机变量具有离散性、变异性与规律性的特点。v2.变量的类型v(1)连续变量与非连续变量(间断变量、离散变量)v(2)因变量与自变量随机变量按性质分有如下四种:v(1)称名变量(Nominal)如性别、年级等。v(2)顺序(等
10、级)变量(ordinal)如名次、等级评定、喜爱程度、品质等级、能力等级等。v(3)等距变量(interval)如天气温度、各种能力分数、智商等。v(4)比率变量(ratio)如身高、体重、反应时等。v3.总体 个体 样本 v 总体是某一类所欲研究的对象的全体。N v 构成总体的每个基本单元称为个体。x v 从总体中抽取的一部分个体,称为总体的一个样本。n总体(population)样本(sample)v4.统计量与参数v统计量是描述样本情况的统计指标。如,S,r等。v参数又称总体参数,是指描述一个总体情况的统计指标,用希腊字母表示。如 等X样本样本抽取部分个体抽取部分个体 推断统计推断统计如
11、:样本平均数如:样本平均数 样本标准差样本标准差S 样本相关系数样本相关系数r 如:总体平均数如:总体平均数 总体标准差总体标准差 总体相关系数总体相关系数X描述统计描述统计各种概念之间的关系v5.平均数、标准差v(1)平均数的概念v(2)方差与标准差的概念v(1)平均数的概念v 观测值的总和除以观测值的总次数所得的商,总体平均数用表示,样本平均数用 表示。XNXNNii111XnX1v(2)方差与标准差的概念v总体方差与标准差:v样本方差与标准差:22)(1XN2)(1XN22)(11XXnS2)(11XXnSv如:数据(三位射击手的射击成绩)v A:7 7 8 8 8 9 9 R=2v B
12、:4 5 7 8 9 11 12 R=8v C:1 4 7 8 9 12 15 R=14v谁的成绩更稳定?8对于谁的代表性更好?8AX8BX8CXv在心理学中,常用平均数与标准差建立量表的常模。v如:在SCL-90中,抑郁分量表的均值为1.50,标准差SD为0.59,如果某人的得分偏离常模团体平均数达到两个标准差时0.32,2.68,则可认为是异常。v6.正态分布与t分布v(1)正态分布v 正态分布也称为常态分布或常态分配,是连续随机变量的概率分布的一种。其概率分布是一种呈钟型的对称曲线,叫正态曲线或高斯曲线。v 某变量服从正态分布写作:X N()2,不聪明的人人数很多人很少人中等聪明的人聪明
13、的人矮的人中等高矮的人高的人正态分布100130120110908070 0 3 2 1-1-2-3()原始分标准差正态曲线下的面积被分成不同的区域(=100,=10)平均数决定曲线在横坐标上的位置(总体水平的高低)低分高分A的平均数B的平均数C的平均数y标准差决定总体的离散程度(分布形态)低分高分平均数y分布A分布B分布Cv在正态分布曲线下,标准差与概率(面积)有一定的数量关系。v 如:离开平均数正负1个标准差之间包含总面积的68.26%。其他见下表:100130120110908070 0 3 2 1-1-2-3(平均数)原始分标准差34.13%34.13%13.59%13.59%2.15
14、%2.15%.13%.13%区域包括分数的范围(如果平均数为100,标准差为10)平均数和1个标准差曲线下包括所有个体的34.13%100-1101和2个标准差曲线下包括所有个体的13.59%110-1202和3个标准差曲线下包括所有个体的2.15%120-130超过平均数3个标准差以上曲线下包括所有个体的0.13%130以上同样区域包括分数的范围(如果平均数为100,标准差为10)平均数和-1个标准差曲线下包括所有个体的34.13%90-100-1和-2个标准差曲线下包括所有个体的13.59%80-90-2和-3个标准差曲线下包括所有个体的2.15%70-80超过平均数-3个标准差以上曲线下
15、包括所有个体的0.13%70以下v 正负1.96个标准差之间,包含总面积的95%;正负2个标准差之间包含总面积的95.44%;正负2.58个标准差之间包含总面积的99%;正负1.64个标准差之间包含总面积的90%;正负3个标准差之间包含总面积的99.74%。v 任何正态分布都可以通过 v 转换成标准正态分布。转化成标准正态分布后,所有的原始分数都变成了标准分数,所有的普通正态分布曲线下横坐标上的数据都转变成了标准正态分布下的标准分数,因而把不等单位的原始数据转变成了可以比较(加减乘除)的标准分数。XZv如上述正态分布XN vX为110的标准分为:2(100,10)110 100110XZ 0
16、3 2 1-1-2-3标准分34.13%34.13%13.59%13.59%2.15%2.15%.13%.13%v所有学生分数中84%的学生的分数低于1个标准分,即P(Z1)=0.84。即16%的学生的分数高于1个标准分。v(2)t分布v t分布也是钟形对称的分布,与正态分布相比,中间稍低而尖翘,两头高而平缓。v t分布因自由度的不同而形成不同的形态,而正态分布是由平均数和方差决定的分布,标准正态分布只有一条曲线,而t分布随着自由度的增大,曲线形态会越来越接近正态分布,当df趋近无穷时,t分布曲线与正态分布曲线重合。正态分布与t 分布比较正态分布与t 分布比较00.10.20.30.40.5-
17、4-3-2-101234normalnormalt(1)t(1)t(3)t(3)t(5)t(5)t(9)t(9)t(19)t(19)案例呈现1(仅作教学使用)v研究题目:“浙江省大学生人格状况调查研究”。v研究工具:“大五”人格问卷。v研究问题:v(一)该抽样调查的样本结构如性别、年级、学校人数结构v(二)浙江省大学生的人格现状描述v(三)浙江省大学生人格的性别差异研究v(四)浙江省大学生人格的年级差异研究v(五)浙江省大学生人格的学校差异研究v(六)浙江省大学生人格在性别与年级上是否存在交互作用v(七)浙江省大学生人格在性别与学校上是否存在交互作用v(八)浙江省大学生人格在学校与年级上是否存
18、在交互作用v(九)高低人格类型与性别、年级、学校的关系v收集资料的方法:问卷调查法。v分析资料的方法:v 问题(一)、(二):描述统计分析v 问题(三)、(四)、(五):一元推断统计分析v 问题(六)、(七)、(八):多元推断统计分析v 问题(九):卡方检验案例呈现2(仅作教学使用)v研究题目:私立高中学生心理健康水平与其父母教养方式的相关研究。v研究工具:周步成的“学生心理健康综合测量(mht)”、“父母教养方式评价量表”。v研究问题:v(一)私立高中学生心理健康水平的总体描述v(二)独生与非独生子女MHT的差异v(三)学生MHT的文理科、性别差异v(四)学生MHT的年级差异v(五)父亲教养
19、方式与学生MHT的相关分析v(六)母亲教养方式与学生MHT的相关分析v(七)父亲文化程度与学生MHT的关系v(八)母亲文化程度与学生MHT的关系v收集资料的方法:问卷调查法v分析资料的方法:v问题(一)描述统计分析:平均数、标准差v问题(二)(三):假设检验v问题(五)(六):相关分析v问题(四)(七)(八):方差分析 实证研究(量的研究)的论文格式:(一)题目 题目最好能表现研究的变量关系(即关系是可验证的假设)。如“学习困难儿童友谊质量、定向、孤独感的研究”(心理科学 2003年 第2期 P236。)(二)引言或前言 说明该研究的意义以及题目产生的过程;提出问题的背景材料;提出问题的假设并
20、加以一定的阐述。(三)研究方法 1.被试选择 被试的选择方式,被试的年龄、性别及相关信息,被试的数目、如何分组(实验研究)等体现被试总体的大概信息。(可用文字、描述统计分析图或表来说明)2.研究材料(仪器材料)量表研究(如本例)智力量表、学业成绩、孤独问卷、友谊质量问卷、定向问卷(交代问卷的效度及信度资料);如果是自编问卷应交代问卷质量分析过程。实验研究 呈现自变量或测量因变量用的。如眼动仪 还应写明自变量如何呈现,呈现的时间和速度等。3.研究程序(实验程序)量表研究:指导语、如何进行测试。实验研究:实验设计,进行实验的原则、方法和步骤,指导语是什么,用什么措施控制了哪些条件等。(四)结果(对
21、研究问题进行统计分析的结果)以图或表的形式表示的统计结果。客观结果。(五)讨论 这部分主要是要根据研究结果对所要解决的问题给予回答并指出假设是否得到证实。v 如果研究(实验)结果不能充分说明问题或者各部分有矛盾,就要进行讨论,找出原因。v 如果研究(实验)结果与其他研究者的同类研究结果不一致时,要进行讨论,提出自己的看法。v 如果研究(实验)得到意外结果,也要进行讨论。v 还应对本研究的程序、所用仪器材料以及进一步研究提出修改意见和建议。以上具体过程可参见:刘在花 许燕 学习困难儿童友谊质量、定向、孤独感的研究 心理科学 2003年,第2期,P236(六)结论 以概括的形式说明实验结果证实了或
22、否定了什么问题。结论应确切地反映整个实验的收获。(七)参考文献 文献的作者、题目、出处、出版日期等。(八)附录 另外,有的研究(实验)还要求写“摘要”。“摘要”应写在题目下,正文前。200字左右。包括所解决的问题、方法、结果或结论等内容。二、相关分析及其应用v案例案例1 对语文与教学成绩关系的统计处理对语文与教学成绩关系的统计处理v 设想语文成绩与数学成绩之间有一定的相关,在小学阶段,语文成绩好的学生,可以更好的理解数学题目,在低年级更加明显。某些小学老师对这个问题很感兴趣,他们对参加考试的同学中,抽取10名学生,其成绩如下:学生 语文 数学 1 59 47 2 35 40 3 59 42 4
23、 57 55 5 50 49 6 71 63 7 62 55 8 47 42 9 43 42 10 68 57v【问题与思考】v 1.相关分析的原理是什么?v 2.相关分析的类别有什么?v 3.对于本案例该用何种相关来进行分析?相关分析(描述两变量关系的量数)v1.什么是相关关系v 变量之间的关系可以分为两类:v 一类是确定的函数关系,比如销售额(M)、价格(P)和销售量(Q)之间的关系为:M=P*Q;它们之间为一一对应的关系,知道其中两个变量,就可以确定第三个变量。v另一类是统计相关关系。相关关系指的是变量之间有联系,但其密切程度又没有达到一一确定的因果关系。比如不同地区家庭的人均食品支出与
24、人均收入的关系,收入高的地区,往往食品支出也高,但是相同收入的地区,食品支出不一定相同,这是因为后者还与地区物价以及不易测量的消费习惯等随机因素有关。v 变量之间相关的密切程度可以用相关系数r来表示,其取值范围为-1,+1,绝对值r越接近1表明相关密切程度越高,或者说一变量受另一变量的影响程度越高。可见具有函数关系的两变量,其相关系数一定为+1或-1。v 正相关:方向一致,如身高与体重成正相关。v 负相关:方向相反,如初学打字,练习次数越多,错误越少。v 零相关:不存在线性相关,如成绩好坏与身高无关,不是不相关,因为有可能是曲线相关。图图7 74 4 相关系数示意图相关系数示意图 散点呈椭圆形
25、分布,散点呈椭圆形分布,X X、Y Y 同时同时增减增减-正相关(正相关(positive positive correlation)correlation);X X、Y Y 此增彼减此增彼减-负相关负相关(negative correlation)(negative correlation)。散点在一条直线上,散点在一条直线上,X X、Y Y 变变化趋势相同化趋势相同-完全正相关完全正相关;反反向变化向变化-完全负相关。完全负相关。X X、Y Y 变化互不影响变化互不影响-零相关零相关(zero correlation)(zero correlation)零相关零相关v2.相关系数的计算v
26、计算相关系数一般要求成对的数据,即若干个个体中的个体要有两种不同的观测值。例如每个学生的数学和语文成绩;每个学生的智力分数与学习成绩;每个学生的英语听力水平和口语水平。v积差相关(积矩相关)v适用条件:v 连续变量v 成对出现v 正态分布 v定义公式:v计算公式:22)()()(YYXXYYXXrxy2222)()(YYNXXNYXXYNrxyv例如,被试的身高(cm)和体重(公斤)均服从正态分布,求其相关密切程度。(r=0.792)被试12345678910身高170173160155173188178183180165体重50454744505350495245vspearman等级相关v
27、 适用条件:v 两列变量都是等级或顺序变量的时候。v 确定不了数据的分布形态的时候。v 积差相关运算太繁,转用等级相关。v 计算公式:v D为等级相减之差 v例:v学习 1 2 3 4 5 6 7 8 9 10v纪律 1 4 3 2 9 5 6 8 10 7v D 0 -2 0 2 -4 1 1 0 -1 3)1(6122NNDr78.0)110(1036612rv3.对于本案例的分析v 由于语文和数学考试都是采用百分制,故可把它们都看作是连续变量,因而其相关分析可用积差相关来做。v =0.832222)()(YYNXXNYXXYNrxy以上数据统计分析也可在以上数据统计分析也可在SPSS10
28、.0中进行中进行v具体操作过程如下:v(1)菜单选择:Analyze/Correlate/Bivariate v(2)统计结果:v (3)结果说明:数学和语文成绩相关显著,相关系数为r=0.83(p0.01)。Correlations1.000.830.0031010.8301.000.003.1010Pearson CorrelationSig.(2-tailed)NPearson CorrelationSig.(2-tailed)N语文数学语文数学三、假设检验及其应用1v案例案例2 对独生和非独生子女社会认知能力数据的统对独生和非独生子女社会认知能力数据的统计处理计处理v 随着计划生育基本
29、国策的推广,有越来越多的独生子女出现,独生子女问题一直是大家比较关心的问题。设想独生子女与非独生子女在社会性方面存在差异,有些研究者对这个问题很感兴趣,他们随机抽取独生子女7人,非独生子女12人,进行社会认知测验,测验题目共200题,在规定时间内答对算1分。测验成绩的数据如下:非独生子女 独生子女 83 70 146 118 119 101 104 75 120 107 161 132 107 94 134 115 129 99 123v【问题与思考】v 1.平均数差异显著性检验的原理是什么?v 2.平均数假设检验的类别有什么?v 3.对本例的分析。v1.平均数差异显著性检验的原理v 均值比较
30、就是看两个样本中某变量均值不同,其差异是否具有统计意义,即能否通过样本平均数之间的差异去推论总体之间确实存在差异.v 要解决这个问题,其步骤为:建立假设检验假设作出结论。v(1)关于假设v :两者在社会认知能力上无差异v :两者在社会认知能力上有显著性差异0H1Hv 虚无假设是统计推论的出发点,人们在进行研究时,总是从虚无假设出发,通过计算某一检验统计量来推翻虚无假设,从而得到希望证实的研究假设。v(2)统计决策的原理v 统计决策的原理是“小概率事件原理”。v 在一次随机抽样中小概率事件不会也不可能发生,小概率事件的小概率记为 ,称为显著性水平(Level of significant),所谓
31、显著性水平就是研究者拒绝真的虚无假设时犯错误之最大概率值,通常取0.05,0.01三个值比较多。v 在spss中,如果sig0.05或带有*(在文章中写作p0.05),就可以拒绝原假设,从而接受研究假设。v 差异显著性检验的原理v 从样本(我们实际观察)的统计量的差异能否作出一般性结论总体参数之间确实存在差异。要检验这种差异,必须建立与之对立的虚无假设(不存在差异,是误差因素引起的),经过检验如果所得到差异超过了统计学规定的某一误差限度(横坐标上的界限值),则表明差异已经不属于抽样误差,而是总体确实有差异,这种情况叫做差异显著,应拒绝虚无假设。v(3)检验统计量值(t检验与t值)v 平均数差异
32、的检验均可以采用t检验,t值的计算为:t=(平均数之差)/SEv t值计算出来后,应该与临界值比较,如果t值大于临界值,此时sig0.05(p0.05),则拒绝原假设,接受研究假设,即认为平均数之间存在显著性差异。.95.05.05/2.05.05/2保留区域保留区域t值落在拒绝区域(发生了小概率事件)t(df)/2-t(df)/2v2.平均数假设检验的内容(Analyze/Compare Means/)v(一)单总体平均数差异显著性检验(one sample t test)v(二)两独立总体平均数差异显著性检验(independent-samples t test)v(三)两相关总体平均数差
33、异显著性检验(paired-samples t test)v(四)单因素方差分析(One-Way ANOVA)v3.对本例的分析v 对本案例数据分析的统计学原理是什么?当然是双总体平均数假设检验,因为实验中有两组被试,其行为表现水平分别用各组被试测量值的平均数作为代表值,则其行为表现的差异性当然就是两组被试平均数差异的显著性检验的问题。v 那么,该用独立总体平均数假设检验的方法还是用相关总体平均数假设检验的方法呢?让我们来看看两相关总体的判断方法:其一、同一批被试的两列测量值是相关的;其二、一一严格配对的两组被试是相关的。故对本例而言,毫无疑问是两独立总体平均数差异显著性检验的问题。v检验统计
34、量为:v t=v服从df=的t分布。221122121211112xynsnsnnnn122nnv检验过程:检验过程:v(1)作统计假设:)作统计假设:v(2)计算检验统计量)计算检验统计量 v 120 101v v =445.82v v v由于由于 、差不多,故可认为两总体方差相差不多,故可认为两总体方差相等。等。012:HX Y 21S2121112 1iixx272211425.337 1iiSYY21s22sv 1.91v(3)由)由 =1.912.001,发生了小概率事件,应拒绝原假设,即认为实验班与对照班成绩存在显著性差异。实验取得了显著效果。2.0010.05/2t(58)-2.
35、0010.05/2t-(58)2.0010.05/2t(58).95.05.05/2.05.05/2保留区域保留区域拒绝区域(发生了小概率事件)-2.0010.05/2t-(58).0505/2.0505/2保留区域保留区域(0.95)拒绝区域 2.0010.05/2t(58)2.56vSPSS操作:数据见“自主学习教学方式.sav”。vAnalyze/compare means/Independent-samples T test,把“成绩”送入test variable中,把“group”送入grouping variable中,点击define groups按钮定义组别(1和2),ok。
36、Group Statistics3085.50003.3502.61173083.20003.6046.6581GROUP实验班对照班成绩NMeanStd.DeviationStd.ErrorMeanIndependent Samples Test.000.9912.56058.0132.56057.692.013Equal variances assumedEqual variances notassumed成绩FSig.Levenes Test forEquality of VariancestdfSig.(2-tailed)t-test for Equality of Meansv结果说
37、明:实验班成绩显著好于对照班成绩t=2.56(p0.05),实验效应显著。你是否能读懂这个表格?变量性别N平均数 标准差t值(P)学习压力男312 2.3892.6561 2.324(*)女394 2.2774.6175 社交压力男312 2.2668.7318 2.934(*)女394 2.1095.6883 生活压力男312 2.1982.6451 3.530(*)女394 2.0332.5936 自我发展与择业压力男312 2.4135.7252.603女394 2.3823.6438 总体压力感男284 2.74 1.02 2.651(*)女377 2.54.84*P0.05 *P.0
38、1 *P.001四、假设检验及其应用2v案例4:对对“品酒实验品酒实验”数据的统计处理数据的统计处理v 设想酒的颜色可以影响一个人对酒的喜爱程度,某些实验者对这个问题很感兴趣,他们研制了一种装置,这种装置可以在不改变酒味的情况下改变酒的颜色。在这个实验中,酒的颜色是深红色,它可以变成绿色。实验的因变量是愉悦评价。可以通过一个5等级量表来测量出被试的愉悦程度,自变量是酒的颜色。v 下面是研究者在实验中涉及到的自变量、因变量及无关变量。自变量酒的颜色 因变量评价(1-5个等级),1 2 3 4 5 v 没有愉悦 中等愉悦 非常愉悦v无关变量控制:酒的温度应该保持恒定;光线不应太暗也不应太亮;顺序即
39、第一种酒的品尝可能会影响对后一种酒的品尝;环境和他人的注视,主试对被试进行独立测验,而不应该分组进行,因为组内其他人的注视压力可能会影响一个人的评价。v研究者在这个实验中采用了被试匹配设计被试匹配设计。因为主试认为被试变量如品酒经验可能对结果有很大影响。因此在品酒经验上对被试进行匹配,这样每对相匹配的被试就有相同的经验水平。v 自变量:酒的颜色;v 因变量:质量评价;v 匹配变量(无关变量):品酒经验;v 被试分配:把16名被试按照品酒经验分成8个区组,每区组内2个被试,每个被试接受一个处理。这样每组内的两个被试是一一匹配的。实验数据如下:v 实验组(人工酒色)控制组(原色)dS11 2S21
40、 3S31 2S41 1S51 1S61 2S71 3S81 1S12 4S22 5S32 5S42 5S52 4S62 4S72 5S82 4-2-2-3-4-3-2-2-3v【问题与思考】v 1.平均数差异显著性检验的原理是什么?v 2.双总体平均数假设检验的类别有什么?v 3.对本例的分析。v 平均数差异显著性检验的原理与前案例相同,那么,该用独立总体平均数假设检验的方法还是用相关总体平均数假设检验的方法呢?v 让我们来看看两相关总体的判断方法:其一、同一批被试的两列测量值是相关的;其二、一一严格配对的两组被试是相关的。故对本例而言,毫无疑问是两相关总体平均数差异显著性检验的问题。v 检
41、验统计量为t=v服从df=n-1的t分布。其中,(d=X-Y)。nSXXd)()(2121v t=-10v接下来我们用软件把结果计算出来。nSXXd)()(2121vSPSS过程:数据见“品酒实验.sav”。v(1)菜单选择:Analyze/Compare Means/Paried Samples T Testv(2)统计结果见:“品酒.spo”Paired Samples Statistics1.87508.8345.29504.50008.5345.1890人工色原色Pair 1MeanNStd.DeviationStd.ErrorMeanPaired Samples Test-2.625
42、0.7440.2631-9.9797.000人工色-原色Pair 1MeanStd.DeviationStd.ErrorMeanPaired DifferencestdfSig.(2-tailed)v(3)结果说明:表一是描述统计量值;表二是t检验的结果,可以看出被试对人工酒色的评价显著低于对原色酒的评价v(t=-9.979,P0.001)。五、方差分析及其应用v案例5:三种自习指导方法的实验效果三种自习指导方法的实验效果v一位初中数学老师的困惑:v 在自习课上,采用不同指导方法对学生进行指导所产生的效果是否存在显著差异?为此,该老师设计了一个教学实验。自变量自习指导方法,有三个水平:(a1:
43、指导10分钟;a2:指导20分钟;a3:指导30分钟)因变量:被试的数学测试成绩。控制变量:学生本身的数学水平、作业量、教学方法等v被试分配程序:该教师抽取3个平行班,每个班级随机接受一种自习指导方法的指导,对其它因素加以控制。v一个月后实验结束,进行数学测试。从每一班级中随机抽出5名学生,他们的测验成绩如下,试分析三种自习指导方法的效果是否一致?三种自习指导方法的教学实验 指导方法被试 a1 a2 a3 1 2 3 4 5 69 73 71 67 70 76 81 78 69 76 74 76 70 76 74 70 76 74jXv【问题与思考】v1.什么是方差分析,它与t检验有什么区别和
44、联系?v2.方差分析的原理和步骤是什么?v3.对本例该如何进行分析?v1.方差分析的原理v(1)方差分析的目的v 三个或多个平均数差异检验,采用的手段是用两个方差之比来作决策。例如,在本例中,就是比较三种自习指导方法的实验效果是否一致,即三个样本所代表的总体平均数是否相等。v(2)方差分析中常用的术语 因素(factor)、水平(level)因素指的是实验当中的一个自变量,如本例中的自习指导方法就是一个因素。水平指的是因素的具体取值,如本例中的a1(10分钟)、a2(20分钟)、a3(30分钟)就是因素的三个水平。v比较(comparisons)对各处理水平平均数之间差异的估计叫比较。当经过方
45、差分析发现多个平均数之间存在显著性差异时,且因素的水平数多于2时,需要两两之间进行比较,进一步揭示出到底哪些水平之间比较是差异显著的,这就是比较的主要任务。v(3)方差分析的基本原理v 方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性(可分解性)。v 具体地讲,它是将总平方和分解为几个不同来源的平方和(这里的平方和指实验数据与平均数离差的平方和)。v因变量受到两方面影响:自变量与随机因素(误差)理解方差分析的逻辑v 把总变异分解为组间变异和组内变异。组间差异是由于实验处理效应造成的,因此也可将组间离差平方和记为SSA,组内差异是由于
46、实验误差造成的,因此可将组内离差平方和记为SSE,E表示误差。v 如果实验数据的总变异主要是由实验因素(处理或自变量)造成的,那么在总变异中组间差异将占较大比例,组内差异将占较小比例,这时有充分理由认为不同自习指导方法的实验效果不同,三平均数之间有显著性差异,拒绝原假设。v(4)方差分析的基本过程v 建立假设 目的是检验几种实验处理是否有显著差异,因此:至少有一对 不等kH 3210:1H求平方和 =kjjjn12kjnijijXX112)(wSS21)(tjkjXXnbSS kjnitijXX112)(tSS确定自由度和求均方 =,(组间自由度)=,(组内自由度)进行F检验kNdfwwwdf
47、SSwMS1 kdfbbbdfSSbMSMSEMSAMSMSFwb列出方差分析表,作出结论变异来源平方和 自由度均方F组间SSAK-1MSAF=MSA/MSE组内SSEN-kMSE总变异SStN-1v2.对本例的方差分析v(1)建立假设v Ho:不同的自习指导方法的效果不存在显著差异,即 v H1:至少有两种方法产生的效果存在显著差异v(2)平方和分解与计算v 平方和分解:SSt=SSw+SSb123v计算平方和:211()215.33kntijtjiSSXXN总221()93.33kjtjSSnXXNb间122wtbSSSSSSv(3)确定自由度,求均方v 已知k=3,N=15,则 ,v v
48、 各均方为:1141212tbwdfNdfkdfNk 93.3346.67212210.1712bbwwSSMSAdfSSMSEdfv(4)进行F检验 v(5)列出方差分析表46.674.5910.17MSAFMSE变异来源平方和自由度均方F组间93.33246.67 4.59*组内1221210.17总变异215.3314 v(6)做出结论v查附表:v则可以拒绝Ho,即三种自习指导方法的效果存在显著差异。.05(2,12).05(2,12)3.884.593.88FFFvSPSS过程:数据见“三种自习指导方法.sav”。v(1)菜单选择:Analyze/Compare Means/One-W
49、ay ANOVA v(2)统计结果:ANOVA成绩93.333246.6674.590.033122.0001210.167215.33314Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.Multiple ComparisonsDependent Variable:成绩LSD-6.00*2.02.012-10.39-1.61-4.002.02.071-8.39.396.00*2.02.0121.6110.392.002.02.341-2.396.394.002.02.071-.398.39-2.002.02.341
50、-6.392.39(J)方法231312(I)方法123MeanDifference(I-J)Std.ErrorSig.Lower BoundUpper Bound95%Confidence IntervalThe mean difference is significant at the.05 level.*.v(3)结果说明v 表一是方差分析方差分析的结果,结果表明三种自习指导方法的效果存在显著差异的(F=4.59,P0.05)。v 表二是多重事后比较的结果,以进一步了解差异的实质。由结果知:指导20分钟比指导10分钟的效果更好,而指导20分钟和30分钟的效果差别不显著,指导10分钟和30