心理统计学课件(ppt).ppt

上传人(卖家):三亚风情 文档编号:2451694 上传时间:2022-04-19 格式:PPT 页数:195 大小:3.94MB
下载 相关 举报
心理统计学课件(ppt).ppt_第1页
第1页 / 共195页
心理统计学课件(ppt).ppt_第2页
第2页 / 共195页
心理统计学课件(ppt).ppt_第3页
第3页 / 共195页
心理统计学课件(ppt).ppt_第4页
第4页 / 共195页
心理统计学课件(ppt).ppt_第5页
第5页 / 共195页
点击查看更多>>
资源描述

1、心理统计学课件(ppt)(优选)心理统计学课件统计学是一种思想方法统计学是一种思想方法 从用事实说话从用事实说话 到用概率说话到用概率说话心理统计学的发展(一)统计学的基础概率论和正态分布的产生16世纪至17世纪中期。伽利略提出概率论基本理论,法国数学家帕斯卡和费马在讨论解决赌博难题中,创立了概率论,为统计学的发展奠定了重要理论基础。17世纪末18世纪。瑞士数学家贝努里提出概率论运用于社会及经济事务领域,为正态分布发现创造了条件。之后,数学家高斯等人独自发现了正态曲线方程,并首次提出正态分布曲线。19世纪初,法国数学家泊松提出“大数定理”,并导出了在概率论与数理方程中有重要应用的泊松积分。这些

2、数学家为概率论的发展做出了很大贡献心理统计学的发展(二)数理统计学的发展描述统计学与推论统计学19世纪末,英国数学家高尔顿,在生物学、优生学、心理学等研究中,努力探索简化数据的途径和方法,提出了中位数、百分位数等描述统计最为重要的概念;并与他的学生皮尔逊共同提出了相关和回归的概念。1900年,皮尔逊系统推导并阐明了配合度检验方法,将相关理论扩展到许多领域,为大样本理论奠定了基础。1908年,皮尔逊的学生格赛特有感于大样本理论的限制,开始建立小样本理论,提出t分布理论,开辟了在样本数目较小的情况下进行统计推论的新途径。1923年,经费舍数理论证,t检验得到承认并推广。然后,费舍还提出了F分布,使

3、得方差分析系统化,是推论统计的真正创始者。心理统计学的内容心理统计学的内容心理统计描述统计实验设计推论统计统计图表差异量数集中量数相关分析统计估计参数检验参数估计非参数估计点估计区间估计假设检验非参数检验样本选择与分配实验误差分析方差分析协方差分析回归分析 描述统计(descriptive statistics)主要研究如何整理心理科学实验领域调查得来的大量数据,描述一组数据的全貌。u 数据如何分组,如何使用各种统计图表描述一组数据的分布情况u 怎样计算一组数据的特征值,描述数据集中情况和分散情况的各种特征值计算与表示方法。如:平均数、中数、众数;平均差、标准差、变异系数等。u 表示一事物两种

4、或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件。通过描述统计,我们使杂乱无章的数字更好地显示出事物的某些特征,有助于说明问题的实质。 推论统计(inferential statistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。u 如何对假设进行检验,大样本检验方法(Z检验),小样本检验方法(t检验)等。u 总体参数估计方法,估计理论主要是根据随机抽样的结果来估计总体分布的参数值。统计检验主要根据实际的抽样结果来推论有关总体特征的假设是否与具体的随机抽样所提供的信息相一致。 实验设计(experimental design)主要目的在于研究如何科学有效地进行实验。

5、作为一个严谨的实验研究,在实验以前要对基本步骤、取样方法、条件控制、结果数据的统计分析方法等作出严格的规定。集中量数学习目标学习目标1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合学习内容学习内容众数众数中位数中位数平均数平均数 众数、中位数和平均数的比较众数、中位数和平均数的比较集中趋势(central tendency)1. 一组数据向其中心值靠拢的倾向和程度2. 测度集中趋势就是寻找数据水平的代表值或中心值3. 不同类型的数据用不同的集中趋势测度值众数(mode)(1)经验公式法(皮尔逊)只能作为一个近似值 xM

6、dnM230众数(mode)众数(mode)例:众数(原始数据)无众数无众数原始数据: 10 5 9 12 6 8分类数据的众数 (次数最多的那个组) 饮料品牌饮料品牌次数次数相对次相对次数数百分数百分数(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解:解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo可口可乐可口

7、可乐顺序数据的众数回答类别回答类别甲城市甲城市次数次数 (户户)百分数百分数(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0 众数的意义与应用众数的意义与应用 (1)当需要快速而粗略地寻求一组数据的代表值时(2)当一组数据出现不同质的情况时,可用众数表示典型情况。如工资收入、学生成绩等常以次数最多者为代表值(3)当次数分布中有两极端的数目,除了一般用中数外,有时也用众数(4)当粗略估计次数分布的形态时,有时用平均数与众数之差,作为表示次数分布是否偏态的指标中位数(median)1.按大小排

8、序后处于中间位置上的值2、这个数可能是数据中的某一个,也可能根本不是原有的数。数值型数据的中位数 (奇数个数据的算例)【例例】 9个家庭的人均月收入数据原始数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排排 序序: 750 780 850 960 1080 1250 1500 1630 2000位位 置置: 1 2 3 4 5 6 7 8 9521921n位置数值型数据的中位数 (偶数个数据的算例)【例例】:10个家庭的人均月收入数据排排 序序: 660 750 780 850 960 1080 1250 1500 1630 2000位位 置置

9、: 1 2 3 4 5 6 7 8 9 10 102021080960中位数中数为居于中间位置两个数的平均数数值型数据的中位数 (重复数据的算例)【例】【例】1、3、5、6、6、8、95.5 6 6.5 Mdn=5.75【例】【例】1、3、5、6、6、6、8、95.5 6 6.5 5.83 6.17 Mdn=5.83顺序数据的中位数 (例题分析)回答类别回答类别甲城市甲城市次数次数 (户户)累计次数累计次数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300分组数据的中位数ifFNLMdnMdnbb

10、21其中: :中数所在组的实下限 :中数所在组以下各组次数之和(以下累积次数) :中数所在组的次数 :组距bLbFMdnfi例子:*中数组的寻找方法:由下往上找,第一个大于N/2的组。解:16217267.5469.7425dnM 中数的优缺点与应用(1)当一组观测结果中出现两个极端数目时当一组观测结果中出现两极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意

11、舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。 (2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值 (3)当需要快速估计一组数据的代表值时,也常用中数 中数的优缺点与应用(2)当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值区当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数而不能计算平均数。(3)当需要快速估计一组数据的代表值时,也常用

12、中数平均数算术平均数 (arithmetic mean )nxnxxxxniin1218 .791xNx(2)分组数据的计算方法(组中值计算法)方法:把组中值看成每一分组的平均数方法:把组中值看成每一分组的平均数112211()1(47 1 52 297 6)48ciccn cnxf xNf xf xf xN 平均数的特点1、各变量值与均值的离差之和等于零0)(xxi2、所有的观测值都加上常数C,则平均值也增加常数CcxcxNi)(13、所有观测值都乘以不等于0的常数C,则平均值也增大C倍xcxcNi)(1平均数的意义算术平均数是应用最普遍的一种集中量数。它是“真值”渐近、最佳的估计值。在科研

13、实验中人们进行观测,是想知道被观测事物真正的值是多少,例如想研究人的反应时间,用计时器进行测量,人们是想测到真正的反应时间是多少。再如,使用某种测验,是想测量某个人或某些人的真实的能力水平到底有多么高。但是由于主客观各种随机因素的影响,如仪器的精密程度,测量方法,实验情景,人的观测力及观测标准等等都不能做到尽善尽美,因此想获得真值是不大可能的,人们只能用一些集中量数作为它的估计值。 平均数的优缺点算术平均数具备一个良好的集中量数应具备的一些条件:反应灵敏。观测数据中任何一个数值的或大或小的变化,甚至细微的变化,在计算平均数时,都能反应出来。确定严密。计算平均数有确定的公式,不管何人,在何种场合

14、,只要是同一组观测数据,所计算的平均数都是相同的,不凭主观确定。简明易解。平均的概念简单明白,容易理解。较少数学抽象。计算简单。计算公式只是用简单的四则运算。符合代数方法进一步演算。不但平均数的计算过程应用代数方法,而且,还可应用平均数作进一步的数学演算。例如求离均差x,以及将要讲到的求方差等等。较少受抽样变动的影响。在进行观测时,样本大小或个体的变化,对计算平均数影响很小。平均数的优缺点但是算术平均数也有一些缺点,在一定程度上限制了它的应用,这些缺点是:易受极端数据的影响。由于平均数反应灵敏,因此数据中若出现极端数据(或大或小),就要影响平均数。在心理与教育方面的实验观测中,偶然因素十分复杂

15、,经常会出现极端数目,例如,一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人却由于身体不适或一时性情绪障碍而得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低,并且不符合实际情况。若出现模糊不清的数据时,无法计算平均数,因为计算平均数时需要每一个数据都加入计算。在次数分布中只要有一个数据含糊不清,都无法计算平均数。在这种情况下,一般采用中数作为该组数据的代表值,描述其集中趋势。此外,必须注意,凡不同质的数据不能计算平均数。此外,必须注意,凡不同质的数据不能计算平均数。加权平均数有些测量中所得数据,其单位权重并不相等。这时若要计算平均数,就不能

16、用算术平均数,而应该使用加权平均数。例如:高校入学考试共包括语文、政治、外语、数学、物理、化学及生物?科,而计算总分时并不是各科平等,在语文、政治等科都以100为满分的情况下,数学定120分,生物定50分,也是考虑到各门学科的相对重要性而进行加权的结果。NxNNNNxNxNxNxkkkw212211加权平均数分组数据:设一组数据为: x1 ,x2 , ,xk各组的组中值为:XC1 ,XC2 , ,XCk 相应的频数为: f1 , f2 , ,fknfXffffXfXfXxkiicikkckcc1212211按销售量分组按销售量分组组中值组中值(XC)次数次数(fi)Xc fi 14015015

17、0160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200iMiM185120222001nfMxkiii几何平均数(geometric mean)1. n 个变量值乘积的个变量值乘积的 n 次方根次方根2.适用于对比率数据的平均适用于对比率数据的平均3.主要用于计算平均增长率主要用于计算平均增长率4.计算公式为计算公式为121nnngniiMxx

18、xx112lg1lg(lglglg)niignxMxxxnn其中,其中,n:数据的个数数据的个数 X:变化的比例数据变化的比例数据在心理和教育科学研究的数据处理过程中,应用几何平均数表示集中趋势,有两种情形。1直接应用基本公式计算几何平均数。属于这种情况是:一组实验数据中有少数数据偏大或偏小,数据的分布呈偏态。这时若计算算术平均数也会出现偏大或偏小,平均数就不能很好地反映一组数据的典型情况。而用几何平均数作为集中趋势的代表,就比算术平均数优越。在心理与教育实验中,有部分数据变异较大的情况经常出现,这种场合除应用中数或众数外,时常应用几何平均数。而在心理物理学的等距与等比量表实验中,只能用几何平

19、均数。2. 应用几何平均数的变式计算。属于这种情况有:一组数据彼此间变异较大,几乎是按一定的比例关系变化。如教育经费的逐年增加数,学习、阅读的进步数,以及学生人数的增加数等等。在上述所举的几方面研究中,一般不求平均数,而是求平均增长的比率,如教育经费的平均年增长率,学校人数的年增长率,学习的平均进步率,阅读速度的平均增加率等等。这时都要用几何平均数计算平均比率,而不用算术平均数计算。 【例例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。12310

20、9% 116% 120%114.91%ngnMxxx 【例例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 4104.5% 102.1% 125.5% 101.9%18.0787%Mg 4.5%2.1%25.5%1.9%48.5%Mg 调和平均数(harmonic mean)主要是用以描述学习速度方面的问题。调和平均数作为集中量数之一,在描述速度方面的集中趋势时,优于其他集中量数。 在有关研究学习速度的实验设计中,一般常取两种形式:一是工作量固定,记录各被试完成相同工作所用的时间。二

21、是学习的时间一定。记录一定时间内务被试所完成的工作量。由于反应的指标不同,在计算学习速度时也不一样,这是应用调和平均数要特别注意的地方。调和平均数(harmonic mean)计算公式为)111(1121NHXXXNM其中,N:数据个数 X :具体的变量值 例:有一学生例:有一学生15分钟学会生词分钟学会生词30个,后个,后10分钟学会生词也是分钟学会生词也是30个,问该生每分个,问该生每分钟平均学会多少?钟平均学会多少?4 . 21251)3121(211HM解:由2310302153021NXX4 . 21251)3121(211HM众数、中位数和平均数的比较众数、中位数、平均数的特点和应

22、用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响计算方便,反应灵敏数据对称分布或接近对称分布时应用众数、中位数和平均数的关系xMdnM230032MMdnx033MxMdnx310MxMdnx作业三:作业三:1、对于下列实验数据:、对于下列实验数据:1,100,11,9,5,6,9,9,7,11,9,描述其集中趋势用,描述其集中趋势用_最为适宜,其值是最为适宜,其值是_。2、求下列次数分布的平均数、中数、众数。、求下列次数分布的平均数、中数、众数。数据离散趋势数据离散趋势离散趋势离散趋势极 差R平 均 差A

23、.D.标 准 差S.D.()变异系数V在心理统计学中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。例如,在考察同一个年级中几个教学班的某科成绩时,通常会遇到有些班级平均成绩相同,但整齐程度不同,如果只比较平均成绩并不能真实地反应这些班级对课程学习的全貌;我们只有对班成绩分数的离散程度也进行度量,才能做到较全面的描述。因此,我们需要采用差异量数来反映数据的总体情况,除了必须求出集中量数外,还要使用差异量数。它是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。 标志变异指标的计算标志变异指标的计算(一)极差(全距)(一)极差(全距) R Rmaxmin RX

24、-X即即: 1. 全距是总体中最大的观察值和最小观察值之差, 极差表明观察值在总体范围内变动的最大距离,极差大说明平均数的代表性小,极差小说明平均数的代表性大。2. 全距的特点 优点: 计算方便,易于理解。 缺点: 只考虑数列两端数值差异,方法粗略。 未分组或单项式:极差(R)=观察值最大值-观察值最小值组距式分组:极差(R)=末组上限-首组下限只针对闭口组 在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子 例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为

25、1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:乙: 如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?计算可得77乙甲x,x两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?456 789 10环数频率0.10.20.3(甲)4 5 6789 100.10.20.30.4环数频率(乙)甲成绩比较分散,乙成绩相对集中看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的

26、角度来考察这两组数据.甲的环数极差=10-4=6乙的环数极差=9-5=4. 极差对极端值非常敏感,在一定程度上表明样本数据的的波动情况但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是A组还是B组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标 平均差是各单位标志值与其平均数离差绝对值的算术平均数。 1.概念 :(二)平均差 A.D.2.计算: (二)平均差 A.D.例:有5名被试的错觉实验数据如下,求其平均差:被试被试12345错觉量1618202217 根据全部标志值与平均数离差而计算出来的变异指标,能全面反映标志值的差异程度; 计算有绝对值

27、符号,不适合代数方法的演算使其应用受到限制。3.3.平平均差的特点:均差的特点:方差(Variance)也称变异数、均方。作为样本统计量,常用符号S2表示,作为总体参数,常用符号2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差是度量数据分散程度的一个很重要的统计特征数。标准差(Standard deviation)即方差的平方根,常用S或SD表示。若用表示,则是指总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。方差、标准差方差、标准差 一、方差与标准差的计算一、方差与标准差的计算(一)未分组的数据求方差与标

28、准差基本公式是:一、方差与标准差的计算一、方差与标准差的计算上述公式中,都要先求平均数,再求方差和标准差。若平均数不一定是一个整数或者有除不尽的情况,那么在计算过程中就会引入计算误差,计算就会很繁冗,此时可以直接运用原始分数计算方差与标准差 一、方差与标准差的计算一、方差与标准差的计算例1:计算6、5、7、4、6、8这一组数据的方差和标准差用平均数的方法:用原始数据方法:一、方差与标准差的计算一、方差与标准差的计算(二)分组的数据求方差与标准差基本公式是:式中d(Xc - AM) / i,AM为估计平均数Xc为各分组区间的组中值f为各组区间的次数N=f 为总次数或各组次数和i为组距。一、方差与

29、标准差的计算一、方差与标准差的计算分组区间Xcfdfdfd2计 算96-93-90-87-84-81-78-75-72-69-66-63-60-979491888582797673706764612348111719141073l16543210123456121516242217014202112567275647244170144063482536 S2=32*(570/100 -(28/100)2)=50.5944 S7113 i=3 f100 fd=28fd2=570 具体步骤: 设估计平均数AM; 求d 用f乘d,并计算fd; 用d与fd相乘得fd2,并求fd2; 代入公式计算。 计

30、算下面数据的平均数和方差,体会方差 是怎样刻画数据的波动程度的。(1)6 6 6 6 6 6 6 (2)5 5 6 6 6 7 7(3)3 3 4 6 8 9 9 (4)3 3 3 6 9 9 9解(1)X=62S =0(2) X=6 S = (3)X=6 S = (4)X=6 S =75427442742 方差越大,说明数据的波动越大,越不稳定. 方差越小,说明数据的波动越小,越稳定现在你能说说两队参赛选手年龄的波动的情况吗? 方差用来衡量一批数据的波动大小 (即这批数据偏离平均数的大小).S甲2= (26-26.9)2+(25-26.9)2+ +(29-26.9)2 =2.89110S乙2

31、= (28-26.9)2+(27-26.9)2+ +(26-26.9)2 =0.89110 方差越大,说明数据的波动越大,越不稳定. 方差越小,说明数据的波动越小,越稳定S甲2S乙2 乙的波动小些,数据更稳定40164040164427441627乙乙42213919142237404125甲甲40164040164427441627乙乙42213919142237404125甲甲问:(1)哪一种玉米长得高?(2)哪种玉米的苗长得齐?在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧天鹅湖,参加表演的女演员的身高(单位:cm)分别是 甲团 163 164 164 165 165 166 166

32、 167 乙团 163 165 165 166 166 167 168 168哪个芭蕾舞团女演员的身高更整齐?S甲2=1.5S乙2=2. 5 S甲2 S乙2甲芭蕾舞团女演员的身高更整齐解:165X甲166X=乙某快餐公司的香辣鸡腿很受消费者欢迎,为了保持公司信誉,公司严把鸡腿的进货质量,现有甲、乙两家农副产品加工厂到快餐公司推销鸡腿,两家鸡腿的价格相同,品质相近,快餐公司决定通过检查鸡腿的重量来确定选购哪家公司的鸡腿,检查人员以两家的鸡腿中各抽取15个鸡腿,记录它们的质量如下(单位:g):甲 74 74 75 74 76 73 76 73 76 75 78 77 74 72 73乙 75 73

33、 79 72 76 71 73 7278 74 77 78 80 71 75根据上面的数据,你认为快餐公司应该选购哪家加工厂的鸡腿?7 .7415737274757474 甲x9 .7415757172797375 乙x62. 27 .74737 .74747 .74741512222 甲s2 . 89 .74759 .74739 .74751512222 乙s22乙甲ss 因为 ,所以选择甲厂鸡腿加工。二、方差与标准差的意义二、方差与标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。它基本

34、具备一个良好的差异量数应具备的条件:反应灵敏,每个数据取值的变化,方差或标准差都随之变化;有一定的计算公式严密确定;容易计算;适合代数运算;受抽样变动的影响小,即不同样本的标准差或方差比较稳定;简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。二、方差与标准差的意义二、方差与标准差的意义1、每一个观测值都加一个相同常数C之后,计算得到的标准差等于原来标准差。2、每一个观测值都乘以一个相同的常数C,则所得的标准差等于原来标准差乘以这个常数。3、以上两点项结合,每一个观测值都乘以同一个常数C,再加上一个常数D,所得的标准差等于原标准差乘以这个常数C。三、总标准差的合成三、总标准差的

35、合成除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。三、总标准差的合成三、总标准差的合成 计算公式为: 三、总标准差的合成三、总标准差的合成例:在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班

36、的总标准差:班级Ns14210316236110123509817 一、差异系数标准差的应用当所观测的样本水平比较接近,而且是对同一个特质使用同一种测量工具进行测量时,要比较不同样本之间离散程度的大小,一般可直接比较标准差或方差的大小-标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。标准差的单位与原数据的单位相同,因而有时称它为绝对差异量。在对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:两个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?即使使用的是同种观测工具,但样本的水平相差较大时,如何比较它们的离散程度? 例 已知某小学一年级学生的平

37、均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?解: CV体重3.7 / 25 * 10014.8 CV身高6.2 / 110 * 1005.64通过比较差异系数可知,体重的分散程度比身高的分散程度大(14.85.64)。 例 通过同一个测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(14岁)学生的平均分数为 80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?解: CV一年级4.02 / 60 * 100= 6.7 CV五年级6.04 /80 * 100= 7.55答;五年级的测验分数

38、分散程度大。 应用差异系数的注意事项:1、测量的数据保持等距的尺度,这时的平均数和标准差才有意义;2、观测工具应该具备绝对零在,因此差异系数常用于重量、长度和时间等方面;3、只能用于对一般相对差异量的描述,至今尚无有效的假设检验方法,不能进行统计推论。标准分数计算公式标准差的应用 标准分数的性质1、Z分数无实际的单位,是以平均数为参照点,以标准差为单位的一个相对量。2、一组原始分数转换成标准分可以是正值,也可以是负值。它表明的是原分数在该组数据中分布中的位置,故称为相对位置量数。3、在一组数据中所有由原分数转换得出的Z分数之和为零,其Z分数的平均数亦为零。4、一组数据中各Z分数的标准差为1标准

39、分数的应用1、用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。例如有一人的身高是170厘米,体重是65公斤(也可以是另一人的体重),究竟身高还是体重在各自的分布中较高?这是属于两种不同质的观测,不能直接比较。但若我们知道各自数据分布的平均数与标准差,这样我们可分别求出z分数进行比较。设Z身高1.700.5,Z体重65=1.2,则可得出该人的体重离平均数的距离要比身高离平均数的距离远,即该人在某团体中身高稍偏高,而体重更偏重些。标准分数的应用2、计算不同质的观测值总和或平均值,以表示在团体中的相对位置。在计算平均数时,要求数据必须同质,否则会使平均数没有意义,但有时需要将不同质的

40、数据合成,这时可采用Z分数。例如已知高考的各科成绩分布是正态分布,但是由于各科的难易度不同,因此,各科成绩就属于不同质的数据。以前常采取总和分数或求平均分数的方法,这是不科学的。如果应用Z分数求总和或平均数则更有意义。 科目原始分数甲 乙全体考生平均数 标准差Z分数甲 乙语文政治外语数学理化85 8970 6268 7253 4072 8770 lO65 569 850 675 81.500 1.9001.000 -0.600-0.125 0.3750.500 -1.667-0.315 1.500总计348 350 2.500 1.505例:下表是高考中两名考生甲与乙的成绩分数,根据考试成绩录

41、取谁?如果按总分录取则取乙生,若按标准分数录取则应取甲生;为何会出现如此悬殊的差别?这是由于不恰当地计算总和分数造成的,因为各科成绩难易度不同,分散程度也不同;各门学科的成绩分数是不等价的,亦即数据是不同质的,这时应用总和分数不够科学,故此出现这类问题,科学的方法应当用Z分数合成。从Z分数可知甲生多数成绩是在平均数以上,即使有两种成绩低于平均数,差别也小。总之成绩较稳定且在分布较高处,而乙生则不然。可见应用Z分数更趋合理。一 、次数分布表 次数分布表是对杂乱无序的次数分布表是对杂乱无序的数据进行整理的重要手段,数据进行整理的重要手段,它能使我们对样本情况有个它能使我们对样本情况有个初步的了解,

42、为今后进一步初步的了解,为今后进一步分析和研究问题提供很大方分析和研究问题提供很大方便。便。1、简单次数分布表员工对主管尽职情况的评定员工对主管尽职情况的评定人数人数 非常不尽职非常不尽职 不尽职不尽职 不置可否不置可否 尽职尽职 非常尽职非常尽职9 93030101025256 6总计总计8080表表3-1 80名员工对部门主管尽职程度调查结果名员工对部门主管尽职程度调查结果2、分组次数分布表成绩成绩组中值组中值频数频数累积频数累积频数95 95 97.597.52 22 290 90 92.592.52 24 485 85 87.587.53 37 780 80 52.552.55 512

43、1275 75 77.577.58 8202070 70 72.572.51111313165 65 67.567.59 9404060 60 62.562.55 5454555 55 57.557.54 4494950 50 52.552.52 2515145 45 17.517.51 15252合计合计5252表表3-2 某班学生数学成绩次数分布表某班学生数学成绩次数分布表 求全距求全距 R=Xmax-Xmin 决定组距决定组距 i 和组数和组数 k 列出分组区间列出分组区间 登记次数登记次数 计算每组数据的次数计算每组数据的次数f 抄录新表抄录新表3.相对次数分布表将次数分布表中各组的将

44、次数分布表中各组的实际次数转化为相对次数,实际次数转化为相对次数,即用频数比率(即用频数比率(fN)或百)或百分比(分比( )来表示次)来表示次数,就可以制成相对次数分数,就可以制成相对次数分布表。布表。%100Nf4、累加次数分布表 表表3-3 某班学生数学成绩累加次数分布表某班学生数学成绩累加次数分布表 成绩成绩组中值组中值频数频数累加频数累加频数累加百分比累加百分比959597.52 223.8590 90 92.52 247.6985 85 87.53 3713.4680 80 82.55 51254.0575 75 77.58 82038.4670 70 72.511113159.6

45、265 65 67.59 94076.9260 60 62.55 54586.5455 55 57.54 44994.2350 50 52.52 25198.0845 45 47.51 152100.0合计合计52525、双列次数分布表 双列次数分布表又称相关次数分布表,双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示是对有联系的两列变量用同一个表表示其次数分布。其次数分布。 所谓有联系的两列变量,一般是指同一所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试或两种心理特点的指标,或同一组

46、被试在两种实验条件下获得的结果。在两种实验条件下获得的结果。 表表3-4 313-4 31名学生视、听反应时测验结果名学生视、听反应时测验结果听听视视100100120120140140160160180180200200220220Y Y2302302102101901901701701501501301301101101 11 11 11 12 21 11 13 32 22 23 33 31 11 11 12 21 11 11 11 11 12 24 47 78 84 45 51 1X X1 15 59 98 84 43 31 13131二、次数分布图在编制次数分布表的基础上,可以绘在编制

47、次数分布表的基础上,可以绘制次数分布图,使一组数据特征更加制次数分布图,使一组数据特征更加和和,而且还可以对数据的而且还可以对数据的和和作粗略的分析。作粗略的分析。绘制次数分布图可以用已有的计算机绘制次数分布图可以用已有的计算机程序,如程序,如EXCEL,也可以用专门的统计,也可以用专门的统计程序。程序。1、频数分布直方图 直方图直方图 ( histogram )又称为等距直方图,又称为等距直方图,是以矩形的面积表示是以矩形的面积表示随机变量次数随机变量次数分布的图形。一般用分布的图形。一般用表示数据的频数,表示数据的频数,用用表示数据的等距分组点,即各分组表示数据的等距分组点,即各分组区间的

48、上下限。区间的上下限。 直方图是统计学中常用而且又有特殊意义直方图是统计学中常用而且又有特殊意义的一种统计图,有着重要的应用价值。的一种统计图,有着重要的应用价值。例:根据第二讲中52个学生的数学成绩所作直方图图图3-1 52名学生数学成绩分布的频数直方图名学生数学成绩分布的频数直方图45 50 55 60 65 70 75 80 85 90 95 100还可以做成下面这种形式图图3-2 52名学生数学成绩次数分布直方图名学生数学成绩次数分布直方图2、次数分布多边图 次数分布多边形图(次数分布多边形图(frequency polygon)是一种表示是一种表示随机变量次数分布的线随机变量次数分布

49、的线形图,属于次数分布图。凡是等距分组的形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多可以用直方图表示的数据,都可用次数多边图来表示。边图来表示。 绘制方法:以各分组区间的组中值为绘制方法:以各分组区间的组中值为,以各组的频数为以各组的频数为,描点;将各描点;将各点以直线连接即构成多边图形。点以直线连接即构成多边图形。图图3-3 52名学生数学成绩分布图名学生数学成绩分布图 人 数图图3-4 52名学生数学成绩分布图名学生数学成绩分布图人 数成 绩 利用次数分布多边图还可以把几组资料利用次数分布多边图还可以把几组资料放在一起进行比较。放在一起进行比较。 但需要注意的是

50、,这时必须把数据的次但需要注意的是,这时必须把数据的次数换算成数换算成。图图3-5 45页数据的次数分布图页数据的次数分布图图图3-6 不正确的比较图不正确的比较图3、累积次数分布图 根据根据累积次数,累积次数,可以绘制可以绘制累积次数累积次数分布图。分布图。 右图右图是累积次是累积次数分布直数分布直方图。方图。 累积次数分布曲线 当数据的总数较多当数据的总数较多时,将累积次数分时,将累积次数分布图中的布图中的以以每一分组区间的每一分组区间的精精确上限确上限或精确下限或精确下限表示,表示,以以累累积次数积次数表示,则可表示,则可绘制累积次数分布绘制累积次数分布曲线,即累积曲线。曲线,即累积曲线

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(心理统计学课件(ppt).ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|