1、第 1 章绪论1.1复习笔记本章重点 心理与教育统计的研究内容 选择使用统计方法的基本步骤 统计数据的基本类型 心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1. 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。2. 具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。3. 统计学
2、大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。(二)心理与教育科学研究数据的特点1. 心理与教育科学研究数据与结果多用数字形式呈现。2. 心理与教育科学研究数据具有随机性和变异性。3. 心理与教育科学研究数据具有规律性。4. 心理与教育科学研究的目标是通过部分数据来推测总体特征。(三)学习心理与教育统计应注意的事项1.
3、 学习心理与教育统计学要注意的几个问题:(1) 学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。(2) 在学习时要注意重点掌握各种统计方法使用的条件。(3) 要做一定的练习。2. 应用心理与教育统计方法时要做到:(1) 克服“统计无用”与“统计万能”的思想,注意科研道德。(2) 正确选用统计方法,防止误用和乱用统计。二、心理与教育统计学的内容心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别:(一)分类一依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的
4、分类方法。如图 1-1 所示:图 1-1心理与教育统计研究内容1. 描述统计描述统计(descriptive statistics)主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:(1) 数据如何分组,如何使用各种统计图表描述一组数据的分布情况。(2) 怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌。(3) 表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数的计算方法等等。2. 推论统计推论统计(inferential statistics)主要研究如何通过局部数
5、据所提供的信息,推论总体的情形。这是统计学中较为重要、也是应用较多的内容。包括以下几个方面:(1) 如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(Z 检验),小样本检验方法(t 检验),各种计数资料的检验方法(百分数检验, x2 检验等),变异数分析的方法(F 检验),回归分析方法等等。(2) 总体参数特征值的估计方法,即总体参数的估计方法。(3) 各种非参数的统计方法等等。3. 实验设计实验设计(experimental design)主要目的在于研究如何科学地、经济地以及更有效地进行实验,它是统计学近几十年发展起来的一部分内容。作为一个严谨的实验研究,在实验以前就要对研究的
6、基本步骤、取样的方法、实验条件的控制、实验结果数据的统计分析方法等做出严格的规定。4. 描述统计、推论统计、和实验设计之间的关系心理与教育统计的这几部分内容之间有着密切联系。描述统计是推论统计的基础,推论统计离不开描述统计计算获得的特征值。描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的和要求。同样,只有良好的实验设计才能使获得的数据具有意义,进一步的推论统计才能说明问题。一个好的实验设计,也必须符合基本的统计方法要求, 否则,再好的设计,如果事先没有确定适当的统计处理方法,在处理研究结果时可能会遇到
7、许多麻烦问题。(二)分类二依据心理与教育统计研究的问题实质来划分,可将心理与教育统计学的内容划分为:1. 描述一件事物的性质。2. 比较两件事物之间的差异。3. 分析影响事物变化的因素。4. 一件事物两种不同属性之间的相互关系。5. 取样方法等。三、心理与教育统计学的发展(一)统计学的发展历程统计学(statistics)作为一门科学始于 19 世纪。但统计工作自古就有,源于统治者治理国家的需要。这类统计是记录或描述已经发生的各种现象,可以称为描述性统计。1随着科学进步,近百年来,在概率论基础上逐步形成了推测性的数理统计。19 世纪中期奠定了概率论的理论基础。(1) 统计学的理论基础概率论与正
8、态分布曲线方程的产生16 世纪,伽利略提出概率论的基础理论。17 世纪中期,法国数学家帕斯卡和费马创立概率论,为统计学的发展创立了重要的理论基础。17 世纪末 18 世纪初,瑞士数学家贝努里创立了贝努里定理,为发现正太分布概率创造了条件。1733 年莫弗推导出“正态曲线方程”。高斯首次提出“正态分布曲线”。19 世纪初,泊松推广贝努里定理,提出“大数定理”。(2) 数理统计的产生与发展描述统计学与推论统计学数理统计的发展经历了两个阶段:描述统计学与推论统计学。描述统计学产生于 20 世纪 20 年代之前,以高尔顿(Frarmis Galton,18221911)和皮尔逊(Karl Pearso
9、n,18571936)为代表。推论统计学产生于 20 年代之后,以费舍(Ronald Aylmer Fisher,18901962)为代表。19 世纪末,在生物学、优生学、心理学研究中,高尔顿探索简化数据的途径及方法,提出了中位数、百分位数、四分差等描述统计学的相关概念。1908 年,由于受大样本理论的限制,英国数理统计学家格赛特(william Sealy Gosset,18761937),开始建立小样本理论,提出了一种根据样本资料估计均数的检验方法,即 t 分布理论,开辟了在样本数目较小的情况下进行统计推论的新途径,t 检验已成为今天应用得非常广泛的统计检验方法之一。英国的费舍是推论统计真
10、正的创始者,他是 20 世纪初对统计学作出最大贡献的科学家。他将皮尔逊及格赛特的工作发扬光大,对 t 分布给出理论论证,最先提出F 分布理论,后被命名为 F 分布,使方差分析系统化。一战后,费舍在农业实验中首倡“实验设计”,提出随机化概率,建立了点估计与随机化估计的理论,发展确立了推论统计思想,使统计方法应用更为广泛。二战以后,非参数方法、序列分析、随机过程的研究、小样本分布这些都逐渐被认识和应用。多元统计理论与方法被应用到各种实际研究中去,数理统计产生了许多应用分支学科,为工农业生产及科学研究开辟了广阔的应用前景。同时,实践的发展又为数理统计的发展提出了很多新课题。(二)统计在心理与教育研究
11、中的应用作为一门应用统计分支学科,心理与教育统计基本上是随着数理统计的发展而发展的;同时心理与教育研究的发展也不断充实着统计学的方法。许多现代统计学理论最初是来自心理与教育研究的。例如,因子分析源出于心理学, x2 理论来自社会科学的研究。1. 英国的高尔顿最早将统计方法应用于心理学研究,首创回归原理。他的学生皮尔逊也将相关系数及x2 检验等应用于心理与教育研究中。2. 同时期英国的心理学家斯皮尔曼(Charles Edward Spearman,18631945)对心理统计的发展做了很多工作,延伸了相关系数的概念,导出等级相关系数的计算方法。1904 年,又提出因子分析的思想,用统计方法处理
12、心理实验结果。3. 贡献较大的有卡特尔、桑代克、瑟斯顿等人。1904 年,桑代克出版心理与社会测量一书,极力提倡以心理学与统计学为工具而研究教育学,推广运用统计方法研究心理与教育方面的实验结果。20 世纪 20 年代, 瑟斯顿等人对因素分析在心理学研究中的广泛应用也作了很大贡献。420 世纪初,统计学作为一门课程在美国的经济学科中被讲授,正式实施统计学教育。一战后,统计学全方位进入各个领域。30 年代,心理科学研究开始强调利用统计学,高等院校开设心理与教育统计课程。40 年代, 普遍应用于研究心理与教育问题。(三)心理与教育统计在中国的发展与应用1心理与教育统计学在辛亥革命以后传到我国。当时心
13、理与教育统计、心理与教育测量都作为高等、中等师范院校的必修课程,有一大批专家、学者从事这方面的研究、讲授工作,出版了不少关于教育统计方面的译著、专著。220 世纪 80 年代以后,心理与教育统计学开始复苏。在二十多年中,我国的心理与教育统计学科在教学、研究、培养人才等各方面取得了非常丰硕的成果。3目前,心理与教育统计学的教学和研究进入稳步快速发展时期。四、心理与教育统计基础概念(一)数据类型根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。1. 从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。(1) 计数数据(count data),是指计算个数的数据,
14、一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。(2) 测量数据(measurement data),又称计量数据是指借助于一定的测量工具或一定的测量标准而获得的数据。2. 根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。(1) 称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,在教育和心理类调查研究中, 有关被试属性的调查资料,大多属于这类数据。(2) 顺序数据(ordinal data)是指既无相等单位,
15、也无绝对零的数据,是按事物某种属性的多少或大小, 按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序,不能指出相互间的差别大小这类数据不能进行加减乘除运算。(3) 等距数据(interval data)是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。只能使用加减运算,不能使用乘除运算。(4) 比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。3. 按照数据是否具有连续性,把数据划分
16、为离散数据和连续数据。(1) 离散数据(discrete data)又称为不连续数据、间断数据。这类数据在任何两个数据点之间所取的数值的个数是有限的。(2) 连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。至少在理论上从最高到最低之间都可以进一步细分。对于连续性数据的进一步细分,一是取决于测量技术所允许的精确程度,二是取决于测量值所需要的精确程度。而离散数据一般是取整数,两个单位之间不能再划分细小单位。在心理和教育调查研究、问卷研究、访谈研究等质性研究的实践操作中,这两种数据的区分非常明显。这两种数据的分布规律不同,相应的制表作图方法也不同,所
17、使用的统计方法也有区别。另外,一般情况下计数数据大都是离散数据。(二)变量、观测值、随机变量1. 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当用一个量表示这个指标的观察结果时,这个指标是一个变量。2. 用来表示随机现象的变量,称为随机变量。一般用大写的或表示随机变量。3. 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。(三)总体、样本与个体1. 需要研究的同质对象的全体,称为总体。总体既可以是无限的也可以是有限的。2. 每一个具体研究对象,称为一个个体。3. 从总体中抽出的用以推测总体的部分对象的集合称为样本。样本中包含的个体数,称为样本的容量 n。一般把容量
18、 n30 的样本称为大样本;而 n30 的样本称为小样本。(四)次数、比率、频率与概率1. 在一项研究中,对随机现象进行观察试验,在一定条件下,本质不同的事情可能出现,也可能不出现, 这种事情称为随机事件,简称为事件。2. 次数是指某一事件在某一类别中出现的数目,又称为频数(frequency),用 f 表示。3. 两个数的比称为比率。当所比的两个数中,分子所表示的事物是做分母的那个数(基数)所表示事物的一部分时,比率又称为比例,百分数或百分率是比例的另一种表示形式。4. 频率,又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通常用比例(p
19、roportion)或百分数(percent)表示。5. 概率,又称机率、或然率(probability),用符号 P 表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率。概率通常用比例表示。(五)参数和统计量1. 参数和统计量的概念在科学研究中,探寻的是关于所有事物总体的说明和解释。总体的那些特性称为参数(parameter),又称总体参数,是描述一个总体情况的统计指标。样本的那些特征值称为统计量(statistics),又称特征值。2. 参数和统计量的区别(1) 一个参数是从整个总体中计算得到的量数,通常是通过样本特征值来预测得到。统计量
20、是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。参数代表总体的特性,它是一个常数。(2) 统计量代表样本的特性,它是一个变量,随着样本的变化而变化。(3) 参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。3. 参数和统计量的联系从数值计算上讲,当总体大小已知并与实验观察的总次数相同时,它们是同一统计指标。当总体无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数能够做出预测和估计。1.2 课后习题详解1. 名词概念(1) 随机变量答:随机变量(random variable)是在样本空间 的全部事件集
21、上的一个实值函数。通常随机变量用大写字母 X,Y,Z 等表示,或者希腊字母 x,h,z 等表示。分离散型随机变量和连续型随机变量两类。离散型随机变量是指所有可能的取值个数是有限的或至多可列的随机变量。如随机抽取任一学生观察其性别,其样本空间只有两个男性和女性样本点,即W=w1, w2, w1 = 男性, w2 = 女性。随机变量 X 只取两个值: X (w1 ) = 1 ,X (w2 ) = 0 ,即当某学生是男生时,x 取 1;当学生是女生时,x 取 0。连续型随机变量是指可能在一个连续区间内或整个实数范围内取值的随机变量。如,在 12 岁的学生总体中,随机抽一个观测其身高 y。此随机试验的
22、样本空间W= R+ , R+ 是大于 0 的实数集。随机变量 y 可在一个连续区间内取值。随机变量的引进使概率论能使用精密的数学工具(如微积分、代数、实变函数、测度论等)来处理和分析随机现象。(2) 总体答:总体(population),又称“母体”,统计学术语,是指一个统计问题中研究对象的全体。由具有某种研究特征的个体构成。从总体中抽取一部分个体,就构成总体的一个样本。如,研究小学生的推理能力,记 X 为每个小学生的推理能力,则 X 的任一个可能取值是一个个体,X 的所有可能取值的集合则是一个总体。如果随机抽取 n 个小学生,测量他们的推理能力为 X1, , X 2,X 3,.,X n ,这
23、就是一个取自总体 X 的样本。可根据包含个体的数目,可分为有限总体和无限总体。总体本身的大小是有限还是无限,取决于研究问题的推理范围。心理学研究中常为无限总体。在推断统计中被定义为一个随机变量,可运用概率论等数学工具进行统计推断。(3) 样本答:样本(sample),又称“子样”,统计学术语,是指按一定规则从统计总体中抽取的若干个体的集合或对总体 X 的n 次观测结果( X1, X 2 ,., Xn )。根据样本容量(通常以 30 为界线)的大小,可区分为大样本和小样本。根据两样本来自的两总体是相关还是独立,可分为相关样本和独立样本。(4) 个体答:个体(individual),又称“单位”、
24、“样品”,统计学术语,是指总体中的每一个单位、样品或成员。个体是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。在心理学研究中,个体根据研究目的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。(5) 次数答:次数,又称为频数(frequency),是指某一事件在某一类别中出现的数目,用 f 表示。(6) 频率答:频率(frequency),又称“相对频数”。某随机事件 A,在 N 次试验中出现的次数 n 与试验总次数 N的比值。亦称事件 A 发生的频率。记为 F ( A) = n (0 n N ) ,其值F介于 01 之间。事件的频率越大,NNN(
25、A)说明它出现的可能性越大;反之则越小。一个事件的频率不是一个固定的数值,与总次数 N 有关,且即使再重复 N 次试验,次数 n 也可能不同。但在大量重复试验中频率具有稳定性,即当试验次数 N 无限增大时,频率 F 会在某个固定值上下波动,而且偏差越来越小。简谐振动基本物理量。物体每秒振动的次数。单位是赫兹(Hz)。在数学关系上频率是物体振动周期的倒数。(7) 概率答:概率(probability),概率论术语指,随机事件发生可能性大小度量指标。概率描述性定义。随机事件 A 在所有试验中发生可能性大小的量值,称为事件 A 的概率,记为 P(A)。如将一枚均匀硬币上抛足够多次,会发现“正面朝上”
26、的事件出现的频率在 0.5 上下波动。这种频率稳定性从实践上表明随机事件的概率是客观存在的。概率的精确定义。设 P 是定义在“事件域”上的一个集合函数,若满足下列条件,则称之为概率:aP(A)0,对一切 A F ;b p(W) = 1;c若 Ai = F (i =1,2.)两互不相容,则 P( AI ) = P( Ai ) (性i=1i=1质c 称为可列可加性)。若 P 是概率,则不可能事件的概率为零,即 p(F) = 0 对任意事件 A ,有0 P (A ) 。应当注意,若 P(A)0,并不能说 A 一定是不可能事件,即不可能事件的概率一定是零,但概率为零的事件未必是不可能事件。这是由于 P
27、 是集合函数,可能在某些点集上(如有限个点)为零。同理,概率为 1 的事件, 未必是必然事件。(8) 统计量答:统计量(statistic),统计学术语,指不含未知参数的样本的函数。设有一总体 X,(X1,X2,Xn)是取自 X 的一个随机样本,T(X1,X2,Xn)是不包含任何未知参数的函数,则称T ( X1 , X 2 ,., Xn ) 是一个统计量。如,样本均值 X = (X1 + X2 +. + Xn ) / n ,是一个统计量, X (n) = maxX1 , X 2 ,., X n 也是一个统计量。在各种不同的统计分析或推断中,并不直接使用随机样本,而是将随机样本“加工”为统计量。
28、在解决不同问题时有不同的统计量,统计量是直接用来进行分析或推断的重要工具。如正态总体 N (m, s2 ) ,若数学期望 未知,可用样本均值 X 去估计;在两个总体的均值差异显著性检验时,要运用 Z 统计量或 t 统计量。(9) 参数答:参数(parameter)在数理统汁中,反映一个统计量或随机变量的分布特征的参变量。对于参数统计来讲,分布依赖的参数是有限个数(其实只确很少几个)。只要参数确定,则分布也确定了。参数可在一定允许范围内取值。它便确定了一个分布族。 如正态分布 N (m ,s2 )只含有 m, s2 两个参数。它们的取值允许范围是- m +,0 s2 。对于非参数统计来讲,分布依
29、赖的参数不是有限的,其统计方法只能是非参数方法或自由分布方法。(10) 观测值答:随机变量一旦确定了某个值,就称这个值为随机变量的观测值,也就是具体数据。2. 何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。(2)学习心理与教育统计
30、学有重要的意义统计学为科学研究提供了一种科学方法科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。心理与教育统计学是心理与教育科研定量分析的重要工具凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性,而且引起它发生变化的因素甚多,难以准确测量。但是它毕竟还是可以测
31、量的。因此。在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计学就是对心理与教育问题进行定量分析的重要科学工具。广大心理与教育工作者学习心理与教育统计学的具体意义a可以顺利地阅读国内外先进的研究成果; b可以提高心理与教育工作的科学性和效率; c为学习心理与教育测量和评价打下了基础。3. 选用统计方法有哪几个步骤?答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析。只有做到对数据分析正确,才能对统计方法做出正确地选用。(1) 要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如
32、果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。(2) 要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。(3) 要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。4. 心理与教育科学实验所获得的数据是否属于随机变量?为什么? 答:心理与教育科学实验所获得的数据属于随机变量。心理与教育科学研究数据具有随机性和变异性。科学研究中因观测人员、观测工具、观测条件的变化而具有随机变化的现象。在心理和教育科学领域,研究获得的数据资料也具有一定随机性质。观测数据的这种特点,称
33、为变异性。即便使用同一种测量工具,观测同一事物,只要是进行多次,那么获得的数据就不会完全相同。随着测量工具的完善和精确,数据的这种随机性变化就更明显。例如,人们对同一年级或同一年龄儿童甚至对同一个人进行同一学科的学业测试,或对同一个心理特点进行评量、观察多次,得到的数据绝不会全然相同,这些数据总是在一定的范围内变化。造成数据变异的原因,出自观测过程中一些偶然的不可控制的因素,称随机因素。随机因素使测量产生的误差称作随机误差。由于这种随机误差的存在,使得在相同条件下观测的结果常常不止一个,并且事前无法确定, 这是客观世界存在的一种普遍现象,人们称这类现象为随机现象。在教育和心理科学的各类研究中,
34、研究的对象是人的内在的各种心理现象,不仅由客观上一些偶然因素会引起测量误差,由实验者和被试主观上一些不可控制的偶然因素也会造成测量误差,这些偶然因素十分复杂,因而造成的随机误差就更大,也就使心理与教育科学研究中得到的数据具有更明显的变异性。5. 怎样理解总体、样本与个体?答:(1)需要研究的同质对象的全体,称为总体。总体既可以是无限的也可以是有限的。(2) 每一个具体研究对象,称为一个个体。(3) 从总体中抽出的用以推测总体的部分对象的集合称为样本。样本中包含的个体数,称为样本的容量 n。一般把容量 n30 的样本称为大样本;而 n30 的样本称为小样本。6. 统计量与参数之间有何区别和关系?
35、答:在科学研究中,探寻的是关于所有事物总体的说明和解释。总体的那些特性称为参数(parameter),又称总体参数,是描述一个总体情况的统计指标;样本的那些特征值称为统计量(statistics),又称特征值。(1) 参数和统计量的区别一个参数是从整个总体中计算得到的量数,通常是通过样本特征值来预测得到,统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况,参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化;参数和统计量之间最明显的区别是参数常用希腊字母表示,而样本统计量则用英文字母表示。(2) 参数和统计量的关系从数值计算上讲,当总体大小已
36、知并与实验观察的总次数相同时,它们是同一统计指标。当总体无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。通过样本统计量,对总体参数能够做出预测和估计。7. 试举例说明各种数据类型之间的区别。答:根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。(1) 从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。计数数据(count data),是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。测量数据(measurement data),又称计量数据是指借助于一定的测量工具或一定的测量标准而获得的数
37、据。(2) 根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,在教育和心理类调查研究中, 有关被试属性的调查资料,大多属于这类数据。顺序数据(ordinal data)是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序
38、,不能指出相互间的差别大小这类数据不能进行加减乘除运算。等距数据(interval data)是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。只能使用加减运算,不能使用乘除运算。比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。(3) 按照数据是否具有连续性,把数据划分为离散数据和连续数据。离散数据(discrete data)又称为不连续数据、间断数据。这类数据在任何两个数据点之间所取的数值的个数是有限的。连续数据(continuous data)指任意两个数据点之间都可以细分出无
39、限多个大小不同的数值。至少在理论上从最高到最低之间都可以进一步细分。8. 下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?(1)17.0 千克,(2)89.85 厘米,(3)199.2 秒,(4)17 人,(5)25 本,(6)93.5 分。答:上面的数据中测量数据有:(1)17.0 千克,(2)89.85 厘米,(3)199.2 秒,(6)93.5 分。记数数据有:(4)17 人,(5)25 本。计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数形式。9. 说明下面符号代表的意义。m答:Xr r ssbwn10. 结合所学心理学知识,
40、谈谈你对心理统计思想的初步理解。答:在心理发展过程中,个理论学派观点层出不穷,但是他们都有一个共同的特点,并不是单纯的从唯心角度出发,而是客观的用现象、行为和数据来说明心理的各种规律,但是在研究过程中,发现心理的数据有时具有随机性和变异性,但有时又具有规律性,为了研究变异性和规律性,心理学就利用部分数据来推测总体数据的特征,为了更科学的推测和分析,就形成了心理统计思想,并将统计学渗透到心理学的各个分支。11. 熟悉 EXCEL 软件,初步了解计算机在统计工作中的应用情况。答:略。1.3 考研真题和强化习题详解一、单选题1. 三位研究者评价人们对四种速食面品牌的喜好程度。研究者甲让评定者先挑出最
41、喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。研究者乙让评定者将四种品牌分别给予 1 5 的等级评定,(1 表示非常不喜欢,5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。研究者甲,乙,丙所使用的数据类型分别是( )。A类目型-顺序型-计数型B顺序型-等距型-类目型C顺序型-等距型-顺序型D顺序型-等比型-计数型【答案】B2. 调查了 n200 个不同年龄组的被试对手表显示偏好程度。该题自变量与因变量的数据类型分别是( )。A. 类目型-顺序型B计数型-等比型C顺序型-等距型D顺序型-命名型【答案】D3157.5这个数的上限是( )。A157.7
42、5B157.65 C157.55 D158.5【答案】C4. 随机现象的数量化表示称为()。A自变量B随机变量C因变量D相关变量【答案】B5. 实验或研究对象的全体被称之为()。A总体B样本点C个体D元素【答案】A6. 下列数据中,哪个数据是顺序变量?() A父亲的月工资为1300元 B小明的语文成绩为80分C小强100米跑得第2名D小红某项技能测试得5分【答案】C二、概念题1. 描述统计吉林大学 2002 研答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或
43、相关系数等,将大量数据简缩,找出其中所传递的信息。2. 推论统计中国政法大学 2005 研,浙大 2000 研答:推论统计又称推断统计,主要研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等。这是推论统计要研究的内容,常用的统计方法有:假设检验的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。3. 假设检验浙大 2002 研答:在统计学中,通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称假设检验。假设检验是推论统计
44、中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。检验的推理逻辑是一定概率保证下的反证法。一般包括四个步骤:根据问题要求提出原假设 H0;寻找检验统计量,用于提取样本中的用于推断的信息,要求在 H0 成立的条件下,统计量的分布已知且不包含任何未知参数;由统计量的分布,计算“概率值”或确定拒绝域与接受域;由具体样本值计算统计量的观测值,对统计假设作出判断。若 H0 的内容涉及到总体参数,称为参数假设检验,否则为非参数检验。第 2 章统计图表2.1 复习笔记本章重点 各种统计图表的基本结构与编制方法 各种次数分布
45、表与次数分布图 直方图、条形图与线形图一、数据的初步整理心理和教育研究中收集的各种原始资料杂乱无章,只有经过整理分析才能从中提取出有用的信息。在对资料进一步分析之前,需要进行认真的整理。整理的基本方式有排序和统计分组两种。(一)审核资料审核资料的目的,是为了剔除不合格的资料,以确保资料的可靠性和可信性。审核是对原始资料进行初步的审查和核实。不符合要求的数据主要有三种:缺失、可疑、失误。1. 缺失:指数据不全或缺项未填。2. 可疑:指难以辨认或怀疑其真实性的数据。3. 失误:指存在明确差错的数据或答案。在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的数据随意去掉。对于个别极端数据是否
46、该剔除,应遵循三个标准差法则。(二)数据排序数据排序(sort 或 order),就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。如按照被试的年龄或性别,或调查问卷的标识码等标准进行排列。排列后会使数据之间的某种关系有所显示。数据排序是整理数据最简单的方法。(三)统计分组统计分组(grouping),就是根据被研究对象的特征,将所得数据划分到各个组别中去。对研究中所获得的大量数据进行统计分组是对数据进行整理的重要步骤。1. 统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消除记录误差, 以便使后续的统计分析建立在一个坚实的基
47、础上。2. 统计分组应注意的问题(1) 分组要以被研究对象的本质特性为基础。(2) 分组标志要明确,要能包括所有的数据。3. 分组的标志分类标志有各种各样。这些分类标志按形式大致可分为性质类别与数量类别两种。(1) 性质类别。主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同, 不说明事物之间的数量差异。(2) 数量类别。这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。在这种排序中,项目本身就显示了分类的数量信息,这一点与性质类别明显不同。(三)统计表1. 统计表的概念及特点(1) 在对数据进行统计分类以后,得到的各种数量结果称为统计指标。把统