1、第十五章 表达统计数据 关键问题为什么要用统计数据?统计数据应该包括哪些内容?是否需要提供公式或计算过程?在参数检验时要报告什么资料?在表达统计数据时有哪些常犯错误?报告各种常见统计(方差分析、卡方检验、回归分析、因素分析、结构方程分析、多层线性分析)结果,应该包括哪些内容?为何要报告效应量、置信区间?可否说“接近显著”?第一节 表达统计数据的目的第二节 表达统计数据的规则第三节 表达统计数据的常用实践技巧第一节 表达统计数据的目的 实证性的研究报告都要根据实验或调查数据来表达作者的观点。仅用表格列出原 始数据是很难看出意义的,必须对原始数据进行统计处理,然后才能使数据背后的规律显露出来。第二
2、节 表达统计数据的规则1.要报告异常数据的清理 在统计分析前,要进行数据检查及异常数据的清理。例如,计算出每个参与者对表演者的评分均值,按照2个标准差原则去除2个离群无效数据。首先删去3名回答阅读理解题正确率在75%以下的参与者,这样有35名参与者的数据进入统计。然后删去阅读文章时间在2个标准差之外的极端数据,这样的数据占总数据的0.34%。如果数据非正态、非线性,为符合统计要求,若需要对数据做某些数学转换(numerical transformation,如对数转换或把非正态的数据转换为正态数据),应如实报告。在统计分析后,要说明缺失数据是如何处理的。对异常数据检查及处理的描述,可放在研究方
3、法或结果部分。2.每个统计分析都要报告自由度 在报告推论统计时,需报告统计名称、自由度或样本量、统计值以及显著水平;经常见到有的论文只报告t、F值而不包括自由度,这是不完整的。例如,F=20.46,p.001错误范例 应改为下述等式样:F(2,304)=20.46,p.001当p.001时,无须提供准确值 F(2,116)=3.71,p=.041当p.001时,应提供准值 t(75)=2.19,p=.032 x2(4)=12.34,p=.0153.不要写p=.000 虽然计算机会报告p值为.000,但不能写为p=0(或.000),因为计算机只报告某几个小数位值(如3个小数位),该p值的真正值并
4、非0。例如,p=.00034计算机可能展示p值为.000 应该写为 p.0014.标准统计程序无须提供公式或计算过程 对于一般常用程序(如t检验、F检验等),无须提供公式或参考文献。5.需要解释统计的情况 在下列情况中统计的情况要加以解释:p对不常用的统计方法,尤其是那些虽然在期刊中出现过,但是还没有列入一般统计教材中的方法,应简略介绍其方法,并给予参考文献。p有争议的统计数据,例如,当显著程度没有达到假设所认可的水平,但却认为 它们可当作有差异时;或当差异达到假设的显著水平,但却认为这个差异微不足道时。p当文章的重点是数据处理方法或统计分析时,必须提供详细解释及对应的公式。6.同类的统计只需
5、报告一种统计结果 也许我们在分析数据时尝试了多种统计方法,如果结果是一样的,就没有必要逐一报告。有些时候,不同方法的统计甚至等同,例如两组t检验改用F检验或回归,结果相同。此外,若此项分析涉及较多种相近的方法,例如,因素分析中用了多种不同的因素抽取方法或旋转方法,一般来说,只需描述它们的一致性或差异的部分,而且只需报告最核心的结果便可。当然,如果研究的核心是对这几个方法的比较,对这些方法的结果,我们或许需要提供更多的有关资料。第三节 表达统计数据的常用实践技巧1.避免括号中套括号 为避免括号中套括号,可以把推论统计的表达作为一个句子来处理。例如,可以把 结果表明,女生得分远高于男生F(1,30
6、)=9.45,p=.005。错误范例 修改为 结果表明,女生得分远高于男生;F(1,30)=9.45,p=.005。2.参数检验应尽量报告平均数、标准差、样本量 统计信息的呈现要完备。例如,在进行参数显著性检验(单组或多组方差分析,或者各类多因素均值显著性检验)时,我们应该提供样本量、各组的均值和标准差(或方差)等足够资料让其他学者可进行元分析(见表15.1)。在表15.1中,如果各组人数相同,可以把 n放在表注中(见表15.2)。我们也可以把平均数和标准差放在一列中,用连起来,表示为MSD。此外,亦可以把标准差放在括号内,只需在表注中注明。表应自明,所以,即使正文中已经报告了人数,也应在表中
7、反映出来。3.尽量在报告方差分析结果前提供必要的描述统计 在报告方差分析结果前,很多读者对各变量的均值及标准差(或方差)非常感兴趣,例如,用以计算效应量(effect size)的大小。在篇幅容许的情况下,要尽量提供这些资料。有的读者可能还关心方差是否齐性或者分数分布是否正态。若用图来表示描述统计,最好报告误差块(error bars)。4.在方差分析中报告主效应和交互作用的情况 在方差分析中,虽然一般会先顺序地报告主效应及交互作用的显著性检验结果,但若交互作用显著,普遍来说,不能简单地描述主效应,需依靠交互作用图或其他的分析,才可进一步描述交互作用的结果。5.非参数分析应提供各种原始数据的总
8、体描述 一般来说,对于非参数数据(例如,列联表 分析、计数数据的分析),报告平均数往往没有意义,应报告中数或众数;同样,报告标准差也意义不大,应报告分数的范围(上、下限)。此外,亦应提供每一类别参与者数目、等级的分布等。尽量报告各单元的计数,仅报告百分比不利于其他研究者做元分析(见表15.3)。6.卡方检验应该用x2 卡方检验可用下述方法表示:x(4,N=50)=5.36,p.05统计名称、自由度、样本量、显著性都应列出。注意应该用x而不是X“。7.报告随机分组、重复测量、多变量方差设计及分析 对于这些分析,尽可能报告每一个变量的基本描述性数据,包括平均数、样本量和方差-协方差矩阵等 8.基于
9、相关矩阵的分析要报告相关矩阵 对于基于相关的分析,例如,多元回归分析、因素分析以及结构方程模型分析,我们应该尽量报告方差(或标准偏差)、协方差矩阵(或相关矩阵),以及在使用这些|统计方法(如计算自由度)时所需要的相关的信息,例如,变量的均值、信度。我们也需要准确描述研究中的假设结构模型等数据(见表15.4)。9.报告回归分析结果 表15.4为一般多层线性回归所用的表格。10.报告探索性因素分析结果 在报告探索性因素分析时,尽量提供决定因子数目的步骤(特征值、解释变量百分率)、提取因子方法、旋转(正交、斜交、因子相关)、因子负荷等资料(见表15.5)11.报告结构方程模型 除了用插图展示结构方程
10、模型变量的关系外,可用表格展示及比较各结构方程模型的拟合指数(见表15.6和表15.7,以及图15.1)。12.报告多层线性模型 多层线性模型(HLM)需报告的内容见表15.8。13.统计上显著不代表有实际意义 需要留意显著性检验的各种局限,不要盲目崇拜显著性检验。简单来说,统计学上的差异显著,只是说差异可以从统计上辨别出来,可以认为差异不是因为随机波动造成的。但统计上的差异显著,并不意味着实际上差异有多大意义。当样本量很大时,即使组间差异很小,也容易出现统计上的显著差异;当样本量很大时,即使相关很低(如小于0.1),也可能在统计上达到显著水平。例如,某种教学方法的最终结果,比传统方法高1分,
11、虽然统计显著,但也可能没有多大实际意义,应小心解读结果,不能因此而大力推荐该种教学法。14.尽量报告效应量、置信区间 美国心理学会认为由于研究者容易过于依赖统计上的虚无假设检验,只报告检验结果是不够的。美国心理学会强调显著性检验只是众多分析的开始,我们应该报告效应量(effect size)、置信区间及其他资料以便读者更明了结果的意义。在使用置信区间时,最好全文都采用同一置信水平(如95%),效应量可用原来或标准化后的单位报|告,两者各有其优点。具体的表达方法如,R=.18,p=.006,95%CI 0.08,0.2815.不要说“接近显著”如果p=.058,在结果部分不应表述为边缘显著(p.
12、06)或接近显著,因为显著程度应在研究假设中早已决定,若真有需要,可在讨论中描述数据虽未达显著差异(相关等),但整体趋势如何。课后练习 练习练习1 在实验中,回馈对自习次数的主效应显著,F(1,24)=32587,P.001;线索主效应也显著,F(1,24)=172 318,p.001。进一分析显示,700ms 呈现条件下,线索有助于回馈,(24)=1.60,p.01。针对上述材料,以下说法哪些合理,哪些不合理?(i)在第1、2次提供p值时,没有提供准确的数值。(ii)在第3次提供p值时,没有提供准确的数值。(iii)尽可能提供效应量。解析(i)不合理。若p.001,须提供准确的数值。(见:第
13、二节 2.每个统计分析都|要报告自由度)(iii)合理。不应只着眼显著性检验。(见:第三节 13.统计上显著不代表有实 际意义)练习练习2 从表1可以看出,假设的三因素模型比备选测量模型(模型1至模型4)显示出更优良的拟合度:X/df=1.63;RMSEA=.06;CFI=.98。与此同时,趣味氛围对创意绩效的间接效应显著,=.42(p=.015,90%CI=.06.95,=.05);其中,趣味氛围对团队创意效能感的效应为.33(p=.003),趣味氛围对团队创意绩效的直接效应为.09(不显著),模型整体拟合良好:R=.17,F(2,48)=4.80,p=.019,95%CI=.05.27。因
14、此,创意效能感在趣味氛围和团队创意绩效之间起到中介作用。针对上述材料,以下说法哪些合理,哪些不合理?(i)比较模型1 至模型4时卡方检验的相关资料不足。(ii)没有提供统计程序及方法的过程或相关文献。(iii)没有采用一致的置信水平。(iv)使用太多括号。解析(i)不合理。当然亦可在方法部分提供相关文献。(见:第三节 6.卡方检|验应该用x)(ii)不合理。常见统计方法,无须介绍。(见:第二节 4.标准统计程序无须提供公式或计算过程;5.需要解释统计的情况)(iii)合理。全文应尽量采用同一置信水平。(见:第三节 14.尽量报告效应量、置信区间)(iv)合理。应避免括号中套括号。(见:第三节 1.避免括号中套括号)