1、上海师范大学教育学院管理学系副教授/博士 陈勇Email:微信/QQ:27351275DID YOU KNOWN?关系图3什么是统计什么是统计?1.1.统计工作统计工作 对数据资料搜集、整理和对数据资料搜集、整理和分析分析2.2.统计资料统计资料 统计工作的成果统计工作的成果 3.3.统计学统计学 为何学习统计时代的呼唤教育研究的科学性、严密性、实证性;克服中国人拍脑子做事情的思维习惯;质性研究与量化研究的统一21世纪必备技能。5H.G.Wells 6统计学的应用领域统计学的应用领域流行统计软件SASSPSSBMDPSYSTATEPINFO和EPMAPEXCEL统计分析前的准备数据的输入数据的
2、转换文件格式的转换变量的分组变量的计算与变换变量的分类变量定量变量连续的离散的定性变量次序的名义的定量变量连续的:收入、身高、温度离散的:家庭人数、考试不及格的次数、发生交通事故的次数定性变量次序变量:对学校的喜欢程度(非常喜欢、比较喜欢、一般、比较不喜欢、非常不喜欢),职业技能水平(高级、中级、低级、没水平)名义变量:性别(男、女),种族(汉、蒙、满),婚姻状况(未婚、已婚、离婚、丧偶)数据的基本处理排序选择拆分计算变量转换变量可视化离散替换缺省值分类汇总排秩课前复习分数练习问卷处理样本数(一)组别差异比较:各组至少20个以上;要求很低也要15个以上;理想:30个以上样本数(二)样本数(三)
3、样本抽样数与总体人数并非成比例关系;一般问卷调查研究中,正式抽样数最好在350以上;AIRSSINA 与GAY:10%;总体小于500,20%以上;再少,30%以上;抽样样本数愈多推论的效度愈可靠抽样样本数愈多推论的效度愈可靠抽样方法如何选择一个用于代表总体的样本?数目;方法。如何抽样?17统计学的内容统计学的内容描描述述性性统统计计推推断断统统计计实实验验设设计计统统计计学学内内容容描述性统计分析频数分布表正态分布数据如果符合正态分布,那就具备了一般统计分析的充分条件。偏态数据推断统计推断统计是用已收集和分析过的样本数据去推断总体值的统计方法。差异推断统计:均数差异联合推断统计:相关推断置信
4、区间置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之五。如例子中一样,置信水平一般用百分比表示,因此置
5、信水平0.95上的置信空间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。小概率事件(0.05)0.05显著;0.01高度显著;0.001极其高度显著 小概率事件是几乎不可能发生的事情,在一次试验或观察中小概率事件发生了,于是我们有理由怀疑这一假设的真实性,拒绝原假设。原假设:没有差异/没有关联差异推断统计单样本均值差数检验独立双样本均值差数检验相关双样本均值差数检验独立多样本均值差数检验练习题用“多变量入门练习数据”,分析身高160以上(包含160)与160以下,体重上是否存在差异?用”六班成绩”中的期中数学年级平均分为87.16.试分析3班的“期中数学”成绩与之相比有无差异?6个班之间的情况又是如何?用ch6中的数据中是10个运动员新旧训练成绩,试分析新训练法有推广价值吗?联合推断统计双变量偏相关相关系数r问卷的基本分析问卷的项目分析、效度检验、信度检验作为编制正式问卷的依据。效度检验:整张问卷的可靠程度;信度检验:一致性;项目分析:主要测验个别题项的适切性或可靠程度。难度鉴别度极端组法同质性检验