1、.第二章 统计图表.统计图表统计表和统计图是对数据进行初步整理,以简化的形式表现数据的两种最简单的方式。它们可以简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点。 本章主要介绍对数据进行初步整理的方法和各种统计图表的制作与应用。.第二章 统计图表第一节 数据的初步整理(重点)第二节 次数分布表(重点难点)第三节 次数分布图(重点难点)第四节 其他类型的统计图表(重点).第一节 数据的初步整理一、数据排序 二、统计分组三、统计表四、统计图.一、数据排序数据排序就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。排列后会使数据之间的某种关系有所显示。排序方法
2、:升序和降序。.不同数据的排序(一)字符型数据 汉字按拼音或笔画;英文按字母顺序。(二)数值型数据 按数值的大小。排序后可以划分等级,确定名次。 等级排列的顺序用升序还是降序,要看数据及其所反映的事物本身的性质和研究目的而定。如成绩、跑步时间。.二、统计分组所谓统计分组,就是根据被研究对象的特征,将所得数据划分到各个组别中去。(一)统计分组前的准备(二)统计分组应注意的问题(三)分组的标志.(一)统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。(非常重要)核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。.删除数据的原则1、在这个
3、过程中,切忌随心所欲地删除那些不符合自己主观假设的数据。2、在心理与教育科学研究中,常常会收集到一些变异性较大的实验数据。在进行整理时,如果没有充足的理由证明某数据是由实验中的过失所造成,就不应轻易将其排除。如果要删除它们,也应遵循三个标准差准则。(理由见P161正态分布).(二)统计分组应注意的问题1、分组要以被研究对象的本质特征为基础。(如性别,年级)2、分类标志要明确,要能包括所有的数据。这就需要遵循两个原则:周延原则和相斥原则。(1)周延:分类完整而不遗漏。周延原则:在某一标志下所分的各类能包含所有应包含的个体,任何一个个体必须有一类可归,绝不能有无类可归的个体。(2)相斥:对类别的安
4、排不会混淆。相斥原则:凡能归入某一类的个体只能归入这一类,绝没有归入其他一类的可能。注意:可以采用二分法,或者采用“其他”选项.(三)分组的标志分组的标志按形式大致可分为性质类别与数量类别两种:1、性质类别。主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。(称名、顺序)性质类别可根据事物的性质及研究的需要分成不同的层次,每个层次又可分为不同数量的细目。普通话考试等级一级甲等一级乙等;二级2、数量类别。这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。(等距、比率)对原始数据排序和分类以后,数量小的就可以直
5、接计算,数量大时再做进一步分组,编制统计表、统计图为以后的分析打下基础。.三、统计表1、定义:统计表是用来表达统计指标与被说明事物之间数量关系的表格。统计指标:在对数据进行统计分类以后,得到的各种数量结果称为统计指标。2、作用:简洁、清晰、准确、一目了然,明显地反映出事物的全貌及其蕴含的特征,省去冗长的文字叙述,便于分析、比较、计算和记忆。3、结构.表号 表号指表的序号,位于表的左上方,一般以出现的先后顺序排列。.名称名称又称标题,是一个表格的名称,应写在表的上方。标题用语要简练扼要,准确得体,一望即知该表的内容。表的序号和标题之间留一个汉字的空格。二者居中排在顶线的上方,长度不宜超过表的宽度
6、,若标题字数过多,应转行排列。.标目标目即分类的项目。标目的好坏决定统计表的质量,要认真酌定。标目一般在表的上面一行或左侧一列。如果分类的标志只有一个,写在表的上行或左列都可以。如果分类的标志有两个,且二者没有隶属关系,则左列与上行各一个。如果两个分类标志有隶属关系,则要放在一个方向(或上面或左侧)分两行分述。标目确立了数据组织的逻辑,并确定了栏目下数据栏的性质。.数字数字是统计表的语言,又称统计指标。它占据统计表的大部分空间,书写要整齐划一,数字应以个位数(或小数点)对准上下对齐,缺数字的项要划“-”。表中的数字一般不带单位、%(百分号)等,单位和%一般归在标目中。表中的数字构成了表体。.表
7、注表注写在表的下面,是对统计表或者表内的某些内容进行补充说明和解释。数据来源、附记等都可作为表注的内容,文字可长可短。.表线心理学研究中的表格常使用简单的三线表。这种表格只有三条线,即顶线、底线和栏目线,并且不用竖线隔开。教育研究中的不全是。.表1 1983年我国普通中学教师学历统计表注:引自中国教育成就统计资料,1984年人民教育出版社.四、统计图1、定义:指利用几何的点、线、面、体和色彩的描述把所研究对象的特征、内部结构、相互关系和对比情况等方面的统计数据绘制成整齐、简明的图形。2、作用:直观、形象、简明扼要、清晰易懂、便于学习和记忆。缺点:不精确。弥补方法:统计图和统计表同时出现。3、形
8、式:统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。4、结构.图号及图题图号是图的序号,图题或标题是统计图的名称。二者之间空一个汉字的举例。位于图形正下方。图题的文字要言简意赅,具有说明性和专指性,使人一看就能知道该图所要显示的是何事、何物,发生于何时、何地。如果图示资料比较复杂,这时图题可用大标题与小标题呈现。图题的字体要与整个图形的大小相称,一般是图中使用的最大号的文字。.图目图目是写在图形基线上的各种不同类别、名称,或时间、空间的统计数量值,即横坐标上所用的各种单位名称。也叫刻度线标签。.图尺在统计图的
9、横坐标及纵坐标上都要用一定的距离表示各种单位,这些单位称为图尺。图尺分点要清楚,整个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺法或回尺法,减少图幅。.图形图形是图的主要部分,图形线条要清晰,一般除图形线外,避免书写文字。要表示不同的结果,用不同的图形线来区别。.图例图例的位置可选图中或图外适当的地方,注意保证整个统计图的和谐美观和均衡。.图注凡是图形中需要借助文字或数字加以补充说明的,均称为图注。图注部分的文字要少,字号要小。它可以帮助读者理解图形所示资料,提高统计图的使用价值,又不破坏图的美观。.图线统计图所使用的线条,除图形基线(横坐标)、尺度线(纵坐标)、轮廓线(图
10、形的边框)外,有时也可以加参考线(也称网格线)。.人数 70 60 50 40 30 20 10 1980年 1985年 1991年图1 某校近十年教师人数及性别变化图示男 女年份图例图形图目图尺(制图的尺度线。点、单位的总称)图题图号.图2 高考上线人数.第二节 次数分布表一、简单次数分布表二、分组次数分布表(有的书上把分组次数分布表称为简单次数分布表)三、相对次数分布表 四、累加(累积)次数分布表五、双列次数分布表六、不等距次数分布表.次数分布表的构成次数分布表由两个部分两个部分组成:一、分组分组。分组的标志可以是品质的,如性别(简单次数分布表);也可以是按照数量特征的具体值(简单次数分布
11、表)或数值的一定范围来分组(分组次数分布表)。二、与各个组相对应的次数。次数。这两部分决定了次数分布表属于哪一种。这两部分决定了次数分布表属于哪一种。.一、简单次数分布表简单次数分布表就是依据每一个分数值每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。例1,见表2-1。例2,将下列数据放入一个简单次数分布表中。2、3、1、2、5、4、5、5、1、4、2、2。.二、分组次数分布表当数据很大时,应当把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。(一)编制分组次数分布表的步骤(
12、二)分组次数分布表的意义与缺陷.(一)编制分组次数分布表的步骤1、求全距:RMax-Min(两极差)2、定组数:K3、定组距:i4、列出分组区间(组限)5、求组中值:Xc6、登记次数:列登记表,又称草表。7、计算次数:重新制表。.例题:52名学生拼写测验分数如下,试将它制成一个次数分布表。59、56、52、50、50、47、46、44、43、43、42、42、40、39、38、38、38、37、37、37、36、36、36、36、35、35、34、34、33、32、32、32、31、31、31、30、30、29、29、28、27、27、27、25、24、22、22、21、21、20、17、17
13、。.(二)分组次数分布表的意义与缺陷编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布状况如何。同时,次数分布表还可显示这一组数据的集中情况及差异情况等。缺点:缺点:(1)原始数据不见了,只见到各分组区间及各组的次数,所有的分组次数分布表都是这样。根据这样的统计表提供的数据资料计算得到的平均值,会与用原数据计算的值有一定的出入。(2)同一组数据,随着分组组距的加大,分组数目减少,引进的误差就会变大,反之则变小。弥补:弥补:根据次数分布表的编制要求,分组区间不能无约束变大。因此,就一组数据而言,组距的变化引进的计算误差也不会很大,对以后的进一步统计
14、分析,一般不会带来需要注意的影响。.三、相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(fN)或百分比( )来表示次数,制成相对次数分布表。100%fN.四、累加(累积)次数分布表累加次数:是把各组的次数由下而上,或由上而下累加在一起。最后一组的累加次数应等于数据的总次数。累加次数的方法有两种:(1)向上累加:从分布表的小数值端,逐区间进行次数累加,这种累加次数可回答次数分布表某一分组区间上限以下的次数是多少。(2)向下累加:从分布表的大数端逐区间累加次数,这种累加次数可回答某一分组区间下限以上的次数是多少。.累加次数分布表的种类(一)累加次数分布表(二)累加相对次数分
15、布表(三)累加百分数分布表.五、双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,是指同一组被试中每个被试两门学业成绩分数、或两种能力分数或两种心理特点的特征,或同一组被试在两种实验条件下获得的结果等。或匹配组被试(如孪生子、智商相同者)。例P37-38.六、不等距次数分布表 一般次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别、年龄分组等,若按等距分组不能确切地反映实际情况,这时可采取不等距分组的方法。.心理学中对年龄的分组0-1岁,乳儿期;1-3岁,婴儿期;3-6岁,幼儿期;7-11岁,学龄初期(童年期);1
16、1-15岁,学龄中期(少年期);15-25岁,学龄晚期(青年初期);25-65岁,成年期(青年期和壮年期);65岁-死亡,老年期。.第三节 次数分布图一、次数直方图二、次数多边图三、相对次数直方图与多边图四、累加次数分布图五、累加相对次数曲线图与累加百分数曲线图.一、次数直方图直方图,又称等距直方图,是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,是以矩形的面积表示连续性随机变量次数分布的图形。1、绘制次数直方图的步骤 2、次数直方图的优缺点 .1、绘制次数直方图的步骤(1)以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交。为使图形美观,通常使横轴与纵轴的长度比为5:3。
17、当然也不必拘泥于这个比例。纵轴代表次数,一般从0开始,到最高次数为止,按比例标出刻度。横轴代表测验的分数量尺,表示数据的等距分组点,即各分组区间的上下限,有时用组中值表示。直方图就画在横轴上方。直方条的宽度为组距(i)。为美观期间,往往不从0处开始标刻度,而是空出一个直方条宽度的位置,再从分数最低的一组开始,按比例等间隔地标出次数分布中各组的组中值或上下组限。(2)以各组组中值为对称点,以组距为宽度,以各组次数为高度绘制直方条。各直条矩形之间不留空隙,没有间隔。直方条下的面积与总次数相等。各直方条沿着横轴,依顺序紧密直立排列。这样,次数直方图即告绘成。(3)在直方图横轴下边标上图的编号和图的题
18、目,并检查一下图形结构的完整性。这样,直方图便绘制完成了。.次数直方图(次数直方图(histogram).2、次数直方图的优缺点 优点:与次数分布表比较,次数直方图比较直观形象直观形象,使人见后印象深刻印象深刻,尤其能很快地看出各组次数之间的相对大小及结构形态。缺点:次数直方图也有不足之处,那就是人们不易准确与快速地了解到各组的次数大小。为此,在绘制次数直方图时,有人也把各组的次数分别标在各个直方条的顶端,以便阅读。.二、次数多边图 次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。1、次数多边图制作步骤 2、多边形图与直方图虽然都是以面积表示连续性数据的次数分布,但次数多
19、边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。3、将简单次数转换成相对次数,就可以画出相对次数多边图。它的一个突出优点在于在一个图上比较多组次数分布。 .次数多边图(次数多边图(line graph).三、相对次数直方图与多边图绘制方法和次数直方图与多边图大致相同,不同在于纵轴表示的是相对次数。在应用上,有时可能会碰上比较多批不同数据的相对次数,而利用相对次数多边图的特点,可允许在同一个图形中描绘两个或三个不同的相对次数多边图,但要注意两点:(1)数据分组要相同;(2)要用图注或不同的颜色来区别与辨认几个不同次数多边图。.次数多边图的优点次数多边图的优点.四、累加次数分布图累
20、加次数分布图有直方图式和曲线图式两种,最为常用的是累积次数曲线图,它是根据累积次数分布或累积相对次数分布制作而成的。1、累加直方图2、累加曲线3、累加曲线的形状 .累加次数分布图累加次数分布图.五、累加相对次数曲线图与累加百分数曲线图根据累加相对次数分布以及累加百分数分布,可相应地绘制累加相对次数曲线图和累加百分数曲线图。它们的制作方法大体上与上述的累加次数曲线图相同,只是这里的纵轴是关于累加相对次数或累加百分数的量尺。.累积相对次数分布图累积相对次数分布图.第四节 其他类型的统计图表一、其他常用的统计表类型二、其他常用的统计图的类别.一、其他常用的统计表类型(一)简单表:只列出名称、地点时序
21、或统计指标名称的统计表。(二)分组表:只有一个分类标志的统计表,也称单向表。(三)复合表:统计分组标志有两个或两个以上的表。.(一)简单表表1 某运动队队员几项心理指标测试平均结果.(二)分组表表2 不同年龄组脑电平均频率分布资料来源:陈帼眉、沈德立编,幼儿心理学,石家庄:河北人民出版社,1979年,第48页.(三)复合表表3 不同年级控制组与实验组的学习成绩.二、其他常用的统计图的类别除了次数分布图,还有:(一)条形图(二)圆形图(三)线形图(四)散点图.自学各种统计图含义适用的数据资料绘制方法注意要点.barGraduation DateSpring 91Fall 90Spring 90F
22、all 89Mean Starting Salary270002600025000.histogramStarting Salary62500.057500.052500.047500.042500.037500.032500.027500.022500.017500.012500.07500.02001000Std. Dev = 6967.98 Mean = 26064.2N = 1100.00.pieSpring 91Fall 90Spring 90Fall 89.lineGraduation DateSpring 91Fall 90Spring 90Fall 89Mean Startin
23、g Salary270002600025000.绘制统计图的要求1、根据数据和目的选择合适的图形2、图形所表示的面积或距离要比例适当3、表示不同的事物要用不同的颜色与线条.(一)条形图条形图(bar chart),也叫直条图,主要用于表示离散型数据资料,即计数资料。条形图以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图中一个轴是分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据。.barGraduation DateSpring 91Fall 90Spring 90Fall 89Mean Starting Salary270002600025000.hi
24、stogramStarting Salary62500.057500.052500.047500.042500.037500.032500.027500.022500.017500.012500.07500.02001000Std. Dev = 6967.98 Mean = 26064.2N = 1100.00.条形图和直方图的不同.(二)圆形图圆形图(circle graph),又称饼图(pie),主要用于描述间断性资料,目的是为了显示各部分在整体中所占的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如百分数)为主。.pieSpring 91Fall 90Spring 90Fa
25、ll 89.(三)线形图线形图更多用于连续性资料(也可用于离散数据),凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形,用线形图表示是较好的方法。也可在线形图中画两条线或多条线,用于比较两组或多组数据资料。常见的两种线形图有折线图和曲线图。线形图是最常用的统计图。.lineGraduation DateSpring 91Fall 90Spring 90Fall 89Mean Starting Salary270002600025000.(四)散点图散点图(scatter plot),又称点图、散布图(scatter diagram或scatte
26、rgram,scattergraph),它是用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。通常以圆点分布的形态表示两种现象间相关程度。.1、次数多边图制作步骤 (1)画纵轴和横轴的方法及要求与制作次数直方图相同,但是要求在横轴上最低组和最高组外各增加一个次数f为0的组。目的在于构成闭合的多边形。(2)在两轴所在的直角坐标平面上,分别以每个组的组中值为横坐标、相应的次数为纵坐标,画出各个点。如果原先把数据分成了K个组,那么加上两端额外增加的两个次数为0的组后共为(K+2)个组。因此,要在坐标平面上画出(K+2)个点。(3)用线段把相邻的点依次连接起来,连同横轴,构成一个闭合的多
27、边形,即是次数多边图。.次数多边图与概率分布曲线当一批数据的个数不是很多时,所绘制成的次数多边图常表现为不规则的多边形。从理论上讲,当一批数据的个数足够大时,随着分组时组距的不断变小,绘制成的次数多边图就越来越连续光滑,若分为无数组时,就形成一条极其光滑的曲线,这种曲线在统计学上称为次数分布曲线。后面会学到正态分布、t分布、F分布、卡方分布等概率分布曲线。.1、累加直方图横坐标和直方图一样,标分组区间或组中值。纵坐标是累加次数。其它和直方图绘制步骤相同。向上累加:自下而上累加,精确上限以下的累加次数。向下累加:自上而下累加,精确下限以上的累加次数。.2、累加曲线累积次数曲线图的形状不会由于组距
28、的不同而使图形发生较大的变化,因而从抽样数据制成的累积次数曲线图是比较稳定的。累积次数曲线图的制作方法主要掌握以下几个要领。(1)纵轴为累积次数的量尺,横轴意义不变。(2)对于“以下”分布来说,各个坐标点的位置,其横坐标是各组的实上限,纵座标是累积的次数。(3)用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“S”型曲线。如果有累加直方图,连接各组矩形的右顶点可画累加曲线。.3、累加曲线的形状 (P66)(1)曲线的上枝长于下枝。说明大数端各组次数偏少且组数较多,各组次数变化小。因此称为正偏态。(2)下枝长于上枝。说明小数端各组次数偏少且组数较多,各组次数变化小。因
29、此称为负偏态。(3)上下枝相当。正态分布。 .2、定组数:K定组数就是要确定把整批数据划分为多少个等距的区组。组数用符号K来表示,它的大小要看数据的多少而定。 一般来说,当一批数据的个数在200个以内时,组数可取8-18组。如果数据来自一个正态的总体,则可利用下述经验公式来确定组数,即: 。(N为数据个数,K取近似整数)。251.87(1)KN.3、定组距:i组距是指任意一组的起点和终点之间的距离,用符号i表示。iRK。组距经常取2、3、5、10、20等数值,这样便于分组,便于计算分组区间和组中值。.4、列出分组区间(组限)分组区间即一个组的起点值和终点值之间的距离,又叫组限。起点值称组下限,终点值称组上限,组限有表述组限和精确组限两种。注意:注意:(1)在列出的分组区间内,最高组区间应包含最大的数据,最低组区间应包含最小的数据。(2)最高组或最低组的下限最好是组距i的整数倍。(3)各分组区间一般在纵坐标上按顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面。(4)在呈现表格时,各分组区间使用表述组限,并且为了书写方便,通常只用整数写下限值,然后在右侧划一横线。不过在登记次数时必须明确,一定要按精确组限将数据归类划分到相应的组别中。 .5、求组中值:Xc组中值是各组的组中点在量尺上的数值。组中值(组实上限+组实下限)2
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。