体育统计方法与实例第三章-统计描述课件.ppt

上传人(卖家):晟晟文业 文档编号:3934967 上传时间:2022-10-26 格式:PPT 页数:125 大小:1.06MB
下载 相关 举报
体育统计方法与实例第三章-统计描述课件.ppt_第1页
第1页 / 共125页
体育统计方法与实例第三章-统计描述课件.ppt_第2页
第2页 / 共125页
体育统计方法与实例第三章-统计描述课件.ppt_第3页
第3页 / 共125页
体育统计方法与实例第三章-统计描述课件.ppt_第4页
第4页 / 共125页
体育统计方法与实例第三章-统计描述课件.ppt_第5页
第5页 / 共125页
点击查看更多>>
资源描述

1、体育统计方法与体育统计方法与实例实例第三章第三章 统计描述统计描述统计描述统计描述描述统计描述统计频数分析频数分析统计图表统计图表第一节第一节 描述统计描述统计学习学习目标:目标1 掌握集中量数的统计意义及计算方法目标2 掌握差异量数的统计意义及计算方法目标3 掌握变异系数的统计意义及计算方法 在分析或研究体育现象时,常常以样本特征数(描述样本信息特征的数值)去估计总体参数,样本特征数的指标主要有集中量数指标和离散量数指标两种。第一节第一节 描述统计描述统计描述统计量包括:描述统计量包括:n1 集中量数指标n2 离散量数指标n3 分布参数n4 描述统计的SPSS例解第一节第一节 描述统计描述统

2、计1 1 集集中中量量数数指指标标 反映一群性质相同的观察值的平均水平或集中趋势的统计指标即为集中量数。常用的有:算术平均数、中位数、众数、百分位数等,下面针对这几种集中量数的涵义及小样本的计算方法进行举例说明,大样本的计算方法见后面的SPSS软件的介绍。第一节第一节 描述统计描述统计一、集中量数指标包括:一、集中量数指标包括:1 算术平均数(Average)2 中位数(Median)3 众数(Mode)4 百分位数(Percentile)一、集中量数指标一、集中量数指标1.1.算术平均数(算术平均数(AverageAverage)(1 1)定义:)定义:所有同质数据的总和除以数据的个数所得的

3、商,即为该组数据的算术平均数,简称平均数、均数或均值。就是说,如果有一组数据 (I=1,2,3n),把(3-1-1)称为本组数据的算术平均数。其中为数据的总和;(读作Xbar)为算术平均数;为某个体变量。nxxnxxnii也可简化为1nixxxx21xixix(2 2)平均数的直接计算方法)平均数的直接计算方法例3-1-1 若有5人的跳高成绩(单位:米)为:1.60 1.62 1.68 1.65 1.64,求其跳高成绩的算术平均数。解:5人跳高成绩的算术平均数为:一般情况下,计算的最后结果要比原始数据多保留1位小数,下同。)(638.1564.165.168.162.160.1米nxx(3 3

4、)平均数的加权计算方法)平均数的加权计算方法 数据分组后,可以利用加权法计算算术平均数。加权法可以根据频数分布表中数据的频数计算均数,也可以根据事先设置的权重计算均数。权重就是各个数据的重要程度的系数(所有数据的权重之和等于1)。加权法计算均数多用于学生体质或者体育综合成绩的计算、教学评估的合成分数以及多组数据平均数的合成。加权法计算算术平均数的公式为:(3-1-2)kiikiiikknffxffffxfxfxx11212211 例例3 3-1 1-22 某年级有四个班学生的体育成绩,1班有35人,平均分为75分;2班有32人,平均分为78分;3班有36人,平均分为81分;4班有30人,平均分

5、为79分,求4个班体育成绩的总平均分。)(3.7830363235307936813278357511分解:kiikiiiffxx 例例3 3-1 1-33 某教师在学期末的100名学生学评教中,教学基本功、教学内容、教学方法以及教学创新的得分分别为95分、89分、92分、85分,学校规定教学基本功、教学内容、教学方法以及教学创新的得分权重分别是30%、40%、20%、10%,试计算该教师学期末的学评教(总)平均得分。)(911.0852.0924.0893.095分解:x 例例3-1-43-1-4 某班20名男生的引体向上成绩如表3-1-1所示,求平均数。表3-1-1 20名男生的引体向上成

6、绩)(72014012345321202153104855312011个解:kiikiiiffxx 例例3-1-53-1-5 有一组跳远数据的频数分布资料,如表3-1-2所示,计算平均数。表3-1-2 100名学生跳远成绩的频数分布)(7.3441003447211cmffxxkiikiii解:平均数的优缺点:平均数的优缺点:优点优点:均数计算简便,适合代数运算,是一个用途最广效果也很好的统计量。既考虑到频次的多少又考虑到变量值的大小,它可靠、灵敏,也是对资料所提供信息运用最充分。缺点缺点:均数易受少数极端数据的影响而大大改变其数值,故严重偏态的分布,用均数往往不能较好地反映资料的集中趋势。平

7、均数的意义平均数的意义:(1)平均数是反映同质对象观察值的平均水平或集中趋势的统计量。适用于定距以上测度的变量。(2)对于多组数据,在同质、同单位的情况下,利用平均数可以比较多组数据的平均水平。2.2.中位数(中位数(MedianMedian)将样本的观察值按其数值大小顺序排列起来处于中间位置的那个数即为中位数。它处于频数分配的中点,不受极端数值的影响。中位数用“”表示。eM中位数的计算公式:中位数的计算公式:当为n奇数时,则位于中间位置第(n+1)/2位置的那个数即中位数:(3-1-3)当为n偶数时,则位于中间两项,第与第位置的两数的平均数即中位数:(3-1-4)21neXM2n12n2)(

8、122nneXXM计算步骤:计算步骤:将数据按照从小到大的顺序排列起来求项数:Om=(n+1)/2 求中位数eM例例3-1-6若由8名运动员的纵跳成绩(单位:米)为:10.20 10.35 10.84 10.6810.92 11.05 11.21 11.38,试求中位数。将数据按照从小到大的顺序排列起来10.20 10.35 10.68 10.84 10.92 11.05 11.21 11.38求项数:Om=(n+1)/2=(8+1)/2=4.5即中位数位于第四和第五项之间求中位数:Me=(10.84+10.92)/2=10.88中中位位数数的的优优点点:当数据严重偏态,有个别极端值特别大或特

9、别小时,不会影响中位数的大小.因而在当数据严重偏态,平均数失去应有的代表性时,用中位数来反映数据的集中趋势更合适.适合于定序以上的变量.3.3.众数(众数(ModeMode)定义:定义:数据中出现次数最多的数据为本组数据的众数,它能明确反映数据分布的集中趋势。众数是一种位置平均数,不受极端数据的影响。但并非所有的数据组都有众数,一组数可能存在一个众数,也可能存在多个众数,众数用“”表示。众数的计算方法:众数的计算方法:对于小样本数据,直接数出数据的个数,个数最多的数据为本组数据的众数。如果样本量较大,在频数分布表中频数分布最多的那一组的组中值即为本组数据的众数。oM 例例3-1-73-1-7已

10、知100名某年龄组跳远成绩的频数分布表如下,试求本组数据的众数。表3-1-3 100名某年龄组跳远成绩(单位:厘米)的频数分布表 在表3-1-3中,频数最多的是第5组,频数为25,该组的组中值为(330+346)/2=338,故本组数据的众数为338.注意:注意:中位数、众数受极端数据(数值非常大或非常小)的影响较小。算术平均数、中位数、众数间的关系算术平均数、中位数、众数间的关系:当频数分布呈完全对称分布时,算术平均数、中位数、众数三者相同,如图3-1-1所示。图3-1-1 对称分布 当频数分布呈正偏态时,算术平均数大于中位数、众数小于中位数,如图3-1-2所示。图3-1-2 正偏态分布 当

11、频数分布呈负偏态时,算术平均数小于中位数、众数大于中位数,如图3-1-3所示。图3-1-3 负偏态分布 平均数、中位数和众数都是描述数据集中趋势的统计量,它们分别适用于不同分布的数据资料。平均数适用于无异常值的正态或近似正态分布的数据资料;中位数适用于存在异常值且严重偏态的数据资料;众数适用于分布不匀,而个别数据重复次数较多的数据资料。4.4.百分位数(百分位数(PercentilePercentile)定义:定义:百分位数是将数据按由小到大的顺序排列起来后,用99个点将数据100等分,处于各分点位置上的数,称为百分位数,用Pk(或xi)表示。其中,k=1,2,99表示百分位数的位置或分点或分

12、点所对应的分数。Pk表示有k%的数据小于等于Pk,有(100-k)%的数据大于等于Pk。P50 就是中位数Me。分点的位置记为i。百分位数的计算过程与中位数类似,具体步骤如下:百分位数的计算过程与中位数类似,具体步骤如下:(1)将数据从小到大排列后为(2)确定所求百分位数的位置i。设求第k百分位数,则位置为:(3-1-5)(3)确定百分位数Pk。若计算i为整数,则直接在排好的数据中找到第i个数据即所求。若计算i为小数,则取i两侧的数据中求算术平均数即所求。1100nkinxxx,21 例例3-1-83-1-8测得30名男生的助跑摸高的数据(单位:cm)如下:求第25、50、75百分位数。解:1

13、)将30个数据从小到大排列后如下:2)确定所求百分位数的位置i。设求第25百分位数,则位置为:结果不为整数,说明第25百分位数的位置在第7位与第8位观测值的中间。75.71002531100)1(25kni3)确定百分位数。取第7位和第8位观测值的算术平均数作为第25百分位数,即 288是第25百分位数,说明有25%的摸高数据比它小。也可理解为该群体有100个摸高数据,则会有25个数据比288小。同理可得,第50百分位数是301.5,第75百分位数是311。这三个等分点把原始数据四等分,称为第一四分位数、第二四分位数、第三四分位数,分别记为Q1、Q2、Q3,它们统称为四分位数,记为Q。百分位数

14、适用于定序以上的数据。)(288228928775.725cmxP 任何一组数据,尽管它们属同质的数据,但在量上又是由具有差异的个体组成的,这些数据既是同质的又是有差异的,有时用集中位置量数难以反映一组数据的全貌,这是由于一组数据除了集中水平的一面,还有离散程度的一面。例如:两组运动员引体向上的成绩如下:甲组:3,5,5,5,5,6,6。=5乙组:1,2,4,5,6,9,8。=5甲x乙x二、二、离散量数指标离散量数指标 以上两组成绩的平均数皆为5次,但其组内观察值的分布情况却不相同,乙组离散程度要大于甲组,因此,要全面反映变量的特征,除了考察变量的平均水平外,还必须要反映离散程度。离散量数是反

15、映一群性质相同的观察值的离散程度的统计指标。常见的有:极差、四分差、方差、标准差、变异系数。1.1.极差极差(全距全距)(Range)(Range)极差是一组数据的最大值和最小值的差,用字母R表示。即:(3-1-6)R越大表示数据的离散程度越大,反之则越小。使用极差描述数据的离散程度公式简介,但是公式中只是涉及到了最大值和最小值两个数据,而中间的大部分数据信息未在极差中体现,信息不全,故容易受到极值的影响。如果存在极端数据,不宜采用R来描述数据的离散程度。极差适用于定量数据。minmaxxxR二、二、离散量数指标离散量数指标 例例3-1-93-1-9 采用例3-1-6的数据,8名运动员的纵跳成

16、绩(单位:米)为:10.20 10.35 10.84 10.6810.92 11.05 11.21 11.38,试求极差。解:)(18.120.1038.11minmax米xxR2.2.四分差四分差(Quartile Deviation)(Quartile Deviation)四分差(四分位差)是一组数据中第三四分位数与第一四分位数之差的一半。记 为计算公式为:(3-1-7)四分差的意义是除去两端各四分之一的部分,用剩余中间的一半来测定四分之一的距离大小。它去掉了极端数据,不受极端值的影响,在反映数据的离散程度方面较之极差略准确一些。它适用于定量数据。Q2QQQ13 例例3-1-103-1-1

17、0 采用例3-1-8的数据,测得30名男生助跑摸高的数据(单位:cm)如下:求四分差。解:由例3-1-8的计算结果可知Q3=P75=311 Q1=P25=288,因此)(5.1122883112QQQ13cm3.标准差标准差(Standard Deviation)与方差与方差(Variance)标准差是所有变量值与其均数的离差平方的算术平均数的平方根。方差是所有变量值与其均数的离差平方的算术平均数。方差常用在统计推断中,方差的单位时原始变量值单位的平方,不太符合习惯。两者都适用于定量数据。对于原始数据来讲,若一个总体中有N个观察值,则总体标准差的计算公式为:(3-1-8),21NxxxNx2)

18、(总体方差的计算公式为:(3-1-9)其中,2为方差,为总体均数,N为总体中的个体数目。如果一个样本包涵了n个观察值 则样本标准差S的计算公式为:(3-1-10)Nx 22nxxS2,21nxxx 根据数理统计的研究,用样本资料获得的标准差差,往往比总体标准差偏小,为了得到总体标准差较好的估计值,可将分母中的 n减去1,即(3-1-11)其中,S样本标准差,n-1为自由度(能够进行独立变化的变量个数),记为。方差的计算公式为(3-1-12)12nxxS122nxxSn 例例3-1-113-1-11 求2,4,6的标准差和方差。解:=2 43642nxx 12 nxxS 13464442222

19、413)46()44()42(122222nxxS 也可利用下面的公式,省去计算平均数,如果平均数不是整数的话,根据四舍五入的均值计算的标准差不是很准确。(3-1-13)122nnxxS小样本标准差的直接求法(不计算均值)步骤如下:小样本标准差的直接求法(不计算均值)步骤如下:列标准差的计算表,求出变量的和X和变量的平方和X2根据标准差的计算公式求S,其计算式为 1/22nnxxS 例例3-1-123-1-12 10名学生的引体向上的数据(单位:次)为:7、3、9、6、10、12、5、11、4、13,试求其标准差。解:列标准差的计算表,求出变量的和X和变量的平方和X2表3-1-4 标准差的计算

20、表根据标准差的计算公式求根据标准差的计算公式求S S,其计算式为,其计算式为)(5.311010/807501/222次nnxxS标准差的意义:标准差的意义:标准差是描述数据离散程度的统计量;对于多组数据,在同质、同单位、均数相等或近似相等的情况下,可以比较多组数据的离散程度(三个条件缺一不可);标准差越小,说明观察值的离散程度越小,标准差越大,说明观察值的离散程度越大。经计算:=40.23m,=40.23m;=0.945m,=2.07m 两个队员的标枪成绩的平均数都是40.23m,但是观察甲队员的最好成绩为42.10m,最差成绩为38.70m,而乙队员的最好成绩为43.32m,最差成绩为29

21、.50m,甲队员的成绩相对乙队员的成绩较整齐,并且计算得知S甲=0.945m S乙=2.07m,说明甲队员的成绩比乙队员稳定。甲X乙X甲S乙S4.4.变变异异系系数数(C Co oe ef ff fi ic ci ie en nt t o of f V Va ar ri ia at ti io on n)变异系数是反映变量离散程度的统计指标,是以样本标准差除以平均数的商的百分比来表示的,表达式为:CV=CV=(3-1-14)变异系数CV是相对数,无单位。CV的值越小,运动员成绩越稳定;反之,越不稳定。%100 xS引入变异系数的原因:引入变异系数的原因:在比较多组数据的离散程度时,对于性质不同

22、或单位不同或平均数不相等的数据,就不能利用标准差比较了;变异系数是描述数据离散程度的统计量,在比较多组数据的离散程度时,利用变异系数比较不受上述三个条件的限制。例例3-1-133-1-13有一位男运动员,其主项是100米,兼项是跳远。在竞赛期内,其主、兼项的20次测试结果是:100米:=12秒,S1=0.15秒;跳远成绩:=5.9米,S2=0.18米,试比较该运动员的主、兼项成绩的稳定性。解:CV100=CV跳远=因为CV1000,则分布右侧有长尾,称正偏态,如图3-1-4;若SK1或SK-1;中度偏态:0.5SK1或-1SK0 图3-1-5 负偏态分布SK0,则为尖峰分布;若Ku0,则为平峰

23、分布。三、三、分布参数分布参数图3-1-6 峰度系数与分布形态 例例3-1-15 3-1-15 采用例3-1-1424名男生1500米跑的分数的数据,试求偏度系数SK.解:求原始数据的平均数和标准差得:平均值为:64.5分,标准差为12.3分,则 在体育实践中,往往是大样本数据,利用公式计算非常繁琐,容易出错,SPSS软件解决了这个问题,下面结合实例介绍统计描述量的计算过程。例例3-1-16 3-1-16 某年龄段104名男生助跑摸高的成绩如下(单位:cm),请运用SPSS软件计算其平均数、中位数、众数、标准差、方差、极差、最大值、最小值、四分位数、偏度系数和峰度系数、第10、30、90百分位

24、数。四、四、描述统计的描述统计的SPSSSPSS例解例解用用SPSSSPSS软件进行描述统计的步骤如下:软件进行描述统计的步骤如下:选择“分析(A)”菜单“描述统计”“频率(F)”命令,弹出如图3-1-7所示的对话框。双击“助跑摸高”,将其选入变量(V)复选框,然后单击“统计量(S)”按钮。弹出如图3-1-8所示的对话框。单击均值、中位数、众数、标准差、方差、范围、最大值、最小值、偏度、峰度、四分位数、然后单击“百分位数”,在其后的空格里分别输入10、30、90后,依次单击下面的“添加”按钮,然后单击“继续”按钮,返回上一级菜单。单击“确定”按钮,完成计算。其结果如表3-1-4所示。图3-1-

25、7“频率(F)”对话框图3-1-8“频率:统计量”对话框表3-1-4统计量 本例的输出结果:表3-1-4是描述统计结果,显示样本量N=104;缺失值=0;104名男生助跑摸高的均值=296.53,中位数=301.00,众数=306,标准差=17.005,方差=289.164,偏度系数=-0.855,峰度系数=0.051,极差(全距)=69,最小值=253,最大值=322,第一四分位(25%)=287.25,第二四分位(50%)=301.00(即中位数),第三四分位(75%)=307.75,第10百分位数=266.00,第30百分位数=292.00,第90百分位数=315.00。练习题练习题3.

26、1一、单项选择题一、单项选择题 1.当数据分布基本对称时,用()能较好的反映数据的集中趋势和平均水平。A.平均数 B.中位数 C.变异系数 D.众数 2.甲、乙两名同一项目运动员的标准差,S甲S乙,则说明()A.甲运动员成绩好于乙运动员 B.甲运动员成绩不如乙运动员 C.甲运动员成绩稳定性好于乙运动员 D.甲运动员成绩稳定性不如乙运动员 3.需要比较100米和跳远项目成绩的稳定性,但项目不同质、单位和均数也不同,可以用下面()比较其离散程度?A.Q B.S C.CV D.R 4.当数据呈严重偏态分布时,用()指标能更好地反映资料的集中趋势?A.中位数 B.平均数C.变异系数D.标准差 5.如果

27、计算得SK=0,Ku=0,则数据的分布为()A.尖峰分布 B.平峰分布 C.负偏态 D.正态分布二、填空题二、填空题(1)在统计学中,表示_,S表示_。(2)在统计学中,表示_,表示_。(3)对于性质相同、单位相同的一组数据,若均数相等或者近似相等,一般来说,S 越大,说明数据的_越大;反之,说明数据的_越小。(4)变异系数越大,说明数据的_越大,说明运动员成绩越_。(5)来自样本的统计指标,称为_;来自总体的统计指标,称为_。三、计算题三、计算题1.已知一组数据:,试计算平均数、中位数、方差、标准差、变异系数、众数。2.某人50支射箭成绩如下表,求平均射箭成绩。3、已知某年龄组50名男孩的体

28、重如下,试计算其中位数、第25、75百分位数、众数、四分差和极差。4.某班36名学生,体育测验成绩的标准差为9.6,求其离(均)差平方和.)(2xx四、四、SPSS操作题操作题 随机抽取61名学生的立定跳远成绩(单位:厘米)如下,利用SPSS描述统计的功能求其平均数、标准差、中位数、众数、方差、第30、90百分位数、偏态系数和峰态系数。表3-1-5 61名学生的立定跳远成绩统计表第二节 频数分析n学习目标:n 目标1 了解变量的类型n目标2 掌握类别变量的频数分析n目标3 掌握连续变量的频数分析 n目标4 能够用SPSS进行频数分析 在体育科学研究中,通常会收集到多个变量的样本数据。统计分析一

29、般是先对每个变量进行统计描述,以了解变量的大致分布情况和基本特征。统计描述主要有描述统计量(计算样本的数字特征)、频数分析和统计图表的使用。本节在描述统计量的基础上,介绍频数分析。一、一、变量的分类变量的分类 认识变量的分类,对于选取合适的统计方法非常重要,根据变量的测量和取值情况,通常可以将变量分为四类。第二节第二节 频数分析频数分析1.1.定类变量定类变量 定类变量也称为类别变量。只表示某一事物与其他事物在属性上的不同。不能排序。如运动员号码、学生的学号、性别、衣服的颜色、不同的专业等。根据其变量值,只能区分研究对象是否属于同一类别。如用1表示男生,用2表示女生,此时的1、2只表示学生的性

30、别类型。定类变量没有绝对的0点,没有测量单位。变量值之间有“相等”和“不等”的关系,但是没有大小之分,不能进行大小比较,更不能进行加、减、乘、除四则运算。例例3 3-2 2-1 1 对某体育院校大学生的问卷调查中,问卷题目为:你的专业是:1.运动人体 2.应用心理 3.运动康复 4.体育教育 5.其他 这个题目测量的是专业类别,对应的变量为定类变量,所以这个变量的5个取值没有大小之分。2.2.定序变量定序变量 定序变量也称为等级变量或顺序变量。可以就事物的某一属性的多少或大小依次排序。如:比赛中的名次(第一、二、三名)、等级制的学科成绩(优、良、中、合格、不合格)。又如,运动员等级、学历等。定

31、序变量没有绝对的0点,没有测量单位。变量值之间有“等于”、“不等于”、序关系(优于、劣于等),但加、减、乘、除四则运算没有意义。例例3-2-23-2-2 问卷题目为:你喜欢体育教师这个职业吗?(1)非常不喜欢(2)不喜欢(3)无所谓(4)喜欢 (5)非常喜欢 对应的变量为定序变量,通常将选项的数字作为该变量的取值。本例中,变量值越高,表示越喜欢。3.3.定距变量定距变量 定距变量也称为间距变量,是指具有相同单位,但无绝对零点的数据。只能进行加减运算,不能进行乘除运算。如气温就是定距变量,30度低于31度,且29度、30度、31度之间均相差等距的1度。4.4.定比变量定比变量 定比变量也称为比率

32、变量。是指具有相同单位和绝对零点的数据。可加减,也可乘除运算。如身高、体重、跳远成绩、学习成绩、反应时间等。数据的测量级别:数据的测量级别:定类和定序变量也称为离散变量或定性变量。定距变量和定比变量也称为连续变量或定量变量。定距和定比测量数据称为尺度测量数据,它和定序测量数据和定类测量数据一起构成了SPSS中规定的三种数据测量级别。尺度测量数据的测量级别最高,其次是定序测量数据,定类测量数据的测量级别最低。级别高的数据可以转换为级别低的数据进行分析,如可以将百分制成绩转换成等级制成绩进行分析。二、二、类别变量的频数分析类别变量的频数分析 定类数据在整理时除了列出数据的类别外,还要计算出每一类别

33、的频数、频率(或比例、比率),同时选择适当的图表进行显示,以便对数据及其特征有一个初步的了解。频数频数是落在某一特定类别(或组)中的数据个数。也称为次数。把某个类别(或组)及落在其中的相应频数全部列出,并用表格形式表示出来,称为频频数分布数分布。第二节第二节 频数分析频数分析 例例3-2-3 3-2-3 某射箭运动员30支箭的成绩分别为:整理后的频数分布表,见表3-2-1。表3-2-1 某运动员射箭成绩频数分布表 定序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积频率(百分比)。例例3-2-4 3-2-4 某专业200新生的年龄及其分布可以整理成表3-2-2。表3-2-2 某

34、专业新生年龄分布三、三、连续变量的频数分析连续变量的频数分析 连续变量包括定距变量和定比变量,通常取值都很多,直接按变量的取值分类意义不大。例例3-2-5 3-2-5 某小学四年级52名男生的身高资料如图3-2-1所示,试绘制频数分布表。图图3-2-1 3-2-1 某小学四年级某小学四年级5252名男生身高资料名男生身高资料 第二节第二节 频数分析频数分析解:解:数据分组的步骤:1.确定分组。本例分8组。2.确定各组的组距。3.根据分组,整理成频数分布表,见表3-2-43-2-4。表3-2-4 52名学生身高资料频数分布表四、频数分析的四、频数分析的SPSSSPSS例解例解 频数分析是描述统计

35、中最常用的方法之一,它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图、直方图等统计图。例例3-2-63-2-6某小学四年级52名男生的身高资料如图3-2-1所示,试绘制频数分布直方图。解解:假设数据己输入完毕,变量名为“身高”,具体操作如下:步 骤步 骤 1 1:选 择“分 析”菜 单,单 击“描 述 统计”“频率”命令。弹出“频率(F)”对话框。如图3-2-2所示。其中:显示频率表格复选择框,确定是否在结果中输出频数表,本例不选此项。图3-2-2 “频数分布”对话框步骤步骤2 2:在对话框左侧的变量列表中选择“身高”,单击按钮使之添加到“变量”框中。步骤步骤3 3

36、:单击“统计量”按钮,出现“频率:统计量”子对话框,如图3-2-3所示。图3-2-3 “频率:统计量”子对话框该对话框的功能为定义需要计算的其他描述统计量。1“百分位值”复选框组:定义需要输出的百分位数:可以选择:四分位数:显示25%、50%、75%的百分位数。将数据平分为所设定的相等等份:数值范围为2100之间的整数。由用户定义百分位数:键入值的范围为0100之间。键入数值后,单击“添加”按钮。可以键入多个百分位数。如果要剔除某个己选入的数据,可使用“删除”按钮。2“集中趋势”复选框组:用于定义描述集中趋势的一组指标。包括:算术平均数、中位数、众数和总和。3“离散”复选框组:用于定义描述离散

37、趋势的一组指标。包括:标准差、方差、全距、最小值、最大值和均数的标准误。4“分布”复选框组:用于定义描述分布特征的两个指标,偏度系数和峰度系数。本例中,选择了如图3-2-3所示的部分统计量,单击“继续”按钮,返回“频率(F)”对话框。步骤步骤4 4:单击“图表”按钮,出现“频率:图表有”子对话框,如图3-2-4所示。图3-2-4“频率:图表”子对话框 该对话框用于设定所做的统计图。“图表类型”单选按钮组:定义统计图类型。系统默认状态为不输出图形,也可选择条形图、饼图、直方图。“图表值”单选择按钮组:当选择条形图和饼 形图时,定义是按照频数还是按百分比做图。步骤步骤5 5:单击“频率:格式”按钮

38、,弹出“频率:格式”子对话框,该对话框用于定义输入频数表的格式,一般不用更改,使用默认设置即可。结果与分析结果与分析:在“频率(F)”对话框中,单击“继续”按钮,本例的输出结果如图3-2-5所示。图3-2-5 例3-2-6的统计结果 本例的输出结果:左图为描述统计结果,显示样本量N=52;缺失值=0;52名学生身高的均值=143.833,中位数=143.450,标准差=7.5238,最小值=128,最大值=162.5,第一四分位(25%)=138.1,第二四分位(50%)=143.45,第三四分位(75%)=148.75。图3-5的右图为绘制出的直方图,右侧的图例中给出了均数和标准差。本例选择

39、了显示正态分布曲线。一般系统默认的直方图分组数较多,本例对系统产生的直方图进行了人工设置,具体方法是:用鼠标双击图例,进入“图表编辑器”窗口,双击横轴组限数字,在“属性”对话框的“刻度”标签中,设置组距为5,数据显示范围为125165;在工具栏上单击(“显示数字标签”)工具,选择在直方图上显示各组的频数。由图可见资料的分布与正态曲线比较吻合。第三节第三节 统计图表统计图表学学习习目目标标:目标1 能够设计并制作统计表目标2 掌握统计图的分类与制作 为了更好地展示数据的分布特征,在描述统计和频数分析的基础上,往往用统计表和统计图来表达统计结果和对比分析,尤其在科研论文或者研究报告中应用更为广泛。

40、一、一、统统计计表表 将统计分析的事物的特征指标数值用表格的形式列出,即为统计表。合理的统计表可将数据和分析结果简明地表达出来,使数据有条理,系统化,便于分析和比较。1.1.统统计计表表的的结结构构 直观上看,统计表包括表号、标题、标目(包括横标目、纵标目)、数字、线条(一般为三线)、表注6部分。其基本格式如表3-3-1所示。(1 1)表号)表号 表号是表格的序号,位于表的正上方居中的位置。在整篇论文、研究报告或者章节中如果有多张表格,从前到后依次排序,其作用是对不同的表格进行区分,便于指示、查找。(2 2)标题)标题 标题是表格的名称,位于表的正上方居中的位置,紧接在表号的后面,与表号间隔一

41、个空格的位置。其作用在于简要说明表格中资料的内容、资料的时间和空间范围等。如果表内数据的单位相同和样本量相同等可以在标题后用括号统一标注。(3)标目标目 标目是表格中对数据含义的说明以及分类,有单位要注明单位。根据位置和作用,标目有分为总标目、横标目、纵标目,是分别对横行和纵列数据的含义进行说明和分类。总标目是对横标目和纵标目内容的概括,横标目的总标目位于表格的左上角,如表3-3-2所示的“年龄段”,纵标目的总标目根据是否需要来设置,如表3-3-2所示的“性别”。横标目位于表的左侧,向右说明各横行数字的含义,如表3-3-2所示的“各年龄段”;纵标目位于表头的上侧,向下说明各纵列数字的含义,如表

42、3-3-2所示的“男”、“女”。表3-3-2 2015年150名武陵山民族地区不同年龄段健身组织成员的性别结构(人)*资料来源:2014年国家社科基金项目武陵山民族地区全民健身组织网络建设与路径选择研究的小样本(n=150)调查数据(4 4)数字)数字 数字是统计表中最具实质性的内容,是对研究对象的性质、特点、分布等情况量的描述。表内数字务必准确,用阿拉伯数字表示,填写完整,位数对齐,小数位一致,一般所有表格中都应该有数字的,如果数字是“0”,要填写“0”,表内相邻的相同数字均应照写,不能用“同上”或者“”。如果某个表格中没有数字,要用“-”表示,以区分忘记填或者带给读者其他异议。(5)线条线

43、条 线条是构成表格的框架。一般具有三条横线,此类统计表又称为“三线表”。顶端和底端的两条线略粗,中间区分标目与数字的横线条略细,需要添加的其他横短线略细,以示区分。其他的线条略去,特别是表的左上角斜线和两侧的边线绝对禁止使用。(6)表注表注 表注是对统计表格内的内容进行的补充说明。表格一般不列表注或者其他的文字说明,特殊情况需要说明时用“*”或者“A”或者“1)”标出,将说明文字写在表格的下面,如表3-3-2所示的“资料来源:”。从内容上看,每张表又有主语和谓语。主语是指被研究的事物,如表3-3-2中的“年龄段”,一般位于表的左侧;谓语是指主语的各项指标,如表3-3-2所示的“男”、“女”,一

44、般位于表的右侧,主语和谓语结合起来就构成了一个完整的句子。如表3-3-2可理解为“2015年150名武陵山民族地区健身组织成员中20岁以下的男女人数分别为7和13”。2.2.统计表的种类统计表的种类 常见的统计表根据变量的个数分为简单表和复合表。(1)简单表简单表 由一组横标目和一组纵标目组成的统计表称为简单表。如表3-3-3和表3-3-4所示。表表3-3-3 某校学生人数情况某校学生人数情况(人人)表3-3-4 某大学体质健康标准达标情况(人)(2 2)复合表)复合表 按两个或两个以上标志结合起来分组的统计表称为复合表。如表3-3-5所示,将年龄、性别和城乡结合起来分组,可以分析不同年龄段、

45、不同性别的城乡老年人的预期寿命。表3-3-5 某地区不同性别城乡老年人预期寿命(3 3)编制统计表的基本原则和要求)编制统计表的基本原则和要求 统计表的制作原则应是简明、实用、美观。具体要求如下:第一,表的构思要简单明了,要能够直观表达表中数字的内容,一目了然。一般表的分组标志不以超过3个,否则就会使读者茫然,建议制作多张表格,来说明不同的分组意义。第二,一个好质量的统计表要求各个标目的安排和分组层次分明,符合主谓语的陈述顺序,以便于分析和比较。第三,对于频数分布表,最好列出合计栏,方便获取整体情况的信息。合计根据需要可放在最后一行或者最后一列,对于各种专门的统计量,比如卡方值、P值等放在表的

46、最后一列或者最后一行。二、二、统计图统计图 统计图是以统计数据为制图依据,利用EXCEL或者SPSS等软件把数据绘制成条形、箱型、面积、线型等几何形状来展示研究对象的结构特征、对比关系、频数分布等情况。其特点是形象具体、便于比较和判断,更直观的向读者展现了数据间的相关关系等,在科研论文、研究报告等宣传与展示中很常见,也是整理、分析、描述数据的一种常见形式,为了精确显示数字,也可以在图的下面附上统计表,或者在图形的相应位置标示出数字。1.1.统计图的基本结构统计图的基本结构 统计图通常包括图号、标题、标目、图形、刻度、图例6部分组成。如图3-3-1所示。(1 1)图号)图号 图号是图形的序号,位

47、于图的下方,标题的左侧,其作用是为了便于对文中的图形进行区分,一般按照图在文中出现的顺序依次排序,如图3-3-1所示。(2 2)标题)标题 标题是对图形所反映统计项目内容的简要的文字描述。其文字字号在图中最大,紧接图号,与图号间隔一个空格的位置。与图号一起位于图的正下方居中的位置,如图3-3-1所示标题“初中某班男女生体育健康课程等级评价图”。(3 3)标目)标目 标目是指在坐标系(圆图除外)中所标明的统计项目及其规定的尺度。分为纵标目和横标目,表示坐标轴的纵轴和横轴的意义,一般有度量单位,如图3-3-1所示的等级、人数。(4 4)图形)图形 图形是对要描述对象的性质和特点的直观表达,是统计图

48、的主要部分。根据资料的类型不同可选不同的图形:线形图、直方图、圆形图、条形图等等,如图3-3-1的条形图。(5 5)刻度)刻度 刻度即纵轴与横轴上的坐标。排列方法与直角坐标系的排法一致,刻度数值按从小到大的顺序;纵轴由下向上,横轴由左向右。(6 6)图例)图例 当同一坐标系下有多个事物时,则需要采用不同的颜色或条纹以示区别,并用图例予以说明。图例的位置可以根据美观需要自己选择在图形的下方、右上、右下等位置。如图3-3-1中的男、女分别用不同的颜色来区分。如果只有一个事物时,图例省略。2.2.常见统计图的类型常见统计图的类型 体育实践中,统计图通常的类型包括线形图、直方图、圆形图、条形图等等。各

49、种图的适用范围不同,一般离散型变量资料多采用条形图和圆形图,连续型变量资料多采用线形图和直方图。(1)条形图条形图 条形图是以宽度相同长度不同的条形来表现数据的大小和变动的统计图。条形图根据其条形的横排和纵排,分别称其为带形图和柱形图。条形图根据对比资料的组数不同分为单式和复式两种。图形中对比事物只有一组资料的,称为单式条形图。如图3-3-2所示。初一年级的早操出勤率是根据班级一个变量来分组绘制的。图形中含有两组或两组以上资料的称为复式条形图,如图3-3-1所示“男女体育健康课程等级评价图”。图3-3-2 高一年级5个班早操出勤率统计图 在绘制复式条形图时,若被比事物总频数不等,尺度可用百分比

50、表示。(2 2)圆形图)圆形图 圆形图又称为扇形图或饼图。它是以圆的整体面积代表被研究事物的全体,按各购成部分占全体的比重大小以扇形的形式来表示各个部分对全体的比例关系的统计图。如图3-3-3所示的饼图。一般的构成部分的数目不宜太多,以5-7个为宜。太多了就不能很直观的展示各部分的对比关系,建议换成条形图。图3-3-3 第31届奥运会中国队奖牌分布结构图(3 3)线形图)线形图 线形图又称为曲线图。它是用线段的升降来表示事物的变动对比情况的一种统计图。主要用于表示事物在时间上的变化趋势、事物的分配情况对比以及两个或者多个事物之间的依存对比关系等。一般一张线形图的线条数目不宜太多,超过4-5条直

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学 > 体育
版权提示 | 免责声明

1,本文(体育统计方法与实例第三章-统计描述课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|