1、第一节 统计资料的收集一、收集资料的基本要求 收集资料的收集资料的基本要求基本要求准确性准确性齐同性齐同性随机性随机性二、收集资料的方法收集资料收集资料的方法的方法日常积累日常积累全面普查全面普查专题研究专题研究三、几种常用的抽样方法常用的抽样方法常用的抽样方法简单随机抽样简单随机抽样分层抽样分层抽样整群抽样整群抽样 1、简单随机抽样(完全随机抽样):在总体中不加任何分组、分类、排队等,完全随机地抽取研究个体,每个个体被抽中的机会均等。A.抽签法。B.随机数表法:先将总体中的各个个体进行编号,后用随机数表(见附表9)决定抽定的个体进行测试或登记,形成样本资料的方法。n例:为研究湖北师范学院体育
2、系球类专选学生(100人)与田径专选学生(120人)在动作反应时上是否存在差异,现需从不同专项学生中各选45名,用随机数表法如何选取样本?2. 分层抽样:先将总体中的个体按某种属性分成若干类型、部分或层,然后在各类型、部分或层中按比例按比例进行简单随机抽样组成研究样本的方法。分类形式常有性别、年龄、民族等。例:为研究体育系学生学习态度,已知体育系500人,男生280人,女生220人,需抽取100人作为研究样本,用分层抽样法如何抽取样本?3. 整群抽样:在总体中先划分群,以群为抽样单位,再按简单随机抽样抽出若干群组成样本。该方法适应于大规模的抽样研究。 划分群时尽量使群之间的差异小,而划分群时尽
3、量使群之间的差异小,而群内个体间的差异大些,以提高样本代表群内个体间的差异大些,以提高样本代表性。性。思考题: 为了解我国在校大学生的身体素质状况,需要从大约1700万大学生中抽取5000名大学生作为研究样本,如何抽取该样本?一、资料的审核一、资料的审核 审核资料的准确性和完整性。 一般分为初审、逻辑检查和复核初审、逻辑检查和复核三步。第二节 统计资料的整理二、频数整理二、频数整理:将数据资料按一定顺序分成若干组,并数出各组中所含有的数据个数(频数) ,制成频数分布表或图。频数分布表的制作步骤:n求极差(或全距)R:R=最大值(Xmax)-最小值(Xmin)n确定分组数 分组数要依样本含量的n
4、的大小确定。表1给出了前苏联H.A.马萨利金设计的分组方法:表表1 分组参考表分组参考表样本含量(n)分组数(k)30-6060-100100-200200-5005-87-109-1211-15n确定组距(确定组距(I I)与组限值()与组限值(L L) 组距:组与组之间的区间长度,可事先规定,也可用计算的方法确定。计算公式为: I=极差/分组数=R/k 组限:组区间的界限。 第一组的下限(L1)=Xmin-I 第i组的下限(Li)=Li-1+ In列频数分布表列频数分布表 表格形式如下所示:组序号 组限划记频数组中值累计频数数据X的归属原则: 本组下限X次组下限组中值的求法:组中值=各组下
5、限值+组距 或组中值=(该组下限+该组上限)累计频数为从第一组开始将各组频数累加而成。 例1:有50名学生的1500成绩(单位:s)如下,试进行频数处理。319 357 309 350 344 324 386 343 357 348332 365 378 376 353 360 320 329 340 328 330 340 351 337 335 339 345 342 360 360 360 368 324 342 328 310 315 318 301 321 340 359 333 312 309 299 344 355 322 333整理步骤:1.求极差R=最大值-最小值=386-2
6、99=87 s2.确定分组数本例n=50,参考分组表,可取k=73.确定组距与组限值 组距(I)=R/k=87/7=12.4312 s 第一组下限(L1)=Xmin- I=299-6=2934.列频数分布表并划记。 整理出的频数分布表见表2。组序号组序号组限组限划记划记频数频数组中值组中值(f)累计频数累计频数(C)12345678293305317329341353365377 2591199322993113233353473593713832716273645485050表表2 频数分布表频数分布表试对以下数据进行频数处理。66 89 88 84 86 87 75 73 72 68 97
7、 58 81 54 79 76 95 76 71 60 90 76 85 89 92 64 57 83 81 78 77 72 61 70 81 75 82 65 76 7280 81 79 65 70 78 69 77 74 70 三、直方图与多边形图 画直方图时,将频数绘制在纵坐标上,组限绘制在横坐标上,根据各组的频数画出代表各组频数的直方图。 将例1中的数据绘成频数分布直方图(见图1)。 频数分布多边形图是将每组频数与各组的组中值所确定的线段相连而成(见图1虚线部分)。频数分布直方图和多边形图:S 本章重点:本章重点:n 常用的抽样方法 简单随机抽样(抽签法、随机数表法)、分层抽样、整群抽样。n频数分布表的制作步骤 求极差、确定分组数、确定组距与组限值、列频数分布表(直方图或多边形图)。作业:1.P19,习题4。2.对本宿舍或班级同学的相关情况(出生年月、籍贯、身高、体重等)进行调查统计,结果以直方图的形式表示。以最小值为第一组下限以最小值减1/2组距为第一组下限以最小值为第一组下限学生1500m成绩频数分布图和正态曲线以最小值减1/2组距为第一组下限学生1500m成绩频数分布图和正态曲线