统计学第二章统计数据的描述课件.ppt

上传人(卖家):晟晟文业 文档编号:4928515 上传时间:2023-01-26 格式:PPT 页数:163 大小:1.51MB
下载 相关 举报
统计学第二章统计数据的描述课件.ppt_第1页
第1页 / 共163页
统计学第二章统计数据的描述课件.ppt_第2页
第2页 / 共163页
统计学第二章统计数据的描述课件.ppt_第3页
第3页 / 共163页
统计学第二章统计数据的描述课件.ppt_第4页
第4页 / 共163页
统计学第二章统计数据的描述课件.ppt_第5页
第5页 / 共163页
点击查看更多>>
资源描述

1、精品1统计先是思维而后才是数学统计先是思维而后才是数学 第二章第二章 统计数据的描述统计数据的描述 精品2统计先是思维而后才是数学统计先是思维而后才是数学 n第一节第一节 统计数据的整理统计数据的整理n第二节第二节 分布集中趋势的测度分布集中趋势的测度n第三节第三节 分布离散程度的测度分布离散程度的测度n第四节第四节 分布偏态与峰度的测度分布偏态与峰度的测度n第五节第五节 统计表和统计图统计表和统计图精品3统计先是思维而后才是数学统计先是思维而后才是数学 学习目标学习目标n掌握数据的整理方法掌握数据的整理方法n掌握集中、离散趋势的测度掌握集中、离散趋势的测度n掌握偏态峰度的测度掌握偏态峰度的测

2、度n掌握统计表和统计图的制作与使掌握统计表和统计图的制作与使用用精品4统计先是思维而后才是数学统计先是思维而后才是数学 录取中有无歧视?录取中有无歧视?n某高校两个系(财经系、工程系)的报考及录取某高校两个系(财经系、工程系)的报考及录取情况情况男生男生女生女生录取录取350200未录取未录取450400报考人数报考人数800600 录取比率:录取比率:男生:男生:350/800=44%女生:女生:200/600=33%男生成绩好男生成绩好?性别歧视性别歧视?精品5统计先是思维而后才是数学统计先是思维而后才是数学 两个系的报考及录取情况两个系的报考及录取情况工程系工程系财经系财经系男生男生女生

3、女生男生男生女生女生录取录取30010050100未录取未录取300100150300报考人数报考人数600200200400工程系:男女录取比率工程系:男女录取比率50%,财经系:男女录取比率,财经系:男女录取比率25%。说明的问题:对数据说明的问题:对数据 1.1.要从不同的角度进行分析;要从不同的角度进行分析;2.2.要注意结构或是权数的影响。要注意结构或是权数的影响。精品6统计先是思维而后才是数学统计先是思维而后才是数学 2.1 统计数据的整理统计数据的整理精品7统计先是思维而后才是数学统计先是思维而后才是数学 统计整理统计整理或已经加工或已经加工的综合资料的综合资料使数据系统化、条理

4、化,反映事物的总体特使数据系统化、条理化,反映事物的总体特征,并在建立数据库的基础上达到一源多用征,并在建立数据库的基础上达到一源多用统计整理的概念和作用统计整理的概念和作用精品8统计先是思维而后才是数学统计先是思维而后才是数学 统计整理的步骤统计整理的步骤精品9统计先是思维而后才是数学统计先是思维而后才是数学 数据的审核数据的审核n对原始数据的审核的内容对原始数据的审核的内容n完整性审核完整性审核n准确性审核准确性审核n对第对第2手数据的审核的内容手数据的审核的内容n完整性审核完整性审核n准确性审核准确性审核n时效性时效性n适用性适用性精品10统计先是思维而后才是数学统计先是思维而后才是数学

5、 数据的排序数据的排序(data rank)n按一定顺序将数据排列,以发现一些明显的特征或趋按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索势,找到解决问题的线索n排序有助于对数据检查纠错,以及为重新归类或分组排序有助于对数据检查纠错,以及为重新归类或分组等提供依据等提供依据n在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一n排序可借助于计算机完成排序可借助于计算机完成精品11统计先是思维而后才是数学统计先是思维而后才是数学 世界人均国民总收入世界人均国民总收入nhttp:/ 2.1.1 统计数据的分组统计数据的分组精品13统计先是思维而后才是数

6、学统计先是思维而后才是数学 统计分组的基本原则统计分组的基本原则:必须保证在某一标志上,必须保证在某一标志上,组内的同质性和组组内的同质性和组间的差异性间的差异性。分组兼有分组兼有“分和合分和合”双重含义双重含义 一、统计分组的概念和作用一、统计分组的概念和作用精品14统计先是思维而后才是数学统计先是思维而后才是数学 分组分组253342精品15统计先是思维而后才是数学统计先是思维而后才是数学 统计分组的关键:统计分组的关键:1、选择分组标志、选择分组标志:品质标志(性别、质量等)品质标志(性别、质量等)数量标志(数量、数值等)数量标志(数量、数值等)2、划分各组界限、划分各组界限二、分组标志

7、的选择与分组种类二、分组标志的选择与分组种类精品16统计先是思维而后才是数学统计先是思维而后才是数学 学生按性别分组学生按性别分组性别性别人数(频数)人数(频数)频率(频率(%)男生男生30306060女生女生20204040合计合计5050100100按品质标志分组按品质标志分组精品17统计先是思维而后才是数学统计先是思维而后才是数学 某班学生按考试成绩分组某班学生按考试成绩分组按考试成绩分组按考试成绩分组人数人数频率频率%优优510良良1020中中2040及格及格1020不及格不及格510合计合计50100精品18统计先是思维而后才是数学统计先是思维而后才是数学 按数量标志分组按数量标志分

8、组年龄年龄人数人数频率频率%191230201537.5211332.5合计合计40100某班学生按年龄频数分布某班学生按年龄频数分布精品19统计先是思维而后才是数学统计先是思维而后才是数学 2.1.2 次数分配次数分配精品20统计先是思维而后才是数学统计先是思维而后才是数学 次数分配次数分配是将总体按一定的标志分组,说明是将总体按一定的标志分组,说明个体在各组之间的分布情况。是统计资料整理结个体在各组之间的分布情况。是统计资料整理结果的一种重要表现。果的一种重要表现。n次数分配次数分配:也称次数(频数)分布。:也称次数(频数)分布。n次数分配组成要素次数分配组成要素:1、组的名称、组的名称

9、2、各组次数(也称频数)或频率、各组次数(也称频数)或频率精品21统计先是思维而后才是数学统计先是思维而后才是数学 分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组组距分组组距分组精品22统计先是思维而后才是数学统计先是思维而后才是数学 单变量值分组单变量值分组(要点)(要点)1.将一个变量值作为一组将一个变量值作为一组2.适合于离散变量适合于离散变量3.适合于变量值较少的情况适合于变量值较少的情况精品23统计先是思维而后才是数学统计先是思维而后才是数学 例题分析例题分析精品24统计先是思维而后才是数学统计先是思维而后才是数学 单变量值分组表单变量值分组表(实例)(实例

10、)表表 某车间某车间30名工人周加工零件数分组表名工人周加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)8485889194959611121119799 10110310510610711213421091101111181191211281121111变量值变量值精品25统计先是思维而后才是数学统计先是思维而后才是数学 组距分组(要点)组距分组(要点)n将变量值的一个区间作为一组将变量值的一个区间作为一组n适合于连续变量适合于连续变量n适合于变量值较多的情况适合于变量值较多的情况n必须遵循必须遵循“不重不漏不重不漏

11、”的原则(上的原则(上组限值不算在该组内)组限值不算在该组内)n可采用等距分组,也可采用不等距可采用等距分组,也可采用不等距分组分组精品26统计先是思维而后才是数学统计先是思维而后才是数学 工人按月工资额分组工人按月工资额分组(元)(元)工人数工人数(频数)(频数)频率频率%6007004010700800100258009001203090010008020100011006015合计合计400100等距分组等距分组 l各组的组距相等各组的组距相等 l各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响l可直接根据绝对频数来观察频数分布的特征和规律可直接根据绝对频数来观察频数分布

12、的特征和规律精品27统计先是思维而后才是数学统计先是思维而后才是数学 不等距分组不等距分组l各组的组距是不相等各组的组距是不相等 l各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响年龄阶段年龄阶段男性男性 女性女性婴幼儿婴幼儿0-60-6少年儿童少年儿童7-177-17中青年中青年18-5918-54老年老年60岁以上岁以上55岁以上岁以上精品28统计先是思维而后才是数学统计先是思维而后才是数学 等距分组步骤等距分组步骤1)确定组数确定组数:组数的确定应以能够显示数据的分布特:组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,组数不应少于征和规律为目的。一般情况

13、下,组数不应少于5组,组,也不应多于也不应多于15组。组。在实际分组时,可以按在实际分组时,可以按 Sturges 提出的经验公式来提出的经验公式来确定组数确定组数K(四舍五入取整)(四舍五入取整)2lglg1nK例如例如2-12-1的数据:的数据:62lg30lg1K精品29统计先是思维而后才是数学统计先是思维而后才是数学 例例2.1的数据,最大值为的数据,最大值为128,最小值为,最小值为84,则,则 组距组距(128-84)/67.3。组距宜取组距宜取5或或10的倍数的倍数;(近似值);(近似值)在实践中,组数和组距要通过反复的实验确定,在实践中,组数和组距要通过反复的实验确定,最终确定

14、出最有意义的组数和组距的组合。最终确定出最有意义的组数和组距的组合。精品30统计先是思维而后才是数学统计先是思维而后才是数学 3)确定组限确定组限:组限是分组的数量界限,是表明每组界限:组限是分组的数量界限,是表明每组界限的两头数值。的两头数值。下下 限限(low limit):一个组的最小值:一个组的最小值 上上 限限(upper limit):一个组的最大值:一个组的最大值组限的具体形式有组限的具体形式有:重合组限和间断组限;闭口组限和:重合组限和间断组限;闭口组限和开口组限。开口组限。确定组限的原则确定组限的原则1:最小一组的下限必须包含数列中最小:最小一组的下限必须包含数列中最小变量值

15、;最大组的上限必须包含数列中最大变量值。变量值;最大组的上限必须包含数列中最大变量值。确定组限的原则确定组限的原则2:遵循不重不漏的原则。:遵循不重不漏的原则。“不重不重”是指一项数据只能分在其中的某一组,不能是指一项数据只能分在其中的某一组,不能在其他组中重复出现;在其他组中重复出现;“不漏不漏”在所分的全部组别中每项数据都能分在其中在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。的某一组,不能遗漏。精品31统计先是思维而后才是数学统计先是思维而后才是数学 4)根据分组计算频数,整理成频数分布表根据分组计算频数,整理成频数分布表:将原始数据:将原始数据按照各自的大小分配到各组中。按

16、照各自的大小分配到各组中。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)频率(频率(%)809031090100723.331001101343.33110120516.6712013026.67合计合计30100本例可以得到如下频数分布表本例可以得到如下频数分布表重合组限、闭口组限重合组限、闭口组限精品32统计先是思维而后才是数学统计先是思维而后才是数学 对于重合组限的形式,为解决对于重合组限的形式,为解决“不重不重”的问题,统计分组时习惯上规定的问题,统计分组时习惯上规定“上组限上组限不在内不在内”,即当相邻两组的上下限重叠时,即当相邻两组的上下限重叠时,恰好等于其一组上限的

17、变量值不算在本组恰好等于其一组上限的变量值不算在本组内,而计算在下一组内。内,而计算在下一组内。重合组限既适用于连续型变量分组也适重合组限既适用于连续型变量分组也适用于离散型变量分组,应用非常广泛。用于离散型变量分组,应用非常广泛。精品33统计先是思维而后才是数学统计先是思维而后才是数学 对于离散变量,可以采用相邻两组组限间断的办法对于离散变量,可以采用相邻两组组限间断的办法(间断组限)解决(间断组限)解决“不重不重”的问题。的问题。按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80893909971001091311011951201292合计合计30精品34统计先是思维而后才

18、是数学统计先是思维而后才是数学 n如果全部数据中的最大值和最小值与其他数如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组或个别极端据相差悬殊,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采取值被漏掉,第一组和最后一组可以采取“x x以下以下”及及“x x以上以上”这样的开口组。这样的开口组。n开口组通常以相邻组的组距作为其组距。开口组通常以相邻组的组距作为其组距。n例如,在例例如,在例21的的30个数据中,假定将最小个数据中,假定将最小值改为值改为64,最大值改为,最大值改为160,采用上面的分组,采用上面的分组就会出现就会出现“空白组空白组”,这时可采用,这时可

19、采用“开口开口组组”,如,如80以下;以下;130以上。以上。开口组限:缺少上限或者下限的组限设置。开口组限:缺少上限或者下限的组限设置。精品35统计先是思维而后才是数学统计先是思维而后才是数学 按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)80以下以下1809029010071001101311012051201301130以上以上1合计合计30开口组开口组精品36统计先是思维而后才是数学统计先是思维而后才是数学 编制频数分布表的步骤编制频数分布表的步骤精品37统计先是思维而后才是数学统计先是思维而后才是数学 在研究分析次数分布时,还需要计算:累计频在研究分析次数分布时,还需要

20、计算:累计频数和累计频率数和累计频率1.1.累计频数:将各类别的频数逐级累加。累计频数:将各类别的频数逐级累加。有两种方法:有两种方法:一是可以从最小组一方向最大组的一方累加一是可以从最小组一方向最大组的一方累加频数,称为向上累积;频数,称为向上累积;二是可以从最大组的一方向最小组的一方累二是可以从最大组的一方向最小组的一方累加频数,称为向下累积。加频数,称为向下累积。n累计频率:将各类别的频率累计频率:将各类别的频率(百分比百分比)逐级累加逐级累加精品38统计先是思维而后才是数学统计先是思维而后才是数学 表表 某车间工人某车间工人周零件数的频数分布表周零件数的频数分布表按按周加工周加工零件数

21、零件数分组分组人数人数(次数次数)频率频率(%)向下累积向下累积 向上累积向上累积 累计累计频数频数(次数)(次数)累计累计频率频率(%)累计累计频数频数(次数次数)累计累计频率频率(%)80-90 90-100 100-110 110-120 120-1303713521023.3343.3316.676.673 102328301033.3376.6693.33100302720721009066.6723.346.67合计合计30100.0例:累计频数和累计频率的计算例:累计频数和累计频率的计算精品39统计先是思维而后才是数学统计先是思维而后才是数学 在根据组距数列进行统计计算时,需要确

22、定组中在根据组距数列进行统计计算时,需要确定组中值,作为各组变量值的代表值。值,作为各组变量值的代表值。组中值组中值(class midpoint):下限与上限之间的中点值。:下限与上限之间的中点值。概念:组中值概念:组中值n组中值这种代表有一个必要的假定条件,即各组数据在本组中值这种代表有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。组内呈均匀分布或在组距中值两侧呈对称分布。n如实际数据的分布不符合这一假定,用组中值作为一组数如实际数据的分布不符合这一假定,用组中值作为一组数据的代表值会有一定的误差。据的代表值会有一定的误差。精品40统计先是思维而后才是数学统计

23、先是思维而后才是数学 例:组中值计算例:组中值计算按周加工零件数按周加工零件数分组分组组中值组中值次数次数(频数)(频数)频率(频率(%)8090853109010095723.331001101051343.33110120115516.6712013012526.67合计合计30100精品41统计先是思维而后才是数学统计先是思维而后才是数学 在开口组中,组中值的计算以邻近组组距为依据在开口组中,组中值的计算以邻近组组距为依据22邻邻近近组组组组距距下下限限缺缺上上限限的的开开口口组组组组中中值值邻邻近近组组组组距距上上限限缺缺下下限限的的开开口口组组组组中中值值 可见,开口组的组中值既假定

24、变量值是均匀分可见,开口组的组中值既假定变量值是均匀分布或对称分布,又假定组距与邻近组组距相等。布或对称分布,又假定组距与邻近组组距相等。精品42统计先是思维而后才是数学统计先是思维而后才是数学 例:组中值计算例:组中值计算按周加工零件数按周加工零件数分组分组组中值组中值次数次数(频数)(频数)频率(频率(%)80以下以下7513.3380908526.679010095723.331001101051343.33110120115516.6712013012513.33130以上以上13513.33合计合计30100精品次数分配表的编制(例题分析)精品使用Excel频数函数(FREQUENC

25、Y)使用使用Excel中的统计函数中的统计函数“FREQUENCY”来创建频来创建频数分布表和直方图,可解决这一问题。创建频数分数分布表和直方图,可解决这一问题。创建频数分布表的步骤是布表的步骤是选择与接受区域相临近的单元格区域,作为频数分布表选择与接受区域相临近的单元格区域,作为频数分布表输出的区域输出的区域选择统计函数中的选择统计函数中的“FREQUENCY”函数函数在对话框在对话框Date-array后输入数据区域,在后输入数据区域,在Bins-array后输后输入各组分界点入各组分界点同时按下同时按下ctrl-shift-Enter组合键,即得到频数分布组合键,即得到频数分布精品次数分

26、配表按周加工零件数分组按周加工零件数分组次数(频数)次数(频数)809039010071001101411012041201302合计合计30精品46统计先是思维而后才是数学统计先是思维而后才是数学 2.1.3 次数分配直方图次数分配直方图精品47统计先是思维而后才是数学统计先是思维而后才是数学 1.直方图直方图n用矩形的宽度和高度来表示频数分布的图形,用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的实际上是用矩形的面积面积来表示各组的频数分布来表示各组的频数分布n在直角坐标中,用在直角坐标中,用横轴表示数据分组横轴表示数据分组,纵轴表纵轴表示频数或频率示频数或频率,各组与相应的频数就

27、形成了一,各组与相应的频数就形成了一个矩形,即直方图个矩形,即直方图(Histogram)n直方图下的总面积等于直方图下的总面积等于1精品48统计先是思维而后才是数学统计先是思维而后才是数学 分组数据的图示分组数据的图示(直方图的绘制直方图的绘制)809010011012013004812高度表示每一组的频数或高度表示每一组的频数或百分比,宽度则表示各组百分比,宽度则表示各组的组距,的组距,横轴标注的刻度横轴标注的刻度应该是连续区间应该是连续区间精品49统计先是思维而后才是数学统计先是思维而后才是数学 2.折线图折线图n折线图也称频数多边形图折线图也称频数多边形图n是在直方图的基础上,把直方图

28、顶部的中点是在直方图的基础上,把直方图顶部的中点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉n折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的所表示的频数分布是一致的精品50统计先是思维而

29、后才是数学统计先是思维而后才是数学 分组数据的图示分组数据的图示(折线图的绘制折线图的绘制)折线图与直方图下的面积相等!809010011012013004812精品51统计先是思维而后才是数学统计先是思维而后才是数学 3.次数分布曲线次数分布曲线当对数据所分的组数很多时,组距会越来越当对数据所分的组数很多时,组距会越来越小,这时所绘制的折线图就会越来越光滑,小,这时所绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频数分布逐渐形成一条平滑的曲线,这就是频数分布曲线。曲线。精品52统计先是思维而后才是数学统计先是思维而后才是数学 频数分布曲线的类型频数分布曲线的类型精品53统计先是思

30、维而后才是数学统计先是思维而后才是数学 2.1.4 洛伦兹曲线与基尼系数洛伦兹曲线与基尼系数精品54统计先是思维而后才是数学统计先是思维而后才是数学 洛伦茨曲线(累积次数分配折线图)洛伦茨曲线(累积次数分配折线图)20世纪初美国经济学家、统计学家洛伦茨世纪初美国经济学家、统计学家洛伦茨(M.E.Lorentz)根据意大利经济学家帕累托根据意大利经济学家帕累托(V.Pareto)提出的收入分配公式绘制而成的。提出的收入分配公式绘制而成的。是描述收入和财富分配性质的曲线,分析该是描述收入和财富分配性质的曲线,分析该国家或地区分配的平均程度国家或地区分配的平均程度 AB累积的人口百分比累积的人口百分

31、比 累积的收入百分比累积的收入百分比 绝对公平线绝对公平线 洛伦茨曲线洛伦茨曲线精品55统计先是思维而后才是数学统计先是思维而后才是数学 基尼系数基尼系数 n20世纪初意大利经济学家基尼世纪初意大利经济学家基尼(G.Gini)根据洛伦茨曲线给出了衡量根据洛伦茨曲线给出了衡量收入分配平均程度的指标收入分配平均程度的指标nA表示实际收入曲线与绝对平均线之间的面积表示实际收入曲线与绝对平均线之间的面积nB表示实际收入曲线与绝对不平均线之间的面积表示实际收入曲线与绝对不平均线之间的面积n如果如果A=0,则基尼系数,则基尼系数=0,表示收入绝对平均,表示收入绝对平均n如果如果B=0,则基尼系数,则基尼系

32、数=1,表示收入绝对不平均,表示收入绝对不平均n基尼系数在基尼系数在0 和和1之间取值之间取值n一般认为:一般认为:基尼系数若小于基尼系数若小于0.2,表明分配平均;,表明分配平均;基尼系数在基尼系数在0.2至至0.4之间是比较适当的,即一个社会既有效率之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;又没有造成极大的分配不公;基尼系数在基尼系数在0.4被认为是收入分配不公平的警戒线,超过了被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。应该采取措施缩小这一差距。ABBAA基尼系数精品56统计先是思维而后才是数学统计先是思维而后才是数学 2.2 分布集中趋势的

33、测度分布集中趋势的测度 精品57统计先是思维而后才是数学统计先是思维而后才是数学 数据集中区数据集中区变量变量xx 集中趋势是指一组数据向某一中心值集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值据一般水平的代表值或中心值精品58统计先是思维而后才是数学统计先是思维而后才是数学 n一、众数一、众数n二、中位数二、中位数n三、四分位数三、四分位数n四、均值四、均值n五、几何均值五、几何均值n六、切尾均值六、切尾均值n七、众数、中位数和均值的比较七、众数、中位数和均值的比较精品59统计先是思维而后才是数学统计先是思维

34、而后才是数学 1.1.概概念:在总体中出现次数最多的那个标志值就是众数。念:在总体中出现次数最多的那个标志值就是众数。2.2.1 众数众数 M0从分布的角度看,众数是具有明显集中趋势点的数值,从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。一组数据分布的最高峰点所对应的数值即为众数。例如:集市上某种蔬菜的成交价格(元)为:例如:集市上某种蔬菜的成交价格(元)为:0.8,0.9,0.9,1.0,1.2,1.2,1.2,1.2,1.5,1.5,1.6 1.2元出现次数最多,就是众数元出现次数最多,就是众数精品60统计先是思维而后才是数学统计先是思维而后才

35、是数学 众数众数无众数无众数众数众数 1 1众数众数2 2一组数据可能没有众数或有几个众数(不唯一性)一组数据可能没有众数或有几个众数(不唯一性)精品61统计先是思维而后才是数学统计先是思维而后才是数学 M0M0M0M0M0若有两个次数相等的众数,则称复众数。若有两个次数相等的众数,则称复众数。只有总体单位数比较多,而且又有明显的集中趋势时才只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。存在众数。由定义可看出众数存在的条件:由定义可看出众数存在的条件:精品62统计先是思维而后才是数学统计先是思维而后才是数学 下三图无众数:下三图无众数:在单位数很少,或单位数虽多但无明显集中趋势时,

36、在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。计算众数是没有意义的。精品63统计先是思维而后才是数学统计先是思维而后才是数学 1)定类数据的众数)定类数据的众数 表表1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(频数频数)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100众数众数=商品广告商品

37、广告 对定序数据同样对定序数据同样2 2.众数的计算方法众数的计算方法精品64统计先是思维而后才是数学统计先是思维而后才是数学 2)定序数据的众数)定序数据的众数某城市家庭对住房状况评价的频数分布某城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0精品65统计先是思维而后才是数学统计先是思维而后才是数学 根据单项数列确定众数;根据单项数列确定众数;价格价格(元元)销售数量销售数量(千克千克)2.00 2

38、02.40 603.001404.00 80合计合计300某种商品的价格情况某种商品的价格情况众数众数 M0=3.00(元元)例例0M3)数值数据的众数)数值数据的众数精品66统计先是思维而后才是数学统计先是思维而后才是数学 根据组距数列确定众数根据组距数列确定众数iLM 2110 利利用比例插值法推算众数的近似值。用比例插值法推算众数的近似值。由由最多次数来确定众数所在组;最多次数来确定众数所在组;12众数众数Lin其中:其中:L 众数组的下限众数组的下限;n 1 众数组与前一组的频数之差众数组与前一组的频数之差n 2 众数组与后一组的频数之差众数组与后一组的频数之差n i 众数组的组距众数

39、组的组距精品67统计先是思维而后才是数学统计先是思维而后才是数学 按周加工零件数分组按周加工零件数分组工人人数工人人数(人人)80-903 90-1007 100-11013 110-1205 120-1302 表中表中100-110,即众数所在组。,即众数所在组。例例精品68统计先是思维而后才是数学统计先是思维而后才是数学 解:众数组是解:众数组是“100-110”的组,则的组,则分组分组 各组频数各组频数 8 80 0-9090 3 3 9090-100100 7 7 100100-110110 1313 110110-120120 5 5 120120-130130 2 2 iLM 21

40、1010)513()713(713100 29.104 精品69统计先是思维而后才是数学统计先是思维而后才是数学 众数的特点众数的特点:n集中趋势的测度值之一集中趋势的测度值之一n出现次数最多的变量值出现次数最多的变量值n众数是位置代表值,不受极端值的影响众数是位置代表值,不受极端值的影响n可能没有众数或几个众数可能没有众数或几个众数n适用于定类数据、定序数据、定量数据适用于定类数据、定序数据、定量数据众数所体现的统计思想是:众数所体现的统计思想是:n 在一组数据的中心点附近,变量值出现的频数较在一组数据的中心点附近,变量值出现的频数较高,根据众数组及相邻两组的频数分布,确定中心高,根据众数组

41、及相邻两组的频数分布,确定中心点的位置。点的位置。精品70统计先是思维而后才是数学统计先是思维而后才是数学 n在某些情况下,众数是一个较好的代表值。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。的是最普遍的尺寸而不是平均尺寸。n又如,当要了解大多数家庭的收入状况时,又如,当要了解大多数家庭的收入状况时,也要用到众数。也要用到众数。例:买菜例:买菜;n适合于数据量较多时使用适合于数据量较多时使用n 众数值偏离众数组组中值得程度越大

42、,分布众数值偏离众数组组中值得程度越大,分布的形状越偏的形状越偏精品71统计先是思维而后才是数学统计先是思维而后才是数学 1.1.概概念:念:将总体中各单位标志值按大小顺序排列,将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。居于中间位置的那个标志值就是中位数。2.2.2 中位数中位数 Me精品72统计先是思维而后才是数学统计先是思维而后才是数学 1)定序数据的中位数)定序数据的中位数回答类别回答类别频数频数(户户)向上向上累积累积非常不满意非常不满意24242424不满意不满意108108132132一般一般9393225225满意满意4545270270非常满意非常

43、满意3030300300合计合计3003002n 中位数位置中位数位置对于定序数据,确定中位对于定序数据,确定中位数位置用:数位置用:l中位数位置中位数位置=300/2=150=300/2=150l中位数中位数=一般一般;2.中位数的计算方法中位数的计算方法精品73统计先是思维而后才是数学统计先是思维而后才是数学 由未分组资料计算中位数由未分组资料计算中位数(a)先对数据进行排序)先对数据进行排序(b)确定中位数的位置,其公式为)确定中位数的位置,其公式为:(n为数据的个数)为数据的个数)21n中位数位置中位数位置(c)最后确定中位数的具体数值)最后确定中位数的具体数值21neXM当当n为偶数

44、时,为偶数时,)(21122nneXXM当当n为奇数时,为奇数时,2)数值数据的中位数)数值数据的中位数精品74统计先是思维而后才是数学统计先是思维而后才是数学 n 9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排序排序:750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9521921n位置位置例例精品75统计先是思维而后才是数学统计先是思维而后才是数学 n 10个家庭的人均月收入数据个家庭的人均月收入数据排序排序:660 7

45、50 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 5.5211021n位置位置102021080960中位数中位数例例精品76统计先是思维而后才是数学统计先是思维而后才是数学 由分组数据确定中位数由分组数据确定中位数 按日产量分组按日产量分组(千克千克)工人数工人数(人人)向上累计向上累计向下累计向下累计 50 60 10 10164 60 70 19 29154 70 80 50 79135 80 90 36115 85 90100 27142 49 100-110 14156 22 110以上以上 8164 8

46、合计合计164-组距内。组距内。即中位数在即中位数在中位数位置中位数位置90808221642 fna)要先根据公式:)要先根据公式:f/2,确定中位数的位置,并确,确定中位数的位置,并确定中位数所在的组。定中位数所在的组。f 总次数总次数精品77统计先是思维而后才是数学统计先是思维而后才是数学 b)然后采用下面的公式计算中位数的近似值:)然后采用下面的公式计算中位数的近似值:ifSfLMmme12式中:式中:f 为数据的个数,为数据的个数,L为中位数所在组的下限,为中位数所在组的下限,Sm-1为中位数所在组以前各组的累积频数,为中位数所在组以前各组的累积频数,fm为中位数所在组为中位数所在组

47、的频数,的频数,i为中位数所在组的组距为中位数所在组的组距。)(83.8010367921648021千克千克 ifSfLMmme例例精品78统计先是思维而后才是数学统计先是思维而后才是数学 中位数是一种位置平均数,它也不受极端值中位数是一种位置平均数,它也不受极端值 及开口组的影响,具有稳健性。及开口组的影响,具有稳健性。各单位标志值与中位数离差的绝对值之和是个各单位标志值与中位数离差的绝对值之和是个 最小值。最小值。对某些不具有数学特点或不能用数字测定的现对某些不具有数学特点或不能用数字测定的现 象,可以用中位数求其一般水平。象,可以用中位数求其一般水平。minmin即即:或或eeXMXM

48、 f3.3.中中位数的特点位数的特点精品79统计先是思维而后才是数学统计先是思维而后才是数学 2.2.3 四分位数四分位数(quartile)n 四分位数是通过三个点将全部数据等分为四部分,四分位数是通过三个点将全部数据等分为四部分,其中每部分包含其中每部分包含25%的数据。的数据。n l很显然,中间的四分位数就是中位数。很显然,中间的四分位数就是中位数。l排序后处于排序后处于25%和和75%位置上的值,即通常说位置上的值,即通常说的第一个四分位数(下四分位数);第三个四分的第一个四分位数(下四分位数);第三个四分位数(上四分位数)。位数(上四分位数)。精品80统计先是思维而后才是数学统计先是

49、思维而后才是数学 特点:特点:精品81统计先是思维而后才是数学统计先是思维而后才是数学 定序数据四分位数定序数据四分位数(位置的确定位置的确定)434ULnQnQ位置位置位置位置精品82统计先是思维而后才是数学统计先是思维而后才是数学 定序数据的四分位数定序数据的四分位数 (例题分析例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300精品83统计先是思维而后才是

50、数学统计先是思维而后才是数学 1.未分组四分位数未分组四分位数 4)1(341ULnQnQ位置位置位置位置 当四分位数的位置不在某一个数值上,按比当四分位数的位置不在某一个数值上,按比例分摊位置两侧数值的差值。例分摊位置两侧数值的差值。先排序;然后确定四分位数的位置先排序;然后确定四分位数的位置数量数据四分位数数量数据四分位数精品84统计先是思维而后才是数学统计先是思维而后才是数学 例:数量数据的四分位数例:数量数据的四分位数(9(9个数据的算例个数据的算例)n【例例】:9 9个家庭的人均月收入数据个家庭的人均月收入数据n原始数据原始数据:1500 750 780 1080 850 960 2

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学第二章统计数据的描述课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|