第一节-数据的分类和整理课件.ppt

上传人(卖家):三亚风情 文档编号:2272246 上传时间:2022-03-28 格式:PPT 页数:38 大小:2.03MB
下载 相关 举报
第一节-数据的分类和整理课件.ppt_第1页
第1页 / 共38页
第一节-数据的分类和整理课件.ppt_第2页
第2页 / 共38页
第一节-数据的分类和整理课件.ppt_第3页
第3页 / 共38页
第一节-数据的分类和整理课件.ppt_第4页
第4页 / 共38页
第一节-数据的分类和整理课件.ppt_第5页
第5页 / 共38页
点击查看更多>>
资源描述

1、第二章数据的整理与统计描述第二章数据的整理与统计描述第一节数据分类和整理第一节数据分类和整理第二节数据分布的统计特征描述第二节数据分布的统计特征描述第三节统计图表第三节统计图表数据数据也称资料,是对客观现象计量的结果。也称资料,是对客观现象计量的结果。一、数据的分类一、数据的分类 统计数据统计数据是利用统计方法进行分析的基础,是利用统计方法进行分析的基础,不同的统计数据应采用不同的统计分析方法。不同的统计数据应采用不同的统计分析方法。第一节数据分类和整理第一节数据分类和整理定类数据定类数据定序定序数据数据离散离散数据数据连续连续数据数据数据数据类型类型定性定性数据数据定量定量数据数据( (例例

2、: :性别、民族性别、民族) )( (例例: :产品等级产品等级) )( (例例: :家庭人口家庭人口) )( (例例: :体重、温度体重、温度) )1 1、数据的类型、数据的类型定性数据定性数据 定性数据定性数据也称品质数据,是观察或实验也称品质数据,是观察或实验结果不可以用数值大小表示只能用文字描述结果不可以用数值大小表示只能用文字描述的数据资料,一般不带有度量衡单位。的数据资料,一般不带有度量衡单位。特点:特点:每个观察结果或实验结果之间没有量的每个观察结果或实验结果之间没有量的大小区别,表现为互不相容的类别或属性。大小区别,表现为互不相容的类别或属性。 根据观察结果是否有等级或顺序,将

3、定性根据观察结果是否有等级或顺序,将定性数据分为数据分为定类数据定类数据和和定序数据定序数据两类。两类。 定类数据也称名义数据、计数数据:是对事物按照定类数据也称名义数据、计数数据:是对事物按照其属性进行分类或分组的计量结果,其数据表现为其属性进行分类或分组的计量结果,其数据表现为文字文字型型的的无序无序类别,可以进行每一类别出现频数的计算,没类别,可以进行每一类别出现频数的计算,没有等级之分,也不能进行加减乘除的数学运算。有等级之分,也不能进行加减乘除的数学运算。(1)(1)定类数据定类数据 例如一个学校的学生按性别分为男、女两类,或按例如一个学校的学生按性别分为男、女两类,或按民族分为汉族

4、和少数民族两类。这种分类把所考察的民族分为汉族和少数民族两类。这种分类把所考察的个体(学生)划分为不同的类型,但各类型之间是平个体(学生)划分为不同的类型,但各类型之间是平行的关系,不能区分优劣或大小。行的关系,不能区分优劣或大小。 定序数据也称有序数据或等级数据。同样是按定序数据也称有序数据或等级数据。同样是按事物属性进行分类或分组,但事物属性进行分类或分组,但可排序可排序。即定序测度不。即定序测度不仅可以划分类型,而且还可以确定这些类别的优劣或仅可以划分类型,而且还可以确定这些类别的优劣或顺序。即其数据表现为顺序。即其数据表现为有序有序类别,可以进行类别的频类别,可以进行类别的频数计算和排

5、序,同样不能进行加减乘除的数学运算。数计算和排序,同样不能进行加减乘除的数学运算。 例如可以把企业信誉分为好、较好、一般和较例如可以把企业信誉分为好、较好、一般和较差四个类别;把某种药物的疗效分为无效、有效、差四个类别;把某种药物的疗效分为无效、有效、显效、痊愈等。显然这些类别具有等级差异,但不显效、痊愈等。显然这些类别具有等级差异,但不能具体测定等级之间差异的大小。能具体测定等级之间差异的大小。(2)(2)定序数据定序数据定量数据定量数据 定量数据定量数据,也称数值数据或计量数据,也称数值数据或计量数据,是观察或实验结果可以用数值大小表示的是观察或实验结果可以用数值大小表示的数据资料,一般带

6、有度量衡单位。数据资料,一般带有度量衡单位。特点:特点:每个观察值或实验值之间有量的大小的每个观察值或实验值之间有量的大小的区别,即可进行频数计算和排序,又可进行加区别,即可进行频数计算和排序,又可进行加减乘除的数学运算。减乘除的数学运算。 例如,收入就有实际的例如,收入就有实际的0作为起点,作为起点,0表示表示没有收入。假如甲收入没有收入。假如甲收入600元,乙收入元,乙收入300元,元,可以说甲比乙多收入可以说甲比乙多收入300元,也可以说甲收入元,也可以说甲收入是乙的两倍。因此,定量测度可以进行加、减、是乙的两倍。因此,定量测度可以进行加、减、乘、除运算。乘、除运算。 根据数据的分布情况

7、,将定量数据分为根据数据的分布情况,将定量数据分为离散型数据离散型数据和和连续型数据连续型数据两类。两类。三种数据的比较三种数据的比较计量测度计量测度数学特性数学特性定类数据定类数据定序数据定序数据定量数据定量数据分类分类排序排序间距间距比值比值注:定量数据与定性数据可相互转换。注:定量数据与定性数据可相互转换。3、两类数据的转换、两类数据的转换(1)定量数据的定性化转换)定量数据的定性化转换(2)定性数据的数量化转换)定性数据的数量化转换例如,作为定量数据的成年男子的血清胆固例如,作为定量数据的成年男子的血清胆固醇值,按是否小于醇值,按是否小于6(mmol/L)划分成血脂)划分成血脂正常和异

8、常两类,就转化为定性数据。正常和异常两类,就转化为定性数据。(1)定量数据的定性化转换)定量数据的定性化转换例如,例如,“1”表示表示“非常同意非常同意”,“2”表示表示“同同意意”, “3”表示表示“保持中立保持中立”,“4”表示表示“不同不同意意”, “5”表示表示“非常不同意非常不同意”。 又如,用又如,用“1”表示表示“男性男性”,“0”表示表示“女女性性”。(2)定性数据的数量化转换)定性数据的数量化转换变量变量用以说明现象的某种用以说明现象的某种属性属性或或特征特征。变变 量量特点:特点:是从一次观察到下一次观察会呈现出是从一次观察到下一次观察会呈现出差别或变化,变量的具体取值称为

9、变量值。差别或变化,变量的具体取值称为变量值。比如,商品销售额可以是比如,商品销售额可以是20万元、万元、30万元、万元、50万元、万元、这些数字就是变量值。这些数字就是变量值。如如“商品销售额商品销售额”、“受教育程度受教育程度”、“产品的质量等级产品的质量等级”等都是变量。等都是变量。2 2、变量及其类型、变量及其类型定类变量定类变量定序变量定序变量离散变量离散变量连续变量连续变量变量类型变量类型定性变量定性变量定量变量定量变量(数值变量)(数值变量)( (例例: :性别、民族性别、民族) )( (例例: :产品等级产品等级) )( (例例: :家庭人口家庭人口) )( (例例: :体重、

10、温度体重、温度) )二、数据资料的统计整理二、数据资料的统计整理 统计工作一般分为统计工作一般分为统计设计统计设计、收集资料收集资料、整理资料整理资料和和分析资料分析资料四个阶段,其中数据资料四个阶段,其中数据资料的统计整理就是根据统计研究的任务,对搜集的统计整理就是根据统计研究的任务,对搜集到的数据资料进行科学的汇总和处理,使数据到的数据资料进行科学的汇总和处理,使数据资料系统化,以反映研究总体的特征、规律和资料系统化,以反映研究总体的特征、规律和趋势。趋势。数据资料整理和图示通常包括下列数据资料整理和图示通常包括下列步骤步骤:(1)对数据资料进行审核和订正;)对数据资料进行审核和订正;(2

11、)对数据资料进行统计分组(分类);)对数据资料进行统计分组(分类);(3)进行统计汇总,计算各组频数,编制频数分布表;)进行统计汇总,计算各组频数,编制频数分布表;(4)给出统计图表或报告。)给出统计图表或报告。 注:注: 在对数据进行统计整理时,应根据不同的数在对数据进行统计整理时,应根据不同的数据类型进行处理,对定性数据(定类数据和定序数据)据类型进行处理,对定性数据(定类数据和定序数据)主要作分类整理,对定量数据(数值数据)主要作分主要作分类整理,对定量数据(数值数据)主要作分组整理。组整理。频数:频数:统计分组中落在各组(或类别)中的统计分组中落在各组(或类别)中的数据个数。数据个数。

12、频率:频率:各组(或类别)的数据个数占数据总各组(或类别)的数据个数占数据总个数的比例值。个数的比例值。频数分布表:频数分布表:各组观察值(或类别)及其各组观察值(或类别)及其相应的频数(或频率)用表格形式按顺序相应的频数(或频率)用表格形式按顺序全部列出来。全部列出来。概概 念:念:累积频数累积频数指把各类别的频数逐项累加。指把各类别的频数逐项累加。累累积积频率频率指指把各类别的频率逐项累加。把各类别的频率逐项累加。例例 为研究广告市场的状况,一家广告公司为研究广告市场的状况,一家广告公司在某城市随机抽取人就广告问题做了邮寄在某城市随机抽取人就广告问题做了邮寄问卷调查,其中的一个问题是:问卷

13、调查,其中的一个问题是:“您比较关心下您比较关心下列哪一类广告?列哪一类广告?” 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告1、定性数据的整理和图示广告类型广告类型人数(人)人数(人) 比例比例频率频率(%) 商品广告商品广告 112 112 0.560 56.0 56.0 服务广告服务广告 51 51 0.255 25.5 25.5 金融广告金融广告 9 9 0.045 4.5 4.5 房地产广告房地产广告 16 16 0.080 8.0 8.0 招生招聘广告招生招聘广告 10 10 0.050 5.0 5.0 其他

14、广告其他广告 2 2 0.010 1.0 1.0 合计合计 200 200 1.0001.000 100.0 100.0 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布某城市居民关注不同类型广告的人数分布(条形图)某城市居民关注不同类型广告的人数分布(条形图)频数(人)频数(人)条形图条形图是用宽度相同的条形高度或长短来表是用宽度相同的条形高度或长短来表示各类别频数或频率的图形。示各类别频数或频率的图形。圆形图圆形图是用圆形及圆内扇形的面积来表示各是用圆形及圆内扇形的面积来表示各类别类别频率频率的图形。的图形。某城市居民关注不同类型广告的人数的构成(饼图)某城市居民关注不同类

15、型广告的人数的构成(饼图)2、定量数据的整理和图示、定量数据的整理和图示分组方法分组方法单变量值分组单变量值分组组距分组组距分组等距分组等距分组异距分组异距分组数据的分组数据的分组单变量值分组单变量值分组、适用于离散变量且变量值较少、适用于离散变量且变量值较少、把每一变量值作为一组、把每一变量值作为一组例例 某生产车间名工人日加工零件某生产车间名工人日加工零件数(单位:个)如下。试采用单变量值对数数(单位:个)如下。试采用单变量值对数据进行分组。据进行分组。117117122122124124129129139139107107117117130130122122125125108108131

16、131125125117117122122133133126126122122118118108108110110118118123123126126133133134134127127123123118118112112112112134134127127123123119119113113120120123123127127135135137137114114120120128128124124115115139139128128124124121121零件数零件数(个)(个)频数频数(人)(人)零件数零件数(个)(个)频数频数(人)(人)零件数零件数(个)(个)频数频数(人)(人)107

17、1071 11191191 11281282 21081082 21201202 21291291 11101101 11211211 11301301 11121122 21221224 41311311 11131131 11231234 41331332 21141 11241243 31341342 21151 11251252 21351351 11171173 31261262 21371371 11181183 31271273 31391392 2某车间名工人日加工零件数分组表某车间名工人日加工零件数分组表适用连续变量或离散变量且变量值较多。适用连续变量或离散变量且变量值较多。

18、把一个区间作为一组,区间长度可以相等把一个区间作为一组,区间长度可以相等 也可以不相等。也可以不相等。分组时应分组时应“不重不漏不重不漏”。组距分组组距分组按数据的个数按数据的个数及数据本身的特点及数据本身的特点选择组数选择组数,通常当数据个数小于通常当数据个数小于50时,可分为时,可分为5-6组;当数据个数为组;当数据个数为100左右时,可分为左右时,可分为6-10组;当数据个数超组;当数据个数超过过500时,可分为时,可分为10-15组。组。组距分组步骤:组距分组步骤:确定组数确定组数也可按也可按Sturges经验公式确定组数经验公式确定组数:ln1ln2nK 例如,当例如,当n=90时,

19、组数时,组数849. 72ln90ln1K数据的最大值与最小值之差称为数据的最大值与最小值之差称为极差极差,用,用表示,即表示,即 最大值最小值最大值最小值确定各组的组距与组限确定各组的组距与组限KRd各组取相同的组距。组中值各组取相同的组距。组中值2上限下限由组数和极差就可确定组距由组数和极差就可确定组距,即即把数据归组后得频数分布表把数据归组后得频数分布表. .归组归组按零件数分组(个)按零件数分组(个)频数(人)频数(人)频率(频率(%)1051103 3 6 6 1101155 5 10 10 1151208 8 16 16 12012514 14 28 28 12513010 10

20、20 20 1301356 6 12 12 1351404 4 8 8 合计合计50 50 100 100 某车间名工人日加工零件数分组表某车间名工人日加工零件数分组表(加工零件数最少(加工零件数最少107个,最多个,最多139个)个)某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图105 110 115 120 125 130 135 140日加工日加工零件数零件数(个)(个)频数(人)频数(人)用横轴表示组限,纵轴表示频数或频率用横轴表示组限,纵轴表示频数或频率各组以组距为宽,以频数或频率各组以组距为宽,以频数或频率 为高形成一个矩形,即为直方图。为高形成一个矩形,即为直方图。

21、直方图直方图用矩形来表示频数分布的图形用矩形来表示频数分布的图形直方图与条形图的差别:直方图与条形图的差别:条形图用宽度表示类别,宽度都相条形图用宽度表示类别,宽度都相等,而直方图用宽度表示组距,宽度可以不等,而直方图用宽度表示组距,宽度可以不相等。相等。条形图通常分开排列,而直方图则条形图通常分开排列,而直方图则是连续排列。是连续排列。折线图折线图用折线表示频数分布的图形用折线表示频数分布的图形用横轴表示组中值,纵轴表示频数或用横轴表示组中值,纵轴表示频数或 频率频率.用直线连接各组中值相应的频数或频用直线连接各组中值相应的频数或频 率,即为折线图。率,即为折线图。某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图105 110 115 120 125 130 135 140日加工零件数(个)日加工零件数(个)频数(人)频数(人)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第一节-数据的分类和整理课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|