1、学习目标:学习目标:(一)知识目标(一)知识目标 了解市场调查资料整理的含义与意义;了解市场调查资料整理的含义与意义;认识市场调查资料整理的程序和方法;认识市场调查资料整理的程序和方法;了解数据交叉列表技术;了解数据交叉列表技术;理解数据描述性分析方法;理解数据描述性分析方法;了解数据相对程度分析的种类与方法;了解数据相对程度分析的种类与方法;掌握数据变量间关系分析方法。掌握数据变量间关系分析方法。(二)技能目标(二)技能目标 掌握市场调查资料整理的程序和方法;掌握市场调查资料整理的程序和方法;掌握数据相关分析、因子分析和聚类分析等方法。掌握数据相关分析、因子分析和聚类分析等方法。一、市场调查
2、资料整理的含义一、市场调查资料整理的含义 市场调查资料整理是指根据市场分析研究的需要,运用科学市场调查资料整理是指根据市场分析研究的需要,运用科学的方法对市场调查所获得的各种原始资料进行审核、分组、的方法对市场调查所获得的各种原始资料进行审核、分组、汇总、列表,或对二手资料进行再加工,使其集中化、条理汇总、列表,或对二手资料进行再加工,使其集中化、条理化、系统化的活动或过程。化、系统化的活动或过程。二、市场调查资料整理的意义二、市场调查资料整理的意义 1.1.市场调查资料整理是进行资料分析的前提市场调查资料整理是进行资料分析的前提 2.2.市场调查资料的整理可以大大提高调查资料的使市场调查资料
3、的整理可以大大提高调查资料的使用价值用价值 3.3.市场调查资料的整理是实现从感性认识到理性认市场调查资料的整理是实现从感性认识到理性认识的重要过渡识的重要过渡 4.4.市场调查资料的整理是保存调查资料的客观要求市场调查资料的整理是保存调查资料的客观要求三、市场调查资料整理的原则三、市场调查资料整理的原则 为了保证质量,在市场调查资料整理的过程中,应坚持以下为了保证质量,在市场调查资料整理的过程中,应坚持以下几点原则:几点原则:1.1.真实性原则真实性原则 2.2.完整性原则完整性原则 3.3.准确性原则准确性原则 4.4.系统性原则系统性原则 5.5.统一性原则统一性原则一、市场调查资料整理
4、的一般程序一、市场调查资料整理的一般程序 市场调查资料整理一般程序如下:市场调查资料整理一般程序如下:1.1.资料整理方案的设计资料整理方案的设计 2.2.调查资料的审核调查资料的审核 3.3.资料的分组资料的分组 4.4.资料的汇总资料的汇总 5.5.资料的显示资料的显示二、调查资料的审核二、调查资料的审核 调查资料审核的内容调查资料审核的内容 调查资料审核的方法调查资料审核的方法(一)调查资料审核的内容(一)调查资料审核的内容 调查资料的审核内容包括:调查资料的审核内容包括:1.1.完整性完整性 2.2.准确性准确性 审核的准确性是检查问卷或调查表中的项目是否存在填答错审核的准确性是检查问
5、卷或调查表中的项目是否存在填答错误,一般有以下三种情形:误,一般有以下三种情形:(1 1)答非所问的答案。)答非所问的答案。(2 2)逻辑性错误。)逻辑性错误。(3 3)乏兴回答的错误。)乏兴回答的错误。3.3.及时性及时性 4.4.有效性有效性 5.5.齐备性齐备性(二)调查资料审核的方法(二)调查资料审核的方法 常用的审核方法有以下几种:常用的审核方法有以下几种:(1 1)逻辑审核。)逻辑审核。(2 2)计算审核。)计算审核。(3 3)设置疑问框审核。)设置疑问框审核。三、调查资料的分组三、调查资料的分组 分组的含义与作用分组的含义与作用 分组的关键与原则分组的关键与原则 分组的类型分组的
6、类型 资料分组应注意的事项资料分组应注意的事项 (一)分组的含义与作用(一)分组的含义与作用 1.1.分组的含义分组的含义 分组是指根据市场调查研究的目的和客观现象的内在特点,分组是指根据市场调查研究的目的和客观现象的内在特点,按照一定的标志把被研究的总体划分为若干个性质不同但有按照一定的标志把被研究的总体划分为若干个性质不同但有联系的组成部分的一种统计方法。联系的组成部分的一种统计方法。2.2.分组的作用分组的作用 把资料进行分组的作用主要体现在以下几个方面:把资料进行分组的作用主要体现在以下几个方面:(1)(1)区分和判断社会经济现象的类型特征。区分和判断社会经济现象的类型特征。(2)(2
7、)揭示变量之间的依存关系。揭示变量之间的依存关系。(3)(3)反映事物内部结构及比例关系。反映事物内部结构及比例关系。(二)分组的关键与原则二)分组的关键与原则 1.1.分组的关键分组的关键 分组有两个关键问题:分组有两个关键问题:(1 1)分组标志的选择。)分组标志的选择。选择分组标志的依据是:根据市场调查的目的和任务选择分组标志。选择能够反映事物本质或主要特征的标志作为分组标志。要结合历史条件和经济条件来选择分组标志。(2 2)划分各组界限。)划分各组界限。2.2.分组的原则分组的原则 统计分组在方法上必须符合以下两个原则:统计分组在方法上必须符合以下两个原则:(1 1)穷尽性原则。)穷尽
8、性原则。(2 2)互斥性原则。)互斥性原则。(三)分组的类型(三)分组的类型 1.1.简单分组和复合分组简单分组和复合分组 按照分组标志个数多少的不同,统计分组可分为:按照分组标志个数多少的不同,统计分组可分为:(1 1)简单分组。)简单分组。(2 2)复合分组。)复合分组。2.2.品质标志分组和数量标志分组品质标志分组和数量标志分组 按照分组标志性质的不同,统计分组可分为:按照分组标志性质的不同,统计分组可分为:(1 1)品质标志分组。)品质标志分组。(2 2)数量标志分组。)数量标志分组。3.3.数量标志分组的类型数量标志分组的类型 变量分组有以下两种基本方法:变量分组有以下两种基本方法:
9、(1 1)单项式分组。)单项式分组。(2 2)组距式分组。)组距式分组。从工作过程来讲,组距式分组可分为以下几个步骤:确定全距。确定组数。确定组距。确定组限。(四)资料分组应注意的事项(四)资料分组应注意的事项(1 1)按某一标志进行分组,不要遗漏任何原始资料所提供)按某一标志进行分组,不要遗漏任何原始资料所提供的数据。的数据。(2 2)组距尽可能取整数。)组距尽可能取整数。(3 3)各组的组距尽可能相等,即尽可能多用等距分组,少)各组的组距尽可能相等,即尽可能多用等距分组,少用不等距分组。用不等距分组。(4 4)问卷中回答项目本身就已经分类的,表格化时就可按)问卷中回答项目本身就已经分类的,
10、表格化时就可按已有分类进行排列。已有分类进行排列。(5 5)使用的组距要使最常出现的答案在中间。)使用的组距要使最常出现的答案在中间。(6 6)分类的间隔应是互相排斥的。)分类的间隔应是互相排斥的。四、资料的汇总四、资料的汇总 统计汇总的意义统计汇总的意义 资料汇总的组织形式资料汇总的组织形式 资料汇总的方法资料汇总的方法(一)统计汇总的意义(一)统计汇总的意义 资料汇总是指在资料分组的基础上,把总体单位各方面的资料汇总是指在资料分组的基础上,把总体单位各方面的标志表现分别进行综合处理,最终得到总体指标的过程或工标志表现分别进行综合处理,最终得到总体指标的过程或工作。从完整的资料整理过程来讲,
11、资料分组仅完成了整理工作。从完整的资料整理过程来讲,资料分组仅完成了整理工作的一部分,在分组的基础上,还要进行大量的汇总工作,作的一部分,在分组的基础上,还要进行大量的汇总工作,即把总体单位各个方面的标志表现综合为指标。因此,汇总即把总体单位各个方面的标志表现综合为指标。因此,汇总是资料整理的主要内容,在此基础上才能作各种统计分析。是资料整理的主要内容,在此基础上才能作各种统计分析。把资料汇总的结果与分组结合在一起,既可以观察和分析总把资料汇总的结果与分组结合在一起,既可以观察和分析总体各方面的分布特征,还可以补充说明总体的总量指标和平体各方面的分布特征,还可以补充说明总体的总量指标和平均指标
12、掩盖的变异差距,为分析研究对象的均匀、稳定、协均指标掩盖的变异差距,为分析研究对象的均匀、稳定、协调性提供条件,从而更加全面、深入地认识社会经济现象。调性提供条件,从而更加全面、深入地认识社会经济现象。因此,资料汇总对于全面和深入地认识问题具有重要意义。因此,资料汇总对于全面和深入地认识问题具有重要意义。(二)资料汇总的组织形式(二)资料汇总的组织形式 按照组织形式的不同,资料汇总可分为:按照组织形式的不同,资料汇总可分为:逐级汇总是按照一定的统计管理制度,自下而上地逐级汇逐级汇总是按照一定的统计管理制度,自下而上地逐级汇总统计调查资料,然后逐级上报。这种组织形式的优点是:总统计调查资料,然后
13、逐级上报。这种组织形式的优点是:能满足各地区、各部门对统计资料的需要,同时便于就地审能满足各地区、各部门对统计资料的需要,同时便于就地审核和更正原始资料的错误,也能调查汇总大量的统计调查项核和更正原始资料的错误,也能调查汇总大量的统计调查项目。缺点是:由于汇总环节多,发生差错的几率大;费时较目。缺点是:由于汇总环节多,发生差错的几率大;费时较长,影响了统计效率的提高;逐级汇总耗费人力、物力、财长,影响了统计效率的提高;逐级汇总耗费人力、物力、财力较大,因此其经济性也较差。力较大,因此其经济性也较差。集中汇总是将全部调查资料集中到组织调查的最高机关一次集中汇总是将全部调查资料集中到组织调查的最高
14、机关一次汇总。这种组织形式的优点是:可以缩短汇总时间,减少汇汇总。这种组织形式的优点是:可以缩短汇总时间,减少汇总差错,相对来说耗费的人力、物力、财力也比较小。缺点总差错,相对来说耗费的人力、物力、财力也比较小。缺点是:原始资料如有差错不能就地更正,汇总结果有时不能及是:原始资料如有差错不能就地更正,汇总结果有时不能及时满足各地区、各部门的需要。时满足各地区、各部门的需要。(三)资料汇总的方法(三)资料汇总的方法 按照资料汇总的主要手段划分,汇总方法可分为:按照资料汇总的主要手段划分,汇总方法可分为:1.1.手工汇总手工汇总 手工汇总是最原始的汇总方式,随着计算机的产生和发展,手工汇总是最原始
15、的汇总方式,随着计算机的产生和发展,手工汇总渐渐地缩小了其使用范围。手工汇总使用的工具是手工汇总渐渐地缩小了其使用范围。手工汇总使用的工具是算盘和小型计算器,这些汇总工具在我国许多地区还属于常算盘和小型计算器,这些汇总工具在我国许多地区还属于常规工具。手工汇总的常用方法有以下四种:规工具。手工汇总的常用方法有以下四种:(1)(1)划记法。划记法。(2)(2)过录法。过录法。(3)(3)折叠法。折叠法。(4)(4)卡片法。卡片法。2.2.计算机汇总计算机汇总 计算机汇总的步骤如下:计算机汇总的步骤如下:(1 1)程序设计。)程序设计。(2 2)数据编码。)数据编码。(3 3)数据录入。)数据录入
16、。(4 4)逻辑检查。)逻辑检查。(5 5)运行程序。)运行程序。(6 6)提供统计资料。)提供统计资料。五、资料的显示五、资料的显示 市场调查的资料经过加工整理后,通常要借助于一定的形式市场调查的资料经过加工整理后,通常要借助于一定的形式显示出来,以便供用户、调查员阅读、分析和使用。市场调显示出来,以便供用户、调查员阅读、分析和使用。市场调查资料显示的方式主要有:查资料显示的方式主要有:统计表统计表 统计图统计图(一)统计表(一)统计表 1.1.统计表的含义与作用统计表的含义与作用 通过市场调查所得来的原始资料,经过整理,得到说明社会通过市场调查所得来的原始资料,经过整理,得到说明社会现象及
17、其发展过程的数据,把这些数据按一定的顺序排列在现象及其发展过程的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。统计表既是调查整理的工具,又表格上,就形成了统计表。统计表既是调查整理的工具,又是分析研究的工具。是分析研究的工具。统计表是调查资料、整理结果最常用的表示方法。它主要有统计表是调查资料、整理结果最常用的表示方法。它主要有以下几方面的作用:第一,能使大量的统计资料系统化、条以下几方面的作用:第一,能使大量的统计资料系统化、条理化,能更清晰地表述统计资料的内容;第二,利用统计表理化,能更清晰地表述统计资料的内容;第二,利用统计表便于比较各项目便于比较各项目(指标指标)之间的关系
18、,便于计算;第三,利用之间的关系,便于计算;第三,利用统计表易于检查数字的完整性和正确性;第四,采用统计表统计表易于检查数字的完整性和正确性;第四,采用统计表表述统计资料显得紧凑、简明、醒目,使人一目了然。表述统计资料显得紧凑、简明、醒目,使人一目了然。2.2.统计表的构成统计表的构成 从结构来讲,统计表可分为以下五个部分:从结构来讲,统计表可分为以下五个部分:(1 1)总标题。)总标题。(2 2)横行标题。)横行标题。(3 3)纵栏标题。)纵栏标题。(4 4)数字资料。)数字资料。(5 5)表外附加。)表外附加。3.3.统计表的分类统计表的分类(1 1)按用途的不同,可把统计表划分为调查表、
19、整理表或)按用途的不同,可把统计表划分为调查表、整理表或汇总表、分析表。汇总表、分析表。(2 2)按主词是否分组及分组的复杂程度不同,可把统计表)按主词是否分组及分组的复杂程度不同,可把统计表划分为简单表、简单分组表和复合分组表。划分为简单表、简单分组表和复合分组表。4.4.编制统计表的一般规则编制统计表的一般规则 具体来说,设计统计表时要遵循以下几点规则:具体来说,设计统计表时要遵循以下几点规则:(1 1)合理安排统计表的结构,如行标题、列标题、数字资)合理安排统计表的结构,如行标题、列标题、数字资料的位置应安排合理。料的位置应安排合理。(2 2)统计表一般应是开口式的,即左右两端不封线,上
20、下)统计表一般应是开口式的,即左右两端不封线,上下封门。封门。(3 3)统计表的各种标题应规范、科学、准确。表中的总标)统计表的各种标题应规范、科学、准确。表中的总标题要简明扼要,并能确切说明表中的内容。题要简明扼要,并能确切说明表中的内容。(4 4)表内各栏数字的位数要对齐,同类数字保持统一位数)表内各栏数字的位数要对齐,同类数字保持统一位数,一般应有合计。,一般应有合计。(5 5)统计表中的数字资料部分不允许空格。)统计表中的数字资料部分不允许空格。(6 6)表中的指标数字应有计量单位。)表中的指标数字应有计量单位。(7 7)当统计表的栏目较多时,可以加以编号。)当统计表的栏目较多时,可以
21、加以编号。(8 8)某些特殊资料需要说明的,应在表的下方加以注解。)某些特殊资料需要说明的,应在表的下方加以注解。(二)统计图(二)统计图 调查资料也可以用统计图来显示。统计图就是以圆点的多调查资料也可以用统计图来显示。统计图就是以圆点的多少、直线长短、曲线起伏、条形长短、柱状高低、圆饼面积少、直线长短、曲线起伏、条形长短、柱状高低、圆饼面积等图形来显示调研数据。它可以形象、直观地表明数据的分等图形来显示调研数据。它可以形象、直观地表明数据的分布形态与发展变化的趋势。一张好的统计图,往往让人一目布形态与发展变化的趋势。一张好的统计图,往往让人一目了然,远胜过冗长的文字。了然,远胜过冗长的文字。
22、统计图既可以用手工制作,也可以用计算机制作。用计算统计图既可以用手工制作,也可以用计算机制作。用计算机制作可以提高图形的绘制速度,使图形绘制更加准确和精机制作可以提高图形的绘制速度,使图形绘制更加准确和精美。一些商用的统计软件包和电子图表软件都具有强大的图美。一些商用的统计软件包和电子图表软件都具有强大的图形处理能力,可以使用户迅速生成花样繁多且质量、效果很形处理能力,可以使用户迅速生成花样繁多且质量、效果很好的图形来。好的图形来。统计图的类型有很多,常用的主要有:统计图的类型有很多,常用的主要有:1.1.饼形图饼形图 饼形图又称圆形图,是将资料数据展示在一个圆平面上。饼形图又称圆形图,是将资
23、料数据展示在一个圆平面上。2.2.环形图环形图 环形图与饼形图类似,但又有区别。环形图中间有一个环形图与饼形图类似,但又有区别。环形图中间有一个“空空洞洞”,总体或样本中的每一部分数据用环中的一段表示。,总体或样本中的每一部分数据用环中的一段表示。3.3.条形图条形图 条形图是用宽度相等、长短不同的条形表示现象之间对比关条形图是用宽度相等、长短不同的条形表示现象之间对比关系的统计图。系的统计图。4.4.直方图直方图 直方图是用矩形的宽度和高度来表示频数分布的图形直方图是用矩形的宽度和高度来表示频数分布的图形 。5.5.折线图和曲线图折线图和曲线图 折线图也称频数多边形图,是在直方图的基础上,把
24、直方图折线图也称频数多边形图,是在直方图的基础上,把直方图顶部的中点用直线连起来,再把原来的直方图抹掉所形成的顶部的中点用直线连起来,再把原来的直方图抹掉所形成的图形。图形。组距会越来越小,这时所绘制的折线图就会越来越平滑,逐组距会越来越小,这时所绘制的折线图就会越来越平滑,逐渐形成一条曲线,这就是频数分布曲线。曲线图是折线图的渐形成一条曲线,这就是频数分布曲线。曲线图是折线图的几何逼近。几何逼近。6.6.茎叶图茎叶图 茎叶图也称枝叶图由茎叶图也称枝叶图由“茎茎”和和“叶叶”两部分构成,适用于没两部分构成,适用于没有分组的数值型数据(原始数据)。有分组的数值型数据(原始数据)。7.7.趋势图趋
25、势图 趋势图也称时间序列曲线图,是以曲线的起伏来表示数据随趋势图也称时间序列曲线图,是以曲线的起伏来表示数据随时间的动态变化的。时间的动态变化的。第三节第三节 数据描述性统计分析数据描述性统计分析 描述性统计分析是一种非常有效的概括大规模数据特征的方描述性统计分析是一种非常有效的概括大规模数据特征的方法。描述性统计分析是指对调查总体所有单位的有关数据作法。描述性统计分析是指对调查总体所有单位的有关数据作搜集、整理和计算综合指标等加工处理,用来描述总体特征搜集、整理和计算综合指标等加工处理,用来描述总体特征的统计分析方法。描述性统计分析是统计分析的重要组成部的统计分析方法。描述性统计分析是统计分
26、析的重要组成部分,在统计研究中有着广泛的应用。市场调查分析中最常用分,在统计研究中有着广泛的应用。市场调查分析中最常用的描述性统计分析主要包括数据的集中趋势分析和离散程度的描述性统计分析主要包括数据的集中趋势分析和离散程度分析。分析。第三节第三节 数据描述性统计分析数据描述性统计分析一、数据的集中趋势分析一、数据的集中趋势分析 平均指标按计算方法的不同可以分为:平均指标按计算方法的不同可以分为:算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数 第三节第三节 数据描述性统计分析数据描述性统计分析(一)算术平均数(一)算术平均数 算术平均数是总体单位某一数量
27、标志值之和除以总体单位总算术平均数是总体单位某一数量标志值之和除以总体单位总数,其计算公式为:数,其计算公式为:总体单位数和总体单位数量标志值之算术平均数第三节第三节 数据描述性统计分析数据描述性统计分析1.1.简单算术平均数简单算术平均数 依据未分组的原始数据,将总体单位的标志值简单加总求依据未分组的原始数据,将总体单位的标志值简单加总求和,除以总体单位数所得的结果为简单算术平均数。其计算和,除以总体单位数所得的结果为简单算术平均数。其计算公式为:公式为:12nxxxxxnn第三节第三节 数据描述性统计分析数据描述性统计分析2.2.加权算术平均数加权算术平均数 原始资料按数量标志分组,编成变
28、量数列,将各组的标志值原始资料按数量标志分组,编成变量数列,将各组的标志值乘以相应的次数(权数),然后再加总求和,再除以总次数乘以相应的次数(权数),然后再加总求和,再除以总次数(总体单位数)所得到的结果为加权算术平均数。其计算公(总体单位数)所得到的结果为加权算术平均数。其计算公式为:式为:112212.n nnxfx fx fx fxffff第三节第三节 数据描述性统计分析数据描述性统计分析(二)调和平均数(二)调和平均数 调和平均数是对变量值的倒数求得的平均数,又称倒数平均调和平均数是对变量值的倒数求得的平均数,又称倒数平均数,又可以分为:数,又可以分为:1.1.简单调和平均数简单调和平
29、均数 简单调和平均数是各单位标志值倒数的简单算术平均数的倒简单调和平均数是各单位标志值倒数的简单算术平均数的倒数,其计算公式为:数,其计算公式为:1/HXnX第三节第三节 数据描述性统计分析数据描述性统计分析 2.2.加权调和平均数加权调和平均数 加权调和平均数是各单位标志值倒数的加权算术平均数的倒加权调和平均数是各单位标志值倒数的加权算术平均数的倒数。以数。以m m表示各项权数,其计算公式为:表示各项权数,其计算公式为:()/HmXmX第三节第三节 数据描述性统计分析数据描述性统计分析(三)几何平均数(三)几何平均数 根据所掌握资料的不同,可把几何平均数分为:根据所掌握资料的不同,可把几何平
30、均数分为:1.1.简单几何平均数简单几何平均数 简单几何平均数是简单几何平均数是n n个标志值乘积的个标志值乘积的n n次方根。其计算公式次方根。其计算公式为:为:12.nnGX XXX第三节第三节 数据描述性统计分析数据描述性统计分析 2.2.加权几何平均数加权几何平均数 对于分组资料,且各组变量值出现的次数(权数)不相等时对于分组资料,且各组变量值出现的次数(权数)不相等时应采用加权几何平均数,其计算公式为:应采用加权几何平均数,其计算公式为:1212.nfnGfffxxxX第三节第三节 数据描述性统计分析数据描述性统计分析(四)中位数(四)中位数 中位数是指将总体各单位的标志值由小到大排
31、列,处在中间中位数是指将总体各单位的标志值由小到大排列,处在中间位置的那个标志值,用位置的那个标志值,用MeMe表示。它把全部标志值分为两个部表示。它把全部标志值分为两个部分,一半标志值比它小,一半标志值比它大。当平均值不易分,一半标志值比它小,一半标志值比它大。当平均值不易计算时,可用中位数代表总体的一般水平。确定中位数的方计算时,可用中位数代表总体的一般水平。确定中位数的方法有以下三种:法有以下三种:1.1.未分组资料中位数计算方法未分组资料中位数计算方法 未分组资料中位数的计算步骤为:未分组资料中位数的计算步骤为:第一步,将数值由小到大排列。第一步,将数值由小到大排列。第三节第三节 数据
32、描述性统计分析数据描述性统计分析 第二步,按照公式(第二步,按照公式(n+1n+1)/2/2计算中位数的位次,再根据位计算中位数的位次,再根据位次确定中位数。次确定中位数。第三步:若数列的项数为奇数,则中位数即为(第三步:若数列的项数为奇数,则中位数即为(n+1n+1)/2/2对对应的数;若数列的项数为偶数,则对应于中位数位次左、右应的数;若数列的项数为偶数,则对应于中位数位次左、右相邻两个变量的简单平均数即为中位数。相邻两个变量的简单平均数即为中位数。2.2.单项式分组资料中位数计算方法单项式分组资料中位数计算方法 3.3.组距分组资料中位数计算方法组距分组资料中位数计算方法 第三节第三节
33、数据描述性统计分析数据描述性统计分析(五)众数(五)众数 众数是在一个统计总体或分布数列中出现次数最多的变量值。众数是在一个统计总体或分布数列中出现次数最多的变量值。它本身不是平均值,只是总体一般水平的代表值。众数可以它本身不是平均值,只是总体一般水平的代表值。众数可以根据品质数列计算,也可以根据变量数列计算。它不受极端根据品质数列计算,也可以根据变量数列计算。它不受极端值的影响,所以代表性更强。值得注意的是,有时频数最大值的影响,所以代表性更强。值得注意的是,有时频数最大的数据值可能会有两个或更多。在这种情况下,存在不止一的数据值可能会有两个或更多。在这种情况下,存在不止一个众数。如果在数据
34、中恰有两个众数,称此数据为双众数;个众数。如果在数据中恰有两个众数,称此数据为双众数;如果在数据中有两个以上的众数,则称此数据为多众数。在如果在数据中有两个以上的众数,则称此数据为多众数。在多众数的情况下,对于数据的描述并不起多大的作用,所以多众数的情况下,对于数据的描述并不起多大的作用,所以很少用其作分析。很少用其作分析。第三节第三节 数据描述性统计分析数据描述性统计分析(六)各种平均数之间的关系(六)各种平均数之间的关系 1.1.数值平均数和位置平均数的比较数值平均数和位置平均数的比较(1 1)数值平均数是根据总体内各个标志值计算的,位置平)数值平均数是根据总体内各个标志值计算的,位置平均
35、数是根据总体中某一个特殊位置上的标志值确定的。数值均数是根据总体中某一个特殊位置上的标志值确定的。数值平均数对数据的概括能力显然比位置平均数要强一些。平均数对数据的概括能力显然比位置平均数要强一些。(2 2)数值平均数容易受极端值的影响,对于极端值的)数值平均数容易受极端值的影响,对于极端值的“耐耐抗性抗性”较低;位置平均数却相反,数列中某些数据的变动不较低;位置平均数却相反,数列中某些数据的变动不一定会影响到它们的水平,个别或少数极端值对于位置平均一定会影响到它们的水平,个别或少数极端值对于位置平均值几乎没有影响,值几乎没有影响,“耐抗性耐抗性”较高。较高。第三节第三节 数据描述性统计分析数
36、据描述性统计分析(3 3)适用的数据类型不同。数值平均数适用于定距尺度和)适用的数据类型不同。数值平均数适用于定距尺度和定比尺度的数据,而位置平均数还适用于各种定序尺度的数定比尺度的数据,而位置平均数还适用于各种定序尺度的数据,众数甚至能用于定类尺度的数据。因此,在无法运用数据,众数甚至能用于定类尺度的数据。因此,在无法运用数值平均数的场合,位置平均数不失为一种有效的分析工具。值平均数的场合,位置平均数不失为一种有效的分析工具。2.2.各种数值平均数的比较各种数值平均数的比较 (1 1)适用的场合不同。一般来说,在计算单位标志平均数)适用的场合不同。一般来说,在计算单位标志平均数时,用算术平均
37、数或调和平均数;在计算动态比率平均数时时,用算术平均数或调和平均数;在计算动态比率平均数时,用几何平均数。,用几何平均数。(2 2)计算的繁简程度不同。算术平均数的计算过程最简单)计算的繁简程度不同。算术平均数的计算过程最简单,其他数值平均数的计算都相对复杂一些。,其他数值平均数的计算都相对复杂一些。第三节第三节 数据描述性统计分析数据描述性统计分析(3 3)某些数值平均数对变量的取值有特殊的限制。几何平)某些数值平均数对变量的取值有特殊的限制。几何平均数要求被平均变量不能为负或零,调和平均数则要求被平均数要求被平均变量不能为负或零,调和平均数则要求被平均变量不能为零。均变量不能为零。第三节第
38、三节 数据描述性统计分析数据描述性统计分析二、数据的离散程度分析二、数据的离散程度分析 反映数据离散程度的指标有:反映数据离散程度的指标有:极差极差 平均差平均差 标准差标准差 离散系数离散系数 第三节第三节 数据描述性统计分析数据描述性统计分析 1.1.极差极差 极差又称全距,是总体各单位标志的最大值和最小值之差。极差又称全距,是总体各单位标志的最大值和最小值之差。2.2.平均差平均差 平均差是总体中各单位标志值与其算术平均数的差平均差是总体中各单位标志值与其算术平均数的差(离差离差)的的绝对值的算术平均数。绝对值的算术平均数。3.3.标准差标准差 标准差又称均方差,是各单位标志值与其算术平
39、均数离差平标准差又称均方差,是各单位标志值与其算术平均数离差平方的算术平均数的平方根。方的算术平均数的平方根。第三节第三节 数据描述性统计分析数据描述性统计分析 4.4.离散系数离散系数 离散系数又称变异系数,是一类相对数形式的变异指标。离散系数又称变异系数,是一类相对数形式的变异指标。其计算公式为:其计算公式为:100VX第四节第四节 数据相对程度分析数据相对程度分析 数据相对程度分析就是从两个相联系的统计指标对比计算的数据相对程度分析就是从两个相联系的统计指标对比计算的相对数出发,对其反映的事物间的关系进行的研究分析。相相对数出发,对其反映的事物间的关系进行的研究分析。相对程度分析使那些利
40、用总量指标不能直接对比的现象找到了对程度分析使那些利用总量指标不能直接对比的现象找到了可比的基础。相对指标有的为有名数,但多为无名数,一般可比的基础。相对指标有的为有名数,但多为无名数,一般用系数、倍数、成数、百分数或千分数表示。用系数、倍数、成数、百分数或千分数表示。市场调查分析中常用的相对指标有:市场调查分析中常用的相对指标有:计划完成程度相对指标计划完成程度相对指标 比例相对指标比例相对指标 结构相对指标结构相对指标第四节第四节 数据相对程度分析数据相对程度分析 比较相对指标比较相对指标 强度相对指标强度相对指标 动态相对指标动态相对指标第四节第四节 数据相对程度分析数据相对程度分析1.
41、1.计划完成程度相对指标计划完成程度相对指标 计划完成程度相对指标是某一时期实际完成的指标数值与计计划完成程度相对指标是某一时期实际完成的指标数值与计划指标数值对比的结果。其计算公式为:划指标数值对比的结果。其计算公式为:100%实际数计划完成程度相对指标计划数第四节第四节 数据相对程度分析数据相对程度分析 计划完成程度相对指标的具体用法有两种:一种是计划数为计划完成程度相对指标的具体用法有两种:一种是计划数为绝对数、相对数或平均数,此时直接按上述公式计算,以考绝对数、相对数或平均数,此时直接按上述公式计算,以考核计划完成的情况;另一种是计划数为增长或降低的百分比核计划完成的情况;另一种是计划
42、数为增长或降低的百分比,此时计划完成程度相对指标按如下公式计算:,此时计划完成程度相对指标按如下公式计算:1100%1ijVV计划完成程度相对指标第四节第四节 数据相对程度分析数据相对程度分析2.2.结构相对指标结构相对指标 结构相对指标是总体各组成部分与总体数值对比得出的比重结构相对指标是总体各组成部分与总体数值对比得出的比重或比率,用来表明总体的构成情况,一般用百分数表示。它或比率,用来表明总体的构成情况,一般用百分数表示。它从静态上反映总体的内部构成,揭示事物的本质特征,其动从静态上反映总体的内部构成,揭示事物的本质特征,其动态变化可以反映事物的结构发展变化趋势和规律性,总体各态变化可以
43、反映事物的结构发展变化趋势和规律性,总体各组的结构相对指标可以说明该组在总体中的地位和作用,对组的结构相对指标可以说明该组在总体中的地位和作用,对于计算平均指标有特殊意义。其计算公式为:于计算平均指标有特殊意义。其计算公式为:100%总体全部数值总体部分数值结构相对指标第四节第四节 数据相对程度分析数据相对程度分析3.3.比较相对指标比较相对指标 客观事物的发展是不平衡的,对事物在不同地区、不同单位客观事物的发展是不平衡的,对事物在不同地区、不同单位之间即不同空间发展的差异程度进行研究,需要运用比较相之间即不同空间发展的差异程度进行研究,需要运用比较相对指标。对指标。比较相对指标即反映在同一时
44、间不同空间上同类现象数量对比较相对指标即反映在同一时间不同空间上同类现象数量对比关系的指标,一般用百分数或倍数表示,其计算公式为:比关系的指标,一般用百分数或倍数表示,其计算公式为:100%数值另一总体同项指标指标某一总体某项指标数值比较相对指标第四节第四节 数据相对程度分析数据相对程度分析4.4.比例相对指标比例相对指标 由于总体内部各组成部分之间存在一定的联系,并在客观上由于总体内部各组成部分之间存在一定的联系,并在客观上保持一定的比例,为了反映这种比例关系,需要计算比例相保持一定的比例,为了反映这种比例关系,需要计算比例相对指标对指标 比例相对指标是指同一总体内不同部分的指标数值对比得到
45、比例相对指标是指同一总体内不同部分的指标数值对比得到的相对数,它表明总体中各部分的比例关系,通常用倍数或的相对数,它表明总体中各部分的比例关系,通常用倍数或百分数表示,也可以用一比几或几比几的形式来表示。其计百分数表示,也可以用一比几或几比几的形式来表示。其计算公式为:算公式为:100%总体中某部分指标数值比例相对指标总体中另一部分指标数值第四节第四节 数据相对程度分析数据相对程度分析5.5.强度相对指标强度相对指标 强度相对指标又称强度相对数,是指两个性质不同但有联系强度相对指标又称强度相对数,是指两个性质不同但有联系的总量指标对比得出的相对数,是用来表示现象的强度、密的总量指标对比得出的相
46、对数,是用来表示现象的强度、密度和普遍程度的指标。例如,以人口数与土地面积对比得到度和普遍程度的指标。例如,以人口数与土地面积对比得到的人口密度,以主要产品产量与人口数对比得到的每人平均的人口密度,以主要产品产量与人口数对比得到的每人平均产品产量,以医院病床数与人口数对比得到的每一万人平均产品产量,以医院病床数与人口数对比得到的每一万人平均分摊的医院病床数,均称为强度相对指标。其计算公式为:分摊的医院病床数,均称为强度相对指标。其计算公式为:100%的总量指标数值另一性质相同而有联系某一总量指标数值强度相对指标第四节第四节 数据相对程度分析数据相对程度分析6.6.动态相对指标动态相对指标 动态
47、相对指标即两个时期间同一指标数值的对比,是反映现动态相对指标即两个时期间同一指标数值的对比,是反映现象发展变化程度的指标,把作为比较的时期称为基期,把同象发展变化程度的指标,把作为比较的时期称为基期,把同基期对比的时期称为报告期。动态相对指标对于分析研究社基期对比的时期称为报告期。动态相对指标对于分析研究社会经济现象的发展变化过程具有重要意义。动态相对指标通会经济现象的发展变化过程具有重要意义。动态相对指标通常用百分数表示。其计算公式为:常用百分数表示。其计算公式为:100%基期同一指标数值报告期某一指标数值动态相对指标第四节第四节 数据相对程度分析数据相对程度分析7.7.计算和运用相对指标应
48、注意的问题计算和运用相对指标应注意的问题 统计相对数是一种抽象化的指标数值,是现象进行对比分析统计相对数是一种抽象化的指标数值,是现象进行对比分析的一种重要手段,要使对比分析准确、深刻地反映出现象之的一种重要手段,要使对比分析准确、深刻地反映出现象之间的关系,发挥相对数的作用,在计算和应用相对指标时应间的关系,发挥相对数的作用,在计算和应用相对指标时应注意以下几个问题:注意以下几个问题:(1 1)注意指标的可比性。)注意指标的可比性。(2 2)要把各种相对数结合起来。)要把各种相对数结合起来。(3 3)把相对数和绝对数结合起来使用。)把相对数和绝对数结合起来使用。第五节第五节 数据交叉列表分析
49、数据交叉列表分析一、交叉列表分析的含义一、交叉列表分析的含义 交叉分析表是指同时将两个或两个以上有一定联系的变量及交叉分析表是指同时将两个或两个以上有一定联系的变量及其变量取值按一定的顺序交叉排列在同一张统计表内,使各其变量取值按一定的顺序交叉排列在同一张统计表内,使各变量值成为不同变量的结点,进而分析变量之间的相互关系变量值成为不同变量的结点,进而分析变量之间的相互关系,最终得出结论的一种数据分析技术。变量之间的分项必须,最终得出结论的一种数据分析技术。变量之间的分项必须交叉对应,从而使得交叉表中的每个结点的值反映不同变量交叉对应,从而使得交叉表中的每个结点的值反映不同变量的某些特征。的某些
50、特征。第五节第五节 数据交叉列表分析数据交叉列表分析二、交叉列表分析中变量的确定二、交叉列表分析中变量的确定 在使用交叉列表进行分析时,变量的选择和确定是一个关键在使用交叉列表进行分析时,变量的选择和确定是一个关键性问题,它直接关系到分析结果正确与否。选择和确定交叉性问题,它直接关系到分析结果正确与否。选择和确定交叉列表分析中的变量,包括其内容和数量,应根据调查项目的列表分析中的变量,包括其内容和数量,应根据调查项目的特点具体确定。特点具体确定。第五节第五节 数据交叉列表分析数据交叉列表分析三、双变量交叉列表分析三、双变量交叉列表分析 双变量交叉列表分析是最基本的交叉列表分析方法。双变量交叉列