1、1 2 对市场调查资料的最佳利用,不是对市场调查资料的最佳利用,不是其字面上的内容,而是其可能暗示的其字面上的内容,而是其可能暗示的内容,要看出字里行间蕴含的意义。内容,要看出字里行间蕴含的意义。这些事实资料表明何种趋势、何种偏这些事实资料表明何种趋势、何种偏差、何种冲突、何种机会?对决策有差、何种冲突、何种机会?对决策有用的信息,也许就存在事实资料之外用的信息,也许就存在事实资料之外。-马克麦考马克39.19.1市场调查资料整理的含义与程序市场调查资料整理的含义与程序含义含义:n资料的整理资料的整理是指对通过各种方法收集到的资料加是指对通过各种方法收集到的资料加以整理、分析及统计运算,把庞大
2、的、复杂的、零以整理、分析及统计运算,把庞大的、复杂的、零散的资料集中简化散的资料集中简化、系统化和条理化,使资料变成系统化和条理化,使资料变成易于理解和解释的形式易于理解和解释的形式。4意意 义义 可以对调查工作进行全面检查可以对调查工作进行全面检查是进一步研究资料的基础是进一步研究资料的基础。整理资料是调查积累保存资料的要求整理资料是调查积累保存资料的要求产生新的信息产生新的信息5 整理资料的原则整理资料的原则n1 1、真实性原则、真实性原则n 真实是整理资料的最根本的原则。真实是整理资料的最根本的原则。n2 2、准确性原则、准确性原则n3 3、完整性原则、完整性原则n4 4、统一性原则、
3、统一性原则n5 5、条理性原则、条理性原则n6 6、简明性原则、简明性原则69.2市场调查资料整理的程序设设计计汇汇总总方方案案审审核核原原始始资资料料对对资资料料进进行行分分类类分分组组对对资资料料进进行行汇汇总总资资料料整整理理结结果果显显示示市场调查资料整理程序市场调查资料整理程序7(一)设计汇总方案n汇总方案的设计主要包括三个方面的内容:汇总方案的设计主要包括三个方面的内容:n 1 1、一套综合表、包括一系列分类分组所、一套综合表、包括一系列分类分组所构成的分组体系。构成的分组体系。n 2 2、填表说明,包括汇总的范围、程序、填表说明,包括汇总的范围、程序、分组方法、指标解释和计算方法
4、。分组方法、指标解释和计算方法。n 3 3、分类目录设计汇总方案是资料整理工、分类目录设计汇总方案是资料整理工作有计划进行的前提。作有计划进行的前提。8(二二)审核原始资料审核原始资料n资料的审核的内容包括及时性、完整性、有效性资料的审核的内容包括及时性、完整性、有效性和正确性。和正确性。n及时性是指所填资料是否是最新资料。及时性是指所填资料是否是最新资料。n完整性是看是否有缺损问卷;是否都填写齐全;完整性是看是否有缺损问卷;是否都填写齐全;是否有答案模糊不清的问卷。是否有答案模糊不清的问卷。n有效性是指审核访谈是否按适当的方式进行,访有效性是指审核访谈是否按适当的方式进行,访问员有没有作假行
5、为等。问员有没有作假行为等。9资料审核的方法资料审核的方法1 1、经验法经验法,即根据以往的实践经验来判断资料的真实性。该,即根据以往的实践经验来判断资料的真实性。该方法一般需找有经验的专家或者实践经验丰富的调查人员实方法一般需找有经验的专家或者实践经验丰富的调查人员实施。施。2 2、逻辑法逻辑法,即根据调查资料的内在逻辑来检验资料的真实,即根据调查资料的内在逻辑来检验资料的真实性。如果发现调查资料前后矛盾,或者违背事物发展的逻辑性。如果发现调查资料前后矛盾,或者违背事物发展的逻辑即为不真实的资料。即为不真实的资料。3 3、来源法来源法,即根据资料来源渠道来判断资料的真实性。一,即根据资料来源
6、渠道来判断资料的真实性。一般来讲,调查中当事人反映的情况比局外人反映的情况可靠般来讲,调查中当事人反映的情况比局外人反映的情况可靠性大一些;多数人反映的情况比少数人反映的情况可靠性大性大一些;多数人反映的情况比少数人反映的情况可靠性大一些;有文字记录在案的情况比在人群中口耳相传的情况可一些;有文字记录在案的情况比在人群中口耳相传的情况可靠性大一些;政治经济稳定时期的资料比不稳定时期资料可靠性大一些;政治经济稳定时期的资料比不稳定时期资料可靠性大一些。靠性大一些。10n无效问卷确定之一:无效问卷确定之一:n在同一份问卷中,有相当一部分题目没有作答的在同一份问卷中,有相当一部分题目没有作答的问卷;
7、问卷;n答案记录模糊不清的问卷,如字迹不清楚,无法答案记录模糊不清的问卷,如字迹不清楚,无法辩认,或把辩认,或把“”打在两个答案之间等;打在两个答案之间等;n不符合作答要求,如不应该回答的问题问卷中做不符合作答要求,如不应该回答的问题问卷中做了回答;了回答;n调查对象不符合要求,如有的针对性较强的产品调查对象不符合要求,如有的针对性较强的产品,在调查使用效果时,无关人员不能成为调查对,在调查使用效果时,无关人员不能成为调查对象,否则此问卷为无效;象,否则此问卷为无效;11n无效问卷确定之二:无效问卷确定之二:n问卷中答案之间前后矛盾或有明显错误,如没用问卷中答案之间前后矛盾或有明显错误,如没用
8、过本产品,却对本产品的功效表达用后感受;过本产品,却对本产品的功效表达用后感受;n答案选择可疑,如只选第一个答案,或开放式答答案选择可疑,如只选第一个答案,或开放式答案均不作答;案均不作答;n问卷缺损,如个别页码丢失,或页面破损,影响问卷缺损,如个别页码丢失,或页面破损,影响到阅读。到阅读。12资料审核应注意的问题资料审核应注意的问题n在审核中,如发现问题可以分不同的情况予以处理在审核中,如发现问题可以分不同的情况予以处理:n(1)对于在调查中已发现并经过认真核实后确认)对于在调查中已发现并经过认真核实后确认的错误,可以由调查者代为更正。的错误,可以由调查者代为更正。n(2)对于资料中可疑之处
9、或有错误与出入的地方)对于资料中可疑之处或有错误与出入的地方,应进行补充调查。,应进行补充调查。n(3)无法进行补充调查的应坚决剔除那些有错误)无法进行补充调查的应坚决剔除那些有错误的资料,以保证资料的真实准确的资料,以保证资料的真实准确。13(三三)对资料进行分类分组对资料进行分类分组n根据整理方案中所设计的分类标准和分组根据整理方案中所设计的分类标准和分组标志,对原始资料进行分类分组。标志,对原始资料进行分类分组。n如果是文字资料,则进行分类;如果是数如果是文字资料,则进行分类;如果是数字资料,则进行分组。不论是分类或分组字资料,则进行分组。不论是分类或分组,都要遵循互斥和完备的原则,都要
10、遵循互斥和完备的原则。141 1、资料分类的含义和要求、资料分类的含义和要求 是根据资料的性质、内容或特征,将相异的资是根据资料的性质、内容或特征,将相异的资料区别开来,将相同或相近的资料合为一类的过程料区别开来,将相同或相近的资料合为一类的过程。分类是否正确,取决于分类标准是否科学。分类是否正确,取决于分类标准是否科学。分类标准的确定必须以科学理论为指导,以客观事分类标准的确定必须以科学理论为指导,以客观事实为依据。实为依据。15调查资料的分类方法调查资料的分类方法n有前分类法和后分类法两种。有前分类法和后分类法两种。n 1 1前分类法,就是在设计调查提纲、调查表格时前分类法,就是在设计调查
11、提纲、调查表格时,就按照事物的性质不同设计调查指标,然后再按,就按照事物的性质不同设计调查指标,然后再按分类指标搜集资料。这样分类工作在调查前就完成分类指标搜集资料。这样分类工作在调查前就完成了。了。n 2 2后分类法,是指在调查资料理集起来之后,再后分类法,是指在调查资料理集起来之后,再根据资料的性质、内容或特征,将它们分类。对于根据资料的性质、内容或特征,将它们分类。对于一些文献资料、访谈调查、问卷调查中的开放型问一些文献资料、访谈调查、问卷调查中的开放型问题因无法事先知道分类标准,就只能采用后分类法题因无法事先知道分类标准,就只能采用后分类法。16分类必须遵循两条基本原则分类必须遵循两条
12、基本原则n穷举原则和相斥原则。穷举原则和相斥原则。n穷举没有遗漏,把所有的资料都包括进去,使每穷举没有遗漏,把所有的资料都包括进去,使每一条资料都要有所归属。一条资料都要有所归属。n相斥即不重复,就是同一条资料只能归于一类,相斥即不重复,就是同一条资料只能归于一类,而不能既属于这一类,又属于那一类,以至在不而不能既属于这一类,又属于那一类,以至在不同类中重复出现。同类中重复出现。17三、文字资料的录入和汇编三、文字资料的录入和汇编n汇编是指按调查目的和要求对分类后的资料进行汇编是指按调查目的和要求对分类后的资料进行汇总和编辑,使之成为能反映调查对象客观情况汇总和编辑,使之成为能反映调查对象客观
13、情况的系统、完整、集中和简明的材料。的系统、完整、集中和简明的材料。n录入是将经过编码的数据资料输入计算机的存储录入是将经过编码的数据资料输入计算机的存储设备(软盘、硬盘或闪存)中,这样便可供计算设备(软盘、硬盘或闪存)中,这样便可供计算机统计分析了。机统计分析了。181、汇编n汇编的方法:根据调查目的、要求和调查对象的客汇编的方法:根据调查目的、要求和调查对象的客观情况确定合理的逻辑结构;对分类资料进行初观情况确定合理的逻辑结构;对分类资料进行初步加工。如给各种资料加上标题、符号,编上序号步加工。如给各种资料加上标题、符号,编上序号等。等。n 汇编的要求:完整和系统。即所有可用的资汇编的要求
14、:完整和系统。即所有可用的资料经汇编后要分类编在一起,应秩序分明,有条有料经汇编后要分类编在一起,应秩序分明,有条有理,能系统地反映被调查对象的全貌;简明和集中理,能系统地反映被调查对象的全貌;简明和集中。即尽可能使文字简单明了,清晰集中。如有必要。即尽可能使文字简单明了,清晰集中。如有必要,还要注明资料的来源和出处。,还要注明资料的来源和出处。192.2.录入录入n数据的录入形式有两种,一种是以单独数据文件的形式录入和存在,另一种是直接录入专门的统计分析软件中(如Excell、SPSS)。209.3 9.3 调查资料的定性分析调查资料的定性分析n1 1、定性分析的概念及原则、定性分析的概念及
15、原则n定性分析是与定量分析相对而言的,它是对不能量定性分析是与定量分析相对而言的,它是对不能量化的现象进行系统化理性认识的分析,其方法依据化的现象进行系统化理性认识的分析,其方法依据是科学的哲学观点、逻辑判断及推理,其结论是对是科学的哲学观点、逻辑判断及推理,其结论是对事物的本质、趋势及规律的性质方面的认识。事物的本质、趋势及规律的性质方面的认识。n定性分析有如下特点:分析的对象是访谈记录、二定性分析有如下特点:分析的对象是访谈记录、二手资料,分析的直接目的是要证实或证伪研究假设手资料,分析的直接目的是要证实或证伪研究假设,对市场现象得出理论认识、分析强调纵式关系。,对市场现象得出理论认识、分
16、析强调纵式关系。212 2、定性资料的分析方法、定性资料的分析方法理论分析理论分析n理论分析,是运用概念、判断和推理等思维形式,理论分析,是运用概念、判断和推理等思维形式,对客观事物的本质和内在联系进行系统的分析。对客观事物的本质和内在联系进行系统的分析。n理论分析具有如下的特点:理论分析具有如下的特点:n 1.是对客观事物的本质和内在联系的认识,而不是对客观事物的本质和内在联系的认识,而不是对客观事物的现象和外在联系的认识。是对客观事物的现象和外在联系的认识。n 2.借助概念、判断和推理的形式作出判断,而不借助概念、判断和推理的形式作出判断,而不是运用感觉、知觉和表象作出判断。是运用感觉、知
17、觉和表象作出判断。n 3.是对客观事物的系统化的认识,而不是支离破碎是对客观事物的系统化的认识,而不是支离破碎的杂乱无章的认识。的杂乱无章的认识。n 4.分析的结果具有普遍性,可以拿它进行演绎推分析的结果具有普遍性,可以拿它进行演绎推理。理。22常用的定性分析方法常用的定性分析方法n一、比较分析法一、比较分析法n (一一)比较分析法的涵义比较分析法的涵义n 比较分析法,是确定认识对象之间相异点和相同比较分析法,是确定认识对象之间相异点和相同点的逻辑思维方法。在调查资料的理论分析中,当点的逻辑思维方法。在调查资料的理论分析中,当需要通过比较两个或两个以上事物或者对象的异同需要通过比较两个或两个以
18、上事物或者对象的异同来达到对某个事物的认识时,就需要采用比较分析来达到对某个事物的认识时,就需要采用比较分析的方法。的方法。n 23(二二)比较分析法的种类比较分析法的种类n1横向比较法,就是根据同一标准对不同认识横向比较法,就是根据同一标准对不同认识对象进行比较的方法。它可以是同类事物之间的对象进行比较的方法。它可以是同类事物之间的比较;也可以是不同类的事物之间的比较;可以比较;也可以是不同类的事物之间的比较;可以是同一事物不同方面的比较等。是同一事物不同方面的比较等。n 2纵向比较法,就是对同一认识对象在不同时纵向比较法,就是对同一认识对象在不同时期的特点进行比较的方法。它可以是同一事物不
19、期的特点进行比较的方法。它可以是同一事物不同时期之间的比较。同时期之间的比较。n 3理论与事实比较法,就是把某种理论观点与理论与事实比较法,就是把某种理论观点与客观事实进行比较的方法。理论与事实的比较过客观事实进行比较的方法。理论与事实的比较过程,实质上就是用客观事实检验理论的过程。程,实质上就是用客观事实检验理论的过程。24n因果分析法,是探求事物或现象之间因果联因果分析法,是探求事物或现象之间因果联系的方法。系的方法。分析的内容有三点:分析的内容有三点:n 1找出构成因果关系的事物。找出构成因果关系的事物。n 2确定因果关系的性质。确定因果关系的性质。n 3对因果关系的程度作出解释。对因果
20、关系的程度作出解释。n二、因果分析法二、因果分析法25因果分析法的种类因果分析法的种类1求同法。求同法。求同法的规则是:如果在所研究的现象出求同法的规则是:如果在所研究的现象出现的两个或两个以上的场合中,只有一个是共同的,现的两个或两个以上的场合中,只有一个是共同的,那么这个共同的情况可能是所研究现象的原因。那么这个共同的情况可能是所研究现象的原因。n 2求异法求异法。求异法的原则是:如果所研究的现象出。求异法的原则是:如果所研究的现象出现的场合与它不出现的场合之间只有一点不同,即在现的场合与它不出现的场合之间只有一点不同,即在一个场合中有某个情况出现,而在另一个场合中这个一个场合中有某个情况
21、出现,而在另一个场合中这个情况不出现,那么这个情况可能是被研究现象的原因情况不出现,那么这个情况可能是被研究现象的原因。n3同异并求法同异并求法。同异并求的法则是:如果在出现所研。同异并求的法则是:如果在出现所研究的现象的几个场合中,都存在着一个共同的情况,究的现象的几个场合中,都存在着一个共同的情况,在所研究的现象不出现的几个场合中,都没出现这个在所研究的现象不出现的几个场合中,都没出现这个情况,那么这个情况可能是所研究的现象的原因。情况,那么这个情况可能是所研究的现象的原因。262728四、演绎法四、演绎法n是从一般性前提推出个别性结论的逻辑思维方式。是从一般性前提推出个别性结论的逻辑思维
22、方式。n演绎推理的类型有许多种,演绎推理可分为:性质演绎推理的类型有许多种,演绎推理可分为:性质推理和关系推理。推理和关系推理。n性质推理又可分为:直接和间接推理。性质推理又可分为:直接和间接推理。n关系推理又可分为:简单关系推理和复杂关系推理关系推理又可分为:简单关系推理和复杂关系推理。29n演绎的基本形式是三段论式,它包括:演绎的基本形式是三段论式,它包括:(1)大前提,是已知的一般原理或一般性假设)大前提,是已知的一般原理或一般性假设;(2)小前提,是关于所研究的特殊场合或个别)小前提,是关于所研究的特殊场合或个别事实的判断,小前提应与大前提有关;事实的判断,小前提应与大前提有关;(3)
23、结论,是从一般已知的原理(或假设)推)结论,是从一般已知的原理(或假设)推出的,对于特殊场合或个别事实作出的新判断。出的,对于特殊场合或个别事实作出的新判断。n比如:(比如:(1)大前提:高收入群体都喜欢购买名)大前提:高收入群体都喜欢购买名牌产品;牌产品;(2)小前提:张三年收入很高;)小前提:张三年收入很高;(3)结论:)结论:张三喜欢买名牌。张三喜欢买名牌。30五、结构功能法五、结构功能法n结构是构成事物的各个要素之间所固有的相对稳结构是构成事物的各个要素之间所固有的相对稳定的组织方式或联结方式。功能是指构成事物的定的组织方式或联结方式。功能是指构成事物的各个要素之间所发生的相互作用和影
24、响。各个要素之间所发生的相互作用和影响。n结构功能法结构功能法就是通过考察事物的结构和功能来认就是通过考察事物的结构和功能来认识事物和分析事物的方法。识事物和分析事物的方法。n 任何事物都有一定的结构。结构体现为要素的任何事物都有一定的结构。结构体现为要素的组合,各要素借助于结构而形成系统。组合,各要素借助于结构而形成系统。n结构有两个特征:一是稳定性,一是有序性。结构有两个特征:一是稳定性,一是有序性。31结构功能的作用结构功能的作用n 结构功能法有如下的几个作用:结构功能法有如下的几个作用:n1 1、从形式上分析事物的内部关系,即事物的内、从形式上分析事物的内部关系,即事物的内部结构。部结
25、构。n2 2、从内容上分析事物内部各要素之间的相互作、从内容上分析事物内部各要素之间的相互作用和影响,即事物的内部功能。用和影响,即事物的内部功能。n3 3、从事物的总体上分析事物系统对社会的影响、从事物的总体上分析事物系统对社会的影响和作用,即事物的外部功能。和作用,即事物的外部功能。32结构功能法的实施步骤结构功能法的实施步骤 1 1、事物系统分析。即明确结构和功能的承担者。、事物系统分析。即明确结构和功能的承担者。n2 2、内部结构分析。考察各组成要素之间在形式上、内部结构分析。考察各组成要素之间在形式上的排列和分布。的排列和分布。n3 3、内部功能分析。考察各组成要素之间的相互影、内部
26、功能分析。考察各组成要素之间的相互影响和作用。包括三项内容:响和作用。包括三项内容:A A确定功能关系的性确定功能关系的性质,即分析有无相互影响和作用。质,即分析有无相互影响和作用。B B挖掘功能存挖掘功能存在和建立的必要条件,即分析在何种条件下各要素在和建立的必要条件,即分析在何种条件下各要素间的相互影响和作用才可能存在和建立起来。间的相互影响和作用才可能存在和建立起来。C C找出满足功能的机制,即分析促使各要素之间发生找出满足功能的机制,即分析促使各要素之间发生相互影响和作用的手段和方法。相互影响和作用的手段和方法。33n4 4、外部功能分析。、外部功能分析。n考察事物整体对社会的影响和作
27、用。亦即把研究考察事物整体对社会的影响和作用。亦即把研究对象和现象放在社会系统之中,考察它对社会各对象和现象放在社会系统之中,考察它对社会各个方面的影响和作用。个方面的影响和作用。n包括两项基本内容:包括两项基本内容:A A、分析对社会哪些方面发、分析对社会哪些方面发生作用和影响。生作用和影响。B B分析功能的性质,即对社会分析功能的性质,即对社会的作用和影响哪些是积极的,哪些是消极的;哪的作用和影响哪些是积极的,哪些是消极的;哪些是明显的,哪些是潜在的;哪些是长期的,哪些是明显的,哪些是潜在的;哪些是长期的,哪些是短暂的等等。些是短暂的等等。34F检查问卷检查问卷F数据的编辑数据的编辑F数据
28、编码数据编码F数据录入数据录入F数据清理数据清理第第1010章章 定量数据的整理定量数据的整理36检查问卷检查问卷 问卷的初步检查通常是在现场工作实施的过程中进行问卷的初步检查通常是在现场工作实施的过程中进行的的问卷的某些部分填写不完整问卷的某些部分填写不完整调查对象的回答表明调查员没有弄清楚问题的含义或调查对象的回答表明调查员没有弄清楚问题的含义或没有阅读说明没有阅读说明调查对象的差异性不大调查对象的差异性不大返回调查问卷部分丢失返回调查问卷部分丢失问卷的回收超过时限问卷的回收超过时限问卷的填写人不符合调查要求问卷的填写人不符合调查要求37数据的编辑数据的编辑 数据编辑是为了提高问卷数据的准
29、确性而进行的再检查,目数据编辑是为了提高问卷数据的准确性而进行的再检查,目的是筛选出问卷中的是筛选出问卷中看不清楚看不清楚、不完整不完整、不一致不一致或或模棱两可模棱两可的的答案答案 对不合格的问卷进行处理对不合格的问卷进行处理:1:1、返回现场工作:、返回现场工作:有缺失值的问卷数很少有缺失值的问卷数很少每份有缺失值的问卷中的缺失值所占的比例较小每份有缺失值的问卷中的缺失值所占的比例较小有缺失值的变量不是关键变量有缺失值的变量不是关键变量不合格的问卷比例较小不合格的问卷比例较小2 2、填补缺失值、填补缺失值抽样数量很大时抽样数量很大时不合格问卷与合格问卷没有明显的差别时不合格问卷与合格问卷没
30、有明显的差别时3 3、丢弃不合格问卷:、丢弃不合格问卷:关键变量的缺失关键变量的缺失不合格答案的比重较大不合格答案的比重较大38数据编码数据编码 数据编码是为每个问题的可能的答案分配一个代码数据编码是为每个问题的可能的答案分配一个代码,通常是一个数字。,通常是一个数字。通常开放题和半开放题需要进行编码;通常开放题和半开放题需要进行编码;将所记录的答案归类整理,相同或相近意思的答案将所记录的答案归类整理,相同或相近意思的答案归为一类;归为一类;为每一类分配一个唯一代码。为每一类分配一个唯一代码。39数据录入数据录入 将调查问卷中的信息录入计算机内,形成数据文件将调查问卷中的信息录入计算机内,形成
31、数据文件以供统计分析之用。以供统计分析之用。通常情况下,调研公司都是将数据录入两遍,然后通常情况下,调研公司都是将数据录入两遍,然后作检验,来控制录入的错误;作检验,来控制录入的错误;如果时间和经费有限,加上数据输入人员错误率很如果时间和经费有限,加上数据输入人员错误率很低时,只核实低时,只核实25%50%25%50%的数据就可以了。的数据就可以了。40数据清理数据清理 数据清理包括检查数据一致性和缺失值数据清理包括检查数据一致性和缺失值数据一致性检查是为了找出超出正常范围、逻辑上数据一致性检查是为了找出超出正常范围、逻辑上不合理或者极端的取值;不合理或者极端的取值;缺失值就是对某个变量的取值
32、不明,原因可能是调缺失值就是对某个变量的取值不明,原因可能是调查对象的答案不清楚或者记录不完整。查对象的答案不清楚或者记录不完整。中性值代替中性值代替用估计值代替用估计值代替整列删除整列删除结对删除结对删除41第第1111章章 定量数据的定量数据的一、频数分布一、频数分布二、交叉表二、交叉表三、集中趋势指标三、集中趋势指标四、差异性指标四、差异性指标五、分布形状的指标五、分布形状的指标一、频数分布一、频数分布F概念概念F频率分析频率分析F统计图形统计图形44频数分布有时营销调研人员需要了解有关单个变量的信有时营销调研人员需要了解有关单个变量的信息息本品牌的使用者中有多少称得上是品牌忠诚者?本品
33、牌的使用者中有多少称得上是品牌忠诚者?有多少个顾客对新产品很熟悉?多少比较熟悉?有多少个顾客对新产品很熟悉?多少比较熟悉?有多少顾客对饭菜的口味满意?多少非常满意?多少有多少顾客对饭菜的口味满意?多少非常满意?多少不满意?不满意?频数分布:了解对一个变量选择不同取值的调频数分布:了解对一个变量选择不同取值的调查对象数量。查对象数量。变量中不同取值的出现频率以百分比的形式展现;变量中不同取值的出现频率以百分比的形式展现;对一个变量的频数分布会产生频数、百分比、对一个变量的频数分布会产生频数、百分比、累积百分比几个数据。累积百分比几个数据。45频数分布作用:作用:有助于明确未回答者的多少,同时也能
34、显示不合有助于明确未回答者的多少,同时也能显示不合格答案的多少;格答案的多少;可以检验奇异值和极端值;可以检验奇异值和极端值;根据频数分布可以划出各种统计图形。根据频数分布可以划出各种统计图形。46频数分布3:请问您所希望购买的户型是哪种?(单项选择)一室一厅一卫1两室一厅一卫2两室两厅一卫3两室两厅两卫4三室一厅 一卫5三室一厅两卫6三室两厅一卫7三室两厅两卫8四室两厅两卫9错层10跃层11其他(请注明)1247频数分布所想购买的户型所想购买的户型频数频数百分比百分比有效百分比有效百分比累积百分比累积百分比一室一厅一卫一室一厅一卫3 2.13 2.19 2.19 两室一厅一卫两室一厅一卫39
35、 27.66 28.47 30.66 两室两厅一卫两室两厅一卫12 8.51 8.76 39.42 两室两厅两卫两室两厅两卫9 6.38 6.57 45.99 三室一厅一卫三室一厅一卫32 22.70 23.36 69.34 三室一厅两卫三室一厅两卫15 10.64 10.95 80.29 三室两厅一卫三室两厅一卫4 2.84 2.92 83.21 三室两厅两卫三室两厅两卫10 7.09 7.30 90.51 四室两厅两卫四室两厅两卫1 0.71 0.73 91.24 措层措层2 1.42 1.46 92.70 越层越层2 1.42 1.46 94.16 其他其他8 5.67 5.84 100
36、.00 Total137 97.16 100.00 Missing4 2.84 Total141 100.00 48频数分布49频数分布50频数分布内部居住环境内部居住环境频数频数百分率百分率住宅标准住宅标准4331.39 住宅类型住宅类型3223.36 隔音隔音8864.23 隔热与保湿隔热与保湿7655.47 光照光照10979.56 日照日照8058.39 朝向朝向8763.50 通风通风13195.62 51频数分布二、交叉表二、交叉表F概念概念F频率分析频率分析53交叉表 使用行和列的形式对比表示数据使用行和列的形式对比表示数据本产品中男性消费者的满意比率是多少?女性消费本产品中男性
37、消费者的满意比率是多少?女性消费者满意的比率是多少呢?者满意的比率是多少呢?有多少高收入消费者对新产品很熟悉呢?多少比较有多少高收入消费者对新产品很熟悉呢?多少比较熟悉、知道一些或者不熟悉该品牌呢?熟悉、知道一些或者不熟悉该品牌呢?交叉表通常是由背景信息与题项作交叉分析获得。交叉表通常是由背景信息与题项作交叉分析获得。54交叉表所想购买的户型所想购买的户型2500-3499元元3500-4999元元5000-7999元元8000-9999元元10000元以元以上上中高收中高收入群体入群体一室一厅一卫一室一厅一卫4.3 1.4 两室一厅一卫两室一厅一卫42.9 17.4 20.0 26.0 两室
38、两厅一卫两室两厅一卫14.3 17.4 11.0 两室两厅两卫两室两厅两卫3.6 4.3 25.0 5.5 三室一厅一卫三室一厅一卫14.3 21.7 12.5 50.0 20.0 19.2 三室一厅两卫三室一厅两卫10.7 13.0 12.5 20.0 11.0 三室两厅一卫三室两厅一卫3.6 25.0 4.1 三室两厅两卫三室两厅两卫7.1 4.3 12.5 8.2 四室两厅两卫四室两厅两卫4.3 1.4 措层措层20.0 1.4 越层越层50.0 20.0 2.7 其他其他3.6 13.0 12.5 8.2 定量数据的描述统计分析定量数据的描述统计分析数据分布性质数据分布性质集中趋势集中
39、趋势离中趋势离中趋势分布形态分布形态三、集中趋势指标三、集中趋势指标F算术平均数算术平均数F中位数中位数F众数众数57平均数 平均数是将总体中所有个体的数量标志差异抽象化,平均数是将总体中所有个体的数量标志差异抽象化,用以反映现象在一定时间、地点条件下的一般水平或用以反映现象在一定时间、地点条件下的一般水平或代表性水平代表性水平.对象:个体单位的数量差异;对象:个体单位的数量差异;手段:将数量差异抽象化手段:将数量差异抽象化,即去差异;即去差异;目的:反映各个个体现象数值的一般水平,代表性水目的:反映各个个体现象数值的一般水平,代表性水平平58平均数F反映总体分布的集中趋势;反映总体分布的集中
40、趋势;F反映总体现象的共性特征;反映总体现象的共性特征;F是总体分布的重要数量特征值;是总体分布的重要数量特征值;F是现象规律性的数量表现。是现象规律性的数量表现。59平均数F总体分布的集中趋势总体分布的集中趋势:-1000:-1000 个大客户的地区分布个大客户的地区分布212198192164155121133989460平均数F总体现象的共性特征总体现象的共性特征捷达轿车捷达轿车:1:1没有奖品没有奖品:99999:99999集中趋势集中趋势:没有奖品没有奖品明天下雨的可能性是明天下雨的可能性是:80%:80%明天不下雨的可能性明天不下雨的可能性:20%:20%集中趋势是集中趋势是:明天
41、下雨明天下雨61骗人的“平均数”M M:吉斯莫先生有一个小工厂,生产超级小玩意儿:吉斯莫先生有一个小工厂,生产超级小玩意儿。M M:管理人员由吉斯莫先生、他的弟弟、六个亲戚:管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由组成。工作人员由5 5个领工和个领工和1010个工人组成。工厂经个工人组成。工厂经营得很顺利,现在需要一个新工人。营得很顺利,现在需要一个新工人。M M:现在吉斯莫先生正在接见萨姆,谈工作问题。:现在吉斯莫先生正在接见萨姆,谈工作问题。吉斯莫:我们这里报酬不错。平均薪金是每周吉斯莫:我们这里报酬不错。平均薪金是每周300300元。你在学徒期间每周得元。你在学徒期间每周
42、得7575元,不过很快就可以加元,不过很快就可以加工资。工资。62骗人的“平均数”M M:萨姆工作了几天之后,要求见厂长。:萨姆工作了几天之后,要求见厂长。萨姆;你欺骗我!我已经找其他工人核对过了,没萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周有一个人的工资超过每周100100元。平均工资怎么可能元。平均工资怎么可能是一周是一周300300元呢?元呢?吉斯莫:啊,萨姆,不要激动。平均工资是吉斯莫:啊,萨姆,不要激动。平均工资是300300元元。我要向你证明这一点。我要向你证明这一点。吉斯莫:这是我每周付出的酬金。我得吉斯莫:这是我每周付出的酬金。我得24002400元,我
43、元,我弟弟得弟弟得10001000元,我的六个亲戚每人得元,我的六个亲戚每人得250250元,五个元,五个领工每人得领工每人得200200元,元,1010个工人每人个工人每人100100元。总共是每元。总共是每周周69006900元,付给元,付给2323个人,对吧?个人,对吧?63骗人的“平均数”萨姆:对,对,对!你是对的,平均工资是每周萨姆:对,对,对!你是对的,平均工资是每周300300元。可你还是蒙骗了我。元。可你还是蒙骗了我。吉斯莫;我不同意!你实在是不明白。我已经把工吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是资列了个表,并告诉了你,工资的中位数
44、是200200元元,可这不是平均工资,而是中等工资。,可这不是平均工资,而是中等工资。萨姆:每周萨姆:每周100100元又是怎么回事呢?元又是怎么回事呢?吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:那称为众数,是大多数人挣的工资。吉斯莫:老弟,你的问题是出在你不懂平均数、中吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。位数和众数之间的区别。萨姆:好,现在我可懂了。我萨姆:好,现在我可懂了。我我辞职!我辞职!64算术平均数 算术平均数是集中趋势指标中最常用的一个统计量算术平均数是集中趋势指标中最常用的一个统计量,用于评估一个用定距或定比尺度衡量的数据均值,用于评估一个用定
45、距或定比尺度衡量的数据均值。数据都有一定的集中趋势,大部分回答应该分布。数据都有一定的集中趋势,大部分回答应该分布在均值附近。在均值附近。观察值个数观察值观察值的个数所有观察值之和算术平均数:nxnxx65中位数 将总体中的各个个体数值按照大小顺序排列,居于将总体中的各个个体数值按照大小顺序排列,居于中间位置的数值,便是中位数。中间位置的数值,便是中位数。中位数66中位数 1.1.是一种集中趋势或平均指标是一种集中趋势或平均指标 2.2.位于中间位置的数值位于中间位置的数值如果数据为奇数项,中位数是中间位置的数值如果数据为奇数项,中位数是中间位置的数值如果数据为偶数项,中位数是中间位置两个数值
46、的如果数据为偶数项,中位数是中间位置两个数值的平均数是一种位置平均数平均数是一种位置平均数 3.3.不受总体中极值的影响不受总体中极值的影响67中位数n数据:10.34.98.911.76.37.7n顺序:4.96.37.77.78.98.910.311.7n位置:123 34 45668众数众数 总体中出现次数最多的数值是众数。总体中出现次数最多的数值是众数。众数69众数1.1.集中趋势测定指标或平均指标集中趋势测定指标或平均指标2.2.出现次数最多的数值出现次数最多的数值3.3.不受总体中极值的影响不受总体中极值的影响4.4.可以没有众数,也可以有几个众数可以没有众数,也可以有几个众数70
47、众数无众数无众数数据:10.34.98.911.76.37.7一个众数一个众数数据:6.34.94.98.9 6.3 4.94.94.94.9一个以上的众数一个以上的众数数据:2128282828414343434371平均数的局限性 一个身高一个身高180180的不会游泳的人想涉水过河的不会游泳的人想涉水过河,已知河的已知河的平均深度为平均深度为1 1米米,此人是否过河此人是否过河?为什么为什么?某人想购买一台冰箱某人想购买一台冰箱,现有如下信息现有如下信息:冰箱品牌冰箱品牌 A BA B平均使用年限平均使用年限 10 1010 10最多使用年限最多使用年限 20 1220 12最少使用年限
48、最少使用年限 2 82 8四、差异性指标四、差异性指标F全距全距F方差和标准差方差和标准差73差异性指标 标志变异指标是测定总体中各个个体单位标志值差标志变异指标是测定总体中各个个体单位标志值差异的变动范围或差异程度的指标。异的变动范围或差异程度的指标。集中趋势74差异需要测定吗?孟子说孟子说“物之不齐,物之性也物之不齐,物之性也”。乃佛家之殊。乃佛家之殊相相 差异来自于大量现象的异质性或多变性差异来自于大量现象的异质性或多变性 大量现象相异之外,有其相同的一面。但经常大量现象相异之外,有其相同的一面。但经常是相异之处比相同之处更为显著。是相异之处比相同之处更为显著。统计分析的主题,便是一套研
49、究差异的技术。统计分析的主题,便是一套研究差异的技术。75规律性的重要补充F首先要充分接受差异,接受现象之个性首先要充分接受差异,接受现象之个性,使世界使世界丰富多彩丰富多彩;F然后是认识差异然后是认识差异,了解总体了解总体;F用集中趋势抽象差异用集中趋势抽象差异,得到总体一般水平得到总体一般水平;F结合差异,全面认识现象。结合差异,全面认识现象。76全距F测量的是数据的分散程度,就是样本中最大值测量的是数据的分散程度,就是样本中最大值与最小值之差。与最小值之差。全距直接到奇异值的影响全距直接到奇异值的影响反映标志值的变动范围反映标志值的变动范围全距计算简便,易于理解,应用普遍。全距计算简便,
50、易于理解,应用普遍。全距的计算全距的计算:全距全距=最大标志值最大标志值-最小标志值最小标志值77精确地描述差异-标准差F标准差是各单位标志值与标准差是各单位标志值与其平均数的离差平方的算其平均数的离差平方的算术平均数的平方根,它表术平均数的平方根,它表示每个标志值与平均数的示每个标志值与平均数的平均距离。平均距离。nxx2)(五、分布形状的指标五、分布形状的指标F偏度偏度F峰度峰度79偏度F理想的分布形态是对称的,但在现实生活中,理想的分布形态是对称的,但在现实生活中,现象之分布并不完全对称,而是或多或少地不现象之分布并不完全对称,而是或多或少地不同程度地存在着非对称情况,在统计上将这个同程