1、1 6.1 6.1 调查资料的数据处理调查资料的数据处理 6.2 6.2 调查资料的分析调查资料的分析 目录目录第第6 6章章 调查资料的整理与分析调查资料的整理与分析 2学习目标学习目标p理论目标:理论目标:v学习和把握调查资料整理与分析的相关概念、调查资料审核的内容学习和把握调查资料整理与分析的相关概念、调查资料审核的内容和基本要求,无效问卷和不满意问卷包含的情况,编码的方式、原则,和基本要求,无效问卷和不满意问卷包含的情况,编码的方式、原则,编码簿的结构,统计图的类型等陈述性知识;能用所学理论知识指导编码簿的结构,统计图的类型等陈述性知识;能用所学理论知识指导调查资料整理与分析中的认知活
2、动。调查资料整理与分析中的认知活动。p实务目标:实务目标:学习与掌握调查资料数据处理的步骤,问卷处理方法,编码的各种方学习与掌握调查资料数据处理的步骤,问卷处理方法,编码的各种方法与技巧,统计表的制作,用法与技巧,统计表的制作,用EXCEL整理数据并绘制统计图,数据的整理数据并绘制统计图,数据的集中趋势分析与离散程度分析的方法,用集中趋势分析与离散程度分析的方法,用EXCEL处理数据描述统计与处理数据描述统计与数据间的相互关系的技巧,数据间的相互关系的技巧,“业务链接业务链接”所及程序性知识;能运用所所及程序性知识;能运用所学实务知识规范调查资料整理与分析中的技能活动。学实务知识规范调查资料整
3、理与分析中的技能活动。3学习目标学习目标p案例目标:案例目标:能正确运用所学调查资料的整理与分析的理论与实务知识研究相关案能正确运用所学调查资料的整理与分析的理论与实务知识研究相关案例,培养和提高学生在特定业务情境中分析问题与决策设计的能力;例,培养和提高学生在特定业务情境中分析问题与决策设计的能力;依照依照“职业道德与营销伦理职业道德与营销伦理”的行业规范与标准,分析企业行为的善的行业规范与标准,分析企业行为的善恶,强化学生的职业道德。恶,强化学生的职业道德。p实训目标:实训目标:v引导学生参加引导学生参加“调查资料的整理与分析调查资料的整理与分析”业务胜任力的实践训练。业务胜任力的实践训练
4、。在其了解和把握本实训所及在其了解和把握本实训所及“能力与道德领域能力与道德领域”相关技能点的相关技能点的“规范规范和标准和标准”基础上,通过切实体验基础上,通过切实体验“调查资料的整理与分析调查资料的整理与分析”各实训任各实训任务的完成、系列技能操作的实施等有质量、有效率的活动,培养其务的完成、系列技能操作的实施等有质量、有效率的活动,培养其“调查资料的整理与分析调查资料的整理与分析”的专业能力,强化其的专业能力,强化其“信息处理信息处理”、“数数字应用字应用”、“解决问题解决问题”和和“革新创新革新创新”等职业核心能力(初级),等职业核心能力(初级),并通过并通过“顺从级顺从级”践行践行“
5、职业观念职业观念”、“职业理想职业理想”、“职业态度职业态度”、“职业守则职业守则”等规范,促进其健全职业人格的塑造。等规范,促进其健全职业人格的塑造。4SunriseSunrise购物中心数据整理购物中心数据整理v SunriseSunrise购物中心是一家拥有百余家分店的购物中心。最近,管理人员发现购物中心是一家拥有百余家分店的购物中心。最近,管理人员发现需要更多地了解顾客的满意程度。艾米是需要更多地了解顾客的满意程度。艾米是SunriseSunrise购物中心的市场调查负责购物中心的市场调查负责人,现在她车子的后备箱中堆满了人,现在她车子的后备箱中堆满了10001000多份调查问卷。她仔
6、细看了许多问卷,多份调查问卷。她仔细看了许多问卷,很多问题的回答五花八门。很多问题的回答五花八门。v 艾米起初试图凭直觉了解对每个问题的一般答案,但后来她想比较顾客的年艾米起初试图凭直觉了解对每个问题的一般答案,但后来她想比较顾客的年龄、收入和来龄、收入和来SunriseSunrise购物中心的次数,以便更好地找出这些不同人群的特购物中心的次数,以便更好地找出这些不同人群的特征。虽然她急着想将这些调查问卷分类和进行手工计算,但她知道自己没有征。虽然她急着想将这些调查问卷分类和进行手工计算,但她知道自己没有时间做。一个人整理这些表格并记录下正确数据得花上一两周的时间。时间做。一个人整理这些表格并
7、记录下正确数据得花上一两周的时间。v 她应该怎样才能把这些信息变为一张分析所必需的详细摘要表呢?最笨的办她应该怎样才能把这些信息变为一张分析所必需的详细摘要表呢?最笨的办法是调查人员阅读所有的问卷,记下笔记,并从中得出结论,这显然是愚蠢法是调查人员阅读所有的问卷,记下笔记,并从中得出结论,这显然是愚蠢的行为。专业调查人员不用这种不正规并效率低的方法,而是遵循一个程序的行为。专业调查人员不用这种不正规并效率低的方法,而是遵循一个程序进行资料的处理与分析。进行资料的处理与分析。5 6.1 6.1 调查资料的整理调查资料的整理v6.1.1 意义v6.1.2 基本原则6 6.1 6.1 调查资料的资料
8、的整理调查资料的资料的整理 6.1.3数据处理的步骤数据的列示缺失数据的处理数据的编码和录入调查资料的审核7业务链接业务链接6-1 6-1 调查资料审核的方法调查资料审核的方法v 1 1、逻辑审核。逻辑审核就是分析标志、数据之间是否符合逻辑,各、逻辑审核。逻辑审核就是分析标志、数据之间是否符合逻辑,各个项目之间有无相互矛盾的地方。像个项目之间有无相互矛盾的地方。像“年龄年龄2020岁而工龄已经岁而工龄已经1515年年”就就属于明显的逻辑错误,要弄清情况,核准后予以纠正。属于明显的逻辑错误,要弄清情况,核准后予以纠正。v 2 2、计算审核。计算审核就是检查调查表中各项数字在计算方法和计、计算审核
9、。计算审核就是检查调查表中各项数字在计算方法和计算结果上是否有误,数字的计量单位有无与规定不符的地方等等。如算结果上是否有误,数字的计量单位有无与规定不符的地方等等。如中间数一般要小于或等于合计数,横行相加与纵列之和应相等或相吻中间数一般要小于或等于合计数,横行相加与纵列之和应相等或相吻合,否则就属于计算错误,应重新计算。合,否则就属于计算错误,应重新计算。v 3 3、抽样审核。抽样审核就是从全部调查资料中抽取一部分资料进行、抽样审核。抽样审核就是从全部调查资料中抽取一部分资料进行抽样检验,用以推断全部调查资料的准确程度,并修正调查结果的方抽样检验,用以推断全部调查资料的准确程度,并修正调查结
10、果的方法。法。8v1)调查资料审核的内容v(1)完整性审核 v(2)准确性审核 v(3)及时性审核 v(4)协调性审核 9同步案例同步案例6-1 6-1 错误的数据不如没有数据错误的数据不如没有数据v 国内一家知名的电视机生产企业,国内一家知名的电视机生产企业,20042004年初设立了年初设立了2020多人多人的市场研究部门,开展了同样的调研问卷,完全相同结构的市场研究部门,开展了同样的调研问卷,完全相同结构的抽样,两组数据结论却差异巨大。正是因为这次调查,的抽样,两组数据结论却差异巨大。正是因为这次调查,部门被注销、人员被全部裁减。部门被注销、人员被全部裁减。v 问题:列举您会选择的电视机
11、品牌?问题:列举您会选择的电视机品牌?v 其中一组的结论是:有其中一组的结论是:有15%15%的消费者选择本企业的电视机;的消费者选择本企业的电视机;另一组的得出的结论却是:另一组的得出的结论却是:36%36%的消费者表示本企业的产的消费者表示本企业的产品将成为其购买的首选。巨大的差异让公司高层非常恼火,品将成为其购买的首选。巨大的差异让公司高层非常恼火,为什么完全相同的调查抽样,会有如此矛盾的结果呢?公为什么完全相同的调查抽样,会有如此矛盾的结果呢?公司决定聘请专业的调研公司来进行调研诊断,找出问题的司决定聘请专业的调研公司来进行调研诊断,找出问题的真相。真相。10同步案例同步案例6-1 6
12、-1 错误的数据不如没有数据错误的数据不如没有数据v 普瑞辛格的执行小组受聘和参与调查执行的访问员进行交流,并很快普瑞辛格的执行小组受聘和参与调查执行的访问员进行交流,并很快提交了简短的诊断结论:第二组在进行调查执行过程中存在误导行为。提交了简短的诊断结论:第二组在进行调查执行过程中存在误导行为。调研期间,第二组的成员佩带了公司统一发放的领带,而在领带上有调研期间,第二组的成员佩带了公司统一发放的领带,而在领带上有本公司的标志,其标志足以让被访问者猜测出调研的主办方;其次,本公司的标志,其标志足以让被访问者猜测出调研的主办方;其次,第二组在调查过程中,把选项的记录板第二组在调查过程中,把选项的
13、记录板(无提示问题无提示问题)向被访问者出示,向被访问者出示,而本企业的名字处在侯选题板的第一位。以上两个细节,向被访问者而本企业的名字处在侯选题板的第一位。以上两个细节,向被访问者泄露了调研的主办方信息,影响了消费者的客观选择。泄露了调研的主办方信息,影响了消费者的客观选择。v 这家企业的老总训斥调研部门的主管:这家企业的老总训斥调研部门的主管:“如果按照你的数据,我要增如果按照你的数据,我要增加一倍的生产计划,最后的损失恐怕不止千万。加一倍的生产计划,最后的损失恐怕不止千万。”v 问题:本案例对你有何启示?问题:本案例对你有何启示?v 分析提示:市场调查是直接指导营销实践的大事,对错是非可
14、以得到分析提示:市场调查是直接指导营销实践的大事,对错是非可以得到市场验证,只是人们往往忽视了市场调查本身带来的风险。一句市场验证,只是人们往往忽视了市场调查本身带来的风险。一句“错错误的数据不如没有数据误的数据不如没有数据”,包含了众多中国企业家对数据的恐慌和无,包含了众多中国企业家对数据的恐慌和无奈。奈。11职业道德与营销伦理职业道德与营销伦理6-1 6-1 小郭的市场调查小郭的市场调查v 背景与情境:背景与情境:小郭在一次关于消费者购物习惯的调查中,要求采小郭在一次关于消费者购物习惯的调查中,要求采访十位经常在大型商场购物的、年龄在五十岁以上的男性消费者。由访十位经常在大型商场购物的、年
15、龄在五十岁以上的男性消费者。由于客观原因,小郭在规定的时间内寻找符合这样条件的被调查者面临于客观原因,小郭在规定的时间内寻找符合这样条件的被调查者面临一定的困难。当寻找到一位愿意配合完成问卷调查的被访者时,他的一定的困难。当寻找到一位愿意配合完成问卷调查的被访者时,他的年龄却不到五十岁,这时小郭便诱导这位被调查者,在公司进行电话年龄却不到五十岁,这时小郭便诱导这位被调查者,在公司进行电话审核时,请他帮忙谎称自己是五十岁,进而完成一份调查问卷。审核时,请他帮忙谎称自己是五十岁,进而完成一份调查问卷。v 问题问题:小郭的工作作风符合职业道德与营销伦理要求吗?小郭的工作作风符合职业道德与营销伦理要求
16、吗?v 分析提示分析提示:对市场调查资料进行审核包括完整性、准确性、及时性对市场调查资料进行审核包括完整性、准确性、及时性和协调性四方面的内容。而由访问员填写的、假的回答或伪造采访的和协调性四方面的内容。而由访问员填写的、假的回答或伪造采访的行为。严重影响了数据的准确性,降低了市场调查问卷的质量水平。行为。严重影响了数据的准确性,降低了市场调查问卷的质量水平。小郭调查的结果使得调查数据失准,调查真实性小郭调查的结果使得调查数据失准,调查真实性“掺水掺水”。所以小郭。所以小郭的工作作风违反了职业道德与营销伦理的要求。的工作作风违反了职业道德与营销伦理的要求。126.1.3 6.1.3 缺失数据的
17、处理缺失数据的处理v1)无效问卷v2)不满意的问卷 v3)不满意问卷的处理方法 131)无效问卷)无效问卷v(1)回答不完全 v(2)调查对象不符合要求 v(3)答案选择高度一致 v(4)截止日期后收回的问卷 142)不满意的问卷不满意的问卷 v(1)模糊不清 v(2)前后不一致或有明显错误的 v(3)模棱两可 v(4)不符合作答要求 153)不满意问卷的处理方法)不满意问卷的处理方法 v(1)重新调查 v(2)填充 v 找一个中间值代替 v 用一个逻辑答案代替 v 删除处理 v(3)空缺 16职业道德与营销伦理职业道德与营销伦理6-3 6-3 如此的市场调查如此的市场调查v 背景与情境:背景
18、与情境:A A公司在开展一次市场调查,问卷中有涉及到一些给某公司在开展一次市场调查,问卷中有涉及到一些给某项指标打分或者给出好、一般、不好等评价的题目,这些题目往往数项指标打分或者给出好、一般、不好等评价的题目,这些题目往往数目繁多,给人浪费时间的感觉。访问员在提问这样的问题时,被访者目繁多,给人浪费时间的感觉。访问员在提问这样的问题时,被访者感到厌烦,不经过思考而给出一致的答案,要么是相同的分数,要么感到厌烦,不经过思考而给出一致的答案,要么是相同的分数,要么全部选择一般这个选项。有时访问员为了缩短访问时间就会跳过这样全部选择一般这个选项。有时访问员为了缩短访问时间就会跳过这样的题目,提问其
19、他题目,待访问结束时,自行随意圈选或者按照配额的题目,提问其他题目,待访问结束时,自行随意圈选或者按照配额的要求伪造答案。的要求伪造答案。v 问题问题:这些访问员的工作作风是否符合职业道德与营销伦理要求?这些访问员的工作作风是否符合职业道德与营销伦理要求?v 分析提示分析提示:市场调查的真实性是指在真实的时间、地点对被调查者做市场调查的真实性是指在真实的时间、地点对被调查者做出了真实的访问,并真实地填写访问记录。但是由于某些市场调查从出了真实的访问,并真实地填写访问记录。但是由于某些市场调查从业人员操作的不规范,导致很多人心目中形成一种对市场调查错误的业人员操作的不规范,导致很多人心目中形成一
20、种对市场调查错误的印象,市场调查不过是填填问卷,开开座谈会而已。本例中的访问员印象,市场调查不过是填填问卷,开开座谈会而已。本例中的访问员填写假的回答,该行为严重影响了数据的真实性,降低了市场调查问填写假的回答,该行为严重影响了数据的真实性,降低了市场调查问卷的质量水平。所以这种工作作风违反了职业道德与营销伦理的要求。卷的质量水平。所以这种工作作风违反了职业道德与营销伦理的要求。176.1.4 6.1.4 数据的编码和录入数据的编码和录入v1)编码方式v2)编码的具体方法v3)编码簿的制作v4)数据录入v5)查错与核对181)编码方式)编码方式v(1)事前编码v(2)事后编码192)编码的具体
21、方法)编码的具体方法v(1)以答案的顺序编码v(2)以答案本身的数字编码v(3)对于无回答的要编特别号码203)编码簿的制作)编码簿的制作v(1)编码的基本原则v(2)编码簿的结构v代码所在的位置。v变量的名称及变量说明。v编码说明。215)查错与核对)查错与核对v(1)双机分别录入 v(2)部分复查 v(3)一致性查错与逻辑查错 226.1.56.1.5数据的展示数据的展示 1)统计表的制作(1)数据分组 有以下几个主要原则:(1)分组的组数应适当,以便能够真实地反映数据的差异。(2)各组内的回答应性质相同,答案相似;(3)各组之间应是互相排斥的,且又包含了所有的情形。23(2)频数表 频数
22、是指变量为某一取值的个数。(3)统计表制作的注意点 2425(1)简单柱状图)简单柱状图 26(2)复合柱状图)复合柱状图 27(3)简单曲线图)简单曲线图 28(4)复杂曲线图)复杂曲线图 29(5)饼状图)饼状图 306)统计图制作的注意事项)统计图制作的注意事项 一、每张图都要有号码和标题,标题要简明扼要 二、图标说明要简洁三、图形清楚简明 四、作图时最好既使用颜色,又使用文字说明,颜色的选择要有逻辑性,突出重要的部分 五、一般应说明数据的来源 31步骤步骤4 图形列示图形列示 32一、调查资料的描述性统计分析一、调查资料的描述性统计分析二、调查资料的推断性统计分析二、调查资料的推断性统
23、计分析33数据分布的特征数据分布的特征v集中趋势集中趋势 v(位置位置)v离中趋势离中趋势v(分散程度分散程度)v偏态和峰度偏态和峰度v(形状)(形状)一、调查资料的描述性统计分析一、调查资料的描述性统计分析34数据的特征和测度数据的特征和测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度一、调查资料的描述性统计分析一、调查资料的描述性统计分析35表表7-57-5 数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类型数据类型定类数据定类数据 定序数据定序数据定距数据定距数据定比数据定比数据适适用用的的测测度度值值众数众数中位数中位数算术平均数算术平均数算术平均数算术平
24、均数四分位数四分位数众数众数调和平均数调和平均数众数众数中位数中位数几何平均数几何平均数四分位数四分位数 中位数中位数四分位数四分位数众数众数红色为该数据类型最适合用的测度值红色为该数据类型最适合用的测度值一、调查资料的描述性统计分析一、调查资料的描述性统计分析36偏态与峰度分布的形状偏态与峰度分布的形状一、调查资料的描述性统计分析一、调查资料的描述性统计分析37数据分析数据分析开发数据资料的功能与作用开发数据资料的功能与作用数据解释数据解释v 以某种有意义的形式或次序把收集以某种有意义的形式或次序把收集的资料重新展现出来。的资料重新展现出来。v 资料分析的基础上,找出信息之间资料分析的基础上
25、,找出信息之间或与其他已知信息的联系。或与其他已知信息的联系。从所收集资料中获得结论从所收集资料中获得结论29%42%8%21%1小时以下1小时-3小时3小时-5小时5小时以上v每组资料里每组资料里有什么信息?有什么信息?一、调查资料的描述性统计分析一、调查资料的描述性统计分析38数据分析与解释数据分析与解释是相互联系与相互依赖是相互联系与相互依赖v案例一:案例一:A A牌牙膏是否应退出市场牌牙膏是否应退出市场v 假设某大型日用化工厂,每个季度要在全国假设某大型日用化工厂,每个季度要在全国的的5050个主要的大百货商场做一次库存检查,表中是个主要的大百货商场做一次库存检查,表中是A A牌老产品
26、和牌老产品和B B牌新产品在过去牌新产品在过去4 4季度里销售量的变化。季度里销售量的变化。两种不同产品销售量的比较两种不同产品销售量的比较季度季度A A牌(万支)牌(万支)B B牌(万支)牌(万支)1234100908575241530一、调查资料的描述性统计分析一、调查资料的描述性统计分析39v案例二:不同广告设计的效果分析案例二:不同广告设计的效果分析v假设一汽车公司对三种广告设计进行试验,以判断哪一种广假设一汽车公司对三种广告设计进行试验,以判断哪一种广告对提高汽车销售量最有效。在不同时间里分别对四个城市进告对提高汽车销售量最有效。在不同时间里分别对四个城市进行销售量的统计如下:行销售
27、量的统计如下:广告对汽车销售量的影响广告对汽车销售量的影响总计总计A AB BC C243124312064206419761976广告广告城市城市1 12 23 34 4508508481481516516976976613613560560489489528528464464458458442442436436A A广告最有效广告最有效一、调查资料的描述性统计分析一、调查资料的描述性统计分析40一、调查资料的描述性统计分析一、调查资料的描述性统计分析41三、数据的解释三、数据的解释一、调查资料的描述性统计分析一、调查资料的描述性统计分析42一、调查资料的描述性统计分析一、调查资料的描述性统
28、计分析43一、调查资料的描述性统计分析一、调查资料的描述性统计分析44数据的解释数据的解释方法方法数据的解释方法数据的解释方法操作操作描述法描述法综合说明法综合说明法归纳推理法归纳推理法演绎推理法演绎推理法对数字的简单描述对数字的简单描述综合说明,得出结论综合说明,得出结论从个别事例到一般原则从个别事例到一般原则把理论应用到具体事例中把理论应用到具体事例中原则原则数据的解释原则数据的解释原则操作操作考察数据的可靠性考察数据的可靠性真实又有分寸真实又有分寸目的明确,方法简练目的明确,方法简练小样本的局限性小样本的局限性善于发现新问题善于发现新问题依据事实,作出推理依据事实,作出推理不能夸张或歪曲
29、事实不能夸张或歪曲事实不要过于复杂不要过于复杂检验检验防止思维定势防止思维定势综合的理论分析综合的理论分析一、调查资料的描述性统计分析一、调查资料的描述性统计分析45表表 交通事故调查表交通事故调查表从未在驾驶中出事故从未在驾驶中出事故62 62%在驾驶中至少出过一次事故在驾驶中至少出过一次事故38 38%列总计列总计100 100%被调查人数被调查人数1403014030单因素列表单因素列表交叉列表分析技术交叉列表分析技术(一)单项频次表分析技术(一)单项频次表分析技术46根据调查项目的特点考虑列表的内容和数量根据调查项目的特点考虑列表的内容和数量意义意义确定变量确定变量 同时将两个或两个以
30、上有联系的变量及其变同时将两个或两个以上有联系的变量及其变量值交叉排列在一张统计表。量值交叉排列在一张统计表。深刻认识变量之间的关系及其分布情况深刻认识变量之间的关系及其分布情况(二)交叉列表分析技术(二)交叉列表分析技术表表7-3-1 7-3-1 居住时间与对百货公司熟悉程度关系表居住时间与对百货公司熟悉程度关系表熟悉情况熟悉情况居住时间居住时间行总计行总计小于小于1 10 0年年1 11-301-30年年3030年以上年以上不熟悉不熟悉熟悉熟悉454552523434535355552727134134132132总计总计97978787828226626647变量的选择和确定变量的选择和
31、确定-关系到分析结果的关键因素关系到分析结果的关键因素(三)交叉列表分析中变量的选择和确定(三)交叉列表分析中变量的选择和确定例例1 1:影响产品销售的因素分析:影响产品销售的因素分析v价格、价格、质量、品种、款式、花色、品牌、包装、体积质量、品种、款式、花色、品牌、包装、体积经营年限与业务增长之间的关系表经营年限与业务增长之间的关系表业务增长业务增长经营年限经营年限行总计行总计小于小于5 5年年5-105-10年年1010年以上年以上速度慢速度慢速度快速度快454552523434535355552727134134132132总计总计979787878282266266例例2 2:影响学生
32、学习积极性的因素分析:影响学生学习积极性的因素分析v性别、性别、年龄、学习环境年龄、学习环境48表表6-3-3 6-3-3 交通事故与性别的关系调查表交通事故与性别的关系调查表性别性别男性(男性(%)女性(女性(%)在驾驶中至少出过一次事故在驾驶中至少出过一次事故444432.432.4被调查人数被调查人数7080708069506950表表6-3-4 6-3-4 事故发生率与驾驶里程数的关系表事故发生率与驾驶里程数的关系表男性驾驶公里数男性驾驶公里数女性驾驶公里数女性驾驶公里数大于大于1500015000小于小于1500015000大于大于1500015000小小于于1500015000至少
33、出过一次事故至少出过一次事故52%52%25%25%52%52%25%25%被调查人数被调查人数50105010207020701915191550355035双因素列表双因素列表三因素列表三因素列表(四)交叉列表的种类(四)交叉列表的种类49表表6-3-5 6-3-5 年收入水平与受教育程度相关关系年收入水平与受教育程度相关关系6 6以下以下 6-86-88-108-1010-1210-1212-1512-15 15-2015-20 20-2520-25 2525以上以上合计合计小学或文盲小学或文盲初中初中高中高中大专大专本科本科研究生研究生2322321451451961961161162
34、9297 713613699992172178181565631316161454513713791913434111148488080187187139139434338384040515121721714814874744040464661612202202202201371377676161626261641641221221171178585131333331391391321321781781651655925925415411477147710491049668668453453合计合计725725620620380380535535575575760760530530660660
35、47804780受教育程度年收入(千元)v两变量交叉列表两变量交叉列表50按国内外按国内外 分组分组合计合计发明发明应用新型应用新型外观设计外观设计申请量申请量构成构成%申请量申请量构成构成 申请量申请量构成构成 申请量申请量构成构成 合计合计476264476264100.0100.017332717332736.4%36.4%13956613956629.3%29.3%16337116337134.3%34.3%国内国内38315738315780.5 80.5 934859348553.9 53.9 13808513808598.9 98.9 15158715158792.8 92.8
36、国外国外931079310719.519.5798427984246.1 46.1 148114811.1 1.1 11784117847.2 7.2 表表 2005 2005年中国专利申请量统计表年中国专利申请量统计表1 1、两变量交叉列表、两变量交叉列表512 2、三变量交叉列表三变量交叉列表表表7-3-8 7-3-8 婚姻状态与时装购买情况的关系婚姻状态与时装购买情况的关系时装购买情况时装购买情况婚姻状态婚姻状态已婚(已婚(%)未婚(未婚(%)高档高档低档低档3 38 8626252524848列总计列总计100100100100被调查人数被调查人数700700300300表表7-3-9
37、 7-3-9 婚姻状态、性别与时装购买情况的关系婚姻状态、性别与时装购买情况的关系时装购买情况时装购买情况男性男性女性女性已婚(已婚(%)未婚(未婚(%)已婚(已婚(%)未婚(未婚(%)高档高档低档低档35356565404060602525757560604040列总计列总计100100100100100100100100被调查人数被调查人数400400120120300300180180v更精确地反更精确地反映原有两变量映原有两变量之间的关系之间的关系522 2、三变量交叉列表三变量交叉列表表表7-3-10 7-3-10 受教育程度与拥有昂贵小轿车的关系受教育程度与拥有昂贵小轿车的关系拥有
38、昂贵小轿车拥有昂贵小轿车受教育程度受教育程度大学程度(大学程度(%)低于大学程度(低于大学程度(%)是是否否3232686821217979列总计列总计100100100100被调查人数被调查人数250250750750表表7-3-11 7-3-11 受教育程度、收入水平与拥有昂贵小轿车之间的关系受教育程度、收入水平与拥有昂贵小轿车之间的关系拥有昂拥有昂贵小轿贵小轿车车收入水平收入水平低收入低收入高收入高收入大学程度(大学程度(%)低于大学程度(低于大学程度(%)大学程度(大学程度(%)低于大学程(低于大学程(%)是是否否35356565404060602525757560604040列总计列
39、总计100100100100100100100100调查人数调查人数400400120120300300180180v拥有昂贵拥有昂贵小轿车与受小轿车与受教育程度有教育程度有关关v显示原有显示原有两变量的联两变量的联系是虚假系是虚假532 2、三变量交叉列表三变量交叉列表表表7-3-12 7-3-12 年龄与出国旅游愿望的关系年龄与出国旅游愿望的关系出国旅游的愿望出国旅游的愿望年龄年龄小于小于4545岁岁(%)4545岁以上岁以上(%)有有无无5050505050505050列总计列总计100100100100被调查人数被调查人数500500500500表表7-4-13 7-4-13 年龄、性
40、别与出国旅游愿望的关系年龄、性别与出国旅游愿望的关系出国旅游的出国旅游的愿望愿望收入水平收入水平男性年龄(男性年龄(%)女性年龄(女性年龄(%)小于小于4545岁岁(%)4545岁以上岁以上(%)小于小于4545岁岁(%)4545岁以上岁以上(%)有有无无60604040404060603535656565653535列总计列总计100100100100100100100100被调查人数被调查人数300300300300200200200200年龄不是影年龄不是影响人们愿否响人们愿否出国旅游的出国旅游的因素因素v显示原先显示原先被隐含的关被隐含的关系系542 2、三变量交叉列表三变量交叉列表表
41、表7-3-14 7-3-14 家庭收入水平与外出吃饭之间的关系家庭收入水平与外出吃饭之间的关系经常外出吃饭经常外出吃饭家庭收入家庭收入水平水平低收入(低收入(%)高收入(高收入(%)是是否否5 5959535356565列总计列总计100100100100被调查人数被调查人数500500500500表表7-3-15 7-3-15 家庭收入、家庭规模与外出吃饭之间的关系家庭收入、家庭规模与外出吃饭之间的关系经常外出吃饭经常外出吃饭收入水平收入水平低收入(低收入(%)高收入(高收入(%)规模小(规模小(%)规模大规模大(%)规模小规模小(%)规模大规模大(%)是是否否5 595955 595953
42、535656535356565列总计列总计100100100100100100100100调查人数调查人数250250250250200200200200v家庭收入家庭收入与经常外出与经常外出吃饭无关吃饭无关v原有的变原有的变量关系不变量关系不变552 2、三变量交叉列表三变量交叉列表原有二变量原有二变量二变量间具二变量间具有某些联系有某些联系二变量间二变量间无联系无联系引入第三变量引入第三变量引入第三变量引入第三变量更精确地显更精确地显示原二变量示原二变量间的联系间的联系原二变量间原二变量间不相关不相关无变化无变化原二变量间具原二变量间具有某些联系有某些联系56二、调查资料的推断性统计分析二
43、、调查资料的推断性统计分析v(一)区间估计(一)区间估计v(二)(二)Z Z检验与检验与t t 检验法检验法v(三)(三)2 2检验与检验与K-SK-S检验法检验法57v第三节第三节 双变量数据分析双变量数据分析双变量分析的统计工具双变量分析的统计工具依赖分析中依赖分析中变量和互相变量和互相依分析中变依分析中变量的量表性量的量表性质质描述性分析描述性分析推断分析推断分析依赖分析中自变量的量表分析依赖分析中自变量的量表分析互相分析互相分析等差和等比等差和等比量表数据量表数据顺序量表数顺序量表数据据类别量表数据类别量表数据等差和等比等差和等比量表数据量表数据简单回归分简单回归分析析n.an.a以哑
44、变量为自以哑变量为自变量的简单回变量的简单回归分析归分析简单相关分简单相关分析析回归系数的回归系数的t t检验检验双样本双样本t t检验检验方差分析(方差分析(ANOVAANOVA)顺序量表数顺序量表数据据n.an.aSpearmanSpearman排排序相关分析序相关分析n.an.a排序排序kendallkendall系数系数U U检验检验K-SK-S检验检验Mann-Whitney UMann-Whitney U检验检验WilcoxonWilcoxon方差分析方差分析类别量表数类别量表数据据判别分析判别分析简单简单logisticlogistic回归分析回归分析n.an.a权变系数权变系数
45、n.an.a卡方检验卡方检验McNemar Cochran QMcNemar Cochran Q586.2.26.2.2数据变量间的关系分析数据变量间的关系分析 v1)数据的方差分析 v2)数据的相关分析 59业务链接业务链接6-2 6-2 什么是方差分析什么是方差分析v v 方差分析(方差分析(ANOVAANOVA)又称)又称“变异数分析变异数分析”或或“F F检验检验”,是,是R.A.FisherR.A.Fisher发明的,发明的,用于两个及两个以上样本均数差别的显著性检验。用于两个及两个以上样本均数差别的显著性检验。v 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成由
46、于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。因素。v 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间以及显著影响因素的最佳水平等。方差分析是在可比较的数组
47、中,把数据间的总的的总的“变差变差”按各指定的变差来源进行分解的一种技术。对变差的度量,按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。源的部分离差平方和,这是一个很重要的思想。v 经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个相等。若要得到各组均数间更详细的信息,应在
48、方差分析的基础上进行多个样本均数的两两比较。样本均数的两两比较。60同步思考同步思考6-26-2v 背景与情境:背景与情境:在一家超市里,有一个有趣的现象:尿布和啤酒在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实事例,并一直为商家所津津乐道。原来,美国的店超市的真实事例,并一直为商家所津津乐道。原来,美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布。而丈妇女们经常会嘱
49、咐她们的丈夫下班以后要为孩子买尿布。而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的。是什么让沃尔玛发现了尿尿布在一起购买的机会还是很多的。是什么让沃尔玛发现了尿布和啤酒之间的关系呢?正是商家通过对超市一年多原始交易布和啤酒之间的关系呢?正是商家通过对超市一年多原始交易数字进行详细的分析,才发现了这对神奇的组合数字进行详细的分析,才发现了这对神奇的组合。v 思考:思考:如何从浩如烟海却又杂乱无章的数据中,发现啤酒和尿如何从浩如烟海却又杂乱无章的数据中,发现啤酒和尿布销售之间的联系呢?这给了我们什么样的
50、启示呢?布销售之间的联系呢?这给了我们什么样的启示呢?v 分析提示:分析提示:“啤酒啤酒”和和“尿布尿布”两个看上去没有关系的商品摆两个看上去没有关系的商品摆放在一起进行销售,并获得了很好的销售收益,这种现象就是放在一起进行销售,并获得了很好的销售收益,这种现象就是卖场中商品之间的相关性。商家正是通过对两种商品的销售数卖场中商品之间的相关性。商家正是通过对两种商品的销售数据进行的相关性分析而得出的结论。据进行的相关性分析而得出的结论。61调查资料的整理与分调查资料的整理与分析析一、调查资料的数据处理一、调查资料的数据处理调查资料的审核和整理调查资料的审核和整理缺失数据的处理缺失数据的处理数据的