1、B1市场研究与spss数据分析B2目录SPSS在市场研究中的应用市场研究概述市场研究统计分析概述B3市场研究概述统计学(Statistics)是关于数据资料的 的一门学科收集整理分析推断市场(营销)研究(Marketing Research)AMA-是营销者通过信息与消费者、顾客和公众联系的一种职能。这些信息用于识别和定义营销问题与机遇,制定、完善和评估营销活动,监测营销绩效,改进对营销过程的理解。-确定解决问题所需的信息,设计信息收集方法,管理和实施数据收集过程,分析结果,就研究结论及其意义进行沟通。市场研究是以统计学为基础,基于信息收集处理与分析,利用SPSS等统计学工具进行的相关工作。B
2、4市场研究分类研究内容支持体调查方式分析方法深广度定性研究n动机、态度、决策过程n口头表达的信息n深访、座谈会n心理分析,经验/灵感n深度探测定量定量研究研究 n事实、意见、行为事实、意见、行为n数字、尺度数字、尺度n入户面访、街访、电话、信函入户面访、街访、电话、信函n统计分析统计分析n广度探测,多方面和表面广度探测,多方面和表面B5目录SPSS在市场研究中的应用市场研究概述市场研究统计分析概述B6市场研究数据分析的过程问卷设计数据录入和查错探索性分析确证/结论性分析高级分析分析始于这里!确信问卷覆盖你要达成研究目的所需要的全部内容。巧妇难为无米之炊!设计不严谨、信息不完备的问卷是任何“强有
3、力”统计工具的“毒药”!大量的交叉表数据,对研究结论进行支持。对关键/核心题目的数据进行简要分析,粗略把握研究发现,并生成初步的研究结论(可能只是假设)确信您获得了所需要的全部数据信息,并且它们是准确无误的。一方面,结合高级统计技术进行一些深入的数据挖掘和分析;一方面,将数据信息与营销理论结合,形成研究结论并给出建议。B7数据分析方法简单的数据分析多元统计分析方法适用性与优势主要方法列举n 集中趋势分析:众数、中位数、均数n 交叉表分析n简单分析变量间关系n相对应用较广,较容易掌握和使用n对数据和使用者的要求较低 n 相关分析n 回归分析n 因子分析n 聚类分析n 对应分析n分析变量间的因果关
4、系、相似度等n多用于预测、用户细分等场景n对数据要求:数据量要足够、数据周期要足够;n对使用者的要求:需要掌握基本的统计学知识和对业务有一定理解;B8目录SPSS在市场研究中的应用市场研究概述市场研究统计分析概述B9SPSS进行市场研究分析的步骤依据研究目的完成问卷设计-在此过程中注意问卷形式的标准化。标准化的调研实施过程,以保证收回数据的规范、有效。对收回问卷中的开放题答案进行编码。对调研数据在SPSS上进行数据录入。对数据进行机械校验与逻辑校验。对生成的SPSS格式数据文件进行分析处理。调研:数据收集SPSS上的操作B10J FrequenciesJ DescriptivesJCrosst
5、absJ MeansJ Bivariate CorrelationsJ Linear RegressionJ K-Means cluster AnalysisJ Correspondence AnalysisJScatterplot应用一例SPSS常用分析统计命令B11Frequencies:一维频数分布表了解变量的频次分布状况,对数值的数量特征和内部结构状况获得概况的认知,以方便在此基础上对数据进行进一步的归类整理。Frequencies的基本应用步骤如下:选择Frquencies选择项,打开相应对话框;选择需要进行频数分析的变量;依据需要在Statistics、Charts中选定希望输出的
6、统计量与图形;通过Format按钮可设置频数表输出格式;点击OK按钮运行命令;查看Output窗口中输出的统计结果:Frequency Table中输出的五列数据自左至右分别为:变量值、各变量值对应的出现频次(Frequency)、基于全体样本量的百分比构成(Percent)、基于本次计算的有效样本量的百分比构成(Valid Percent)、累加百分比(Cumulative Percent)。典型应用:定价策略B12Descriptives:描述统计利用Descriptives 可以求得变量的描述统计量以反映数据的集中趋势和离散趋势。集中趋势(Central Tendency)指标:众数(M
7、ode):发生率最高的数值;适用于所有的测量水平中位数(Median):数值排序后正好位于中间位置的数;适用于定序、定距、定比数据算术平均数或均值(Mean):各数值的简单平均;适用于定距数据与定比数据离散趋势(Measures of Dispersion)指标:全距或极差(Range):一个定序型变量最大值与最小值的差上、下四分位数:方差(Variance):一个变量所有值与其平均值之差的平方的平均数标准差(Standard Deviation):方差的平方根典型应用:一般统计B13Crosstabs:多维频数交叉分析Crosstabs多维频数分布交叉表:交叉列表分析过程生成二维和多维交叉表
8、。一个行变量和一个列变量可以形成一个二维交叉表,再指定一个控制变量就形成三维交叉表。如果可以指定多个行、列、控制变量,就会形成一个复杂的多维交叉表。表中的数据可以是数值型或字符型变量。使用交叉表分析过程可以完成分类资料或等级资料的统计描述和各种各样“常规”的统计检验。Crosstabs的基本应用步骤如下:选择Crosstabs选择项,打开相应对话框;自源变量中选择频数表的行变量放入Row(s)框;选择列变量放入Column(s)框;在Statistics中选择Chi-square,检验行列变量是否独立;在Cells中选择交叉表格中输出的统计量;点击点击OKOK按钮运行命令;按钮运行命令;查看O
9、utput窗口中输出的统计结果:Crosstabulation为输出的二维频数表。Pearson Chi-Square的值显示了行列变量双方独立,如该值小于0.05则说明行列变量相互间独立的假设不成立,即行列变量之间存在关联。注意Chi-Square Tests表格下面的注释,如该表国有部分单元格(Cell)内样本量分布过低,则该Pearson Chi-Square系数即使显著(小于0.05),这种行列变量之间的关联性也限于推论至本次分析的样本群体。典型应用:市场细分趋势预测B14Crosstabs:多维频数交叉分析总体年龄段人数高收入细分市场人数 列百分比 行百分比 指数 down acro
10、ss index%中收入细分市场人数 列百分比 行百分比 指数 down across index%低收入细分市场人数 列百分比 行百分比 指数 down across index%18-65岁18-24岁25-34岁35-49岁50-65岁500125150125100150 100 30 10039 26 31.2 10466 44 44 14733 22 26.4 8812 8 12 40150 100 30 10036 24 28.8 9642 28 28 9342 28 33.6 11230 20 30 100200 100 40 10050 25 40 10042 21 28 70
11、50 25 40 10058 29 58 145高收入细分市场该年龄段的列百分比高收入细分市场某年龄段的剖面指数=100%总体市场该年龄段的列百分比指数=100%是等于总体市场指数=120%或以上,则认为显著高于总体水平指数=80%或以下,则认为显著低于总体水平举例:18-24岁的高收入人群的行百分比:26%;指18-24岁高收入人群在整体高收入中的比例为26%;18-24岁的高收入人群的列百分比:31.2%;指18-24岁高收入人群在18-24岁人群中的比例为31.2%18-24岁的高收入人群的剖面指数:104;B15Means:均值比较可以按分类变量分组计算指定变量的综合描述统计量。Mea
12、ns的应用步骤如下:选择Means选择项,打开相应对话框;自源变量中选择分组变量放入Independent框内;选择目标分析变量放入Dependent框内;在Options中选择所要输出的统计量,同时,选择Anova检验变量组间是否存在差异;点击点击OKOK按钮运行命令;按钮运行命令;查看Output窗口中输出的统计结果:Report表中输出的是所考察变量按分类变量分组后相应的描述统计量;Anova Table中Sig.显示的是各变量组间差异显著性系数,若小于0.05则表明该变量依该分类变量分组后组间存在显著差异。典型应用:市场细分B16Bivariate Correlations:相关分析相
13、关分析用以计算两个变量的相关系数,用来判别两个变量之间的相关性强弱。Bivariate Correlations的应用步骤如下:选择Bivariate Correlations选择项,打开相应对话框;自源变量中选择要求相关系数的变量放入Variables框内;点击OK按钮运行命令;查看Output窗口中输出的统计结果:观察输出结果中A变量与B变量交叉单元格中的Pearson Correlation系数,此数值的绝对值越接近于1,则两变量间的相关性越强。典型应用:定价策略B17Linear Regression:线性回归检验一个因变量与一组自变量之间的关系,用以研究某一个变量的影响因素并建立线性
14、回归方程。Linear Regression的应用步骤如下:选择Linear Regression选择项,打开相应对话框;自源变量中选定自变量与因变量放入相应框中;在Statistics中除默认值外加入选择Collinearity Statistic;点击OK按钮运行命令;查看Output窗口中输出的统计结果:观察Coefficients表中Sig.值,该值小于0.05的自变量对因变量变化有显著影响,对应观察这些自变量的Unstandardized Coefficients B值(回归系数),这一系数的正负显示的是该自变量与因变量关系的方向,该系数绝对值越大表示自变量与因变量的关联性越强。典型
15、应用:定价策略趋势分析B18Linear Regression:线性回归案例:下表为某城市1999年到2007年相关经济数据年份商品房平均售价(元每平方米)城镇人均可支配收入(元)城市人口密度(人每平方公里)房地产开发投资额(亿元)1999.003422.0010931.641672.00514.832000.003565.0011718.011757.00566.172001.003866.0012883.461950.00630.732002.004134.0013249.801959.00748.892003.005118.0014867.491971.00901.242004.0058
16、55.0016682.821970.001175.462005.006842.0018645.032718.201246.862006.007196.0020667.912774.201275.592007.0010320.0023623.352931.001307.53若2008年,人均可支配收入达到27743.55元,城市人口密度达到3222.00人/平方公里,房地产开发投资达到1500.33亿元,请预测2008年该地商品房平均售价。B19K-Means cluster Analysis:快速聚类依据若干变量的表现特性对研究对象分类。K-Means cluster Analysis的应用步
17、骤如下:选择K-Means cluster Analysis选择项,打开相应对话框;自源变量中将要参与聚类的变量放入Variables框中;将样本标记变量放入查看Output窗口中输出Label Cases框中;在Number of中定义划分的类别数;在Save中选择Cluster mumbership(记录各case所属类别号,存放在数据窗口qcl-n变量中)、Distance from cluster center(记录各case与类中心的距离);在Options中除默认设置外,选择Anova table、Cluster imformation for each;点击OK按钮运行命令典型应
18、用:市场细分竞争分析B20啤酒名啤酒名热量热量钠含量钠含量酒精酒精价格价格Budweiser 144.00 19.00 4.70.43 Schlitz 181.00 19.00 4.90.43 Ionenbrau 157.00 15.00 4.90.48 Kronensourc 170.00 7.00 5.20.73 Heineken 152.00 11.00 5.00.77 Old-milnaukee145.00 23.00 4.60.26 Aucsberger 175.00 24.00 5.50.40 Strchsbohemi149.00 27.00 4.70.42 Miller-lite
19、 99.00 10.00 4.30.43 Sudeiser-lich113.00 6.00 3.70.44 Coors 140.00 16.00 4.60.44 Coorslicht 102.00 15.00 4.10.46 Michelos 135.00 11.00 4.20.50 Secrs 150.00 19.00 4.70.76 Kkirin 149.00 6.00 5.00.79 Pabst 68.00 15.00 2.30.36 Hamms 136.00 19.00 4.40.43 Heilemans144.00 24.00 4.90.43 Olympia 72.00 6.00 2
20、.90.46 Schlite 97.00 7.00 4.20.47以啤酒各竞争以啤酒各竞争品牌分类为例品牌分类为例K-Means cluster Analysis:快速聚类B21Correspondence Analysis:对应分析 依据几个并列的对象(如,几个竞争品牌)在若干特性(如,品牌特性)上的表现值,综合权衡各对象自身内部的特性比较与各对象间的对比状况,找出相对而言各对象的核心特性与边缘特性。表 品牌形象认知(提及比率%)品牌特性品牌A品牌B品牌C科技领先的47.530.826.5不断发展壮大的50.226.721.3值得信赖的55.726.920.9质量可靠的45.826.120.
21、6有社会责任感的52.819.515.1实力雄厚的50.020.219.3把消费者放在第一位的42.423.420.7与众不同的55.329.021.7物有所值的39.217.813.8基于如下数据举例说明:典型应用:品牌定位B22Correspondence Analysis:对应分析依据前述数据,构造一个Spss数据文件;其中包含三个变量:变量A中数据依次为品牌A至C在各特性上所获得的提及比率,变量B为品牌特性的序号,在此,对应变量A的数据排列,变量B中的数据为三段1至9的排列,变量C为品牌的序号,在此为9个1、9个2、9个3的排列。依据变量A对数据作加权;选择Correspondence
22、 Analysis 选择项,打开相应对话框;将变量A、B分别移入Row、Column框中;在Define range中定义变量A、B的范围,在此,分别为1至9与1至3;点击OK按钮运行命令。B23Correspondence Analysis:对应分析生成如下图形;红色点表示的是各个品牌特性,绿色点表示的是三个竞争品牌;与品牌落在同一象限的、相对距离较近的品牌特性是该品牌的核心特性,与某品牌处于对角象限的品牌特性点是与该品牌现有形象差距最大的品牌特性。B24Scatterplot:散点图基于如下数据进行SWOT分析:表 消费者对各产品特性的看重度与某品牌各特性表现的评分 重要性表现特性14.5
23、03.98特性23.793.87特性33.783.81特性43.823.53特性53.943.63特性64.463.71特性74.694.02特性84.163.72特性94.293.74特性104.223.70特性114.123.59特性124.163.75典型应用:SWOT分析B25依据前述数据,构造一个Spss数据文件;其中包含三个变量:变量A为各品牌特性所获得的重要性评价,变量B为某品牌在各特性上获得的表现评价,变量C为品牌特性序号;选择Scatterplot选择项,打开相应对话框;选择Simple形式,进行定义;以a变量作为Y轴、b变量作为X轴,c变量作为Label Cases;在Op
24、tions中选择Display chart with cases labels;点击点击OKOK按钮运行命令;按钮运行命令;Output输出如下图形:对此图形进行编辑,求a变量的平均值作为y轴的参照线,求b变量的平均值作为X轴的参照线,将此散点图划分为四个象限;Scatterplot:散点图B26A象限为消费者高度重视,某品牌表现较好的品牌特性,是该品牌的机会点;B象限为消费者高度重视,该品牌表现不够理想的品牌特性,是该品牌的威胁所在;D象限为消费者相对不太重视,该品牌表现较好的品牌特性,是该品牌的优势点;C象限为消费者相对不太重视,该品牌表现也不太理想的品牌特性,是该品牌的弱势部分。Scatterplot:散点图ABCD