1、第五章第五章 市场调查的数据分析市场调查的数据分析l市场调查数据分析的基本方法l假设检验法l方差分析法l聚类分析法l判别分析法5.1 市场调查数据分析的基本方法市场调查数据分析的基本方法l频数、频率分析l数据集中趋势分析 算术平均数 中位数 众数l数据分散趋势分析 全距(极差)四分位差 标准差5.1.1 频数、频率分析(频数、频率分析(1)l例1:假设有样本数据ABCDEFGHIJ112214653322611223254334413314335413456424635352112114662634551322763662365118415336463495132522262103252341
2、445 5.1.1 频数、频率分析(频数、频率分析(2)VAR000016.005.004.003.002.001.00Count2220181614125.1.1 频数、频率分析(频数、频率分析(3)VAR000011717.017.017.02020.020.037.02121.021.058.01616.016.074.01313.013.087.01313.013.0100.0100100.0100.01.002.003.004.005.006.00TotalValidFrequencyPercentValidPercentCumulative Percent5.1.2 算术平均数算术
3、平均数l未分组数据的平均数计算l分组数据的平均数计算l上例的计算结果270.31001001iixxfffxfxfxnxx为组频数 5.1.3 中位数的计算(中位数的计算(1)l未分组数据的中位数计算 对所有数据进行排序,当数据量为奇数时,取中间数为中位数,当数据量为偶数时,取最中间两位数的平均数为中位数。上例中数据量为100,是偶数,所以应取排序后第50位数和第51位数的平均值作为中位数。第50位数是3,第51位数也是3,所以中位数为3。5.1.3 中位数的计算(中位数的计算(2)l分组数据的中位数计算 下式中L为中位数所在组的下限值,fm为中位数所在组的组频数,Sm-1为至中位数组时累计总
4、频数,h为组距。hfSfLMmme1215.1.3 中位数的计算(中位数的计算(3)l例2:假设有分组数据如下(销售额单位为万元)年销售额组中值商店数目累计频数80-90853390-10095710100-1101051323110-120115528120-130125230合计305.1.3 中位数的计算(中位数的计算(4)l依据公式例2的中位数为万元 85.103101310230100212111hfSfLMhfSfLMmmemme5.1.4 众数的计算众数的计算l未分组数据的众数为出现次数最多的数。l分组数据的众数依据下式计算获得。表达式中1表示众数所在组与前一组的频数差,2表示众
5、数所在组与后一组的频数差。依据公式,例2分组数据的众数为104.29万元。hLMo2115.1.5 全距(极差)的计算全距(极差)的计算l全距指的是样本数据中最大值与最小值之间的距离,因而也叫极差。例1中最小值为1,最大值为6,因而全距为6-1=5。5.1.6 四分位差的计算四分位差的计算l四分位差是一种按照位置来测定数据离散趋势的计量方法,它只取决于位于样本排序后中间50%位置内数据的差异程度。即第一个四分位与第三个四分位数据之间的差异。例2的四分位差计算过程如下万元 四分位差万元 万元 606243.9662.109262.109101310343010043.96107343090133
6、1.QQQQ5.1.7 标准差的计算(标准差的计算(1)l未分组数据的标准差计算nxxnxxs2)(5.1.7 标准差的计算(标准差的计算(2)l分组数据的标准差的计算fxfxffxxs2)(5.2 市场调查数据的假设检验市场调查数据的假设检验l参数假设检验 U检验 t检验l非参数检验5.2.1 U检验检验l当样本容量大于30时,可以采用U检验。均值检验 百分比检验 双样本平均数差异的检验 双样本百分比差异的检验均均 值值 检检 验(验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。0100:HHnsxU05.096.
7、12U2U2UU 百百 分分 比比 检检 验(验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。0100:PPHPPHnPPPpU)1(05.096.12U2U2UU 双样本平均数差异的检验(双样本平均数差异的检验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。211210:HH22212121nsnsxxU05.096.12U2U2UU 双样本百分比差异的检验(双样本百分比差异的检验(U)l假设有选取统计量设定显著性水平 查表得到根据U的计算
8、结果,比较U的绝对值与 的大小。若有 则接受H0,否则拒绝H0。211210:PPHPPH22211121)1()1(nppnppppU05.096.12U2U2UU 5.2.2 t检验检验l当样本容量小于30时,不可以使用U检验,而需要使用t检验。均值检验 均值差异的检验 百分比差异的检验均均 值值 检检 验(验(t)l假设有选取统计量设定显著性水平 查表得到根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。0100:HH1nsxt01.0)1(nt)1(nt)1(ntt均值差异的检验(均值差异的检验(t)l假设有选取统计量设定显著性水平 查表得到根据t的计算结果,
9、比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。211210:HH)11(2212122221121nnnnsnsnxxt01.0)2(21 nnt)2(21 nnt)2(21 nntt百分比差异的检验(百分比差异的检验(t)l假设有选取统计量设定显著性水平 查表得到根据t的计算结果,比较t的绝对值与 的大小。若有 则接受H0,否则拒绝H0。211210:ppHppH2122112121)11)(1(nnpnpnpnnppppt 其中 01.0)2(21 nnt)2(21 nnt)2(21 nntt5.2.3 非参数检验(非参数检验(X2)l在市场调查中常获得一些量表数据,对量表数据
10、求取平均数与方差都是毫无意义的。对量表数据的处理更适宜于采用非参数检验方法。非参数检验中常用的方法是X2检验。X2检验的统计量是 上述统计量中,表示第 类别在样本中实际出现的次数,表示期望出现的次数,为类别数。kiiiiEEQX122)(iQiiEk5.3 市场调查的方差分析市场调查的方差分析l单因素方差分析l双因素方差分析5.3.1 单因素方差分析(单因素方差分析(1)l单因素方差分析研究一个因素在不同水平下对研究对象影响的显著性。单因素方差分析的数据表如下:试验数试验水平A1A2An12M平均值11x12xnx121x22xnx21mx2mxmnx1x2xnx5.3.1 单因素方差分析(单
11、因素方差分析(2)l单因素方差分析的一般形式方差来源平方和自由度方差F组间方差组内方差方差总和ASESEATSSS1nnmn1mn1nSAnmnSE)()1(nmnSnSEA5.3.1 单因素方差分析(单因素方差分析(3)l单因素方差分析的数学计算表达式 njjijijjjjAmxmTS122)(jjjijijEmTxS22 njjijijijijEATmxxSSS122)(jmiijjxT15.3.1 单因素方差分析(单因素方差分析(4)l例试验点月销售量(吨)包装1包装2包装3115151921010123912164511165161217合计5560805.3.1 单因素方差分析(单因
12、素方差分析(5)7015195580560555)(2222122njjijijjjjAmxmTS122)580560555(1716.101522222222 jjjijijEmTxS19212270EATSSS44.312122270)()1(nmnSnSFEA5.3.1 单因素方差分析(单因素方差分析(6)l查表求得 的值。比较 与 的大小。若有 ,则认为因素无显著性影响。反之则认为影响较显著。本例中n=3,m=5。),1(nmnnF),1(nmnnFF),1(nmnnFF5.3.2 双因素方差分析(双因素方差分析(1)l双因素方差分析分析两个同时存在的因素在不同水平状态下独立作用对分析
13、对象的影响的显著性。双因素分析的常用数据表因 素 A行总计观察值A1A2As因素BB1B2Br列总计11x12xsx121x22xsx21rx2rxrsxsjjx11sjjx12sjrjx1riix11riix12riisx1 risjijx115.3.2 双因素方差分析(双因素方差分析(2)l双因素方差分析表方差来源平方和自由度方差F因素A因素B误差总计ASBSESTS1s1r)1)(1(sr1rs)1(sSA)1(rSB)1)(1(srSE)1)(1()1(srSsSFEAA)1)(1()1(srSrSFEBB5.3.2 双因素方差分析(双因素方差分析(3)njjijijijijTrxxS
14、122)(l双因素方差分析的数学表达式rjjijijjjjArxrTS122)(sjijisiiijijiiiBxKsxsKS1122)()(BATESSSS5.3.2 双因素方差分析(双因素方差分析(4)l例销 地销 量行总计包装A1包装A2包装A3B120192160B216151445B39101130B487621列总计535152156(总)5.3.2 双因素方差分析(双因素方差分析(5)50.012156452451453)(2222122 rjjijijjjjArxrTS29412156321330345360)(22222122 siiijijiiiBsxsKS30212156
15、611.1620)(22222122 njjijijijijTrxxS5.7)(BATESSSS5.3.2 双因素方差分析(双因素方差分析(6)20.0)13)(14(5.7)13(5.0)1)(1()1(srSsSFEAA4.78)13)(14(5.7)14(294)1)(1()1(srSrSFEBB5.3.2 双因素方差分析(双因素方差分析(7)l查表求得 的值。比较 与 、的大小。若有 ,则认为因素A无显著性影响;反之则认为影响较显著。若有 ,则认为因素B无显著性影响;反之则认为影响较显著。与)1)(1(,1()1)(1(,1(rsrFrssF 与)1)(1(,1()1)(1(,1(rs
16、rFrssFAFBF)1)(1(,1(rssFFA)1)(1(,1(rsrFFB5.4 因子聚类分析因子聚类分析l距离聚类法 最短距离法 最长距离法l相关系数聚类法5.4.1 最短距离聚类法(最短距离聚类法(1)l计算样本间距离,并列出初始距离矩阵。l选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。l根据最小值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。l重复上述步骤,直至所有样本被全部合并为一类。5.4.1 最短距离聚类法(最短距离聚类法(2)l例假设有样本数据如下,请对样本进行分类。样本序号样本式样样本包装样本性能144423663633424551225.4.1
17、最短距离聚类法(最短距离聚类法(3)l初始距离矩阵 1433617142165332133666333175635.4.1 最短距离聚类法(最短距离聚类法(4)14661433663333663314145.4.2 最长距离聚类法(最长距离聚类法(1)l计算样本间距离,并列出初始距离矩阵。l选取初始距离矩阵中的最小值,并对该值对应的样本进行类合并。l根据最大值原则计算新合并样本与其他样本之间的距离,列出新的距离矩阵。l重复上述步骤,直至所有样本被全部合并为一类。5.4.2 最长距离聚类法(最长距离聚类法(2)l同上例l初始距离矩阵1472617142165722133666333175635.
18、4.2 最长距离聚类法(最长距离聚类法(3)1721317336213333363363363333335.4.3 相关系数聚类法(相关系数聚类法(1)l被聚类的对象 、的相关系数可以由下式计算获得iXjXnkjjknkiiknkjjkiikijXXXXXXXXr12121)()()(5.4.3 相关系数聚类法(相关系数聚类法(2)样本相关系数表X1X2X3X4X5X6X7X1-0.530.470.380.680.530.64X20.53-0.600.480.650.700.42X30.470.60-0.670.570.440.52X40.380.480.67-0.360.780.50X50.
19、680.650.570.36-0.590.62X60.520.700.440.780.59-0.52X70.640.420.520.500.620.52-5.4.3 相关系数聚类法(相关系数聚类法(3)找出每列中最大的相关系数X1X2X3X4X5X6X7X1-0.530.470.380.680.530.64X20.53-0.600.480.650.700.42X30.470.60-0.670.570.440.52X40.380.480.67-0.360.780.50X50.680.650.570.36-0.590.62X60.520.700.440.780.59-0.52X70.640.420
20、.520.500.620.52-5.4.3 相关系数聚类法(相关系数聚类法(4)l找出各列最大相关系数中的最大值X1X2X3X4X5X6X7X1-0.680.64X2-X3-X40.67-0.78X50.68-X60.700.78-X7-5.4.3 相关系数聚类法(相关系数聚类法(5)l合并X2、X3、X4、X6。l重复上述步骤,合并X1、X5、X7。X1X5X7X1-0.680.64X50.68-0.62X70.640.62-5.5 因子判别分析因子判别分析l判别分析法的目的是判别给定样本是否属于假定的类型。判别分析法的核心是建立判别函数。常用的判别函数为多元线性判别函数。其形式如下inni
21、iiiXbXbXbXbY.3322115.5.1 判别函数的建立(判别函数的建立(1)l例 假设有下列原始数据,请建立判别函数,判别假定的分组是否正确。产品各指标表相应评价值产品款式X1产品包装X2产品性能X3预定销售组A1987210743763464558666855预定销售组B753682439145104525.5.1 判别函数的建立(判别函数的建立(2)l第一步:计算A、B两组相应指标数据平均值868867109)(1AX66564678)(2AX56565347)(3AX344125)(1BX445443)(2BX442536)(3BX5.5.1 判别函数的建立(判别函数的建立(3
22、)l第二步:计算组间平均值的差。l即有538)()()(111BXAXXD246)()()(222BXAXXD145)()()(333BXAXXD125D5.5.1 判别函数的建立(判别函数的建立(4)l第三步:计算A、B两组资料的离差矩阵。0101000221012122215565885666885564865366875467810576889AC211101102212424534454431434432464335BC5.5.1 判别函数的建立(判别函数的建立(5)l第四步:计算离差矩阵CA、CB的共变异矩阵。1032310828100101000221012122210102121
23、02012002121ATAACCS10414211110211101102212211210011212BTBBCCS5.5.1 判别函数的建立(判别函数的建立(6)l第五步:计算A、B两组资料的联合共变异矩阵。20111127372010414211110103231082810BASSU5.5.1 判别函数的建立(判别函数的建立(7)l第六步:求联合共变异矩阵U的逆矩阵U-1。0523.00112.00118.00112.01071.00392.00118.00392.00655.0191414341391143431432393650113323133222123121111UUUUU
24、UUUUUU5.5.1 判别函数的建立(判别函数的建立(8)l第七步:求判别方程的系数b。0157.00294.02373.01250523.00112.00118.00112.01071.00392.00118.00392.00655.01DUb5.5.1 判别函数的建立(判别函数的建立(9)l第八步:根据上述系数矩阵建立判别函数。l根据判别表达式可知:产品款式对分组判别的影响最为显著,产品包装其次,而产品的性能对判别的影响不显著。3210157.00294.02373.0XXXY5.5.1 判别函数的建立(判别函数的建立(10)l第九步:求判别函数Yc临界值。5228.15.40157.0
25、50294.05.52373.05.42452)()(52462)()(5.52382)()(333222111YBXAXXBXAXXBXAXX5.5.1 判别函数的建立(判别函数的建立(11)l第十步:判别分组的正确性。预分组别判别值实际组别预估准确性A2.4800A正确A2.6416A正确A1.8846A正确A1.6199A正确A2.1690A正确A2.1239A正确B1.3687B正确B0.6393B正确B0.4334B正确B1.1276B正确5.5.1 判别函数的建立(判别函数的建立(12)l第十一步:判别检验。故接受原假设。,由于有 查表得到本例中 为)63(76.4)1346,3()1,()1,(0528.6)0157.010294.022373.05(34631346)(105005.02105.0211212121,FFFmnnmFmnnmFFbXDnnnnmmnnF。mjjj
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。