1、a1实验研究崔楠武汉大学市场营销与旅游管理系a2内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a3内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a4主要研究方法 观察 调查 实验a5因果关系a6因果关系 如何判定因果关系 相从而动 时间顺序 没有其他原因a7实验研究 实验研究 在控制其他变量的情况下(即其他情况相同),操纵自变量(的不同水平),检测因变量(的变化)。实验研究的主要步骤 识别问题并形成因果假设 设计实验 执行实验 根据收回的数据对假设进行
2、检验 沟通和汇报结果a8内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a9实验设计 实验设计(R.Kirk,1995)如何分配被试到不同实验情形中 与分配方案相关的统计分析 实验 研究设计的一般特征 受试者被随机选取并随机分派到不同群组。一个或一个以上的受试群组接受实验的处理。实验完后,实验结果可以进行测量。有检验可能影响效度的步骤。不同群组表现的差异可以用统计方法来比较。a10实验中的变量 自变量 对我们所关心的结果有影响的变量的不同水平 操纵变量、处理变量、因素 通常是名义变量(分类变量)例如:价格水平,不同的广告、不
3、同的包装 因变量 捕捉实验的结果变化 例如:销量,购买意向、知晓率a11实验设计的基本步骤 确定处理水平(自变量)操纵的变量 例如价格-质量推断实验中,不同的果汁贴上不同的价格标签 被试单元 单个消费者?家庭?确定因变量及因变量的测量 例如购买意向、感知质量a12实验设计的基本步骤 控制或测量可能影响实验结果的外生变量 其他变量或因素(nuisance variables)随机分配参与者可以消除潜在的系统性差异。使得干扰变量对所有受试者保持一致 通过统计方法控制(加入控制变量)例如,味觉对果汁评价的影响a13内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类
4、型 实验中的操纵检查 范例与提问a14实验的效度 内部效度 因变量的变化是否是由自变量引起?是不是由其他变量引起的?替代解释受到控制的程度 互动式教学法是否影响学生的成绩?a15影响内部效度的因素 历史记录 实验之外发生的特殊外部事件对实验的影响 种群效应(同辈效应):在某一实验情形中的成员有共同的体验。a16影响内部效度的因素 测试效应 被试意识到他们在测试中,从而导致特定的行为,而不是他们平时所进行的行为 Hawthorne Effect 对实验的特别关注 Demand Effect:按照研究人员所想要的结果来回答 如何避免 掩盖实验目的 让被试猜测实验目的 Placebo Effect
5、解决 引入对比组 双盲实验a17影响内部效度的因素 成熟 随实验进行被试发生的变化(更有经验、饥饿、疲倦)a18影响内部效度的因素 测试的交互效应 先前的测试使得被试对这一次的测试更加敏感 之前接受过类似的研究a19影响内部效度的因素 工具化效应 测量工具本身的变化 例如在进行口味测试的时候,如果消费者对三种产品口味没有明显偏好时,他们会偏好头一种产品 再如,如果测试的时候有同谋者(实验助手)存在,不同实验助手的表现不同也会影响结果;即使是单一的助手,实验助手的疲劳也会造成影响。a20影响内部效度的因素 死亡率 被试流失 流失的被试可能与未流失的被试原因不同 例如商店试销实验、被试参加瘦身计划
6、的流失。a21影响内部效度的因素 选择偏差 实验组与控制组的被试选择不同 自我选择偏差 出于便利,都存在自我选择被试 解决:随机分配a22外部效度 能够将结果推广吗?参与者?自变量,或操纵的情景?因变量现实吗?实验室实验多缺乏外部效度:不真实 许多影响内部效度的因素也同样会影响外部效度 选择性偏差可能是对外部效度的最大威胁 例如试销市场可能不能代表整个市场 学生通常作为实验被试a23内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a24一般实验 实验室实验:操纵一些变量,控制其他变量 缺点 人造场景:不真实 例如:看广告然后
7、问购买意向 被试在实验室之外还会这样嘛?a25实验模拟 尽管整个情境不真实,但是会保留某些真实的部分 例如:在商店展示广告进行测试a26现场实验 发生在真实场景中 控制性被权衡掉了 例如试销市场实验a27内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a28实验设计的类型符号X 表示一组被试接受实验处理O 对因变量的观测R 随机分配到处理水平中a29准实验设计 单纯实验后设计 X O1 问题?无对比 没有控制外生变量a30准实验设计 单组前后对比设计 O1 X O2 问题?成熟、测试效应、死亡、无控制组、历史效应 常用于营销
8、研究中a31准实验设计 静态组设计实验组:X O1控制组:O2 问题 实验依赖于两组的相似性 解决 对两组人进行特征匹配a32实验设计 所有的实验设计都涉及到随机分配被试到处理组和控制组/对照组 随机分配消除选择性偏差a33实验设计 前测-后测控制组设计实验组 R O1 X O2控制组 R O3 O4 处理效应=(O2-O1)-(O4-O3)假设:外生变量、历史、成熟、测试效应、工具对两组的影响是相同的 测试的交互效应仍有可能存在a34实验设计 仅后测控制组设计实验组:R X O1控制组:R O2 处理效应=O2-O1 假设外生变量对两组被试的影响是相同的 消除了测试效应、测试的交互效应、工具
9、化等问题a35实验设计 所罗门四组设计实验组 1:R O1 X O2控制组 1:R O3 O4实验组 2:R X O5控制组 2:R O6 在该设计中,处理效应、测试交互效应、外生因素效应全都可以测量 提供了多种处理效应的测量(O2-O4,O2-O1,O4-O3,O6-O5)缺点:样本过大a36更为复杂的设计 时间序列设计 通常没有控制组或对照组 尤其受到历史和成熟效应的影响 多因素实验设计a37内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a38outline t Test for Independent Samples
10、 Design Completely randomized design t Test for Dependent-Samples Design Randomized block design Latin square design Completely Randomized Factorial Designa39t Test for Independent-Samples DesignOne of the simplest experimental designst test statistic is often used to test the null hypothesis that t
11、he difference between two population means is equal to some value,usually zero.If there are n subjects and p treatment levels,then we have(np)!/(n!)p assignments.Random number table.012112:0:0HHa40Illustration of t Test for Independent-Samples DesignTreat.LevelGroup 1Subject1Subject2.Subjectn/2a1a1.
12、a1Group 2Subjectn/2+1Subjectn/2+2.Subjectna2a2.a2.1Y.2Ya41outline t Test for Independent Samples Design Completely randomized design t Test for Dependent-Samples Design Randomized block design Latin square design Completely Randomized Factorial Designa42Completely Randomized Design Denoted as CR-p W
13、hy Randomization important?Distributes the idiosyncratic characteristics of the subjects over the p treatment levels so that they do not selectively bias the outcome of the experiment Helps us obtain an unbiased estimate of the random error variation Helps to ensure that the error effects are statis
14、tically independent.a43Illustraion of CR-3Treat.LevelGroup 1Subject1Subject2.Subjectn/3a1a1.a1Group 2Subjectn/3+1Subjectn/3+2.Subject2n/3a2a2.a2Group 2Subject2n/3+1Subject2n/3+2.Subjectna3a3.a3.1Y.2Y.3Ya44Completely Randomized DesignExperimental design model equationAn observation(measure of the dep
15、endent variable)can be thought of as a composite that reflects the effects of Independent variableIndividual characteristics of the subjectChance fluctuations in the subjects performanceMeasurement and recording errors that occur during data collectionAny other nuisance variables.Yij the observation
16、 for subject i in treatment level jis the population grand mean of 1,2 and p.j is the treatment effect for population j and is equal to j-1.is the error effect associated with Yij()(1,.,;1,.,)ijji jYin jpa45outline t Test for Independent-Samples Design Completely randomized design t Test for Depende
17、nt-Samples Design Randomized block design Latin square design Completely Randomized Factorial Designa46t Test for Dependent-Samples Design Dependent samples Repeated measures Observing each subject under each treatment level in the experiment Subject matching Forming sets of subjects who are similar
18、 with respect to a variable that is correlated with the dependent variable.Obtaining sets of identical twins or litter mates and assigning one member of the pair randomly to one treatment level and the other member to the other treatment level.Obtaining pairs of subjects who are matched by mutual se
19、lection-for example,husband and wife pairs or business partnera47Illustration of t Test for Dependent-Samples DesignTreat.LevelTreat.LevelBlock 1a1a2Block 2a1a2.Block 15a1a2.1Y.2Y0.1.2:0Ha48outline t Test for Independent-Samples Design Completely randomized design t Test for Dependent-Samples Design
20、 Randomized block design Latin square design Completely Randomized Factorial Designa49Illustraion of RB-3Treat.LevelTreat.LevelTreat.LevelBlock 1a1a2a3Block 2a1a2a3.Block 15a1a2a3.1Y.2Y1.Y2.Y15.Y.3Ya50Randomized Block Design RB-p The second hypothesis,which is usually of little interest,states that
21、the population means for the 15 levels of nuisance variable are equal.We expect a test of this null hypothesis to be significant.If the nuisance variable doesnt account for an appreciable proportion of the total variation in the experiment,little has been gained by isolating the effects of the varia
22、ble.0.1.2.301.2.15.:(Treatment population means are equal):.(Block population means are equal)HHa51Randomized Block Design Experimental design model equationYij is the observation for subject i in treatment level j is the population grand mean.j is the treatment effect for population j and is equal
23、to.j-i is the block effect for population i and is equal to i.-ijis the error effect associated with Yij(1,.,;1,.,)ijjiijYin jp2222()()if 0ijijijjiijjiYYCRpRBpa52Randomized Block Design Use the F statistic to test the null hypothesis in analysis of variance:Thus,RB design enables us to get a more po
24、werful test of a false null hypothesis(error effect)(treatment effects)(error effect)ffFfa53outline t Test for Independent-Samples Design Completely randomized design t Test for Dependent-Samples Design Randomized block design Latin square design Completely Randomized Factorial Designa54Illustraion
25、of LS-3c1c2c3b1a1a2a3b2a2a3a1b3a3a1a2a55Latin Square Design LS-p Isolate two nuisance variables.More complex randomization procedure than those for RB design The number of rows and columns of a LS must each equal the number of the treatment levels.01.2.3.0.1.2.3.0.1.2.3:(Treatment population means a
26、re equal):(Row population means are equal):(Column population means are equal)HHH(1,.,;1,.,;1,.,;1,.,)ijjklijYin jp kp lp2222222()(LS Design)()(RB Design)if the combined effects of and are greater than ijlipooledijjklijjikYYa56outline t Test for Independent-Samples Design Completely randomized desig
27、n t Test for Dependent-Samples Design Randomized block design Latin square design Completely Randomized Factorial Designa57Illustration of CRF-22Treat.LevelGroup 1Subject1.Subject5a1b1.a1b1Group 2Subject6.Subject10a1b2.a1b2Group 3Subject11.Subject15a2b1.a2b1Group 4Subject16.Subject20a2b2.a2b2.11Y.12
28、Y.21Y.22Ya58Completely Randomized Factorial DesignTwo or more treatments can be evaluated simultaneously in a single experimentCRF-pq A CRF-23 design has 23=6 treatment condition.Completely crossed treatments are a characteristic of all CRF designs.().()()(1,.,;1,.,;1,.,)()()ijkjkjki jkjjkkjkjkjki j
29、kijkjkjkYin jp kqYa59Completely Randomized Factorial Design01.2.0.1.20:(Treatment A population means are equal):(Treatment B population means are equal):0(All interaction effects equal zero)jkj kjkj kHHHAB()()()CR design:CRF design:()if let denote the effects of the treatments and interaction in CRF
30、-design,then:CR design:CRF design:ijji jijkjkjki jkjkijji jijkpYpqYpqpYpqY()jki jka60Classification of Analysis of Variance DesignAll complex design can be constructed from the three building block designsCompleted randomized designRandomized block designLatin square designThere are only four kinds
31、of variation in ANOVATotal variationBetween-groups variationWithin-groups variationInteraction variationAll error terms involve either within-groups variation or interaction variationThe numerator of an F statistic should always estimate one more source of variation than the denominator,and that sou
32、rce of variation should be the one that is being tested.a61内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问a62操纵变量的要求 操纵变量必须是明确的。自变量是单一维度还是多个维度 对两类变量的操纵 可观测的、明显的变量,容易确认操纵成功 价格,拜访次数等。在营销中经常碰到高阶的、不可测的自变量,例如一些社会和心理变量,更需要操纵确认。感知的销售人员的能力、恐惧感、压力等。a63a64实验操纵的聚合效度和区分效度 聚合效度(convergence validity)实
33、验处理(treatment)是与潜变量相关的“直接测量”区分效度(discriminant validity)没有引起其他相关变量的变化,如竞争性解释变量的变化。a65检验操纵和混淆变量的时间 在预测试中(pretest)可以修改操纵场景 成本较低(如果不好的话)但各种条件要保持与主实验相一致 最好在主实验前做一次检查 在暴露于刺激后应立即访问受试者 可以鉴别混淆变量(confounding variables)a66检验操纵和混淆变量的时间 在主实验中(main experiment)在测量因变量之后。原因:避免demand characteristics Credibility or at
34、tractiveness 缺陷 操纵可能仅会引起自变量或混淆变量的短暂变化 受试者对因变量的回答也会影响操纵或混淆效应检查 但如果同时有混淆变量的检查可以减少这一原因的可能性a67检验操纵和混淆变量的时间 其他方法 使用操纵检查组 操纵检查组不测量因变量 而实验组不进行操纵和混淆变量检查 缺点是增加了受试者的人数 使用平衡方法(counterbalancing)一组先测量操纵检查问题,后进行因变量测量。一组正好相反 如果不存在顺序偏差,则可以合并。使用预测试作为操纵检查组 受试者可能较少 但实验条件必须要与主实验中的一致。不能只是为了操纵检查而进行预测试。a68操纵和混淆检查的测量 应保证有足
35、够的变异性 保证不同受试者处于同一个操纵点 强操纵会表现为高的信度 当信度不高时,难以确认是操纵弱还是操纵检验问题不好。进行处理内的因子分析。检查不同的处理中的聚合效度。a69操纵和混淆检查的分析方法 t-test 或 one-way ANOVA 对多因子设计的检查应当使用full-factorial ANOVA,尤其当一个因子有可能影响另外一个因子的变化的时候.操纵检查理想的情况是只有主效应显著 显著的主效应表明该操纵的聚合效度 其他主效应和交互效应显著则表明区分效度有疑问 混淆检查的理想情况是所有的效应都不显著 如果显著则说明操纵的区分效度不好。不仅要证明所需要的操纵出现,而且要证明其效应
36、足够大a70例 A:expertise level B:friendliness level Manipulation checks:M1:check for expertise M2:check for friendliness C1:trustworthiness ANOVA A B on M1 A should be the only significant effect;large 2 For other effect,near-zero 2 A B on M2 B should be the only significant effect;A B on C1 None effect should be significant;near-zero 2a71内容 实验研究 实验设计 实验的效度 实验研究的类型 实验设计类型概览 基本实验设计类型 实验中的操纵检查 范例与提问