第九章-对应分析课件.ppt

上传人(卖家):晟晟文业 文档编号:5175549 上传时间:2023-02-16 格式:PPT 页数:36 大小:1.04MB
下载 相关 举报
第九章-对应分析课件.ppt_第1页
第1页 / 共36页
第九章-对应分析课件.ppt_第2页
第2页 / 共36页
第九章-对应分析课件.ppt_第3页
第3页 / 共36页
第九章-对应分析课件.ppt_第4页
第4页 / 共36页
第九章-对应分析课件.ppt_第5页
第5页 / 共36页
点击查看更多>>
资源描述

1、第9章 对应分析v对应分析(correspondence analysis)是用于寻求列联表的行和列之间联系的一种低维图形表示法,它可以从直觉上揭示出同一分类变量的各个类别之间的差异,以及不同分类变量各个类别之间的对应关系。v对应分析是由法国人Benzecri于1970年提出的,起初在法国和日本最为流行,然后引入美国。v在对应分析中,列联表的每一行对应(通常是二维)图中的一点,每一列也对应同一图中的一点。本质上,这些点都是列联表的各行各列向一个二维欧式空间的投影,这种投影最大限度地保持了各行(或各列)之间的关系。第九章 对应分析v9.1 行轮廓和列轮廓v9.2 独立性的检验和总惯性v9.3 行

2、、列轮廓的坐标v9.4 对应分析图9.1 行轮廓和列轮廓v一、列联表v二、对应矩阵v三、行、列轮廓一、列联表v其中,是第 行、第 列类别组合的频数,;为第 行的频数之 和,;为第 列的频数之和,;为所有类别组 合的频数总和。ijnij1,2,1,2,ip jq1qiijjnni1,2,ip1pjijinn1,2,jqj1111pqpqijijijijnnnn二、对应矩阵v这里,。v显然有 。1111,qqppijijijijiijjijjjiinnnpppppnnn111pqijijppv称 为对应矩阵。将对应矩阵表中的最后一列用 表示,即 其中 是元素均为1的 维向量,最后一行用 表示,即

3、v其中 是元素均为1的 维向量,向量 和 的元素有时称为行和列密度(masses)。ijijpnnPr12,pppprP11,1,11q c12,qpppc1 P1,1,11prc三、行、列轮廓v第 行轮廓:其各元素之和等于1,即 。v第 列轮廓:其各元素之和等于1,即 。i1212,iqiqiiiiiiiiiiipnppnnpppnnnr1,1,2,iip r1j1212,jjpjjjpjjjjjjjjpppnnnpppnnnc1,1,2,jjq1 c行轮廓矩阵 v其中 。111121111221222122212qqrppppqppppppppppppppppppppprrRD Pr12d

4、iag,rppppD列轮廓矩阵 v其中 。111121222122112121212,qqqqcqpppqqppppppppppppppppppCPDc cc12diag,cqpppD 可见,可以表示成各列轮廓的加权平均。类似地,即 可以表示成各行轮廓的加权平均。121121,qccqjjjqpppprP1PDD 1c cccr11prriiipc1 P1 DD Pr c例9.1.1v将由个人组成的样本按心理健康状况与社会经济状况进行交叉分类,分类结果见表9.1.3。v 将表9.1.3中的数据除以,得到对应矩阵,列于表9.1.4中。表9.1.4给出的行密度和列密度向量为0.1850.363,0

5、.305,0.173,0.231,0.160,0.1310.2180.234rc 行轮廓矩阵为 列轮廓矩阵为10.3940.1860.2350.1170.0680.3120.1740.2340.1610.1180.3090.1800.2130.1490.1490.2210.1540.2420.2010.183rRD P10.2390.1990.1880.1360.0970.3710.3660.3670.3660.3270.2210.2260.2010.2040.2490.1700.2090.2450.2940.327cCPD两个马赛克图 对心理健康的每一种状况,A、B、C、D、E五个小方块的宽

6、度显示了行轮廓,0、1、2、3四种心理健康状况的小方块高度显示了行密度。对社会经济的每一种状况,0、1、2、3四个小方块的高度显示了列轮廓,A、B、C、D、E五种社会经济状况的小方块宽度显示了列密度。9.2 独立性的检验和总惯量v一、行、列独立的检验 v二、总惯量一、行、列独立的检验v在列联表中,检验行变量和列变量相互独立假设的统计量为 当独立性的原假设为真,且样本容量 充分大,期望频数 时,近似服从自由度为 的卡方分布。拒绝规则为 若 ,则拒绝独立性的原假设 其中 是 的上分位点。2211pqijijijijpp pnp pn5,1,2,1,2,ijnp pipjq211pq221,1pq2

7、21,1pq21,1pq21,1pq二、总惯量 总惯量还可以行轮廓和列轮廓的形式表达如下:2211pqijijijijpp pnp p总惯量21111pqpijijiiiciijijpppppp rc Drc总惯量21111qpqijjijjjrjjijippppppcrDcr总惯量 其中 称为第 行轮廓 到行轮廓中心 的卡方()距离,它可看作是一个加权的平方欧氏距离。同样,是第 列轮廓 到列轮廓中心 的卡方距离。故总惯量可看成是行轮廓到其中心的卡方距离的加权平均,也可看成是列轮廓到其中心的卡方距离的加权平均。它既度量了行轮廓之间的总变差,也度量了列轮廓之间的总变差。211qijijicijj

8、pppprc Drcic2211pijjijrjiippppcrDcrjjcrir总惯量为零的等价情形 v总惯量为零与以下三种情形的任一种等价:(1),或表示为 ;(2)所有的行轮廓相等,即 ;(3)所有的列轮廓相等,即 。v所以,如果行变量与列变量相互独立,则我们可以期望(由样本数据构成的)列联表中所有的行有相近的轮廓,所有的列亦有相近的轮廓。,1,2,1,2,ijijpp pip jqPrc12prrrc12qcccr9.3 行、列轮廓的坐标9.4 对应分析图v一、行、列轮廓的逼近 v二、行(列)点之间的距离 v三、行点和列点相近的意涵一、行、列轮廓的逼近二、行(列)点之间的距离v如果两个

9、行(列)点接近,则表明相应的两个行(列)轮廓是类似的;反之,如果两个行(列)点远离,则表明相应的两个行(列)轮廓是非常不同的。需要指出的是,行点与列点之间并没有直接的距离关系。三、行点和列点相近的意涵v如果一个行点和一个列点相近,则表明行、列两个变量的相应类别组合发生的频数会高于这两个变量相互独立情形下的期望值。例9.4.1v 在例9.1.1中,经计算,奇异值、主惯性以及贡献率等的计算结果列于表9.4.1中。总惯量的94.75%可由第一维来解释,前二维解释了高达99.76%的总惯量,几乎解释了列联表数据的所有变差。例9.4.1 行点和列点的前二维坐标矩阵为 将各行点和列点置于同一坐标系中,构成对应分析图,如图9.4.1所示。110.1830.0160.2600.0130.0590.0220.0300.023,0.0090.0420.0140.0700.1650.0430.2370.0200.2880.062 XY

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第九章-对应分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|