主成分分析教学课件.ppt

上传人(卖家):晟晟文业 文档编号:4283586 上传时间:2022-11-25 格式:PPT 页数:20 大小:460.70KB
下载 相关 举报
主成分分析教学课件.ppt_第1页
第1页 / 共20页
主成分分析教学课件.ppt_第2页
第2页 / 共20页
主成分分析教学课件.ppt_第3页
第3页 / 共20页
主成分分析教学课件.ppt_第4页
第4页 / 共20页
主成分分析教学课件.ppt_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、组长:郭圣锐小组成员:罗琳 张玉峰 石小丰12022-11-25在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性。如果分别对每个指标进行分析,分析往往是孤立的,不能完全利用数据中的信息,因此盲目减少指标会损失很多有用的信息,从而产生错误的结论。因此需要找到一种合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的。由于各变量之间存在

2、一定的相关关系,因此可以考虑将关系紧密的变量变成尽可能少的新变量,使这些新变量是两两不相关的,那么就可以用较少的综合指标分别代表存在于各个变量中的各类信息。主成分分析与因子分析就属于这类降维算法。22022-11-25降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。在实际的生产和应用中,降维在一定的信息损失范围内,可以为我们节省大量的时间和成本。降维也成为应用非常广泛的数据预处理方法。降维具有如下一些优点:使得数据集更易使用。降低算法的计算开销。去除噪声。使得结果容易理解。降维的算法有很多,比如主成分分

3、析(PCA)、奇异值分解(SVD)、因子分析(FA)、独立成分分析(ICA)。32022-11-25PCAPCA的概念的概念PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1

4、,2个轴正交的平面中方差最大的。依次类推,可以得到n个这样的坐标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎为0。于是,我们可以忽略余下的坐标轴,只保留前面k个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。42022-11-25答案:事实上,通过计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值特征向量,选择特征值最大(即方差最大)的k个特征所对应的特征向量组成的矩阵。这样就可以将数据矩阵转换到新的空间当中,实现数据特征的降维。52022-1

5、1-25样本均值:样本方差:样本X和样本Y的协方差:11niixxn22111niiSxxn 11,1niiiCov X YEXE XYE Yxxyyn62022-11-25(1)方差的计算公式是针对一维特征,即针对同一特征不同样本的取值来进行计算得到;而协方差则必须要求至少满足二维特征;方差是协方差的特殊情况。(2)方差和协方差的除数 ,这是为了得到方差和协方差的无偏估计。协方差为正时,说明 和 是正相关关系;协方差为负时,说明 和 是负相关关系;协方差为0时,说明X和Y是相互独立。就是X的方差。当样本是n维数据时,它们的协方差实际上是协方差矩阵(对称方阵)。,Cov X X1n72022-

6、11-2582022-11-2592022-11-25图中,B点表示样例,A点表示在 上的投影,是直线的斜率也是直线的方向向量,而且是单位向量。蓝色点是在 上的投影点,离原点的距离是 uuu,x u102022-11-25112022-11-25记122022-11-25132022-11-25142022-11-25试计算这8个指标的主成分及对13个工业部门进行排序。152022-11-25经过因子分析可得到162022-11-25172022-11-25可得结果 0.5554 -0.1120 -0.0801 0.5434 -0.1287 -0.1339 0.5706 -0.0082 -0.

7、1437 0.1329 0.5069 -0.00123-0.0017 0.4714 -0.4304-0.0003 0.5382 -0.0812-0.0860 -0.4196 -0.1976 0.2p135 0.1609 0.8509 1.5 7 1 2 -0.3 2 9 5 -0.4 9 5 5-1.4 0 4 9 -2.1 5 3 1 -0.3 3 8 2-1.3 9 3 3 -3.0 3 9 7 -0.5 2 3 4 1.0 7 8 5 0.7 0 0 0 0.9 2 8 6 4.8 8 5 0 -1.3 7 7 6 -0.3 4 4 3-0.9 7 1 8 -1.4 6 2 5 -0.0 4 9 3-1.0 1 5 8 0.6 3 1 7 -0.3 9 0 0-0.0 2 9 9 sc 3.3 4 1 1 -1.3 7 4 8 0.0 0 1 5 1.3 9 1 5 -0.5 2 8 9-0.8 6 5 3 0.6 6 8 0 0.8 1 0 1-1.0 1 2 2 0.0 3 5 3 -0.0 5 7 6-0.8 8 9 4 0.9 7 2 5 -0.3 2 4 2 0.0 4 6 5 0.6 2 2 5 2.6 8 7 5182022-11-25192022-11-25202022-11-25

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(主成分分析教学课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|