《大数据处理与智能决策 》课件_距离度量.pptx

上传人(卖家):kld 文档编号:8243160 上传时间:2025-01-22 格式:PPTX 页数:10 大小:103.80KB
下载 相关 举报
《大数据处理与智能决策 》课件_距离度量.pptx_第1页
第1页 / 共10页
《大数据处理与智能决策 》课件_距离度量.pptx_第2页
第2页 / 共10页
《大数据处理与智能决策 》课件_距离度量.pptx_第3页
第3页 / 共10页
《大数据处理与智能决策 》课件_距离度量.pptx_第4页
第4页 / 共10页
《大数据处理与智能决策 》课件_距离度量.pptx_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、度量简介度量简介 度量常用于衡量个体之间差异性大小。距离度量(Distance)衡量个体在空间上存在的距离,距离越远说明个体间的差异越大。相似度度量(Similarity)计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,差异越大。广泛应用于数据分析中的相关分析、数据挖掘中的聚类和分类算法等。1欧几里欧几里德德距离距离 欧几里德距离(Euclidean Distance),欧氏距离是最常见的距离度量,衡量多维空间中各个点之间的绝对距离。公式如下:(1)计算基于各维度特征的绝对数值,所以欧氏度量需要保证各维度指标在相同的刻度级别.2i=1(X,Y)=(x-y)niidist2标准化

2、欧氏距离标准化欧氏距离 标准化欧氏距离(Standardized Euclidean distance)标准化欧氏距离将各个分量进行标准化,标准化变量的数学期望为0,方差为1。那么,标准化欧氏距离的公式:(2)321-(X,Y)=()niiixydist明可夫斯基距离明可夫斯基距离 明可夫斯基距离明可夫斯基距离(Minkowski Distance),明氏距离是欧氏距离的推广,是对多个距离度量公式的概括性的表述。公式如下:(3)这里的p值是一个变量,当p=2的时候就得到了上面的欧氏距离。41=1(X,Y)=-ppniiidistx y曼哈顿距离曼哈顿距离 曼哈顿距离曼哈顿距离(Manhatta

3、n Distance)曼哈顿距离来源于城市区块距离,是将多个维度上的距离进行求和后的结果,公式如下:(4)5=1(X,Y)=-niiidistx y切比雪夫距离切比雪夫距离 切比雪夫距离切比雪夫距离(Chebyshev Distance)切比雪夫距离起源于国际象棋中国王的走法。公式如下:(5)曼哈顿距离、欧氏距离和切比雪夫距离都是明可夫斯基距离在特殊条件下的应用。61=1(X,Y)=lim-=max-ynppiiiipidistx yx马哈拉诺比斯距离马哈拉诺比斯距离 马哈拉诺比斯距离(Mahalanobis Distance)印度统计学家马哈拉诺比斯(P.C.Mahalanobis)提出的,

4、表示数据的协方差距离。与欧式距离不同的是它考虑到各种特性之间的联系。例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的。7PDIST函数函数 D=PDIST(X,DISTANCE)computes D using DISTANCE.Choices are:euclidean -Euclidean distance(default).seuclidean -Standardized Euclidean distance.To specify another value for S,use D=PDIST(X,seuclidean,S).minkowski -Minkowski

5、distance.To specify a different exponent,use D=PDIST(X,minkowski,P)8PDIST函数函数 cityblock -City Block distance chebychev -Chebychev distance (maximum coordinate difference)mahalanobis-Mahalanobis distance.To compute the distance with a different covariance,use D=PDIST(X,mahalanobis,C).9PCA-重构 pca获得:(1)重构图像(一)(2)重构图像(二)(3)(4)10=FinalData RowFeatureVectorRowDataAdjust-1=RowDataAdjust RowFeatureVectorFinalData=TRowDataAdjust RowFeatureVectorFinalData=(RowFeatureVectorFinalData)+OriginalMeanTRowOriginalData

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《大数据处理与智能决策 》课件_距离度量.pptx)为本站会员(kld)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|