基于出租车轨迹数据的异常事件检测与分析课件.pptx

上传人(卖家):三亚风情 文档编号:2845688 上传时间:2022-06-02 格式:PPTX 页数:29 大小:18.74MB
下载 相关 举报
基于出租车轨迹数据的异常事件检测与分析课件.pptx_第1页
第1页 / 共29页
基于出租车轨迹数据的异常事件检测与分析课件.pptx_第2页
第2页 / 共29页
基于出租车轨迹数据的异常事件检测与分析课件.pptx_第3页
第3页 / 共29页
基于出租车轨迹数据的异常事件检测与分析课件.pptx_第4页
第4页 / 共29页
基于出租车轨迹数据的异常事件检测与分析课件.pptx_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、S基于出租车轨迹数据的异常事件检测与分析 D1问题提出2数据与方法3出租车异常轨迹模式发现4事件检测与分析5异常聚集行为发现6小结基于出租车轨迹数据的异常事件检测与分析城市交通管理、公共安全1 问题提出基于出租车轨迹数据的异常事件检测与分析研究意义泛地理信息时代轨迹数据、手机信令、社交媒体、交通刷卡轨迹数据分析智慧应用/管理思考寻常移动行为模式异常移动行为信息事件异常轨迹检测与分析轨迹数据关键问题0、轨迹数据及研究方法1、出租车异常轨迹模式发现2、基于出行量的事件检测与分析3、基于出行量和出行位置空间分布特征的异常聚集行为发现曲线的时空特征轨迹点的数量特征和时空特征 轨迹点的数量特征、时空特征

2、及空间分布特征轨迹的特征采样点的集合 曲线语义位置序列移动时空范围 2 数据和方法轨迹数据分类数据量庞大、覆盖范围广泛、更新速度快轨迹的组成轨迹数据处理的方式多样 基于时间采样的轨迹数据 基于事件触发采样的轨迹数据轨迹数据分析方法u 轨迹数据预处理:包括轨迹数据清洗、轨迹分段和地图匹配。u 轨迹数据的知识提取:轨迹、人以及区域三个方面,将现有的研究粗略分为轨迹相似、轨迹模式挖掘和区域特征提取。聚类分析与异常检测 基于统计的异常检测方法“k倍标准差”准则、似然比检验 基于距离的异常检测方法 DB(p,D)-outlier,p为比例,D为距离异常检测的核心问题不仅在于方法的设计,还在于检测到的异常

3、结果可解释性,对于这个问题的研究,关键在于发现能显著区别异常对象和正常对象的属性特征,并在具体应用中加以合理解释。 异常检测的常用方法 基于密度的异常检测方法 基于聚类的异常检测方法聚类是发现数据中的多数模式,而异常检测是挖掘显著偏离多数模式的异常情况。基于密度的DBSCAN算法3 出租车异常轨迹模式发现同一起终点范围的移动轨迹轨迹子轨迹轨迹片段行驶时间耗费 时间异常轨迹空间异常轨迹标准轨迹时空异常轨迹StantardT-OutlierS-OutlierST-Outlier|ittkk取1.645异常分类与定义空间特征异常时间特征异常不属于任何轨迹簇空间特征时间特征t2t3t1t4基于出租车轨

4、迹数据的异常事件检测与分析轨迹预处理1、候选轨迹集的提取2、轨迹分割与重构222/ 2arccosabcabw处分割基于线段Hausdorff距离的轨迹空间相似性度量3 出租车异常轨迹模式发现轨迹片段近邻dist(Li,Lj) 轨迹空间相似两轨迹中互为近邻的轨迹片段长度和分别与两轨迹长度的比值最小值大于f异常轨迹模式发现(袁冠等,2011)权重系数:w,w|,w基于出租车轨迹数据的异常事件检测与分析基于聚类和基于统计结合的异常轨迹检测方法3 出租车异常轨迹模式发现邻域:空间相似轨迹集合( )SC T邻域密度:集合内轨迹数目|( )|SC T基于出租车轨迹数据的异常事件检测与分析3 出租车异常轨

5、迹模式发现旧金山出租车轨迹数据上下车点和候选轨迹的可视化 线段距离权重系数:w=0.8,w|=0.05,w=0.15 轨迹空间相似判断参数:=0.006,f=0.85 邻域密度阈值参数:MinTrs=10实验与分析实验数据准备实验参数设置基于出租车轨迹数据的异常事件检测与分析3 出租车异常轨迹模式发现实验与分析 (a)Two Standards (b )Outliers (c)ST-outlier (d)推荐驾驶路线轨迹行驶时间分布时空、时间异常轨迹点序 标准轨迹 择路行为分析 空间异常轨迹 个性化路线推荐 空间或时空异常轨迹 服务质量评价 时间或时空异常轨迹 交通管控基于聚类的出租车异常轨迹

6、基于聚类的出租车异常轨迹检测,计算机工程,检测,计算机工程,2017Vol.43(2):16-204 事件检测与分析n 一个区域的出租车上下客数量可以用于描述区域的人类行为活跃度n 利用统计模型识别数量特征概率上显著偏离预期行为的区域和时间段n 分析大量事件的时空信息,探寻事件随时间的发展趋势和影响区域出行动态dropoffs=,gidi为子区域,dk为天粒度的时间戳,hi为第i个时间段,I表示流入量元事件单个区域出行动态出现异常。表示为E=,其中class表示元事件类型(1表示聚集,-1表示稀疏)。元事件是用于事件分析的最小单元基于似然比检验(LRT)的异常检测方法零假设H0:观测值服从零模

7、型L0=f(x|) 备择假设H1:观测值服从模型L1=f(x|)检验水平为,其中 是与相关的新参数(| )=-2log()( |)if xsup f xP= (,df),若p1-,拒绝用零模型拟合观测值,说明此数值在统计意义上是异常的。 2相关定义4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析麦迪孙广场和唐人街的区域流入量时序分布实验数据元事件检测实验 2015年1月和2月的1.3万量纽约黄色出租车出行数据,属性信息包括出租车上车和下车日期、经纬度坐标、费用和旅程距离等 划分为2166个人口普查区的纽约区域矢量数据工作日和周末有明显的数值差异0204060801001357911 1

8、3 15 17 19 21 23 25 27 29 31 33 35 37 39 41流入量10:0011:00单个时间段流入量变化4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析某日下午18:00下车点空间分布空间上部分区域数据稀疏4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析检测对象:420个区域以及42个工作日24个时段的流入量统计数据检测基准:各个时段过滤异常值后的样本数据均值和方差值构建的高斯分布检验水平:0.0501000200030004000500060001/11/81/151/221/292/52/122/192/26事件个数时间out+1out-1主要事

9、件: 1月1日、2日(新年) 2月13日(情人节前一天) 2月19日、20日(春节)元事件检测实验 1月19日(马丁路德金日) 1月26日、27日(暴雪) 2月16日(总统日)元事件个数逐日变化4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析元事件时空特征分析元事件统计分析复合时空事件的提取与分析事件过程分析事件影响分析类DBSCAN方法提取关键信息4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析元事件统计分析050010001/21/91/161/231/302/62/132/202/27事件个数时间050010001/21/91/161/231/302/62/132/202

10、/27事件个数时间聚集元事件月流入量与事件个数对比图聚集元事件的空间分布日聚集和日稀疏元事件个数变化趋势元事件时空特征分析实验4 事件检测与分析基于出租车轨迹数据的异常事件检测与分析元事件统计分析02004006000246810 12 14 16 18 20 22区域个数out+1out-11月1日元事件区域个数变化趋势01002003004005000 2 4 6 8 10121416182022 0 2 4 6 8 10121416182022 0 2 4 6 8区域个数大雪期间稀疏元事件区域个数变化趋势大雪期间大气能见度变化、暴雪期间空间影响范围变化过程事件过程分析实验1/26 14时

11、刻1/26 15时刻1/26 18时刻1/27 15时刻基于出租车轨迹数据的异常事件检测与分析元事件规模|scaleII 元旦和总统日两天的活动对所有区域的聚集元事件规模总和分别为101747和29955 节日对城市影响存在空间差异性,有助于了解城市内不同类型地块的分布事件影响分析实验元旦和总统日两个节假日(1月1日和2月16日)为例,来分析其对420个区域的影响差异经过统计,420个区域在这一天分化为四种影响模式:82个区域不受影响,68个区域仅受负面影响,114个区域仅受正面影响,156个区域受到了正负面影响。黄色黄色区域区域分布在曼哈顿城区内;蓝色蓝色区域区域分布在多个博物馆、富豪住宅集

12、聚的上城东(中央公园东侧),这一天博物馆未对外开放;黑色区域黑色区域主要分布在曼哈顿中城、格林威治村、西村、格拉梅西村、苏活区、上城西、中央公园以及下城西等区域,主要的金融机构(如华尔街证券交易所)和办公机构(如纽约市政府大厅、纽约大学) 都集中在此区域内,受节日放假的影响,前往此区域的人群数量在上班高峰期(7点至10点)明显减少,但同时这些区域也聚集了许多商店和服务业,因而在其余时间吸引了比平时更多的人群;红色区域红色区域主要分布在东村、下城东、小意大利村、唐人街、切尔西区等区域,由于没有出现流入量减少的情况,因此和黑色区域相比,此区域以商业娱乐为主。4 事件检测与分析基于出租车轨迹数据的异

13、常事件检测与分析复合时空事件的提取与分析对于两个元事件:E1=,E2=若满足以下三个条件之一可以将其组合:(1)d1与d2相同,h1与h2相邻,class1与class2相同,gid1与gid2相同;(2)d1与d2相邻,h1与h2相同,class1与class2相同,gid1与gid2相同。(3)d1与d2相同,h1与h2相同,class1与class2相同,gid1与gid2相邻。同一区域内同一时刻的元事件至少有一个相邻日期的近邻同一时刻相邻区域发生的元事件至少两天日期相同时间上连续2天及2天以上的时空事件提取利用DBSCAN的密度连通策略从满足条件(时空连续)的元事件集中提取时空事件提取

14、关键信息 STE=类DBSCAN方法邻域判断STE=4 事件检测与分析复合时空事件的提取与分析春节事件starttimeendtimegidscentergidtotalscale2015-2-18 19:002015-2-20 20:00953,1436 1436438.3336元事件信息dhgidIscalegidIscale2/1819:0014366627.6154953-2/1918:005127.05416421.236819:009859.61549942.657920:0010970.7949-2/2018:005733.05416623.236819:007334.61541

15、0144.657920:009253.7949-唐人街区域实验与分析基于位置点统计的时空异常检测与分析,测绘科学技术学报,基于位置点统计的时空异常检测与分析,测绘科学技术学报,2017年年第第34卷卷第第3期期:320-3245 异常聚集行为发现anni1,判断为聚集分布模式,值越小表示聚集程度越高弱化了局部空间区域内点群空间分布对整体分布的影响/oeannidd0.5*/edA n1/noiiddn对象p的局部可达距离( )()( )|( )|kkq Npkreachdistpqlrdist pNp/oeaknnidd( )|p Colrdist pdC聚集行为发现方法聚集行为区域位置点群平

16、均最近邻指数局部时间范围内位置点在局部空间发生聚集的现象第dk天时间段hj内乘坐出租车到访或离开区域gidi的上、下车点集合,表示为dropoffpoints=由所有位置点最邻近距离平均值do与完全随机分布下期望点对邻近距离de的比值计算得到?参考k-最近邻思想,计算p的k-距离邻域改进后的平均k最近邻指数(aknni)5 异常聚集行为发现k=1k=2k=3k=4点群10.4998050.6601960.8803161.064951点群20.4947070.692181.0030351.294138点群1点群2两个点群在不同k值下的aknni值k值k=1k=2k=3k=4聚集分布比率89%81

17、%56%8%不同k值下的聚集分布比率1月份下车点落入纽约矢量数据中区域标识码gid=2098区域的出租车出行记录数据其外接矩形的经度和纬度范围分别为(-74.01,-73.996)和(40.742,40.76),纽约最大的会展中心贾维茨会展中心位于此区域内实验与分析实验数据点群1内点个数为265,点群2内点个数为276,人眼直观视觉分析,点群1显然比点群2要更加聚集。5 异常聚集行为发现v1=6,5,1,0,6,8,0,1,2,0,1,0,0,2,0,1,v2=1,0,1,0,0,2,1,0,0,2,6,5,1,0,6,8,v3=12,10,1,0,12,16,0,1,2,0,1,0,0,2,

18、0,1(1)(2)(3)cosinedist=0.2139,cosinedist=0.9915,cosinedist=0.175912211()cos,|()()niiinniiiiABA BinedistA BABAB(2)余弦距离计算向量间相似度将空间区域划分成n*m的网格单元,统计位置点落在各个网格单元内的点数,得到n*m维的向量(1)位置特征向量构建用向量来描述位置点群的分布,简化了点与点的空间关系,从而提供了一个可便捷计算点群间相似度的模型。聚集行为模式分析与异常检测位置点群的异常聚集行为检测5 异常聚集行为发现(3)聚集行为模式分析与异常检测方法基于DBSCAN密度聚类的聚集行为模

19、式分析方法 :聚类对象是聚集行为的发生时间,距离阈值衡量的是位置点群间的相似度,密度阈值表示满足距离阈值的点群数量。0.001*0.001(度)基于LRT和基于距离的 常聚集行为 检测位置点群的异常聚集行为发现框架流入量异常增加位置点群没有足够近邻异常聚集行为05 异常聚集行为发现下车点聚类结果上车点聚类结果class1class2class3class3class4class2class1出行模式聚集行为模式分析实验离散出行和聚集出行,各自都有明显的时间分布特征事件触发出行,比如工作日上下班事件、大型展览活动、休息日夜间娱乐等事件引起的聚集出行行为,而每类聚集行为模式都有相似的位置点空间分布

20、特征相似度r和比例阈值p分别设为90%和15%5 异常聚集行为发现2/13 2:00-3:002/26 18:00-19:00异常点群发现的异常聚集行为具有最低的余弦相似度和邻域个数比,在所有聚集元事件中应被视为特殊事件得到重点关注时间编号时间编号时间编号1-1-001-12-1392-16-14181-1-111-13-7102-16-15191-1-221-13-9112-16-16201-1-331-13-10122-20-20211-8-1841-16-23132-23-8221-8-1952-13-2142-23-9231-12-662-16-1152-24-9241-12-772-

21、16-8162-26-18251-12-1082-16-1317 聚集元事件异常检测实验 聚集元事件点群与三类模式的余弦相似度以及邻域个数比6 结论 易于解释的异常轨迹模式发现方法 复杂轨迹间匹配相似度的比较方法 基于轨迹数据的事件检测与分析方法 探区域异常聚集行为检测的问题数据预处理提取特征建立相似性度量异常检测与分析 从方法的执行效率方面加以研究和改进,进行实时异常轨迹检测 扩展实验数据集和案例来提高结果的可靠性 研究阈值参数与数据集的内在关系,实现参数的半监督或自动设定 尝试基于已有GIS软件平台实现轨迹数据异常检测与分析功能 从历史轨迹数据检测全局异常,而且没有考虑方法的计算复杂度 数据的稀疏性问题,所使用的实验数据集规模较小,代表性不足 方法涉及许多阈值参数,且不能自动设定请批评指正!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(基于出租车轨迹数据的异常事件检测与分析课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|