1、VDT视频大数据分析技术及应用视频大数据分析技术及应用01.应用背景分析02.智能分析技术积累03.视频云计算技术积累04.VDT大数据应用-3-01.应用背景分析-4-互联网应用已进入DT时代 随着互联网与各种智能设备的普及,各类数据出现了爆炸性增长。根据2012年互联网络数据中心发布的数字宇宙2020报告,2011年全球数据总量已达到1.87ZB(1ZB=10万亿亿字节),并且数据以每两年翻一番的速度飞快增长。在大数据时代,企业和个人更多的行为可记录、被记录,可分析、被分析,各国都普遍重视大数据运用,并作为国家的战略。数据资源正和土地、劳动力、资本等生产要素一样,成为促进经济增长和社会发展
2、的基本要素。互联网应用已进入数据为王的时代!-5-视频数据中蕴藏巨大的价值信息路面监控可拍摄到大量人员信息卡口、电警可拍摄到海量车辆信息人员、车辆是打防管控的重要目标,视频内的大量价值信息可以为研判提供有效支撑。-6-视频具有非常大的数据量平安城市互联网互联网上视频每分钟上传量已超过700小时监控视频录像数据量预计达上千PB/天智能硬件智能硬件中视频是重要的传感器,占整个数据量的68%以上共10万公安自建摄像机(70%标清,30%高清)近8000个交通卡口每天视频存储量:4PB/天每天上传卡口记录:6000万条/天上海-7-视频大数据应用的难点视频是非结构化数据,其内容难以被计算机理解视频分析
3、运算量极大,需要消耗海量运算资源-8-IT技术视频智能分析视频大数据VDT云计算GPU分布式计算Deep Learning深度学习车牌识别车辆全信息识别人脸识别人群分析视频布防视频实时结构化视频大数据是IT、智能分析最先进技术的结合视频智能分析:深度学习使得视频内容可以被计算机理解;IT技术:云计算、分布式计算、GPU技术为视频分析提供运算资源。-9-02.智能分析技术积累-10-深度学习使视频数据可以被计算机理解可以不断提高比对准确性可以针对特定目标显著提高识别准确率可以显著提高场景、图像质量、目标角度的适应性语音识别:2011,识别错误率降低20-30%,10多年的重大突破 图像识别:20
4、12,ImageNet,错误率从26%降到15%车型识别:2014,从60%,提升到93%人脸识别:2015,LFW测试准确率提升到99.55%,超过人眼识别水平深度学习技术带来了计算机识别领域的革命深度学习的持续训练 精度 数据规模深度学习传统机器学习(浅层学习)-11-极具挑战的 LFW 测试集同一个人的照片样例不同的人(但是长得像)的照片样例非受控网络图片数据库:LFW(5758个人)国际领先的人脸识别技术对复杂样本的广泛适应-12-大数据,计算资源以及深度学习发展带来人脸识别技术突破 最新的识别算法准确率达到99.55%,超过人眼识别能力国际领先的人脸识别技术超越人眼的识别能力人眼识别
5、能力 Human cropped(97.53%)人眼识别能力 Human funneled(99.20%)DeepID2(99.15%),2014Eigenface(60%)TL Joint Bayesian(96.33%),2013非深度学习方法的最佳性能SenseTime(99.55%),2015Facebook(97.35%),2014随机猜测(50%)-13-多场景下人体特征比对-14-品牌:奥迪型号:A4L年款:2013颜色:白色类别:轿车车牌:苏DC983B异常特征:无异常品牌:大众型号:桑塔纳年款:2006颜色:黑色类别:轿车车牌:苏DE1075异常特征:遮挡面部车牌:苏D714
6、1类别:摩托车颜色:红色异常特征:无异常品牌:现代型号:全新胜达年款:2013颜色:黑色类别:越野车车牌:无牌异常特征:遮挡号牌车牌识别率,白天98%、夜间97%以上;能够识别中国路面上1200种车品牌,识别准确率超过93%!车辆多种信息的自动识别车灯车标遮阳板车身颜色年检标装饰物车型车款车牌轮毂-15-03.视频云计算技术积累-16-VDT大数据应用的基础条件已成熟网络传输带宽不断提升,为VDT大数据的传输提供了通路摄像头覆盖面越来越广、清晰度越来越高,为VDT大数据应用提供了有效的数据基础存储、运算设备资费的不断下降为采用云计算技术的VDT大数据运算提供了低成本的计算资源-17-综合运维物
7、理安防系统移动端的视频应用社会资源接入公安建设资源整合管理提供多种设备接入提供多级系统联网提供海量数据存储视频的监控与查询全网视通羚羊云PVG+视频云联网-解决多样复杂联网应用-18-视频云计算视频大数据分析的落地实现100种视频、图像分析服务500种原始视频流式播放能力1000节点管理能力10K(1万)核并行计算能力10G(百亿)条记录快速检索与挖掘PBEB级存容量4大核心技术:虚拟化、高性能计算、云存储、大数据-19-云存储访问接口视频(大)文件存储池小文件存储池结构化信息存储池文件访问接口对象OPAQ第三方存储系统GlusterFS物理存储服务器集群数据库/搜索引擎集群视频帧索引技术索引
8、数据IndexFrameKey-Value技术哈希表数据Namedata关系数据库全文检索引擎DDB+全文检索技术A.统一的资源管理:支持视频、图片、文本、结构化数据等多种数据类型。B.分布式存储设计,资源访问速度快。C.资源按需分配,可以实现横向扩展、弹性存储。D.无元节点设计,可靠性高。PFS(Power File System)海量数据存储架构-20-开放、高效的计算框架,支持各种类型的各种类型的视频应用计算和各类视频分析算法的整合Map-Reduce计算(MRCP)高并发计算(HCCP)内存计算(MMCP)流式计算(STCP)计算资源池云计算访问接口A.支持四种计算类型。MRCP:视频
9、结构化与浓缩HCCP:多人同时视频图像检索、模糊处理MMCP:人脸检索、指纹检索STCP:车辆布控、人脸布控B.支持不同计算资源的共享与按需分配。C.支持动态负载均衡、容错处理。D.数据与通讯协议接口,可集成其他厂家算法与功能。视频云计算统一的云服务接口-21-云检索(OPAQ)-海量数据分布式交互查询加速引擎百亿级数据查询秒级返回方案主集群副本集群查询排序分页聚合关联多进程并发处理百亿数据查询,秒级返回深度负载均衡自动容灾切换集群式主从备份无缝扩容式海量存储读写分离、快速迁移标准MYSQL查询协议p自动检测各个计算资源状态和岩机情况,提供深度负载均衡和自动容灾切换能力p传统的MySql、Or
10、acle、Hadoop百亿级数据秒级返回困难p1万分组查询的性能是MySql的10倍以上p数据插入迁移性能在30,000 条/秒以上p密集并发,低资源占用,一般的查询内存在1G以内,磁盘占用几乎为零基于MySql,能力远高于MySql-22-海量数据应用的三座大山什么样的信息内容都有厂家不同、获取方式不同、字段不同,内容不全。Poseidon大数据处理分析平台推/拉采集定制格式采集格式转换字典映射数据过滤数据标准化采集与清洗清洗实时计算内存计算图计算适用于各种场景下的多种计算模式单机提供百万级的处理与转发能力灵活、高效的SQL分析处理引擎提供千亿数据量的分析、挖掘能力多种获取方式、多种清洗手段
11、大数据接入大数据计算转发大数据分析挖掘多种存储方式满足海量数据存储存储动态扩容,服务无缝切换大数据存储文件存储内存存储列式存储高效容错简洁操作查询优化实时处理的、分阶段处理的、定期汇总的。什么样的处理要求都有面向的用户不同,分析的内容目标也不同。什么样的分析应用都有大数据分析(Poseidon)千亿级数据处理与分析方案-23-04.VDT大数据应用-24-人员信息和车辆信息协同应用公安最关注的目标:重点人员、重点车辆重点人员轨迹信息重点车辆轨迹信息通过视频提取人员、车辆信息,进行轨迹描述-25-通过人脸比对确认重点关注人员的时空位置 人脸识别技术可以有效地进行人员身份识别,并且通过人脸采集点确
12、定布控人员的时空位置,为轨迹描述及行为追踪提供了支撑手段。人脸检测特征提取比对识别地点确认-26-通过车牌识别描述车辆行驶轨迹l 车辆行踪掌控:从哪来,到哪去;l 历史轨迹事件回溯:经过的地方、发生的事情、有哪些异常。-27-通过行驶轨迹查找车辆-28-以图搜图,通过车辆细节特征比对同一车辆。有效发现目标车辆的套牌行为。比对车辆特征图像比对认定同一车辆-29-多种手段辅助认证lWIFI围栏l手机APPl公安情报资源借助WIFI信息、手机APPs信息、银行、住宿、交通等信息,辅助确认人、车轨迹-30-情报大数据与视频大数据的结合应用银行信息住宿信息车辆信息人像信息通讯信息对人像布控结果和车辆布控结果进行验证确认重点人员的身份信息和重点车辆的归属信息碰撞-31-专家型运维团队输出价值线索人像信息、车辆信息、住宿信息、银行信息、通讯信息等情报进行综合分析。情报分析能力图像处理能力人像专业辨识能力输出准确、有价值的人员信息和车辆信息组建专业运维团队,为业务应用输出最有价值的人、车信息。