ImageVerifierCode 换一换
格式:PPTX , 页数:38 ,大小:3.22MB ,
文档编号:5647205      下载积分:20 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-5647205.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(ziliao2023)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(目标检测RCNN系列讲解复习课程课件.pptx)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

目标检测RCNN系列讲解复习课程课件.pptx

1、基于基于R-CNN的系列目标检测算法的系列目标检测算法组员:组员:R-CNN,SPP NET,Fast R-CNN,Faster R-CNN目 录CONTENTS01背景知识02RCNNSPP NETFast R-CNNFaster R-CNN030504实例展示0601背景知识PART ONE背景知识04目标检测是在给定的图片中精确找到物体所在位置,并标注出物体的类别。物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,并且物体还可以是多个类别。目标检测背景知识05图像识别(classification):输入:图片输出:物体的类别评估方法:准确率。定位(loca

2、lization):输入:图片输出:方框在图片中的位置(x,y,w,h)评估方法:检测评价函数 intersection-over-union背景知识06目标检测算法1.传统的目标检测算法:Cascade+HOG/DPM+Haar/SVM以及上述方法的诸多改进、优化;2.候选区域/窗+深度学习分类:通过提取候选区域,并对相应区域进行以深度学习方法为主的分类的方案,如:R-CNN(Selective Search+CNN+SVM)SPP-net(ROI Pooling)Fast R-CNN(Selective Search+CNN+ROI)Faster R-CNN(RPN+CNN+ROI)R-F

3、CN等系列方法;3.基于深度学习的回归方法:YOLO/SSD/DenseBox 等方法;以及最近出现的结合RNN算法的RRC detection;结合DPM的Deformable CNN等。02R-CNNPART TWOR-CNN08传统目标检测方法传统目标检测的算法基本流程如下:l使用不同尺度的滑动窗口选定图像的某一区域为候选区域;l从对应的候选区域提取如Harr HOG LBP LTP等一类或者多类特征;l使用Adaboost、SVM 等分类算法对对应的候选区域进行分类,判断是否属于待检测的目标。1、基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余;2、手工设计的特征对于多样性

4、的变化没有很好的鲁棒性。传统目标检测方法的缺点R-CNN09R-CNN是Region-based Convolutional Neural Networks的缩写,中文翻译是基于区域的卷积神经网络,是一种结合区域提名(Region Proposal)和卷积神经网络(CNN)的目标检测方法。区域提名(Region Proposal):利用图像中的纹理、边缘、颜色等信息,预先找出图中目标可能出现的位置。需要解决的问题:(1)适应不同尺度 (2)多类别图像的适应性(3)速度。R-CNN的主要贡献:1)传统目标检测算法一般使用滑动窗口扫描所有可能区间,同时需要考虑变化窗口尺寸以适应不同大小的目标,这种

5、方法效率太低。R-CNN使用Selective Search方法预先提取所有候选区域;2)传统目标检测算法依赖人工设计的特征,R-CNN使用深度学习自动提取和学习特征。R-CNN10R-CNN的简要步骤如下:(1)输入测试图像;(2)利用选择性搜索(Selective Search)算法在图像中从下到上提取2000个左右的可能包含物体的候选区域;(3)因为取出的区域大小各自不同,所以需要将每个候选区域缩放(warp)成统一的227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征;(4)将每个候选区域提取到的CNN特征输入到SVM进行分类。R-CNN的总体思路R-CNN11Sele

6、ctive Search算法R-CNN12RCNN的具体步骤步骤一:训练(或者下载)一个分类模型(比如AlexNet)R-CNN13步骤二:对该模型做fine-tuning将分类数从1000改为20,比如20个物体类别+1个背景去掉最后一个全连接层R-CNN14步骤三:特征提取提取图像的所有候选框(选择性搜索Selective Search);对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘。R-CNN15步骤四:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别每个类别对应一个SVM,判断是不是属于这个类别,是就

7、是positive,反之nagative。比如下图,就是对狗分类的SVMR-CNN16步骤五:使用回归器精细修正候选框位置:对于每一个类,训练一个线性回归模型去判定这个框是否框得完美R-CNN171、基于R-CNN目标检测算法只能输入固定尺寸的图片,样本输入受限2、经人工处理过的图片,易降低网络识别检测精度3、R-CNN需对各候选区域进行一次卷积操作,计算量大,耗时长R-CNN存在的问题人工图片处理样例03SPP NETPART THREESPP NET19在R-CNN的第一步中,对原始图片通过Selective Search提取的候选框多达2000个左右,而这2000个候选框每个框都需要进行

8、CNN提特征+SVM分类,计算量很大,导致R-CNN检测速度很慢,一张图都需要47s。而且,基于R-CNN目标检测算法只能输入固定尺寸的图片,样本输入受限,使用很不方便。那么如何改进呢?SPP-NET的出现恰好解决了这些问题。SPP-Net(Spatial Pyramid Pooling)是何凯明2014年提出的方法,通过解决传统CNN无法处理不同尺寸输入的问题对同年的R-CNN算法做改进,实验结果表明SPP方法比R-CNN快了近100倍从算法架构上,SPP-Net与R-CNN相似:通过Selective Search获取候选区域,最后也是使用SVM做分类。但不再将每个候选区域过一次CNN,而

9、是将原始图过一次CNN,在CNN的全连接层前添加新提出的SPP层,根据候选区域位置crop的图像卷积结果通过SPP层来确保输入全连接层的尺寸满足要求。最后在全连接层的输出一次性获得所有候选区域的特征向量。SPP NET20SPP NET的原理可允许不同尺寸图片输入,将R-CNN最后一个卷积层后的池化层替换为SPP层,生成长度固定的特征,并输入到最后的全连接层中。特点:1、可实现CNN多尺度图像的输入;2、只对原图进行一次卷积特征提取。SPP Net结构SPP Net vs R-CNNSPP NET21SPP NET的具体步骤步骤一:选择性搜索对待检测图片,选择性搜索出2000个候选框候选区域提

10、取SPP NET22步骤二:特征提取将整张待检测图片输入CNN中,进行一次特征提取,得到feature maps。在各feature map中找到各候选框区域。SPP Net特征提取SPP NET23步骤三:空间金字塔池化对各候选框区域进行空间金字塔池化,提取出固定长度的特征向量。空间金字塔池化SPP NET24步骤四:训练SVM分类器利用SVM算法,对各候选区域对应的特征向量进行分类识别。SVM分类识别SPP NET25SPP NET存在的问题经SPP NET改进后的R-CNN虽能有效提高检测速度,但仍存在局限性:在SPP NET采用selective search对原始图片进行候选区域提取

11、时,由于候选区域数量较多,存在候选区域特征重复提取计算问题,限制了SPP NET的检测速度。另外,对SPP NET,虽然ROI特征在最后一个卷积层才提取,省去了多次前向CNN。但由于SVM,ROI特征仍需存储。此外,SPP NET中的tunning无法更新SPP层之前的所有权重,因此对于比较深的网络无能为力。04Fast R-CNNPART FOURFast R-CNN27R-CNN和SPP NET的不足:1)R-CNN和SPP NET的训练都需要经过多个阶段:fine-tuning得到网络卷积层的特征输出、SVM对每组特征向量的学习、位置bounding box的回归2)对R-CNN,训练和

12、测试的时间空间开销大。每个图像提取的大量ROI特征需要存储和通过CNN3)对SPP NET,虽然ROI特征在最后一个卷积层才提取,省去了多次前向CNN。但由于SVM,ROI特征仍需存储。此外,SPP NET中的tunning无法更新SPP层之前的所有权重,因此对于比较深得网络无能为力Fast R-CNN是Ross Girshick在2015年对上一年的SPP Net算法做的改进。作者在VGG16网络的测试表明:Fast R-CNN在训练阶段比R-CNN快了9倍,比SPP NET快了3倍;在测试阶段比R-CNN快了213倍,比SPP NET快了10倍;同时精度也有一定提升。Fast R-CNN2

13、8Fast R-CNN算法思想Fast R-CNN算法首先通过 selective search方法生成约2K个ROI,连同图像一起输入到CNN网络;在最后一个卷积层后求取ROI位置的映射关系,使用1层的SPP池化层将每个ROI统一到相同大小;最后通过两个全连接层,一个FC层后接softmax实现分类,一个FC层后接bounding box回归得到类别修正后的位置。Fast R-CNN29(1)ROI pooling layer实际上是SPP-NET的一个精简版,SPP-NET对每个proposal使用了不同大小的金字塔映射,而ROI pooling layer只需要下采样到一个7x7的特征图

14、。对于VGG16网络conv5_3有512个特征图,这样所有region proposal对应了一个7*7*512维度的特征向量作为全连接层的输入。换言之,这个网络层可以把不同大小的输入映射到一个固定尺度的特征向量。(2)边框回归对于窗口一般使用四维向量(x,y,w,h),分别表示窗口的中心点坐标和宽高。红色的框 P 代表原始的Proposal,绿色的框 G 代表目标的Ground Truth,我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G。所以,边框回归的目的即是:给定(Px,Py,Pw,Ph)寻找一种映射f,使得 f(Px,Py,Pw,P

15、h)=(Gx,Gy,Gw,Gh)并且(Gx,Gy,Gw,Gh)(Gx,Gy,Gw,Gh)Fast R-CNN30与R-CNN框架图对比,可以发现主要有两处不同:一是最后一个卷积层后加了一个ROI pooling layer;二是损失函数使用了多任务损失函数,将边框回归Bounding Box Regression 直接加入到CNN网络中训练。Fast R-CNN vs R-CNNFast R-CNN31R-CNN:许多候选框-CNN-得到每个候选框的特征-分类+回归Fast R-CNN:一张图片-CNN-得到每张候选框的特征-分类+回归所以,Fast R-CNN相对于R-CNN的提速原因就在于

16、:不像R-CNN把每个候选区域给深度网络提特征,而是整张图提一次特征,再把候选框映射到第五个卷积层上,而Fast R-CNN只需要计算一次特征,剩下的只需要在第五个卷积层上操作就可以了。然而,Fast R-CNN在进行选择性搜索时,需要找出所有的候选框,这个过程也非常耗时。05Faster R-CNNPART FIVEFaster R-CNN33由于Fast R-CNN在进行选择性搜索时,需要找出所有的候选框,这大大限制了其检测的速度。Faster R-CNN是Ross Girshick对Fast R-CNN算法的改进。简单网络(ZF)目标检测速度达到17fps,在PASCAL VOC上准确率

17、为59.9%;复杂网络(VGG-16)达到5fps,准确率78.8%。Faster R-CNN算法思想从R-CNN到Fast R-CNN,再到Faster R-CNN,目标检测的四个基本步骤(候选区域生成,特征提取,分类,位置精修)终于被统一到一个深度网络框架之内。所有计算没有重复,完全在GPU中完成,大大提高了运行速度。Faster R-CNN可以简单地看做“区域生成网络RPN+Fast RCNN“的系统,用RPN代替fast RCNN中的Selective Search方法。Faster R-CNN34RPN为了提高候选区域的寻找速度,加入一个提取边缘的神经网络,也就是说,寻找候选框的任务

18、也交给神经网络来完成。在Faster R-CNN中引入Region Proposal Network(RPN)替代Selective Search,同时引入anchor box应对目标形状的变化问题(anchor就是位置和大小固定的box,可以理解成事先设置好的固定的proposal)。具体做法:将RPN放在提取整幅图片特征的CNN后面,RPN直接训练得到候选区域。1.在feature map上滑动窗口。2.建一个神经网络用于物体分类+框位置的回归。3.滑动窗口的位置提供了物体的大体位置信息。4.框的回归提供了框更精确的位置。Faster R-CNN35R-CNN VS Fast R-CNN

19、VS Faster R-CNNRCNN:Selective Search-每个候选框CNN特征提取-SVM分类-边框回归Fast R-CNN:Selective Search-整张图片输入CNN,得到feature map-每个候选框在feature map上的映射patch作为卷积特征输入到SPP layer和之后的层-softmax分类+边框回归Faster R-CNN:整张图片输入CNN,得到feature map-输入到RPN,得到候选框-对候选框中提取出的特征,使用分类器判别是否属于一个特定类-分类+边框回归06实验展示PART SIX实验展示35采用MIT pedestrian detection database基于VGG16的Faster RCNN实验结果由测试结果可以看到,Faster RCNN 对目标具有较好的检测效果,且对于人群间的重叠,仍能较好的进行检测。Faster RCNN行人检测结果感谢各位聆听Thanks for Listening

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|