1、目录背景介绍Contents1小节介绍2本章总结3背景介绍B A C K G R O U N DE v e r y i m a g e t e l l s a s t o r y.C o m p u t e r v i s i o n d e v e l o p s t h e o r i e s a n d m e t h o d s t o a l l o w c o m p u t e r s t o e x t r a c t re l e va n t i n f o r m a t i o n f ro m d i g i t a l i m a g e s o r v i d e
2、 o s.ONE背 景 介 绍作为人类,我们可以轻松感知周围的三维世界。相比之下,不管近年来计算机视觉已经取得多么令人瞩目的成果,但要让计算机能像人类那样理解和解释图像,却仍然是一个遥远的梦想。小节介绍S E C T I O N I N T R O D U C T I O NE v e r y i m a g e t e l l s a s t o r y.C o m p u t e r v i s i o n d e v e l o p s t h e o r i e s a n d m e t h o d s t o a l l o w c o m p u t e r s t o e x
3、t r a c t re l e va n t i n f o r m a t i o n f ro m d i g i t a l i m a g e s o r v i d e o s.TWO1.1 计算机视觉简史美国计算机科学家拉里罗伯茨在麻省理工大学的博士毕业论文Machine Perception of Three-Dimensional Solids1963年热点偏向于图像内容的建模,如三维建模、立体视觉等20世纪70年代主动视觉理论和定性视觉理论等被提出,进入了最蓬勃发展的一个时期20世纪80年代机器学习开始成为计算机视觉,尤其是识别、检测和分类等应用中一个不可分割的重要工具成为
4、计算机领域的一个大学科21世纪20世纪90年代基于神经网络的深度学习算法2012年,Hinton的小组参加了ImageNet竞赛,提出卷积神经网络AlexNet,取得十个百分点的改进,完胜第二名冲击传统计算机视觉分类算法更深的网络结构校正线性单元(Rectified Linear Unit,ReLU)、Dropout等方法的应用GPU训练网络三点改进自从2012年后,基于深度学习的检测和识别、基于深度学习的图像分割、基于深度学习的立体视觉等如雨后春笋般一夜之间全冒了出来。在各领域发挥作用1.2 计算机视觉发展的新起点现实生活应用安防交通工业生产在线购物信息检索游戏娱乐摄影摄像机器人无人机体育医
5、疗1.3 计算机视觉应用相对其他许多传统的机器学习方法,深度神经网络本身就是一个消耗计算量的大户。另一方面,由于多层神经网络本身极强的表达能力,对数据量也提出了很高的要求。u 20世纪80年代,使用专门的运算单元负责对三维模型形成的图像进行渲染。u 1999年,NVIDTA发布GeForce 256,正式提出了GPU的概念。u 2000年,尝试用GPU来加速通用高密度、大吞吐量的计算任务。u 2001年,通用图形处理器(General-Purpose computing on CPU,GPGPU)的概念被正式提出。u 2002年,多伦多大学的James Fung发布了Open VIDIA,利用
6、GPU实现了一些计算机视觉库的加速,这是第一次正式将GPU用到了渲染以外的用途上。u 2006年,NVIDIA推出了利用GPU进行通用计算的平台CUDA,很快就流行开并成为了GPU通用计算的主流框架。u 2012年,Alex一战成名,同时GPU也成为了训练深度神经网络的标配。1.4 GPU与并行技术图像搜索图像分割生成对抗网络图像描述图像分类物体检测人脸识别卷积神经网络01020304051.5 基于卷积神经网络的计算机视觉应用本章总结C H A P T E R S U M M A R YE v e r y i m a g e t e l l s a s t o r y.C o m p u t
7、 e r v i s i o n d e v e l o p s t h e o r i e s a n d m e t h o d s t o a l l o w c o m p u t e r s t o e x t r a c t re l e va n t i n f o r m a t i o n f ro m d i g i t a l i m a g e s o r v i d e o s.Three本书从基本的视觉色彩原理到神经网络模型,再到之后的卷积模型与具体应用,对计算机视觉领域的知识进行了较为系统的介绍。全书共分为八个章节:第二、三章介绍及;第四章介绍;第五至八章介绍等主要任务及算法。1.6 全书章节简介