1、1深度学习入门理论2主要内容人脑视觉机理1关于特征2深度学习思想3训练过程45常用模型3人脑视觉机理 人的视觉系统的信息处理是分级的,神经-中枢-大脑的工作过程是一个不断迭代、不断抽象的过程。4目前我们通过机器学习去解决这些问题的思路都是这样的(以视觉感知为例):5关于特征 特征是机器学习系统的原材料。如果数据被很好的表达成了特征,通常线性模型就能达到满意的精度。对于特征,我们需要考虑四个方面:1、特征表示的粒度、特征表示的粒度 2、初级(浅层)特征表示、初级(浅层)特征表示 3、结构性特征表示、结构性特征表示 4、需要有多少个特征、需要有多少个特征6关于特征1、特征表示的粒、特征表示的粒度度
2、 学习算法在一个什么粒度上的特征表示,才有能发挥作用?7关于特征2、初级(浅层)特、初级(浅层)特征表示征表示 像素级的特征表示方法没有作用,那怎样的表示才有用呢?8关于特征3、结构性特征表示、结构性特征表示 小块的图形可以由基本edge构成,更结构化,更复杂的,具有概念性的图形如何表示呢?9关于特征 在不同对象上做训练时,所得的边缘基底 是非常相似的,但对象部分和模型 就会完全不同了。10关于特征4、需要有多少个、需要有多少个特征特征 我们知道需要层次的特征构建,由浅入深,但每一层该有多少个特征呢?11深度学习思想 对堆叠多个层,也就是说这一层的输出作为下一层的输入。通过这种方式,并且使得输
3、入与输出的差别尽可能地小,就可以实现对输入信息进行分级表达了。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段,“特征学习”是目的。12深度学习训练过程 1)使用自下上升非监督学习 从底层开始,一层一层的往顶层训练,采用无标定数据(有标定数据也可)分层训练各层参数。2)自顶向下的监督学习 就是通过带标签的数据去训练,误差自顶向下传输,对网络进行微调,基于第一步得到的各层参数进一步微调整个多层模型的参数,这一步是一个有监督训练过程13深度学习的常用模型 1、AutoEncoder自动编码器自动编码器
4、 自动编码器就是一种尽可能复现输入信号的神经网络。具体过程简单的说明如下:1)给定无标签数据,用非监督学习学习特征:)给定无标签数据,用非监督学习学习特征:14AutoEncoder自动编码器自动编码器通过调整encoder和decoder的参数,使得重构误差最小,这时候我们就得到了输入input信号的第一个表示了,也就是编码code了。因为是无标签数据,所以误差的来源就是直接重构后与原输入相比得到。15AutoEncoder自动编码器自动编码器 2)通过编码器产生特征,然后训练下一层。这样逐层训)通过编码器产生特征,然后训练下一层。这样逐层训练:练:将第一层输出的code当成第二层的输入信号
5、,同样最小化重构误差,就会得到第二层的参数,并且得到第二层输出的code,也就是原输入信息的第二个表达了。其他层就用同样的方法炮制。16AutoEncoder自动编码器自动编码器 3)有监督微调:)有监督微调:到这里,这个AutoEncoder还不能用来分类数据,可以在AutoEncoder的最顶的编码层添加一个分类器,然后通过标准的多层神经网络的监督训练方法(梯度下降法)去训练。微调分为两种,一个是只调整分类器(黑色部分):17AutoEncoder自动编码器自动编码器 另一种:通过有标签样本,微调整个系统:在研究中可以发现,如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度,甚
6、至在分类问题中比目前最好的分类算法效果还要好!18AutoEncoder自动编码器自动编码器 AutoEncoder存在的一些变体:a)Sparse AutoEncoder稀疏自动编码器稀疏自动编码器 b)Denoising AutoEncoders降噪自动编码器降噪自动编码器19深度学习的常用模型 2、Sparse Coding稀疏编码稀疏编码 将一个信号表示为一组基的线性组合,而且要求只需要较少的几个基就可以将信号表示出来。稀疏编码算法是一种无监督学习方法,它用来寻找一组“超完备”基向量来更高效地表示样本数据。目标函数:Min|I O|+u*(|a1|+|a2|+|an|)20Sparse
7、 Coding稀疏编码稀疏编码21Sparse Coding稀疏编码稀疏编码 Sparse coding分为两个部分:1)Training阶段:阶段:给定一系列的样本图片x1,x 2,,我们需要学习得到一组基1,2,,也就是字典。训练过程就是一个重复迭代的过程,交替更改a和使得下面这个目标函数最小。22Sparse Coding稀疏编码稀疏编码 2)Coding阶段:阶段:给定一个新的图片x,由上面得到的字典,通过解一个LASSO问题得到稀疏向量a。这个稀疏向量就是这个输入向量x的一个稀疏表达了。23深度学习的常用模型 3、Restricted Boltzmann Machine(RBM)限限制波尔兹曼机制波尔兹曼机 4、Deep Belief Networks深信度网络深信度网络 5、Convolutional Neural Networks卷积神经卷积神经网络网络