1、支持向量机 support vector machine,SVMOutlinenSVM的理论基础n线性判别函数和判别面n最优分类面n支持向量机SVM的理论基础n传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。n传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。n推广能力推广能力是指:将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。过学习问题过学习问题n“过学习问题过学习问题”:某些情况下
2、,当训练误差过小反而会导致推广能力的下降。n例如:对一组训练样本(x,y),x分布在实数范围内,y取值在0,1之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0.SVMn由于SVM 的求解最后转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解nSVM在解决小样本、非线性及高维模式识别问题中在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中合等其他机器学习问题中nJoachims 最近采用SVM在Reuters-21578来进行文本分类,并声称
3、它比当前发表的其他方法都好 OutlinenSVM的理论基础n线性判别函数和判别面n最优分类面n支持向量机线性判别函数和判别面n一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 n两类情况:对于两类问题的决策规则为n如果g(x)0,则判定x属于C1,n如果g(x)0;当;当x点在超平面的负侧时,点在超平面的负侧时,g(x)0,则判定x属于C1,如果g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任意分到某一类或者拒绝判定。广义线性判别函数广义线性判别函数设计线性分类器 OutlinenSVM的理论基础n线性判别函数和判别面n最优分类
4、面n支持向量机最优分类面最优分类面 nSVM 是从线性可分情况下的最优分类面发展而来的,基本思想可用图2的两维情况说明.图中,方形点和圆形点代表两类样本,H 为分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大.推广到高维空间,最优分类线就变为最优分类面。最优分类面最优分类面如何求最优分类面 最优分类面最优分类面OutlinenSVM的理论基础n线性判别函数和判别面n最优分类面n支持向量机支持向量机 上节所得到的最优分类函数为:n该式只包含待分类样本与训练样本中的支持向量的内积 运算,可见,要解决一个特征空间中的最优线性分类问题,我们只需要知道这个空间中的内积运算即可。n 对非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面.这种变换可能比较复杂,因此这种思路在一般情况下不易实现.*1()sgnsgn()kiiiif xwxby x xb支持向量机核函数的选择