规范化
取自孙明的"数字图像处理与分析基础"
1. 引入——病态问题和约束
通过改变模型的拟合能力来避免过拟合并不是一件容易的事情,更常用的办法是使用规范化对模型的参数进行一定的约束。下面来考虑一个非常简单的例子,求下面方程的解:
这是一个二元一次方程,有无数个解,都在下图1a所示的这条直线上。
这是一个典型的病态(ill-posed)方程,有无数个解可以满足方程,可以通过
针对病态方程,一个常见的办法是加入一个约束项,缩小
2. L2规范化
虽然上面讨论的是一个非常简单的解方程的例子,但是和机器学习的问题有许多相似性。基于参数的机器学习模型某种程度上就是一个不可逆的问题,对于同一个损失函数值,可以对应很多种不同的参数。甚至在高维度下,极小值和最小值都很接近,所以即使是很好优化过的模型,也会对应许多不同的参数组合,而这些组合未必是数值稳定的。而且因为参数的范围更自由,可以得到很小的训练误差,往往都不具有很好地泛化能力(对训练数据以外数据做出准确预测的能力成为泛化能力)。这时候可以考虑加入一个约束项,这种方法叫做规范化(Regularization)。具体来说就是在损失函数里加上一项,最常用的一种是L2规范化:
其实就是L2范数,也就是欧氏距离的平方乘上一个系数。在神经网络中,L2规范化通常只应用于仿射变换中的线性变换部分,也就是
下面通过一个简单的例子来形象理解下L2规范化的作用。考虑一个只有两个参数
图2a是一个目标函数,可以看到,最小值所在是一条线,整个曲面像一条山岭倒过来一样。这样的曲面对应无数个参数组合,单纯用梯度下降法是难以得到确定解的,可以看做是一个典型的病态问题。但是加上一项
L1规范化(L1 Regularization)
除了L2规范化,L1规范化也是最常见的规范化方法之一,形式如下:
其实在图1所示的例子中已经见过,和L2的区别主要是L2项的等高线不同,二维情况的等高线画在了图1c中,是个旋转
图3中虚线代表的是元损失函数的等高线,实线代表的是规范化项的等高线,左边a图是L2的情况,右边b图是L1的情况。当整体函数达到最小值的时候,如图a中点所示的位置,所以能够很清楚看出,L2项让整体参数都有变小的趋势。二L1则会让参数的方向朝着某个轴靠近,比如图3b中,因为原始损失函数等高线的形状,无论L1项的系数怎么变,最终最小值一定是在横轴上。这样的约束可以让有效特征的数量变少,从而获得稀疏性。因为这个性质,L1规范化经常被用在降噪声和图像重建中。在统计学里L1规范化也有另外一个名字叫做LASSO,即least absolute Shrinkage and Selection Operator,是对L1规范化的一个简短概括。
相关阅读
在Excel2010工作表中,用户可以使用“选择性粘贴”命令有选择地粘贴剪贴板中的数值、格式、公式、批注等内容,使复制和粘
lol2018年2月幸运召唤师活动地址 2月幸运召唤师活动网
lol2018年2月幸运召唤师活动地址,lol2月幸运召唤师活动网址,幸运召唤师的活动是游戏中特别给力的活动之一,大家可以通过超低的折扣来
excel作为功能强大的办公软件,是非常重要的。许多朋友在输入身份证号的时候,会遇到类似3.62202E+17的情况,苦恼不堪。如何迅速的在ex
Excel是Microsoft Office system中的电子表格程序。您可以使用 Excel 创建工作簿(电子表格集合)并设置工作簿格式,以便分析数据和
excel2007中制作员工工资表--自动生成既有格式的方法
企业要想提高整体工作效率,使工作和管理一体化,就必须规范员工工资的管理,再录入时经常会有各自用完而输入内容又要重复前面的工作的