范数的概念

       范数(Norm)是一种关于向量的函数,是向量“长度”概念及其推广。在线性代数、泛函分析及相关的数学领域,可用范数来度量一个向量的“长度”。在中学里我们学过一个向量的模长(长度)是向量中各元素平方和的平方根,比如向量(3,4)的模长就是5,这里模长其实是向量(3,4)的一种范数——L2范数,向量的范数除了L2范数外,还有其他定义,如L0范数、L1范数和L∞范数,下面将一一介绍上述提及的这几个范数概念。

1 L0范数

       若向量X = (x1, x2, …, xn),则向量X的L0范数为

[{left| {f{x}} ight|_0} = {f{x}}中所有非零元素个数
]

       若向量A = (0, 3, 6),向量A中有1个元素为0,2个非零元素 (3和6),则A对应L0范数为

[{left| {f{A}} ight|_0} = {m{2}}
]

       在机器学习中压缩感知(compressive sensing)领域,很多时候希望最小化目标向量的 L0范数。但L0范数的最优化在数学上被认为是个NP-hard问题,即求解很复杂,所以许多压缩感知模型是将最小化目标向量的 L0范数转化为最小化目标向量的 L1范数。

2 L1范数

       若向量X = (x1, x2, …, xn),则向量X的L1范数为

[egin{array}{l}
{left| {f{x}} ight|_1} = left| {{x_1}} ight| + left| {{x_2}} ight| + cdots left| {{x_n}} ight| \
quad ;;{m{ = }}sumlimits_{i = 1}^n {left| {{x_i}} ight|} \
end{array}]

       若向量A = (0, 3, 6),则A对应L1范数为

[{left| {f{A}} ight|_1} = left| {m{0}} ight|{m{ + }}left| {m{3}} ight|{m{ + }}left| {m{6}} ight|{m{ = 3 + 6 = 9}}
]

       最小化目标向量的 L1范数求解比最小化目标向量的 L0范数容易些,可通过最优化算法得到对应的可行解。但L1范数有一个问题,就是L1范数的导数不易求,所以许多机器学习问题中遇到 L1范数最小化问题会转为L2范数最小化问题。

3 L2范数

       若向量X = (x1, x2, …, xn),则向量X的L2范数为

[ egin{array}{l}
{left| {f{x}} ight|_2} = sqrt {{{left| {{x_1}} ight|}^{m{2}}}{m{ + }}{{left| {{x_{m{2}}}} ight|}^{m{2}}}{m{ + }} cdots {m{ + }}{{left| {{x_n}} ight|}^{m{2}}}} \
quad ;;{m{ = }}sqrt {sumlimits_{i = 1}^n {{{left| {{x_i}} ight|}^2}} } \
end{array} ]

       若向量A = (2, 3, 6),则A对应L2范数为

[{left| {f{A}} ight|_2} = sqrt {{2^2} + {3^2} + {6^2}} = sqrt {4 + 9 + 36} = sqrt {49} = 7
]

4 L∞范数

       若向量X = (x1, x2, …, xn),则向量X的L∞范数为

[{left| {f{x}} ight|_infty } = max left( {left| {{x_1}} ight|left| {{x_{m{2}}}} ight| cdots left| {{x_n}} ight|} ight)
]

       若向量A = (2, 3, 6),则A对应L∞范数为

[{left| {f{A}} ight|_infty } = max left( {2,3,6} ight) = 6
]

5 Lp范数

       Lp范数实际上将L1范数、L2范数和L∞范数统一到一个框架体系中。

       若向量X = (x1, x2, …, xn),则向量X的Lp范数为

[ egin{array}{l}
{left| {f{x}} ight|_p} = sqrt[p]{{{{left| {{x_1}} ight|}^p}{m{ + }}{{left| {{x_{m{2}}}} ight|}^p}{m{ + }} cdots {m{ + }}{{left| {{x_n}} ight|}^p}}} \
quad ;;{m{ = }}sqrt[p]{{sumlimits_{i = 1}^n {{{left| {{x_i}} ight|}^p}} }} \
end{array} ]

       关于Lp范数的几何解释可以用单位圆来说明。单位圆是无穷个向量终点组成的集合,这些向量必须满足Lp范数为1且起点为原点。

       对于L1范数,它在R2空间中的单位圆是正方形。

       对于L2范数,它在R2空间中的单位圆是圆形。

       对于L∞范数,它是R2空间中的单位圆也是一个正方形。

       对于任何p范数,它是一个超椭圆(具有全等轴)。下面图为p取不同数值,Lp范数对应的单位圆。


图1 不同p对应的单位圆

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注