奇异值分解(Singular Value Decomposition)是线性代数中一种重要的矩阵分解,是矩阵分析中正规矩阵酉对角化的推广。
术语介绍
奇异值分解在某些方面与对称矩阵或Hermite矩阵基于特征向量的对角化类似。然而这两种矩阵分解尽管有其相关性,但还是有明显的不同。对称阵特征向量分解的基础是谱分析,而奇异值分解则是谱分析理论在任意矩阵上的推广。
理论描述
假设是一个阶矩阵,其中的元素全部属于域 ,也就是 实数域或复数域。如此则存在一个分解使得
,
其中是阶酉矩阵;是半正定阶对角矩阵;而,即的共轭转置,是阶酉矩阵。这样的分解就称作的奇异值分解。对角线上的元素,其中即为的奇异值。
常见的做法是为了奇异值由大而小排列。如此Σ便能由M唯一确定了。(虽然U和V仍然不能确定。)
直观的解释
在矩阵的奇异值分解中
U的列(columns)组成一套对M的正交"输入"或"分析"的基向量。这些向量是的特征向量。
V的列(columns)组成一套对M的正交"输出"的基向量。这些向量是的特征向量。
对角线上的元素是奇异值,可视为是在输入与输出间进行的标量的"膨胀控制"。这些是及的奇异值,并与和的行向量相对应。
奇异值和奇异向量, 以及他们与奇异值分解的关系
一个非负实数是的一个奇异值仅当存在的单位向量u和的单位向量v如下:
其中向量u 和v分别为σ的左奇异向量和右奇异向量。
对于任意的奇异值分解
矩阵Σ的对角线上的元素等于M的奇异值. U和V的列分别是奇异值中的左、右奇异向量。因此,上述定理表明:
一个的矩阵至多有个不同的奇异值。
总是可以找到在Km 的一个正交基U,组成M的左奇异向量。
总是可以找到和Kn的一个正交基V,组成M的右奇异向量。
如果一个奇异值中可以找到两个左(或右)奇异向量是线性相关的,则称为退化。
非退化的奇异值具有唯一的左、右奇异向量,取决于所乘的单位相位因子(根据实际信号)。因此,如果M的所有奇异值都是非退化且非零,则它的奇异值分解是唯一的,因为U中的一列要乘以一个单位相位因子且同时V中相应的列也要乘以同一个相位因子。
根据定义,退化的奇异值具有不唯一的奇异向量。因为,如果和为奇异值σ的两个左奇异向量,则两个向量的任意规范线性组合也是奇异值σ一个左奇异向量,类似的,右奇异向量也具有相同的性质。因此,如果M 具有退化的奇异值,则它的奇异值分解是不唯一的。
几何意义
因为U 和V 向量都是单位化的向量, 我们知道U的列向量组成了K空间的一组标准正交基。同样,V的列向量也组成了K空间的一组标准正交基(根据向量空间的标准点积法则).
线性变换,把向量Nx变换为Mx。考虑到这些标准正交基,这个变换描述起来就很简单了: , 其中σi 是对角阵Σ中的第i个元素; 当时,。
这样,SVD理论的几何意义就可以做如下的归纳:对于每一个线性映射,T把K的第i个基向量映射为K的第i个基向量的非负倍数,然后将余下的基向量映射为零向量。对照这些基向量,映射T就可以表示为一个非负对角阵。
矩阵范数
1. 矩阵范数的概念 设,定义一个实值函数,若满足:
(1) 非负性:,且当且仅当;
(2) 齐次性:;
(3) 三角不等式:;
(4) 相容性:
则称为的矩阵范数。
定理2:由向量的1-范数、2-范数和∞-范数分别诱导出的矩阵范数分别是
通常依次称为列和范数、谱范数和行和范数。
定理3:谱范数和F-范数都是酉不变范数,即对于任意酉矩阵P和Q,有。
应用领域
求伪逆
奇异值分解可以被用来计算矩阵的伪逆。若矩阵的奇异值分解为,
那么 的伪逆为其中是的伪逆,并将其主对角线上每个非零元素都求倒数之后再转置得到的。求伪逆通常可以用来求解线性最小平方、最小二乘法问题。
平行奇异值模型
把频率选择性衰落信道进行分解.
矩阵近似值
奇异值分解在统计中的主要应用为主成分分析(PCA),种数据分析方法,用来找出大量数据中所隐含的“模式”,它可以用在模式识别,数据压缩等方面。PCA算法的作用是把数据集映射到低维空间中去。数据集的特征值(在SVD中用奇异值表征)按照重要性排列,降维的过程就是舍弃不重要的特征向量的过程,而剩下的特征向量组成的空间即为降维后的空间。
几种编程语言中计算SVD的函式范例
[b c d]=SVD狙击步枪(x)
void cvSVD( CvArr* A, CvArr* W, CvArr* U=NULL, CvArr* V=NULL, int flags=0 )
发展
在很长时间内,奇异值分解都无法并行处理。(虽然 谷歌 早就有了MapReduce 等并行计算的工具,但是由于奇异值分解很难拆成不相关子运算,即使在 Google 内部以前也无法利用并行计算的优势来分解矩阵。)最近,Google 中国的张智威博士和几个中国的工程师及实习生已经实现了奇异值分解的并行算法,这是 Google中国对世界的一个贡献。