关于线性变换和特征值的理解
首先我们来看这样一个事实。一个二维的直角坐标系XOY,然后逆时针方向旋转了ө角变为X’OY’后,考察会发现XOY和 X’OY’的坐标系之间存在这样的转化关系。就是说在XOY坐标系下的某一个点在X’OY’坐标系下的坐标变了 。那么我们同样来考察一下这两个坐标系下的基坐标。就是来考察在XOY坐标系下的基坐标 (1,0)和(0,1)在新的坐标系X’OY’下的 基坐标下的投影大小用(1,0)和(0,1)来表示为这样的。注意,这里的矩阵的排列是前面两个基坐标系数方程的转置矩阵,之所以写为转置矩阵是因为我们习惯这样来写基坐标的线性变换A =( , ) 。我们可以看到这样的旋转变换的目的就是把坐标系旋转后来看一下。这样的旋转角度一旦确定以后,我们就能够得到原来的老坐标下的坐标点在新坐标系下的坐标为 。注意的是,这里的坐标是右乘变换矩阵。
线性变换数学定义在一般的高等代数学书中都可以找到。A(a b)=Aa Ab,Aka=kAa。其中a,b是V中的线性空间。这个定义就是说把空间中的元素(特殊地想为三维空间的向量)经过一个变换,而这种变换是具有线性的特性的。那么这种变换的从一个元素转变到另外一个元素的对应关系,我们可以用前面的一个矩阵来表示,称为线性变换矩阵。
在三维空间中,我们有一个球心在原点(XOYZ和 X’OY’Z’的坐标系具有不为零的三个欧拉角)的球面,球面上的每一个点当然都有一个空间矢量,我们让这个球开始沿着X’OY’Z’的三个主轴方向变化,假设X’,Z’方向膨胀,Y’方向收缩,那么我们可以想见,只有这三个方向的位置矢量是沿着原来的方向变化着的,其它的位置矢量在新的位置都会和原来的位置矢量有一个夹角。容易直观的理解,这样的变换是线性变换。
下面我们要考虑的问题是,怎样来描述这样一个变换过程。无疑我们可以用变换矩阵来表明表面上任意一个点在变化前后的位置对应关系。但是如果用X’OY’Z’坐标系(一个基坐标)来描述这种变换的话,要比XOYZ坐标系(另外一个基坐标)下的变换矩阵要简单一些。问题是,在一般情况下,我们得到的变换矩阵都是在一般的基坐标下的矩阵。前面的二维例子已经指出,变换矩阵就是把一个元素(向量)变换到另外一个元素(向量)的过程。那么,我们先来考察这个元素是基坐标的特列会得到什么样的结果。假设我们已经给出这样的一个变换矩阵。 那么我们再来右乘一个基坐标。得到的结果就是这个基向量。变为了一个不和原来的基坐标同方向的矢量。同样地,其它两个基坐标也会变化为其它的方向。进一步我们指出,如果说空间中的向量(因为任何一个向量都可以用无关的基向量表述)。
我们可以想像,在这种变换矩阵的作用下,能否找到空间中某一个向量经过这种方式变换以后,具有和原来的向量同方向,但是只是它的这个大小具有倍的关系,即我们经常见到的 。假设我们这样的向量存在的话,那么我们的就称为特征向量,(因为其具有线性变换下方向不变的特征), 称为特征值。很显然,我们可以用前面的圆球变椭球来想象,这种情况是可能发生的,但是我们指出,这种情况发生与否只与变换矩阵本身相关。关于变换矩阵的特征值和特征向量,其具体的求法就是求解一个特征多项式,得到特征值后,将每一个特征值反带回元原来的方程组得到特征向量。并且,我们指出,物理意义上相同的同一个线性变换,用不同的基坐标来表示得到的变换矩阵是不一样的(就拿旋转变换来说吧,假设已经有了两个坐标系XOY和 X’OY’,又有第三个坐标X’’OY’’首先与XOY重合,然后在旋转一个角度,那么这个转转变换在XOY和 X’OY’坐标系下的变换矩阵显然是不一样的,因为针对不同坐标系的旋转角度是不一样的)。但是,可以证明同一种变换在不同的基坐标下的变换矩阵是相似的。并且可以证明相似矩阵具有相同的特征多项式,这也就是说同一个变换的特征多项式至于变换本身有关系,而与具体的选择的基坐标无关,是有变换本身的特性决定的。那么,我们自然可以相问,能否找到一个基,使得这个变换矩阵具有最简单的形式(当然是对角矩阵了)。换句话说,就是能否找到一个矩阵和对角性矩阵相似。我们先来在假设第一个问题量是肯定的情况下,来看看第二个问题。我们还是用前面的圆球变椭球来想象,这种物理上的变换是不会随着基坐标系的改变而改变的。那么就圆球变椭球的例子,我们可以看到,在XOY坐标系下的变换矩阵不简单,但是,如果我们将基坐标选择为和 X’OY’重合,那么在这个坐标系下,同样基坐标方向上的那个向量在进行矩阵变换后只是变为原来的λ倍。在这个特征向量作为基的情况下,我们得到的线性变换的矩阵是最简单的对角形矩阵,并且对角线上的元素全是特征向量的特征值,至于具体的排列顺序没有严格的要求,但是,必须和你选择的基坐标的顺序一样,也就是说,如果选择位置的话,那么就同时必须把 对应的特征向量作为X方向的基坐标。同时我们也可以看到,在三维空间中,变换矩阵表示为对角形的三个基向量是线性无关的,这个概念推广就是我们一般的结论那就是一个nxn维变换矩阵能相似于一个对角形矩阵(或者说可以在特征向量的基坐标下变化为对角形)的充要条件就是必须具有n个线性无关的特征向量。如果这一结论对所有矩阵都成立的话就比较好了,但是可惜的是,并非所有矩阵都有和其维数一样多的特征向量。但是,我们可以得出如下的结论。1、属于不同特征值的特征向量彼此之间线性无关,2、如果某一特征值有几个线性无关向的特征向量,那么这几个线性无关向量和其它任何不同特征值的特征向量是线性无关的。3、矩阵相似与对角阵的条件是矩阵有和维数一样多的线性无关特征向量。我们最后指出,实对称矩阵必定可以对角化。最后我们来联系流体力学来看,张量的意思就是把变化到另外一个地方去。那么变形速度张量和一个的右向内积就是得到一个变形速度。