Download - 矩阵分析 - Matrix Theory - Wuhan University

第 5章矩阵分析

Matrix Theory

黄正华

Email: [email protected]

武汉大学数学与统计学院

December 29, 2014

黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 1 / 109

mailto:[email protected]

分析 Analysis, 一般称为 “数学分析”, 是微积分的 Pro 版本.

矩阵分析讨论矩阵序列的极限、矩阵级数、矩阵的微分与积分等分析概念.


Outline

1 向量范数及矩阵范数

向量范数

矩阵范数

2 矩阵序列与矩阵级数

3 矩阵的微分与积分

4 矩阵函数


在第二章中我们用内积定义了向量的长度:

∥x∥ =√

(x|x),

它是几何向量长度概念的一种推广.

本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.

Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:

1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有

∥x + y∥ 6 ∥x∥+ ∥y∥,

则称 ∥x∥ 为线性空间 V 中向量 x 的::范

::数(norm). 定义了范数的线性空间 V 又

叫做::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),

它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.



∥x + y∥ 6 ∥x∥+ ∥y∥,



叫做::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),



1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;

2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有

∥x + y∥ 6 ∥x∥+ ∥y∥,



叫做::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),



1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;

3 三角不等式: 对任意 x, y ∈ V, 都有

∥x + y∥ 6 ∥x∥+ ∥y∥,



叫做::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),




∥x + y∥ 6 ∥x∥+ ∥y∥,



叫做::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),




∥x + y∥ 6 ∥x∥+ ∥y∥,


::数(norm).

定义了范数的线性空间 V 又叫做

::线

::性

::赋

::范

::空

::间.



∥x∥ =√

(x|x),




∥x + y∥ 6 ∥x∥+ ∥y∥,



叫做::线

::性

::赋

::范

::空

::间.


基本性质

1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥

= ∥x∥.

2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)

事实上, (1) 式等价于

−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.

而

−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)

∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)


基本性质

1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥ = ∥x∥.

2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)

事实上, (1) 式等价于

−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.

而

−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)

∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)


由

∥y∥ = ∥x + y − x∥ 6 ∥x∥+ ∥y − x∥ = ∥x∥+ ∥x − y∥, (4)

∥x∥ = ∥x − y + y∥ 6 ∥x − y∥+ ∥y∥, (5)

得证 (1) 式成立.

� 注意向量范数是在一般线性空间 V 中给出的, 定义中的向量是广义向量,就是说对矩阵、多项式、连续函数等都可以定义向量范数.

下文讨论的向量范数, 仅限于线性空间 Cn 上讨论.


由

∥y∥ = ∥x + y − x∥ 6 ∥x∥+ ∥y − x∥ = ∥x∥+ ∥x − y∥, (4)

∥x∥ = ∥x − y + y∥ 6 ∥x − y∥+ ∥y∥, (5)

得证 (1) 式成立.� 注意向量范数是在一般线性空间 V 中给出的, 定义中的向量是广义向量,就是说对矩阵、多项式、连续函数等都可以定义向量范数.

下文讨论的向量范数, 仅限于线性空间 Cn 上讨论.


线性空间 Cn 的范数

任取 x ∈ Cn, 设 x = (ξ1, ξ2, · · · , ξn)T, 常用的范数有

1 2-范数

∥x∥2 =( n∑

i=1

|ξi|2) 1

2

.

2 1-范数

∥x∥1 =n∑

i=1

|ξi|.

3 ∞-范数∥x∥∞ = max

16i6n|ξi|.

以上三种范数都是以下:::p-范

::数的特例:

∥x∥p =( n∑

i=1

|ξi|p) 1

p, 1 6 p < +∞.


p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式.

例如 p = 12 , 则

∥x∥p =( n∑

i=1

|ξi|p) 1

p=

( n∑i=1

√|ξi|

)2

,

对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则

∥α+ β∥ 12= 4, ∥α∥ 1

2= 1, ∥β∥ 1

2= 1.

1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.

2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.


p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式. 例如 p = 12 , 则

∥x∥p =( n∑

i=1

|ξi|p) 1

p=

( n∑i=1

√|ξi|

)2

,

对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则

∥α+ β∥ 12= 4, ∥α∥ 1

2= 1, ∥β∥ 1

2= 1.

1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.

2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.


Theorem 1.2对任意向量 x ∈ Cn,

limp→∞

∥x∥p = ∥x∥∞. (6)

证: 因 (max16i6n

|ξi|p) 1

p 6( n∑

i=1

|ξi|p) 1

p 6(

n · max16i6n

|ξi|p) 1

p,

故有

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.

令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.



limp→∞

∥x∥p = ∥x∥∞. (6)

证: 因 (max16i6n

|ξi|p) 1

p 6( n∑

i=1

|ξi|p) 1

p

6(

n · max16i6n

|ξi|p) 1

p,

故有

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.

令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.



limp→∞

∥x∥p = ∥x∥∞. (6)

证: 因 (max16i6n

|ξi|p) 1

p 6( n∑

i=1

|ξi|p) 1

p 6(

n · max16i6n

|ξi|p) 1

p,

故有

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.

令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.


范数的等价性

按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.

Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有

K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .

由

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞

表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.


范数的等价性



K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .

由

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞

表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价,

因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.


范数的等价性



K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .

由

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞

表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.

特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.


范数的等价性



K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .

由

∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞

表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.


Outline


向量范数

矩阵范数



4 矩阵函数


注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.

与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:

∥A∥V1 =m∑

i=1

n∑j=1

|aij|,

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=

√tr(AHA) , ∥A∥F, (Frobenius 范数)

∥A∥V∞ = maxi,j

|aij|, (契比雪夫范数)

∥A∥Vp =( m∑

i=1

n∑j=1

|aij|p) 1

p, 1 6 p < +∞.

可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .




∥A∥V1 =m∑

i=1

n∑j=1

|aij|,

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=




∥A∥Vp =( m∑

i=1

n∑j=1

|aij|p) 1

p, 1 6 p < +∞.

可以证明它们都是线性空间 Cm×n 上的向量范数.

� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .




∥A∥V1 =m∑

i=1

n∑j=1

|aij|,

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=




∥A∥Vp =( m∑

i=1

n∑j=1

|aij|p) 1

p, 1 6 p < +∞.

可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector.

同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .




∥A∥V1 =m∑

i=1

n∑j=1

|aij|,

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=




∥A∥Vp =( m∑

i=1

n∑j=1

|aij|p) 1

p, 1 6 p < +∞.

可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .


F-范数

Frobenius 范数

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=

√tr(AHA) , ∥A∥F

简称为::::F-范

::数, 是最常见的范数之一.

它是酉空间 Cm×n 中的内积

(A | B) = tr(BHA) =m∑

i=1

n∑j=1

bijaij

所诱导的范数. 即

∥A∥2F = (A | A) = tr(AHA) =m∑

i=1

n∑j=1

|aij|2.


F-范数

Frobenius 范数

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=


简称为::::F-范

::数, 是最常见的范数之一. 它是酉空间 Cm×n 中的内积

(A | B) = tr(BHA) =m∑

i=1

n∑j=1

bijaij

所诱导的范数.

即

∥A∥2F = (A | A) = tr(AHA) =m∑

i=1

n∑j=1

|aij|2.


F-范数

Frobenius 范数

∥A∥V2 =( m∑

i=1

n∑j=1

|aij|2) 1

2

=


简称为::::F-范

::数, 是最常见的范数之一. 它是酉空间 Cm×n 中的内积

(A | B) = tr(BHA) =m∑

i=1

n∑j=1

bijaij

所诱导的范数. 即

∥A∥2F = (A | A) = tr(AHA) =m∑

i=1

n∑j=1

|aij|2.


Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有

∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.

称之为 F-范数的::酉

::不

::变

::性.

证: 由 ∥A∥F =

√tr(AHA), 得

∥UA∥F =

√tr(AHUHUA) =

√tr(AHA) = ∥A∥F.

其他同理.





::不

::变

::性.

证: 由 ∥A∥F =

√tr(AHA),

得

∥UA∥F =

√tr(AHUHUA) =


其他同理.





::不

::变

::性.

证: 由 ∥A∥F =

√tr(AHA), 得

∥UA∥F =

√tr(AHUHUA)

=


其他同理.





::不

::变

::性.

证: 由 ∥A∥F =

√tr(AHA), 得

∥UA∥F =

√tr(AHUHUA) =


其他同理.


矩阵范数

Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足

1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;

2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.

则称 ∥ · ∥ 为::相

::容

::的

::矩

::阵

::范

::数, 或简称为

::矩

::阵

::范

::数.


矩阵范数


1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;

3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.

则称 ∥ · ∥ 为::相

::容

::的

::矩

::阵

::范

::数, 或简称为

::矩

::阵

::范

::数.


矩阵范数


1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;

4 ∥AB∥ 6 ∥A∥∥B∥.

则称 ∥ · ∥ 为::相

::容

::的

::矩

::阵

::范

::数, 或简称为

::矩

::阵

::范

::数.


矩阵范数


1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.

则称 ∥ · ∥ 为::相

::容

::的

::矩

::阵

::范

::数, 或简称为

::矩

::阵

::范

::数.


若将向量 x 视为矩阵, 根据相容性矩阵范数定义的第 4 条∥AB∥ 6 ∥A∥∥B∥, 应有

∥Ax∥ 6 ∥A∥∥x∥.

它们各自取不同的范数仍能使这个不等式成立吗? 两者怎样取才能协调? 这就是矩阵范数与向量范数相容的概念.

Definition 1.6如果矩阵范数 ∥A∥m 和向量范数 ∥x∥v 对一切矩阵 A 和向量 x 都满足

∥Ax∥v 6 ∥A∥m∥x∥v,

则称矩阵范数 ∥A∥m 和向量范数 ∥x∥v 是::相

::容的.


Example 1.7设 x = (ξ1, ξ2, · · · , ξn)

T ∈ Cn, A = [aij] ∈ Cn×n, 试证明 F-范数

∥A∥F =( m∑

i=1

n∑j=1

|aij|2) 1

2

与向量的欧氏范数 ∥x∥2 =( n∑

i=1

|ξi|2) 1

2

是相容的.


对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?

Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容

的向量范数.

证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义

∥x∥v = ∥xaH∥m .

先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以

∥x∥v = ∥xaH∥m > 0.

当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有

∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.




的向量范数.



先证明 ∥x∥v 是 Cn 中的向量范数.

1 当 x = 0 时, xaH = O, 所以

∥x∥v = ∥xaH∥m > 0.






的向量范数.



先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O,

所以

∥x∥v = ∥xaH∥m > 0.






的向量范数.




∥x∥v = ∥xaH∥m > 0.






的向量范数.




∥x∥v = ∥xaH∥m > 0.

当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.

2 对任意 λ ∈ C, 有





的向量范数.




∥x∥v = ∥xaH∥m > 0.


∥λx∥v = ∥λxaH∥m

= |λ|∥xaH∥m = |λ|∥x∥v.




的向量范数.




∥x∥v = ∥xaH∥m > 0.


∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m

= |λ|∥x∥v.




的向量范数.




∥x∥v = ∥xaH∥m > 0.




3 对任何 x, y ∈ Cn, 都有

∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m

6 ∥xaH∥m + ∥yaH∥m

= ∥x∥v + ∥y∥v.

所以 ∥x∥v 是 Cn 中的向量范数.又

∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,

得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.





= ∥x∥v + ∥y∥v.

所以 ∥x∥v 是 Cn 中的向量范数.

又







= ∥x∥v + ∥y∥v.


∥Ax∥v = ∥AxaH∥m

6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,






= ∥x∥v + ∥y∥v.


∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m

= ∥A∥m ∥x∥v,






= ∥x∥v + ∥y∥v.





Theorem 1.9设 A ∈ Cm×n, x ∈ Cn, 且在 Cn 中已规定了向量的某种范数 ∥x∥, 则与向量范数 ∥x∥ 相容的矩阵范数可以取为向量 Ax 的范数的最大值, 即

∥A∥ = max∥x∥=1

∥Ax∥.

其中向量范数 ∥x∥ 与 ∥Ax∥ 可以相同, 也可以不同.


Example 1.10设 A = [aij] ∈ Cn×n, 当向量范数分别取 ∥ · ∥1, ∥ · ∥∞, ∥ · ∥2 时, 其对应的算子范数也分别记为 ∥A∥1, ∥A∥∞, ∥A∥2, 则有

∥A∥1 = max∥x∥1=1

∥Ax∥1 = maxj

n∑i=1

|aij|, (列范数)

∥A∥∞ = max∥x∥∞=1

∥Ax∥∞ = maxi

n∑j=1

|aij|, (行范数)

∥A∥2 = max∥x∥2=1

∥Ax∥2 =[ρ(AHA)

] 12 = σ1. (谱范数)

其中 σ1 为 A 的最大奇异值.


Theorem 1.11矩阵 A ∈ Cm×n 的任意一种范数, 都是 A 的元素的连续函数.

Theorem 1.12对于 Cm×n 上的任意两种范数 ∥A∥a 及 ∥A∥b, 必存在 K1 > 0, K2 > 0, 使得对任意的 A ∈ Cm×n, 都有

K1∥A∥a 6 ∥A∥b 6 K2∥A∥a.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.

(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

],

得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221.

故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Example 1.13

设 A =

[1 −2

−3 4

], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.

解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.

(3) 由 AHA =

[1 −3

−2 4

][1 −2

−3 4

]=

[10 −14

−14 20

], 得

∣∣∣∣∣ λ− 10 14

14 λ− 20

∣∣∣∣∣ = λ2 − 30λ+ 4,

则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−

√221. 故

∥A∥2 =[ρ(AHA)

] 12 =

√15 +

√221 ≈ 5.46.

(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =

√30 ≈ 5.477.


Exercise 1.14 (P.176 习题一 11)证明:

1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.

证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)

] 12 , 故

∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.

从而

∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.

另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.

证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn.

因 ∥A∥2 =[ρ(AHA)

] 12 , 故


从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故

∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn}

, λmax.

从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而

∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn

= tr(AHA) = ∥A∥2F.

另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而

∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA)

= ∥A∥2F.

另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn)

=1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.



1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


] 12 , 故


从而


另一方面,

∥A∥22 = λmax > 1

n (λ1 + λ2 + · · ·+ λn) =1

n∥A∥2F.

得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.


Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有

ρ(A) 6 ∥A∥.

证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.

由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.

而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是

|λ| ∥x∥v 6 ∥A∥ ∥x∥v.

又 ∥x∥v > 0, 故|λ| 6 ∥A∥.

由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.



ρ(A) 6 ∥A∥.

证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数.

又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.



|λ| ∥x∥v 6 ∥A∥ ∥x∥v.

又 ∥x∥v > 0, 故|λ| 6 ∥A∥.




ρ(A) 6 ∥A∥.




|λ| ∥x∥v 6 ∥A∥ ∥x∥v.

又 ∥x∥v > 0, 故|λ| 6 ∥A∥.




ρ(A) 6 ∥A∥.




|λ| ∥x∥v 6 ∥A∥ ∥x∥v.

又 ∥x∥v > 0, 故|λ| 6 ∥A∥.

由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 25 / 109

Outline



向量序列的极限

矩阵序列的极限

矩阵级数


4 矩阵函数


矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.

Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若

∥x(k) − x0∥ → 0 (k → ∞),

则称向量序列 {x(k)}::收

::敛于向量 x0, 或称向量 x0 是向量序列 {x(k)} 在 k → ∞

时的::极

::限. 记为

limk→∞

x(k) = x0,

或

x(k) → x0 (k → ∞).

� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.




∥x(k) − x0∥ → 0 (k → ∞),


::敛于向量 x0,

或称向量 x0 是向量序列 {x(k)} 在 k → ∞时的

::极

::限. 记为

limk→∞

x(k) = x0,

或

x(k) → x0 (k → ∞).





∥x(k) − x0∥ → 0 (k → ∞),



时的::极

::限.

记为

limk→∞

x(k) = x0,

或

x(k) → x0 (k → ∞).





∥x(k) − x0∥ → 0 (k → ∞),



时的::极

::限. 记为

limk→∞

x(k) = x0,

或

x(k) → x0 (k → ∞).



Example 2.2设 x0 = (1, 1, · · · , 1)T, 且

x(k) =(1 +

1

2k , 1 +1

3k , · · · , 1 +1

(n + 1)k

)T, k = 1, 2, · · ·

试证: limk→∞

x(k) = x0.

证: 由于

∥x(k) − x0∥∞ = max{ 1

2k ,1

3k , · · · ,1

(n + 1)k

}=

1

2k → 0 (k → ∞),

所以 limk→∞

x(k) = x0.


Example 2.2设 x0 = (1, 1, · · · , 1)T, 且

x(k) =(1 +

1

2k , 1 +1

3k , · · · , 1 +1

(n + 1)k

)T, k = 1, 2, · · ·

试证: limk→∞

x(k) = x0.

证: 由于

∥x(k) − x0∥∞ = max{ 1

2k ,1

3k , · · · ,1

(n + 1)k

}

=1

2k → 0 (k → ∞),

所以 limk→∞

x(k) = x0.


Example 2.2设 x0 = (1, 1, · · · , 1)T, 且

x(k) =(1 +

1

2k , 1 +1

3k , · · · , 1 +1

(n + 1)k

)T, k = 1, 2, · · ·

试证: limk→∞

x(k) = x0.

证: 由于

∥x(k) − x0∥∞ = max{ 1

2k ,1

3k , · · · ,1

(n + 1)k

}=

1

2k

→ 0 (k → ∞),

所以 limk→∞

x(k) = x0.


Example 2.2设 x0 = (1, 1, · · · , 1)T, 且

x(k) =(1 +

1

2k , 1 +1

3k , · · · , 1 +1

(n + 1)k

)T, k = 1, 2, · · ·

试证: limk→∞

x(k) = x0.

证: 由于

∥x(k) − x0∥∞ = max{ 1

2k ,1

3k , · · · ,1

(n + 1)k

}=

1

2k → 0 (k → ∞),

所以 limk→∞

x(k) = x0.


Theorem 2.3设 x(k) =

(ξ(k)1 , ξ

(k)2 , · · · , ξ(k)n

)T, x0 =(ξ1, ξ2, · · · , ξn

)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于

ξi, 即lim

k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)

证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n

|ξi|, 则

∥x(k) − x0∥∞ → 0 (k → ∞).

由于

|ξ(k)i − ξi| 6 max16i6n

|ξ(k)i − ξi| = ∥x(k) − x0∥∞,

所以

|ξ(k)i − ξi| → 0 (k → ∞).

即

limk→∞

ξ(k)i = ξi, i = 1, 2, · · · ,n.


充分性. 如果 limk→∞

ξ(k)i = ξi, (i = 1, 2, · · · ,n), 则

limk→∞

max16i6n

|ξ(k)i − ξi| = 0,

即

∥x(k) − x0∥∞ → 0 (k → ∞).

再有范数的等价性知, 上述结论对任意向量范数均成立.


Example 2.4试考察下列向量序列的收敛性:

1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.

故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,

k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·

为调和级数, 是发散的. 故向量序列 y(k) 发散.



1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0,

所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.


k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·




1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T

= (0, 0)T = 0.


k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·




1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.


k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·




1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.

故向量序列 x(k) 收敛, 且收敛于 0.

(2) 当 k → ∞ 时,

k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·




1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.


k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·

为调和级数, 是发散的.

故向量序列 y(k) 发散.



1 x(k) =(

12k ,

sin kk

)T, k = 1, 2, · · · .

2 y(k) =( k∑

i=1

12i ,

k∑i=1

1i

)T, k = 1, 2, · · · .

解: (1) 当 k → ∞ 时, 12k → 0, sin k

k → 0, 所以

limk→∞

x(k) =(

limk→∞

1

2k , limk→∞

sin kk

)T= (0, 0)T = 0.


k∑i=1

1

i = 1 +1

2+ · · ·+ 1

k + · · ·

为调和级数, 是发散的. 故向量序列 y(k) 发散.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 31 / 109

Outline





矩阵级数


4 矩阵函数


任给 Cm×n 中的矩阵序列 A1, A2, · · · , Ak, · · · , 记为 {Ak},

其中

Ak =

a(k)11 a(k)

12 · · · a(k)1n

a(k)21 a(k)

22 · · · a(k)2n

......

...a(k)

m1 a(k)m2 · · · a(k)

mn

.

显然, {Ak} 中各矩阵的对应元素构成了 m × n 个标量序列 {a(k)ij }.


任给 Cm×n 中的矩阵序列 A1, A2, · · · , Ak, · · · , 记为 {Ak}, 其中

Ak =

a(k)11 a(k)

12 · · · a(k)1n

a(k)21 a(k)

22 · · · a(k)2n

......

...a(k)

m1 a(k)m2 · · · a(k)

mn

.

显然, {Ak} 中各矩阵的对应元素构成了 m × n 个标量序列 {a(k)ij }.


Definition 2.5给定 Cm×n 中的矩阵序列 {Ak}, 如果 k → ∞ 时, m × n 个序列 {a(k)

ij } 都收敛,即

limk→∞

a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,

则称矩阵序列 {Ak}::收

::敛于矩阵

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

......

am1 am2 · · · amn

,

并称 A 是序列 {Ak} 在 k → ∞ 时的::极

::限, 记作

limk→∞

Ak = A.



ij } 都收敛,即

limk→∞

a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,


::敛于矩阵

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

......


,


::限,

记作

limk→∞

Ak = A.



ij } 都收敛,即

limk→∞

a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,


::敛于矩阵

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

......


,


::限, 记作

limk→∞

Ak = A.


Example 2.6已知

Ak =

1

k2k2 − 1

3k2 + 4(1 +

1

k )k cos 1

k3

,

求 {Ak} 在 k → ∞ 时的极限.

解:

limk→∞

Ak =

lim

k→∞

1

k limk→∞

2k2 − 1

3k2 + 4

limk→∞

(1 +

1

k )k lim

k→∞cos 1

k3

=

0 2

3

e 1

.


Theorem 2.7设有矩阵序列 Ak ∈ Cm×n 和矩阵 A ∈ Cm×n, 则 lim

k→∞Ak = A 的充要条件是

limk→∞

∥Ak − A∥ = 0,

其中 ∥ · ∥ 是 Cm×n 上的任一矩阵范数.


Theorem 2.8收敛的矩阵序列 {Ak} 是有界的, 即存在正数 M > 0, 使得对一切 k 都有

∥Ak∥ 6 M.


Theorem 2.9若 Ak, Bk, A, B ∈ Cm×n, αk, βk, α, β ∈ C, 且有 lim

k→∞Ak = A, lim

k→∞Bk = B,

limk→∞

αk = α, limk→∞

βk = β, 则

1 limk→∞

(αkAk + βkBk

)= αA + βB;

2 limk→∞

(AkBk

)= AB;

3 limk→∞

A−1k = A−1, 若 A−1

k , A−1 存在.


Outline





矩阵级数


4 矩阵函数


Definition 2.10设有矩阵序列 Ak ∈ Cm×n, 称

∞∑k=1

Ak = A1 + A2 + · · ·+ Ak + · · ·

为::矩

::阵

::级

::数, 其中 Ak 为矩阵级数的

::一

::般

::项.


Definition 2.11

称 Sm =m∑

k=1

Ak 为矩阵级数∞∑

k=1

Ak 的::部

::分

::和.

若矩阵序列 {Sm} 收敛, 且

limm→∞

Sm = S,

则称矩阵级数∞∑

k=1

Ak 是::收

::敛的, 级数的和为 S, 记作

S =∞∑

k=1

Ak.

不收敛的级数称为是::发

::散的.

显然,∞∑

k=1

Ak 收敛的充分必要条件是对应的 m × n 个数值级数

∞∑k=1

a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)

都收敛.


Definition 2.11

称 Sm =m∑

k=1


k=1

Ak 的::部

::分

::和. 若矩阵序列 {Sm} 收敛, 且

limm→∞

Sm = S,


k=1

Ak 是::收

::敛的, 级数的和为 S,

记作

S =∞∑

k=1

Ak.


::散的.

显然,∞∑

k=1


∞∑k=1

a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)

都收敛.


Definition 2.11

称 Sm =m∑

k=1


k=1

Ak 的::部

::分


limm→∞

Sm = S,


k=1

Ak 是::收


S =∞∑

k=1

Ak.


::散的.

显然,∞∑

k=1


∞∑k=1

a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)

都收敛.


Definition 2.11

称 Sm =m∑

k=1


k=1

Ak 的::部

::分


limm→∞

Sm = S,


k=1

Ak 是::收


S =∞∑

k=1

Ak.


::散的.

显然,∞∑

k=1


∞∑k=1

a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)

都收敛.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 41 / 109

Example 2.12

已知 Ak =

1

2kπ

4k

01

(k + 1)(k + 2)

, k = 0, 1, 2, · · · . 问矩阵级数∞∑

k=0

Ak 是否收

敛? 若收敛, 求其和.

解: 因为∞∑

k=0

1

2k =1

1− 12

= 2,

∞∑k=0

π

4k =π

1− 14

=4π

3,

又

m∑k=0

1

(k + 1)(k + 2)= 1− 1

2+

1

2− 1

3+ · · ·+ 1

m + 1− 1

m + 2

= 1− 1

m + 2→ 1 (m → ∞),


即∞∑

k=0

1

(k + 1)(k + 2)= 1.

所以矩阵级数∞∑

k=0

Ak 收敛, 且其和为

2 4π

3

0 1

.


如果在矩阵空间 Cm×n 中,∞∑

k=1

Ak = S,∞∑

k=1

Bk = T, 则有

1∞∑

k=1

(Ak + Bk) = S + T;

2∞∑

k=1

αAk = αS, ∀α ∈ C;

3∞∑

k=1

Akx = Sx, ∀x ∈ Cn.


Definition 2.13

如果对 Cm×n 上的某种范数 ∥ · ∥, 标量级数∞∑

k=1

∥Ak∥ 收敛, 则称级数∞∑

k=1

Ak

为::绝

::对

::收

::敛.

Theorem 2.14

若级数∞∑

k=1

Ak 绝对收敛, 则它也一定是收敛的.


Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2

, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.

证: 取矩阵的范数为 ∥ · ∥∞. 因

∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·

是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知

∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·

收敛, 故原级数绝对收敛.


Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2


证: 取矩阵的范数为 ∥ · ∥∞.

因

∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij|

= 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1.

则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·

是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.

又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知

∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·

是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k,

由正项级数比较法审敛法知

∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·



Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·

收敛,

故原级数绝对收敛.


Example 2.15

设 A =

0.2 0.5 0.1

0.1 0.5 0.3

0.2 0.4 0.2



∥A∥ = ∥A∥∞ = maxi

n∑j=1

|aij| = 0.9 < 1,

又 ∥I∥ = ∥I∥∞ = 1. 则

∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·


∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·

收敛, 故原级数绝对收敛.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 46 / 109

Example 2.16设 A ∈ Cn×n, 则矩阵级数

I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.

证: 因为∥∥∥Ak

k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,

由正项级数比较法知, 级数∞∑

k=1

∥∥∥Ak

k!

∥∥∥ 收敛, 所以级数∞∑

k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak

k! 的和记为 eA, 称为 A 的::矩

::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! ,

且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!


k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!


k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!

∥∥∥ 收敛,

所以级数∞∑

k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!


k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!


k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数,

即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .



I + A +A2

2!+ · · ·+ Ak

k! + · · ·

绝对收敛.


k!

∥∥∥ =∥Ak∥

k! 6 ∥A∥k

k! , 且

∥I∥+ ∥A∥+ ∥A∥2

2!+ · · ·+ ∥A∥k

k! + · · · = e∥A∥ − 1 + ∥I∥,


k=1

∥∥∥Ak

k!


k=1

Ak

k! 绝对收敛.

级数∞∑

k=1

Ak


::阵

::指

::数

::函

::数, 即

eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .


同理有

sin A = A − A3

3!+ · · ·+ (−1)k−1 A2k−1

(2k − 1)!+ · · · , (8)

cos A = I − A2

2!+ · · ·+ (−1)k A2k

(2k)! + · · · . (9)

从而欧拉公式

eiA = cos A + i sin A

对任意的复数或复矩阵都成立. 特别地,

eiπ + 1 = 0.


同理有

sin A = A − A3

3!+ · · ·+ (−1)k−1 A2k−1

(2k − 1)!+ · · · , (8)

cos A = I − A2

2!+ · · ·+ (−1)k A2k

(2k)! + · · · . (9)

从而欧拉公式


对任意的复数或复矩阵都成立.

特别地,

eiπ + 1 = 0.


同理有

sin A = A − A3

3!+ · · ·+ (−1)k−1 A2k−1

(2k − 1)!+ · · · , (8)

cos A = I − A2

2!+ · · ·+ (−1)k A2k

(2k)! + · · · . (9)

从而欧拉公式


对任意的复数或复矩阵都成立. 特别地,

eiπ + 1 = 0.


Outline




函数矩阵及其极限

函数矩阵的微分和积分

纯量函数关于矩阵的导数

矩阵对矩阵的导数

4 矩阵函数


Definition 3.1以实变量 t 的函数为元素的矩阵

A(t) =

a11(t) a12(t) · · · a1n(t)a21(t) a22(t) · · · a2n(t)

......

...am1(t) am2(t) · · · amn(t)

称为

::函

::数

::矩

::阵, 其中 aij(t) 都是定义在 [a, b] 上的实函数.


函数矩阵 A(t) 在 [a, b] 上有界、有极限、连续、可微、可积等概念, 可用其 m × n 个元素 aij(t) 同时在 [a, b] 上有界、有极限、连续、可微、可积来定义.

例如

ddtA(t) =

[ ddtaij(t)

]m×n

;∫A(t) dt =

[ ∫aij(t) dt

]m×n

;∫ b

aA(t) dt =

[ ∫ b

aaij(t) dt

]m×n

.


函数矩阵 A(t) 在 [a, b] 上有界、有极限、连续、可微、可积等概念, 可用其 m × n 个元素 aij(t) 同时在 [a, b] 上有界、有极限、连续、可微、可积来定义. 例如

ddtA(t) =

[ ddtaij(t)

]m×n

;∫A(t) dt =

[ ∫aij(t) dt

]m×n

;∫ b

aA(t) dt =

[ ∫ b

aaij(t) dt

]m×n

.


Definition 3.2如果所有的元素 aij(t) 在 t → t0 时, 极限存在, 记为常数 aij, 即

limt→t0

aij(t) = aij,

则称矩阵 A(t) 在 t → t0 时, 极限存在, 且极限值为 A (常量矩阵), 即

limt→t0

A(t) = A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

......


.


Definition 3.3如果所有的元素 aij(t) 在 t = t0 连续, 即

limt→t0

aij(t) = aij(t0),

则称矩阵 A(t) 在 t = t0::连

::续,

且记为

limt→t0

A(t) = A(t0) =

a11(t0) a12(t0) · · · a1n(t0)a21(t0) a22(t0) · · · a2n(t0)

......

...am1(t0) am2(t0) · · · amn(t0)

.


Definition 3.3如果所有的元素 aij(t) 在 t = t0 连续, 即

limt→t0

aij(t) = aij(t0),

则称矩阵 A(t) 在 t = t0::连

::续, 且记为

limt→t0

A(t) = A(t0) =

a11(t0) a12(t0) · · · a1n(t0)a21(t0) a22(t0) · · · a2n(t0)

......

...am1(t0) am2(t0) · · · amn(t0)

.


容易验证下列等式是成立的.设 lim

t→t0A(t) = A, lim

t→t0B(t) = B.

1 若 A(t), B(t) 都是 m × n 阶矩阵, 则

limt→t0

[A(t) + B(t)] = A + B = limt→t0

A(t) + limt→t0

B(t).

2 设 k 为常数, 则limt→t0

[kA(t)] = kA.

3 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则

limt→t0

[A(t)B(t)] = AB = limt→t0

A(t) limt→t0

B(t).


Outline








4 矩阵函数


Definition 3.4若函数矩阵 A(t) 中所有的元素 aij(t) 在 t0 处 (或在区间 (a, b) 上) 可微, 则称函数矩阵 A(t) 在 t0 处 (或在区间 (a, b) 上)

::可

::微.

并记为

A′(t0) =dA(t)

dt

∣∣∣t=t0

= lim∆t→0

A(t0 +∆t)− A(t0)∆t

=

a′11(t0) a′

12(t0) · · · a′1n(t0)

a′21(t0) a′

22(t0) · · · a′2n(t0)

......

...a′

m1(t0) a′m2(t0) · · · a′

mn(t0)

.


Definition 3.4若函数矩阵 A(t) 中所有的元素 aij(t) 在 t0 处 (或在区间 (a, b) 上) 可微, 则称函数矩阵 A(t) 在 t0 处 (或在区间 (a, b) 上)

::可

::微. 并记为

A′(t0) =dA(t)

dt

∣∣∣t=t0

= lim∆t→0

A(t0 +∆t)− A(t0)∆t

=

a′11(t0) a′

12(t0) · · · a′1n(t0)

a′21(t0) a′

22(t0) · · · a′2n(t0)

......

...a′

m1(t0) a′m2(t0) · · · a′

mn(t0)

.


Example 3.5

已知 A(t) =[

sin t 2t3

2√

t e2t

], 求 dA(t)

dt .

解:

dA(t)dt =

ddt (sin t) d

dt (2t3)

ddt (2

√t) d

dt (e2t)

=

cos t 6t2

1√t

2e2t

.


关于函数矩阵, 有下面的求导法则:1 若 A(t), B(t) 都是 m × n 阶矩阵可微矩阵, 则

ddt [A(t) + B(t)] = d

dtA(t) + ddtB(t).

2 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则

ddt [A(t)B(t)] =

[ ddtA(t)

]B(t) + A(t)

[ ddtB(t)

].

3 若 A(u) 可微, 且 u = f(t) 关于 t 可微, 则

ddtA

(f(t)

)= f′(t) d

dtA(u).

4 若 A(t) 与 A−1(t) 都可微, 则

ddt

(A−1(t)

)= −A−1(t)

[ ddtA(t)

]A−1(t).


证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导,

得[ ddtA(t)

]A−1(t) + A(t)

[ ddt

(A−1(t)

)]= O,

即

A(t)[ d

dt(A−1(t)

)]= −

[ ddtA(t)

]A−1(t)

两边左乘以 A−1(t), 得

ddt

(A−1(t)

)= −A−1(t)

[ ddtA(t)

]A−1(t).

� 注意矩阵乘法不满足交换律. 例如

ddtA2(t) = d

dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)

= 2A(t) · A′(t).


证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导, 得[ ddtA(t)

]A−1(t) + A(t)

[ ddt

(A−1(t)

)]= O,

即

A(t)[ d

dt(A−1(t)

)]= −

[ ddtA(t)

]A−1(t)

两边左乘以 A−1(t), 得

ddt

(A−1(t)

)= −A−1(t)

[ ddtA(t)

]A−1(t).

� 注意矩阵乘法不满足交换律. 例如

ddtA2(t) = d

dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)

= 2A(t) · A′(t).


Definition 3.6若 A(t) 中所有的元素 aij(t) 在区间 [a, b] 上可积, 则称函数矩阵 A(t) 在区间[a, b] 上

::可

::积,

并规定 ∫ b

aA(t) dt =

[ ∫ b

aaij(t) dt

]m×n

.


Definition 3.6若 A(t) 中所有的元素 aij(t) 在区间 [a, b] 上可积, 则称函数矩阵 A(t) 在区间[a, b] 上

::可

::积, 并规定 ∫ b

aA(t) dt =

[ ∫ b

aaij(t) dt

]m×n

.


Theorem 3.7

1 若 A(t) 在区间 [a, b] 上连续, 则对任一 t ∈ (a, b),∫ t

aA(τ)dτ 可微, 且

ddt

[ ∫ t

aA(τ) dτ

]= A(t).

2 若 A(t) 在区间 [a, b] 上可微, 则∫ t

a

[ ddsA(s)

]ds = A(t)− A(a), t ∈ [a, b].


Outline








4 矩阵函数


在场论中, 我们对数量函数 f(x, y, z) 定义梯度为

grad f = ∇f =( ∂f∂x ,

∂f∂y ,

∂f∂z

),

这可以理解为数量函数 f(x, y, z) 对向量 (x, y, z) 的导数.

注意梯度是向量, 有时也记为

grad f = ∂f∂x i + ∂f

∂y j + ∂f∂zk.

下面我们将这一概念推广到一般情形.


在场论中, 我们对数量函数 f(x, y, z) 定义梯度为

grad f = ∇f =( ∂f∂x ,

∂f∂y ,

∂f∂z

),

这可以理解为数量函数 f(x, y, z) 对向量 (x, y, z) 的导数.注意梯度是向量, 有时也记为

grad f = ∂f∂x i + ∂f

∂y j + ∂f∂zk.

下面我们将这一概念推广到一般情形.


Definition 3.8设 X = [xij] ∈ Rm×n 为变量矩阵, f(X) 为矩阵 X 的数量函数, 即看成是 m × n元函数, 即

f(X) = f(x11, x12, · · · , x1n, x21, x22, · · · , x2n, · · · , xm1, xm2, · · · , xmn

).

则规定数量函数 f(X) 对于矩阵 X 的导数为

dfdX =

[ ∂f∂xij

]m×n

=

∂f∂x11

∂f∂x12

· · · ∂f∂x1n

∂f∂x21

∂f∂x22

· · · ∂f∂x2n

......

...∂f

∂xm1

∂f∂xm2

· · · ∂f∂xmn

.


特别地, 若变量矩阵为 m 维向量 X = [xi]m×1, 这时数量函数为f(x1, x2, · · · , xn), 则

dfdX =

∂f∂x1∂f∂x2

...∂f∂xm

.

此即梯度.


Outline








4 矩阵函数


Definition 3.9设 A = [aij]m×n, X = [xkl]p×q, 且 A 中的各元素 aij 是矩阵 X 中各元素 xkl 的

可微函数, 则矩阵 A 对矩阵 X 的导数定义为

dAdX =

∂A∂x11

∂A∂x12

· · · ∂A∂x1q

∂A∂x21

∂A∂x22

· · · ∂A∂x2q

......

...∂A∂xp1

∂A∂xp2

· · · ∂A∂xpq

,


其中

∂A∂xkl

=

∂a11

∂xkl

∂a12

∂xkl· · · ∂a1n

∂xkl

∂a21

∂xkl

∂a22

∂xkl· · · ∂a2n

∂xkl...

......

∂am1

∂xkl

∂am2

∂xkl· · · ∂amn

∂xkl

, k = 1, 2, · · · , p; l = 1, 2, · · · , q.


Example 3.10设 X = (x1, x2, · · · , xn)

T, 求向量 XT = (x1, x2, · · · , xn) 对向量 X 的导数.

解:

dXT

dX =

∂XT

∂x1

∂XT

∂x2...

∂XT

∂xn

=

1 0 0 · · · 0

0 1 0 · · · 0...

......

...0 0 0 · · · 1

= In.


Outline




4 矩阵函数

矩阵多项式

矩阵函数


Theorem 4.1

设 f(λ) = a0 + a1λ+ · · ·+ amλm =m∑

k=0

akλk, A 为分块对角阵

A =

A1

A2

. . .At

= diag(A1,A2, · · · ,At),

则

f(A) = diag[f(A1), f(A2), · · · , f(At)].


证:

f(A)

= a0I + a1A + · · ·+ amAm

=a0

I1

I2. . .

It

+a1

A1

A2

. . .At

+· · ·+am

Am

1

Am2

. . .Am

t

=

m∑k=0

akAk1

m∑k=0

akAk2

. . .m∑

k=0

akAkt

=

f(A1)

f(A2)

. . .f(At)

.


Theorem 4.2设 A ∈ Cn×n, P 为 n 阶非奇异矩阵, f(λ) 为多项式. 则

f(P−1AP) = P−1f(A)P.

证: 由

(P−1AP)k = (P−1AP)(P−1AP) · · · (P−1AP) = P−1AkP,

得

f(P−1AP) =m∑

k=0

ak(P−1AP)k

=

m∑k=0

ak(P−1AkP)

= P−1( m∑

k=0

akAk)

P

= P−1f(A)P.


矩阵多项式的计算方法

要计算 f(A) = a0I + a1A + · · ·+ amAm,

可以找一个 A 的零化多项式φ(λ), 且 ∂

(φ(λ)

)< m, 再由多项式带余除法有

f(λ) = φ(λ)g(λ) + r(λ),

则

f(A) = φ(A)g(A) + r(A).

又 φ(A) = O, 故f(A) = r(A).

从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.



要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂

(φ(λ)

)< m,

再由多项式带余除法有

f(λ) = φ(λ)g(λ) + r(λ),

则

f(A) = φ(A)g(A) + r(A).

又 φ(A) = O, 故f(A) = r(A).





(φ(λ)


f(λ) = φ(λ)g(λ) + r(λ),

则

f(A) = φ(A)g(A) + r(A).

又 φ(A) = O, 故f(A) = r(A).





(φ(λ)


f(λ) = φ(λ)g(λ) + r(λ),

则

f(A) = φ(A)g(A) + r(A).

又 φ(A) = O, 故f(A) = r(A).

从而把计算 f(A) 转化为计算次数较低的 r(A).

这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.




(φ(λ)


f(λ) = φ(λ)g(λ) + r(λ),

则

f(A) = φ(A)g(A) + r(A).

又 φ(A) = O, 故f(A) = r(A).



Outline




4 矩阵函数

矩阵多项式

矩阵函数


Lemma 4.3

设 r 阶方阵为 H =

0 1

0 1

. . . . . .0 1

0

,

则 (1) 当 m > r 时, Hm = O; (2)

当 m < r 时,

Hm =

0 · · · 0 1

. . . . . . . . .. . . . . . 1

. . . 0m 个 0. . . ...

0

.

即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.


Lemma 4.3


0 1

0 1

. . . . . .0 1

0

, 则 (1) 当 m > r 时, Hm = O;

(2)

当 m < r 时,

Hm =

0 · · · 0 1

. . . . . . . . .. . . . . . 1

. . . 0m 个 0. . . ...

0

.

即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.


Lemma 4.3


0 1

0 1

. . . . . .0 1

0

, 则 (1) 当 m > r 时, Hm = O; (2)

当 m < r 时,

Hm =

0 · · · 0 1

. . . . . . . . .. . . . . . 1

. . . 0m 个 0. . . ...

0

.

即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 76 / 109

例如

H2 =

0 1 0 0

0 1 0

0 1

0

0 1 0 0

0 1 0

0 1

0

=

0 0 1 0

0 0 1

0 0

0

,

H3 =

0 0 1 0

0 0 1

0 0

0

0 1 0 0

0 1 0

0 1

0

=

0 0 0 1

0 0 0

0 0

0

,

H4 =

0 0 0 1

0 0 0

0 0

0

0 1 0 0

0 1 0

0 1

0

=

0 0 0 0

0 0 0

0 0

0

,

Hm = O, m > 4.


由引理 4.3 可知,

∞∑m=0

amHm =

a0 a1 · · · ar−1

. . . . . . .... . . a1

a0

. (10)


Lemma 4.4

若 f(z) =∞∑

m=0amzm, 则

1

s! f(s)(z)

∣∣∣z=λ

=

∞∑m=s

Csmamλm−s.

证: 因为

Csmamλm−s =

m!

s!(m − s)!amλm−s =1

s!amds

dzs zm∣∣∣z=λ

,

所以∞∑

m=sCs

mamλm−s =1

s!

∞∑m=s

amds

dzs zm∣∣∣z=λ

=1

s! f(s)(z)

∣∣∣z=λ

.


Lemma 4.4

若 f(z) =∞∑

m=0amzm, 则

1

s! f(s)(z)

∣∣∣z=λ

=

∞∑m=s

Csmamλm−s.

证: 因为

Csmamλm−s =

m!

s!(m − s)!amλm−s

=1

s!amds

dzs zm∣∣∣z=λ

,

所以∞∑

m=sCs

mamλm−s =1

s!

∞∑m=s

amds

dzs zm∣∣∣z=λ

=1

s! f(s)(z)

∣∣∣z=λ

.


Lemma 4.4

若 f(z) =∞∑

m=0amzm, 则

1

s! f(s)(z)

∣∣∣z=λ

=

∞∑m=s

Csmamλm−s.

证: 因为

Csmamλm−s =

m!

s!(m − s)!amλm−s =1

s!amds

dzs zm∣∣∣z=λ

,

所以∞∑

m=sCs

mamλm−s =1

s!

∞∑m=s

amds

dzs zm∣∣∣z=λ

=1

s! f(s)(z)

∣∣∣z=λ

.


另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑

m=0amzm,

则

f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑

m=1

mamzm−1,

f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑

m=2

m(m − 1)amzm−2,

...

f(s)(z) =∞∑

m=sm(m − 1) · · · (m − s + 1)amzm−s

=∞∑

m=s

m!

(m − s)!amzm−s

= s!∞∑

m=s

m!

s!(m − s)!amzm−s

= s!∞∑

m=sCs

mamzm−s.


另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑

m=0amzm, 则

f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑

m=1

mamzm−1,

f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑

m=2

m(m − 1)amzm−2,

...

f(s)(z) =∞∑

m=sm(m − 1) · · · (m − s + 1)amzm−s

=∞∑

m=s

m!

(m − s)!amzm−s

= s!∞∑

m=s

m!

s!(m − s)!amzm−s

= s!∞∑

m=sCs

mamzm−s.


所以1

s! f(s)(z) =

∞∑m=s

Csmamzm−s.

故1

s! f(s)(z)

∣∣∣z=λ

=∞∑

m=sCs

mamλm−s.


Theorem 4.5

设 f(z) =∞∑

m=0amzm 的收敛半径为 R, 又 r 阶若当块为 J =

λ 1

. . . . . .λ 1

λ

.

则当 |λ| < R 时, 级数∞∑

m=0amJm 收敛, 且

∞∑m=0

amJm =

f(λ) f′(λ) 1

2!f′′(λ) · · · 1

(r − 1)!f(r−1)(λ)

f(λ) f′(λ) · · · 1

(r − 2)!f(r−2)(λ)

. . . . . . ...f(λ) f′(λ)

f(λ)

.


证: 矩阵 J 可以写成 λI + H,

因为 I 是单位矩阵, 所以 I 可以与 H 交换. 于是m > r 时,

Jm = (λI + H)m = λmI + C1mλm−1H + · · ·+ Cm−1

m λHm−1 + Hm

=

λm C1

mλm−1 · · · Cr−1m λm−r+1

. . . . . . ...λm C1

mλm−1

λm

.(对照公式 (10)

)


证: 矩阵 J 可以写成 λI + H, 因为 I 是单位矩阵, 所以 I 可以与 H 交换.

于是

m > r 时,


m λHm−1 + Hm

=

λm C1

mλm−1 · · · Cr−1m λm−r+1

. . . . . . ...λm C1

mλm−1

λm

.(对照公式 (10)

)


证: 矩阵 J 可以写成 λI + H, 因为 I 是单位矩阵, 所以 I 可以与 H 交换. 于是m > r 时,


m λHm−1 + Hm

=

λm C1

mλm−1 · · · Cr−1m λm−r+1

. . . . . . ...λm C1

mλm−1

λm

.(对照公式 (10)

)


所以

∞∑m=0

amJm =

∞∑m=0

amλm∞∑

m=0amC1

mλm−1 · · ·∞∑

m=0amCr−1

m λm−r+1

∞∑m=0

amλm · · ·∞∑

m=0amCr−2

m λm−r+2

. . . ...∞∑

m=0amλm

=

f(λ) f′(λ) 1

2!f′′(λ) · · · 1

(r − 1)!f(r−1)(λ)

f(λ) f′(λ) · · · 1

(r − 2)!f(r−2)(λ)

. . . . . . ...f(λ) f′(λ)

f(λ)

.

最后一个等号的成立需要 |λ| < R. 得证级数∞∑

m=0amJm 收敛.


所以

∞∑m=0

amJm =

∞∑m=0

amλm∞∑

m=0amC1

mλm−1 · · ·∞∑

m=0amCr−1

m λm−r+1

∞∑m=0

amλm · · ·∞∑

m=0amCr−2

m λm−r+2

. . . ...∞∑

m=0amλm

=

f(λ) f′(λ) 1

2!f′′(λ) · · · 1

(r − 1)!f(r−1)(λ)

f(λ) f′(λ) · · · 1

(r − 2)!f(r−2)(λ)

. . . . . . ...f(λ) f′(λ)

f(λ)

.

最后一个等号的成立需要 |λ| < R.

得证级数∞∑

m=0amJm 收敛.


所以

∞∑m=0

amJm =

∞∑m=0

amλm∞∑

m=0amC1

mλm−1 · · ·∞∑

m=0amCr−1

m λm−r+1

∞∑m=0

amλm · · ·∞∑

m=0amCr−2

m λm−r+2

. . . ...∞∑

m=0amλm

=

f(λ) f′(λ) 1

2!f′′(λ) · · · 1

(r − 1)!f(r−1)(λ)

f(λ) f′(λ) · · · 1

(r − 2)!f(r−2)(λ)

. . . . . . ...f(λ) f′(λ)

f(λ)

.

最后一个等号的成立需要 |λ| < R. 得证级数∞∑

m=0amJm 收敛.


Theorem 4.6

设幂级数 f(z) =∞∑

m=0amzm 的收敛半径为 R, 且 A ∈ Cn×n 的谱半径 (即 A 的

特征值模的最大值) 为 ρ(A), 则当 ρ(A) < R 时, 矩阵幂级数∞∑

m=0amAm 收敛.

证: 设 A 的若当标准形为

J =

J1

J2

. . .Js

= J1 ⊕ J2 ⊕ · · · ⊕ Js,

其中 Ji 是特征值为 λi 的 ri 阶若当块. 则存在满秩方阵 P, 使 A = PJP−1.


Theorem 4.6




m=0amAm 收敛.


J =

J1

J2

. . .Js

= J1 ⊕ J2 ⊕ · · · ⊕ Js,

其中 Ji 是特征值为 λi 的 ri 阶若当块.

则存在满秩方阵 P, 使 A = PJP−1.


Theorem 4.6




m=0amAm 收敛.


J =

J1

J2

. . .Js

= J1 ⊕ J2 ⊕ · · · ⊕ Js,

其中 Ji 是特征值为 λi 的 ri 阶若当块. 则存在满秩方阵 P, 使 A = PJP−1.


于是

∞∑m=0

amAm =∞∑

m=0

am(PJP−1

)m

=

∞∑m=0

amPJmP−1

= P( ∞∑

m=0

amJm)

P−1

= P( ∞∑

m=0

amJm1 ⊕

∞∑m=0

amJm2 ⊕ · · · ⊕

∞∑m=0

amJms

)P−1.

因为 ρ(A) < R, 故 |λi| < R, 由定理 4.5 知∞∑

m=0amJm

i 收敛,

因而推得

∞∑m=0

amAm 收敛.


于是

∞∑m=0

amAm =∞∑

m=0

am(PJP−1

)m

=

∞∑m=0

amPJmP−1

= P( ∞∑

m=0

amJm)

P−1

= P( ∞∑

m=0

amJm1 ⊕

∞∑m=0

amJm2 ⊕ · · · ⊕

∞∑m=0

amJms

)P−1.

因为 ρ(A) < R, 故 |λi| < R, 由定理 4.5 知∞∑

m=0amJm

i 收敛, 因而推得∞∑

m=0amAm 收敛.


Definition 4.7

设幂级数∞∑

m=0amzm 的收敛半径为 R, 且对任意的 |z| < R, 幂级数收敛于 f(z),

即

f(z) =∞∑

m=0

amzm (|z| < R).

如果 A ∈ Cn×n 满足 ρ(A) < R, 则记矩阵幂级数∞∑

m=0amAm 的和为 f(A), 即

f(A) =∞∑

m=0

amAm.

称 f(A) 为自变量 A 的::矩

::阵

::函

::数.


Definition 4.7

设幂级数∞∑


即

f(z) =∞∑

m=0

amzm (|z| < R).


m=0amAm 的和为 f(A),

即

f(A) =∞∑

m=0

amAm.


::阵

::函

::数.


Definition 4.7

设幂级数∞∑


即

f(z) =∞∑

m=0

amzm (|z| < R).


m=0amAm 的和为 f(A), 即

f(A) =∞∑

m=0

amAm.


::阵

::函

::数.


例如, 对于如下函数的幂级数展开式

(1− z)−1 =∞∑

m=0

zm (R = 1),

ln(1 + z) =∞∑

m=0

(−1)m

m + 1zm+1 (R = 1).

相应地有矩阵函数

(I − A)−1 =∞∑

m=0

Am (ρ(A) < 1),

ln(I + A) =∞∑

m=0

(−1)m

m + 1Am+1 (ρ(A) < 1).

以及

矩阵指数函数: eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .

矩阵正弦函数: sin A = A − A3

3!+ · · ·+ (−1)k−1 A2k−1

(2k − 1)!+ · · · ,

矩阵余弦函数: cos A = I − A2

2!+ · · ·+ (−1)k A2k

(2k)! + · · · .


例如, 对于如下函数的幂级数展开式

(1− z)−1 =∞∑

m=0

zm (R = 1),

ln(1 + z) =∞∑

m=0

(−1)m

m + 1zm+1 (R = 1).

相应地有矩阵函数

(I − A)−1 =∞∑

m=0

Am (ρ(A) < 1),

ln(I + A) =∞∑

m=0

(−1)m

m + 1Am+1 (ρ(A) < 1).

以及

矩阵指数函数: eA = I + A +A2

2!+ · · ·+ Ak

k! + · · · .

矩阵正弦函数: sin A = A − A3

3!+ · · ·+ (−1)k−1 A2k−1

(2k − 1)!+ · · · ,

矩阵余弦函数: cos A = I − A2

2!+ · · ·+ (−1)k A2k

(2k)! + · · · .黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 88 / 109

定理 4.6 的证明过程给出了求 f(A) 的一个方法.

f(A) = P(

f(J1)⊕ f(J2)⊕ · · · ⊕ f(Js))

P−1,

其中

f(Ji) =∞∑

m=0

amJmi =

f(λi) f′(λi)1

2!f′′(λi) · · · 1

(ri − 1)!f(ri−1)(λi)

f(λi) f′(λi) · · · 1

(ri − 2)!f(ri−2)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

.

这里 ri 是若当块 Ji 的阶数.


实际计算中, 若当块的阶数多为 1, 2, 3, 即分别为

Ji = λi, Ji =

[λi 1

λi

], Ji =

λi 1 0

λi 1

λi

,

此时对应地有

f(Ji) = f(λi), f(Ji) =

[f(λi) f′(λi)

f(λi)

], f(Ji) =

f(λi) f′(λi)

1

2!f′′(λi)

f(λi) f′(λi)

f(λi)

.


比如设 f(A) = eA, 假定 A 的为若当矩阵:

A =

2 1 0

2 1

2

,

则

f(A) =

f(λ) f′(λ) 1

2!f′′(λ)

f(λ) f′(λ)f(λ)

=

e2 e2 1

2e2

e2 e2

e2

.


Example 4.8

设 A =

2 0 0

1 1 1

1 −1 3

, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.

解: 先求 A 的若当标准形. 因

λI − A =

λ− 2 0 0

−1 λ− 1 −1

−1 1 λ− 3

∼

1

λ− 2

(λ− 2)2

.

所以若当标准形为

J =

2 0 0

2 1

2

.

则 J1 = 2, J2 =

[2 1

2

].


Example 4.8

设 A =

2 0 0

1 1 1

1 −1 3

, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.

解: 先求 A 的若当标准形.

因

λI − A =

λ− 2 0 0

−1 λ− 1 −1

−1 1 λ− 3

∼

1

λ− 2

(λ− 2)2

.


J =

2 0 0

2 1

2

.

则 J1 = 2, J2 =

[2 1

2

].


Example 4.8

设 A =

2 0 0

1 1 1

1 −1 3

, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.


λI − A =

λ− 2 0 0

−1 λ− 1 −1

−1 1 λ− 3

∼

1

λ− 2

(λ− 2)2

.


J =

2 0 0

2 1

2

.

则 J1 = 2, J2 =

[2 1

2

].


由 AP = PJ 可求得

P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20. 则

f(J1) = 220, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1 =

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.



P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20.

则

f(J1) = 220, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1 =

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.



P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20. 则

f(J1) = 220,

f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1 =

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.



P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20. 则

f(J1) = 220, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1 =

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.



P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20. 则

f(J1) = 220, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1

=

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.



P =

1 0 1

1 1 0

0 1 0

, P−1 =

0 1 −1

0 0 1

1 −1 1

.

(1) 记 f(z) = z20. 则

f(J1) = 220, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[220 20 · 219

220

].

故

A20 = P(f(J1)⊕ f(J2)

)P−1 =

1 0 1

1 1 0

0 1 0

220 0 0

220 20 · 219

220

0 1 −1

0 0 1

1 −1 1

= 220

1 0 0

10 −9 10

10 −10 11

.


(2) 记 f(z) = ez.

则

f(J1) = e2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[e2 e2

e2

].

故

eA = Pf(J)P−1 =

1 0 1

1 1 0

0 1 0

e2 0 0

e2 e2

e2

0 1 −1

0 0 1

1 −1 1

= e2

1 0 0

1 0 1

1 −1 2

.


(2) 记 f(z) = ez. 则

f(J1) = e2,

f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[e2 e2

e2

].

故

eA = Pf(J)P−1 =

1 0 1

1 1 0

0 1 0

e2 0 0

e2 e2

e2

0 1 −1

0 0 1

1 −1 1

= e2

1 0 0

1 0 1

1 −1 2

.


(2) 记 f(z) = ez. 则

f(J1) = e2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[e2 e2

e2

].

故

eA = Pf(J)P−1 =

1 0 1

1 1 0

0 1 0

e2 0 0

e2 e2

e2

0 1 −1

0 0 1

1 −1 1

= e2

1 0 0

1 0 1

1 −1 2

.


(2) 记 f(z) = ez. 则

f(J1) = e2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[e2 e2

e2

].

故

eA = Pf(J)P−1

=

1 0 1

1 1 0

0 1 0

e2 0 0

e2 e2

e2

0 1 −1

0 0 1

1 −1 1

= e2

1 0 0

1 0 1

1 −1 2

.


(2) 记 f(z) = ez. 则

f(J1) = e2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[e2 e2

e2

].

故

eA = Pf(J)P−1 =

1 0 1

1 1 0

0 1 0

e2 0 0

e2 e2

e2

0 1 −1

0 0 1

1 −1 1

= e2

1 0 0

1 0 1

1 −1 2

.


(3) 记 f(z) = sin z.

则

f(J1) = sin 2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[sin 2 cos 2

sin 2

].

故

sin A = Pf(J)P−1 =

1 0 1

1 1 0

0 1 0

sin 2 0 0

sin 2 cos 2sin 2

0 1 −1

0 0 1

1 −1 1

=

sin 2 0 0

cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2

.


(3) 记 f(z) = sin z. 则

f(J1) = sin 2,

f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[sin 2 cos 2

sin 2

].

故


1 0 1

1 1 0

0 1 0

sin 2 0 0

sin 2 cos 2sin 2

0 1 −1

0 0 1

1 −1 1

=

sin 2 0 0


.


(3) 记 f(z) = sin z. 则

f(J1) = sin 2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[sin 2 cos 2

sin 2

].

故


1 0 1

1 1 0

0 1 0

sin 2 0 0

sin 2 cos 2sin 2

0 1 −1

0 0 1

1 −1 1

=

sin 2 0 0


.


(3) 记 f(z) = sin z. 则

f(J1) = sin 2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[sin 2 cos 2

sin 2

].

故

sin A = Pf(J)P−1

=

1 0 1

1 1 0

0 1 0

sin 2 0 0

sin 2 cos 2sin 2

0 1 −1

0 0 1

1 −1 1

=

sin 2 0 0


.


(3) 记 f(z) = sin z. 则

f(J1) = sin 2, f(J2) =

[f(λi) f′(λi)

f(λi)

]=

[sin 2 cos 2

sin 2

].

故


1 0 1

1 1 0

0 1 0

sin 2 0 0

sin 2 cos 2sin 2

0 1 −1

0 0 1

1 −1 1

=

sin 2 0 0


.


� 矩阵 P 是怎么求得的?

设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

2 0 0

2 1

2

,

得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有

Ap1 = 2p1, 即 (2I − A)p1 = 0,

Ap2 = 2p2, 即 (2I − A)p2 = 0,

Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.

由

2I − A =

0 0 0

−1 1 −1

−1 1 −1

∼

1 −1 1

0 0 0

0 0 0

,


� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3],

则有

A[p1,p2,p3] = [p1,p2,p3]

2 0 0

2 1

2

,

得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有

Ap1 = 2p1, 即 (2I − A)p1 = 0,

Ap2 = 2p2, 即 (2I − A)p2 = 0,

Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.

由

2I − A =

0 0 0

−1 1 −1

−1 1 −1

∼

1 −1 1

0 0 0

0 0 0

,


� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

2 0 0

2 1

2

,

得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3].

于是有

Ap1 = 2p1, 即 (2I − A)p1 = 0,

Ap2 = 2p2, 即 (2I − A)p2 = 0,

Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.

由

2I − A =

0 0 0

−1 1 −1

−1 1 −1

∼

1 −1 1

0 0 0

0 0 0

,


� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

2 0 0

2 1

2

,

得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有

Ap1 = 2p1, 即 (2I − A)p1 = 0,

Ap2 = 2p2, 即 (2I − A)p2 = 0,

Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.

由

2I − A =

0 0 0

−1 1 −1

−1 1 −1

∼

1 −1 1

0 0 0

0 0 0

,


知齐次方程组 (2I − A)x = 0 的基础解系为

α1 = (1, 1, 0)T, α2 = (0, 1, 1)T.

又 0 0 0 b1

−1 1 −1 b2−1 1 −1 b3

∼

1 −1 1 −b30 0 0 b3 − b20 0 0 b1

,

故要使方程组 (2I − A)p3 = −p2 有解, −p2 需满足 b1 = 0, b2 = b3. 则(2I − A)p2 = 0 的解可取为

p2 = α2 = (0, 1, 1)T,

从而方程组 (2I − A)p1 = 0 的解可取为

p1 = α1 = (1, 1, 0)T.


再求解非齐次线性方程组 (2I − A)p3 = −p2,

由

[2I − A, −p2

]=

0 0 0 0

−1 1 −1 −1

−1 1 −1 −1

∼

1 −1 1 1

0 0 0 0

0 0 0 0

,

可取

p3 = (1, 0, 0)T.

另由上述过程可知 P 不唯一.


再求解非齐次线性方程组 (2I − A)p3 = −p2, 由

[2I − A, −p2

]=

0 0 0 0

−1 1 −1 −1

−1 1 −1 −1

∼

1 −1 1 1

0 0 0 0

0 0 0 0

,

可取

p3 = (1, 0, 0)T.

另由上述过程可知 P 不唯一.


Example 4.9

设 A =

2 −1 −1

2 −1 −2

−1 1 2

, 求矩阵 A 的 Jordan 标准形 J, 并求变换矩阵 P,

使 P−1AP = J.



λI − A =

λ− 2 1 1

−2 λ+ 1 2

1 −1 λ− 2

r1−(λ−2)r3−−−−−−−→r2+2r3

0 λ− 1 −λ2 + 4λ− 3

0 λ− 1 2λ− 2

1 −1 λ− 2

c2+c1−−−−−−−−→

c3−(λ−2)c1

0 λ− 1 −λ2 + 4λ− 3

0 λ− 1 2λ− 2

1 0 0

r1↔r3−−−−→

1 0 0

0 λ− 1 2λ− 2

0 λ− 1 −λ2 + 4λ− 3

r3−r2−−−−→

1 0 0

0 λ− 1 2λ− 2

0 0 −λ2 + 2λ− 1

r3×(−1)−−−−−→c3−2c2

1

λ− 1

(λ− 1)2

.


J =

1 0 0

1 1

1

.


设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

1 0 0

1 1

1

,

得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3].

于是有

Ap1 = p1, 即 (I − A)p1 = 0,

Ap2 = p2, 即 (I − A)p2 = 0,

Ap3 = p2 + p3, 即 (I − A)p3 = −p2.

即 p1, p2 是方程组 (I − A)x = 0 的解. 由

I − A =

−1 1 1

−2 2 2

1 −1 −1

∼

1 −1 −1

0 0 0

0 0 0

,

取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.


设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

1 0 0

1 1

1

,

得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有

Ap1 = p1, 即 (I − A)p1 = 0,

Ap2 = p2, 即 (I − A)p2 = 0,

Ap3 = p2 + p3, 即 (I − A)p3 = −p2.


I − A =

−1 1 1

−2 2 2

1 −1 −1

∼

1 −1 −1

0 0 0

0 0 0

,



设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

1 0 0

1 1

1

,

得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有

Ap1 = p1, 即 (I − A)p1 = 0,

Ap2 = p2, 即 (I − A)p2 = 0,

Ap3 = p2 + p3, 即 (I − A)p3 = −p2.

即 p1, p2 是方程组 (I − A)x = 0 的解.

由

I − A =

−1 1 1

−2 2 2

1 −1 −1

∼

1 −1 −1

0 0 0

0 0 0

,



设 P = [p1,p2,p3], 则有

A[p1,p2,p3] = [p1,p2,p3]

1 0 0

1 1

1

,

得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有

Ap1 = p1, 即 (I − A)p1 = 0,

Ap2 = p2, 即 (I − A)p2 = 0,

Ap3 = p2 + p3, 即 (I − A)p3 = −p2.


I − A =

−1 1 1

−2 2 2

1 −1 −1

∼

1 −1 −1

0 0 0

0 0 0

,

取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 101 / 109

可以选取 p1 = α1.

但是不能简单地令 p2 = α2, 因为 p2 还要保

证 (I − A)p3 = −p2 有解.令

p2 = k1α1 + k2α2 = k1

1

1

0

+ k2

1

0

1

=

k1 + k2

k1k2

,

其中 k1, k2 是不全为零的待定常数. 由

(I − A,−p2) =

−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2

∼

1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0

,

故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即

k1 = −2k2(= 0).

取 k1 = 2, k2 = −1, 则

p2 = 2α1 − 1α2 = (1, 2,−1)T.


可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保

证 (I − A)p3 = −p2 有解.

令

p2 = k1α1 + k2α2 = k1

1

1

0

+ k2

1

0

1

=

k1 + k2

k1k2

,


(I − A,−p2) =

−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2

∼

1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0

,


k1 = −2k2(= 0).

取 k1 = 2, k2 = −1, 则

p2 = 2α1 − 1α2 = (1, 2,−1)T.



证 (I − A)p3 = −p2 有解.令

p2 = k1α1 + k2α2 = k1

1

1

0

+ k2

1

0

1

=

k1 + k2

k1k2

,

其中 k1, k2 是不全为零的待定常数.

由

(I − A,−p2) =

−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2

∼

1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0

,


k1 = −2k2(= 0).

取 k1 = 2, k2 = −1, 则

p2 = 2α1 − 1α2 = (1, 2,−1)T.



证 (I − A)p3 = −p2 有解.令

p2 = k1α1 + k2α2 = k1

1

1

0

+ k2

1

0

1

=

k1 + k2

k1k2

,


(I − A,−p2) =

−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2

∼

1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0

,


k1 = −2k2(= 0).

取 k1 = 2, k2 = −1, 则

p2 = 2α1 − 1α2 = (1, 2,−1)T.


再求解非齐次线性方程组 (I − A)p3 = −p2, 由

[I − A, −p2

]=

−1 1 1 −1

−2 2 2 −2

1 −1 −1 1

∼

1 −1 −1 1

0 0 0 0

0 0 0 0

,

可取 p3 = (1, 0, 0)T.

故可取

P =

1 1 1

1 2 0

0 −1 0

,

使 P−1AP = J.


再求解非齐次线性方程组 (I − A)p3 = −p2, 由

[I − A, −p2

]=

−1 1 1 −1

−2 2 2 −2

1 −1 −1 1

∼

1 −1 −1 1

0 0 0 0

0 0 0 0

,

可取 p3 = (1, 0, 0)T. 故可取

P =

1 1 1

1 2 0

0 −1 0

,

使 P−1AP = J.


Example 4.10

设 f(z) =∞∑

m=0

( z3

)m, 求 f(A), 其中 A =

2 1

2 1

2 1

2

.

解: f(z) =(1− z

3

)−1

, 其收敛半径为 3. 注意到 A 为若当矩阵, 其特征值为 2,

故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑

m=0

(A3

)m收敛, 且

f(A) =

f(2) f′(2) 1

2!f′′(2) 1

3!f′′′(2)

f(2) f′(2) 1

2!f′′(2)

f(2) f′(2)f(2)

.


Example 4.10

设 f(z) =∞∑

m=0

( z3

)m, 求 f(A), 其中 A =

2 1

2 1

2 1

2

.

解: f(z) =(1− z

3

)−1

, 其收敛半径为 3.

注意到 A 为若当矩阵, 其特征值为 2,

故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑

m=0

(A3

)m收敛, 且

f(A) =

f(2) f′(2) 1

2!f′′(2) 1

3!f′′′(2)

f(2) f′(2) 1

2!f′′(2)

f(2) f′(2)f(2)

.


Example 4.10

设 f(z) =∞∑

m=0

( z3

)m, 求 f(A), 其中 A =

2 1

2 1

2 1

2

.

解: f(z) =(1− z

3

)−1


故谱半径 ρ(A) = 2 < 3,

所以 f(A) =∞∑

m=0

(A3

)m收敛, 且

f(A) =

f(2) f′(2) 1

2!f′′(2) 1

3!f′′′(2)

f(2) f′(2) 1

2!f′′(2)

f(2) f′(2)f(2)

.


Example 4.10

设 f(z) =∞∑

m=0

( z3

)m, 求 f(A), 其中 A =

2 1

2 1

2 1

2

.

解: f(z) =(1− z

3

)−1


故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑

m=0

(A3

)m收敛,

且

f(A) =

f(2) f′(2) 1

2!f′′(2) 1

3!f′′′(2)

f(2) f′(2) 1

2!f′′(2)

f(2) f′(2)f(2)

.


Example 4.10

设 f(z) =∞∑

m=0

( z3

)m, 求 f(A), 其中 A =

2 1

2 1

2 1

2

.

解: f(z) =(1− z

3

)−1


故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑

m=0

(A3

)m收敛, 且

f(A) =

f(2) f′(2) 1

2!f′′(2) 1

3!f′′′(2)

f(2) f′(2) 1

2!f′′(2)

f(2) f′(2)f(2)

.


因

f′(z) = 1

3

(1− z

3

)−2

, f′′(z) = 2

9

(1− z

3

)−3

, f′′′(z) = 2

9

(1− z

3

)−4

,

所以

f(2) = 3, f′(2) = 3, f′′(2) = 6, f′′′(2) = 18.

故

f(A) =

3 3 3 3

3 3 3

3 3

3

.

当然, 也可以由 f(A) =(

I − A3

)−1

得到答案.


Definition 4.11设 A ∈ Cn×n, λ1, λ2, · · · , λs 是 A 的谱. A 的最小多项式为 m 次多项式 m(λ),

m(λ) = (λ− λ1)m1(λ− λ2)

m2 · · · (λ− λs)ms ,

其中 m1 + m2 + · · ·+ ms = m.

记

l = max{m1,m2, · · · ,ms},

设 f(λ) 是一个给定的具有 l − 1 阶导数的函数, 则我们把下列 m 个值

f(λ1), f′(λ1), · · · , f(m1−1)(λ1),

f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...

f(λs), f′(λs), · · · , f(ms−1)(λs),

(11)

称为 f(λ) 在 A 上的::谱

::值. 若这些值都为有限值, 则称函数 f(λ) 在 A 的

::谱

::上

::给

::定.



m(λ) = (λ− λ1)m1(λ− λ2)

m2 · · · (λ− λs)ms ,

其中 m1 + m2 + · · ·+ ms = m. 记

l = max{m1,m2, · · · ,ms},


f(λ1), f′(λ1), · · · , f(m1−1)(λ1),

f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...

f(λs), f′(λs), · · · , f(ms−1)(λs),

(11)


::值.

若这些值都为有限值, 则称函数 f(λ) 在 A 的::谱

::上

::给

::定.



m(λ) = (λ− λ1)m1(λ− λ2)

m2 · · · (λ− λs)ms ,

其中 m1 + m2 + · · ·+ ms = m. 记

l = max{m1,m2, · · · ,ms},


f(λ1), f′(λ1), · · · , f(m1−1)(λ1),

f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...

f(λs), f′(λs), · · · , f(ms−1)(λs),

(11)


::值. 若这些值都为有限值, 则称函数 f(λ) 在 A 的

::谱

::上

::给

::定.


我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式.

构造多项式

p(λ), 使

p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),

p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...

p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),

(12)

即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由

f(Ji) =

f(λi) f′(λi) · · · 1

(r − 1)!f(r−1)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

,

知 f(J) = p(J).


我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式. 构造多项式p(λ), 使

p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),

p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...


(12)


f(Ji) =

f(λi) f′(λi) · · · 1

(r − 1)!f(r−1)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

,

知 f(J) = p(J).



p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),

p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...


(12)

即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.

设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由

f(Ji) =

f(λi) f′(λi) · · · 1

(r − 1)!f(r−1)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

,

知 f(J) = p(J).



p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),

p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...


(12)

即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵.

由

f(Ji) =

f(λi) f′(λi) · · · 1

(r − 1)!f(r−1)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

,

知 f(J) = p(J).



p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),

p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...


(12)


f(Ji) =

f(λi) f′(λi) · · · 1

(r − 1)!f(r−1)(λi)

. . . . . . ...f(λi) f′(λi)

f(λi)

,

知 f(J) = p(J).黄正华 (武汉大学) 第5章矩阵分析 December 29, 2014 107 / 109

于是

f(A) = Qf(J)Q−1

= Qp(J)Q−1 = p(QJQ−1) = p(A).

对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使

g(A) = p(A).

令

p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,

由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.


于是

f(A) = Qf(J)Q−1 = Qp(J)Q−1

= p(QJQ−1) = p(A).


g(A) = p(A).

令

p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,



于是

f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1)

= p(A).


g(A) = p(A).

令

p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,



于是

f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1) = p(A).


g(A) = p(A).

令

p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,



Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09

2, 故谱半径 ρ(A) =

0.7 +√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

],

由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09


0.7 +√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09


0.7 +√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09

2,

故谱半径 ρ(A) =0.7 +

√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09


0.7 +√1.09

2< 1,

从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09


0.7 +√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1

=

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Exercise 4.12 (P. 211 习题一 9 (1))

计算级数∞∑

k=0

[0.1 0.7

0.3 0.6

]k

的和.

解: 记 A =

[0.1 0.7

0.3 0.6

], 由

|λI − A| =

[λ− 0.1 −0.7

−0.3 λ− 0.6

]= λ2 − 0.7λ− 0.15,

得特征值为 λ1,2 =0.7±

√1.09


0.7 +√1.09

2< 1, 从而

∞∑k=0

[0.1 0.7

0.3 0.6

]k

= (I − A)−1 =

[0.9 −0.7

−0.3 0.4

]−1

=1

0.15

[0.4 0.7

0.3 0.9

].


Download - 矩阵分析 - Matrix Theory - Wuhan University

Top Related