Download - 矩阵分析 - Matrix Theory - Wuhan University
第 5章 矩阵分析
Matrix Theory
黄 正 华
Email: [email protected]
武汉大学 数学与统计学院
December 29, 2014
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 1 / 109
分析 Analysis, 一般称为 “数学分析”, 是微积分的 Pro 版本.
矩阵分析 讨论矩阵序列的极限、矩阵级数、矩阵的微分与积分等分析概念.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 2 / 109
分析 Analysis, 一般称为 “数学分析”, 是微积分的 Pro 版本.
矩阵分析 讨论矩阵序列的极限、矩阵级数、矩阵的微分与积分等分析概念.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 2 / 109
Outline
1 向量范数及矩阵范数
向量范数
矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 3 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广.
本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;
2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;
3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm).
定义了范数的线性空间 V 又叫做
::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
在第二章中我们用内积定义了向量的长度:
∥x∥ =√
(x|x),
它是几何向量长度概念的一种推广. 本节采用 ·公 ·理 ·化的方法把向量长度的概念进一步推广, 主要讨论向量范数、矩阵范数及其应用.
Definition 1.1设 V 是数域 F 上的线性空间. 若对任一向量 x ∈ V, 都有一实数 ∥x∥ 与之对应,且满足以下条件:
1 正定性: ∥x∥ > 0. 当且仅当 x = 0 时, ∥x∥ = 0;2 齐次性: 对任意 λ ∈ F, ∥λx∥ = |λ|∥x∥;3 三角不等式: 对任意 x, y ∈ V, 都有
∥x + y∥ 6 ∥x∥+ ∥y∥,
则称 ∥x∥ 为线性空间 V 中向量 x 的::范
::数(norm). 定义了范数的线性空间 V 又
叫做::线
::性
::赋
::范
::空
::间.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 4 / 109
基本性质
1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥
= ∥x∥.
2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)
事实上, (1) 式等价于
−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.
而
−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)
∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 5 / 109
基本性质
1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥ = ∥x∥.
2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)
事实上, (1) 式等价于
−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.
而
−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)
∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 5 / 109
基本性质
1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥ = ∥x∥.
2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)
事实上, (1) 式等价于
−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.
而
−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)
∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 5 / 109
基本性质
1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥ = ∥x∥.
2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)
事实上, (1) 式等价于
−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.
而
−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)
∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 5 / 109
基本性质
1 对任意的 x ∈ V, 有∥−x∥ = |−1|∥x∥ = ∥x∥.
2 对任意 x, y ∈ V, 有 ∣∣∥x∥ − ∥y∥∣∣ 6 ∥x − y∥. (1)
事实上, (1) 式等价于
−∥x − y∥ 6 ∥x∥ − ∥y∥ 6 ∥x − y∥.
而
−∥x − y∥ 6 ∥x∥ − ∥y∥⇔∥y∥ 6 ∥x∥+ ∥x − y∥, (2)
∥x∥ − ∥y∥ 6 ∥x − y∥⇔∥x∥ 6 ∥x − y∥+ ∥y∥. (3)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 5 / 109
由
∥y∥ = ∥x + y − x∥ 6 ∥x∥+ ∥y − x∥ = ∥x∥+ ∥x − y∥, (4)
∥x∥ = ∥x − y + y∥ 6 ∥x − y∥+ ∥y∥, (5)
得证 (1) 式成立.
� 注意向量范数是在一般线性空间 V 中给出的, 定义中的向量是广义向量,就是说对矩阵、多项式、连续函数等都可以定义向量范数.
下文讨论的向量范数, 仅限于线性空间 Cn 上讨论.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 6 / 109
由
∥y∥ = ∥x + y − x∥ 6 ∥x∥+ ∥y − x∥ = ∥x∥+ ∥x − y∥, (4)
∥x∥ = ∥x − y + y∥ 6 ∥x − y∥+ ∥y∥, (5)
得证 (1) 式成立.� 注意向量范数是在一般线性空间 V 中给出的, 定义中的向量是广义向量,就是说对矩阵、多项式、连续函数等都可以定义向量范数.
下文讨论的向量范数, 仅限于线性空间 Cn 上讨论.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 6 / 109
由
∥y∥ = ∥x + y − x∥ 6 ∥x∥+ ∥y − x∥ = ∥x∥+ ∥x − y∥, (4)
∥x∥ = ∥x − y + y∥ 6 ∥x − y∥+ ∥y∥, (5)
得证 (1) 式成立.� 注意向量范数是在一般线性空间 V 中给出的, 定义中的向量是广义向量,就是说对矩阵、多项式、连续函数等都可以定义向量范数.
下文讨论的向量范数, 仅限于线性空间 Cn 上讨论.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 6 / 109
线性空间 Cn 的范数
任取 x ∈ Cn, 设 x = (ξ1, ξ2, · · · , ξn)T, 常用的范数有
1 2-范数
∥x∥2 =( n∑
i=1
|ξi|2) 1
2
.
2 1-范数
∥x∥1 =n∑
i=1
|ξi|.
3 ∞-范数∥x∥∞ = max
16i6n|ξi|.
以上三种范数都是以下:::p-范
::数的特例:
∥x∥p =( n∑
i=1
|ξi|p) 1
p, 1 6 p < +∞.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 7 / 109
线性空间 Cn 的范数
任取 x ∈ Cn, 设 x = (ξ1, ξ2, · · · , ξn)T, 常用的范数有
1 2-范数
∥x∥2 =( n∑
i=1
|ξi|2) 1
2
.
2 1-范数
∥x∥1 =n∑
i=1
|ξi|.
3 ∞-范数∥x∥∞ = max
16i6n|ξi|.
以上三种范数都是以下:::p-范
::数的特例:
∥x∥p =( n∑
i=1
|ξi|p) 1
p, 1 6 p < +∞.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 7 / 109
线性空间 Cn 的范数
任取 x ∈ Cn, 设 x = (ξ1, ξ2, · · · , ξn)T, 常用的范数有
1 2-范数
∥x∥2 =( n∑
i=1
|ξi|2) 1
2
.
2 1-范数
∥x∥1 =n∑
i=1
|ξi|.
3 ∞-范数∥x∥∞ = max
16i6n|ξi|.
以上三种范数都是以下:::p-范
::数的特例:
∥x∥p =( n∑
i=1
|ξi|p) 1
p, 1 6 p < +∞.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 7 / 109
线性空间 Cn 的范数
任取 x ∈ Cn, 设 x = (ξ1, ξ2, · · · , ξn)T, 常用的范数有
1 2-范数
∥x∥2 =( n∑
i=1
|ξi|2) 1
2
.
2 1-范数
∥x∥1 =n∑
i=1
|ξi|.
3 ∞-范数∥x∥∞ = max
16i6n|ξi|.
以上三种范数都是以下:::p-范
::数的特例:
∥x∥p =( n∑
i=1
|ξi|p) 1
p, 1 6 p < +∞.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 7 / 109
p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式.
例如 p = 12 , 则
∥x∥p =( n∑
i=1
|ξi|p) 1
p=
( n∑i=1
√|ξi|
)2
,
对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则
∥α+ β∥ 12= 4, ∥α∥ 1
2= 1, ∥β∥ 1
2= 1.
1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.
2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 8 / 109
p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式. 例如 p = 12 , 则
∥x∥p =( n∑
i=1
|ξi|p) 1
p=
( n∑i=1
√|ξi|
)2
,
对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则
∥α+ β∥ 12= 4, ∥α∥ 1
2= 1, ∥β∥ 1
2= 1.
1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.
2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 8 / 109
p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式. 例如 p = 12 , 则
∥x∥p =( n∑
i=1
|ξi|p) 1
p=
( n∑i=1
√|ξi|
)2
,
对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则
∥α+ β∥ 12= 4, ∥α∥ 1
2= 1, ∥β∥ 1
2= 1.
1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.
2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 8 / 109
p-范数定义式中, 若取 0 < p < 1, 则不满足三角不等式. 例如 p = 12 , 则
∥x∥p =( n∑
i=1
|ξi|p) 1
p=
( n∑i=1
√|ξi|
)2
,
对 α = (1, 0, 0)T, β = (0, 1, 0, )T, 则
∥α+ β∥ 12= 4, ∥α∥ 1
2= 1, ∥β∥ 1
2= 1.
1-范数和 2-范数显然是 p-范数在 p = 1 和 p = 2 的特殊情形.
2-范数 ∥x∥2 也叫 Euclid 范数, 就是通常意义下的向量的长度.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 8 / 109
Theorem 1.2对任意向量 x ∈ Cn,
limp→∞
∥x∥p = ∥x∥∞. (6)
证: 因 (max16i6n
|ξi|p) 1
p 6( n∑
i=1
|ξi|p) 1
p 6(
n · max16i6n
|ξi|p) 1
p,
故有
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.
令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 9 / 109
Theorem 1.2对任意向量 x ∈ Cn,
limp→∞
∥x∥p = ∥x∥∞. (6)
证: 因 (max16i6n
|ξi|p) 1
p 6( n∑
i=1
|ξi|p) 1
p
6(
n · max16i6n
|ξi|p) 1
p,
故有
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.
令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 9 / 109
Theorem 1.2对任意向量 x ∈ Cn,
limp→∞
∥x∥p = ∥x∥∞. (6)
证: 因 (max16i6n
|ξi|p) 1
p 6( n∑
i=1
|ξi|p) 1
p 6(
n · max16i6n
|ξi|p) 1
p,
故有
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.
令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 9 / 109
Theorem 1.2对任意向量 x ∈ Cn,
limp→∞
∥x∥p = ∥x∥∞. (6)
证: 因 (max16i6n
|ξi|p) 1
p 6( n∑
i=1
|ξi|p) 1
p 6(
n · max16i6n
|ξi|p) 1
p,
故有
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞.
令 p → ∞, 注意到 n1p → 1, 即得 (6) 式成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 9 / 109
范数的等价性
按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.
Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有
K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .
由
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞
表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 10 / 109
范数的等价性
按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.
Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有
K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .
由
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞
表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 10 / 109
范数的等价性
按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.
Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有
K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .
由
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞
表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价,
因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 10 / 109
范数的等价性
按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.
Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有
K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .
由
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞
表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.
特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 10 / 109
范数的等价性
按照不同方式规定的范数, 其值一般不相同, 但在各种范数下考虑向量序列的收敛性时, 却表现出明显的一致性, 这就是向量范数的等价性.
Definition 1.3称范数 ∥x∥α 与 ∥x∥β 等价, 如果存在 K2 > K1 > 0, 使得对一切 x ∈ Cn 都有
K1∥x∥β 6 ∥x∥α 6 K2∥x∥β .
由
∥x∥∞ 6 ∥x∥p 6 n1p ∥x∥∞
表明, 任何范数 ∥x∥p 均与 ∥x∥∞ 等价, 因而任何两种 p-范数都是彼此等价的.特别地, 前述三种常用范数 ∥x∥1, ∥x∥2 和 ∥x∥∞ 彼此等价.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 10 / 109
Outline
1 向量范数及矩阵范数
向量范数
矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 11 / 109
注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.
与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:
∥A∥V1 =m∑
i=1
n∑j=1
|aij|,
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F, (Frobenius 范数)
∥A∥V∞ = maxi,j
|aij|, (契比雪夫范数)
∥A∥Vp =( m∑
i=1
n∑j=1
|aij|p) 1
p, 1 6 p < +∞.
可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 12 / 109
注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.
与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:
∥A∥V1 =m∑
i=1
n∑j=1
|aij|,
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F, (Frobenius 范数)
∥A∥V∞ = maxi,j
|aij|, (契比雪夫范数)
∥A∥Vp =( m∑
i=1
n∑j=1
|aij|p) 1
p, 1 6 p < +∞.
可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 12 / 109
注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.
与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:
∥A∥V1 =m∑
i=1
n∑j=1
|aij|,
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F, (Frobenius 范数)
∥A∥V∞ = maxi,j
|aij|, (契比雪夫范数)
∥A∥Vp =( m∑
i=1
n∑j=1
|aij|p) 1
p, 1 6 p < +∞.
可以证明它们都是线性空间 Cm×n 上的向量范数.
� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 12 / 109
注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.
与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:
∥A∥V1 =m∑
i=1
n∑j=1
|aij|,
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F, (Frobenius 范数)
∥A∥V∞ = maxi,j
|aij|, (契比雪夫范数)
∥A∥Vp =( m∑
i=1
n∑j=1
|aij|p) 1
p, 1 6 p < +∞.
可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector.
同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 12 / 109
注意到前述的向量范数是定义在线性空间 V 上的, m × n 阶矩阵作为线性空间空间 Cm×n 中的向量, 自然也可以依照该定义产生范数.
与向量 x ∈ Cn 的几种范数相对应, 对矩阵 A = [aij] ∈ Cm×n 有:
∥A∥V1 =m∑
i=1
n∑j=1
|aij|,
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F, (Frobenius 范数)
∥A∥V∞ = maxi,j
|aij|, (契比雪夫范数)
∥A∥Vp =( m∑
i=1
n∑j=1
|aij|p) 1
p, 1 6 p < +∞.
可以证明它们都是线性空间 Cm×n 上的向量范数.� 下标 V 即 Vector. 同样地, ∥A∥Vp 在 p = 1, p = 2, p → ∞ 时分别成为∥A∥V1 , ∥A∥V2 , ∥A∥V∞ .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 12 / 109
F-范数
Frobenius 范数
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F
简称为::::F-范
::数, 是最常见的范数之一.
它是酉空间 Cm×n 中的内积
(A | B) = tr(BHA) =m∑
i=1
n∑j=1
bijaij
所诱导的范数. 即
∥A∥2F = (A | A) = tr(AHA) =m∑
i=1
n∑j=1
|aij|2.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 13 / 109
F-范数
Frobenius 范数
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F
简称为::::F-范
::数, 是最常见的范数之一. 它是酉空间 Cm×n 中的内积
(A | B) = tr(BHA) =m∑
i=1
n∑j=1
bijaij
所诱导的范数.
即
∥A∥2F = (A | A) = tr(AHA) =m∑
i=1
n∑j=1
|aij|2.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 13 / 109
F-范数
Frobenius 范数
∥A∥V2 =( m∑
i=1
n∑j=1
|aij|2) 1
2
=
√tr(AHA) , ∥A∥F
简称为::::F-范
::数, 是最常见的范数之一. 它是酉空间 Cm×n 中的内积
(A | B) = tr(BHA) =m∑
i=1
n∑j=1
bijaij
所诱导的范数. 即
∥A∥2F = (A | A) = tr(AHA) =m∑
i=1
n∑j=1
|aij|2.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 13 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA), 得
∥UA∥F =
√tr(AHUHUA) =
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA), 得
∥UA∥F =
√tr(AHUHUA) =
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA),
得
∥UA∥F =
√tr(AHUHUA) =
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA), 得
∥UA∥F =
√tr(AHUHUA)
=
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA), 得
∥UA∥F =
√tr(AHUHUA) =
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
Theorem 1.4设 A ∈ Cm×n, 对酉矩阵 U ∈ Cm×m, V ∈ Cn×n, 恒有
∥A∥F = ∥UA∥F = ∥AV∥F = ∥UAV∥F.
称之为 F-范数的::酉
::不
::变
::性.
证: 由 ∥A∥F =
√tr(AHA), 得
∥UA∥F =
√tr(AHUHUA) =
√tr(AHA) = ∥A∥F.
其他同理.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 14 / 109
矩阵范数
Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足
1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;
2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.
则称 ∥ · ∥ 为::相
::容
::的
::矩
::阵
::范
::数, 或简称为
::矩
::阵
::范
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 15 / 109
矩阵范数
Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足
1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;
3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.
则称 ∥ · ∥ 为::相
::容
::的
::矩
::阵
::范
::数, 或简称为
::矩
::阵
::范
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 15 / 109
矩阵范数
Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足
1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;
4 ∥AB∥ 6 ∥A∥∥B∥.
则称 ∥ · ∥ 为::相
::容
::的
::矩
::阵
::范
::数, 或简称为
::矩
::阵
::范
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 15 / 109
矩阵范数
Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足
1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.
则称 ∥ · ∥ 为::相
::容
::的
::矩
::阵
::范
::数, 或简称为
::矩
::阵
::范
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 15 / 109
矩阵范数
Definition 1.5在矩阵空间 Cn×n 上的任一实函数, 记为 ∥ · ∥, 如果对所有的 A, B ∈ Cn×n,λ ∈ Cn 都满足
1 ∥A∥ > 0. 当且仅当 A = O 时, ∥A∥ = 0;2 ∥λA∥ = |λ|∥A∥;3 ∥A + B∥ 6 ∥A∥+ ∥B∥;4 ∥AB∥ 6 ∥A∥∥B∥.
则称 ∥ · ∥ 为::相
::容
::的
::矩
::阵
::范
::数, 或简称为
::矩
::阵
::范
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 15 / 109
若将向量 x 视为矩阵, 根据相容性矩阵范数定义的第 4 条∥AB∥ 6 ∥A∥∥B∥, 应有
∥Ax∥ 6 ∥A∥∥x∥.
它们各自取不同的范数仍能使这个不等式成立吗? 两者怎样取才能协调? 这就是矩阵范数与向量范数相容的概念.
Definition 1.6如果矩阵范数 ∥A∥m 和向量范数 ∥x∥v 对一切矩阵 A 和向量 x 都满足
∥Ax∥v 6 ∥A∥m∥x∥v,
则称矩阵范数 ∥A∥m 和向量范数 ∥x∥v 是::相
::容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 16 / 109
若将向量 x 视为矩阵, 根据相容性矩阵范数定义的第 4 条∥AB∥ 6 ∥A∥∥B∥, 应有
∥Ax∥ 6 ∥A∥∥x∥.
它们各自取不同的范数仍能使这个不等式成立吗? 两者怎样取才能协调? 这就是矩阵范数与向量范数相容的概念.
Definition 1.6如果矩阵范数 ∥A∥m 和向量范数 ∥x∥v 对一切矩阵 A 和向量 x 都满足
∥Ax∥v 6 ∥A∥m∥x∥v,
则称矩阵范数 ∥A∥m 和向量范数 ∥x∥v 是::相
::容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 16 / 109
若将向量 x 视为矩阵, 根据相容性矩阵范数定义的第 4 条∥AB∥ 6 ∥A∥∥B∥, 应有
∥Ax∥ 6 ∥A∥∥x∥.
它们各自取不同的范数仍能使这个不等式成立吗? 两者怎样取才能协调? 这就是矩阵范数与向量范数相容的概念.
Definition 1.6如果矩阵范数 ∥A∥m 和向量范数 ∥x∥v 对一切矩阵 A 和向量 x 都满足
∥Ax∥v 6 ∥A∥m∥x∥v,
则称矩阵范数 ∥A∥m 和向量范数 ∥x∥v 是::相
::容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 16 / 109
Example 1.7设 x = (ξ1, ξ2, · · · , ξn)
T ∈ Cn, A = [aij] ∈ Cn×n, 试证明 F-范数
∥A∥F =( m∑
i=1
n∑j=1
|aij|2) 1
2
与向量的欧氏范数 ∥x∥2 =( n∑
i=1
|ξi|2) 1
2
是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 17 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.
1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O,
所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.
2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m
= |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m
= |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
对于 Cn×n 上任意给定的一种矩阵范数, 是否一定存在与之相容的向量范数?
Theorem 1.8设 ∥A∥m 是 Cn×n 上的一种 ·相 ·容 ·的矩阵范数, 则在 Cn 上必存在一个与它相容
的向量范数.
证: 设 a ∈ Cn 是非零向量, 对任意的 x ∈ Cn, 定义
∥x∥v = ∥xaH∥m .
先证明 ∥x∥v 是 Cn 中的向量范数.1 当 x = 0 时, xaH = O, 所以
∥x∥v = ∥xaH∥m > 0.
当且仅当 x = 0 时, 才有 xaH = O, 即 ∥x∥v = ∥xaH∥m = 0.2 对任意 λ ∈ C, 有
∥λx∥v = ∥λxaH∥m = |λ|∥xaH∥m = |λ|∥x∥v.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 18 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.又
∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.
又
∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.又
∥Ax∥v = ∥AxaH∥m
6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.又
∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m
= ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.又
∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
3 对任何 x, y ∈ Cn, 都有
∥x + y∥v = ∥(x + y)aH∥m = ∥xaH + yaH∥m
6 ∥xaH∥m + ∥yaH∥m
= ∥x∥v + ∥y∥v.
所以 ∥x∥v 是 Cn 中的向量范数.又
∥Ax∥v = ∥AxaH∥m 6 ∥A∥m ∥xaH∥m = ∥A∥m ∥x∥v,
得证矩阵范数 ∥A∥m 和向量范数 ∥x∥v = ∥xaH∥m 是相容的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 19 / 109
Theorem 1.9设 A ∈ Cm×n, x ∈ Cn, 且在 Cn 中已规定了向量的某种范数 ∥x∥, 则与向量范数 ∥x∥ 相容的矩阵范数可以取为向量 Ax 的范数的最大值, 即
∥A∥ = max∥x∥=1
∥Ax∥.
其中向量范数 ∥x∥ 与 ∥Ax∥ 可以相同, 也可以不同.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 20 / 109
Example 1.10设 A = [aij] ∈ Cn×n, 当向量范数分别取 ∥ · ∥1, ∥ · ∥∞, ∥ · ∥2 时, 其对应的算子范数也分别记为 ∥A∥1, ∥A∥∞, ∥A∥2, 则有
∥A∥1 = max∥x∥1=1
∥Ax∥1 = maxj
n∑i=1
|aij|, (列范数)
∥A∥∞ = max∥x∥∞=1
∥Ax∥∞ = maxi
n∑j=1
|aij|, (行范数)
∥A∥2 = max∥x∥2=1
∥Ax∥2 =[ρ(AHA)
] 12 = σ1. (谱范数)
其中 σ1 为 A 的最大奇异值.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 21 / 109
Theorem 1.11矩阵 A ∈ Cm×n 的任意一种范数, 都是 A 的元素的连续函数.
Theorem 1.12对于 Cm×n 上的任意两种范数 ∥A∥a 及 ∥A∥b, 必存在 K1 > 0, K2 > 0, 使得对任意的 A ∈ Cm×n, 都有
K1∥A∥a 6 ∥A∥b 6 K2∥A∥a.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 22 / 109
Theorem 1.11矩阵 A ∈ Cm×n 的任意一种范数, 都是 A 的元素的连续函数.
Theorem 1.12对于 Cm×n 上的任意两种范数 ∥A∥a 及 ∥A∥b, 必存在 K1 > 0, K2 > 0, 使得对任意的 A ∈ Cm×n, 都有
K1∥A∥a 6 ∥A∥b 6 K2∥A∥a.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 22 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.
(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
],
得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221.
故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Example 1.13
设 A =
[1 −2
−3 4
], 试计算 ∥A∥1, ∥A∥∞, ∥A∥2, ∥A∥F.
解: (1) ∥A∥1 = 6.(2) ∥A∥∞ = 7.
(3) 由 AHA =
[1 −3
−2 4
][1 −2
−3 4
]=
[10 −14
−14 20
], 得
∣∣∣∣∣ λ− 10 14
14 λ− 20
∣∣∣∣∣ = λ2 − 30λ+ 4,
则 AHA 的特征值为 λ1 = 15 +√221, λ2 = 15−
√221. 故
∥A∥2 =[ρ(AHA)
] 12 =
√15 +
√221 ≈ 5.46.
(4) ∥A∥F =√12 + (−2)2 + (−3)2 + 42 =
√30 ≈ 5.477.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 23 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn.
因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn}
, λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn
= tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA)
= ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn)
=1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.14 (P.176 习题一 11)证明:
1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
证: 矩阵 AHA的特征值非负, 记为 λ1, λ2, · · · , λn. 因 ∥A∥2 =[ρ(AHA)
] 12 , 故
∥A∥22 = ρ(AHA) = max{λ1, λ2, · · · , λn} , λmax.
从而
∥A∥22 = λmax 6 λ1 + λ2 + · · ·+ λn = tr(AHA) = ∥A∥2F.
另一方面,
∥A∥22 = λmax > 1
n (λ1 + λ2 + · · ·+ λn) =1
n∥A∥2F.
得证 1√n∥A∥F 6 ∥A∥2 6 ∥A∥F.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 24 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数.
又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Exercise 1.15 (P.176 习题二 3.)设 ∥ · ∥ 为 Cn×n 上矩阵的算子范数, ρ(A) 为 A 的谱半径, 则对任意的矩阵A ∈ Cn×n, 均有
ρ(A) 6 ∥A∥.
证: 设 ∥ · ∥v 是 Cn 上与矩阵范数 ∥ · ∥ 相容的向量范数. 又设 λ 为 A 的特征值, x 为 A 的属于特征值 λ 的特征向量, 则 x = 0, 从而 ∥x∥v > 0.
由 Ax = λx 有∥Ax∥v = |λ| ∥x∥v.
而 ∥Ax∥v 6 ∥A∥ ∥x∥v, 于是
|λ| ∥x∥v 6 ∥A∥ ∥x∥v.
又 ∥x∥v > 0, 故|λ| 6 ∥A∥.
由 λ 的任意性, 得证 ρ(A) 6 ∥A∥.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 25 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
向量序列的极限
矩阵序列的极限
矩阵级数
3 矩阵的微分与积分
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 26 / 109
矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.
Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若
∥x(k) − x0∥ → 0 (k → ∞),
则称向量序列 {x(k)}::收
::敛于向量 x0, 或称向量 x0 是向量序列 {x(k)} 在 k → ∞
时的::极
::限. 记为
limk→∞
x(k) = x0,
或
x(k) → x0 (k → ∞).
� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 27 / 109
矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.
Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若
∥x(k) − x0∥ → 0 (k → ∞),
则称向量序列 {x(k)}::收
::敛于向量 x0,
或称向量 x0 是向量序列 {x(k)} 在 k → ∞时的
::极
::限. 记为
limk→∞
x(k) = x0,
或
x(k) → x0 (k → ∞).
� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 27 / 109
矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.
Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若
∥x(k) − x0∥ → 0 (k → ∞),
则称向量序列 {x(k)}::收
::敛于向量 x0, 或称向量 x0 是向量序列 {x(k)} 在 k → ∞
时的::极
::限.
记为
limk→∞
x(k) = x0,
或
x(k) → x0 (k → ∞).
� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 27 / 109
矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.
Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若
∥x(k) − x0∥ → 0 (k → ∞),
则称向量序列 {x(k)}::收
::敛于向量 x0, 或称向量 x0 是向量序列 {x(k)} 在 k → ∞
时的::极
::限. 记为
limk→∞
x(k) = x0,
或
x(k) → x0 (k → ∞).
� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 27 / 109
矩阵分析理论的建立和数学分析一样, 也是以极限理论为基础而形成的, 下面讨论向量序列的极限运算.
Definition 2.1设 x(k), x0 ∈ Cn, k = 1, 2, · · · , 若
∥x(k) − x0∥ → 0 (k → ∞),
则称向量序列 {x(k)}::收
::敛于向量 x0, 或称向量 x0 是向量序列 {x(k)} 在 k → ∞
时的::极
::限. 记为
limk→∞
x(k) = x0,
或
x(k) → x0 (k → ∞).
� 由于有限维空间的向量范数是等价的, 因此上述定义中的范数是任意的向量范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 27 / 109
Example 2.2设 x0 = (1, 1, · · · , 1)T, 且
x(k) =(1 +
1
2k , 1 +1
3k , · · · , 1 +1
(n + 1)k
)T, k = 1, 2, · · ·
试证: limk→∞
x(k) = x0.
证: 由于
∥x(k) − x0∥∞ = max{ 1
2k ,1
3k , · · · ,1
(n + 1)k
}=
1
2k → 0 (k → ∞),
所以 limk→∞
x(k) = x0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 28 / 109
Example 2.2设 x0 = (1, 1, · · · , 1)T, 且
x(k) =(1 +
1
2k , 1 +1
3k , · · · , 1 +1
(n + 1)k
)T, k = 1, 2, · · ·
试证: limk→∞
x(k) = x0.
证: 由于
∥x(k) − x0∥∞ = max{ 1
2k ,1
3k , · · · ,1
(n + 1)k
}
=1
2k → 0 (k → ∞),
所以 limk→∞
x(k) = x0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 28 / 109
Example 2.2设 x0 = (1, 1, · · · , 1)T, 且
x(k) =(1 +
1
2k , 1 +1
3k , · · · , 1 +1
(n + 1)k
)T, k = 1, 2, · · ·
试证: limk→∞
x(k) = x0.
证: 由于
∥x(k) − x0∥∞ = max{ 1
2k ,1
3k , · · · ,1
(n + 1)k
}=
1
2k
→ 0 (k → ∞),
所以 limk→∞
x(k) = x0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 28 / 109
Example 2.2设 x0 = (1, 1, · · · , 1)T, 且
x(k) =(1 +
1
2k , 1 +1
3k , · · · , 1 +1
(n + 1)k
)T, k = 1, 2, · · ·
试证: limk→∞
x(k) = x0.
证: 由于
∥x(k) − x0∥∞ = max{ 1
2k ,1
3k , · · · ,1
(n + 1)k
}=
1
2k → 0 (k → ∞),
所以 limk→∞
x(k) = x0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 28 / 109
Example 2.2设 x0 = (1, 1, · · · , 1)T, 且
x(k) =(1 +
1
2k , 1 +1
3k , · · · , 1 +1
(n + 1)k
)T, k = 1, 2, · · ·
试证: limk→∞
x(k) = x0.
证: 由于
∥x(k) − x0∥∞ = max{ 1
2k ,1
3k , · · · ,1
(n + 1)k
}=
1
2k → 0 (k → ∞),
所以 limk→∞
x(k) = x0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 28 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|,
则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi|
= ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
Theorem 2.3设 x(k) =
(ξ(k)1 , ξ
(k)2 , · · · , ξ(k)n
)T, x0 =(ξ1, ξ2, · · · , ξn
)T ∈ Cn, 则向量序列{x(k)} 收敛于向量 x0 的充分必要条件是: 每一个坐标分量序列 {ξ(k)i } 收敛于
ξi, 即lim
k→∞ξ(k)i = ξi, i = 1, 2, · · · ,n. (7)
证: 必要性. 设 ∥x∥ = ∥x∥∞ = max16i6n
|ξi|, 则
∥x(k) − x0∥∞ → 0 (k → ∞).
由于
|ξ(k)i − ξi| 6 max16i6n
|ξ(k)i − ξi| = ∥x(k) − x0∥∞,
所以
|ξ(k)i − ξi| → 0 (k → ∞).
即
limk→∞
ξ(k)i = ξi, i = 1, 2, · · · ,n.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 29 / 109
充分性. 如果 limk→∞
ξ(k)i = ξi, (i = 1, 2, · · · ,n), 则
limk→∞
max16i6n
|ξ(k)i − ξi| = 0,
即
∥x(k) − x0∥∞ → 0 (k → ∞).
再有范数的等价性知, 上述结论对任意向量范数均成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 30 / 109
充分性. 如果 limk→∞
ξ(k)i = ξi, (i = 1, 2, · · · ,n), 则
limk→∞
max16i6n
|ξ(k)i − ξi| = 0,
即
∥x(k) − x0∥∞ → 0 (k → ∞).
再有范数的等价性知, 上述结论对任意向量范数均成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 30 / 109
充分性. 如果 limk→∞
ξ(k)i = ξi, (i = 1, 2, · · · ,n), 则
limk→∞
max16i6n
|ξ(k)i − ξi| = 0,
即
∥x(k) − x0∥∞ → 0 (k → ∞).
再有范数的等价性知, 上述结论对任意向量范数均成立.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 30 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0,
所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T
= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.
(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的.
故向量序列 y(k) 发散.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Example 2.4试考察下列向量序列的收敛性:
1 x(k) =(
12k ,
sin kk
)T, k = 1, 2, · · · .
2 y(k) =( k∑
i=1
12i ,
k∑i=1
1i
)T, k = 1, 2, · · · .
解: (1) 当 k → ∞ 时, 12k → 0, sin k
k → 0, 所以
limk→∞
x(k) =(
limk→∞
1
2k , limk→∞
sin kk
)T= (0, 0)T = 0.
故向量序列 x(k) 收敛, 且收敛于 0.(2) 当 k → ∞ 时,
k∑i=1
1
i = 1 +1
2+ · · ·+ 1
k + · · ·
为调和级数, 是发散的. 故向量序列 y(k) 发散.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 31 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
向量序列的极限
矩阵序列的极限
矩阵级数
3 矩阵的微分与积分
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 32 / 109
任给 Cm×n 中的矩阵序列 A1, A2, · · · , Ak, · · · , 记为 {Ak},
其中
Ak =
a(k)11 a(k)
12 · · · a(k)1n
a(k)21 a(k)
22 · · · a(k)2n
......
...a(k)
m1 a(k)m2 · · · a(k)
mn
.
显然, {Ak} 中各矩阵的对应元素构成了 m × n 个标量序列 {a(k)ij }.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 33 / 109
任给 Cm×n 中的矩阵序列 A1, A2, · · · , Ak, · · · , 记为 {Ak}, 其中
Ak =
a(k)11 a(k)
12 · · · a(k)1n
a(k)21 a(k)
22 · · · a(k)2n
......
...a(k)
m1 a(k)m2 · · · a(k)
mn
.
显然, {Ak} 中各矩阵的对应元素构成了 m × n 个标量序列 {a(k)ij }.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 33 / 109
任给 Cm×n 中的矩阵序列 A1, A2, · · · , Ak, · · · , 记为 {Ak}, 其中
Ak =
a(k)11 a(k)
12 · · · a(k)1n
a(k)21 a(k)
22 · · · a(k)2n
......
...a(k)
m1 a(k)m2 · · · a(k)
mn
.
显然, {Ak} 中各矩阵的对应元素构成了 m × n 个标量序列 {a(k)ij }.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 33 / 109
Definition 2.5给定 Cm×n 中的矩阵序列 {Ak}, 如果 k → ∞ 时, m × n 个序列 {a(k)
ij } 都收敛,即
limk→∞
a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,
则称矩阵序列 {Ak}::收
::敛于矩阵
A =
a11 a12 · · · a1n
a21 a22 · · · a2n...
......
am1 am2 · · · amn
,
并称 A 是序列 {Ak} 在 k → ∞ 时的::极
::限, 记作
limk→∞
Ak = A.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 34 / 109
Definition 2.5给定 Cm×n 中的矩阵序列 {Ak}, 如果 k → ∞ 时, m × n 个序列 {a(k)
ij } 都收敛,即
limk→∞
a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,
则称矩阵序列 {Ak}::收
::敛于矩阵
A =
a11 a12 · · · a1n
a21 a22 · · · a2n...
......
am1 am2 · · · amn
,
并称 A 是序列 {Ak} 在 k → ∞ 时的::极
::限, 记作
limk→∞
Ak = A.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 34 / 109
Definition 2.5给定 Cm×n 中的矩阵序列 {Ak}, 如果 k → ∞ 时, m × n 个序列 {a(k)
ij } 都收敛,即
limk→∞
a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,
则称矩阵序列 {Ak}::收
::敛于矩阵
A =
a11 a12 · · · a1n
a21 a22 · · · a2n...
......
am1 am2 · · · amn
,
并称 A 是序列 {Ak} 在 k → ∞ 时的::极
::限,
记作
limk→∞
Ak = A.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 34 / 109
Definition 2.5给定 Cm×n 中的矩阵序列 {Ak}, 如果 k → ∞ 时, m × n 个序列 {a(k)
ij } 都收敛,即
limk→∞
a(k)ij = aij, i = 1, 2, · · · ,m; j = 1, 2, · · · ,n,
则称矩阵序列 {Ak}::收
::敛于矩阵
A =
a11 a12 · · · a1n
a21 a22 · · · a2n...
......
am1 am2 · · · amn
,
并称 A 是序列 {Ak} 在 k → ∞ 时的::极
::限, 记作
limk→∞
Ak = A.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 34 / 109
Example 2.6已知
Ak =
1
k2k2 − 1
3k2 + 4(1 +
1
k )k cos 1
k3
,
求 {Ak} 在 k → ∞ 时的极限.
解:
limk→∞
Ak =
lim
k→∞
1
k limk→∞
2k2 − 1
3k2 + 4
limk→∞
(1 +
1
k )k lim
k→∞cos 1
k3
=
0 2
3
e 1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 35 / 109
Example 2.6已知
Ak =
1
k2k2 − 1
3k2 + 4(1 +
1
k )k cos 1
k3
,
求 {Ak} 在 k → ∞ 时的极限.
解:
limk→∞
Ak =
lim
k→∞
1
k limk→∞
2k2 − 1
3k2 + 4
limk→∞
(1 +
1
k )k lim
k→∞cos 1
k3
=
0 2
3
e 1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 35 / 109
Example 2.6已知
Ak =
1
k2k2 − 1
3k2 + 4(1 +
1
k )k cos 1
k3
,
求 {Ak} 在 k → ∞ 时的极限.
解:
limk→∞
Ak =
lim
k→∞
1
k limk→∞
2k2 − 1
3k2 + 4
limk→∞
(1 +
1
k )k lim
k→∞cos 1
k3
=
0 2
3
e 1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 35 / 109
Theorem 2.7设有矩阵序列 Ak ∈ Cm×n 和矩阵 A ∈ Cm×n, 则 lim
k→∞Ak = A 的充要条件是
limk→∞
∥Ak − A∥ = 0,
其中 ∥ · ∥ 是 Cm×n 上的任一矩阵范数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 36 / 109
Theorem 2.8收敛的矩阵序列 {Ak} 是有界的, 即存在正数 M > 0, 使得对一切 k 都有
∥Ak∥ 6 M.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 37 / 109
Theorem 2.9若 Ak, Bk, A, B ∈ Cm×n, αk, βk, α, β ∈ C, 且有 lim
k→∞Ak = A, lim
k→∞Bk = B,
limk→∞
αk = α, limk→∞
βk = β, 则
1 limk→∞
(αkAk + βkBk
)= αA + βB;
2 limk→∞
(AkBk
)= AB;
3 limk→∞
A−1k = A−1, 若 A−1
k , A−1 存在.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 38 / 109
Theorem 2.9若 Ak, Bk, A, B ∈ Cm×n, αk, βk, α, β ∈ C, 且有 lim
k→∞Ak = A, lim
k→∞Bk = B,
limk→∞
αk = α, limk→∞
βk = β, 则
1 limk→∞
(αkAk + βkBk
)= αA + βB;
2 limk→∞
(AkBk
)= AB;
3 limk→∞
A−1k = A−1, 若 A−1
k , A−1 存在.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 38 / 109
Theorem 2.9若 Ak, Bk, A, B ∈ Cm×n, αk, βk, α, β ∈ C, 且有 lim
k→∞Ak = A, lim
k→∞Bk = B,
limk→∞
αk = α, limk→∞
βk = β, 则
1 limk→∞
(αkAk + βkBk
)= αA + βB;
2 limk→∞
(AkBk
)= AB;
3 limk→∞
A−1k = A−1, 若 A−1
k , A−1 存在.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 38 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
向量序列的极限
矩阵序列的极限
矩阵级数
3 矩阵的微分与积分
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 39 / 109
Definition 2.10设有矩阵序列 Ak ∈ Cm×n, 称
∞∑k=1
Ak = A1 + A2 + · · ·+ Ak + · · ·
为::矩
::阵
::级
::数, 其中 Ak 为矩阵级数的
::一
::般
::项.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 40 / 109
Definition 2.11
称 Sm =m∑
k=1
Ak 为矩阵级数∞∑
k=1
Ak 的::部
::分
::和.
若矩阵序列 {Sm} 收敛, 且
limm→∞
Sm = S,
则称矩阵级数∞∑
k=1
Ak 是::收
::敛的, 级数的和为 S, 记作
S =∞∑
k=1
Ak.
不收敛的级数称为是::发
::散的.
显然,∞∑
k=1
Ak 收敛的充分必要条件是对应的 m × n 个数值级数
∞∑k=1
a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)
都收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 41 / 109
Definition 2.11
称 Sm =m∑
k=1
Ak 为矩阵级数∞∑
k=1
Ak 的::部
::分
::和. 若矩阵序列 {Sm} 收敛, 且
limm→∞
Sm = S,
则称矩阵级数∞∑
k=1
Ak 是::收
::敛的, 级数的和为 S,
记作
S =∞∑
k=1
Ak.
不收敛的级数称为是::发
::散的.
显然,∞∑
k=1
Ak 收敛的充分必要条件是对应的 m × n 个数值级数
∞∑k=1
a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)
都收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 41 / 109
Definition 2.11
称 Sm =m∑
k=1
Ak 为矩阵级数∞∑
k=1
Ak 的::部
::分
::和. 若矩阵序列 {Sm} 收敛, 且
limm→∞
Sm = S,
则称矩阵级数∞∑
k=1
Ak 是::收
::敛的, 级数的和为 S, 记作
S =∞∑
k=1
Ak.
不收敛的级数称为是::发
::散的.
显然,∞∑
k=1
Ak 收敛的充分必要条件是对应的 m × n 个数值级数
∞∑k=1
a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)
都收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 41 / 109
Definition 2.11
称 Sm =m∑
k=1
Ak 为矩阵级数∞∑
k=1
Ak 的::部
::分
::和. 若矩阵序列 {Sm} 收敛, 且
limm→∞
Sm = S,
则称矩阵级数∞∑
k=1
Ak 是::收
::敛的, 级数的和为 S, 记作
S =∞∑
k=1
Ak.
不收敛的级数称为是::发
::散的.
显然,∞∑
k=1
Ak 收敛的充分必要条件是对应的 m × n 个数值级数
∞∑k=1
a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)
都收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 41 / 109
Definition 2.11
称 Sm =m∑
k=1
Ak 为矩阵级数∞∑
k=1
Ak 的::部
::分
::和. 若矩阵序列 {Sm} 收敛, 且
limm→∞
Sm = S,
则称矩阵级数∞∑
k=1
Ak 是::收
::敛的, 级数的和为 S, 记作
S =∞∑
k=1
Ak.
不收敛的级数称为是::发
::散的.
显然,∞∑
k=1
Ak 收敛的充分必要条件是对应的 m × n 个数值级数
∞∑k=1
a(k)ij (i = 1, 2, · · · ,m; j = 1, 2, · · · ,n)
都收敛.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 41 / 109
Example 2.12
已知 Ak =
1
2kπ
4k
01
(k + 1)(k + 2)
, k = 0, 1, 2, · · · . 问矩阵级数∞∑
k=0
Ak 是否收
敛? 若收敛, 求其和.
解: 因为∞∑
k=0
1
2k =1
1− 12
= 2,
∞∑k=0
π
4k =π
1− 14
=4π
3,
又
m∑k=0
1
(k + 1)(k + 2)= 1− 1
2+
1
2− 1
3+ · · ·+ 1
m + 1− 1
m + 2
= 1− 1
m + 2→ 1 (m → ∞),
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 42 / 109
Example 2.12
已知 Ak =
1
2kπ
4k
01
(k + 1)(k + 2)
, k = 0, 1, 2, · · · . 问矩阵级数∞∑
k=0
Ak 是否收
敛? 若收敛, 求其和.
解: 因为∞∑
k=0
1
2k =1
1− 12
= 2,
∞∑k=0
π
4k =π
1− 14
=4π
3,
又
m∑k=0
1
(k + 1)(k + 2)= 1− 1
2+
1
2− 1
3+ · · ·+ 1
m + 1− 1
m + 2
= 1− 1
m + 2→ 1 (m → ∞),
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 42 / 109
Example 2.12
已知 Ak =
1
2kπ
4k
01
(k + 1)(k + 2)
, k = 0, 1, 2, · · · . 问矩阵级数∞∑
k=0
Ak 是否收
敛? 若收敛, 求其和.
解: 因为∞∑
k=0
1
2k =1
1− 12
= 2,
∞∑k=0
π
4k =π
1− 14
=4π
3,
又
m∑k=0
1
(k + 1)(k + 2)= 1− 1
2+
1
2− 1
3+ · · ·+ 1
m + 1− 1
m + 2
= 1− 1
m + 2→ 1 (m → ∞),
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 42 / 109
Example 2.12
已知 Ak =
1
2kπ
4k
01
(k + 1)(k + 2)
, k = 0, 1, 2, · · · . 问矩阵级数∞∑
k=0
Ak 是否收
敛? 若收敛, 求其和.
解: 因为∞∑
k=0
1
2k =1
1− 12
= 2,
∞∑k=0
π
4k =π
1− 14
=4π
3,
又
m∑k=0
1
(k + 1)(k + 2)= 1− 1
2+
1
2− 1
3+ · · ·+ 1
m + 1− 1
m + 2
= 1− 1
m + 2→ 1 (m → ∞),
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 42 / 109
即∞∑
k=0
1
(k + 1)(k + 2)= 1.
所以矩阵级数∞∑
k=0
Ak 收敛, 且其和为
2 4π
3
0 1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 43 / 109
即∞∑
k=0
1
(k + 1)(k + 2)= 1.
所以矩阵级数∞∑
k=0
Ak 收敛, 且其和为
2 4π
3
0 1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 43 / 109
如果在矩阵空间 Cm×n 中,∞∑
k=1
Ak = S,∞∑
k=1
Bk = T, 则有
1∞∑
k=1
(Ak + Bk) = S + T;
2∞∑
k=1
αAk = αS, ∀α ∈ C;
3∞∑
k=1
Akx = Sx, ∀x ∈ Cn.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 44 / 109
如果在矩阵空间 Cm×n 中,∞∑
k=1
Ak = S,∞∑
k=1
Bk = T, 则有
1∞∑
k=1
(Ak + Bk) = S + T;
2∞∑
k=1
αAk = αS, ∀α ∈ C;
3∞∑
k=1
Akx = Sx, ∀x ∈ Cn.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 44 / 109
如果在矩阵空间 Cm×n 中,∞∑
k=1
Ak = S,∞∑
k=1
Bk = T, 则有
1∞∑
k=1
(Ak + Bk) = S + T;
2∞∑
k=1
αAk = αS, ∀α ∈ C;
3∞∑
k=1
Akx = Sx, ∀x ∈ Cn.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 44 / 109
Definition 2.13
如果对 Cm×n 上的某种范数 ∥ · ∥, 标量级数∞∑
k=1
∥Ak∥ 收敛, 则称级数∞∑
k=1
Ak
为::绝
::对
::收
::敛.
Theorem 2.14
若级数∞∑
k=1
Ak 绝对收敛, 则它也一定是收敛的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 45 / 109
Definition 2.13
如果对 Cm×n 上的某种范数 ∥ · ∥, 标量级数∞∑
k=1
∥Ak∥ 收敛, 则称级数∞∑
k=1
Ak
为::绝
::对
::收
::敛.
Theorem 2.14
若级数∞∑
k=1
Ak 绝对收敛, 则它也一定是收敛的.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 45 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞.
因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij|
= 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1.
则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.
又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k,
由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛,
故原级数绝对收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.15
设 A =
0.2 0.5 0.1
0.1 0.5 0.3
0.2 0.4 0.2
, 试证矩阵级数 I+A+A2 + · · ·+Ak + · · · 绝对收敛.
证: 取矩阵的范数为 ∥ · ∥∞. 因
∥A∥ = ∥A∥∞ = maxi
n∑j=1
|aij| = 0.9 < 1,
又 ∥I∥ = ∥I∥∞ = 1. 则
∥I∥+ ∥A∥+ ∥A∥2 + · · ·+ ∥A∥k + · · ·
是公比为 ∥A∥ = 0.9 的等比级数, 故收敛.又 ∥Ak∥ 6 ∥A∥k, 由正项级数比较法审敛法知
∥I∥+ ∥A∥+ ∥A2∥+ · · ·+ ∥Ak∥+ · · ·
收敛, 故原级数绝对收敛.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 46 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! ,
且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛,
所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数,
即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
Example 2.16设 A ∈ Cn×n, 则矩阵级数
I + A +A2
2!+ · · ·+ Ak
k! + · · ·
绝对收敛.
证: 因为∥∥∥Ak
k!
∥∥∥ =∥Ak∥
k! 6 ∥A∥k
k! , 且
∥I∥+ ∥A∥+ ∥A∥2
2!+ · · ·+ ∥A∥k
k! + · · · = e∥A∥ − 1 + ∥I∥,
由正项级数比较法知, 级数∞∑
k=1
∥∥∥Ak
k!
∥∥∥ 收敛, 所以级数∞∑
k=1
Ak
k! 绝对收敛.
级数∞∑
k=1
Ak
k! 的和记为 eA, 称为 A 的::矩
::阵
::指
::数
::函
::数, 即
eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 47 / 109
同理有
sin A = A − A3
3!+ · · ·+ (−1)k−1 A2k−1
(2k − 1)!+ · · · , (8)
cos A = I − A2
2!+ · · ·+ (−1)k A2k
(2k)! + · · · . (9)
从而欧拉公式
eiA = cos A + i sin A
对任意的复数或复矩阵都成立. 特别地,
eiπ + 1 = 0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 48 / 109
同理有
sin A = A − A3
3!+ · · ·+ (−1)k−1 A2k−1
(2k − 1)!+ · · · , (8)
cos A = I − A2
2!+ · · ·+ (−1)k A2k
(2k)! + · · · . (9)
从而欧拉公式
eiA = cos A + i sin A
对任意的复数或复矩阵都成立.
特别地,
eiπ + 1 = 0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 48 / 109
同理有
sin A = A − A3
3!+ · · ·+ (−1)k−1 A2k−1
(2k − 1)!+ · · · , (8)
cos A = I − A2
2!+ · · ·+ (−1)k A2k
(2k)! + · · · . (9)
从而欧拉公式
eiA = cos A + i sin A
对任意的复数或复矩阵都成立. 特别地,
eiπ + 1 = 0.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 48 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
函数矩阵及其极限
函数矩阵的微分和积分
纯量函数关于矩阵的导数
矩阵对矩阵的导数
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 49 / 109
Definition 3.1以实变量 t 的函数为元素的矩阵
A(t) =
a11(t) a12(t) · · · a1n(t)a21(t) a22(t) · · · a2n(t)
......
...am1(t) am2(t) · · · amn(t)
称为
::函
::数
::矩
::阵, 其中 aij(t) 都是定义在 [a, b] 上的实函数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 50 / 109
函数矩阵 A(t) 在 [a, b] 上有界、有极限、连续、可微、可积等概念, 可用其 m × n 个元素 aij(t) 同时在 [a, b] 上有界、有极限、连续、可微、可积来定义.
例如
ddtA(t) =
[ ddtaij(t)
]m×n
;∫A(t) dt =
[ ∫aij(t) dt
]m×n
;∫ b
aA(t) dt =
[ ∫ b
aaij(t) dt
]m×n
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 51 / 109
函数矩阵 A(t) 在 [a, b] 上有界、有极限、连续、可微、可积等概念, 可用其 m × n 个元素 aij(t) 同时在 [a, b] 上有界、有极限、连续、可微、可积来定义. 例如
ddtA(t) =
[ ddtaij(t)
]m×n
;∫A(t) dt =
[ ∫aij(t) dt
]m×n
;∫ b
aA(t) dt =
[ ∫ b
aaij(t) dt
]m×n
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 51 / 109
Definition 3.2如果所有的元素 aij(t) 在 t → t0 时, 极限存在, 记为常数 aij, 即
limt→t0
aij(t) = aij,
则称矩阵 A(t) 在 t → t0 时, 极限存在, 且极限值为 A (常量矩阵), 即
limt→t0
A(t) = A =
a11 a12 · · · a1n
a21 a22 · · · a2n...
......
am1 am2 · · · amn
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 52 / 109
Definition 3.3如果所有的元素 aij(t) 在 t = t0 连续, 即
limt→t0
aij(t) = aij(t0),
则称矩阵 A(t) 在 t = t0::连
::续,
且记为
limt→t0
A(t) = A(t0) =
a11(t0) a12(t0) · · · a1n(t0)a21(t0) a22(t0) · · · a2n(t0)
......
...am1(t0) am2(t0) · · · amn(t0)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 53 / 109
Definition 3.3如果所有的元素 aij(t) 在 t = t0 连续, 即
limt→t0
aij(t) = aij(t0),
则称矩阵 A(t) 在 t = t0::连
::续, 且记为
limt→t0
A(t) = A(t0) =
a11(t0) a12(t0) · · · a1n(t0)a21(t0) a22(t0) · · · a2n(t0)
......
...am1(t0) am2(t0) · · · amn(t0)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 53 / 109
容易验证下列等式是成立的.设 lim
t→t0A(t) = A, lim
t→t0B(t) = B.
1 若 A(t), B(t) 都是 m × n 阶矩阵, 则
limt→t0
[A(t) + B(t)] = A + B = limt→t0
A(t) + limt→t0
B(t).
2 设 k 为常数, 则limt→t0
[kA(t)] = kA.
3 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
limt→t0
[A(t)B(t)] = AB = limt→t0
A(t) limt→t0
B(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 54 / 109
容易验证下列等式是成立的.设 lim
t→t0A(t) = A, lim
t→t0B(t) = B.
1 若 A(t), B(t) 都是 m × n 阶矩阵, 则
limt→t0
[A(t) + B(t)] = A + B = limt→t0
A(t) + limt→t0
B(t).
2 设 k 为常数, 则limt→t0
[kA(t)] = kA.
3 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
limt→t0
[A(t)B(t)] = AB = limt→t0
A(t) limt→t0
B(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 54 / 109
容易验证下列等式是成立的.设 lim
t→t0A(t) = A, lim
t→t0B(t) = B.
1 若 A(t), B(t) 都是 m × n 阶矩阵, 则
limt→t0
[A(t) + B(t)] = A + B = limt→t0
A(t) + limt→t0
B(t).
2 设 k 为常数, 则limt→t0
[kA(t)] = kA.
3 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
limt→t0
[A(t)B(t)] = AB = limt→t0
A(t) limt→t0
B(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 54 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
函数矩阵及其极限
函数矩阵的微分和积分
纯量函数关于矩阵的导数
矩阵对矩阵的导数
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 55 / 109
Definition 3.4若函数矩阵 A(t) 中所有的元素 aij(t) 在 t0 处 (或在区间 (a, b) 上) 可微, 则称函数矩阵 A(t) 在 t0 处 (或在区间 (a, b) 上)
::可
::微.
并记为
A′(t0) =dA(t)
dt
∣∣∣t=t0
= lim∆t→0
A(t0 +∆t)− A(t0)∆t
=
a′11(t0) a′
12(t0) · · · a′1n(t0)
a′21(t0) a′
22(t0) · · · a′2n(t0)
......
...a′
m1(t0) a′m2(t0) · · · a′
mn(t0)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 56 / 109
Definition 3.4若函数矩阵 A(t) 中所有的元素 aij(t) 在 t0 处 (或在区间 (a, b) 上) 可微, 则称函数矩阵 A(t) 在 t0 处 (或在区间 (a, b) 上)
::可
::微. 并记为
A′(t0) =dA(t)
dt
∣∣∣t=t0
= lim∆t→0
A(t0 +∆t)− A(t0)∆t
=
a′11(t0) a′
12(t0) · · · a′1n(t0)
a′21(t0) a′
22(t0) · · · a′2n(t0)
......
...a′
m1(t0) a′m2(t0) · · · a′
mn(t0)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 56 / 109
Example 3.5
已知 A(t) =[
sin t 2t3
2√
t e2t
], 求 dA(t)
dt .
解:
dA(t)dt =
ddt (sin t) d
dt (2t3)
ddt (2
√t) d
dt (e2t)
=
cos t 6t2
1√t
2e2t
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 57 / 109
Example 3.5
已知 A(t) =[
sin t 2t3
2√
t e2t
], 求 dA(t)
dt .
解:
dA(t)dt =
ddt (sin t) d
dt (2t3)
ddt (2
√t) d
dt (e2t)
=
cos t 6t2
1√t
2e2t
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 57 / 109
关于函数矩阵, 有下面的求导法则:1 若 A(t), B(t) 都是 m × n 阶矩阵可微矩阵, 则
ddt [A(t) + B(t)] = d
dtA(t) + ddtB(t).
2 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
ddt [A(t)B(t)] =
[ ddtA(t)
]B(t) + A(t)
[ ddtB(t)
].
3 若 A(u) 可微, 且 u = f(t) 关于 t 可微, 则
ddtA
(f(t)
)= f′(t) d
dtA(u).
4 若 A(t) 与 A−1(t) 都可微, 则
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 58 / 109
关于函数矩阵, 有下面的求导法则:1 若 A(t), B(t) 都是 m × n 阶矩阵可微矩阵, 则
ddt [A(t) + B(t)] = d
dtA(t) + ddtB(t).
2 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
ddt [A(t)B(t)] =
[ ddtA(t)
]B(t) + A(t)
[ ddtB(t)
].
3 若 A(u) 可微, 且 u = f(t) 关于 t 可微, 则
ddtA
(f(t)
)= f′(t) d
dtA(u).
4 若 A(t) 与 A−1(t) 都可微, 则
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 58 / 109
关于函数矩阵, 有下面的求导法则:1 若 A(t), B(t) 都是 m × n 阶矩阵可微矩阵, 则
ddt [A(t) + B(t)] = d
dtA(t) + ddtB(t).
2 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
ddt [A(t)B(t)] =
[ ddtA(t)
]B(t) + A(t)
[ ddtB(t)
].
3 若 A(u) 可微, 且 u = f(t) 关于 t 可微, 则
ddtA
(f(t)
)= f′(t) d
dtA(u).
4 若 A(t) 与 A−1(t) 都可微, 则
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 58 / 109
关于函数矩阵, 有下面的求导法则:1 若 A(t), B(t) 都是 m × n 阶矩阵可微矩阵, 则
ddt [A(t) + B(t)] = d
dtA(t) + ddtB(t).
2 若 A(t), B(t) 分别是 m × n 阶及 n × r 阶矩阵, 则
ddt [A(t)B(t)] =
[ ddtA(t)
]B(t) + A(t)
[ ddtB(t)
].
3 若 A(u) 可微, 且 u = f(t) 关于 t 可微, 则
ddtA
(f(t)
)= f′(t) d
dtA(u).
4 若 A(t) 与 A−1(t) 都可微, 则
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 58 / 109
证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导,
得[ ddtA(t)
]A−1(t) + A(t)
[ ddt
(A−1(t)
)]= O,
即
A(t)[ d
dt(A−1(t)
)]= −
[ ddtA(t)
]A−1(t)
两边左乘以 A−1(t), 得
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
� 注意矩阵乘法不满足交换律. 例如
ddtA2(t) = d
dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)
= 2A(t) · A′(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 59 / 109
证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导, 得[ ddtA(t)
]A−1(t) + A(t)
[ ddt
(A−1(t)
)]= O,
即
A(t)[ d
dt(A−1(t)
)]= −
[ ddtA(t)
]A−1(t)
两边左乘以 A−1(t), 得
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
� 注意矩阵乘法不满足交换律. 例如
ddtA2(t) = d
dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)
= 2A(t) · A′(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 59 / 109
证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导, 得[ ddtA(t)
]A−1(t) + A(t)
[ ddt
(A−1(t)
)]= O,
即
A(t)[ d
dt(A−1(t)
)]= −
[ ddtA(t)
]A−1(t)
两边左乘以 A−1(t), 得
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
� 注意矩阵乘法不满足交换律. 例如
ddtA2(t) = d
dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)
= 2A(t) · A′(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 59 / 109
证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导, 得[ ddtA(t)
]A−1(t) + A(t)
[ ddt
(A−1(t)
)]= O,
即
A(t)[ d
dt(A−1(t)
)]= −
[ ddtA(t)
]A−1(t)
两边左乘以 A−1(t), 得
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
� 注意矩阵乘法不满足交换律. 例如
ddtA2(t) = d
dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)
= 2A(t) · A′(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 59 / 109
证: (4) 注意到 A(t)A−1(t) = I, 两端对 t 求导, 得[ ddtA(t)
]A−1(t) + A(t)
[ ddt
(A−1(t)
)]= O,
即
A(t)[ d
dt(A−1(t)
)]= −
[ ddtA(t)
]A−1(t)
两边左乘以 A−1(t), 得
ddt
(A−1(t)
)= −A−1(t)
[ ddtA(t)
]A−1(t).
� 注意矩阵乘法不满足交换律. 例如
ddtA2(t) = d
dt [A(t)A(t)] = A′(t) · A(t) + A(t) · A′(t)
= 2A(t) · A′(t).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 59 / 109
Definition 3.6若 A(t) 中所有的元素 aij(t) 在区间 [a, b] 上可积, 则称函数矩阵 A(t) 在区间[a, b] 上
::可
::积,
并规定 ∫ b
aA(t) dt =
[ ∫ b
aaij(t) dt
]m×n
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 60 / 109
Definition 3.6若 A(t) 中所有的元素 aij(t) 在区间 [a, b] 上可积, 则称函数矩阵 A(t) 在区间[a, b] 上
::可
::积, 并规定 ∫ b
aA(t) dt =
[ ∫ b
aaij(t) dt
]m×n
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 60 / 109
Theorem 3.7
1 若 A(t) 在区间 [a, b] 上连续, 则对任一 t ∈ (a, b),∫ t
aA(τ)dτ 可微, 且
ddt
[ ∫ t
aA(τ) dτ
]= A(t).
2 若 A(t) 在区间 [a, b] 上可微, 则∫ t
a
[ ddsA(s)
]ds = A(t)− A(a), t ∈ [a, b].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 61 / 109
Theorem 3.7
1 若 A(t) 在区间 [a, b] 上连续, 则对任一 t ∈ (a, b),∫ t
aA(τ)dτ 可微, 且
ddt
[ ∫ t
aA(τ) dτ
]= A(t).
2 若 A(t) 在区间 [a, b] 上可微, 则∫ t
a
[ ddsA(s)
]ds = A(t)− A(a), t ∈ [a, b].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 61 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
函数矩阵及其极限
函数矩阵的微分和积分
纯量函数关于矩阵的导数
矩阵对矩阵的导数
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 62 / 109
在场论中, 我们对数量函数 f(x, y, z) 定义梯度为
grad f = ∇f =( ∂f∂x ,
∂f∂y ,
∂f∂z
),
这可以理解为数量函数 f(x, y, z) 对向量 (x, y, z) 的导数.
注意梯度是向量, 有时也记为
grad f = ∂f∂x i + ∂f
∂y j + ∂f∂zk.
下面我们将这一概念推广到一般情形.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 63 / 109
在场论中, 我们对数量函数 f(x, y, z) 定义梯度为
grad f = ∇f =( ∂f∂x ,
∂f∂y ,
∂f∂z
),
这可以理解为数量函数 f(x, y, z) 对向量 (x, y, z) 的导数.注意梯度是向量, 有时也记为
grad f = ∂f∂x i + ∂f
∂y j + ∂f∂zk.
下面我们将这一概念推广到一般情形.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 63 / 109
在场论中, 我们对数量函数 f(x, y, z) 定义梯度为
grad f = ∇f =( ∂f∂x ,
∂f∂y ,
∂f∂z
),
这可以理解为数量函数 f(x, y, z) 对向量 (x, y, z) 的导数.注意梯度是向量, 有时也记为
grad f = ∂f∂x i + ∂f
∂y j + ∂f∂zk.
下面我们将这一概念推广到一般情形.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 63 / 109
Definition 3.8设 X = [xij] ∈ Rm×n 为变量矩阵, f(X) 为矩阵 X 的数量函数, 即看成是 m × n元函数, 即
f(X) = f(x11, x12, · · · , x1n, x21, x22, · · · , x2n, · · · , xm1, xm2, · · · , xmn
).
则规定数量函数 f(X) 对于矩阵 X 的导数为
dfdX =
[ ∂f∂xij
]m×n
=
∂f∂x11
∂f∂x12
· · · ∂f∂x1n
∂f∂x21
∂f∂x22
· · · ∂f∂x2n
......
...∂f
∂xm1
∂f∂xm2
· · · ∂f∂xmn
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 64 / 109
Definition 3.8设 X = [xij] ∈ Rm×n 为变量矩阵, f(X) 为矩阵 X 的数量函数, 即看成是 m × n元函数, 即
f(X) = f(x11, x12, · · · , x1n, x21, x22, · · · , x2n, · · · , xm1, xm2, · · · , xmn
).
则规定数量函数 f(X) 对于矩阵 X 的导数为
dfdX =
[ ∂f∂xij
]m×n
=
∂f∂x11
∂f∂x12
· · · ∂f∂x1n
∂f∂x21
∂f∂x22
· · · ∂f∂x2n
......
...∂f
∂xm1
∂f∂xm2
· · · ∂f∂xmn
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 64 / 109
特别地, 若变量矩阵为 m 维向量 X = [xi]m×1, 这时数量函数为f(x1, x2, · · · , xn), 则
dfdX =
∂f∂x1∂f∂x2
...∂f∂xm
.
此即梯度.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 65 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
函数矩阵及其极限
函数矩阵的微分和积分
纯量函数关于矩阵的导数
矩阵对矩阵的导数
4 矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 66 / 109
Definition 3.9设 A = [aij]m×n, X = [xkl]p×q, 且 A 中的各元素 aij 是矩阵 X 中各元素 xkl 的
可微函数, 则矩阵 A 对矩阵 X 的导数定义为
dAdX =
∂A∂x11
∂A∂x12
· · · ∂A∂x1q
∂A∂x21
∂A∂x22
· · · ∂A∂x2q
......
...∂A∂xp1
∂A∂xp2
· · · ∂A∂xpq
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 67 / 109
其中
∂A∂xkl
=
∂a11
∂xkl
∂a12
∂xkl· · · ∂a1n
∂xkl
∂a21
∂xkl
∂a22
∂xkl· · · ∂a2n
∂xkl...
......
∂am1
∂xkl
∂am2
∂xkl· · · ∂amn
∂xkl
, k = 1, 2, · · · , p; l = 1, 2, · · · , q.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 68 / 109
Example 3.10设 X = (x1, x2, · · · , xn)
T, 求向量 XT = (x1, x2, · · · , xn) 对向量 X 的导数.
解:
dXT
dX =
∂XT
∂x1
∂XT
∂x2...
∂XT
∂xn
=
1 0 0 · · · 0
0 1 0 · · · 0...
......
...0 0 0 · · · 1
= In.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 69 / 109
Example 3.10设 X = (x1, x2, · · · , xn)
T, 求向量 XT = (x1, x2, · · · , xn) 对向量 X 的导数.
解:
dXT
dX =
∂XT
∂x1
∂XT
∂x2...
∂XT
∂xn
=
1 0 0 · · · 0
0 1 0 · · · 0...
......
...0 0 0 · · · 1
= In.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 69 / 109
Example 3.10设 X = (x1, x2, · · · , xn)
T, 求向量 XT = (x1, x2, · · · , xn) 对向量 X 的导数.
解:
dXT
dX =
∂XT
∂x1
∂XT
∂x2...
∂XT
∂xn
=
1 0 0 · · · 0
0 1 0 · · · 0...
......
...0 0 0 · · · 1
= In.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 69 / 109
Example 3.10设 X = (x1, x2, · · · , xn)
T, 求向量 XT = (x1, x2, · · · , xn) 对向量 X 的导数.
解:
dXT
dX =
∂XT
∂x1
∂XT
∂x2...
∂XT
∂xn
=
1 0 0 · · · 0
0 1 0 · · · 0...
......
...0 0 0 · · · 1
= In.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 69 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
4 矩阵函数
矩阵多项式
矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 70 / 109
Theorem 4.1
设 f(λ) = a0 + a1λ+ · · ·+ amλm =m∑
k=0
akλk, A 为分块对角阵
A =
A1
A2
. . .At
= diag(A1,A2, · · · ,At),
则
f(A) = diag[f(A1), f(A2), · · · , f(At)].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 71 / 109
证:
f(A)
= a0I + a1A + · · ·+ amAm
=a0
I1
I2. . .
It
+a1
A1
A2
. . .At
+· · ·+am
Am
1
Am2
. . .Am
t
=
m∑k=0
akAk1
m∑k=0
akAk2
. . .m∑
k=0
akAkt
=
f(A1)
f(A2)
. . .f(At)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 72 / 109
Theorem 4.2设 A ∈ Cn×n, P 为 n 阶非奇异矩阵, f(λ) 为多项式. 则
f(P−1AP) = P−1f(A)P.
证: 由
(P−1AP)k = (P−1AP)(P−1AP) · · · (P−1AP) = P−1AkP,
得
f(P−1AP) =m∑
k=0
ak(P−1AP)k
=
m∑k=0
ak(P−1AkP)
= P−1( m∑
k=0
akAk)
P
= P−1f(A)P.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 73 / 109
Theorem 4.2设 A ∈ Cn×n, P 为 n 阶非奇异矩阵, f(λ) 为多项式. 则
f(P−1AP) = P−1f(A)P.
证: 由
(P−1AP)k = (P−1AP)(P−1AP) · · · (P−1AP) = P−1AkP,
得
f(P−1AP) =m∑
k=0
ak(P−1AP)k
=
m∑k=0
ak(P−1AkP)
= P−1( m∑
k=0
akAk)
P
= P−1f(A)P.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 73 / 109
Theorem 4.2设 A ∈ Cn×n, P 为 n 阶非奇异矩阵, f(λ) 为多项式. 则
f(P−1AP) = P−1f(A)P.
证: 由
(P−1AP)k = (P−1AP)(P−1AP) · · · (P−1AP) = P−1AkP,
得
f(P−1AP) =m∑
k=0
ak(P−1AP)k
=
m∑k=0
ak(P−1AkP)
= P−1( m∑
k=0
akAk)
P
= P−1f(A)P.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 73 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm,
可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m, 再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m,
再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m, 再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m, 再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m, 再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).
这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
矩阵多项式的计算方法
要计算 f(A) = a0I + a1A + · · ·+ amAm, 可以找一个 A 的零化多项式φ(λ), 且 ∂
(φ(λ)
)< m, 再由多项式带余除法有
f(λ) = φ(λ)g(λ) + r(λ),
则
f(A) = φ(A)g(A) + r(A).
又 φ(A) = O, 故f(A) = r(A).
从而把计算 f(A) 转化为计算次数较低的 r(A).这里的零化多项式 φ(λ) 可以取为特征多项式, 或最小多项式等.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 74 / 109
Outline
1 向量范数及矩阵范数
2 矩阵序列与矩阵级数
3 矩阵的微分与积分
4 矩阵函数
矩阵多项式
矩阵函数
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 75 / 109
Lemma 4.3
设 r 阶方阵为 H =
0 1
0 1
. . . . . .0 1
0
,
则 (1) 当 m > r 时, Hm = O; (2)
当 m < r 时,
Hm =
0 · · · 0 1
. . . . . . . . .. . . . . . 1
. . . 0m 个 0. . . ...
0
.
即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 76 / 109
Lemma 4.3
设 r 阶方阵为 H =
0 1
0 1
. . . . . .0 1
0
, 则 (1) 当 m > r 时, Hm = O;
(2)
当 m < r 时,
Hm =
0 · · · 0 1
. . . . . . . . .. . . . . . 1
. . . 0m 个 0. . . ...
0
.
即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 76 / 109
Lemma 4.3
设 r 阶方阵为 H =
0 1
0 1
. . . . . .0 1
0
, 则 (1) 当 m > r 时, Hm = O; (2)
当 m < r 时,
Hm =
0 · · · 0 1
. . . . . . . . .. . . . . . 1
. . . 0m 个 0. . . ...
0
.
即 H 的幂次每增加 1, 主对角线上方一排 1 就向右上方平移一个位置.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 76 / 109
例如
H2 =
0 1 0 0
0 1 0
0 1
0
0 1 0 0
0 1 0
0 1
0
=
0 0 1 0
0 0 1
0 0
0
,
H3 =
0 0 1 0
0 0 1
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 1
0 0 0
0 0
0
,
H4 =
0 0 0 1
0 0 0
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 0
0 0 0
0 0
0
,
Hm = O, m > 4.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 77 / 109
例如
H2 =
0 1 0 0
0 1 0
0 1
0
0 1 0 0
0 1 0
0 1
0
=
0 0 1 0
0 0 1
0 0
0
,
H3 =
0 0 1 0
0 0 1
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 1
0 0 0
0 0
0
,
H4 =
0 0 0 1
0 0 0
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 0
0 0 0
0 0
0
,
Hm = O, m > 4.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 77 / 109
例如
H2 =
0 1 0 0
0 1 0
0 1
0
0 1 0 0
0 1 0
0 1
0
=
0 0 1 0
0 0 1
0 0
0
,
H3 =
0 0 1 0
0 0 1
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 1
0 0 0
0 0
0
,
H4 =
0 0 0 1
0 0 0
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 0
0 0 0
0 0
0
,
Hm = O, m > 4.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 77 / 109
例如
H2 =
0 1 0 0
0 1 0
0 1
0
0 1 0 0
0 1 0
0 1
0
=
0 0 1 0
0 0 1
0 0
0
,
H3 =
0 0 1 0
0 0 1
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 1
0 0 0
0 0
0
,
H4 =
0 0 0 1
0 0 0
0 0
0
0 1 0 0
0 1 0
0 1
0
=
0 0 0 0
0 0 0
0 0
0
,
Hm = O, m > 4.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 77 / 109
由引理 4.3 可知,
∞∑m=0
amHm =
a0 a1 · · · ar−1
. . . . . . .... . . a1
a0
. (10)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 78 / 109
Lemma 4.4
若 f(z) =∞∑
m=0amzm, 则
1
s! f(s)(z)
∣∣∣z=λ
=
∞∑m=s
Csmamλm−s.
证: 因为
Csmamλm−s =
m!
s!(m − s)!amλm−s =1
s!amds
dzs zm∣∣∣z=λ
,
所以∞∑
m=sCs
mamλm−s =1
s!
∞∑m=s
amds
dzs zm∣∣∣z=λ
=1
s! f(s)(z)
∣∣∣z=λ
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 79 / 109
Lemma 4.4
若 f(z) =∞∑
m=0amzm, 则
1
s! f(s)(z)
∣∣∣z=λ
=
∞∑m=s
Csmamλm−s.
证: 因为
Csmamλm−s =
m!
s!(m − s)!amλm−s
=1
s!amds
dzs zm∣∣∣z=λ
,
所以∞∑
m=sCs
mamλm−s =1
s!
∞∑m=s
amds
dzs zm∣∣∣z=λ
=1
s! f(s)(z)
∣∣∣z=λ
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 79 / 109
Lemma 4.4
若 f(z) =∞∑
m=0amzm, 则
1
s! f(s)(z)
∣∣∣z=λ
=
∞∑m=s
Csmamλm−s.
证: 因为
Csmamλm−s =
m!
s!(m − s)!amλm−s =1
s!amds
dzs zm∣∣∣z=λ
,
所以∞∑
m=sCs
mamλm−s =1
s!
∞∑m=s
amds
dzs zm∣∣∣z=λ
=1
s! f(s)(z)
∣∣∣z=λ
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 79 / 109
Lemma 4.4
若 f(z) =∞∑
m=0amzm, 则
1
s! f(s)(z)
∣∣∣z=λ
=
∞∑m=s
Csmamλm−s.
证: 因为
Csmamλm−s =
m!
s!(m − s)!amλm−s =1
s!amds
dzs zm∣∣∣z=λ
,
所以∞∑
m=sCs
mamλm−s =1
s!
∞∑m=s
amds
dzs zm∣∣∣z=λ
=1
s! f(s)(z)
∣∣∣z=λ
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 79 / 109
Lemma 4.4
若 f(z) =∞∑
m=0amzm, 则
1
s! f(s)(z)
∣∣∣z=λ
=
∞∑m=s
Csmamλm−s.
证: 因为
Csmamλm−s =
m!
s!(m − s)!amλm−s =1
s!amds
dzs zm∣∣∣z=λ
,
所以∞∑
m=sCs
mamλm−s =1
s!
∞∑m=s
amds
dzs zm∣∣∣z=λ
=1
s! f(s)(z)
∣∣∣z=λ
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 79 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm,
则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
另证: 设 f(z) = a0 + a1z + a2z2 + · · ·+ amzm + · · · =∞∑
m=0amzm, 则
f′(z) = a1 + 2a2z + · · ·+ mamzm−1 + · · · =∞∑
m=1
mamzm−1,
f′′(z) = 2a2 + · · ·+ m(m − 1)amzm−2 + · · · =∞∑
m=2
m(m − 1)amzm−2,
...
f(s)(z) =∞∑
m=sm(m − 1) · · · (m − s + 1)amzm−s
=∞∑
m=s
m!
(m − s)!amzm−s
= s!∞∑
m=s
m!
s!(m − s)!amzm−s
= s!∞∑
m=sCs
mamzm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 80 / 109
所以1
s! f(s)(z) =
∞∑m=s
Csmamzm−s.
故1
s! f(s)(z)
∣∣∣z=λ
=∞∑
m=sCs
mamλm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 81 / 109
所以1
s! f(s)(z) =
∞∑m=s
Csmamzm−s.
故1
s! f(s)(z)
∣∣∣z=λ
=∞∑
m=sCs
mamλm−s.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 81 / 109
Theorem 4.5
设 f(z) =∞∑
m=0amzm 的收敛半径为 R, 又 r 阶若当块为 J =
λ 1
. . . . . .λ 1
λ
.
则当 |λ| < R 时, 级数∞∑
m=0amJm 收敛, 且
∞∑m=0
amJm =
f(λ) f′(λ) 1
2!f′′(λ) · · · 1
(r − 1)!f(r−1)(λ)
f(λ) f′(λ) · · · 1
(r − 2)!f(r−2)(λ)
. . . . . . ...f(λ) f′(λ)
f(λ)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 82 / 109
证: 矩阵 J 可以写成 λI + H,
因为 I 是单位矩阵, 所以 I 可以与 H 交换. 于是m > r 时,
Jm = (λI + H)m = λmI + C1mλm−1H + · · ·+ Cm−1
m λHm−1 + Hm
=
λm C1
mλm−1 · · · Cr−1m λm−r+1
. . . . . . ...λm C1
mλm−1
λm
.(对照公式 (10)
)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 83 / 109
证: 矩阵 J 可以写成 λI + H, 因为 I 是单位矩阵, 所以 I 可以与 H 交换.
于是
m > r 时,
Jm = (λI + H)m = λmI + C1mλm−1H + · · ·+ Cm−1
m λHm−1 + Hm
=
λm C1
mλm−1 · · · Cr−1m λm−r+1
. . . . . . ...λm C1
mλm−1
λm
.(对照公式 (10)
)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 83 / 109
证: 矩阵 J 可以写成 λI + H, 因为 I 是单位矩阵, 所以 I 可以与 H 交换. 于是m > r 时,
Jm = (λI + H)m = λmI + C1mλm−1H + · · ·+ Cm−1
m λHm−1 + Hm
=
λm C1
mλm−1 · · · Cr−1m λm−r+1
. . . . . . ...λm C1
mλm−1
λm
.(对照公式 (10)
)
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 83 / 109
所以
∞∑m=0
amJm =
∞∑m=0
amλm∞∑
m=0amC1
mλm−1 · · ·∞∑
m=0amCr−1
m λm−r+1
∞∑m=0
amλm · · ·∞∑
m=0amCr−2
m λm−r+2
. . . ...∞∑
m=0amλm
=
f(λ) f′(λ) 1
2!f′′(λ) · · · 1
(r − 1)!f(r−1)(λ)
f(λ) f′(λ) · · · 1
(r − 2)!f(r−2)(λ)
. . . . . . ...f(λ) f′(λ)
f(λ)
.
最后一个等号的成立需要 |λ| < R. 得证级数∞∑
m=0amJm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 84 / 109
所以
∞∑m=0
amJm =
∞∑m=0
amλm∞∑
m=0amC1
mλm−1 · · ·∞∑
m=0amCr−1
m λm−r+1
∞∑m=0
amλm · · ·∞∑
m=0amCr−2
m λm−r+2
. . . ...∞∑
m=0amλm
=
f(λ) f′(λ) 1
2!f′′(λ) · · · 1
(r − 1)!f(r−1)(λ)
f(λ) f′(λ) · · · 1
(r − 2)!f(r−2)(λ)
. . . . . . ...f(λ) f′(λ)
f(λ)
.
最后一个等号的成立需要 |λ| < R. 得证级数∞∑
m=0amJm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 84 / 109
所以
∞∑m=0
amJm =
∞∑m=0
amλm∞∑
m=0amC1
mλm−1 · · ·∞∑
m=0amCr−1
m λm−r+1
∞∑m=0
amλm · · ·∞∑
m=0amCr−2
m λm−r+2
. . . ...∞∑
m=0amλm
=
f(λ) f′(λ) 1
2!f′′(λ) · · · 1
(r − 1)!f(r−1)(λ)
f(λ) f′(λ) · · · 1
(r − 2)!f(r−2)(λ)
. . . . . . ...f(λ) f′(λ)
f(λ)
.
最后一个等号的成立需要 |λ| < R.
得证级数∞∑
m=0amJm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 84 / 109
所以
∞∑m=0
amJm =
∞∑m=0
amλm∞∑
m=0amC1
mλm−1 · · ·∞∑
m=0amCr−1
m λm−r+1
∞∑m=0
amλm · · ·∞∑
m=0amCr−2
m λm−r+2
. . . ...∞∑
m=0amλm
=
f(λ) f′(λ) 1
2!f′′(λ) · · · 1
(r − 1)!f(r−1)(λ)
f(λ) f′(λ) · · · 1
(r − 2)!f(r−2)(λ)
. . . . . . ...f(λ) f′(λ)
f(λ)
.
最后一个等号的成立需要 |λ| < R. 得证级数∞∑
m=0amJm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 84 / 109
Theorem 4.6
设幂级数 f(z) =∞∑
m=0amzm 的收敛半径为 R, 且 A ∈ Cn×n 的谱半径 (即 A 的
特征值模的最大值) 为 ρ(A), 则当 ρ(A) < R 时, 矩阵幂级数∞∑
m=0amAm 收敛.
证: 设 A 的若当标准形为
J =
J1
J2
. . .Js
= J1 ⊕ J2 ⊕ · · · ⊕ Js,
其中 Ji 是特征值为 λi 的 ri 阶若当块. 则存在满秩方阵 P, 使 A = PJP−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 85 / 109
Theorem 4.6
设幂级数 f(z) =∞∑
m=0amzm 的收敛半径为 R, 且 A ∈ Cn×n 的谱半径 (即 A 的
特征值模的最大值) 为 ρ(A), 则当 ρ(A) < R 时, 矩阵幂级数∞∑
m=0amAm 收敛.
证: 设 A 的若当标准形为
J =
J1
J2
. . .Js
= J1 ⊕ J2 ⊕ · · · ⊕ Js,
其中 Ji 是特征值为 λi 的 ri 阶若当块. 则存在满秩方阵 P, 使 A = PJP−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 85 / 109
Theorem 4.6
设幂级数 f(z) =∞∑
m=0amzm 的收敛半径为 R, 且 A ∈ Cn×n 的谱半径 (即 A 的
特征值模的最大值) 为 ρ(A), 则当 ρ(A) < R 时, 矩阵幂级数∞∑
m=0amAm 收敛.
证: 设 A 的若当标准形为
J =
J1
J2
. . .Js
= J1 ⊕ J2 ⊕ · · · ⊕ Js,
其中 Ji 是特征值为 λi 的 ri 阶若当块.
则存在满秩方阵 P, 使 A = PJP−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 85 / 109
Theorem 4.6
设幂级数 f(z) =∞∑
m=0amzm 的收敛半径为 R, 且 A ∈ Cn×n 的谱半径 (即 A 的
特征值模的最大值) 为 ρ(A), 则当 ρ(A) < R 时, 矩阵幂级数∞∑
m=0amAm 收敛.
证: 设 A 的若当标准形为
J =
J1
J2
. . .Js
= J1 ⊕ J2 ⊕ · · · ⊕ Js,
其中 Ji 是特征值为 λi 的 ri 阶若当块. 则存在满秩方阵 P, 使 A = PJP−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 85 / 109
于是
∞∑m=0
amAm =∞∑
m=0
am(PJP−1
)m
=
∞∑m=0
amPJmP−1
= P( ∞∑
m=0
amJm)
P−1
= P( ∞∑
m=0
amJm1 ⊕
∞∑m=0
amJm2 ⊕ · · · ⊕
∞∑m=0
amJms
)P−1.
因为 ρ(A) < R, 故 |λi| < R, 由定理 4.5 知∞∑
m=0amJm
i 收敛,
因而推得
∞∑m=0
amAm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 86 / 109
于是
∞∑m=0
amAm =∞∑
m=0
am(PJP−1
)m
=
∞∑m=0
amPJmP−1
= P( ∞∑
m=0
amJm)
P−1
= P( ∞∑
m=0
amJm1 ⊕
∞∑m=0
amJm2 ⊕ · · · ⊕
∞∑m=0
amJms
)P−1.
因为 ρ(A) < R, 故 |λi| < R, 由定理 4.5 知∞∑
m=0amJm
i 收敛, 因而推得∞∑
m=0amAm 收敛.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 86 / 109
Definition 4.7
设幂级数∞∑
m=0amzm 的收敛半径为 R, 且对任意的 |z| < R, 幂级数收敛于 f(z),
即
f(z) =∞∑
m=0
amzm (|z| < R).
如果 A ∈ Cn×n 满足 ρ(A) < R, 则记矩阵幂级数∞∑
m=0amAm 的和为 f(A), 即
f(A) =∞∑
m=0
amAm.
称 f(A) 为自变量 A 的::矩
::阵
::函
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 87 / 109
Definition 4.7
设幂级数∞∑
m=0amzm 的收敛半径为 R, 且对任意的 |z| < R, 幂级数收敛于 f(z),
即
f(z) =∞∑
m=0
amzm (|z| < R).
如果 A ∈ Cn×n 满足 ρ(A) < R, 则记矩阵幂级数∞∑
m=0amAm 的和为 f(A),
即
f(A) =∞∑
m=0
amAm.
称 f(A) 为自变量 A 的::矩
::阵
::函
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 87 / 109
Definition 4.7
设幂级数∞∑
m=0amzm 的收敛半径为 R, 且对任意的 |z| < R, 幂级数收敛于 f(z),
即
f(z) =∞∑
m=0
amzm (|z| < R).
如果 A ∈ Cn×n 满足 ρ(A) < R, 则记矩阵幂级数∞∑
m=0amAm 的和为 f(A), 即
f(A) =∞∑
m=0
amAm.
称 f(A) 为自变量 A 的::矩
::阵
::函
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 87 / 109
Definition 4.7
设幂级数∞∑
m=0amzm 的收敛半径为 R, 且对任意的 |z| < R, 幂级数收敛于 f(z),
即
f(z) =∞∑
m=0
amzm (|z| < R).
如果 A ∈ Cn×n 满足 ρ(A) < R, 则记矩阵幂级数∞∑
m=0amAm 的和为 f(A), 即
f(A) =∞∑
m=0
amAm.
称 f(A) 为自变量 A 的::矩
::阵
::函
::数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 87 / 109
例如, 对于如下函数的幂级数展开式
(1− z)−1 =∞∑
m=0
zm (R = 1),
ln(1 + z) =∞∑
m=0
(−1)m
m + 1zm+1 (R = 1).
相应地有矩阵函数
(I − A)−1 =∞∑
m=0
Am (ρ(A) < 1),
ln(I + A) =∞∑
m=0
(−1)m
m + 1Am+1 (ρ(A) < 1).
以及
矩阵指数函数: eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
矩阵正弦函数: sin A = A − A3
3!+ · · ·+ (−1)k−1 A2k−1
(2k − 1)!+ · · · ,
矩阵余弦函数: cos A = I − A2
2!+ · · ·+ (−1)k A2k
(2k)! + · · · .
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 88 / 109
例如, 对于如下函数的幂级数展开式
(1− z)−1 =∞∑
m=0
zm (R = 1),
ln(1 + z) =∞∑
m=0
(−1)m
m + 1zm+1 (R = 1).
相应地有矩阵函数
(I − A)−1 =∞∑
m=0
Am (ρ(A) < 1),
ln(I + A) =∞∑
m=0
(−1)m
m + 1Am+1 (ρ(A) < 1).
以及
矩阵指数函数: eA = I + A +A2
2!+ · · ·+ Ak
k! + · · · .
矩阵正弦函数: sin A = A − A3
3!+ · · ·+ (−1)k−1 A2k−1
(2k − 1)!+ · · · ,
矩阵余弦函数: cos A = I − A2
2!+ · · ·+ (−1)k A2k
(2k)! + · · · .黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 88 / 109
定理 4.6 的证明过程给出了求 f(A) 的一个方法.
f(A) = P(
f(J1)⊕ f(J2)⊕ · · · ⊕ f(Js))
P−1,
其中
f(Ji) =∞∑
m=0
amJmi =
f(λi) f′(λi)1
2!f′′(λi) · · · 1
(ri − 1)!f(ri−1)(λi)
f(λi) f′(λi) · · · 1
(ri − 2)!f(ri−2)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
.
这里 ri 是若当块 Ji 的阶数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 89 / 109
定理 4.6 的证明过程给出了求 f(A) 的一个方法.
f(A) = P(
f(J1)⊕ f(J2)⊕ · · · ⊕ f(Js))
P−1,
其中
f(Ji) =∞∑
m=0
amJmi =
f(λi) f′(λi)1
2!f′′(λi) · · · 1
(ri − 1)!f(ri−1)(λi)
f(λi) f′(λi) · · · 1
(ri − 2)!f(ri−2)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
.
这里 ri 是若当块 Ji 的阶数.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 89 / 109
实际计算中, 若当块的阶数多为 1, 2, 3, 即分别为
Ji = λi, Ji =
[λi 1
λi
], Ji =
λi 1 0
λi 1
λi
,
此时对应地有
f(Ji) = f(λi), f(Ji) =
[f(λi) f′(λi)
f(λi)
], f(Ji) =
f(λi) f′(λi)
1
2!f′′(λi)
f(λi) f′(λi)
f(λi)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 90 / 109
实际计算中, 若当块的阶数多为 1, 2, 3, 即分别为
Ji = λi, Ji =
[λi 1
λi
], Ji =
λi 1 0
λi 1
λi
,
此时对应地有
f(Ji) = f(λi), f(Ji) =
[f(λi) f′(λi)
f(λi)
], f(Ji) =
f(λi) f′(λi)
1
2!f′′(λi)
f(λi) f′(λi)
f(λi)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 90 / 109
比如设 f(A) = eA, 假定 A 的为若当矩阵:
A =
2 1 0
2 1
2
,
则
f(A) =
f(λ) f′(λ) 1
2!f′′(λ)
f(λ) f′(λ)f(λ)
=
e2 e2 1
2e2
e2 e2
e2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 91 / 109
比如设 f(A) = eA, 假定 A 的为若当矩阵:
A =
2 1 0
2 1
2
,
则
f(A) =
f(λ) f′(λ) 1
2!f′′(λ)
f(λ) f′(λ)f(λ)
=
e2 e2 1
2e2
e2 e2
e2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 91 / 109
比如设 f(A) = eA, 假定 A 的为若当矩阵:
A =
2 1 0
2 1
2
,
则
f(A) =
f(λ) f′(λ) 1
2!f′′(λ)
f(λ) f′(λ)f(λ)
=
e2 e2 1
2e2
e2 e2
e2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 91 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形.
因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
Example 4.8
设 A =
2 0 0
1 1 1
1 −1 3
, 求下列矩阵函数: (1) A20; (2) eA; (3) sin A.
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 0 0
−1 λ− 1 −1
−1 1 λ− 3
∼
1
λ− 2
(λ− 2)2
.
所以若当标准形为
J =
2 0 0
2 1
2
.
则 J1 = 2, J2 =
[2 1
2
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 92 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20.
则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220,
f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1
=
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
由 AP = PJ 可求得
P =
1 0 1
1 1 0
0 1 0
, P−1 =
0 1 −1
0 0 1
1 −1 1
.
(1) 记 f(z) = z20. 则
f(J1) = 220, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[220 20 · 219
220
].
故
A20 = P(f(J1)⊕ f(J2)
)P−1 =
1 0 1
1 1 0
0 1 0
220 0 0
220 20 · 219
220
0 1 −1
0 0 1
1 −1 1
= 220
1 0 0
10 −9 10
10 −10 11
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 93 / 109
(2) 记 f(z) = ez.
则
f(J1) = e2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(2) 记 f(z) = ez. 则
f(J1) = e2,
f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(2) 记 f(z) = ez. 则
f(J1) = e2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(2) 记 f(z) = ez. 则
f(J1) = e2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1
=
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(2) 记 f(z) = ez. 则
f(J1) = e2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(2) 记 f(z) = ez. 则
f(J1) = e2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[e2 e2
e2
].
故
eA = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
e2 0 0
e2 e2
e2
0 1 −1
0 0 1
1 −1 1
= e2
1 0 0
1 0 1
1 −1 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 94 / 109
(3) 记 f(z) = sin z.
则
f(J1) = sin 2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
(3) 记 f(z) = sin z. 则
f(J1) = sin 2,
f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
(3) 记 f(z) = sin z. 则
f(J1) = sin 2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
(3) 记 f(z) = sin z. 则
f(J1) = sin 2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1
=
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
(3) 记 f(z) = sin z. 则
f(J1) = sin 2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
(3) 记 f(z) = sin z. 则
f(J1) = sin 2, f(J2) =
[f(λi) f′(λi)
f(λi)
]=
[sin 2 cos 2
sin 2
].
故
sin A = Pf(J)P−1 =
1 0 1
1 1 0
0 1 0
sin 2 0 0
sin 2 cos 2sin 2
0 1 −1
0 0 1
1 −1 1
=
sin 2 0 0
cos 2 sin 2− cos 2 cos 2cos 2 − cos 2 sin 2 + cos 2
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 95 / 109
� 矩阵 P 是怎么求得的?
设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
2 0 0
2 1
2
,
得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有
Ap1 = 2p1, 即 (2I − A)p1 = 0,
Ap2 = 2p2, 即 (2I − A)p2 = 0,
Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.
由
2I − A =
0 0 0
−1 1 −1
−1 1 −1
∼
1 −1 1
0 0 0
0 0 0
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 96 / 109
� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3],
则有
A[p1,p2,p3] = [p1,p2,p3]
2 0 0
2 1
2
,
得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有
Ap1 = 2p1, 即 (2I − A)p1 = 0,
Ap2 = 2p2, 即 (2I − A)p2 = 0,
Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.
由
2I − A =
0 0 0
−1 1 −1
−1 1 −1
∼
1 −1 1
0 0 0
0 0 0
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 96 / 109
� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
2 0 0
2 1
2
,
得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3].
于是有
Ap1 = 2p1, 即 (2I − A)p1 = 0,
Ap2 = 2p2, 即 (2I − A)p2 = 0,
Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.
由
2I − A =
0 0 0
−1 1 −1
−1 1 −1
∼
1 −1 1
0 0 0
0 0 0
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 96 / 109
� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
2 0 0
2 1
2
,
得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有
Ap1 = 2p1, 即 (2I − A)p1 = 0,
Ap2 = 2p2, 即 (2I − A)p2 = 0,
Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.
由
2I − A =
0 0 0
−1 1 −1
−1 1 −1
∼
1 −1 1
0 0 0
0 0 0
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 96 / 109
� 矩阵 P 是怎么求得的?设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
2 0 0
2 1
2
,
得 [Ap1,Ap2,Ap3] = [2p1, 2p2,p2 + 2p3]. 于是有
Ap1 = 2p1, 即 (2I − A)p1 = 0,
Ap2 = 2p2, 即 (2I − A)p2 = 0,
Ap3 = p2 + 2p3, 即 (2I − A)p3 = −p2.
由
2I − A =
0 0 0
−1 1 −1
−1 1 −1
∼
1 −1 1
0 0 0
0 0 0
,
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 96 / 109
知齐次方程组 (2I − A)x = 0 的基础解系为
α1 = (1, 1, 0)T, α2 = (0, 1, 1)T.
又 0 0 0 b1
−1 1 −1 b2−1 1 −1 b3
∼
1 −1 1 −b30 0 0 b3 − b20 0 0 b1
,
故要使方程组 (2I − A)p3 = −p2 有解, −p2 需满足 b1 = 0, b2 = b3. 则(2I − A)p2 = 0 的解可取为
p2 = α2 = (0, 1, 1)T,
从而方程组 (2I − A)p1 = 0 的解可取为
p1 = α1 = (1, 1, 0)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 97 / 109
知齐次方程组 (2I − A)x = 0 的基础解系为
α1 = (1, 1, 0)T, α2 = (0, 1, 1)T.
又 0 0 0 b1
−1 1 −1 b2−1 1 −1 b3
∼
1 −1 1 −b30 0 0 b3 − b20 0 0 b1
,
故要使方程组 (2I − A)p3 = −p2 有解, −p2 需满足 b1 = 0, b2 = b3. 则(2I − A)p2 = 0 的解可取为
p2 = α2 = (0, 1, 1)T,
从而方程组 (2I − A)p1 = 0 的解可取为
p1 = α1 = (1, 1, 0)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 97 / 109
知齐次方程组 (2I − A)x = 0 的基础解系为
α1 = (1, 1, 0)T, α2 = (0, 1, 1)T.
又 0 0 0 b1
−1 1 −1 b2−1 1 −1 b3
∼
1 −1 1 −b30 0 0 b3 − b20 0 0 b1
,
故要使方程组 (2I − A)p3 = −p2 有解, −p2 需满足 b1 = 0, b2 = b3. 则(2I − A)p2 = 0 的解可取为
p2 = α2 = (0, 1, 1)T,
从而方程组 (2I − A)p1 = 0 的解可取为
p1 = α1 = (1, 1, 0)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 97 / 109
知齐次方程组 (2I − A)x = 0 的基础解系为
α1 = (1, 1, 0)T, α2 = (0, 1, 1)T.
又 0 0 0 b1
−1 1 −1 b2−1 1 −1 b3
∼
1 −1 1 −b30 0 0 b3 − b20 0 0 b1
,
故要使方程组 (2I − A)p3 = −p2 有解, −p2 需满足 b1 = 0, b2 = b3. 则(2I − A)p2 = 0 的解可取为
p2 = α2 = (0, 1, 1)T,
从而方程组 (2I − A)p1 = 0 的解可取为
p1 = α1 = (1, 1, 0)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 97 / 109
再求解非齐次线性方程组 (2I − A)p3 = −p2,
由
[2I − A, −p2
]=
0 0 0 0
−1 1 −1 −1
−1 1 −1 −1
∼
1 −1 1 1
0 0 0 0
0 0 0 0
,
可取
p3 = (1, 0, 0)T.
另由上述过程可知 P 不唯一.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 98 / 109
再求解非齐次线性方程组 (2I − A)p3 = −p2, 由
[2I − A, −p2
]=
0 0 0 0
−1 1 −1 −1
−1 1 −1 −1
∼
1 −1 1 1
0 0 0 0
0 0 0 0
,
可取
p3 = (1, 0, 0)T.
另由上述过程可知 P 不唯一.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 98 / 109
再求解非齐次线性方程组 (2I − A)p3 = −p2, 由
[2I − A, −p2
]=
0 0 0 0
−1 1 −1 −1
−1 1 −1 −1
∼
1 −1 1 1
0 0 0 0
0 0 0 0
,
可取
p3 = (1, 0, 0)T.
另由上述过程可知 P 不唯一.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 98 / 109
再求解非齐次线性方程组 (2I − A)p3 = −p2, 由
[2I − A, −p2
]=
0 0 0 0
−1 1 −1 −1
−1 1 −1 −1
∼
1 −1 1 1
0 0 0 0
0 0 0 0
,
可取
p3 = (1, 0, 0)T.
另由上述过程可知 P 不唯一.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 98 / 109
Example 4.9
设 A =
2 −1 −1
2 −1 −2
−1 1 2
, 求矩阵 A 的 Jordan 标准形 J, 并求变换矩阵 P,
使 P−1AP = J.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 99 / 109
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 1 1
−2 λ+ 1 2
1 −1 λ− 2
r1−(λ−2)r3−−−−−−−→r2+2r3
0 λ− 1 −λ2 + 4λ− 3
0 λ− 1 2λ− 2
1 −1 λ− 2
c2+c1−−−−−−−−→
c3−(λ−2)c1
0 λ− 1 −λ2 + 4λ− 3
0 λ− 1 2λ− 2
1 0 0
r1↔r3−−−−→
1 0 0
0 λ− 1 2λ− 2
0 λ− 1 −λ2 + 4λ− 3
r3−r2−−−−→
1 0 0
0 λ− 1 2λ− 2
0 0 −λ2 + 2λ− 1
r3×(−1)−−−−−→c3−2c2
1
λ− 1
(λ− 1)2
.
所以若当标准形为
J =
1 0 0
1 1
1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 100 / 109
解: 先求 A 的若当标准形. 因
λI − A =
λ− 2 1 1
−2 λ+ 1 2
1 −1 λ− 2
r1−(λ−2)r3−−−−−−−→r2+2r3
0 λ− 1 −λ2 + 4λ− 3
0 λ− 1 2λ− 2
1 −1 λ− 2
c2+c1−−−−−−−−→
c3−(λ−2)c1
0 λ− 1 −λ2 + 4λ− 3
0 λ− 1 2λ− 2
1 0 0
r1↔r3−−−−→
1 0 0
0 λ− 1 2λ− 2
0 λ− 1 −λ2 + 4λ− 3
r3−r2−−−−→
1 0 0
0 λ− 1 2λ− 2
0 0 −λ2 + 2λ− 1
r3×(−1)−−−−−→c3−2c2
1
λ− 1
(λ− 1)2
.
所以若当标准形为
J =
1 0 0
1 1
1
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 100 / 109
设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
1 0 0
1 1
1
,
得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3].
于是有
Ap1 = p1, 即 (I − A)p1 = 0,
Ap2 = p2, 即 (I − A)p2 = 0,
Ap3 = p2 + p3, 即 (I − A)p3 = −p2.
即 p1, p2 是方程组 (I − A)x = 0 的解. 由
I − A =
−1 1 1
−2 2 2
1 −1 −1
∼
1 −1 −1
0 0 0
0 0 0
,
取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 101 / 109
设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
1 0 0
1 1
1
,
得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有
Ap1 = p1, 即 (I − A)p1 = 0,
Ap2 = p2, 即 (I − A)p2 = 0,
Ap3 = p2 + p3, 即 (I − A)p3 = −p2.
即 p1, p2 是方程组 (I − A)x = 0 的解. 由
I − A =
−1 1 1
−2 2 2
1 −1 −1
∼
1 −1 −1
0 0 0
0 0 0
,
取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 101 / 109
设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
1 0 0
1 1
1
,
得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有
Ap1 = p1, 即 (I − A)p1 = 0,
Ap2 = p2, 即 (I − A)p2 = 0,
Ap3 = p2 + p3, 即 (I − A)p3 = −p2.
即 p1, p2 是方程组 (I − A)x = 0 的解.
由
I − A =
−1 1 1
−2 2 2
1 −1 −1
∼
1 −1 −1
0 0 0
0 0 0
,
取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 101 / 109
设 P = [p1,p2,p3], 则有
A[p1,p2,p3] = [p1,p2,p3]
1 0 0
1 1
1
,
得 [Ap1,Ap2,Ap3] = [p1,p2,p2 + p3]. 于是有
Ap1 = p1, 即 (I − A)p1 = 0,
Ap2 = p2, 即 (I − A)p2 = 0,
Ap3 = p2 + p3, 即 (I − A)p3 = −p2.
即 p1, p2 是方程组 (I − A)x = 0 的解. 由
I − A =
−1 1 1
−2 2 2
1 −1 −1
∼
1 −1 −1
0 0 0
0 0 0
,
取齐次方程组 (I − A)x = 0 的基础解系为 α1 = (1, 1, 0)T, α2 = (1, 0, 1)T.黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 101 / 109
可以选取 p1 = α1.
但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数. 由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.
令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数. 由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数.
由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数. 由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数. 由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
可以选取 p1 = α1. 但是不能简单地令 p2 = α2, 因为 p2 还要保
证 (I − A)p3 = −p2 有解.令
p2 = k1α1 + k2α2 = k1
1
1
0
+ k2
1
0
1
=
k1 + k2
k1k2
,
其中 k1, k2 是不全为零的待定常数. 由
(I − A,−p2) =
−1 1 1 −k1 − k2−2 2 2 −k11 −1 −1 −k2
∼
1 −1 −1 −k20 0 0 k1 + 2k20 0 0 0
,
故要使方程组 (I − A)p3 = −p2 有解, 需满足 k1 + 2k2 = 0, 即
k1 = −2k2(= 0).
取 k1 = 2, k2 = −1, 则
p2 = 2α1 − 1α2 = (1, 2,−1)T.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 102 / 109
再求解非齐次线性方程组 (I − A)p3 = −p2, 由
[I − A, −p2
]=
−1 1 1 −1
−2 2 2 −2
1 −1 −1 1
∼
1 −1 −1 1
0 0 0 0
0 0 0 0
,
可取 p3 = (1, 0, 0)T.
故可取
P =
1 1 1
1 2 0
0 −1 0
,
使 P−1AP = J.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 103 / 109
再求解非齐次线性方程组 (I − A)p3 = −p2, 由
[I − A, −p2
]=
−1 1 1 −1
−2 2 2 −2
1 −1 −1 1
∼
1 −1 −1 1
0 0 0 0
0 0 0 0
,
可取 p3 = (1, 0, 0)T. 故可取
P =
1 1 1
1 2 0
0 −1 0
,
使 P−1AP = J.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 103 / 109
Example 4.10
设 f(z) =∞∑
m=0
( z3
)m, 求 f(A), 其中 A =
2 1
2 1
2 1
2
.
解: f(z) =(1− z
3
)−1
, 其收敛半径为 3. 注意到 A 为若当矩阵, 其特征值为 2,
故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑
m=0
(A3
)m收敛, 且
f(A) =
f(2) f′(2) 1
2!f′′(2) 1
3!f′′′(2)
f(2) f′(2) 1
2!f′′(2)
f(2) f′(2)f(2)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 104 / 109
Example 4.10
设 f(z) =∞∑
m=0
( z3
)m, 求 f(A), 其中 A =
2 1
2 1
2 1
2
.
解: f(z) =(1− z
3
)−1
, 其收敛半径为 3.
注意到 A 为若当矩阵, 其特征值为 2,
故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑
m=0
(A3
)m收敛, 且
f(A) =
f(2) f′(2) 1
2!f′′(2) 1
3!f′′′(2)
f(2) f′(2) 1
2!f′′(2)
f(2) f′(2)f(2)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 104 / 109
Example 4.10
设 f(z) =∞∑
m=0
( z3
)m, 求 f(A), 其中 A =
2 1
2 1
2 1
2
.
解: f(z) =(1− z
3
)−1
, 其收敛半径为 3. 注意到 A 为若当矩阵, 其特征值为 2,
故谱半径 ρ(A) = 2 < 3,
所以 f(A) =∞∑
m=0
(A3
)m收敛, 且
f(A) =
f(2) f′(2) 1
2!f′′(2) 1
3!f′′′(2)
f(2) f′(2) 1
2!f′′(2)
f(2) f′(2)f(2)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 104 / 109
Example 4.10
设 f(z) =∞∑
m=0
( z3
)m, 求 f(A), 其中 A =
2 1
2 1
2 1
2
.
解: f(z) =(1− z
3
)−1
, 其收敛半径为 3. 注意到 A 为若当矩阵, 其特征值为 2,
故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑
m=0
(A3
)m收敛,
且
f(A) =
f(2) f′(2) 1
2!f′′(2) 1
3!f′′′(2)
f(2) f′(2) 1
2!f′′(2)
f(2) f′(2)f(2)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 104 / 109
Example 4.10
设 f(z) =∞∑
m=0
( z3
)m, 求 f(A), 其中 A =
2 1
2 1
2 1
2
.
解: f(z) =(1− z
3
)−1
, 其收敛半径为 3. 注意到 A 为若当矩阵, 其特征值为 2,
故谱半径 ρ(A) = 2 < 3, 所以 f(A) =∞∑
m=0
(A3
)m收敛, 且
f(A) =
f(2) f′(2) 1
2!f′′(2) 1
3!f′′′(2)
f(2) f′(2) 1
2!f′′(2)
f(2) f′(2)f(2)
.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 104 / 109
因
f′(z) = 1
3
(1− z
3
)−2
, f′′(z) = 2
9
(1− z
3
)−3
, f′′′(z) = 2
9
(1− z
3
)−4
,
所以
f(2) = 3, f′(2) = 3, f′′(2) = 6, f′′′(2) = 18.
故
f(A) =
3 3 3 3
3 3 3
3 3
3
.
当然, 也可以由 f(A) =(
I − A3
)−1
得到答案.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 105 / 109
因
f′(z) = 1
3
(1− z
3
)−2
, f′′(z) = 2
9
(1− z
3
)−3
, f′′′(z) = 2
9
(1− z
3
)−4
,
所以
f(2) = 3, f′(2) = 3, f′′(2) = 6, f′′′(2) = 18.
故
f(A) =
3 3 3 3
3 3 3
3 3
3
.
当然, 也可以由 f(A) =(
I − A3
)−1
得到答案.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 105 / 109
因
f′(z) = 1
3
(1− z
3
)−2
, f′′(z) = 2
9
(1− z
3
)−3
, f′′′(z) = 2
9
(1− z
3
)−4
,
所以
f(2) = 3, f′(2) = 3, f′′(2) = 6, f′′′(2) = 18.
故
f(A) =
3 3 3 3
3 3 3
3 3
3
.
当然, 也可以由 f(A) =(
I − A3
)−1
得到答案.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 105 / 109
Definition 4.11设 A ∈ Cn×n, λ1, λ2, · · · , λs 是 A 的谱. A 的最小多项式为 m 次多项式 m(λ),
m(λ) = (λ− λ1)m1(λ− λ2)
m2 · · · (λ− λs)ms ,
其中 m1 + m2 + · · ·+ ms = m.
记
l = max{m1,m2, · · · ,ms},
设 f(λ) 是一个给定的具有 l − 1 阶导数的函数, 则我们把下列 m 个值
f(λ1), f′(λ1), · · · , f(m1−1)(λ1),
f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...
f(λs), f′(λs), · · · , f(ms−1)(λs),
(11)
称为 f(λ) 在 A 上的::谱
::值. 若这些值都为有限值, 则称函数 f(λ) 在 A 的
::谱
::上
::给
::定.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 106 / 109
Definition 4.11设 A ∈ Cn×n, λ1, λ2, · · · , λs 是 A 的谱. A 的最小多项式为 m 次多项式 m(λ),
m(λ) = (λ− λ1)m1(λ− λ2)
m2 · · · (λ− λs)ms ,
其中 m1 + m2 + · · ·+ ms = m. 记
l = max{m1,m2, · · · ,ms},
设 f(λ) 是一个给定的具有 l − 1 阶导数的函数, 则我们把下列 m 个值
f(λ1), f′(λ1), · · · , f(m1−1)(λ1),
f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...
f(λs), f′(λs), · · · , f(ms−1)(λs),
(11)
称为 f(λ) 在 A 上的::谱
::值.
若这些值都为有限值, 则称函数 f(λ) 在 A 的::谱
::上
::给
::定.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 106 / 109
Definition 4.11设 A ∈ Cn×n, λ1, λ2, · · · , λs 是 A 的谱. A 的最小多项式为 m 次多项式 m(λ),
m(λ) = (λ− λ1)m1(λ− λ2)
m2 · · · (λ− λs)ms ,
其中 m1 + m2 + · · ·+ ms = m. 记
l = max{m1,m2, · · · ,ms},
设 f(λ) 是一个给定的具有 l − 1 阶导数的函数, 则我们把下列 m 个值
f(λ1), f′(λ1), · · · , f(m1−1)(λ1),
f(λ2), f′(λ2), · · · , f(m2−1)(λ2),...
f(λs), f′(λs), · · · , f(ms−1)(λs),
(11)
称为 f(λ) 在 A 上的::谱
::值. 若这些值都为有限值, 则称函数 f(λ) 在 A 的
::谱
::上
::给
::定.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 106 / 109
我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式.
构造多项式
p(λ), 使
p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),
p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...
p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),
(12)
即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由
f(Ji) =
f(λi) f′(λi) · · · 1
(r − 1)!f(r−1)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
,
知 f(J) = p(J).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 107 / 109
我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式. 构造多项式p(λ), 使
p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),
p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...
p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),
(12)
即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由
f(Ji) =
f(λi) f′(λi) · · · 1
(r − 1)!f(r−1)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
,
知 f(J) = p(J).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 107 / 109
我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式. 构造多项式p(λ), 使
p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),
p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...
p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),
(12)
即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.
设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由
f(Ji) =
f(λi) f′(λi) · · · 1
(r − 1)!f(r−1)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
,
知 f(J) = p(J).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 107 / 109
我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式. 构造多项式p(λ), 使
p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),
p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...
p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),
(12)
即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵.
由
f(Ji) =
f(λi) f′(λi) · · · 1
(r − 1)!f(r−1)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
,
知 f(J) = p(J).
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 107 / 109
我们试图把计算一般矩阵函数 f(A), 转化为计算矩阵多项式. 构造多项式p(λ), 使
p(λ1) = f(λ1), p′(λ1) = f′(λ1), · · · , p(m1−1)(λ1) = f(m1−1)(λ1),
p(λ2) = f(λ2), p′(λ2) = f′(λ2), · · · , p(m2−1)(λ2) = f(m2−1)(λ2),...
p(λs) = f(λs), p′(λs) = f′(λs), · · · , p(ms−1)(λs) = f(ms−1)(λs),
(12)
即函数 f(λ) 与多项式 p(λ) 在 A 上的谱值相同.设 A = QJQ−1, 其中 J 是 A 的若当标准形, Q 是相似变换矩阵. 由
f(Ji) =
f(λi) f′(λi) · · · 1
(r − 1)!f(r−1)(λi)
. . . . . . ...f(λi) f′(λi)
f(λi)
,
知 f(J) = p(J).黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 107 / 109
于是
f(A) = Qf(J)Q−1
= Qp(J)Q−1 = p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1
= p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1)
= p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
于是
f(A) = Qf(J)Q−1 = Qp(J)Q−1 = p(QJQ−1) = p(A).
对于任一多项式 g(λ), 存在次数小于 m 的多项式 p(λ), 使
g(A) = p(A).
令
p(λ) = a0 + a1λ+ · · ·+ am−1λm−1,
由方程组 (12) 可以确定待定系数 a0, a1, · · · , am−1.
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 108 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
],
由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2,
故谱半径 ρ(A) =0.7 +
√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1,
从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1
=
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109
Exercise 4.12 (P. 211 习题一 9 (1))
计算级数∞∑
k=0
[0.1 0.7
0.3 0.6
]k
的和.
解: 记 A =
[0.1 0.7
0.3 0.6
], 由
|λI − A| =
[λ− 0.1 −0.7
−0.3 λ− 0.6
]= λ2 − 0.7λ− 0.15,
得特征值为 λ1,2 =0.7±
√1.09
2, 故谱半径 ρ(A) =
0.7 +√1.09
2< 1, 从而
∞∑k=0
[0.1 0.7
0.3 0.6
]k
= (I − A)−1 =
[0.9 −0.7
−0.3 0.4
]−1
=1
0.15
[0.4 0.7
0.3 0.9
].
黄正华 (武汉大学) 第5章 矩阵分析 December 29, 2014 109 / 109