inversa generalizada e inversa condicional de...

32
CAPÍTULO 5 Inversa generalizada e inversa condicional de matrices� Este capítulo consta de cuatro secciones. Las dos primeras versan sobre la definición, propiedades y cálculo de la inversa generalizada de una matriz. La tercera sección trata sobre la definición y el cálculo de inversas condicionales de una matriz. En la última sección se verán algunas aplicaciones de la inversa generalizada y de la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimos cuadrados. 5.1. Inversa generalizada de una matriz La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]). Antes de dar la definición de inversas generalizada de una matriz, veamos un par de teoremas que serán útiles en el desarrollo del resto del capítulo. 5.1. Teorema. Si A es una matriz m × n de rango r> 0entonces existen matrices invertibles Pm×m y Qn×n tales que P AQ es igual a: 1. » Ir si r<n y r<m. 2. » Ir si r = n<m. 3. ˆ Ir ˜ si r = m<n . 4. Ir si r = n = m. Demostración� Se hará aquí sólo la demostración del inciso (1). Si R es la forma escalonada reducida de A� entonces R = PA� P es un producto de matrices elementales, (véase el apartado 1.7). Las últimas m r filas de R son nulas y R tienen la estructura siguiente: 2 6 6 6 6 6 4 0 ··· 0 1 a1k ··· 0 a 1k ··· a 1k �� 0 a 1k ��� ··· 0 ··· 0 0 0 ··· 1 a 2k ··· a 2k �� 0 a 2k ��� ··· 0 ··· 0 0 0 ··· 0 0 ··· 0 1 a 3k ��� ··· . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 ··· 0 0 0 ··· 0 0 0 0 0 ··· 3 7 7 7 7 7 5 ahora bien, efectuando las operaciones elementales sobre las columnas de la matriz R se obtiene 99

Upload: others

Post on 28-May-2020

28 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

CAPÍTULO 5

Inversa generalizada e inversa condicional de matrices�

Este capítulo consta de cuatro secciones. Las dos primeras versan sobre la definición, propiedades y cálculode la inversa generalizada de una matriz. La tercera sección trata sobre la definición y el cálculo de inversascondicionales de una matriz. En la última sección se verán algunas aplicaciones de la inversa generalizada yde la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimoscuadrados.

5.1. Inversa generalizada de una matriz

La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales(véase la sección 1.5 de [4]).

Antes de dar la definición de inversas generalizada de una matriz, veamos un par de teoremas que seránútiles en el desarrollo del resto del capítulo.

5.1. Teorema. Si A es una matriz m × n de rango r > 0� entonces existen matrices invertibles Pm×m yQn×n tales que PAQ es igual a:

1.

»Ir �

� �

si r < n y r < m.

2.

»Ir�

si r = n < m.

3.ˆIr �

˜si r = m < n .

4. Ir si r = n = m.

Demostración� Se hará aquí sólo la demostración del inciso (1). Si R es la forma escalonada reducidade A� entonces R = PA� P es un producto de matrices elementales, (véase el apartado 1.7). Las últimasm− r filas de R son nulas y R tienen la estructura siguiente:

2

666664

0 · · · 0 1 a1k · · · 0 a1k� · · · a1k�� 0 a1k��� · · ·0 · · · 0 0 0 · · · 1 a2k� · · · a2k�� 0 a2k��� · · ·0 · · · 0 0 0 · · · 0 0 · · · 0 1 a3k��� · · ·...

......

......

......

......

0 · · · 0 0 0 · · · 0 0 0 0 0 · · ·

3

777775

ahora bien, efectuando las operaciones elementales sobre las columnas de la matriz R se obtiene

99

Page 2: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional

F =

»Ir �

� �

Así que F = RQ� donde Q es un producto de marices elementales (por columnas). Por lo tanto; F = RQ =PAQ, donde P y Q son matrices invertibles. �

5.2. Ejemplo. Considere la matriz

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5

claramente las dos primeras filas son linealmente independientes, y la tercera es un múltiplo escalar de laprimera fila de A. por lo tanto, el número máximo de filas linealmente independientes de A es 2; o sea, Atiene rango 2. Por el teorema anterior existen matrices invertibles P y Q tales que

PAQ =

»I2 �

� �

=

2

41 0 0 00 1 0 00 0 0 0

3

5 .

Ahora se procede a calcular las matrices invertibles P y Q siguiendo las pautas de la demostración delteorema anterior.

Paso 1: Se encuentra una matriz invertible P tal que PA = R, donde R es la forma escalonada reducidade A.

[ A | I3 ] =

2

41 2 1 3 1 0 0

−1 −2 0 −2 0 1 02 4 2 6 0 0 1

3

5

filas�

2

41 2 1 3 1 0 00 0 1 1 1 1 00 0 0 0 −2 0 1

3

5

filas�

2

41 2 0 2 0 −1 00 0 1 1 1 1 00 0 0 0 −2 0 1

3

5 = [ R | P ] .

Paso 2: Se encuentra una matriz invertible Q tal que RQ = F� donde

F =

»I2 �

� �

.

100

Page 3: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

[ R | I4 ] =

2

6664

1 2 0 2

0 0 1 1

0 0 0 0

1 0 0 00 1 0 00 0 1 00 0 0 1

3

7775

col.�

2

6664

1 0 2 2

0 1 0 1

0 0 0 0

1 0 0 00 0 1 00 1 0 00 0 0 1

3

7775

col.�

2

6664

1 0 0 0

0 1 0 1

0 0 0 0

1 0 −2 −20 0 1 00 1 0 00 0 0 1

3

7775

col.�

2

6664

1 0 0 0

0 1 0 0

0 0 0 0

1 0 −2 −20 0 1 00 1 0 −10 0 0 1

3

7775

= [ F | Q ] .

Las matrices invertibles

P =

2

40 −1 01 1 0

−2 0 1

3

5 y Q =

2

664

1 0 −2 −20 0 1 00 1 0 −10 0 0 1

3

775

son tales que:

PAQ =

»I2 �

� �

=

2

41 0 0 00 1 0 00 0 0 0

3

5 .

5.3. Teorema. Si A es una matriz m × n de rango r > 0� entonces existen matrices Bm×r y Cr×n, derango r, tales que A = B · C.

Demostración� Considere distintas posibilidades para rango de la matriz A, ρ�A) = r.

1. Si r = m� entonces A = BC, donde B = Ir y C = A.2. Si r = n� entonces A = BC, donde B = A y C = Ir.3. Si r < n y r < m� entonces por el teorema 5.1(1) existen matrices invertibles P y Q tales que:

PAQ =

»Ir �

� �

.

De aquí que:

A = P−1

»Ir �

� �

Q−1

= P−1

»Ir�

–ˆIr �

˜Q−1

= BC�

101

Page 4: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional

donde B ∈ �m×r y C ∈ �r×n son las matrices de rango r, dadas por

B = P−1

»Ir�

y C =ˆIr �

˜Q−1 .

El teorema queda entonces demostrado. �

Una forma de calcular las matrices B y C que aparecen en el teorema anterior, en el caso en que r < n yr < m� tal como aparece en la demostración, es calculando primero las matrices invertibles P y Q tales que:

PAQ =

»Ir �

� �

después calcular las matrices P−1 y Q−1, y por último obtener:

B = P−1

»Ir�

y C =ˆIr �

˜Q−1 .

Para el caso en que la matriz A no sea de rango fila completo, existe una demostración alternativa, la cualpresentamos a continuación. Como veremos, esta demostración facilitará un algoritmo más económico paracalcular matrices B y C adecuadas.

Demostración� [Otra prueba del teorema 5.3 para r < m]

Suponga que A es una matriz de rango r < m. Sea P una matriz invertible de orden m tal que PA = R,donde R es la forma escalonada reducida de A (véase apartado 1.7). Puesto que r < m, R tiene la estructurasiguiente:

R =

2

4C

3

5 �

donde C es una matriz r × n de rango r. Ahora, si escribimos P−1 particionada adecuadamente

P−1 =ˆB D

˜�

donde B es una matriz m× r de rango r. Dado que PA = R se tiene

A = P−1R

=ˆB D

˜2

4C

3

5

= BC

Ahora se presenta a continuación un método basado en esta demostración para calcular matrices B y C,de rango r� tales que A = BC.

5.4. Algoritmo. Considere una matriz A de tamaño m× n

Paso 1 Forme la matriz [ Am×n | Im] .Paso 2 Efectúe operaciones elementales en las filas de A hasta obtener su forma escalonada reducida, y en

las columnas de Im, siguiendo las siguientes pautas:i) Si se intercambian las filas i y j de A� entonces intercambie las columnas i y j de Im.ii) Si se multiplica la i-ésima fila de A por el número α �= 0, entonces se multiplica la i-ésima

columna de Im por el número α−1.

102

Page 5: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

iii) Si a la j-ésima fila de A se le suma α veces la i-ésima fila de A (α �= 0), entonces a la i-ésimacolumna de Im se le suma �−α) veces la j-ésima columna de Im.

Al final de este paso se obtiene la matriz [ R | P−1 ]

Paso 3 B =ˆPrimeras r columnas deP−1

˜,

C = [Primeras r filas deR].

5.5. Ejemplo. La matriz del ejemplo 5.2

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5

tiene rango 2. Existen por lo tanto matrices B3×2 y C2×4 de rango 2 tales que A = BC. Las matrices B yC se pueden ahora calcular siguiendo los pasos indicados anteriormente.

[ A | I3 ] =

2

41 2 1 3 1 0 0

−1 −2 0 −2 0 1 02 4 2 6 0 0 1

3

5

2

41 2 0 2 1 1 00 0 1 1 −1 0 00 0 0 0 2 2 1

3

5

= [ R | P−1 ] .

Así, tomando las primeras 2 columnas de R y las 2 primeras filas de P−1 se obtiene respectivamente lasmatrices

B =

2

41 1

−1 02 2

3

5 y C =

»1 2 0 20 0 1 1

las cuales tienen rango 2 y son tales que:

BC =

2

41 1

−1 02 2

3

1 2 0 20 0 1 1

=

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5 = A .

5.6. Definición (Inversa generalizada o pseudoinversa). Sea A una matriz m × n. Si M es una matrizn×m tal que:

1. AM es una matriz simétrica.2. MA es una matriz simétrica.3. AMA = A .4. MAM =M�

entonces se dice que M es una inversa generalizada (pseudoinversa) de A� o simplemente que M es unag-inversa de A.

5.7.Ejemplo. Verifique que la matrizM =1

11

2

43 −72 −13 4

3

5 es una g-inversa de la matrizA =

»1 1 2

−1 0 1

.

En efecto,

103

Page 6: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional

1. AM =1

11

»11 0

0 11

= I2 es una matriz simétrica.

2. MA =1

11

2

410 3 −13 2 3

−1 3 10

3

5 es una matriz simétrica.

3. AMA = I2A = A .

4. MAM =MI2 =1

11

2

43 −72 −13 4

3

5 .

5.8. Observación.

1. Si A es invertible, entonces la matriz A−1 es una g-inversa de A.2. Si A = �m×n� entonces la matriz M = �n×m es una g-inversa de A.

5.9. Teorema (Existencia de una g-inversa). Toda matriz A de tamaño m × n tiene una inversa genera-lizada.

Demostración� De acuerdo con la observación 5.8(2), la demostración es trivial en el caso en queA = �. Suponga ahora que que A �= � tiene rango r > 0. Por el teorema 5.3, existen matrices B de tamañom× r y C de tamaño r × n, ambas de rango r tales que A = BC.

Puesto queB y C tiene rango r, las matricesBTB y CCT son invertibles (véase el teorema 1.56). Finalmente,se considera la matriz

M = CT`CCT

´−1`BTB

´−1BT .

El resultado quedará comprobado, se se verifica que M es una g-inversa de A. Es decir, si se verifica que sesatisfacen las condiciones de la definición 5.6. En efecto:

Las matrices AM y MA son simétricas puesto que

AM = BCCT`CCT

´−1`BTB

´−1BT = B

`BTB

´−1BT

y

MA = CT`CCT

´−1`BTB

´−1BTBC = CT

`CCT

´−1C

De otro lado, AMA = B`BTB

´−1BTBC = BC = A� y

MAM = CT`CCT

´−1CCT

`CCT

´−1`BTB

´−1BT

= CT`CCT

´−1`BTB

´−1BT =M.

Es decir, AMA = A y MAM = A, por lo tanto, M es una g-inversa de A. �

5.10. Teorema. [Unicidad de la g-inversa]Toda matriz A tiene una única g-inversa.

Demostración� Supongamos queM1 yM2 son dos g-inversas de una matriz A. Utilizando la definiciónde g-inversa de una matriz se obtiene la cadena siguiente de igualdades:

AM2 = �AM1A)M2 = �AM1)�AM2) = �AM1)T �AM2)

T

= ��AM2)�AM1))T = ��AM2A)M1)

T = �AM1)T = AM1 .

De aquí que AM2 = AM1. En forma análoga se obtiene que M2A =M1A. Por lo tanto

M1 = M1AM1 = �M1A)M1 = �M2A)M1 =M2�AM1)

= M2�AM2) =M2AM2 =M2 .

104

Page 7: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.11. Nota. En lo sucesivo, la g-inversa de una matriz la se denotará con el nombre de la matriz y con elsigno + como exponente. Por ejemplo, por A+� B+ denotarán respectivamente las inversas generalizadasde las matrices A y B.

5.12. Teorema (Propiedades de la g-inversa). Para cualquier matriz A tiene que:

a) �A+)+ = A.b) �αA)+ = α−1A+� para todo escalar α �= 0.c) �AT )+ = �A+)T

d) �AAT )+ = �AT )+A+

e) �ATA)+ = A+�AT )+

Demostración� Por el teorema anterior, toda matriz tiene una única g-inversa. Sólo resta verificaren cada caso, que se satisfacen las condiciones de la definición 5.6. Para ello se hará la demostración sólopara el inciso (e) suponiendo, que las afirmaciones (a)-(d) son válidas (las verificaciones quedan a cargo dellector) y se aplicarán las propiedades de la definición 5.6:

1. Inicialmente se verifica que la matriz`ATA

´ `A+�AT )+

´es simétrica, para ello se muestra que

para la matriz M = A+�AT )+ se satisface la igualdad`ATA

´M = A+A. En efecto:

“ATA

”M =

“ATA

” “A+�AT )+

�c)= AT �AA+)�A+)T

def.= AT �AA+)T �A+)T

=`A+AA+A+´T

def.=

`A+A

´T= A+A .

2. Ahora se verifica que la matriz`A+�AT )+

´ `ATA

´es simétrica, para ello muestra como antes, de

que la matriz M = A+�AT )+ satisface la igualdad M`ATA

´= A+A. En efecto:

M“ATA

”=

“A+�AT )+

” “ATA

�c)= A+�A+)TATA

def.= A+�AA+)TA

def.= A+AA+A

def.= A+A.

3. La matriz M = A+�AT )+ satisface la igualdad �ATA)M�ATA) = ATA.

�ATA)M�ATA) =“ATA

” “A+�AT )+

” “ATA

�1)=

`A+A

´ “ATA

”= �A+A)TATA

=`A�A+A)

´TAdef.=

`AA+A

´TA = ATA.

105

Page 8: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional

4. La matriz M = A+�AT )+ satisface la igualdad M�ATA)M =M. En efecto

M�ATA)M =M =“A+�AT )+

” “ATA

” “A+�AT )+

�2)=

`A+A

´ “A+�AT )+

=`A+AA+´ “

AT”+

def.= A+�AT )+.

5.13. Observación. No siempre es cierto que �AB)+ = B+A+. Para mostrar este hecho basta considerarun ejemplo (ver ejemplo siguiente).

5.14. Ejemplo. Si A =ˆ

1 1˜y B =

»12

� entonces AB = [3]. Por lo tanto �AB)+ = 1/3. De acuerdo

con el corolario 5.16, A+ = 12

»11

y B+ = 15

ˆ1 2

˜, de donde se tiene que

B+A+ =1

5

ˆ1 2

˜ 1

2

»11

=1

10[3] = [3/10] �= [3] = �AB)+.

5�1 Ejercicios

En los ejercicios 1 al 9, responda verdadero o falso justificando su respuesta.

1. Si las matrices B ∈ �m×r y C ∈ �r×m tienen el mismo rango, entonces �BC)+ = C+B+.2. Si S es una matriz simétrica, entonces S+ es una matriz simétrica.3. Si S es una matriz simétrica tal que S2 = S� entonces S+ = S.4. Si S es una matriz simétrica tal que S3 = S� entonces S+ = S.5. Para toda matriz A se tiene que A+ = �ATA)+AT .6. Para toda matriz A se tiene que A+ = AT �AAT )+.7. Para toda matriz A se tiene que �AA+)2 = AA+ y �A+A)2 = A+A.8. Si A ∈ �m×n tiene rango m� entonces el sistema de ecuaciones lineales Ax = y tiene solución para

cualquier y ∈ �m×1.9. Si A ∈ �m×n tiene rango n y si el sistema de ecuaciones lineales Ax = y tiene solución, entonces

el sistema tiene solución única.

En los ejercicios 10 al 21 demuestre la afirmación correspondiente

10. Si BCT = �, entonces BC+ = � y CB+ = �.

11. Si A =

»BC

y BCT = � entonces A+ =ˆB+ C+

˜.

12. SiB es una matriz simétricam×m y si CTB = �� donde CT es la matriz CT =ˆ

1 1 · · · 1˜1×m

entonces la g-inversa de la matriz:

A =

»BCT

es A+ =ˆB+ 1/mC

˜.

106

Page 9: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.2. Cálculo de la g-inversa

13. Si D = [dij ]n×n es una matriz diagonal, entonces D+ =[aij ]n×n es una matriz diagonal, donde

aij =

(1/dii , si dii �= 0

0 � si dii = 0.

14. Si A =

»B �

� C

entonces A+ =

»B+ �

� C+

.

15. Si S es una matriz simétrica, entonces SS+ = S+S.16. Si A es una matriz tal que ATA = AAT � entonces A+A = AA+.17. Si A es una matriz m × n, donde �A�ij = 1 para i = 1� 2� . . . �m y j = 1� 2� . . . � n� entonces

A+ =1

mnA.

18. Si P ∈ �n×n y Q ∈ �m×m son matices ortogonales, entonces para cualquier matriz m× n� A, setiene que �PAQ)+ = QTA+PT .

19. Si S es una matriz simétrica no negativa, entonces S+ es una matriz no negativa.20. Para cada matriz m× n� A; AB = AA+ sii B es tal que ABA = A y AB es simétrica.21. Si B es una c-inversa de A� entonces la matriz BAB también lo es.

5.2. Cálculo de la g-inversa de una matriz

En esta sección se verán algunos teoremas que pueden usarse para calcular la g-inversa de una matriz.Empezamos con el siguiente resultado, el cual se deduce de los teoremas 5.3, 5.9 y 5.10.

5.15. Teorema. Sea A una matriz m× n de rango r > 0.

1. Si r = n = m, entonces A es invertible y A+ = A−1.

2. Si r = m < n, entonces A+ = AT`AAT

´−1.

3. Si r = n < m, entonces A+ =`ATA

´−1AT .

4. Si r < n y r < m, entonces existen matrices B ∈ �m×r y C ∈ �r×n de rango r tales que A = B ·Cy

A+ = CT`CCT

´−1`BTB

´−1BT .

5.16. Corolario. Sea a un vector no nulo de n componentes.

1. Si a ∈ �1×n� entonces a+ =`aaT

´−1

aT .

2. Si a ∈ �n×1� entonces a+ =`aT a

´−1

aT .

5.17. Ejemplo. Ilustre el teorema 5.15 con alguna matrices sencillas.

1. La matriz A =

»1 21 3

es invertible, así que A+ = A−1 =

»3 −2

−1 1

.

2. La matriz A =

»1 2 3

−1 −1 1

tiene rango 2, así que:

A+ = AT`AAT

´−1

=

2

41 −12 −13 1

3

5 1

42

»3 00 14

=1

42

2

43 −146 −149 14

3

5

107

Page 10: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional

3. La matriz A =

2

41 23 45 6

3

5 tiene rango 2, así que:

A+ =`ATA

´−1AT =

1

24

»56 −44

−44 35

– »1 3 52 4 6

=1

24

»−32 −8 16

26 8 −10

4. La matriz A dada por

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5

Del ejemplo 5.5 se sabe ρ�A) = 2 y que las matrices

B =

2

41 1

−1 02 2

3

5 y C =

»1 2 0 20 0 1 1

son tales que A = BC. Luego

A+ = CT`CCT

´−1`BTB

´−1BT .

=1

24

2

664

−2 −20 −4−4 −40 −8

9 55 185 15 10

3

775

5. Para la matriz A =ˆ

1 2 3˜�= � se tiene que:

a+ =

“aa

T”−1

aT =

1

14

2

4123

3

5

6. La matriz A =

2

4111

3

5 �= � se tiene que,

a+ =

“a

Ta

”−1

aT =

1

3

ˆ1 1 1

˜.

5.18. Teorema. Sea A ∈ �m×n una matriz de rango r > 0. Entonces la g-inversa de A se puede calcularsiguiendo los pasos dados a continuación:

1. Calcule M = ATA.2. Haga C1 = I.

3. Calcule Ci+1 =1

iTr�CiM)I − CiM� para i = 1� 2� . . . � r − 1.

4. Calculer

Tr �CrM)CrA

T � ésta es la matriz A+.

Además, se tiene que Cr+1M = � y Tr �CrM) �= 0.

Para la demostración de este teorema, remitimos al lector a [3] (teorema 6.5.8). Obsérvese además, que lacondición Cr+1M = � permite proceder sin conocer de antemano el rango de A.

108

Page 11: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.2. Cálculo de la g-inversa

5.19. Ejemplo. Considere la matriz

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5

del ejemplo 5.17(4). Calcule A+ utilizando el teorema anterior.

Para ello se puede calcualar M = AtA. Esto es,

M =

2

664

6 12 5 1712 24 10 345 10 5 15

17 34 15 49

3

775

y considere C1 = I4. Entonces se tiene que:

C2 = Tr �C1M) I − C1M =

2

664

78 −12 −5 −17−12 60 −10 −34−5 −10 79 −15−17 −34 −15 35

3

775 .

Como C3M = �� entonces ρ�A) = 2� y además

A+ =2

Tr �C2M)C2A

T =2

140

2

664

−2 −20 −4−4 −40 −8

9 55 185 15 10

3

775

El siguiente teorema presenta una forma alternativa para calcular la g-inversa de una matriz. Para sudemostración, remitimos a [9] (véase páginas. 14-15).

5.20. Teorema. Sea A ∈ �m×n una matriz de rango r > 0. La g-inversa de A se puede calcular mediantelos siguientes pasos:

1. Forme la matriz [ A | Im ].2. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalon-ada reducida de A. Al final de este paso se obtiene una matriz que descrita por bloques queda así:

»Er×n Pr×m

��m−r)×n P�m−r)×m

si r < m

óˆEm×n | Pm×m

˜si r = m.

(Si r = m = n� A es invertible, E = I y P = A−1 = A+).3. Forme la matriz: »

Er×nAT Er×n

P�m−r)×m ��m−r)×n

si r < m

óˆEm×nA

T | Em×n

˜si r = m.

4. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalon-ada reducida. Al final de este paso se obtiene la matriz

hIm |

`A+

´Ti.

109

Page 12: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional

5.21. Ejemplo. Considere de nuevo la matriz A del ejemplo 5.19

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5 .

Con el objeto de calcular A+ utilizando el teorema anterior, se forma la matrizˆA | I3

˜y se aplican

operaciones elementales en las filas hasta encontrar la forma escalonada reducida de A.

[ A | I3 ] =

2

41 2 1 3 1 0 0

−1 −2 0 −2 0 1 02 4 2 6 0 0 1

3

5

2

41 2 0 2 0 −1 00 0 1 1 1 1 0

0 0 0 0 −2 0 1

3

5

=

»E2×4 P2×3

�1×4 P1×3

.

Se construye ahora la matriz de la forma»E2×4A

T E2×4

P1×3 �1×4

y se aplican de nuevo operaciones elementales en las filas, hasta obtener la matriz identidad I3 en el ladoizquierdo de este arreglo

2

4E2×4A

T E2×4

P1×3 �1×4

3

5 =

2

411 −9 22 1 2 0 24 −2 8 0 0 1 1

−2 0 1 0 0 0 0

3

5

2

66666664

1 0 0 −1

35−

2

35

9

70

1

14

0 1 0 −2

7−

4

7

11

14

3

14

0 0 1 −2

35−

4

35

9

35

1

7

3

77777775

=hI3 | �A+)T

i.

Así que

A+ =

2

66666666666664

−1

35−

2

7−

2

35

−2

35−

4

7−

4

35

9

70

11

14

9

35

2

35

3

14

1

7

3

77777777777775

=1

70

2

664

−2 −20 −4−4 −40 −8

9 55 185 15 10

3

775

110

Page 13: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.2. Cálculo de la g-inversa

5.22. Ejemplo. Considere la matriz A del ejemplo 5.17(2)

A =

»1 2 3

−1 −1 1

y siga los pasos del ejemplo anterior (teorema 5.20) para calcular A+.

[ A | I2 ] =

»1 2 3 1 0

−1 −1 1 0 1

»1 0 −5 −1 −20 1 4 1 1

=ˆE2×4 P2×3

˜.

Se construye ahora la matrizˆE2×3A

T | E2×3

˜y se reduce para obtener

ˆE2×3A

T E2×3

˜=

2

4−14 −6 1 0 −5

14 3 0 1 4

3

5

2

664

1 01

14

2

14

3

14

0 1 −1

3−

1

3

1

3

3

775

=hI2 | �A+)T

i.

Así que

A+ =

2

66666664

1

14−

1

3

2

14−

1

3

3

14

1

3

3

77777775

=1

42

2

66664

3 −14

6 −14

9 14

3

77775

5�2 Ejercicios

1. Para cualquier matriz A se tiene que: ρ�A) = ρ�A+) = ρ�AA+)= ρ�A+A).2. Calcule la g-inversa de cada una de las matrices siguientes:

�i) A1 =ˆ

0 0 0˜

�ii) A2 =

»1 23 5

�iii) A1 =ˆ

1 2 3˜

�iv) A4 =

2

4112

3

5

111

Page 14: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.3. C-inversa Inversa generalizada e inversa condicional

�v) A5 =

2

47 7 77 7 77 7 7

3

5 �vi) A6 =

2

41 0 00 5 00 0 0

3

5

�vii) A7 =

2

664

1 23 40 00 0

3

775 �viii) A8 =

2

664

1 2 0 01 2 0 00 0 3 30 0 3 3

3

775

�ix) A9 =

2

66664

2 −1 −1−3 1 2

1 1 11 1 11 1 1

3

77775

5.3. Inversa condicional de una matriz

Al igual que el concepto de inversa generalizada de una matriz, el concepto de inversa condicional es de granutilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]) y en la caracterización del conjuntosolución de sistemas lineales de ecuaciones.

5.23. Definición. Sea A una matriz m× n. Si M es una matriz n×m tal que:

AMA = A�

entonces se dice que M es una inversa condicional de A o simplemente, que M es una c-inversa de A.

5.24. Observación. De acuerdo con el teorema 5.10, toda matriz A tiene una única inversa generalizadaA+. ésta es a su vez por definición una c-inversa de A. Así que, toda matriz A tiene al menos una c-inversa.Se verá aquí, que una matriz A puede tener varias (incluso infinitas) inversas condicionales, salvo cuandola matriz A es invertible, en cuyo caso A−1 es la única c-inversa.

Nota. El teorema 5.27 dará una caracterización del conjunto de todas las inversas condicionales de A(c-inversas de A).

5.25. Teorema. Sea A ∈ �m×n una matriz de rango r. Entonces:

1. W = {N ∈ �n×m : ANA = �} es un subespacio de �n×m.2. La dimensión del espacio W mencionado en (1) es m · n− r2.

Demostración� Para demostrar el inciso (1) basta demostrar, según el teorema 1.15, que el conjuntoW es cerrado bajo la suma y la multiplicación por un escalar. En efecto,

Sean N1 y N2 dos elementos (matrices) del conjunto W, entonces

A�N1 +N2)A = AN1A+AN2A = � + � = ��

esto implica que N1 +N2 ∈ W. ésto es, W es cerrado bajo la suma.

De otro lado, para cualquier escalar α ∈ R se tiene que

A�αN1)A = αAN1A = α� = ��

ésto implica que, αN1 ∈ W. Es decir, W es cerrado bajo la multiplicación por un escalar. El conjunto W esentonces un subespacio vectorial de �n×m, lo que completa la demostración del inciso (1).

112

Page 15: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.3. C-inversa

Hagamos ahora la demostración del inciso (2) en el caso en la matriz A ∈ �m×n tenga rango r con0 < r < mın {m� n}. Las demostraciones en los demás casos son similares.

Sea entonces A una matriz m × n de rango r� con 0 < r < mın {m� n}. De acuerdo con el inciso (1) delteorema 5.1, existen matrices invertibles P ∈ �m×m y Q ∈ �n×n tales que:

(5.1) PAQ =

»Ir �

� �

o A = P−1

»Ir �

� �

Q−1.

Considere ahora matrices arbitrarias X ∈ �r×r� Y ∈ �r×�m−r)� Z ∈ ��n−r)×r y W ∈ ��n−r)×�m−r) y lamatriz N ∈ �n×m dada por

N = Q

»X YZ W

P.

Ahora N ∈ W sii ANA = �. De (5.1) se sigue que

ANA = P−1

»Ir �

� �

Q−1Q

»X YZ W

P P−1

»Ir �

� �

Q−1

= P−1

»X �

� �

Q−1.

De aquí se deduce ANA = � sii X = �. Esto es, N ∈ W sii N es de la forma:

N = Q

»� YZ W

P.

Ahora se demuestra que la dimensión de W es m · n− r2. Para ello, se hace uso del hecho que el espacio dematrices �k×j tiene dimensión k · j. En efecto, considere los espacios �r×�m−r)� ��n−r)×r y ��n−r)×�m−r)

con las bases respectivas �1��2��3, siendo �1 = {Y1� Y2� . . . � Yr·�m−r)}, �1 = {Z1� Z2� . . . � Zr·�n−r)} y�3 = {W1� W2� . . . �W�n−r)·�m−r)}. Es fácil mostrar entonces que el conjunto � = {N� N2� . . . � Nm·n−r·r}con

Ni = Q

»� Yi

� �

P ; i = 1� 2� . . . �m · r − r2

Nr�m−r)+j = Q

»� �

Zj �

P ; j = 1� 2� . . . � n · r − r2

Nr�m+n−2r)+k = Q

»� �

� Wk

P ; k = 1� 2� . . . � �n− r) · �m− r)�

es una base de W. �

5.26. Teorema. Sea A una matriz m× n. El conjunto McA de todas las c-inversas,

McA = {M ∈ �n×m : AMA = A} �

es una variedad lineal de dimensión m · n− r2.

Demostración� Por el teorema 5.16McA es no vacío, sea entoncesM0 un elemento deMc

A. Se verificaentonces, que M ∈ Mc

A si y sólo si M se puede escribir como la suma de M0 y un elemento N ∈ W. Estoes, si y sólo si M =M0 +N para algún N ∈ W, siendo W el conjunto dado en el teorema 5.25.

Si M = M0 +N� con N ∈ W, entonces AMA = AM0A+ ANA = A+ � = A. Esto es, M ∈ McA. De otra

parte, si M ∈McA� entonces se puede escribir

M = M +M0 −M0

= M0 + �M −M0) =M0 +N �

113

Page 16: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.3. C-inversa Inversa generalizada e inversa condicional

donde N =M −M0. Puesto que

A�M −M0)A = AMA−AM0A = A−A = � �

se tiene entonces que N =M −M0 ∈ W y de aquí se sigue que:

McA = {M +N� N ∈ W} .

El teorema siguiente establece cómo determinar los elementos de McA.

5.27. Teorema. Sea A una matriz m × n de rango r. Sean P ∈ �m×m y Q ∈ �n×n matrices invertiblescomo en el teorema 5.1.

1. Si A = �, entonces McA = �n×m.

2. Si r = n = m, entonces McA =

˘A+

¯=

˘A−1

¯.

3. Si r = m < n, entonces

McA =

Q

»IrY

P : Y ∈ ��n−r)×m

ff

.

4. Si r = n < m, entonces

McA =

˘Q

ˆIr X

˜P : X ∈ �n×�m−r)

¯.

5. Si 0 < r < n y 0 < r < m� entonces el conjunto McA está dado por

McA =

Q

»Ir XY Z

P : Z ∈ ��n−r)×�m−r)�

Y ∈ ��n−r)×m� X ∈ �n×�m−r)

ff

Demostración� De acuerdo con los teoremas 5.25 y 5.26, se tiene que en cada casoMcA es una variedad

lineal de dimensión mn− r2. De otro lado, se puede verificar que si M ∈McA, entonces AMA = A. �

5.28. Ejemplo. Sea

A =

2

41 2 1 3

−1 −2 0 −22 4 2 6

3

5 �

la matriz del ejemplo 5.2. De dicho ejemplo se sabe que las matrices invertibles

P =

2

40 −1 01 1 0

−2 0 1

3

5 y Q =

2

664

1 0 −2 −20 0 1 00 1 0 −10 0 0 1

3

775

son tales que PAQ =

»I2 �

� �

� ρ�A) = r = 2. En este caso,

McA =

Q

»I2 XY Z

P : X ∈ �2×1� Y ∈ �2×2� Z ∈ �2×1

ff

114

Page 17: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.3. C-inversa

representará, el conjunto de todas las inversas condicionales de A� En particular, si tomamos X = �� Y = �

y Z = �� se tiene que una c-inversa de A es:

M0 = Q

»I2 00 0

P =

2

664

0 −1 00 0 01 1 00 0 0

3

775 .

En lo que resta de esta sección se abordará un método alternativo para calcular una c-inversa de una matriz.Considere inicialmente el caso de matrices cuadradas. �

5.29. Definición. Una matriz cuadrada H = [hij ]n×n tiene la forma Hermite superior, si satisface lascondiciones siguientes:

1. H es triangular superior.2. h2

ii = hii; esto es, hii = 0 ó hii = 1� i = 1� 2� . . . � n.3. Si hii = 0, entonces la i-ésima fila es nula, esto es, Hi = �.4. Si hii = 1, entonces el resto de los elementos de la i-ésima columna son nulos; es decir, Hi = Ii

es la i-ésima columna de la matriz idéntica.

5.30. Ejemplo. La matriz

H =

2

664

1 2 0 00 0 0 00 0 1 00 0 0 1

3

775

tiene la forma Hermite superior. �

El siguiente teorema establece que una matriz Hermite superior es idempotente. La demostración de dichoresultado es consecuencia directa de la definición y se deja como un ejercicio para el lector.

5.31. Teorema. Si H es una matriz que tiene la forma Hermite superior, entonces H2 = H.

Demostración� Si A�B ∈ �n×m son matrices triangulares superiores, entonces AB es triangularsuperior y �AB�ii = �A�ii�B�ii (ver ejercicio 2 de la sección 2.1). De esto se sigue que:

1. H2 es triangular superior.2. �H2�ii = �H�ii�H�ii = h2

ii = hii.

De otra parte,

3 Si hii = 0, entonces Hi = � y H2i = HiH = �.

4 Si hii = 1, entonces Hi = Ii y �H2)i = HHi = HIi = Hi = Ii.

5.32. Teorema. Para toda matriz cuadrada A existe una matriz invertible B tal que BA = H tiene laforma Hermite superior.

115

Page 18: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.3. C-inversa Inversa generalizada e inversa condicional

Demostración� Sea P una matriz invertible tal que PA = R es la forma escalonada reducida de A.Si R tiene la forma Hermite superior, entonces la matriz B = P satisface la condición de que BA = R = H.Si R no tiene la forma Hermite superior, intercambiamos las filas de R hasta que el primer elemento no nulo(de izquierda a derecha) de cada fila no nula de R, sea un elemento de la diagonal. Así se tiene una matrizH que tiene la forma Hermite superior. Así que existen matrices elementales (por filas) E1� E2� . . . � Ek talesque

E1E2 · · ·EkR = H

o sea:

E1E2 · · ·EkPA = H.

En consecuencia, la matriz invertible B = E1E2 · · ·EkP es tal que BA = H tiene la forma Hermite superior.�

5.33. Ejemplo. Para la matriz cuadrada:

A =

2

41 2 31 2 52 4 10

3

5 �

la matriz invertible

P =

2

45/2 −3/2 0

−1/2 1/2 00 −2 1

3

5

es tal que

PA = R =

2

41 2 00 0 10 0 0

3

5 �

donde R es la forma escalonada resucida de A. Intercambiando las filas 2 y 3 de R se obtiene la matriz:

H =

2

41 2 00 0 00 0 1

3

5 �

la cual tiene la forma Hermite superior. Además,

B =

2

45/2 −3/2 0

0 −2 1−1/2 1/2 0

3

5

es invertible y es tal que BA = H . �

5.34. Teorema. Sea A una matriz cuadrada. Si B es una matriz invertible tal que BA = H tiene la formaHermite superior, entonces B es una c-inversa de A.

Demostración� Como H tiene la forma Hermite superior, por el teorema 5.31, H2 = H. Así queBABA = H2 = H = BA� o sea:

BABA = BA.

Premultiplicando los dos miembros de la última igualdad por la matriz B−1 se obtiene:

ABA = A�

esto es, B es una c-inversa de A. �

116

Page 19: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.3. C-inversa

5.35. Ejemplo. Considere la matriz A del ejemplo 5.33,

A =

2

41 2 31 2 52 4 10

3

5 .

Se sabe de dicho ejemplo, que la matriz invertible

B =

2

45/2 −3/2 0

0 −2 1−1/2 1/2 0

3

5 �

es tal que BA = H tiene la forma Hermite superior. Por lo tanto, por teorema anterior, B es una c-inversade A. �

El siguiente corolario presenta una forma de calcular una c-inversa para el caso de matrices rectangulares.

5.36. Corolario. Sea A una matriz m× n

1. Si m > n, sea A∗ =ˆA �

˜, donde � es la matriz nula m×�m−n). Sea además B∗ una matriz

invertible tal que B∗A∗ = H tiene la forma Hermite superior. Si escribimos la matriz B∗ entoncesparticionada así:

B∗ =

2

4B

B1

3

5 �

donde B es una matriz n×m, entonces B es una c-inversa de A.

2. Si n > m, sea A∗ =

»A�

, donde � es la matriz nula �n −m) ×m. Sea además B∗ una matriz

invertible tal que B∗A∗ = H tiene la forma Hermite superior. Si escribimos la matriz B∗ entoncesparticionada así:

B∗ =ˆB B1

˜�

donde B es una matriz n×m, entonces B es una c-inversa de A.

Demostración� Se presenta aquí sólo la demostración del inciso (1). Para ello suponga que A es unamatriz m× n, con m > n y considere la matriz cuadrada A∗ =

ˆA �

˜n×n

.

Según el teorema 5.32, existe una matriz invertible B∗� tal que B∗A∗ = H tiene la forma Hermite superior.Dicha matriz B∗ es una c-inversa de A∗ (teorema 5.32), así que, A∗B∗A∗ = A∗� o sea:

A∗B∗A∗ =ˆA �

˜2

4B

B1

3

5ˆA �

˜

=ˆABA �

˜=

ˆA �

˜= A∗.

De esto se sigue que ABA = A. Es decir, B es una c-inversa de A. �

5.37. Ejemplo. Encontre una c-inversa para la matriz:

A =

2

41 −12 −10 1

3

5

3×2

.

Sea A∗ =

2

41 −1 02 −1 00 1 0

3

5

3×3

.

117

Page 20: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.3. C-inversa Inversa generalizada e inversa condicional

Efectuando los cálculos pertinentes se encuentra que la matriz invertible:

B∗ =

2

4−1 1 0−2 1 0

2 −1 1

3

5 =

2

4B

B1

3

5

es tal que B∗A∗ = H tiene la forma Hermite superior. Por lo tanto, por el corolario anterior, la matriz

B =

»−1 1 0−2 1 0

2×3

es una c-inversa de A. �

5�3 Ejercicios

En los ejercicios 1 al 3, responda verdadero o falso justificando su respuesta.

1. Para toda c-inversa Ac de A se tiene que �AAc)2 = AAc y �AcA)2 = AcA.2. Si Ac es una c-inversa de A, entonces A es una c-inversa de Ac.3. Si Ac es una c-inversa de A, entonces �Ac)T es una c-inversa de AT .

En los ejercicios 4 al 9 haga la demostración correspondiente

4. Si Ac es una c-inversa de A, entonces ρ�Ac) ≥ ρ�A) = ρ�AAc) = ρ�AcA).5. Si Ac es una c-inversa de A, entonces Tr�AAc) = Tr�AcA) = ρ�A). (sugerencia véase el ejercicio 7

de la sección de ejercicios 3.2).6. Sea A una matriz m× n. Entonces ρ�A) = m sii AA+ = I sii AAc = I para cada c-inversa Ac deA.

7. Sea A una matriz m× n. Entonces ρ�A) = n sii A+A = I sii AcA = I para cada c-inversa Ac deA.

8. Si B es una c-inversa de A� entonces también lo es BAB.9. Si Bc y Cc son c-inversas de las matrices B y C respectivamente, entonces una c-inversa de la

matriz

A =

»B �

� C

es Ac =

»Bc �

� Cc

.

10. Para la matriz A =

2

41 2 32 5 31 3 0

3

5 � dé dos c-inversa Ac1 y Ac

2 tales que ρ�Ac1) > ρ�A) y ρ�Ac

2) =

ρ�A).11. Determine el conjunto de todas las c-inversas de las matrices

A1 =

»1 11 1

� A2 =

»1 2 31 3 3

A3 =

2

41 21 32 5

3

5 � A4 =

»1 21 3

.

118

Page 21: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

5.4. Sistemas de ecuaciones lineales: g-inversa y c-inversa de una matriz. mínimos

cuadrados.

En esta sección se verán algunas aplicaciones de la g-inversa y la c-inversa de una matriz a los sistemas deecuaciones lineales y al problema de los mínimos cuadrados.

5.38. Teorema. Sea A ∈ �m×n una matriz y sea y ∈ �m×1 un vector. El sistema de ecuaciones linealesAx = y es consistente sii AAcy = y para cada c-inversa Ac de A.

Demostración� Suponga que el sistema de ecuaciones lineales Ax = y es consistente. ésto quieredecir, que existe al menos un x0 tal que:

Ax0 = y .

Sea ahora Ac una c-inversa de A� entonces:

AAcy = AAcAx0

= Ax0

= y .

Suponga ahora, que para cada c-inversa Ac de A, se tiene que AAcy = y. Entonces para cada c-inversa Ac,el vector x0 = Acy es una solución del sistema de ecuaciones lineales Ax = y. Por lo tanto, el sistema esconsistente. �

5.39. Teorema. Sea A una matriz m×n y sea Ac una c-inversa de A. Si el sistema de ecuaciones linealesAx = y es consistente, entonces su solución general es

(5.1) x = Acy + �I −AcA)h� h ∈ �n×1 .

Demostración� Puesto que por hipótesis el sistema de ecuaciones lineales Ax = y es consistente,entonces por el teorema anterior, AAcy = y. En consecuencia, para cada x de la forma (5.1):

Ax = AAcy +A�I −AcA)h

= y + �A−A)h

= y + �h

= y�

esto es, x es una solución del sistema dado.

De otro lado, si x0 es solución del sistema dado, entonces

Ax0 = y .

Premultiplicando los miembros de la última igualdad por Ac se obtiene

AcAx0 = Acy �

de donde:� = Ac

y −AcAx0.

Sumando x0 a los dos lados de la última igualdad se llega a:

x0 = Acy + x0 −A

cAx0

= Acy + �I −AcA)x0

= Acy + �I −AcA)h�

donde h = x0. Esto es, x0 se puede expresar en la forma 5.1. �

Puesto que A+ es una c-inversa de A� se tiene el siguiente corolario.

119

Page 22: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

5.40. Corolario. Sea A una matriz m × n. Si el sistema de ecuaciones lineales Ax = y es consistente,entones su solución general es

(5.2) x = A+y + �I −A+A)h� h ∈ �n×1 .

Problema de los Mínimos Cuadrados

Como se estableció en el teorema 1.51(3), para un sistema de ecuaciones Ax = y se presenta una y sólouna de las opciones siguientes:

(i) El sistema tiene infinitas soluciones.(ii) El sistema tiene solución única.(iii) El sistema no tiene solución.

En el trabajo experimental generalmente se da generalmente la opción (iii), es decir, que el vector y no es unelemento del espacio columna de la matriz A, (y /∈ C�A)) (véase figura 5.1). En este caso se puede preguntar,si existe una solución aproximada del sistema, para una definición conveniente de solución aproximada. Unproblema que se presenta con frecuencia en el trabajo experimental es:

y

A  x

A  x

IR

(A) �0 .  xA  0

m

Figura 5�1� Problema de los mínimos cuadrados

Dado una serie de puntos

�x1� y1); �x2� y2); . . . ; �xn� yn).

obtener una relación y = f�x) entre las dos variables x y y� “adaptando” (en algún sentido) una curva adicho conjunto de puntos.

Como los datos se obtienen experimentalmente, generalmente existe un �error� en ellos (errores de aproxi-mación), lo que hace prácticamente imposible encontrar una curva de la forma deseada que pase por todoslos puntos. Por medio de consideraciones teóricas o simplemente por �acomodo� de los puntos, se decide laforma general de la curva y = f�x) que mejor se adapte. Algunas posibilidades son (ver figura 5.2):

1. Funciones lineales (rectas): y = f�x) = a+ bx; a� b ∈ R

2. Polinomios de grado dos: y = f�x) = a+ bx+ cx2; a� b� c ∈ R.3. Polinomios de grado tres: y = f�x) = a+ bx+ cx2 + dx3; a� b� c� d ∈ R.

A. Adaptación de puntos a una línea recta

Considere los puntos �x1� y1); �x2� y2); . . . ; �xn� yn)� los cuales se pretende ajustar mediante la gráfica de lalínea recta y = f�x) = a+ bx. Si los puntos correspondientes a los datos fuesen colineales, la recta pasaría

120

Page 23: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

x

yy y

xx

(1) Aproximacion lineal ´´(2) Aproximacion cuadratica´´ (3) Aproximacion cubica´

Figura 5�2� Ajuste por mínimos cuadrados

por todos los n puntos y, en consecuencia, los coeficientes desconocidos a y b satisfarían la ecuación de larecta. Esto es, se tendrían las siguientes igualdades:

y1 = a+ bx1

y2 = a+ bx2

......

...

yn = a+ bxn .

Estas igualdades se pueden escribir, utilizando notación matricial, así:

(5.3) y =

2

6664

y1y2...yn

3

7775

=

2

6664

1 x1

1 x2

......

1 xn

3

7775

2

4a

b

3

5 = Ax .

Si los puntos que corresponden a los datos no son colineales, es imposible encontrar coeficientes a y b quesatisfagan (5.3). En este caso, independientemente de la forma en que se escojan a y b, la diferencia

Ax− y�

entre los dos miembros de (5.3) no será cero. Entonces, el objetivo es encontrar un vector x =

»a∗

b∗

que

minimice la longitud del vector Ax− y, esto es, que minimice

�Ax− y ��

lo que es equivalente a minimizar su cuadrado, �Ax− y �2.

Si x0 =

»a∗

b∗

es un vector que minimiza tal longitud, a la línea recta y = a∗ + b∗x se le denomina recta

de ajuste por mínimos cuadrados de los datos. La figura 5.3 ilustra la adaptación de una línea recta por elmétodo de los mínimos cuadrados. Se tiene que �Ax− y �� y

�Ax− y �2 = �a∗ + b∗x1 − y1)2 + �a∗ + b∗x2 − y2)

2 +

· · ·+ �a∗ + b∗xn − yn)2

121

Page 24: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

son minimizados por el vector x0 =

»a∗

b∗

. En dicha figura se ve que |a∗ + b∗xi − yi| corresponde a la

“distancia vertical”, di� tomada desde el punto �xi� yi) hasta la recta y = a∗ + b∗x . Si se toma a di comoel “error vertical” en el punto �xi� yi), la recta de ajuste minimiza la cantidad:

d21 + d22 + · · ·+ d2n �

que es la suma de los cuadrados de los “errores verticales”. De allí el nombre de método de los mínimoscuadrados.

d

d

1

y

x

y=a+b x

x  , y  (          )

(          )

d3

2

dn

* *

2x  , y  2(         )

x   , y   

1 1

3x  , y  3

(           )n n

Figura 5�3� Ajuste lineal por mínimos cuadrados

A continuación se darán dos definiciones motivadas por la discusión anterior. En el ejemplo 5.50 se ex-plicará cómo se adaptar, por mínimos cuadrados, una línea recta y = a + bx a una serien de n puntos�x1� y1); �x2� y2); . . . ; �xn� yn) dados.

5.41. Definición (Solución M nima Cuadrada). Se dice que el vector x0 es una solución mínima cuadrada(S.M.C.) del sistema de ecuaciones lineales Ax = y� si para todo vector x se tiene que:

�Ax0 − y � ≤ �Ax − y � .

5.42. Definición (Mejor Solución Aproximada). Se dice que el vector x0 es una mejor solución aproximada(M.S.A.) del sistema de ecuaciones lineales Ax = y� si:

1. Para todo vector x se tiene que:

�Ax0 − y � ≤ �Ax − y �.

2. Para todo vector x∗ �= x0 tal que �Ax0 − y � < �Ax∗ − y � se tiene que

�x0 � < �x∗ �.

Nota. Observe que una M.S.A de un sistema de ecuaciones lineales Ax = y es una S.M.C. del mismo.

5.43. Teorema. Sea A una matriz m× n y sea y un vector Rm. Si Ac es una c-inversa de A tal que AAc

es simétrica, entonces para todo vector x ∈ Rn se tiene que:

�Ax − y �2 = �Ax −AAcy �2 + �AAc

y − y �2.

122

Page 25: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

Demostración� Por hipótesis AAc = �AAc)T . Así que para todo vector x se tiene que:

�Ax − y �2 = � �Ax −AAcy) + �AAc

y − y)�2

= �Ax −AAcy �2 + 2�Ax−AAc

y)T �AAcy − y)

+�AAcy − y �2

El teorema quedará demostrado si verificamos que el segundo término de esta igualdad es cero, esto es, sicomprobamos la igualdad

�Ax−AAcy)T �AAc

y − y) = 0.

En efecto tenemos:

�Ax−AAcy)T �AAc

y − y) = �x−Acy)TAT ��AAc)T − I)y

= �x−Acy)T �AT �AAc)T −AT )y

= �x−Acy)T ��AAcA)T −AT )y

= �x−Acy)T �AT −AT )y = � .

5.44. Teorema. Sea A una matriz m× n y sea y un vector Rm. Si Ac es una c-inversa de A tal que AAc

es simétrica, entonces x0 = Acy es una S.M.C. para el sistema Ax = y.

Demostración� Por hipótesis y por el teorema anterior se tiene que x0 = Acy es tal que:

�Ax − y �2 = �Ax −Ax0 �2 + �Ax0 − y �2 ≥ �Ax0 − y �2.

Para todo vector x. De aquí que para todo vector x:

�Ax0 − y � ≤ �Ax − y ��

esto es, x0 = Acy es una S.M.C. para el sistema Ax = y. �

5.45. Teorema. Sea A una matriz m× n y sea y un vector Rm. El sistema de ecuaciones lineales Ax = y

tiene una única M.S.A., a saber

x0 = A+y.

Demostración� Por definición de g-inversa se tiene que A+ es en particular una c-inversa de A quesatisface la propiedad de que AA+ es una matriz simétrica, entonces por el teorema 5.43 se tiene para todox que:

�Ax − y �2 = �Ax −AA+y �2 + �AA+

y − y �2 ≥ �AA+y − y �2.

De aquí que para todo vector x :

(5.4) �AA+y − y � ≤ �Ax − y �

Esto es, x0 = A+y es una S.M.C. para el sistema Ax = y. Se quiere demostrar ahora x0 = A+y que laM.S.A. para ello se muestra, que si x∗ �= x0 es otra S.M.C. del sistema Ax = y (esto es si x∗ satisfaceAx∗ = AA+y) entonces se tiene que �x0 � < �x∗ �. Para ello se verifica primero que para todo x se satisfacela igualdad

(5.5) �A+y + �I −A+A)x2� = �A+

y �2 + � �I −A+A)x �2 .

123

Page 26: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

En efecto se tiene que:

�A+y + �I −A+A)x�2 = �A+

y �2 + 2�A+y)T �I −A+A)x +

� �I −A+A)x �2 .

La igualdad (5.5) se obtendrá entonces si verifica que el segundo término de la igualdad anterior es cero.Esto último se sigue fácilmente de

�A+y)T �I −A+A)x = y

Th�A+)T − �A+)T �AA+)T

ix

= yT

h�A+)T − �A+AA+)T

ix

= yT ��)x = �

Tómese ahora un vector x∗ �= x0, tal que Ax∗ = AA+y. Multiplicando por A+ obtenemos A+Ax∗ = A+y.De aquí y de (5.5) aplicada a x∗ se tiene que:

�x∗�2 = �A+

y + x∗ −A+

y�2

= �A+y + x

∗ −A+Ax∗�2

= �A+y + �I −A+A)x∗�2

= �A+y �2 + � �I −A+A)x∗ �2

> �A+y �2 = �x0�

2 .

5.46. Observación. El teorema anterior establece que todo sistema de ecuaciones lineales Ax = y tieneuna única M.S.A., x0 = A+y. Por esto, se hablará de aquí en adelante de la mejor solución aproximada(M.S.A.) de un sistema de ecuaciones lineales.

Ahora bien, puesto que la mejor solución aproximada del sistema de ecuaciones lineales Ax = y es unasolución mínima cuadrada, se tiene el siguiente teorema.

5.47. Corolario. Todo sistema de ecuaciones lineales Ax = y tiene al menos una S.M.C.

5.48. Ejemplo. Para el sistema de ecuaciones lineales

Ax =

2

41 11 11 1

3

5»xy

=

2

4123

3

5 = y�

se tiene que x0 = A+y =1

6

»1 1 11 1 1

–2

4123

3

5 =

»11

es la M.S.A. Además:

�Ax0 − y � =√

2;

así que para todo vector x se tiene que: √2 ≤ �Ax − y ��

y si existe un vector x∗ tal que �Ax∗ − y � =√

2, entonces se debe tener que:

�x0� =√

2 < �x∗ �. �

5.49. Teorema. Sea A una matriz m × n y sea y un vector Rm. Si ρ�A) = n, entonces el sistema de

ecuaciones lineales Ax = y tiene una única S.M.C. que es justamente la M.S.A. dada por:

x0 = A+y.

124

Page 27: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

Demostración� Sea x∗ una S.M.C. del sistema de ecuaciones Ax = y. Por definición se tiene paratodo x ∈ R

n, entonces que �Ax∗ − y � ≤ �Ax − y �� en particular, para el vector x0 = A+y se tiene:

(5.6) �Ax∗ − y � ≤ �AA+

y − y �.

De otra parte, como A+ es una c-inversa de A tal que AA+ es simétrica, entonces se tiene (ver teorema5.43)

�Ax − y �2 = �Ax−AA+y �2 + �AA+

y − y �2 ∀x ∈ Rn.

En particular, para el vector x∗ se tiene:

�Ax∗ − y �2 = �Ax

∗ −AA+y �2 + �AA+

y − y �2.(5.7)

De (5.6) y (5.7) se sigue que:

�AA+y − y �2 ≤ �Ax

∗ −AA+y �2 + �AA+

y − y �2

= �Ax∗ − y �2 ≤ �AA+

y − y �2

De aquí que‚‚Ax∗ −AA+y

‚‚ = 0 y por lo tanto:

Ax∗ = AA+

y .

Puesto que ρ�A) = n, entonces A+ =`ATA

´−1AT (teorema 5.15), en consecuencia:

Ax∗ = A

“ATA

”−1

ATy.

Premultiplicando esta igualdad por`ATA

´−1AT � se obtiene:

x∗ =

“ATA

”−1

ATAx∗

=“ATA

”−1

ATA“ATA

”−1

ATy

“ATA

”−1

ATy = A+

y = x0 .

5.50. Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados (ver figura 5.4), que se adapte alos puntos:

�0� 1); �1� 3); �2� 4); �3� 4) .

Para ello se debe encontrar una S.M.C. del sistema de ecuaciones lineales Ax = y, donde

A =

2

664

1 x1

1 x2

1 x3

1 x4

3

775 =

2

664

1 01 11 21 3

3

775 � y =

2

664

y1y2y3y4

3

775 =

2

664

1344

3

775

y el vector incógnita x está dada por

x =

»ab

.

125

Page 28: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

Puesto que ρ�A) = 2� entonces por el teorema anterior, el sistema dado tiene una única S.M.C., a saber:

x0 = A+y = �ATA)−1AT

y

=1

10

»7 4 1 −2

−3 −1 1 3

–2

664

1344

3

775

=

»1.51

=

»a∗

b∗

En consecuencia, la recta de ajuste, por mínimos cuadrados, de los datos dados es:

y = a∗ + b∗x = 1.5 + x. �

(0,1)

(1,3)

(2,4)(3,4)

y=1.5+x

y

x

Figura 5�4� Ajuste lineal ejemplo 5.50

5.51. Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados, que se adapte a los puntos:

�1� 1); �1� 2) .

Observe que en este caso los puntos dados pertenecen a la recta, de pendiente infinita, x = 1.(ver figura5.5(a))

126

Page 29: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

x

(1,2)

(1,1)

yx = 1

b)   Ajuste por rectas de pendiente no infinita

y

x

(1,2)

(1,1)

y=3/2x

y=3/4+3/4x

a)   Ajuste por una recta de pendiente infinita

Figura 5�5� Ajuste lineal ejemplo 5.51

Ahora bien, si se busca una recta y = a + bx� que no tenga pendiente infinita, que se adapte por mínimoscuadrados, a los puntos dados, entonces se debe encontrar una S.M.C. del sistema de ecuaciones lineales(ver figura 5.5(b))

Ax =

»1 x1

1 x2

– »ab

=

»1 11 1

– »ab

=

»12

=

»y1y2

= y.

Una S.M.C. del sistema dado es:

x0 = A+y =

1

4

»1 11 1

– »12

=

»3/43/4

=

»a∗

b∗

.

Así que una recta de ajuste, por mínimos cuadrados, de los puntos dados es:

y = a∗ + b∗x =3

4+

3

4x .

De otra parte, la matriz

Ac =

»0 0

1/2 1/2

es una c-inversa de A, AAc es simétrica. En efecto,

AAc =

»1/2 1/21/2 1/2

.

Por lo tanto, de acuerdo con el teorema 5.44,

x0 = Acy =

»0

3/2

=

»a

b

es también una S.M.C. Así que otra recta de ajuste por mínimos cuadrados, de los puntos dados es (verfigura 5.5(b)):

y = a∗ + b∗x =3

2x . �

127

Page 30: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

B. Adaptación a polinomios de grado n.

La técnica descrita antes para adaptar una recta a n puntos dados, se generaliza fácilmente a la adaptación,por mínimos cuadrados, de un polinomio de cualquier grado a un conjunto de puntos dados.

A continuación se muestra cómo adaptar un polinomio de grado ≤ m�

y = a0 + a1x+ a2x2 + . . .+ amx

m

a un conjunto de n puntos �x1� y1); �x2� y2); . . . ; �xn� yn)� mediante la técnica de los mínimos cuadrados.

Sustituyendo estos n valores de x y y en la ecuación polinómica se obtienen las n ecuaciones siguientes:

2

6664

y1y2...yn

3

7775

=

2

6664

1 x1 x21 · · · xm

1

1 x2 x22 · · · xm

2

......

.... . .

...1 xn x2

n · · · xmn

3

7775

2

6664

a0a1...am

3

7775

De lo que se trata nuevamente, es de encontrar una S.M.C. del sistema de ecuaciones lineales Ax = y.

5.52. Ejemplo. Encontrar un polinomio de grado dos que mejor se ajuste, por mínimos cuadrados, a lospuntos:

�−1� 0); �0�−2); �1�−1); �2� 0) .

Se debe encontrar una S.M.C. del sistema de ecuaciones lineales:

Ax =

2

664

1 −1 11 0 01 1 11 2 4

3

775

2

4a1a2a3

3

5 =

2

664

0−2−1

0

3

775 = y.

Puesto que ρ�A) = 3� el sistema dado tiene una única S.M.C., la cual está dada por:

x0 = A+y = �ATA)−1AT

y

=1

20

2

43 11 9 −3

−1 3 7 15 −5 −5 5

3

5

2

664

0−2−1

0

3

775

=1

20

2

4−31−13

15

3

5 =

2

4−1.55−0.65

0.75

3

5

En consecuencia, existe un único polinomio de grado dos que se ajuste por mínimos cuadrados de los datosdados. Este polinomio está dado por (ver figura 5.6):

y = −1.55− 0.65x+ 0.75x2 . �

128

Page 31: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

Inversa generalizada e inversa condicional 5.4. Mínimos cuadrados

(2,0)

(1,−1)

(−1,0)

x

y

(0,−2)

y=−1.55−0.65x+0.75x2

Figura 5�6� Ajuste cuadrático ejemplo 5.52

5�4 Ejercicios

1. Si el sistema de ecuaciones lineales Ax = y tiene solución, demuestre entonces que la soluciónx = A+y es única sii A+A = I� y en este caso A+y = Acy para toda c-inversa Ac de A.

2. Si x1� x2� . . . �xn son soluciones del sistema de ecuaciones lineales Ax = y, y si λ1� λ2� . . . � λn sonescalares tales que

Pn

i=1 λi = 1, demuestre entonces

x =

nX

i=1

λixi

es una solución del sistema Ax = y.3. Sea y = a + bx una línea recta que se quiere adaptar, por mínimos cuadrados, a los puntos

�x1� y1); �x2� y2); . . . ; �xn� yn). Utilice el teorema 5.39 y la regla de Cramer para demostrar quesi para algún i y para algún j, xi �= xj � entonces existe una única recta de ajuste, por mínimoscuadrados, a los puntos dados:

y = a∗ + b∗x

y que a∗ =Δa

Δy b∗ =

Δb

Δ, donde:

Δ = det

2

4n

Pn

i=1 xi

Pn

i=1 xi

Pn

i=1 x2i

3

5

Δa = det

2

4

Pn

i=1 yi

Pn

i=1 xi

Pn

i=1 xiyi

Pn

i=1 x2i

3

5

Δb = det

2

4n

Pn

i=1 yi

Pn

i=1 xi

Pn

i=1 xiyi

3

5

129

Page 32: Inversa generalizada e inversa condicional de matricesmatematicas.univalle.edu.co/~mvillegas/texto/cap5.pdf · Inversa generalizada e inversa condicional 5.1. G-Inversa y C-inversa

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

4. Encuentre la M.S.A. del sistema de ecuaciones lineales Ax = y� donde:

A =

2

664

2 2 22 2 21 −1 02 −2 0

3

775 y y =

2

664

1234

3

775 .

5. Encuentre la M.S.A del sistema de ecuaciones lineales8>>><

>>>:

x+ 2y = 1

−x+ y = 1

2x− 3y = 2

3x+ y = 3 .

6. Encuentre la ecuación de la recta que mejor se ajuste por mínimos cuadrados a los puntos:

�0� 1); �1� 3); �2� 2); �3� 4).

7. Obtenga la ecuación del polinomio de grado dos que mejor se adapte, por mínimos cuadrados, alos puntos:

�−1� 4); �0� 2); �1� 0); �2� 1).

8. Dé, si las hay, dos S.M.C. diferentes del sistema de ecuaciones lineales:

Ax =

»2 22 2

– »xy

=

»10

.

9. Suponga que las variables x y y se relacionan por medio de la ecuación y = a · bx; a > 0� b > 0.a) Verique que dicha ecuación se puede transformar en la ecuación

y∗ = a∗ + b∗x �

donde y∗ = ln y� a∗ = ln a y b∗ = ln b. Y viceversa.b) Determine, los valores de las constantes a > 0� b > 0 en el modelo y = a · bx que mejor se

adapte a los datosx -1 1 2

y 1 6 10

Estime el valor de y para x = 5. Para ello encuentre la recta y∗ = a∗+b∗x que mejor se adapte,por mínimos cuadrados a los puntos de la forma �x� ln y).

10. Determine la ecuación del plano z = a + bx + cy que mejor se adapte, por mínimos cuadrados, alos puntos �0� 1� 5)� �1� 0� 2)� �1� 1� 7)� (1,-1,-1).

130