apuntes matemáticasii

140
Universidad de Málaga Escuela Técnica Superior de Arquitectura Fundamentos Matemáticos en la Arquitectura II José M. Gallardo –1 Arquitectura –

Upload: alba-puertas

Post on 08-Aug-2015

28 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Apuntes MatemáticasII

Universidad de Málaga

Escuela Técnica Superior de Arquitectura

Fundamentos Matemáticos en la Arquitectura II

José M. Gallardo

– 1◦ Arquitectura –

Page 2: Apuntes MatemáticasII
Page 3: Apuntes MatemáticasII

3

Índice

1. Ecuaciones diferenciales de primer orden 51.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2. Ecuaciones de variables separables . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.3. Ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.4. Ecuaciones exactas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.5. Problemas de valor inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.6. Aplicación: calentamiento de edificios . . . . . . . . . . . . . . . . . . . . . . . . . 19

2. Ecuaciones diferenciales de orden superior y sistemas 252.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.2. Ecuaciones lineales de segundo orden . . . . . . . . . . . . . . . . . . . . . . . . . 272.3. Ecuaciones lineales homogéneas con coeficientes constantes . . . . . . . . . . . . 282.4. Método de variación de las constantes . . . . . . . . . . . . . . . . . . . . . . . . . 312.5. Problemas de valores iniciales y de contorno . . . . . . . . . . . . . . . . . . . . . 342.6. Ecuaciones lineales de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . 372.7. Sistemas lineales de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.8. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.8.1. Movimiento armónico amortiguado . . . . . . . . . . . . . . . . . . . . . . 532.8.2. Deflexión y pandeo de vigas . . . . . . . . . . . . . . . . . . . . . . . . . . 552.8.3. Calentamiento de edificios . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3. Métodos numéricos para problemas de valor inicial 653.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.2. El método de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.3. Métodos de orden superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.4. Algunas consideraciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 813.5. Aplicación: deflexión de vigas en voladizo . . . . . . . . . . . . . . . . . . . . . . 84

4. Métodos numéricos para problemas de contorno 894.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.2. Método de diferencias finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.3. Aproximación variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954.4. Método de elementos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984.5. Algunos comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1064.6. Aplicación: deflexión de vigas empotradas . . . . . . . . . . . . . . . . . . . . . . 107

5. Probabilidad y Estadística 1145.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1145.2. Probabilidad básica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1155.3. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1175.4. Elementos de Estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1255.5. Curva de ajuste, regresión y correlación . . . . . . . . . . . . . . . . . . . . . . . . 134

Page 4: Apuntes MatemáticasII

4

6. Bibliografía 140

Page 5: Apuntes MatemáticasII

1 Ecuaciones diferenciales de primer orden 5

1. Ecuaciones diferenciales de primer orden

1.1. Introducción

Una ecuación diferencial ordinaria de primer orden es una expresión que relaciona una variableindependiente x con una variable dependiente y(x) y su primera derivada y′(x):

F(x, y(x), y′(x)) = 0, x ∈ [a, b].

Por ejemplo, son ecuaciones diferenciales ordinarias de primer orden las siguientes:

y′(x) = 0,dydx

= y, y + (y′)1/3 + 25x = sen(x).

Para representar la derivada de y respecto de x usaremos indistintamente las notaciones y′,y′(x) o dy

dx . Salvo que sea necesario por claridad, en general no expresaremos la dependenciade la variable y respecto de x:

F(x, y, y′) = 0, x ∈ [a, b].

Una solución de una ecuación diferencial de primer orden es una función y : [a, b]→ R queverifica la ecuación en cada punto x ∈ [a, b]. Para que esta definición tenga sentido, es precisoque la función y(x) sea derivable en el intervalo [a, b] y que dicha derivada sea una funcióncontinua: se dice entonces que y(x) es de clase C1([a, b]).

Ejemplo 1.1. La función y : R → R dada por y(x) = e−x es una solución de la ecuacióndiferencial y′ = −y, ya que es derivable con continuidad en R y

y′(x) = −e−x = −y(x).

La solución general de una ecuación diferencial de primer orden es una familia de funcionesy ≡ y(x, C) dependiente de un parámetro (o constante arbitraria) C que nos proporciona todaslas posibles soluciones de la ecuación diferencial.

Ejemplo 1.2. La solución general de la ecuación diferencial y′ = −y es

y = Ce−x,

siendo C ∈ R una constante arbitraria. En efecto, cualquier función de la forma anterior essolución de la ecuación:

y′(x) = −Ce−x = −y(x).

Más adelante veremos que todas las posibles soluciones de la ecuación tienen la forma ante-rior.

Resolver una ecuación diferencial significa obtener todas sus soluciones, esto es, hay quedeterminar su solución general. La inmensa mayoría de ecuaciones diferenciales no puedenresolverse mediante métodos analíticos, es decir, no es posible obtener una expresión exactade la solución y ≡ y(x, C). En este tema estudiaremos diversos tipos clásicos de ecuacionesque sí pueden resolverse de forma explícita.

Page 6: Apuntes MatemáticasII

6

Una ecuación diferencial de primer orden está escrita en forma normal (también se dice queestá resuelta respecto de la derivada) si la derivada y′ aparece despejada:

y′ = f (x, y).

Toda ecuación en forma normal también puede escribirse en forma diferencial:

M(x, y) dx + N(x, y) dy = 0.

En efecto:

y′ = f (x, y)⇒ dydx

= f (x, y)⇒ f (x, y)dx− dy = 0;

basta pues tomar M(x, y) = f (x, y) y N(x, y) = −1.En las secciones siguientes estudiaremos métodos de resolución para tres tipos fundamen-

tales de ecuaciones diferenciales de primer orden:

Ecuaciones de variables separables: y′ =f (x)g(y)

.

Ecuaciones lineales: y′ = a(x)y + b(x).

Ecuaciones exactas: M(x, y) dx + N(x, y) dy = 0 con∂M∂y

=∂N∂x

.

1.2. Ecuaciones de variables separables

Diremos que una ecuación diferencial de primer orden es de variables separables si puedeescribirse en la forma

y′ =f (x)g(y)

siendo f (x) y g(y) funciones de una sola variable.Las ecuaciones de variables separables se resuelven agrupando en un miembro de la ecua-

ción los términos que dependen de x, y en el otro aquellos que dependen de y; a continuación,se integran ambos miembros para obtener la solución general de la ecuación. De este modo,podemos escribir formalmente:

dydx

=f (x)g(y)

⇒ g(y) dy = f (x) dx ⇒∫

g(y) dy =∫

f (x) dx.

Si G(y) y F(x) son primitivas de g(y) y f (x) respectivamente, obtenemos que

G(y) = H(x) + C,

donde C es la constante de integración: recordemos que dos primitivas de una misma funciónse diferencian en una constante. La expresión obtenida es la solución general de la ecuacióndiferencial. Puede suceder que en dicha expresión no podamos despejar la variable y; en talcaso se dice que la solución está dada en forma implícita.

Page 7: Apuntes MatemáticasII

1.2 Ecuaciones de variables separables 7

Ejemplo 1.3. Consideremos la ecuación diferencial y′ = 2xy, que es de variables separables.Para resolverla, separamos las variables e integramos:

dydx

= 2xy⇒ dyy

= 2x dx⇒∫ dy

y=∫

2x dx⇒ log(y) = x2 + c,

siendo c una constante de integración. Despejemos la variable y:

y = ex2+c = ex2ec.

Por último, renombrando la constante ec como una constante arbitraria C, obtenemos la solu-ción general de la ecuación:

y = Cex2.

El siguiente código permite resolver la ecuación del ejemplo usando Sage:sage: # Ejemplo 1.3sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == 2*x*ysage: desolve(ec , y)c*e^(x^2)

Ejemplo 1.4. La ecuación y′ = −x/y es de variables separables, por tanto:

dydx

= − xy⇒ y dy = −x dx⇒

∫y dy = −

∫x dx⇒ y2

2= − x2

2+ c⇒ x2 + y2 = 2c.

Esta solución puede reescribirse como

x2 + y2 = C,

donde C = 2c representa una constante arbitraria. Hemos obtenido pues la solución generalde la ecuación en forma implícita: x2 + y2 = C. Observemos que al ser x2 + y2 > 0, la constanteC no puede ser negativa.

Es interesante observar que, a partir de la solución general, se obtienen dos ramas desoluciones (figura 1.1):

y =√

C− x2, y = −√

C− x2,

siendo en ambos casos el dominio de definición I = (−√

C,√

C), ya que y(x) no es unafunción derivable en x = ±1.

El correspondiente código Sage para resolver la ecuación es:sage: # Ejemplo 1.4sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == -x/ysage: desolve(ec , y)-1/2*y(x)^2 == 1/2*x^2 + c

Como vemos, la solución viene dada en forma implícita. Si queremos despejar la solución y,primero guardamos el resultado anterior en una variable, que llamaremos sol:

Page 8: Apuntes MatemáticasII

8

x1

1

0

-1

-1

y=1−x2

y

x1

1

0

-1

-1

y=−1−x2

y

Figura 1.1: Las dos ramas de solución para C = 1, definidas en I = (−1, 1).

sage: sol = desolve(ec, y); sol-1/2*y(x)^2 == 1/2*x^2 + c

A continuación, usamos el comando solve para despejar y:sage: solve(sol , y)[y(x) == -sqrt(-x^2 - 2*c), y(x) == sqrt(-x^2 - 2*c)]

Ejemplo 1.5. Consideremos la ecuación en forma diferencial

xy dx + e−x2(y2 − 1) dy = 0.

Podemos separar las variables como sigue:

1− y2

ydy = xex2

dx.

Integrando, obtenemos la solución general:

∫ 1− y2

ydy =

∫xex2

dx ⇒ log(y)− y2

2=

ex2

2+ C.

De nuevo Sage nos proporciona la solución correcta:sage: # Ejemplo 1.5sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == x*exp(x^2)*y/(1-y^2)sage: desolve(ec , y)-1/2*y(x)^2 + log(y(x)) == c + 1/2*e^(x^2)

En este caso no podemos despejar la variable y, por lo que debemos conformarnos con lasolución general en forma implícita.

Page 9: Apuntes MatemáticasII

1.2 Ecuaciones de variables separables 9

Ejemplo 1.6. Por supuesto, no todas las ecuaciones diferenciales de primer orden son devariables separables. Como muestra, un botón:

y′ = x2 + y2.

A continuación vamos a considerar el caso particular de las ecuaciones homogéneas que, aunno siendo estrictamente de variables separables, pueden reducirse a una de estas mediante uncambio de variable.

Diremos que una ecuación diferencial de primer orden y′ = f (x, y) es homogénea si lafunción f (x, y) verifica la siguiente propiedad:

f (λx, λy) = f (x, y) para cada λ > 0.

En tal caso, mediante el cambio de variable

z =yx

podemos transformarla en una ecuación de variables separables. Para comprobarlo, tengamosen cuenta que y = xz y, por tanto, y′ = z + xz′; sustituyendo en la ecuación, resulta:

z + xz′ = f (x, xz)⇒ z + xz′ = f (1, z)⇒ z′ =f (1, z)− z

x,

siendo esta ultima ecuación de variables separables.

Ejemplo 1.7. La ecuación

y′ =y +

√x2 − y2

xes homogénea. En efecto, si definimos

f (x, y) =y +

√x2 − y2

x

entonces, para cada λ > 0,

f (λx, λy) =λy +

√(λx)2 − (λy)2

λx=

λy +√

λ2(x2 − y2)

λx=

y +√

x2 − y2

x= f (x, y).

Para resolver la ecuación, hacemos el cambio z = y/x. El segundo miembro de la ecuaciónquedaría así:

y +√

x2 − y2

x=

xz +√

x2 − (xz)2

x=

xz +√

x2(1− z2)

x= z +

√1− z2.

Sustituyendo en la ecuación diferencial, resulta

�z + xz′ = �z +√

1− z2 ⇒ dzdx

=

√1− z2

x.

Page 10: Apuntes MatemáticasII

10

La ecuación obtenida es de variables separables, por lo que podemos resolverla medianteintegración:

dzdx

=

√1− z2

x⇒∫ dz√

1− z2=∫ dx

x⇒ arc sen(z) = log(x) + C ⇒ z = sen(log(x) + C).

(nótese que se ha supuesto x > 0 para que log(x) tenga sentido). Por último, deshacemos elcambio z = y/x para obtener la solución general:

y = x sen(log(x) + C).

El código Sage para resolver la ecuación diferencial es:

sage: # Ejemplo 1.7sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == (y+sqrt(x^2-y^2))/xsage: desolve(ec , y)x == c*e^(x*arcsin(y(x)/x)/sqrt(x^2))

En este caso, la solución obtenida viene dada en forma implícita:

x = c ex arcsen( y

x

)/√

x2

Suponiendo que x > 0, la expresión anterior puede simplificarse:

x = c earcsen( y

x

)⇒ arcsen

(yx

)= log

( xc

)⇒ y = x sen(log(x) + C),

donde C = log(c). Si queremos que Sage imponga de antemano la condición x > 0, podemosusar el comando assume:

sage: # Ejemplo 1.7sage: var(’x’)sage: assume(x>0) # suponemos que x>0sage: y = function(’y’, x)sage: ec = diff(y, x) == (y+sqrt(x^2-y^2))/xsage: desolve(ec , y)c*x == e^( arcsin(y(x)/x))

En el cálculo de la solución hemos supuesto que x > 0. ¿Qué ocurre en caso contrario?En primer lugar, notemos que el caso x = 0 no tiene cabida, ya que la función que define elsegundo miembro de la ecuación diferencial no está definida en x = 0. Supongamos pues quex < 0; en tal caso, cambiamos de signo ambos miembros de la ecuación y tenemos en cuentaque −x > 0:

dzdx

=

√1− z2

x⇒ −

∫ dz√1− z2

=∫ dx−x⇒ − arc sen(z) = − log(−x) + C.

Cambiando de signo y renombrando la constante de integración, obtenemos:

z = sen(log(−x) + C)⇒ y = x sen(log(−x) + C).

Page 11: Apuntes MatemáticasII

1.3 Ecuaciones lineales 11

Si no queremos preocuparnos del signo de x, es una práctica habitual definir∫ dxx

= log |x|.

De esta manera, podemos considerar la siguiente expresión de la solución general:

y = x sen(log |x|+ C),

que es válida independientemente del signo de x.

1.3. Ecuaciones lineales

Una ecuación diferencial de primer orden es lineal si puede escribirse en la forma

y′ = a(x)y + b(x)

para ciertas funciones a(x) y b(x). Cuando b(x) ≡ 0 la ecuación es de variables separables yse denomina homogénea; en caso contrario, la ecuación se dice completa.

El proceso de resolución de una ecuación lineal consta de dos etapas:

Cálculo de la solución general yH(x, C) de la ecuación homogénea asociada: y′ = a(x)y.

Determinación de una solución particular yP(x) de la ecuación completa.

Veamos en detalle dicho proceso. En primer lugar, resolvemos la ecuación homogéneaasociada, que es de variables separables:

dydx

= a(x)y⇒∫ dy

y=∫

a(x) dx ⇒ log(y) = A(x) + c,

siendo A(x) una primitiva de a(x); despejando la variable y obtenemos la solución general dela ecuación homogénea:

yH(x, C) = CeA(x),

(nótese que la constante C sustituye a ec en este último paso).Para determinar una solución particular de la ecuación completa utilizaremos el método de

variación de la constante. Dicho método se basa en construir una solución yP(x) con la mismaestructura que yH(x, C), donde se sustituye la constante arbitraria C por una función C(x):

yP(x) = C(x)eA(x).

A continuación, se determina C(x) imponiendo que yP(x) sea solución de la ecuación com-pleta:

y′P = a(x)yP + b(x)⇒ C′(x)eA(x) + A′(x)C(x)eA(x) = a(x)C(x)eA(x) + b(x);

teniendo en cuenta que A′(x) = a(x), resulta:

C′(x) = b(x)e−A(x) ⇒ C(x) =∫

b(x)e−A(x) dx

Page 12: Apuntes MatemáticasII

12

(nótese que este último paso no hay que añadir una constante de integración, ya que sólonecesitamos una solución particular). Finalmente, la solución particular buscada es

yP =

(∫b(x)e−A(x) dx

)eA(x).

Una vez calculadas yH(x, C) e yP(x), la solución general de la ecuación completa es

y ≡ y(x, C) = yH(x, C) + yP(x).

Observación. En efecto, teniendo en cuenta que yH e yP verifican, respectivamente, las igual-dades y′H = a(x)yH e y′P = a(x)yP + b(x), tenemos que

y′ = y′H + y′P = a(x)yH + a(x)yP + b(x) = a(x)(yH + yP) + b(x) = a(x)y + b(x),

lo que significa que y = yH + yP es solución de la ecuación completa; además, al ser yH unafamilia uniparamétrica de soluciones, y también lo es. Para probar que se trata de la solucióngeneral, veamos que cualquier solución y de la ecuación completa es de la forma yH + yP,para una cierta solución yH de la ecuación homogénea. Si y es cualquier solución de la formayH + yP, se tiene que

y′ = a(x)y + b(x)y′ = a(x)y + b(x)

}⇒ y′ − y′ = a(x)y− a(x)y⇒ (y− y)′ = a(x)(y− y).

Esto muestra que y− y es una solución de la ecuación homogénea, que llamaremos yH. Portanto,

y− y = yH ⇒ y = y + yH = (yH + yP) + yH = (yH + yH) + yP,

donde yH + yH es solución de la ecuación homogénea (esto se comprueba fácilmente). Hemosdemostrado así que y es de la forma requerida.

Recapitulando, para calcular la solución general de una ecuación lineal basta con calcularla solución general de la ecuación homogénea asociada (que siempre es de variables separa-bles) y sumarle a ésta una solución cualquiera de la ecuación completa.

Ejemplo 1.8. Consideremos la ecuación lineal

y′ =yx+ log(x),

donde a(x) = 1/x y b(x) = log(x). Primero, calculamos la solución general de la ecuaciónhomogénea asociada:

dydx

=yx⇒∫ dy

y=∫ dx

x⇒ log(y) = log(x) + c⇒ yH(x, C) = Cx.

A continuación, buscamos una solución particular de la forma

yP = C(x)x,

Page 13: Apuntes MatemáticasII

1.3 Ecuaciones lineales 13

donde ahora C(x) representa una función a determinar; para ello, sustituimos yP en la ecua-ción completa:

y′P =yP

x+ log(x)⇒ C′(x)x+��

�C(x) =����C(x)x

x+ log(x)⇒ C′(x) =

log(x)x⇒ C(x) =

12

log2(x).

Sustituyendo en yP = C(x)x se determina una solución particular de la ecuación completa:

yP =x2

log2(x).

Finalmente, la solución general de la ecuación completa será

y = Cx +x2

log2(x).

Sage calcula de forma directa la solución general de la ecuación:sage: # Ejemplo 1.8sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == y/x + log(x)sage: desolve(ec , y)1/2*( log(x)^2 + 2*c)*x

Ejemplo 1.9. Resolvamos la ecuación lineal

y′ = y + cos(x),

en la que a(x) = 1 y b(x) = cos(x). En primer lugar estudiamos la ecuación homogéneaasociada:

dydx

= y⇒∫ dy

y=∫

dx ⇒ log(y) = x + c⇒ y = Cex.

A continuación, buscamos una solución particular de la forma

yP = C(x)ex.

Como y′P = C′(x)ex + C(x)ex, sustituyendo en la ecuación completa obtenemos

y′P = yP + cos(x)⇒ C′(x)ex +����C(x)ex =���

�C(x)ex + cos(x)⇒ C′(x) = e−x cos(x).

Integrando por partes, resulta

C(x) =sen(x)− cos(x)

2e−x.

Por tanto, una solución particular es

yP = C(x)ex =sen(x)− cos(x)

2e−xex =

sen(x)− cos(x)2

.

Finalmente, la solución general de la ecuación será

y = Cex +sen(x)− cos(x)

2.

Aquí está el código Sage para resolver la ecuación:

Page 14: Apuntes MatemáticasII

14

sage: # Ejemplo 1.9sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == y + cos(x)sage: desolve(ec , y)1/2*(( sin(x) - cos(x))*e^(-x) + 2*c)*e^x

Si queremos una expresión más simplificada del resultado, podemos utilizar el comandoexpand en la última línea del código:

sage: expand(desolve(ec, y))c*e^x + 1/2* sin(x) - 1/2* cos(x)

1.4. Ecuaciones exactas

Una ecuación en forma diferencial

M(x, y) dx + N(x, y) dy = 0

es exacta si se verifica la condición∂M∂y

=∂N∂x

.

En tal caso, la solución general de la ecuación viene dada por la expresión

E(x, y) = C,

donde E(x, y) es una solución del sistema∂E∂x

= M(x, y),

∂E∂y

= N(x, y).

La función E(x, y) se denomina potencial asociado al campo vectorial M(x, y)~i + N(x, y)~j.

Observación. La terminología usada en esta sección proviene de la Física. En efecto, el campovectorial ~F(x, y) = M(x, y)~i + N(x, y)~j es conservativo si se verifica que ∂M

∂y = ∂N∂x , lo que

coincide con la condición de exactitud. Todo campo conservativo deriva de un potencial, estoes, existe una función potencial E(x, y) tal que ~F puede expresarse como el gradiente de E:

~F(x, y) =−→∇E(x, y)⇒ M(x, y)~i + N(x, y)~j =

∂E∂x

~i +∂E∂y

~j.

Igualando componentes, se deducen las ecuaciones para determinar el potencial:

∂E∂x

= M(x, y),∂E∂y

= N(x, y).

Page 15: Apuntes MatemáticasII

1.4 Ecuaciones exactas 15

Observación. Supongamos que y(x) verifica que E(x, y(x)) = C. Derivando respecto a x, yaplicando la regla de la cadena, se obtiene:

ddx

E(x, y(x)) = 0⇒ ∂E∂x

(x, y(x)) +∂E∂y

(x, y(x))dydx

= 0.

Usando las igualdades ∂E∂x = M y ∂E

∂y = N, resulta:

M(x, y(x)) + N(x, y(x))dydx

= 0⇒ M(x, y(x)) dx + N(x, y(x)) dy = 0.

Esto prueba que y(x) es solución de la ecuación diferencial. Bajo ciertas hipótesis de regulari-dad, puede demostrarse la existencia de una función potencial E(x, y).

Ejemplo 1.10. Resolvamos la ecuación diferencial

2xy dx + (x2 − 1) dy = 0.

En este caso, M(x, y) = 2xy y N(x, y) = x2 − 1. Derivando, obtenemos

∂M∂y

=∂

∂y(2xy) = 2x y

∂N∂x

=∂

∂y(x2 − 1) = 2x,

lo que demuestra que la ecuación es exacta.Para calcular un potencial, hemos de resolver el sistema

∂E∂x

= 2xy ≡ M(x, y),

∂E∂y

= x2 − 1 ≡ N(x, y).

Integrando respecto de x en la primera ecuación, resulta:

E(x, y) =∫

∂E∂x

dx =∫

2xy dx = y∫

2x dx = x2y + g(y).

Observemos que al integrar la función de dos variables E(x, y) respecto de la variable x, la«constante» de integración que aparece no es realmente una constante, sino una función de lavariable y; en efecto, para cualquier función g(y) se verifica que

∂x(x2y + g(y)) =

∂x(x2y) +

∂xg(y) = 2xy + 0 = 2xy.

A continuación, derivamos la expresión obtenida para E(x, y) respecto de la variable y:

∂E∂y

=∂

∂y(x2y + g(y)) = x2 + g′(y),

y sustituimos en la segunda ecuación del sistema:

��x2 + g′(y) =��x2 − 1⇒ g′(y) = −1⇒ g(y) =∫(−1)dy = −y.

Page 16: Apuntes MatemáticasII

16

Por tanto, una función potencial viene dada por

E(x, y) = x2y− y = (x2 − 1) y.

La solución general de la ecuación diferencial será entonces

E(x, y) = C ⇒ (x2 − 1) y = C ⇒ y =C

x2 − 1.

En el desarrollo anterior, para calcular el potencial E(x, y) hemos partido de la primeraecuación. Vamos a ver qué sucede si comenzamos integrando en la segunda ecuación:

E(x, y) =∫

∂E∂y

dy =∫(x2 − 1) dy = (x2 − 1)

∫dy = (x2 − 1)y + h(x).

Derivando respecto de x y sustituyendo en la primera ecuación, resulta:

��2xy + h′(x) =�

�2xy⇒ h′(x) = 0⇒ h(x) = c,

donde c puede ser cualquier constante; tomemos c = 0, y así h(x) = 0. El potencial es entoncesE(x, y) = (x2 − 1) y y la solución general (x2 − 1) y = C. Obtenemos pues el mismo resultadoque en la primera parte del ejemplo, como era de esperar.

Podemos resolver la ecuación usando Sage si la escribimos en forma normal:sage: # Ejemplo 1.10sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == -2*x*y/(x^2-1)sage: desolve(ec , y)c/(x^2 - 1)

Ejemplo 1.11. Sea la ecuación diferencial

(sen(xy) + xy cos(xy)) dx + x2 cos(xy) dy = 0.

Llamemos M(x, y) = sen(xy) + xy cos(xy) y N(x, y) = x2 cos(xy)dy, y notemos que

∂M∂y

= x cos(xy)− x2y sen(xy) + x cos(xy)

∂N∂x

= 2x cos(xy) + x2y sen(xy)

⇒∂M∂y

=∂N∂x

,

lo que prueba que la ecuación es exacta.Para calcular el potencial E(x, y) consideramos el sistema de ecuaciones

∂E∂x

= sen(xy) + xy cos(xy) ≡ M(x, y),

∂E∂y

= x2 cos(xy) ≡ N(x, y).

Page 17: Apuntes MatemáticasII

1.4 Ecuaciones exactas 17

En este caso es más sencillo integrar primero la segunda ecuación:

E(x, y) =∫

∂E∂y

dy =∫

x2 cos(xy) dy = x2∫

cos(xy) dy = x sen(xy) + g(x).

Derivando respecto de x, resulta:

∂E∂x

= sen(xy) + xy cos(xy) + g′(x).

Ahora sustituimos la expresión anterior en la primera ecuación:

����sen(xy) +���

���xy cos(xy) + g′(x) =����sen(xy) +���

���xy cos(xy)⇒ g′(x) = 0⇒ g(x) = c,

siendo c una constante arbitraria. Tomando c = 0, obtenemos g(x) = 0. Así pues, un potenciales

E(x, y) = x sen(xy),

y la solución general de la ecuación diferencial, en forma implícita, viene dada por

x sen(xy) = C.

También Sage es capaz de resolver esta ecuación, si previamente la hemos escrito en formanormal:sage: # Ejemplo 1.11sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == -(sin(x*y)+x*y*cos(x*y))/(x^2* cos(x*y))sage: desolve(ec , y)x*sin(x*y(x)) == c

En caso de que Sage no pueda obtener una solución de forma directa, cabe la posibilidadde realizar todo el proceso de resolución. Vamos a ilustrarlo con la ecuación del ejemplo.

En primer lugar, definimos las funciones M(x, y) y N(x, y), y comprobamos la condiciónde exactitud:sage: # Ejemplo 1.11sage: var(’x, y’)sage: # definimos M y Nsage: M = sin(x*y)+x*y*cos(x*y)sage: N = x^2* cos(x*y)sage: # comprobamos la exactitudsage: diff(M, y)-diff(N, x)0

A continuación resolvemos la ecuación ∂E∂x = M(x, y) mediante integración:

sage: # hacemos la integral de M respecto de xsage: # para calcular el potencial Esage: E = integral(M, x); expand(E)x*sin(x*y)

Como Sage ha calculado sólo la primitiva más simple, añadimos una función dependiente dela variable y:

Page 18: Apuntes MatemáticasII

18

sage: # sumamos una "constante" dependiente de ysage: g = function(’g’, y)sage: EE = E + g; expand(EE)x*sin(x*y) + g(y)

A continuación, derivamos la expresión obtenida respecto de y e igualamos a N(x, y):sage: # derivamos respecto de y e igualamos a Nsage: ec = diff(EE, y) == N; expand(ec)x^2*cos(x*y) + D[0](g)(y) == x^2*cos(x*y)

Calculamos g(y) despejando e integrando:sage: # despejamos g ’(y)sage: dg = solve(ec, diff(g,y)); dg[D[0](g)(y) == 0]sage: # integramos g ’(y) respecto de ysage: g = integrate(dg[0]. rhs(), y); g0

(nótese que dg representa una ecuación; para considerar su segundo miembro, que es el valorobtenido para g(y), usamos la notación dg[0].rhs()1). Por último, definimos el potencialE(x, y):sage: # definimos el potencialsage: E = E + g; expand(E)x*sin(x*y)

1.5. Problemas de valor inicial

Hemos visto que la solución general de una ecuación diferencial de primer orden, quesupondremos escrita en forma normal:

y′ = f (x, y),

depende de una constante arbitraria C, esto es, y ≡ y(x, C). En particular, la ecuación diferen-cial posee un número infinito de soluciones, aunque todas ellas se diferencian únicamente enel valor de la constante C.

Supongamos que estamos interesados en elegir, de entre todas las posibles soluciones,aquella que en el punto a toma un cierto valor y0. En tal caso, estamos ante un problema devalor inicial o problema de Cauchy:{

y′ = f (x, y), x ∈ [a, b],

y(a) = y0.

1Podemos dar una explicación un poco más técnica de la notación. El valor dg representa una lista o conjunto deecuaciones que, en este ejemplo, consta de un único elemento, ya que sólo estamos considerando una ecuación. Loselementos de una lista se enumeran comenzando con el índice 0, por eso dg[0] hace referencia al primer elementode la lista. En lenguaje informático, dg[0] es un objeto, esto es, una estructura con determinados contenidos yaplicaciones (o métodos) asociadas a ella. Para acceder a los contenidos de un objeto se usa un punto (.) detrásdel nombre del objeto. De esta forma, dg[0].rhs denota un método que devuelve el miembro de la derecha (rhs:right hand side, en inglés) de la ecuación representada por dg[0]; los paréntesis vacíos hacen que se ejecute dichométodo sin ningún argumento extra. En general, si queremos ver los métodos asociados a un objeto en Sage, bastacon escribir el nombre del objeto seguido de un punto y pulsar la tecla de tabulación.

Page 19: Apuntes MatemáticasII

1.6 Aplicación: calentamiento de edificios 19

La condición y(a) = y0 se denomina condición inicial. Bajo hipótesis adecuadas de regularidadsobre la función f (x, y), puede demostrarse que el problema de valor inicial posee una únicasolución. El valor correspondiente de la constante C se determina imponiendo la condicióninicial en la solución general; dicho de otro modo, hay que resolver la ecuación y(a, C) = y0.

Ejemplo 1.12. Consideremos el problema de valor inicial{y′ = 2xy,

y(0) = 1.

La solución general de la ecuación y′ = 2xy es, según vimos en el ejemplo 1.3,

y(x, C) ≡ y = Cex2.

Imponiendo la condición inicial, resulta:

y(0) = 1⇒ Ce02= 1⇒ C = 1.

Por tanto, la única solución del problema de valor inicial es

y = ex2.

El siguiente código resuelve el problema de valor inicial en Sage:

sage: # Ejemplo 1.12sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x) == 2*x*ysage: sol = desolve(ec, y, ics=[0, 1]) # ics=[a, y(a)]sage: sole^(x^2)

Es posible representar gráficamente esta solución de forma muy simple. Si, por ejemplo, que-remos dibujarla en el intervalo [0, 1], hacemos:

sage: plot(sol , [0, 1])

para obtener el resultado de la figura 1.2.

1.6. Aplicación: calentamiento de edificios

Vamos a estudiar un modelo que describe la evolución de la temperatura en el interiorde un edificio. Para ello, denotemos por T(t) dicha temperatura en el instante de tiempo t.Supondremos que las variaciones de temperatura dependen de tres factores: la temperaturaexterior, el calor generado en el interior del edificio y el efecto del sistema de calefacción o deaire acondicionado. De forma más específica:

El calor producido por las personas, luces, maquinaria, etc. en el interior del edificiocausan un incremento de la temperatura que denotaremos por H(t), siendo esta funciónno negativa.

Page 20: Apuntes MatemáticasII

20

Figura 1.2: Solución del ejemplo 1.12 en el intervalo [0, 1].

Las variaciones de temperatura producidas por el sistema de calefacción/refrigeraciónse representan mediante una función U(t), que será positiva para la calefacción y nega-tiva para el aire acondicionado.

Por último, hay que considerar el efecto de la temperatura exterior Te(t) sobre el edificio.Factores experimentales muestran que este efecto puede modelizarse usando la ley delenfriamiento de Newton, que establece que el ritmo de cambio de la temperatura T(t) esproporcional a la diferencia entre la temperatura exterior Te(t) y la interior T(t).

Expresando en términos matemáticos los puntos anteriores, podemos considerar la si-guiente ecuación diferencial de primer orden:

dTdt

= k(Te(t)− T(t)) + H(t) + U(t).

El ritmo de cambio de la temperatura T(t) se expresa mediante su derivada respecto del tiem-po, dT

dt . La constante de proporcionalidad k se supone positiva y depende de las propiedadesfísicas del edificio: número de puertas y ventanas, tipo de aislamiento, etc.

Observación. Respecto a las unidades de medida, supondremos que la temperatura vienedada en grados Celsius (◦C) y el tiempo en horas (h); en consecuencia, la variación de tempe-ratura dT

dt se mide en ◦C/h. La constante k tiene como unidad h−1. En general, las funcionesH(t) y U(t) se expresan en términos de energía por unidad de tiempo, kcal/h. Si embargo,multiplicando ambas cantidades por la capacidad calorífica del edificio (cuyas unidades son◦C/kcal), podemos suponer que tanto H(t) como U(t) vienen dadas en ◦C/h.

Observación. Supongamos que H(t) ≡ 0 y U(t) ≡ 0, por lo que la ecuación se reduce a

dTdt

= k(Te(t)− T(t))

Page 21: Apuntes MatemáticasII

1.6 Aplicación: calentamiento de edificios 21

(esta es la expresión de la ley de Newton). Cuando la temperatura exterior es mayor quela interior, Te(t)− T(t) > 0, se tiene que T′(t) > 0, lo que significa que T(t) es una funcióncreciente: la temperatura del edificio se incrementa. Si, por el contrario, la temperatura exteriores menor que la interior, Te(t)− T(t) < 0, entonces T′(t) < 0, por lo que la temperatura deledificio disminuye.

Observación. El valor K = 1/k se denomina constante de tiempo del edificio, y representa eltiempo que se necesita para que la temperatura del edificio cambia de forma sustancial. Unvalor típico podría estar entre dos y cuatro horas, aunque puede ser mucho menor si se abrenlas ventanas o se utilizan ventiladores; por el contrario, la constante de tiempo puede sermucho mayor si el edificio está bien aislado.

Si reescribimos la ecuación de la siguiente forma:

dTdt

= −kT(t) + kTe(t) + H(t) + U(t),

queda claro que es de tipo lineal, por lo que podemos resolverla usando el método de variaciónde la constante. En primer lugar, determinamos la solución general de la ecuación homogéneaasociada:

dTdt

= −kT ⇒∫ dT

T= −

∫k dt⇒ log(T) = −kt + c⇒ TH(t, C) = Ce−kt,

donde hemos sustituido ec por una constante arbitraria C. A continuación, buscamos unasolución particular de la forma TP(t) = C(t)e−kt; sustituyendo en la ecuación, resulta:

C′(t)e−kt −�����

kC(t)e−kt = −�����

kC(t)e−kt + kTe(t) + H(t) + U(t)⇒

C′(t) = ekt(kTe(t) + H(t) + U(t))⇒ C(t) =∫

ekt(kTe(t) + H(t) + U(t)) dt,

de dondeTP(t) = e−kt

∫ekt(kTe(t) + H(t) + U(t)) dt.

Por último, la solución general de la ecuación completa será

T(t, C) ≡ T(t) = e−kt( ∫

ekt(kTe(t) + H(t) + U(t)) dt + C)

.

Para completar el modelo, es necesario conocer la temperatura inicial del edificio, esto es,hay que considerar una condición inicial de la forma

T(0) = T0,

donde T0 es la temperatura del edificio en el instante inicial t = 0. Imponiendo esta condicióninicial en la solución general, es posible determinar el valor de la constante de integración C.

Ejemplo 1.13. Consideremos un edificio en el que el ritmo de calor adicional H(t) ≡ π48◦C/h

es constante y no se usa calefacción ni aire acondicionado: U(t) ≡ 0. Supongamos que latemperatura exterior varía según la función

Te(t) = 23− 7 cos(

π12 t)

,

Page 22: Apuntes MatemáticasII

22

Figura 1.3: Temperatura interior: T(t). Temperatura exterior: Te(t).

esto es, se supone que la temperatura exterior cambia de forma sinusoidal en un períodode 24 horas, con su mínimo en t = 0 (medianoche) y su máximo en t = 12 (mediodía).Supongamos asimismo que k = π

12 h−1, por lo que la constante de temperatura del edificio,1/k, es aproximadamente de cuatro horas. La situación descrita podría corresponder a laprimavera, cuando no usamos ni la calefacción ni el aire acondicionado y las variaciones detemperatura son suaves.

En este caso, la temperatura interior del edificio viene dada por la siguiente función:

T(t) = e−kt( ∫

ekt(kTe(t) + H0) dt + C)

= e−kt(− 7k

∫ekt cos

(π12 t)

dt + (23k + H0)∫

ekt dt + C)

.

Integrando por partes el primer sumando y sustituyendo los valores de k y H0, obtenemos:

T(t) = 934 −

72

(cos

(π12 t)+ sen

(π12 t))

+ Ce−π12 t.

Supongamos ahora que la temperatura inicial (esto es, a medianoche) en el interior deledificio es de 20 ◦C. Imponiendo esta condición sobre T(t), podemos calcular el valor de laconstante de integración C:

T(0) = 20⇒ 934 −

72 + C = 20⇒ C = 1

4 .

La solución del problema de valor inicial es, finalmente,

T(t) = 934 −

72

(cos

(π12 t)+ sen

(π12 t))

+ 14 e−

π12 t.

En la figura 1.3 se muestran las evoluciones de las temperaturas interior y exterior del edificiodurante un período de 24 horas.

Damos a continuación un código Sage para resolver el problema y representar gráficamen-te tanto la solución T(t) como la evolución de la temperatura exterior Te(t).

Page 23: Apuntes MatemáticasII

1.6 Aplicación: calentamiento de edificios 23

sage: var(’t’)sage: k = pi/12sage: Te = 23-7*cos(pi*t/12)sage: H = pi/48sage: U = 0sage: T = function(’T’, t)sage: ec = diff(T, t) == k*(Te -T) + H + Usage: sol = desolve(ec, T, ics=[0, 20])sage: expand(sol)1/4*e^( -1/12*pi*t) - 7/2* sin (1/12* pi*t) - 7/2* cos (1/12* pi*t) + 93/4sage: # Dibujamossage: fig1 = plot(sol , t, 0, 24, color=’blue’,

legend_label=’Temp. interna ’) # figura para Tsage: fig2 = plot(Te, t, 0, 24, color=’red’,

legend_label=’Temp. externa ’) # figura para Tesage: fig = fig1 + fig2 # unimos ambas figurassage: fig.show() # mostramos el resultado

El parámetro legend_label dentro de la instrucción plot se ha utilizado para etiquetar lasgráficas. El resultado obtenido puede verse en la figura 1.3.

Supongamos que queremos determinar la temperatura máxima que se alcanza en el inte-rior del edificio durante un periodo de 24 horas. Para ello, podemos usar el siguiente comando:sage: sol.find_maximum_on_interval (0, 24)(28.204675639897779 , 14.996195034422906)

El primer número corresponde al valor máximo de la temperatura y el segundo al instante enque éste se alcanza. De forma análoga, para determinar la temperatura mínima, hacemossage: sol.find_minimum_on_interval (0, 24)(18.412953900017136 , 3.086010596200699)

Como vemos, los resultados son consistentes con la representación gráfica de la solución.

Page 24: Apuntes MatemáticasII

24

Page 25: Apuntes MatemáticasII

2 Ecuaciones diferenciales de orden superior y sistemas 25

2. Ecuaciones diferenciales de orden superior y sistemas

2.1. Introducción

Una ecuación diferencial ordinaria de orden n es una ecuación que relaciona una variableindependiente x con una variable dependiente y ≡ y(x) y sus derivadas hasta el orden n. Suforma general es la siguiente:

F(x, y, y′, y′′, . . . , y(n)) = 0, x ∈ [a, b].

La ecuación está escrita en forma normal si la derivada de orden n aparece despejada:

y(n) = f (x, y, y′, . . . , y(n−1)), x ∈ [a, b].

Una solución de la ecuación diferencial es una función y : [a, b] → R que satisface la ecua-ción en cada punto x ∈ [a, b]. Dicha función ha de ser regular, en el sentido de ser derivabletantas veces como indique el orden de la ecuación, siendo continuas todas las derivadas; ental caso se dice que y(x) es una función de clase Cn([a, b]).

Ejemplo 2.1. La función y : R → R definida como y(x) = sen(2x) es solución de la ecuacióndiferencial de orden dos (o segundo orden)

y′′ = −4y.

En primer lugar, notemos que la función y(x) es de clase dos, ya que tanto y′(x) = 2 cos(2x)como y′′(x) = −4 sen(2x) son funciones continuas. Además, se verifica la ecuación para cadapunto x ∈ R:

y′′(x) = −4 sen(2x) = −4y(x).

Es inmediato hacer la comprobación anterior usando Sage:sage: # Ejemplo 2.1sage: var(’x’)sage: y = sin (2*x)sage: diff(y, x, 2) + 4*y0

La solución general de una ecuación diferencial de orden n es una familia de funciones quedeterminan todas las posibles soluciones de la ecuación. Dicha solución general depende de nparámetros o constantes arbitrarias: y ≡ y(x, C1, C2, . . . , Cn).

Ejemplo 2.2. La solución general de la ecuación diferencial y′′ = −4y es

y = C1 sen(2x) + C2 cos(2x),

siendo C1 y C2 constantes arbitrarias. Es fácil comprobar que todas las funciones de estaforma verifican la ecuación diferencial; más adelante veremos que estas son todas las posiblessoluciones.

Veamos cómo usar Sage para hacer la comprobación:

Page 26: Apuntes MatemáticasII

26

sage: # Ejemplo 2.2sage: var(’x, C1 , C2’)sage: y = C1*sin (2*x) + C2*cos (2*x)sage: diff(y, x, 2) + 4*y0

También podemos resolver la ecuación directamente:sage: # Ejemplo 2.2sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) == -4*ysage: desolve(ec , y)k1*sin (2*x) + k2*cos (2*x)

Dada una ecuación diferencial de orden n (que supondremos escrita en forma normal), po-demos complementarla con n condiciones iniciales que establecen los valores que deben tomarla solución y sus derivadas en un cierto punto. Estamos entonces ante lo que se denomina unproblema de valores iniciales o problema de Cauchy. Su forma es la siguiente:

y(n) = f (x, y, y′, . . . , y(n−1)), x ∈ [a, b],

y(a) = y0,

y′(a) = y1,...

y(n−1)(a) = yn−1,

donde y0, y1, . . . , yn−1 son datos del problema. Nótese que un problema de valores inicialesposee, en general, solución única. Para determinarla, primero se obtiene la solución generalde la ecuación, que dependerá de n constantes arbitrarias, y luego se determina el valor de lasconstantes utilizando las condiciones iniciales.

Ejemplo 2.3. Consideremos el problema de valores inicialesy′′ = −4y,

y(0) = 1,

y′(0) = 0.

Como vimos en el ejemplo anterior, la solución general de la ecuación y′′ = −4y es

y = C1 sen(2x) + C2 cos(2x).

Determinemos C1 y C2 usando las condiciones iniciales. Por un lado, usando la primera con-dición inicial tenemos que

y(0) = 1⇒ C1 sen 0 + C2 cos 0 = 1⇒ C2 = 1.

Como y′(x) = 2C1 cos(2x)− 2C2 sen(2x), de la segunda condición deducimos que

y′(0) = 0⇒ 2C1���:1

cos 0− 2C2���:0

sen 0 = 0⇒ C1 = 0.

Page 27: Apuntes MatemáticasII

2.2 Ecuaciones lineales de segundo orden 27

Por tanto, la única solución del problema del problema de valores iniciales es

y = cos(2x).

El código Sage correspondiente es el siguiente:

sage: # Ejemplo 2.3sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) == -4*ysage: desolve(ec , y, ics=[0, 1, 0]) # ics=[a, y0 , y0 ’]cos (2*x)

El análisis de las ecuaciones diferenciales generales de orden n requiere el uso de herra-mientas matemáticas avanzadas que están más allá del alcance de este trabajo. Centraremospor ello nuestro estudio en un tipo particular de ecuaciones de segundo orden, las de tipolineal, que aparecen con bastante frecuencia en las aplicaciones.

2.2. Ecuaciones lineales de segundo orden

Una ecuación diferencial de segundo orden es lineal si puede escribirse de la siguienteforma:

y′′ + p(x)y′ + q(x)y = r(x),

donde p(x), q(x) y r(x) son funciones conocidas de la variable x.Dentro de las ecuaciones lineales de segundo orden, distinguimos varios tipos:

Si r(x) ≡ 0, la ecuación se denomina homogénea: y′′ + p(x)y′ + q(x)y = 0.

Si r(x) 6≡ 0, se dice que la ecuación es completa.

Si los coeficientes p(x) y q(x) son constantes, la ecuación es de coeficientes constantes:y′′ + py′ + qy = r(x), donde p, q ∈ R. Obsérvese que el término independiente r(x) notiene por qué ser constante.

La solución general de una ecuación diferencial lineal de segundo orden depende de dosconstantes arbitrarias:

y ≡ y(x, C1, C2).

De modo análogo a las ecuaciones lineales de primer orden, dicha solución general tiene lasiguiente estructura:

y(x, C1, C2) = yH(x, C1, C2) + yP(x),

donde yH(x, C1, C2) es la solución general de la ecuación homogénea asociada e yP(x) es unasolución particular de la ecuación completa.

Puede demostrarse que la estructura de la solución general de la ecuación homogénea esla siguiente:

yH(x, C1, C2) = C1y1(x) + C2y2(x),

Page 28: Apuntes MatemáticasII

28

donde y1 e y2 son soluciones particulares de la ecuación homogénea que verifican la siguientepropiedad: ∣∣∣∣y1(x) y2(x)

y′1(x) y′2(x)

∣∣∣∣ 6= 0, ∀ x ∈ R.

El determinante anterior se denomina wronskiano, y se denota por W(y1, y2). Si se verifica lacondición anterior, diremos que las soluciones y1 e y2 son linealmente independientes, o queforman un sistema fundamental de soluciones.

Ejemplo 2.4. Consideremos la ecuación homogénea y′′ + 4y = 0. Es inmediato comprobarque tanto y1(x) = sen(2x) como y2(x) = cos(2x) son soluciones de la ecuación. Además, sonlinealmente independientes:

W(y1, y2) =

∣∣∣∣ sen(2x) cos(2x)2 cos(2x) −2 sen(2x)

∣∣∣∣ = −2(���

������

��:1sen2(2x) + cos2(2x)) = −2 6= 0, ∀ x ∈ R.

En consecuencia, la solución general de la ecuación homogénea es

y = C1 cos(2x) + C2 sen(2x).

En resumen, para determinar la solución general de una ecuación lineal completa, es ne-cesario calcular:

dos soluciones particulares de la ecuación homogénea asociada, que sean linealmenteindependientes : y1(x), y2(x);

una solución particular de la ecuación completa: yP(x).

La solución general de la ecuación completa será entonces

y = C1y1(x) + C2y2(x) + yP(x), C1, C2 ∈ R.

La verdadera dificultad está en la determinación de dichas soluciones particulares, que sólopodrá realizarse en determinados casos. En particular, en las siguientes secciones analizaremosel caso de las ecuaciones lineales con coeficientes constantes.

2.3. Ecuaciones lineales homogéneas con coeficientes constantes

En esta sección vamos a analizar la forma de la solución general de una ecuación linealhomogénea con coeficientes constantes:

y′′ + py′ + qy = 0,

donde p, q ∈ R.Se define el polinomio característico de la ecuación como

P(λ) = λ2 + pλ + q,

y la ecuación característica asociada como P(λ) = 0, esto es:

λ2 + pλ + q = 0.

Al ser el polinomio característico de segundo grado, hay tres posibilidades en lo que respectaa la naturaleza de sus raíces. Concretamente, P(λ) puede tener:

Page 29: Apuntes MatemáticasII

2.3 Ecuaciones lineales homogéneas con coeficientes constantes 29

I. Dos raíces reales distintas: λ1 6= λ2.

II. Una raíz real doble: λ ≡ λ1 = λ2.

III. Raíces complejas conjugadas: λ = a± bi, donde i es la unidad imaginaria y b 6= 0.

En cada caso, la solución general de la ecuación homogénea puede calcularse de forma directa.Analicemos a continuación cada uno de los casos.

I. Raíces reales distintas: λ1 6= λ2. Un sistema fundamental de soluciones viene dado por lasfunciones

y1(x) = eλ1x, y2(x) = eλ2x.

En efecto, para i = 1, 2 se verifica

y′′i + py′i + qyi = λ2i eλix + pλieλix + qeλix = (λ2

i + pλi + q)eλix = P(λi)eλix = 0,

ya que P(λi) = 0 por ser λi raíz del polinomio característico; esto prueba que cada yi essolución de la ecuación homogénea. Además, teniendo en cuenta que λ1 6= λ2,

W(y1, y2) =

∣∣∣∣ eλ1x eλ2x

λ1eλ1x λ2eλ2x

∣∣∣∣ = (λ2 − λ1)e(λ1+λ2)x 6= 0, ∀ x ∈ R.

En consecuencia, la solución general de la ecuación homogénea es

y = C1eλ1x + C2eλ2x.

Ejemplo 2.5. Consideremos la ecuación homogénea

y′′ − 5y′ + 6y = 0.

Su polinomio característico es P(λ) = λ2 − 5λ + 6. Calculemos sus raíces:

P(λ) = 0⇒ λ2 − 5λ + 6 = 0⇒ λ =5±√

52 − 4 · 62

=5± 1

2⇒{

λ1 = 3,

λ2 = 2.

Al ser las raíces reales y distintas, la solución general de la ecuación es

y = C1e3x + C2e2x.

Sage nos da el siguiente resultado:

sage: # Ejemplo 2.5sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) - 5*diff(y, x) + 6*y == 0sage: desolve(ec , y)k1*e^(3*x) + k2*e^(2*x)

Page 30: Apuntes MatemáticasII

30

II. Raíz real doble: λ. Las funciones

y1(x) = eλx, y2(x) = xeλx

constituyen un sistema fundamental de soluciones. Es inmediato comprobar que ambas fun-ciones son soluciones de la ecuación; además,

W(y1, y2) =

∣∣∣∣ eλx xeλx

λeλx (1 + λx)eλx

∣∣∣∣ = (1 + λx)e2λx − λxeλx = e2λx 6= 0, ∀ x ∈ R.

Por tanto, la solución general de la ecuación homogénea es

y = C1eλx + C2xeλx = (C1 + C2x) eλx.

Ejemplo 2.6. Resolvamos la ecuación

y′′ − 2y′ + y = 0.

El polinomio característico es P(λ) = λ2 − 2λ + 1, que tiene una raíz real doble: λ = 1. Portanto, la solución general de la ecuación es

y = (C1 + C2x) ex.

He aquí el código Sage correspondiente:

sage: # Ejemplo 2.6sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) - 2*diff(y, x) + y == 0sage: desolve(ec , y)(k2*x + k1)*e^x

III. Raíces complejas conjugadas: a± bi, b 6= 0. En este caso, un sistema fundamental de solu-ciones lo constituyen las funciones

y1(x) = eax cos(bx), y2(x) = eax sen(bx).

Es inmediato verificar que ambas funciones son soluciones de la ecuación. Como además

W(y1, y2) =

∣∣∣∣ eax cos(bx) eax sen(bx)eax(a cos(bx)− b sen(bx)) eax(a sen(bx) + b cos(bx))

∣∣∣∣= be2ax(

�����

������:1

sen2(bx) + cos2(bx)) = be2ax 6= 0, ∀ x ∈ R,

deducimos que la solución general de la ecuación viene dada por

y = eax(C1 cos(bx) + C2 sen(bx)).

Page 31: Apuntes MatemáticasII

2.4 Método de variación de las constantes 31

Ejemplo 2.7. Consideremos la ecuación

y′′ + 2y′ + 5y = 0.

La ecuación característica asociada es λ2 + 2λ + 5 = 0, cuyas raíces son −1± 2i. Por tanto, lasolución general de la ecuación será

y = e−x(C1 cos(2x) + C2 sen(2x)).

El código Sage para resolver la ecuación es:sage: # Ejemplo 2.7sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) + 2*diff(y, x) + 5*y == 0sage: desolve(ec , y)(k1*sin (2*x) + k2*cos(2*x))*e^(-x)

Hemos visto que es posible determina la solución general de la ecuación lineal homogéneaen el caso de coeficientes constantes. En la siguiente sección estudiaremos un método paracalcular una solución particular de la ecuación completa.

2.4. Método de variación de las constantes

Consideremos la ecuación lineal con coeficientes constantes dada por

y′′ + py′ + qy = r(x),

donde p, q ∈ R y r(x) es una función conocida, cuya solución general tiene la siguienteestructura:

y ≡ y(x, C1, C2) = yH(x, C1, C2) + yP(x).

La solución general de la ecuación homogénea asociada, yH(x, C1, C2), puede determinarse enfunción de las raíces del polinomio característico asociado, como vimos en la sección anterior.A continuación vamos a ver cómo construir una solución particular, yP(x), usando para elloel método de variación de las constantes.

Observación. Otro método habitual para determinar una solución particular es el conocidocomo método de coeficientes indeterminados.

Sabemos que la solución general de la ecuación homogénea asociada es de la forma

yH(x, C1, C2) = C1y1(x) + C2y2(x),

donde {y1, y2} es un sistema fundamental de soluciones y C1, C2 ∈ R. La idea del métodode variación de las constantes consiste en construir una solución particular de la ecuacióncompleta que tenga la forma

yP(x) = C1(x)y1(x) + C2(x)y2(x),

Page 32: Apuntes MatemáticasII

32

siendo C1(x) y C2(x) funciones a determinar. Nótese que la misma idea se aplicó cuandoestudiamos las ecuaciones lineales de primer orden.

Las funciones C1(x) y C2(x) se calculan sustituyendo yP en la ecuación completa. Comen-cemos calculando la primera derivada de yP:

y′P(x) = C1(x)y′1(x) + C2(x)y′2(x) + C′1(x)y1(x) + C′2(x)y2(x).

En este punto, haremos la siguiente suposición:

C′1(x)y1(x) + C′2(x)y2(x) = 0,

que será fundamental en los cálculos posteriores. Podemos escribir entonces

y′P(x) = C1(x)y′1(x) + C2(x)y′2(x).

Derivando de nuevo, obtenemos

y′′P(x) = C1(x)y′′1 (x) + C2(x)y′′2 (x) + C′1(x)y′1(x) + C′2(x)y′2(x).

Sustituyendo ahora yP en la ecuación y agrupando convenientemente los términos, resulta:

C1(x)(y′′1 (x) + py′1(x) + qy1(x))+C2(x)(y′′2 (x) + py′2(x) + qy2(x))

+ C′1(x)y′1(x) + C′2(x)y′2(x) = r(x).

Teniendo en cuenta que y1 e y2 son soluciones de la ecuación homogénea, la expresión anteriorqueda de la siguiente forma:

C′1(x)y′1(x) + C′2(x)y′2(x) = r(x).

Resumiendo, hemos llegado al sistema de ecuacionesC′1(x)y1(x) + C′2(x)y2(x) = 0,

C′1(x)y′1(x) + C′2(x)y′2(x) = r(x),

cuyas incógnitas son C′1(x) y C′2(x). Este sistema es compatible determinado, ya que el deter-minante de la matriz de coeficientes coincide con el wronskiano W(y1, y2), que no se anula enningún punto x ∈ R por ser {y1, y2} un sistema fundamental de soluciones. En consecuencia,el sistema admite una única solución que puede calcularse mediante la regla de Cramer:

C′1(x) =

∣∣∣∣ 0 y2(x)r(x) y′2(x)

∣∣∣∣∣∣∣∣y1(x) y2(x)y′1(x) y′2(x)

∣∣∣∣ =−y2(x)r(x)W(y1, y2)

, C′2(x) =

∣∣∣∣y1(x) 0y′1(x) r(x)

∣∣∣∣∣∣∣∣y1(x) y2(x)y′1(x) y′2(x)

∣∣∣∣ =y1(x)r(x)W(y1, y2)

.

Por último, integramos las expresiones obtenidas en el paso anterior:

C1(x) =∫ −y2(x)r(x)

W(y1, y2)dx, C2(x) =

∫ y1(x)r(x)W(y1, y2)

dx.

Una vez calculadas C1(x) y C2(x), podemos construir la solución particular yP.

Page 33: Apuntes MatemáticasII

2.4 Método de variación de las constantes 33

Observación. La posibilidad de aplicar el método de variación de las constantes dependeráde la dificultad que tenga el cálculo de las integrales anteriores.

Ejemplo 2.8. Consideremos la ecuación diferencial

y′′ − 4y = ex.

En primer lugar, notemos que la ecuación característica es λ2 − 4 = 0, que tiene a λ1 = 2y λ2 = −2 como raíces. Por tanto, la solución general de la ecuación homogénea asociada,y′′ − 4y = 0, será

yH(x, C1, C2) = C1e2x + C2e−2x,

siendo C1 y C2 constantes arbitrarias.A continuación, y siguiendo el método de variación de las constantes, construimos una

solución particular de la ecuación completa de la forma

yP(x) = C1(x)y1(x) + C2(x)y2(x),

donde y1(x) = e2x e y2(x) = e−2x. Las funciones {y1, y2} forman un sistema fundamental desoluciones de la ecuación homogénea, cuyo wronskiano es

W(y1, y2) =

∣∣∣∣ e2x e−2x

2e2x −2e−2x

∣∣∣∣ = −4.

Las funciones C1(x) y C2(x) se determinan calculando las siguientes integrales:

C1(x) =∫ −y2(x)r(x)

W(y1, y2)dx =

∫ −e−2xex

−4dx = 1

4

∫e−xdx = − 1

4 e−x,

C2(x) =∫ y1(x)r(x)

W(y1, y2)dx =

∫ e2xex

−4dx = − 1

4

∫e3xdx = − 1

12 e3x.

La solución particular buscada es, por tanto,

yP(x) = − 14 e−xe2x − 1

12 e3xe−2x = − 13 ex.

Finalmente, la solución general de la ecuación completa será

y(x) = C1e2x + C2e−2x − 13 ex.

Veamos como resolver el ejemplo con Sage:

sage: # Ejemplo 2.8sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) - 4*y == exp(x)sage: desolve(ec , y)k1*e^(2*x) + k2*e^(-2*x) - 1/3*e^x

Page 34: Apuntes MatemáticasII

34

Ejemplo 2.9. Resolvamos la ecuación

y′′ + y =1

sen(x).

La ecuación característica es λ2 + 1 = 0, cuyas raíces son λ = ±i. De este modo, la soluciónde la ecuación homogénea asociada será

yH(x, C1, C2) = C1 sen(x) + C2 cos(x),

donde C1, C2 ∈ R. El wronskiano del sistema fundamental formado por y1(x) = sen(x) ey2(x) = cos(x) es

W(y1, y2) =

∣∣∣∣sen(x) cos(x)cos(x) − sen(x)

∣∣∣∣ = −(����������:1

sen2(x) + cos2(x)) = −1.

Buscamos ahora una solución particular de la ecuación completa de la forma

yP(x) = C1(x) sen(x) + C2(x) cos(x),

donde

C1(x) =∫ −y2(x)r(x)

W(y1, y2)dx =

∫ cos(x)sen(x)

dx = log(sen(x)),

C2(x) =∫ y1(x)r(x)

W(y1, y2)dx =

∫(−1)dx = −x.

En consecuencia,yP(x) = log(sen(x)) sen(x)− x cos(x).

Por último, la solución general de la ecuación completa viene dada por

y(x) = C1 sen(x) + C2 cos(x) + log(sen(x)) sen(x)− x cos(x).

¿Será capaz Sage de obtener la solución de la ecuación en este caso? Claro que sí:sage: # Ejemplo 2.9sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) + y == 1/sin(x)sage: desolve(ec , y)k1*sin(x) + k2*cos(x) - x*cos(x) + log(sin(x))*sin(x)

2.5. Problemas de valores iniciales y de contorno

Un problema de valores iniciales o de Cauchy para una ecuación lineal de segundo ordenadopta la siguiente forma:

y′′ + p(x)y′ + q(x)y = r(x), x ∈ [a, b],

y(a) = y0,

y′(a) = y1,

Page 35: Apuntes MatemáticasII

2.5 Problemas de valores iniciales y de contorno 35

siendo y0, y1 ∈ R datos del problema. En un problema de valores iniciales se especifica cuántohan de valer la solución y su primera derivada en el extremo inferior del intervalo donde se vaa resolver el problema. En general, dicho problema poseerá solución única, que se determinaimponiendo las condiciones iniciales sobre la solución general de la ecuación.

Ejemplo 2.10. Consideremos el problema de valores inicialesy′′ − 6y′ + 9y = 0,

y(0) = 1,

y′(0) = 0.

La ecuación diferencial es de coeficientes constantes y homogénea. Su ecuación característicaes λ2 − 6λ + 9 = 0, que tiene una raíz doble λ = 3; en consecuencia, la solución general estádada por:

y = (C1 + C2x)e3x.

Imponiendo las condiciones iniciales, podemos determinar las constantes C1 y C2:y(0) = 1⇒ (C1 + C2 · 0)e3·0 = 1⇒ C1 = 1,

y′(0) = 0⇒ (3C1 + C2 + 3C2 · 0)e3·0 = 0⇒ 3���1

C1 + C2 = 0⇒ C2 = −3.

Por tanto, la única solución del problema de valores iniciales es

y = (1− 3x)e3x.

Usemos Sage para resolver el problema y dibujar la solución en el intervalo [0, 1]:sage: # Ejemplo 2.10sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) - 6*diff(y, x) + 9*y == 0sage: sol = desolve(ec, y, ics=[0, 1, 0]) # ics=[a, y0, y1]sage: sol-(3*x - 1)*e^(3*x)sage: plot(sol , [0, 1])

El resultado obtenido puede verse en la figura 2.1.

Un problema de contorno o de valores en la frontera para una ecuación lineal de segundo ordentiene la siguiente forma:

y′′ + p(x)y′ + q(x)y = r(x), x ∈ [a, b],

y(a) = α,

y(b) = β,

siendo α, β ∈ R datos del problema. Las condiciones y(a) = α e y(b) = β se denominancondiciones de contorno. Notemos que en un problema de contorno se definen los valores queha de tomar la solución de la ecuación diferencial en ambos extremos del intervalo donde sequiere resolver.

Page 36: Apuntes MatemáticasII

36

Figura 2.1: Solución del ejemplo 2.10 en el intervalo [0, 1].

Ejemplo 2.11. Resolvamos el problema de contornoy′′ + 1

4 y = 0, x ∈ [0, π],

y(0) = 1,

y(π) = −1.

La ecuación característica de la ecuación diferencial es λ2 + 14 = 0, que tiene raíces λ = ± 1

2 i;la solución general tiene entonces la siguiente expresión:

y = C1 cos( x

2

)+ C2 sen

( x2

).

Para determinar las constantes C1 y C2 imponemos las condiciones de contorno:y(0) = 1⇒ C1���: 1

cos 0 + C2���: 0

sen 0 = 1⇒ C1 = 1,

y(π) = −1⇒ C1����* 0

cos π2 + C2��

��* 1sen π

2 = −1⇒ C2 = −1.

Por tanto, la solución del problema de valores iniciales es

y = cos( x

2

)− sen

( x2

).

El resultado puede obtenerse con el siguiente código Sage:sage: # Ejemplo 2.11sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) + (1/4)*y == 0sage: desolve(ec , y, ics=[0, 1, pi, -1]) # ics=[a, alfa , b, beta]-sin (1/2*x) + cos (1/2*x)

Observación. Un problema de contorno puede tener infinitas soluciones, una única solución,o ninguna solución.

Page 37: Apuntes MatemáticasII

2.6 Ecuaciones lineales de orden superior 37

2.6. Ecuaciones lineales de orden superior

El estudio de las ecuaciones diferenciales de orden mayor que dos sigue pautas similares alanálisis realizado para ecuaciones de segundo orden. Al igual que en este caso, restringiremosnuestro estudio a las ecuaciones lineales, es decir, a ecuaciones de la forma

y(n) + an−1(x)y(n−1) + · · ·+ a2(x)y′′(x) + a1(x)y′ + a0(x)y = r(x),

donde n > 3 y an−1(x), . . . , a0(x) y r(x) son funciones arbitrarias. La solución general de unaecuación lineal es de la forma

y = yH + yP,

donde yH es la solución general de la ecuación homogénea asociada:

y(n) + an−1(x)y(n−1) + · · ·+ a2(x)y′′ + a1(x)y′ + a0(x)y = 0,

mientras que yP es una solución particular de la ecuación completa. La solución general de-penderá de n constantes arbitrarias. Para plantear un problema de valores iniciales, son nece-sarias n condiciones iniciales:

y(x0) = y0,

y′(x0) = y1,

y′′(x0) = y2,...

y(n−1)(x0) = yn−1.

La solución de un problema de valores iniciales es única: el valor de las constantes que apare-cen en la solución general se determina de forma única a partir de las condiciones iniciales.

Diremos que un conjunto {y1, . . . , yn} de soluciones de la ecuación homogénea es un sis-tema fundamental si su wronskiano no se anula en ningún punto:

W(y1, . . . , yn) =

∣∣∣∣∣∣∣∣∣∣∣∣

y1(x) y2(x) · · · yn(x)y′1(x) y′2(x) · · · y′n(x)y′′1 (x) y′′2 (x) · · · y′′n(x)

......

. . ....

y(n−1)1 y(n−1)

2 · · · y(n−1)n

∣∣∣∣∣∣∣∣∣∣∣∣6= 0, ∀ x ∈ R.

Dado un sistema fundamental {y1, . . . , yn}, la solución general de la ecuación lineal homogé-nea es de la forma

yH(x) = C1y1(x) + C2y2(x) + · · ·+ Cnyn(x),

siendo C1, . . . , Cn constantes reales arbitrarias.Nos centraremos a partir de ahora en las ecuaciones lineales de coeficientes constantes, es

decir,y(n) + an−1y(n−1) + · · ·+ a2y′′ + a1y′ + a0y = r(x),

siendo an−1, . . . , a0 constantes reales. El polinomio característico asociado es

P(λ) = λn + an−1λn−1 + · · ·+ a2λ2 + a1λ + a0.

Page 38: Apuntes MatemáticasII

38

A menos que n 6 4, no se dispone de fórmulas explícitas para el cálculo de las raíces de P(λ).En general, se puede intentar aplicar algún método algebraico para el cálculo de raíces como,por ejemplo, el método de Ruffini.

Para determinar la solución general de la ecuación homogénea

y(n) + an−1y(n−1) + · · ·+ a2y′′ + a1y′ + a0y = 0,

a cada raíz del polinomio característico le asociaremos una o varias soluciones particulares,atendiendo a la naturaleza de dicha raíz:

I. Si λ es una raíz real simple, entonces una solución es eλx.

II. Si λ es un raíz real de multiplicidad m > 2, podemos considerar m soluciones distintas:

eλx, xeλx, x2eλx, . . . , xm−1eλx.

III. Si λ = a ± bi son raíces complejas simples, le asociamos dos soluciones: eax cos(bx) yeax sen(bx).

IV. Si λ = a± bi son raíces complejas de multiplicidad m > 2, tenemos 2m soluciones:

eax cos(bx), xeax cos(bx), x2eax cos(bx), . . . , xm−1eax cos(bx),

eax sen(bx), xeax sen(bx), x2eax sen(bx), . . . , xm−1eax sen(bx).

Puede probarse que las n soluciones particulares {y1, . . . , yn} así obtenidas forman un sistemafundamental de soluciones. Por tanto, la solución general de la ecuación homogénea será

yH(x) = C1y1(x) + C2y2(x) + · · ·+ Cnyn(x).

Ejemplo 2.12. Resolvamos la ecuación homogénea

y(6) + 8y(4) + 16y′′ = 0.

El polinomio característico asociado es P(λ) = λ6 + 8λ4 + 16λ2. Calculemos sus raíces:

λ6 + 8λ4 + 16λ2 = 0⇒ λ2(λ4 + 8λ2 + 16) = 0⇒{

λ = 0 (raíz real doble),

λ4 + 8λ2 + 16 = 0.

Para resolver la ecuación λ4 + 8λ2 + 16 = 0 hacemos el cambio µ = λ2:

λ4 + 8λ2 + 16 = 0⇒ µ2 + 8µ + 16 = 0⇒ µ = −4 (doble).

Por tanto, λ = ±√µ = ±√−4 = ±2i, siendo estas raíces complejas dobles.

A la raíz doble λ = 0 le corresponden las soluciones e0x = 1 y xe0x = x, mientras que alas raíces dobles ±2i les asociamos las soluciones e0x cos(2x) = cos(2x), x cos(2x), sen(2x) yx sen(2x). En consecuencia, la solución general de la ecuación será

8y(x) = C1 + C2x + C3 cos(2x) + C4x cos(2x) + C5 sen(2x) + C6x sen(2x).

En este caso, Sage no es capaz de resolver de forma directa la ecuación:

Page 39: Apuntes MatemáticasII

2.6 Ecuaciones lineales de orden superior 39

sage: # Ejemplo 2.12sage: var(’x’)sage: y = function(’y’, x)sage: ec = diff(y, x, 6) + 8*diff(y, x, 4) + 16* diff(y, x, 2) == 0sage: desolve(ec , y)Traceback (most recent call last):...NotImplementedError: Maxima was unable to solve this ODE.

De hecho, el comando desolve sólo puede resolver ecuaciones de primer y segundo orden.Más adelante, cuando estudiemos sistemas de ecuaciones, veremos como solventar este pro-blema.

Ejemplo 2.13. Vamos a resolver el siguiente problema de valores iniciales:y′′′ − 6y′′ + 11y′ − 6y = 0,

y(0) = 1,

y′(0) = 0,

y′′(0) = 0.

El polinomio característico asociado a la ecuación es P(λ) = λ3 − 6λ2 + 11λ − 6. Sus raícespueden obtenerse fácilmente usando el método de Ruffini: λ1 = 1, λ2 = 2 y λ3 = 3. Lassoluciones asociadas a cada raíz son: ex, e2x y e3x. Por tanto, la solución general de la ecuaciónes

y(x) = C1ex + C2e2x + C3e3x.

Impongamos ahora las condiciones iniciales:

y(0) = 1 ⇒ C1 + C2 + C3 = 1y′(0) = 0 ⇒ C1 + 2C2 + 3C3 = 0y′′(0) = 0 ⇒ C1 + 4C2 + 9C3 = 0

⇒ C1 = 0, C2 = 3, C3 = −2.

En consecuencia, la solución del problema de Cauchy es

y(x) = 3e2x − 2e3x.

Consideremos ahora la ecuación lineal de coeficientes constantes no homogénea

y(n) + an−1y(n−1) + · · ·+ a2y′′ + a1y′ + a0y = r(x),

cuya solución general se construye como suma de la solución general yH de la ecuación ho-mogénea asociada y de una solución particular yP de la ecuación completa. Para determinaruna solución particular aplicaremos el método de variación de las constantes.

Si {y1, . . . , yn} es un sistema fundamental de soluciones de la ecuación homogénea, bus-camos un conjunto de funciones {C1(x), . . . , Cn(x)} que sea solución del siguiente sistema:

y1(x)C′1(x) + y2(x)C′2(x) + · · ·+ yn(x)C′n(x) = 0,

y′1(x)C′1(x) + y′2(x)C′2(x) + · · ·+ y′n(x)C′n(x) = 0,

y′′1 (x)C′1(x) + y′′2 (x)C′2(x) + · · ·+ y′′n(x)C′n(x) = 0,...

y(n−1)1 (x)C′1(x) + y(n−1)

2 (x)C′2(x) + · · ·+ y(n−1)n (x)C′n(x) = r(x),

Page 40: Apuntes MatemáticasII

40

para cada x ∈ R. Se trata de un sistema lineal de n ecuaciones y n incógnitas (a saber,C′1(x), . . . , C′n(x)) que es compatible determinado, ya que el determinante de la matriz decoeficientes coincide con el wronskiano del sistema fundamental, que no se anula en ningúnpunto. En consecuencia, podemos resolverlo (mediante la regla de Cramer, por ejemplo) paradeterminar C′1(x), . . . , C′n(x). A continuación se calculan C1(x), . . . , Cn(x) mediante integra-ción, y por último se construye la solución particular:

yP(x) = C1(x)y1(x) + C2(x)y2(x) + · · ·+ Cn(x)yn(x).

Ejemplo 2.14. Consideremos la ecuación diferencial

y′′′ − 6y′′ + 11y′ − 6y = xe−x.

El polinomio característico es P(λ) = λ3 − 6λ2 + 11λ− 6, cuyas raíces son 1, 2 y 3. De estemodo, la solución general de la ecuación homogénea es

yH(x) = C1ex + C2e2x + C3e3x.

En particular, un sistema fundamental de soluciones de la ecuación homogénea está formadopor las funciones y1(x) = ex, y2(x) = e2x e y3(x) = e3x.

Consideremos ahora el sistemay1(x)C′1(x) + y2(x)C′2(x) + y3(x)C′3(x) = 0,

y′1(x)C′1(x) + y′2(x)C′2(x) + y′3(x)C′3(x) = 0,

y′′1 (x)C′1(x) + y′′2 (x)C′2(x) + y′′3 (x)C′3(x) = r(x),

que queda como exC′1(x) + e2xC′2(x) + e3xC′3(x) = 0,

exC′1(x) + 2e2xC′2(x) + 3e3xC′3(x) = 0,

exC′1(x) + 4e2xC′2(x) + 9e3xC′3(x) = xe−x.

Podemos simplificar las ecuaciones:C′1(x) + exC′2(x) + e2xC′3(x) = 0,

C′1(x) + 2exC′2(x) + 3e2xC′3(x) = 0,

C′1(x) + 4exC′2(x) + 9e2xC′3(x) = xe−2x.

El determinante de la matriz de coeficientes es∣∣∣∣∣∣1 ex e2x

1 2ex 3e2x

1 4ex 9e2x

∣∣∣∣∣∣ = 2e3x.

Page 41: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 41

Aplicando la regla de Cramer, obtenemos

C′1(x) =1

2e3x

∣∣∣∣∣∣0 ex e2x

0 2ex 3e2x

xe−2x 4ex 9e2x

∣∣∣∣∣∣ = x2

e−2x,

C′2(x) =1

2e3x

∣∣∣∣∣∣1 0 e2x

1 0 3e2x

1 xe−2x 9e2x

∣∣∣∣∣∣ = −xe−3x,

C′3(x) =1

2e3x

∣∣∣∣∣∣1 ex 01 2ex 01 4ex xe−2x

∣∣∣∣∣∣ = x2

e−4x.

Integrando, resulta

C1(x) = 12

∫xe−2xdx = − 1

4 e−2x(x + 12

),

C2(x) = −∫

xe−3xdx = 13 e−3x(x + 1

3

),

C3(x) = 12

∫xe−4xdx = − 1

8 e−4x(x + 14

).

Por último, construimos la solución particular:

yP(x) = C1(x)y1(x) + C2(x)y2(x) + C3(x)y3(x) = −e−x( 124 x + 13

288

).

Finalmente, la solución general de la ecuación y′′′ + 6y′′ + 11y′ + 6y = xe−x será

y(x) = C1e−x + C2e2x + C3e3x − e−x( 124 x + 13

288

).

2.7. Sistemas lineales de primer orden

Un sistema de ecuaciones diferenciales de orden n está formado por n ecuaciones diferencialesde primer orden en forma normal, esto es,

y′1 = f1(x, y1, . . . , yn),

y′2 = f2(x, y1, . . . , yn),...

y′n = fn(x, y1, . . . , yn),

donde x ∈ [a, b] es la variable independiente e y1, . . . , yn, son las variables dependientes.Una solución del sistema está formada por n funciones y1(x), . . . , yn(x), derivables con

continuidad, que satisfacen todas las ecuaciones en cada punto x ∈ [a, b].

Ejemplo 2.15. Es inmediato comprobar que una solución del sistema{y′1 = −y2,

y′2 = y1.

está formada por las funciones y1(x) = cos(x) e y2(x) = sen(x).

Page 42: Apuntes MatemáticasII

42

La solución general del sistema consta de n funciones dependientes de n constantes arbitra-rias, que proporcionan todas las posibles soluciones del sistema:

y1(x, C1, C2, . . . , Cn),

y2(x, C1, C2, . . . , Cn),...

yn(x, C1, C2, . . . , Cn).

Ejemplo 2.16. La solución general del sistema{y′1 = −y2,

y′2 = y1,

está formada por las funciones{y1(x, C1, C2) = C1 cos(x) + C2 sen(x),

y2(x, C1, C2) = C1 sen(x)− C2 cos(x).

Más adelante veremos cómo obtener este resultado.La solución del sistema puede determinarse en Sage usando el comando desolve_system:

sage: # Ejemplo 2.16sage: var(’x’)sage: y1 = function(’y1’, x)sage: y2 = function(’y2’, x)sage: ec1 = diff(y1, x) == -y2sage: ec2 = diff(y2, x) == y1sage: desolve_system ([ec1 , ec2], [y1 , y2])[y1(x) == -sin(x)*y2(0) + cos(x)*y1(0),y2(x) == sin(x)*y1(0) + cos(x)*y2(0)]

En este caso, y1(0) representa la constante arbitraria C1, mientras que y2(0) equivale a −C2.El porqué de esta notación quedará claro en el siguiente ejemplo.

Un problema de valores iniciales para un sistema de ecuaciones diferenciales se construyeañadiendo n condiciones iniciales de la forma

y1(x0) = y1,

y2(x0) = y2,...

yn(x0) = yn,

con y1, y2, . . . , yn ∈ R.

Ejemplo 2.17. El problema de valores iniciales definido por el sistema{y′1 = −y2,

y′2 = y1,

Page 43: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 43

y las condiciones iniciales {y1(0) = 1,

y2(0) = 0,

tiene una única solución formada por las funciones y1(x) = cos(x) e y2(x) = sen(x).En efecto, a partir de la solución general del sistema (ejemplo 2.16), podemos determinar

de forma única los valores de las constantes C1 y C2 imponiendo las condiciones iniciales:{y1(0) = 1⇒ C1��

�: 1cos 0 + C2��

�: 0sin 0 = 1⇒ C1 = 1,

y2(0) = 0⇒ C1���: 0

sen 0− C2���: 1

cos 0 = 0⇒ C2 = 0.

De esta forma, la solución del problema de valores iniciales será:{y1(x) = C1 cos(x) + C2 sen(x) = cos(x),

y2(x) = C1 sen(x)− C2 cos(x) = sen(x).

Las condiciones iniciales se especifican en Sage mediante el parámetro ics:sage: # Ejemplo 2.17sage: var(’x’)sage: y1 = function(’y1’, x)sage: y2 = function(’y2’, x)sage: ec1 = diff(y1, x) == -y2sage: ec2 = diff(y2, x) == y1sage: desolve_system ([ec1 , ec2], [y1 , y2], ics=[0, 1, 0])[y1(x) == cos(x), y2(x) == sin(x)]

Si queremos representar gráficamente las componentes de la solución en el intervalo[0, 2π], añadimos las siguientes líneas de código:sage: sol = desolve_system ([ec1 , ec2], [y1, y2], ics=[0, 1, 0])sage: fig1 = plot(sol [0]. rhs(), [0, 2*pi], color=’blue’,

legend_label=’cos(x)’)sage: fig2 = plot(sol [1]. rhs(), [0, 2*pi], color=’green ’,

legend_label=’sen(x)’)sage: fig = fig1 + fig2sage: fig.show()

El resultado obtenido puede verse en la figura 2.2.

Observación. En el ejemplo anterior se han representado de forma independiente las gráficasde las componentes de la solución y1(x) e y2(x). También es posible interpretar dichas fun-ciones como las componentes de una curva plana, que recibe el nombre de órbita o trayectoria.Concretamente, (cos(x), sen(x)) sería una parametrización de la órbita asociada al punto (1, 0)determinado por las condiciones iniciales.

Un tipo importante de sistemas lo constituyen los sistemas lineales homogéneos con coeficientesconstantes, que son de la forma

y′1 = a11y1 + a12y2 + · · ·+ a1ny′n,

y′2 = a21y1 + a22y2 + · · ·+ a2ny′n,...

y′n = an1y1 + an2y2 + · · ·+ anny′n,

Page 44: Apuntes MatemáticasII

44

Figura 2.2: Solución del ejemplo 2.17 en el intervalo [0, 2π].

con aij ∈ R. Este tipo de sistemas puede escribirse en forma matricial:

Y′ = AY,

donde

Y =

y1

y2...

yn

, Y′ =

y′1y′2...

y′n

, A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

.... . .

...an1 an2 · · · ann

.

El estudio de sistemas no lineales está fuera del alcance del presente trabajo, ya que ne-cesita del uso de herramientas avanzadas del Análisis Matemático. Por ello, restringiremosnuestro estudio a sistemas de ecuaciones lineales de coeficientes constantes. Además, porsimplicidad, nos centraremos en sistemas de orden dos.

En el caso particular de sistemas de dos ecuaciones (n = 2) es usual denotar la variableindependiente por t (en lugar de x) y las variables dependientes por x e y (en lugar de y1 ey2). Asimismo, para sistemas con tres ecuaciones (n = 3) se suelen usar las variables x, y y zen lugar de y1, y2 e y3. A partir de ahora seguiremos este criterio.

Vamos a considerar pues sistemas de la forma{x′ = ax + by,

y′ = cx + dy,

donde los coeficientes a, b, c y d son números reales. El sistema anterior puede escribirsetambién en forma matricial como

X′ = AX,

donde

X(t) =(

x(t)y(t)

), X′(t) =

(x′(t)y′(t)

)y A =

(a bc d

).

Page 45: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 45

Diremos que un valor λ ∈ C es un autovalor de la matriz A si existe un vector no nulov ∈ R2 tal que

Av = λv.

Un vector v con esta propiedad es un autovector asociado al autovalor λ.

Observación. Un autovector nunca es único. De hecho, si v es un autovector de A entoncesαv también lo es, para cualquier α ∈ R, α 6= 0.

La relación Av = λv puede escribirse también como

(A− λI)v = 0,

siendo I la matriz identidad. Se obtiene así un sistema lineal homogéneo cuyas incógnitasson las componentes del vector v. Dicho sistema tendrá solución no nula únicamente si escompatible indeterminado, es decir, si

det(A− λI) = 0.

Esta es la denominada ecuación característica de la matriz A, cuyas soluciones λ proporcionanlos autovalores de A.

Observación. Es fácil ver que los autovalores de la matriz A coinciden con las raíces delpolinomio característico P(λ) definido como

P(λ) = λ2 − tr(A)λ + det(A),

donde tr(A) y det(A) son, respectivamente, la traza y el determinante de la matriz A:

tr(A) = a + d, det(A) = ad− bc.

Ejemplo 2.18. Dada la matriz

A =

(1 12 −1

),

calculemos sus autovalores resolviendo la ecuación característica asociada:∣∣∣∣1− λ 12 −1− λ

∣∣∣∣ = 0⇒ λ2 − 3 = 0⇒ λ = ±√

3.

Para calcular un autovector v =

β

)asociado a λ, hemos de resolver el sistema asociado:

(A− λI)v = 0⇒(

1− λ 12 −1− λ

)(α

β

)= 0⇒

{(1− λ)α + β = 0,

2α− (1 + λ)β = 0.

Despejando β en la primera ecuación y sustituyendo en la segunda, obtenemos la siguienterelación:

(λ2 − 3)α = 0.

Page 46: Apuntes MatemáticasII

46

Cuando λ = ±√

3, esta ecuación admite cualquier valor de α como solución (como era deesperar). Tomando por ejemplo α = 1, resulta que β = ±

√3 − 1. Por tanto, autovectores

asociados a los autovalores λ1 =√

3 y λ2 = −√

3 son, respectivamente,

v1 =

(1√

3− 1

), v2 =

(1

−√

3− 1

).

Para calcular los autovalores de una matriz A en Sage, primero definimos dicha matrizusando el comando matrix y luego accedemos a su método eigenvalues:sage: # Ejemplo 2.18sage: A = matrix ([[1, 1], [2, -1]])sage: A.eigenvalues ()[ -1.732050807568878? , 1.732050807568878?]

(nótese que√

3 = 1,732050807568878 . . . ). Para determinar los autovectores asociados, escribi-mos:sage: A.eigenvectors_right ()[( -1.732050807568878? , [(1, -2.732050807568878?)] , 1),(1.732050807568878? , [(1, 0.732050807568878?)] , 1)]

El resultado es una lista con dos elementos, escritos entre paréntesis y separados por unacoma. En cada uno de estos elementos, el primer valor es un autovalor, el segundo es unautovector asociado, y el tercero representa la multiplicidad algebraica del autovalor.

Observemos que la ecuación característica es una ecuación polinomial de segundo grado,por lo que pueden presentarse tres posibilidades. A continuación escribimos la forma de lasolución general del sistema en cada uno de los casos.

I. Autovalores reales distintos: λ1 6= λ2. La solución general del sistema es{x(t) = α1C1eλ1t + α2C2eλ2t,

y(t) = β1C1eλ1t + β2C2eλ2t,

siendo C1 y C2 constantes arbitrarias y (αi, βi)t un autovector asociado a λi, para i = 1, 2.

Ejemplo 2.19. Consideremos el sistema{x′ = x + y,

y′ = 4x− 2y,

cuya matriz de coeficientes es

A =

(1 14 −2

).

Resolvamos la ecuación característica para determinar los autovalores de A:

λ2 + λ− 6 = 0⇒{

λ1 = 2,

λ2 = −3.

Page 47: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 47

Para calcular un autovector asociado a un autovalor λ, resolvemos la siguiente ecuación:(1− λ 1

4 −2− λ

)(α

β

)=

(00

)⇒{(1− λ)α + β = 0,

4α− (2 + α)β = 0.

Despejando β en la primera ecuación y sustituyendo en la segunda, obtenemos:

(λ2 + λ− 6)α = 0.

Para λ = 2 o λ = −3 el primer factor es nulo, por lo que podemos tomar un valor arbitrariono nulo de α, por ejemplo, α = 1; el valor correspondiente de β se determina a partir de laprimera ecuación. De esta forma, se obtienen los siguientes autovectores:

v1 =

(11

), v2 =

(1−4

).

Veamos qué resultado produce Sage:sage: # Ejemplo 2.19sage: A = matrix ([[1, 1], [4, -2]])sage: A.eigenvectors_right ()[(2, [(1, 1)], 1), (-3, [(1, -4)], 1)]

Finalmente, las funciones {x(t) = C1e2t + C2e−3t,

y(t) = C1e2t − 4C2e−3t,

forman la solución general del sistema.Directamente, en Sage:

sage: # Ejemplo 2.19sage: var(’t’)sage: x = function(’x’, t)sage: y = function(’y’, t)sage: ec1 = diff(x, t) == x + ysage: ec2 = diff(y, t) == 4*x - 2*ysage: desolve_system ([ec1 , ec2], [x, y])[x(t) == 1/5*(x(0) - y(0))*e^(-3*t) + 1/5*(4*x(0) + y(0))*e^(2*t),y(t) == -4/5*(x(0) - y(0))*e^(-3*t) + 1/5*(4*x(0) + y(0))*e^(2*t)]

Observemos, de nuevo, que las constantes arbitrarias C1 y C2 vienen dadas en función de losvalores iniciales x(0) e y(0).

II. Autovalor real doble: λ. La solución general del sistema es, en este caso,{x(t) = αC1eλt + C2(M1 + M2t)eλt,

y(t) = βC1eλt + C2(N1 + N2t)eλt,

siendo C1 y C2 constantes arbitrarias, (α, β) un autovector asociado a λ, y M1, M2, N1 y N2

valores a determinar por sustitución en (S).

Page 48: Apuntes MatemáticasII

48

Ejemplo 2.20. Consideremos el sistema{x′ = 3x− 4y,

y′ = x− y,

y calculemos sus autovalores a partir de la ecuación característica:

λ2 − 2λ + 1 = 0⇒ λ = 1 (raíz doble).

Determinemos un autovector asociado a λ = 1:(3− λ −4

1 −1− λ

)(α

β

)=

(00

)⇒(

2 −41 −2

)(α

β

)=

(00

)⇒{

2α− 4β = 0,

α− 2β = 0.

Ambas ecuaciones son equivalentes: α = 2β; podemos pues tomar α = 2 y β = 1.Usando Sage, obtenemos:

sage: # Ejemplo 2.20sage: A = matrix ([[3, -4], [1, -1]])sage: A.eigenvectors_right ()[(1, [(1, 1/2)], 2)]

Es decir, se tiene un autovalor λ = 1 con multiplicidad dos y autovector asociado (1, 1/2)t,que es proporcional al obtenido anteriormente.

La solución general del sistema será de la forma{x(t) = 2C1et + C2(M1 + M2t)et,

y(t) = C1et + C2(N1 + N2t)et.

Los coeficientes M1, M2, N1 y N2 se determinan a partir de las ecuaciones del sistema. Susti-tuyendo en la primera ecuación y agrupando convenientemente, resulta

(M1 + M2) + M2t = (3M1 − 4N1) + (3M2 − 4N2)t.

Igualando los coeficientes del mismo orden, obtenemos{M1 + M2 = 3M1 − 4N1 ⇒ 2M1 −M2 = 4N1,

M2 = 3M2 − 4N2 ⇒ M2 = 2N2.

De igual forma, a partir de la segunda ecuación tenemos

N1 + N2 + N2t = M1 − N1 + (M2 − N2)t⇒{

2N1 + N2 = M1,

M2 = 2N2.

Observemos que las cuatro relaciones obtenidas pueden reducirse a dos:{2N1 + N2 = M1,

M2 = 2N2.

Page 49: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 49

Tomando, por ejemplo, M1 = 1 y N2 = 1, deducimos que M2 = 2 y N1 = 0.Finalmente, las funciones {

x(t) = 2C1et + C2(1 + 2t)et,

y(t) = C1et + C2tet,

definen la solución general del sistema.Veamos qué opina Sage:

sage: # Ejemplo 2.20sage: var(’t’)sage: x = function(’x’, t)sage: y = function(’y’, t)sage: ec1 = diff(x, t) == 3*x - 4*ysage: ec2 = diff(y, t) == x - ysage: desolve_system ([ec1 , ec2], [x, y])[x(t) == 2*t*e^t*x(0) - 4*t*e^t*y(0) + e^t*x(0),y(t) == t*e^t*x(0) - 2*t*e^t*y(0) + e^t*y(0)]

Teniendo en cuenta que C1 = y(0) y C2 = x(0) + 2y(0), vemos que la solución obtenida es lamisma.

III. Autovalores complejos: λ = a± bi, b > 0. La solución general del sistema tiene la siguienteforma: {

x(t) = eat(C1(α1 cos(bt)− α2 sen(bt)) + C2(α1 sen(bt) + α2 cos(bt))),

y(t) = eat(C1(β1 cos(bt)− β2 sen(bt)) + C2(β1 sen(bt) + β2 cos(bt))),

siendo C1 y C2 constantes arbitrarias y (α1 + α2i, β1 + β2i) un autovector complejo asociado aλ = a + bi.

Ejemplo 2.21. Consideremos el sistema{x′ = x− 2y,

y′ = 4x + 5y,

cuyos autovalores son de la forma λ = 3± 2i. Para buscar un autovector asociado a 3 + 2i,consideramos la ecuación matricial(

1− (3 + 2i) −24 5− (3 + 2i)

)(α1 + α2iβ1 + β2i

)=

(00

),

que, en componentes, es equivalente al sistema{(α2 − α1 − β1)− (α1 + α2 + β2)i = 0,

(2α1 + β1 + β2) + (2α2 − β1 + β2)i = 0.

Igualando las partes reales e imaginarias a cero, obtenemos las ecuacionesα2 − α1 − β1 = 0,

α1 + α2 + β2 = 0,

2α1 + β1 + β2 = 0,

2α2 − β1 + β2 = 0,

Page 50: Apuntes MatemáticasII

50

que pueden reducirse a dos: {α1 + α2 + β2 = 0,

2α1 + β1 + β2 = 0.

Tomando α1 = 1 y β1 = 1, deducimos que α2 = 2 y β2 = −3.En Sage se obtiene el siguiente resultado:

sage: # Ejemplo 2.21sage: A = matrix ([[1, -2], [4, 5]])sage: A.eigenvectors_right ()[(3 - 2*I, [(1, -1 + 1*I)], 1), (3 + 2*I, [(1, -1 - 1*I)], 1)]

En resumen, las funciones{x(t) = e3t(C1(cos(2t)− 2 sen(2t)) + C2(sen(2t) + 2 cos(2t))

),

y(t) = e3t(C1(cos(2t) + 3 sen(2t)) + C2(sen(2t)− 3 cos(2t))),

son las componentes de la solución general del sistema.Calculemos la solución usando Sage directamente:

sage: # Ejemplo 2.21sage: var(’t’)sage: x = function(’x’, t)sage: y = function(’y’, t)sage: ec1 = diff(x, t) == x - 2*ysage: ec2 = diff(y, t) == 4*x + 5*ysage: desolve_system ([ec1 , ec2], [x, y])[x(t) == -((x(0) + y(0))* sin (2*t) - cos (2*t)*x(0))*e^(3*t),y(t) == ((2*x(0) + y(0))* sin (2*t) + cos (2*t)*y(0))*e^(3*t)]

Podemos recuperar la solución obtenida anteriormente haciendo los cambios x(0) = C1 + 2C2,y(0) = C1 − 3C2.

Observación. El método de autovalores presentado en esta sección puede extenderse de for-ma natural para resolver sistemas lineales de orden arbitrario.

Observación. El método de variación de las constantes puede adaptarse para resolver siste-mas lineales no homogéneos.

Vamos a terminar esta sección viendo que existe una equivalencia entre un sistema linealy una ecuación diferencial homogénea de segundo orden. Esta equivalencia proporciona unmétodo alternativo de resolución, denominado método de sustitución.

Consideremos el sistema {x′ = ax + by,

y′ = cx + dy,

y supongamos que uno de los coeficientes, por ejemplo b, no es cero (si fuese otro el coeficienteno nulo, se razonaría de manera análoga; si todos los coeficientes fuesen nulos el sistema sereduciría a las ecuaciones x′ = 0, y′ = 0, cuyas soluciones son constantes). Derivando en laprimera ecuación, resulta

x′′ = ax′ + by′ = ax′ + b(cx + dy),

Page 51: Apuntes MatemáticasII

2.7 Sistemas lineales de primer orden 51

donde hemos sustituido y′ usando la segunda ecuación. De la primera ecuación despejamos

y =x′ − ax

b.

Sustituyendo en la igualdad anterior, obtenemos

x′′ = ax′ + b(

cx +db(x′ − ax)

)= (a + d)x′ + (bc− ad)x.

Así pues, tenemos la siguiente ecuación de segundo orden:

x′′ − tr(A)x′ + det(A)x = 0.

Recíprocamente, dada la ecuación homogénea

x′′ + px′ + qx = 0,

definimos y = x′. Entonces

y′ = x′′ = −px′ − qx = −py− qx.

Obtenemos así el siguiente sistema: {x′ = y,

y′ = −qx− py.

Hemos demostrado así la equivalencia anteriormente comentada.En el caso de un problema de valores iniciales, también hay una equivalencia entre las

condiciones iniciales. Si tenemos las condiciones iniciales{x(t0) = x0,

y(t0) = y0,

para el sistema, estas se escriben como{x(t0) = x0,

x′(t0) = ax0 + by0,

para la ecuación de segundo orden. Recíprocamente, si las condiciones iniciales para la ecua-ción de segundo orden son de la forma{

x(t0) = x0,

x′(t0) = x′0,

entonces las condiciones para el sistema son{x(t0) = x0,

y(t0) = x′0.

Page 52: Apuntes MatemáticasII

52

Ejemplo 2.22. Consideremos el sistema lineal{x′ = x + y,

y′ = 2x− y,

junto con las condiciones iniciales {x(0) = 1,

y(0) = −1.

Derivamos en la primera ecuaciónx′′ = x′ + y′,

y sustituimos y′ usando la segunda ecuación:

x′′ = x′ + 2x− y.

A continuación, despejamos y de la primera ecuación

y = x′ − x,

y sustituimos en la expresión anterior:

x′′ = x′ + 2x− (x′ − x) = 3x ⇒ x′′ − 3x = 0.

Respecto a las condiciones iniciales, notemos que

x′(0) = x(0) + y(0) = 1 + (−1) = 0.

Hemos obtenido así el problema de Cauchyx′′ − 3x = 0,

x(0) = 1,

x′(0) = 0,

que es equivalente al problema de Cauchy para el sistema original.La solución del problema de valores iniciales para el sistema usando Sage es:

sage: # Ejemplo 2.22sage: var(’t’)sage: x = function(’x’, t)sage: y = function(’y’, t)sage: ec1 = diff(x, t) == x + ysage: ec2 = diff(y, t) == 2*x - ysage: desolve_system ([ec1 , ec2], [x, y], ics=[0, 1, -1])[x(t) == cosh(sqrt (3)*t),y(t) == sqrt (3)* sinh(sqrt (3)*t) - cosh(sqrt (3)*t)]

mientras que para la ecuación de segundo orden es:sage: # Ejemplo 2.22sage: var(’t’)sage: x = function(’x’, t)sage: ec = diff(x, t, 2) - 3*x == 0sage: desolve(ec , x, ics=[0, 1, 0])1/2*e^(-sqrt (3)*t) + 1/2*e^(sqrt (3)*t)

Page 53: Apuntes MatemáticasII

2.8 Aplicaciones 53

¿Se obtiene la misma solución para x(t) en ambos casos? Sí, si tenemos en cuenta la definicióndel seno hiperbólico2. Por último, para determinar y(t) usamos la igualdad y = x′ − x:sage: sol = desolve(ec, x, ics=[0, 1, 0])sage: diff(sol , t) - sol-1/2* sqrt (3)*e^(-sqrt (3)*t) + 1/2* sqrt (3)*e^(sqrt (3)*t)- 1/2*e^(-sqrt (3)*t) - 1/2*e^(sqrt (3)*t)

Aplicando la definiciones del seno y el coseno hiperbólicos, podemos comparar los resultadosobtenidos para y(t).

Observación. La técnica del método de sustitución puede aplicarse también para la resoluciónde sistemas no homogéneos, de la forma{

x′ = ax + by + r1(t),

y′ = cx + dy + r2(t).

En tal caso, al construir la ecuación de segundo orden habrá que aplicar el método de variaciónde las constantes para hallar una solución particular de la misma.

Observación. Puede establecerse una equivalencia entre un sistema de orden n y una ecua-ción diferencial de orden n, siguiendo un procedimiento análogo al explicado anteriormente.Asimismo, existe una equivalencia entre un problema de valores iniciales para una ecuaciónde orden n y para un sistema del mismo orden.

2.8. Aplicaciones

2.8.1. Movimiento armónico amortiguado

Vamos a estudiar la ecuación diferencial que rige el desplazamiento de un medio defor-mable, por ejemplo, un muelle, un mástil, un edificio, etc.

Representemos por x(t) al desplazamiento del medio respecto de la posición de equilibrio,en el instante de tiempo t, y sea m su masa. El origen de coordenadas se establece en laposición de equilibrio y se supone que el movimiento hacia la derecha corresponde a valorespositivos del desplazamiento.

Supondremos que sobre el medio actúan tres tipos de fuerzas:

– Fuerza elástica o de recuperación: es restauradora y su módulo es proporcional al despla-zamiento. Podemos expresarla como −kx, donde k es la constante de recuperación delmaterial y el signo negativo indica que la fuerza se opone al movimiento.

– Fuerza de amortiguación, debida al rozamiento: posee un módulo proporcional a la veloci-dad del medio y se opone al movimiento. Su expresión es −cx′, donde c es la constantede amortiguamiento.

2El seno y el coseno hiperbólicos se definen como

senh(x) =ex + e−2

2, cosh(x) =

ex − e−x

2.

Page 54: Apuntes MatemáticasII

54

– Fuerzas que no son intrínsecas al sistema, sino que obedecen a causas externas (porejemplo, la acción de un terremoto). Nos referiremos a ellas como fuerzas externas y lasdenotaremos por g(t).

La segunda ley de Newton nos dice que la masa por la aceleración es igual a la resultantede fuerzas que actúan sobre el sistema. Teniendo en cuenta que x′′(t) representa la aceleracióndel medio deformable, obtenemos entonces:

mx′′ = −kx− cx′ + g(t)⇒ x′′ +cm

x′ +km

x =g(t)m

.

Se trata de una ecuación diferencial de segundo orden, lineal y de coeficientes constantes. Encaso de que no actúen fuerzas exteriores, g(t) ≡ 0, la ecuación es además homogénea.

Para completar el sistema, debemos considerar condiciones iniciales de la forma{x(0) = x0,

x′(0) = v0,

que indican la posición y velocidad del medio en el instante inicial t = 0. El problema devalores iniciales correspondiente posee una única solución, que nos permite calcular el des-plazamiento del medio respecto de la posición de equilibrio en cada instante.

Ejemplo 2.23. Calculemos el desplazamiento respecto de la posición de equilibrio de un más-til con masa igual a 1 kg, constante de amortiguamiento igual a 4 N·s/m y constante derecuperación igual a 5 N/m, suponiendo que en el instante inicial recibe una ráfaga de vientosoplando hacia la izquierda, cuya velocidad es de 5 m/s.

Figura 2.3: Oscilación de un mástil.

El problema de valores iniciales a considerar es el siguiente:x′′ + 4x′ + 5x = 0,

x(0) = 0,

x′(0) = −5.

Page 55: Apuntes MatemáticasII

2.8 Aplicaciones 55

El polinomio característico de la ecuación, P(λ) = λ2 + 4λ + 5, tiene raíces λ = −2± i; portanto, la solución general de la ecuación será

x(t) = e−2t(C1 cos(t) + C2 sen(t)).

Imponiendo las condiciones iniciales, resulta:x(0) = 0⇒ C1 = 0,

x′(0) = −5⇒ C2 − 2���0

C1 = −5⇒ C2 = −5.

Por tanto, la solución buscada es

x(t) = −5 sen(t)e−2t,

que representa una curva sinusoidal cuyas amplitudes tienden a cero. La gráfica de la soluciónse representa en la figura 2.3, donde puede observarse cómo las oscilaciones se amortiguancon el paso del tiempo y el mástil tiende hacia su posición de equilibrio.

La figura 2.3 se ha obtenido con el siguiente código Sage:

sage: var(’t’)sage: x = function(’x’, t)sage: ec = diff(x, t, 2) + 4*diff(x, t) + 5*x == 0sage: sol = desolve(ec, x, ics=[0, 0, -5]); sol-5*e^(-2*t)*sin(t)sage: plot(sol , 0, 5)

2.8.2. Deflexión y pandeo de vigas

Consideremos una viga de longitud L situada en posición horizontal y cuyos extremosestán fijos. La deformación que sufre dicha viga puede modelizarse mediante el siguienteproblema de contorno:

y′′(x) = − 1EI

w2

x(L− x), x ∈ [0, L],

y(0) = 0,

y(L) = 0,

donde y(x) representa el desplazamiento de la viga (orientado hacia abajo) o deflexión en elpunto x ∈ [0, L], E es el módulo de elasticidad de Young, I denota el momento de inercia y wes el peso por unidad de longitud de la viga. Las condiciones de contorno establecen que losextremos de la viga permanecen fijos.

En este caso la ecuación diferencial puede resolverse mediante una doble integración. Sillamamos α = − 1

EIw2 , resulta que

y′′(x) = αx(L− x)⇒ y′(x) =∫

αx(L− x) dx ⇒ y′(x) = α( 1

2 Lx2 − 13 x3)+ C1,

Page 56: Apuntes MatemáticasII

56

w

L

Figura 2.4: Deflexión de una viga empotrada: esquema.

siendo C1 una constante de integración. De nuevo integramos para obtener:

y(x) =∫ [

α( 1

2 Lx2 − 13 x3)+ C1

]dx ⇒ y(x) = α

( 16 Lx3 − 1

12 x4)+ C1x + C2,

donde C2 es otra constante de integración. Las constantes C1 y C2 pueden determinarse im-poniendo las condiciones de contorno:y(0) = 0⇒ C2 = 0,

y(L) = 0⇒ 112 αL4 + C1L +���

0C2 = 0⇒ C1 = − 1

12 αL3.

Por tanto, la única solución del problema de contorno viene dada por

y(x) =1

EIw24(x4 − 2Lx3 + L3x

).

En particular, podemos determinar la deflexión máxima que, por simetría, se da en el puntoxmax = L/2:

ymax = y(L/2) =1

EIw24

(L4

16− 2

L4

8+

L4

2

)=

5wL4

384EI.

Ejemplo 2.24. Consideremos una barra de longitud L = 2 m con módulo de Young E = 2 · 1011

N/m2, momento de inercia I = 7,85 · 10−9 m4 y w = 95,54 N/m; estos datos correspondena una barra de acero con sección transversal circular de 2 cm de diámetro. En tal caso, ladeflexión máxima de la barra es:

ymax =5 · 95,54 · 24

384 · (2 · 1011) · (7,85 · 10−9)≈ 0,0127 m.

En la figura 2.5 se representa la forma de la solución; téngase en cuenta que se ha tomadoun sistema de referencia en el que los valores positivos de la variable y se dirigen hacia abajo.

He aquí el código Sage para generar la figura 2.5:sage: var(’x’)sage: # datos del problemasage: L = 2sage: E = 2e11

Page 57: Apuntes MatemáticasII

2.8 Aplicaciones 57

Figura 2.5: Deflexión de una viga.

sage: I = 7.85e-9sage: w = 95.54sage: y = function(’y’, x)sage: sol = desolve(diff(y, x, 2) - w/(2*E*I)*x*(L-x) == 0, y,

ics=[0, 0, L, 0]); sol-4777/1884000*x^4 + 4777/471000*x^3 - 4777/235500*xsage: plot(sol , [0, L])

También podemos calcular ymax de la siguiente forma:sage: sol.find_minimum_on_interval (0, L)( -0.01267781316348195 , 1.0000000000000002)

El primer valor es ymax y el segundo la correspondiente abscisa xmax.

En general, la teoría de elasticidad determina que, para deflexiones relativamente peque-ñas de una viga horizontal uniforme, la curva de deflexión y(x) viene determinada por laecuación diferencial

EIy(4)(x) = w, x ∈ [0, L],

donde E es el módulo de Young del material, I es el momento de inercia, w es el peso de la vigay L es su longitud. La solución de esta ecuación diferencial puede obtenerse por integracióndirecta. En efecto, si integramos una vez obtenemos

EIy(3)(x) = wx + C1;

integrando de nuevo, resulta:

EIy′′(x) = 12 wx2 + C1x + C2;

una nueva integación nos lleva a:

EIy′(x) = 16 wx3 + 1

2 C1x2 + C2x + C3;

Page 58: Apuntes MatemáticasII

58

y la última integración nos da:

EIy(x) = 124 wx4 + 1

6 C1x3 + 12 C2x2 + C3x + C4.

Para determinar las constantes arbitrarias C1, C2, C3 y C4, debemos imponer condiciones decontorno adecuadas en los extremos x = 0 y x = L de la viga.

Dependiendo del tipo de soporte, en cada extremo de la viga puede considerarse una delas siguientes condiciones:

Sostenida simplemente: y = y′′ = 0.

Empotrada o fija en el extremo: y = y′ = 0.

Extremo libre: y′′ = y(3) = 0.

Ejemplo 2.25. Por ejemplo, si consideramos una viga en voladizo, con el extremo x = 0 fijo yel extremo x = L libre, tendríamos las siguientes condiciones de contorno:

y(0) = 0, y′(0) = 0, y′′(L) = 0, y(3)(L) = 0.

Imponiendo estas condiciones en la solución general, se obtiene la siguiente curva de defle-xión:

y(x) =w

24EI(x4 − 4Lx3 + 6L2x2).

¿Cuál será la deflexión máxima en este caso? Para determinar dicho valor, igualamos laderivada de y(x) a cero:

y′(x) = 0⇒ w6EI

x(x2 − 3Lx + 3L2) = 0⇒{

x = 0,

x2 − 3Lx + 3L2 = 0 (no tiene raíces reales).

Es decir, la derivada sólo se anula en x = 0, que es el extremo fijo. Esto nos indica que lafunción y(x) es estrictamente creciente, por lo que la deflexión máxima se producirá en elextremo x = L y será:

ymax = y(L) =w

8EIL4.

A continuación vamos a estudiar el problema del pandeo de una viga. Para ello, conside-remos una viga situada en vertical y fijada por sus extremos, a la que se aplica una cargaP en uno de ellos. En tal caso, la forma de la viga y(x) puede obtenerse como solución delproblema de contorno

y′′(x) = − PEI

y(x), x ∈ [0, L],

y(0) = 0,

y(L) = 0,

Llamando α = PEI , la ecuación diferencial puede escribirse como

y′′ + αy = 0.

Page 59: Apuntes MatemáticasII

2.8 Aplicaciones 59

L

P

Figura 2.6: Pandeo de una viga: esquema.

Al ser α > 0, las raíces de la ecuación característica λ2 + α = 0 son complejas: λ = ±√−α =

±i√

α. En tal caso, la solución general tendrá la forma

y(x) = C1 cos(√

αx) + C2 sen(√

αx).

Imponiendo las condiciones de contorno, obtenemos:y(0) = 0⇒ C1 = 0,

y(L) = 0⇒ ���0

C1 cos(√

αL) + C2 sen(√

αL) = 0⇒ C2 sen(√

αL) = 0.

Si C2 = 0, obtenemos la solución trivial: y(x) ≡ 0. Esto significa que la viga no se deforma,cosa que sucede cuando la carga P aplicada es pequeña. Para obtener una solución no trivialdel problema hemos de suponer C2 6= 0, lo que implica que sen(

√αL) = 0. Es decir, los únicos

valores de α para los que hay soluciones no triviales del problema de contorno son aquellosque verifican la condición

sen(√

αL) = 0⇔√

αL = nπ, n ∈N⇔ α =n2π2

L2 , n ∈N.

De este modo, la viga no se deforma a menos que

PEI

=n2π2

L2 ,

donde n es un natural arbitrario. Sin embargo, como estamos interesados en el valor mínimopara el que se produce el pandeo, tomaremos n = 1.

Observación. A la primera carga que provoca la deformación de la viga, P = π2EIL2 , se la

conoce con el nombre de primera carga crítica o carga de pandeo de Euler.

Page 60: Apuntes MatemáticasII

60

El problema de contorno posee pues infinitas soluciones, de la forma

y(x) = C sen(π

Lx)

, 0 6= C ∈ R.

En este caso, la amplitud C de pandeo permanece indeterminada.Intentemos resolver el problema de contorno directamente en Sage:

sage: var(’x, L, P, E, I’)sage: assume(P>0, E>0, I>0)sage: y = function(’y’, x)sage: ec = diff(y, x, 2) == -P/(E*I)*ysage: desolve(ec , [y, x], ics=[0, 0, L, 0])0

Como vemos, sólo se ha determinado la solución trivial. Si sustituimos PEI por π2

L2 , obtenemosla solución correspondiente a la carga de pandeo de Euler:

sage: ec = diff(y, x, 2) == -(pi/L)^2*ysage: desolve(ec , [y, x], ics=[0, 0, L, 0])r1*sin(pi*x/L)

2.8.3. Calentamiento de edificios

En la sección 1.6 estudiamos un modelo de calentamiento de edificios en el que se suponíaque la temperatura estaba uniformemente distribuida en el interior del edificio. Dicho modeloes apropiado para estudiar el caso de un edificio con un único compartimento.

En esta sección vamos a considerar un modo algo más preciso representar aquel modelo,a saber: T′(t) = −T(t)− Te(t)

K+ C

(H(t) + U(t, T(t))

), t ∈ [0, t∗],

T(0) = T0,

donde T(t) (en ◦C) denota la temperatura en el interior del edificio y Te(t) es la temperaturaen el exterior; la constante positiva K (en horas, h) es la constante de tiempo de transferenciade calor, que depende de la calidad del aislamiento; C (en ◦C/kcal) es la capacidad caloríficadel edificio, que depende de su tamaño; H(t) (en kcal/h) representa el calor generado porpersonas, luces, etc., en el interior del edificio; y U(t, T(t)) (en kcal/h) denota los efectos delsistema de calefacción o de aire acondicionado, que dependen tanto del tiempo t como de latemperatura en cada instante T(t); por último, t∗ es el tiempo final y T0 denota la temperaturainicial del edificio.

Vamos a considerar ahora un edificio con varios compartimentos, cada uno de los cualespuede tener una temperatura diferente a la del resto. Por simplicidad, analizaremos un mo-delo con dos compartimentos (figura 2.7), aunque la idea puede extenderse para un númeroarbitrario de ellos.

Denotemos por Ti(t), Hi(t) y Ui(t, T(t)) la temperatura, fuentes de calor y fuentes de cale-facción/refrigeración, respectivamente, del compartimento i = 1, 2. Sean C1 y C2 las constantesde capacidad calorífica de los compartimentos. Ki es la constante de tiempo de transferenciade calor correspondiente a las paredes que limitan el compartimento i-ésimo con el exterior.

Page 61: Apuntes MatemáticasII

2.8 Aplicaciones 61

Te(t)

K1

K2

C1 C

2

T1(t) T

2(t)

U1(t,T)

H1(t)

U2(t,T)

H2(t)

K12

K21

Figura 2.7: Edificio con dos compartimentos.

Asimismo, es necesario introducir las constantes de tiempo de transferencia de calor entreambos compartimentos, K12 y K21; dichos valores deben verificar la relación C1K12 = C2K21.

El sistema de ecuaciones diferenciales a considerar es el siguiente:T′1(t) = −

T1(t)− Te(t)K1

+ C1(

H1(t) + U1(t, T1(t)))− 1

K12(T1(t)− T2(t)),

T′2(t) = −T2(t)− Te(t)

K2+ C2

(H2(t) + U2(t, T2(t))

)− 1

K21(T2(t)− T1(t)),

junto con las condiciones iniciales {T1(0) = T1,0,

T2(0) = T2,0,

siendo Ti,0 la temperatura inicial en el compartimento i = 1, 2.

Observación. El término extra que aparece en la primera ecuación, − 1K12

(T1(t)− T2(t)), pro-viene de la ley del enfriamiento de Newton, y representa la pérdida (si T1(t) > T2(t)) oganancia (si T1(t) < T2(t)) de calor en el primer compartimento a través de la pared que losepara del segundo compartimento. Un término análogo aparece en la segunda ecuación.

Ejemplo 2.26. Consideremos un edificio dividido en dos zonas, A y B. La zona A, cuya ca-pacidad calorífica es de 5,5 · 10−4 ◦C/kcal, se calienta mediante una estufa que proporciona2 · 104 kcal/h. La constante de tiempo para la transferencia de calor entre la zona A y el ex-terior es de 4 horas, entre la zona B y el exterior es de 5 horas, y entre las dos zonas es de 2horas. Si la temperatura exterior es de 0 ◦C, vamos a determinar la temperatura mínima quese alcanza en la zona B al cabo de 4 horas, suponiendo que las temperatura inicial en la zonaA es de 10 ◦C y en la zona B de 12 ◦C.

Page 62: Apuntes MatemáticasII

62

Según el enunciado del problema, se tiene que Te = 0, K1 = 4, K2 = 5, K12 = K21 = 2y C1 = 5,5 · 10−4; C2 puede calcularse a partir de la relación C1K12 = C2K21, aunque noserá necesario. Por otra parte, tenemos que H1 ≡ H2 ≡ 0, ya que no consideramos el calorgenerado por personas o maquinaria en el interior del edificio. Por último, U2 ≡ 0 ya que nohay calefacción en la zona B, y

C1U1 =

(5,5 · 10−4

◦C

���kcal

)·(

2 · 104 ���kcalh

)= 11 ◦C/h

para la zona A. El sistema de ecuaciones diferenciales queda pues de la siguiente forma:{T′1 = − 1

4 T1 − 12 (T1 − T2) + 11,

T′2 = − 15 T2 − 1

2 (T2 − T1),

o bien {T′1 = − 3

4 T1 +12 T2 + 11,

T′2 = 12 T1 − 7

10 T2.

Podemos resolver el sistema mediante el método de sustitución. Derivamos en la segundaecuación:

T′′2 = 12 T′1 − 7

10 T′2,

y sustituimos T′1 usando la primera ecuación:

T′′2 = 12

(− 3

4 T1 +12 T2 + 11

)− 7

10 T′2.

Despejando T1 de la segunda ecuación y sustituyendo en la expresión anterior, se obtiene:

T′′2 + 2920 T′2 +

1140 T2 = 11

2 .

Las raíces del polinomio característico son λ1 = −29+√

40140 y λ2 = −29−

√401

40 . Tras aplicar elmétodo de variación de las constantes, llegamos a que la solución general de la ecuación desegundo orden es

T2(t) = C1eλ1t + C2eλ2t +R

λ1λ2,

donde R = 112 es el término independiente. Por último, a partir de la segunda ecuación

podemos calcular T1:

T1(t) = C1(2λ1 +75 )e

λ1t + C2(2λ2 +75 )e

λ2t +7R

5λ1λ2.

Las condiciones iniciales del problema son T1(0) = 10 y T2(0) = 12, lo que da lugar a losvalores

C1 =1

λ1 − λ2

(− 17

5 − 12λ2 +Rλ1

), C2 =

1λ2 − λ1

(− 17

5 − 12λ1 +Rλ2

).

En la figura 2.8 se representa la evolución de las temperaturas en las zonas A y B durantecuatro horas. Como puede observarse, la temperatura en la zona A aumenta de forma conti-nua hasta alcanzar una temperatura máxima de T1(4) ≈ 22,8 ◦C. En cambio, la temperatura

Page 63: Apuntes MatemáticasII

2.8 Aplicaciones 63

Figura 2.8: Temperaturas en las zonas A y B.

en la zona B comienza disminuyendo y luego tiende a aumentar hasta alcanzar una tempera-tura máxima de T2(4) ≈ 14,7 ◦C. Si queremos calcular la temperatura mínima en la zona B,podemos usar la derivada de T2:

T′2(t) = 0⇒ λ1C1eλ1t + λ2C2eλ2t = 0⇒ t =1

λ1 − λ2log(−λ2C2

λ1C1

)≈ 0,76.

En dicho instante se alcanza la temperatura mínima: T2(0,76) ≈ 10,92 ◦C.Vamos a resolver el problema usando Sage. En primer lugar, obtenemos la solución del

sistema y la dibujamos:sage: t = var(’t’)sage: T1 = function(’T1’, t)sage: T2 = function(’T2’, t)sage: ec1 = diff(T1,t) + 3/4*T1 - 1/2*T2 - 11 == 0sage: ec2 = diff(T2,t) - 1/2*T1 + (1/5+1/2)* T2 == 0sage: sol = desolve_system ([ec1 , ec2], [T1, T2], ics=[0, 10, 12])sage: sol1 = sol [0]. rhs()sage: sol2 = sol [1]. rhs()sage: fig1 = plot(sol1 , 0, 4, color = ’blue’, legend_label=’T1’)sage: fig2 = plot(sol2 , 0, 4, color = ’green’, legend_label=’T2’)sage: (fig1 + fig2).show()

El resultado puede verse en la figura 2.8. A continuación, calculamos la temperatura máximaen la zona A y el instante en que se alcanza:sage: sol1.find_maximum_on_interval (0, 4)(22.846076301719574 , 3.9999998801867243)

así como la temperatura mínima en la zona B y su instante correspondiente:sage: sol1.find_maximum_on_interval (0, 4)(10.92326505335898 , 0.76403288092266153)

Page 64: Apuntes MatemáticasII

64

Page 65: Apuntes MatemáticasII

3 Métodos numéricos para problemas de valor inicial 65

3. Métodos numéricos para problemas de valor inicial

3.1. Introducción

En los capítulos anteriores hemos estudiado diversas técnicas para la resolución analíticade ecuaciones diferenciales ordinarias. Dichas técnicas son sólo aplicables a determinados ti-pos de ecuaciones: homogéneas, lineales, exactas, etc. Sin embargo, la mayoría de ecuacionesque aparecen en problemas científicos y técnicos no pueden resolverse de forma exacta. Ade-más, en determinados casos puede ocurrir que la complejidad de la solución exacta sea tal,que aun pudiéndose calcular de forma explícita no seamos capaces de interpretarla adecua-damente.

En los casos en que no sea posible resolver de forma exacta una ecuación diferencial,podemos plantearnos la obtención de una aproximación suficientemente buena de la solución.Esta solución, denominada solución numérica, se determina mediante un método o algoritmonumérico que se ejecutará con la ayuda de un ordenador. Este es el camino habitual que sesigue en las aplicaciones científicas y técnicas, donde surgen ecuaciones no lineales de difícilo imposible resolución analítica.

En este tema vamos a presentar una serie de técnicas para la obtención de soluciones nu-méricas de problemas de valor inicial (los problemas de contorno se tratarán en el tema 4) quepueden aplicarse tanto a ecuaciones escalares como a sistemas de ecuaciones. Dichas técnicasforman parte de una de las ramas de las Matemáticas conocida como Análisis Numérico.

Nos centraremos en el estudio de un problema de valor inicial de primer orden:{y′(x) = f (x, y(x)), x ∈ [a, b],

y(a) = y0.

Consideremos una discretización o mallado del intervalo [a, b], esto es, una partición del mismode la forma

a = x0 < x1 < x2 < · · · < xN−1 < xN = b.

Por simplicidad, supondremos que el mallado es uniforme: la longitud de cada subintervalo[xk, xk+1], k = 0, . . . , N − 1, es igual a un cierto valor h > 0 fijo. De esta forma, se verifica lasiguiente relación:

xk+1 = xk + h, k = 0, . . . , N − 1.

El valor h se denomina paso de malla y los puntos xk son los nodos del mallado. Nótese que larelación entre el paso de malla h y el número de subintervalos N es la siguiente:

h =b− a

N.

Observación. El paso de malla juega un papel fundamental en el análisis de los métodosnuméricos que vamos a presentar. Intuitivamente, mientras menor sea el paso de malla (estoes, mientras más puntos tenga el mallado) mejor será la aproximación de la solución.

Un método numérico para la resolución del problema de valor inicial es un algoritmo quepermite obtener, para cada nodo xk del mallado, una aproximación yk del valor de la soluciónexacta en el nodo, y(xk):

yk ≈ y(xk), k = 0, . . . , N.

Page 66: Apuntes MatemáticasII

66

El conjunto de puntos{yk : k = 0, . . . , N}

se denomina solución numérica. Nótese que el primer valor de la solución numérica es siempreexacto, y0 = y(a), por tratarse de la condición inicial del problema.

Figura 3.1: Comparación entre la solución exacta del problema y′ = x−y2 , y(0) = 1, y el resultado

obtenido con el método de Euler con paso de malla h = 0,1.

El error local cometido en cada nodo se define como

ek = |y(xk)− yk|, k = 0, 1, . . . , N.

Si queremos considerar un error global, que involucre a toda la solución numérica, podemosdefinir

e = maxk=0,1,...,N

ek = maxk=0,1,...,N

|y(xk)− yk|.

Notemos que el error e depende del paso de malla h; si queremos hacer resaltar esta dependen-cia, escribiremos e(h) en lugar de e. Una propiedad deseable de cualquier método numéricoes que el error tienda a cero cuando el paso de malla decrezca, esto es:

lımh→0

e(h) = 0.

Cuando esto sucede, diremos que el método es convergente. Intuitivamente significa que alaumentar progresivamente el número de puntos de la partición (esto es, al hacer el paso demalla cada vez más pequeño), las correspondientes soluciones numéricas van reconstruyendola solución exacta del problema.

3.2. El método de Euler

El método de Euler se fundamenta en una sencilla idea geométrica: aproximar el valor dela solución en cada nodo por el valor que proporciona la recta tangente a la solución trazadadesde el nodo anterior.

Page 67: Apuntes MatemáticasII

3.2 El método de Euler 67

Comenzamos construyendo la recta tangente a la solución exacta y(x) del problema devalor inicial {

y′(x) = f (x, y(x)), x ∈ [a, b],

y(a) = y0,

en el punto (x0, y0):y = y0 + y′(x0)(x− x0).

Evaluemos ahora dicha recta en el nodo x1 = x0 + h y llamemos y1 al resultado obtenido:

y1 = y0 + y′(x0)(x1 − x0)⇒ y1 = y0 + hy′(x0).

Teniendo que cuenta que y(x) es solución de la ecuación diferencial, podemos sustituir elvalor y′(x0) por f (x0, y(x0)):

y1 = y0 + h f (x0, y(x0)).

Por último, haciendo uso de la condición inicial y teniendo en cuenta que x0 = a, deducimosque

y1 = y0 + h f (x0, y0).

Esta es la primera iteración o paso del método de Euler. En la figura 3.2 se representa la ideageométrica del método.

y

(x1, y(x

1))

(x0, y

0)

(x1, y

1)

xx0

x1

y1

y(x1)

e1

h

Figura 3.2: Interpretación geométrica del método de Euler.

Observación. Notemos que el valor y1 puede determinarse, ya que x0, y0 y f (x, y) son datosdel problema, y h es conocido.

El valor y1 es la aproximación que proporciona el método de Euler al valor exacto de lasolución en x1:

y1 ≈ y(x1),

Page 68: Apuntes MatemáticasII

68

siendo el error cometidoe1 = |y(x1)− y1|.

Una vez construido el punto (x1, y1), consideramos el problema de valor inicial{y′(x) = f (x, y(x)), x ∈ [x1, b],

y(x1) = y1,

y repetimos el proceso anterior para obtener una aproximación y2 en el nodo x2 = x1 + h.Dicha aproximación tendrá la forma

y2 = y1 + h f (x1, y1).

Observación. Nótese que la solución de este nuevo problema de valor inicial no tiene por quéser la misma solución del problema original, ya que la condición inicial es distinta. Sin em-bargo, si la función f (x, y) es suficientemente regular, puede demostrarse que las solucionesa ambos problemas son suficientemente aproximadas.“Euler’s Method” (E342), Inst. Calc. Integralis 1768, §650:

!1

1

A B

C

h = 1/4– p.6/64

Figura 3.3: Publicación original del método de Euler. E342, Inst. Calc. Integralis 1768, §650.

El proceso anterior se repite hasta llegar al último nodo xN = b, obteniéndose así una seriede valores aproximados

{y1, y2, . . . , yN}

que forman la solución numérica. Dicha solución dependerá del paso de malla h elegido.Estamos ya en condiciones de definir la forma general del método de Euler:

yk+1 = yk + h f (xk, yk), k = 0, 1, . . . , N − 1,

donde los valores iniciales x0 e y0 vienen dados por la condición inicial del problema. Cadavalor yk proporciona una aproximación del valor exacto de la solución en el nodo xk:

yk ≈ y(xk), k = 0, 1, . . . , N,

siendo el error cometidoek = |y(xk)− yk|, k = 0, 1, . . . , N,

Observación. Además del error ek anteriormente definido, denominado error de discretización,en la práctica también hay que tener en cuenta los errores de redondeo que provienen de larepresentación de los números reales en el ordenador con una cantidad finita de cifras deci-males.

Page 69: Apuntes MatemáticasII

3.2 El método de Euler 69

Ejemplo 3.1. Consideremos el problema de valor inicial{y′ = 1

2 (x2 − y), x ∈ [0, 1],

y(0) = 1,

cuya solución exacta esy(x) = x2 − 4x + 8− 7e−x/2.

El método de Euler tiene en este caso la siguiente forma:

yk+1 = yk +h2(x2

k − yk), k = 0, 1, . . . , N − 1,

donde h = 1/N.En la tabla 3.1 se muestran, con una precisión de seis cifras decimales, los valores obtenidos

con el método de Euler para N = 10 (paso de malla h = 0,1), así como los valores exactos dela solución y los errores cometidos. En este caso, el error global es igual a e = 0,025697.

k xk yk y(xk) ek

0 0,0 1,000000 1,000000 0,0000001 0,1 0,950000 0,951394 0,0013942 0,2 0,903000 0,906138 0,0031383 0,3 0,859850 0,865044 0,0051944 0,4 0,821357 0,828885 0,0075275 0,5 0,788290 0,798395 0,0101056 0,6 0,761375 0,774272 0,0128977 0,7 0,741306 0,757183 0,0158778 0,8 0,728741 0,747760 0,0190199 0,9 0,724304 0,746603 0,02229910 1,0 0,728589 0,754285 0,025697

Tabla 3.1: Método de Euler: solución del ejemplo 3.1 con paso h = 0,1.

En la figura 3.4 se representan la solución exacta del problema y la solución numérica obteni-da.

Existe una implementación del método de Euler en Sage, cuyo uso se ilustra en el siguientecódigo:

sage: # Ejemplo 3.1sage: var(’x, y’)sage: fun(x, y) = (x^2-y)/2 # segundo miembro de la ecuacio ’nsage: a = 0. # extremo inferiorsage: b = 1. # extremo superiorsage: y0 = 1. # valor inicialsage: N = 10 # nu’mero de particionessage: h = (b-a)/N # paso de mallasage: eulers_method(fun , a, y0 , h, b)

x y h*f(x,y)

Page 70: Apuntes MatemáticasII

70

0.000000000000000 1.00000000000000 -0.05000000000000000.100000000000000 0.950000000000000 -0.04700000000000000.200000000000000 0.903000000000000 -0.04315000000000000.300000000000000 0.859850000000000 -0.03849250000000000.400000000000000 0.821357500000000 -0.03306787500000000.500000000000000 0.788289625000000 -0.02691448125000000.600000000000000 0.761375143750000 -0.02006875718750000.700000000000000 0.741306386562500 -0.01256531932812500.800000000000000 0.728741067234375 -0.004437053361718750.900000000000000 0.724304013872656 0.004284799306367181.00000000000000 0.728588813179023 0.0135705593410488

Vamos a representar en una misma gráfica el resultado obtenido y la solución exacta. Paraello, hagamos lo siguiente:

sage: sol = eulers_method(fun , a, y0, h, b, method=’None’)sage: sol[[0.000000000000000 , 1.00000000000000] ,[0.100000000000000 , 0.950000000000000] ,[0.200000000000000 , 0.903000000000000] ,[0.300000000000000 , 0.859850000000000] ,[0.400000000000000 , 0.821357500000000] ,[0.500000000000000 , 0.788289625000000] ,[0.600000000000000 , 0.761375143750000] ,[0.700000000000000 , 0.741306386562500] ,[0.800000000000000 , 0.728741067234375] ,[0.900000000000000 , 0.724304013872656] ,[1.00000000000000 , 0.728588813179023] ,[1.10000000000000 , 0.742159372520072]]

Como vemos, se ha calculado un punto de más. Podemos eliminarlo así:

sage: sol.pop(-1) # quitamos el elemento final de la lista

A continuación dibujamos los puntos obtenidos unidos por segmentos y la solución exactadel problema:

sage; # dibujamos los puntos obtenidos ...sage: fig1 = list_plot(sol , color=’blue’, legend_label=’Euler ’)sage: # ... y los unimos con segmentossage: fig1 += line(sol)sage: #sage: # Ca’lculo de la solucio ’n exactasage: y = function(’y’, x)sage: ec = diff(y, x) == fun(x, y)sage: sol_exacta = desolve(ec , y, ics=[0, y0]); expand(sol_exacta)x^2 - 4*x - 7*e^( -1/2*x) + 8sage: #sage: fig2 = plot(sol_exacta , a, b, color=’red’, legend_label=’exacta ’,

gridlines=’True’)sage: (fig1 + fig2).show()

El resultado puede contemplarse en la figura 3.4. Por último, si queremos determinar el errorglobal cometido, ejecutamos las siguientes instrucciones:

sage: error = [abs(sol_exacta(x)-y) for (x, y) in sol]sage: print(’Error = %r’ % max(error ))Error = 0.0256965688325422

Page 71: Apuntes MatemáticasII

3.2 El método de Euler 71

Alternativamente, en el siguiente código3 se realiza una implementación del método deEuler y se aplica para resolver el problema anterior:sage: # Me’todo de Eulersage: def euler(fun , a, b, N, y0):... h = (b-a)/N # paso de malla... x = [a] # primer nodo... y = [y0] # valor inicial...... for k in range(N):... x.append(x[k]+h)... y.append(y[k]+h*fun(x[k], y[k]))...... return zip(x, y)sage: #sage: ### Programa principal ###sage: # Ejemplo 3.1sage: var(’x, y’)sage: fun(x, y) = (x^2-y)/2 # segundo miembro de la ecuacio ’nsage: a = 0. # extremo inferiorsage: b = 1. # extremo superiorsage: y0 = 1. # valor inicialsage: N = 10 # nu’mero de particionessage: sol = euler(fun , a, b, N, y0) # me’todo de Eulersage: #sage: # solucio ’n exactasage: y = function(’y’, x)sage: ec = diff(y, x) == fun(x, y)sage: sol_exacta = desolve(ec , y, ics=[0, y0])sage: #sage: # erroressage: error = [abs(sol_exacta(x)-y) for (x, y) in sol]sage: print(’Error = %r’ % max(error ))sage: #sage: # gra’ficassage: fig1 = list_plot(sol , color=’blue’, legend_label=’Euler ’,

size=’20’)sage: fig1 += line(sol , color=’blue’)sage: fig2 = plot(sol_exacta , a, b, color=’red’, legend_label=’exacta ’,

gridlines=’True’)sage: (fig1 + fig2).show()Error = 0.0256965688325422

Si queremos ver los errores cometidos en cada nodo, basta con escribir error en la línea decomandos:sage: error[0.000000000000000 , 0.00139402849500125 , 0.00313807374828301 ,0.00519416502459535 , 0.00752722845412812 , 0.0101048935001661 ,0.0128973114779739 , 0.0158769854065062 , 0.0190186105161513 ,0.0222989247749311 , 0.0256965688325422]

Asimismo, para ver los valores de los nodos y de las soluciones aproximadas, basta con escri-bir sol.

Puede demostrarse que si la función f (x, y) es suficientemente regular, entonces existe una

3Es interesante señalar que Sage está basado en el lenguaje de programación Python. En particular, la definicióndel método de Euler utiliza la sintaxis propia de dicho lenguaje.

Page 72: Apuntes MatemáticasII

72

Figura 3.4: Soluciones numérica y exacta del ejemplo 3.1.

constante C > 0, independiente del paso de malla h, tal que

e(h) ≈ Ch,

donde e(h) es el error global cometido al aproximar la solución del problema de valor inicialmediante el método de Euler con paso de malla h.

Cuando un método numérico verifica una condición del tipo e(h) ≈ Ch, se dice que elmétodo tiene orden uno. Para comprender la idea intuitiva que hay detrás de este concepto,supongamos que se aplica el método de Euler con pasos de malla h1 y h2, siendo h2 = h1/2.En tal caso, se tiene:

e(h1) ≈ Ch1

e(h2) ≈ Ch2

}⇒ e(h1)

e(h2)≈ Ch1

Ch2=

h1

h2= 2⇒ e(h2) ≈

e(h1)

2.

Es decir, al dividir por dos el paso de malla el error también se divide aproximadamente pordos. En general, al dividir el paso de malla por un cierto valor M el error obtenido tambiénse dividirá aproximadamente por M.

Observación. En general, un método numérico tiene orden p si existe una constante C tal que

e(h) ≈ Chp.

Razonando como antes, podemos deducir que

e(h1)

e(h2)≈

Chp1

Chp2=

(h1

h2

)p

= 2p ⇒ e(h2) ≈e(h1)

2p .

Tomando logaritmos y despejando p, se obtiene una fórmula para determinar el orden delmétodo:

p ≈ log(e(h1)/e(h2))

log 2, con h2 =

h1

2.

Page 73: Apuntes MatemáticasII

3.2 El método de Euler 73

En el siguiente ejemplo se comprueba empíricamente que el método de Euler tiene ordenuno.

Ejemplo 3.2. Consideremos el problema del ejemplo 3.1. Habíamos visto que el error globalobtenido con paso de malla h = 0,1 (N = 10) era

e(0,1) = 0,025697.

Doblemos ahora el número de subintervalos (N = 20) o, lo que es lo mismo, dividamos entredos el paso de malla (h = 0,05). Al aplicar el método de Euler se obtiene un error global iguala

e(0,05) = 0,012830.

Observemos quee(0,1)e(0,05)

= 2,002792 ≈ 2⇒ e(0,05) ≈ e(0,1)2

,

es decir, al dividir entre dos el paso de malla el error cometido se divide aproximadamenteentre dos. Por otra parte, al aplicar la fórmula para aproximar el orden se obtiene:

p ≈ log(0,025697/0,012830)log 2

≈ 1,002079 ≈ 1.

Al realizar el experimento un cierto número de veces se obtienen los resultados de la tabla3.2, donde en la penúltima columna se escriben los cocientes entre dos errores consecutivos,y en la última las correspondientes aproximaciones del orden.

N h e cocientes orden

10 0,100000 0,025697 − −20 0,050000 0,012830 2,002792 1,00201240 0,025000 0,006410 2,001471 1,00106180 0,012500 0,003204 2,000753 1,000543160 0,006250 0,001602 2,000381 1,000275

Tabla 3.2: Estudio del orden del método de Euler.

Como puede verse, estas aproximaciones tienden a 1, que es el orden del método de Euler.

Una consecuencia inmediata de la condición e(h) ≈ Ch es que el método de Euler esconvergente. En efecto,

lımh→0

e(h) ≈ lımh→0

Ch = C lımh→0

h = 0.

La idea intuitiva es que, conforme el paso de malla tiende a cero, la solución numérica con-verge hacia la solución analítica. Este hecho se ilustra en el siguiente ejemplo.

Ejemplo 3.3. Consideremos de nuevo el problema del ejemplo 3.1. En la tabla 3.3 se mues-tran los errores obtenidos con una serie de pasos de malla que tienden a cero. Como puedeobservarse, dichos errores se van aproximando a cero.

Page 74: Apuntes MatemáticasII

74

N h e

10 10−1 2,5697 · 10−2

102 10−2 2,5630 · 10−3

103 10−3 2,5623 · 10−4

104 10−4 2,5626 · 10−5

105 10−5 2,5622 · 10−6

106 10−6 2,5623 · 10−7

Tabla 3.3: Convergencia del método de Euler.

Figura 3.5: Soluciones numéricas y exacta del ejemplo 3.3.

Asimismo, en la figura 3.5 se representan la solución exacta y las soluciones aproximadascon pasos de malla 10−1 y 10−2 (el resto de las soluciones son indistinguibles de la soluciónexacta en la figura). Observamos que mientras menor es el paso de malla, más se aproxima lasolución numérica a la solución exacta.

3.3. Métodos de orden superior

Comenzaremos esta sección dando una interpretación física del método de Euler. Para ello,consideremos una partícula cuya posición en el instante x denotaremos por y(x). Supongamosque la velocidad de la partícula puede expresarse como una función f (x, y), dependiente deltiempo x y la posición y. En tal caso, y(x) es solución de la ecuación diferencial

y′ = f (x, y).

La primera iteración del método de Euler se puede escribir como

y1 = y0 + (x1 − x0) f (x0, y0),

Page 75: Apuntes MatemáticasII

3.3 Métodos de orden superior 75

donde x1− x0 = h es el paso de malla. El punto y0 representa la posición inicial de la partículae y1 su posición final. El término f (x0, y0) puede interpretarse como la velocidad inicial dela partícula, mientras que x1 − x0 es el tiempo transcurrido. El producto (x1 − x0) f (x0, y0)

representa por tanto el espacio recorrido por la partícula entre los instantes x0 y x1, si sesupone que ésta viaja siempre a velocidad f (x0, y0). Estamos pues aproximando la posiciónfinal de la partícula como la posición inicial más el espacio recorrido al viajar a una velocidadconstante igual a la velocidad inicial. Esta es la interpretación cinética del método de Euler.

En lugar de considerar la velocidad inicial f (x0, y0) como estimación de la velocidad enel intervalo [x0, x1], podríamos considerar una aproximación distinta. Por ejemplo, podríamospensar en utilizar la media de las velocidades inicial y final, o incluso un promedio generalde velocidades. Al considerar cada una de estas posibilidades se obtienen diferentes métodosnuméricos, dos de los cuales presentaremos a continuación.

Método de Heun o de Euler mejoradoConsideremos la media entre las velocidades inicial f (x0, y0) y final f (x1, y1) de la partí-

cula. Podemos entonces escribir la aproximación y1 de la posición final de la siguiente forma:

y1 = y0 + (x1 − x0)f (x0, y0) + f (x1, y1)

2⇒ y1 = y0 +

h2( f (x0, y0) + f (x1, y1)).

Notemos que el término f (x1, y1) depende explícitamente de y1, que es desconocido a priori.Para solventar este problema, podemos aproximar el valor de y1 en f (x1, y1) mediante unaiteración del método de Euler, que denotaremos por p1:

p1 = y0 + h f (x0, y0)⇒ f (x1, y1) ≈ f (x1, p1).

Obtenemos de esta forma:

y1 = y0 +h2( f (x0, y0) + f (x1, p1)),

que es la primera iteración del método de Heun.La expresión general del método de Heun o de Euler mejorado es la siguiente:pk+1 = yk + h f (xk, yk),

yk+1 = yk +h2( f (xk, yk) + f (xk+1, pk+1)), k = 0, 1, . . . , N − 1.

Notemos que el punto xk+1 = xk + h es conocido en cada paso.

Observación. El método de Heun es un ejemplo de método predictor-corrector. El valor pk+1se interpreta como una predicción para el valor buscado y(xk+1), que luego se corrige paraobtener el valor final yk+1.

Puede probarse que el método de Heun es de orden dos: existe una constante C > 0,independiente del paso de malla h, tal que

e(h) ≈ Ch2,

Page 76: Apuntes MatemáticasII

76

siendo e(h) el error global obtenido al aproximar la solución mediante el método de Heun conpaso de malla h. Como consecuencia, el método de Heun es convergente.

Al ser el método de Heun de orden dos, al dividir el paso de malla entre dos el error come-tido se dividirá aproximadamente entre 22 = 4. Por tanto, el método de Heun proporciona unresultado más preciso que el método de Euler, si en ambos usamos el mismo paso de malla.Estos hechos quedarán patentes en el siguiente ejemplo.

Ejemplo 3.4. Retomemos el problema del ejemplo 3.1. Al aplicar el método de Heun pararesolverlo con paso de malla h = 0, 1, se obtienen los resultados de la tabla 3.4. Si comparamosestos resultados con los de la tabla 3.1, vemos que la precisión del método de Heun es superiora la del método de Euler.

k tk xk y(xk) ek

0 0,0 1,000000 1,000000 0,0000001 0,1 0,951500 0,951394 1,0597 · 10−4

2 0,2 0,906352 0,906138 2,1380 · 10−4

3 0,3 0,865367 0,865044 3,2306 · 10−4

4 0,4 0,829318 0,828885 4,3334 · 10−4

5 0,5 0,798939 0,798395 5,4429 · 10−4

6 0,6 0,774928 0,774272 6,5559 · 10−4

7 0,7 0,757950 0,757183 7,6693 · 10−4

8 0,8 0,748638 0,747760 8,7805 · 10−4

9 0,9 0,747591 0,746603 9,8870 · 10−4

10 10,0 0,755384 0,754285 1,0987 · 10−3

Tabla 3.4: Método de Heun: solución del ejemplo 3.1 con paso h = 0,1.

En la figura 3.6 se comparan gráficamente los resultados obtenidos con los métodos deEuler y Heun.

N h e cocientes orden

10 0,100000 1,0987 · 10−3 − −20 0,050000 2,7270 · 10−4 4,028877 2,01037840 0,025000 6,7926 · 10−5 4,014620 2,00526380 0,012500 1,6950 · 10−5 4,007353 2,002650160 0,006250 4,2337 · 10−6 4,003687 2,001329

Tabla 3.5: Estudio del orden del método de Heun.

Los resultados obtenidos al dividir sucesivamente entre dos el paso de malla se muestranen la tabla 3.5 . Como puede comprobarse, el cociente entre errores sucesivos tiende a 22 = 4y las aproximaciones del orden convergen hacia 2.

El método de Heun no viene implementado en Sage, por lo que es necesario programarlo

Page 77: Apuntes MatemáticasII

3.3 Métodos de orden superior 77

Figura 3.6: Ejemplo 3.4: resultados obtenidos con los métodos de Euler y Heun.

directamente. El siguiente código Sage, que incluye una implementación del método de Heun,se ha utilizado para generar parte de la figura 3.6:sage: # Me’todo de Heunsage: def heun(fun , a, b, N, y0):... h = (b-a)/N # paso de malla... x = [a] # primer nodo... y = [y0] # valor inicial...... for k in range(N):... x.append(x[k]+h)... aux = fun(x[k], y[k])... p = y[k]+h*aux # prediccio ’n... y.append(y[k]+(h/2)*( aux+fun(x[k]+h, p))) # correccio ’n...... return zip(x, y)sage: #sage: ### Programa principal ###sage: #sage: # Ejemplo 3.4sage: var(’x, y’)sage: fun(x, y) = (x^2-y)/2 # segundo miembro de la ecuacio ’nsage: a = 0. # extremo inferiorsage: b = 1. # extremo superiorsage: y0 = 1. # valor inicialsage: N = 10 # nu’mero de particionessage: sol = heun(fun , a, b, N, y0) # me’todo de Heunsage: #sage: # solucio ’n exactasage: y = function(’y’, x)sage: ec = diff(y, x) == fun(x, y)sage: sol_exacta = desolve(ec , y, ics=[0, y0])sage: #sage: # erroressage: error = [abs(sol_exacta(x)-y) for (x, y) in sol]sage: print(’Error = %r’ % max(error ))sage: #

Page 78: Apuntes MatemáticasII

78

sage: # gra’ficassage: fig1 = list_plot(sol , color=’blue’, legend_label=’Heun’,

size=’20’)sage: fig1 += line(sol , color=’blue’)sage: fig2 = plot(sol_exacta , a, b, color=’red’, legend_label=’exacta ’,

gridlines=’True’)sage: (fig1 + fig2).show()Error = 0.00109866300079819

Método de Runge-Kutta de cuarto ordenEl método de Runge-Kutta de cuarto orden (RK4) tiene la siguiente expresión:

yk+1 = yk +h6(K1 + 2K2 + 2K3 + K4), k = 0, 1, . . . , N − 1,

donde K1 = f (xk, yk),

K2 = f (xk +h2 , yk +

h2 K1),

K3 = f (xk +h2 , yk +

h2 K2),

K4 = f (xk + h, yk + hK3).

En este caso se ha considerado un promedio de cuatro velocidades diferentes: una en el nodoinicial xk, dos correcciones en el nodo intermedio xk +

h2 , y otra en el nodo final xk + h.

El método de Runge-Kutta tiene orden cuatro, es decir, existe una constante C > 0, inde-pendiente del paso de malla h, tal que

e(h) ≈ Ch4,

donde e(h) es el error global que se produce al aproximar la solución del problema medianteel método de Runge-Kutta con paso de malla h. De este modo, al dividir el paso de mallaentre dos el error se divide entre 24 = 16.

Observación. Existe una clase general de métodos Runge-Kutta de orden arbitrario, de loscuales el aquí estudiado no es más que un caso particular.

Ejemplo 3.5. Al aplicar el método de Runge-Kutta con paso de malla h = 0,1 al problema delejemplo 3.1, se obtienen los resultados de la tabla 3.6. Es claro que el método de Runge-Kuttaproduce resultados mucho más precisos que los métodos de Euler o de Heun para el mismopaso de malla.

Asimismo, al realizar el experimento de divisiones sucesivas del paso de malla, se obtienenlos resultados de la tabla 3.7. Dichos resultados muestran que el método de Runge-Kutta tieneorden cuatro.

En Sage existe una implementación del método RK4, cuyo uso puede verse en el siguientecódigo:

Page 79: Apuntes MatemáticasII

3.3 Métodos de orden superior 79

k tk xk y(xk) ek

0 0,0 1,000000 1,000000 0,0000001 0,1 0,951394 0,951394 7,9633 · 10−9

2 0,2 0,906138 0,906138 1,6420 · 10−8

3 0,3 0,865044 0,865044 2,5303 · 10−8

4 0,4 0,828885 0,828885 3,4550 · 10−8

5 0,5 0,798395 0,798395 4,4106 · 10−8

6 0,6 0,774273 0,774272 5,3917 · 10−8

7 0,7 0,757183 0,757183 6,3936 · 10−8

8 0,8 0,747760 0,747760 7,4120 · 10−8

9 0,9 0,746603 0,746603 8,4429 · 10−8

10 10,0 0,754285 0,754285 9,4825 · 10−8

Tabla 3.6: Método de Runge-Kutta: solución del ejemplo 3.1 con paso h = 0,1.

N h e cocientes orden

10 0,100000 9,4825 · 10−8 − −20 0,050000 5,9132 · 10−9 16,036346 4,00327440 0,025000 3,6911 · 10−10 16,020039 4,00180680 0,012500 2,3053 · 10−11 16,011356 4,001024160 0,006250 1,4405 · 10−12 16,003314 4,000299

Tabla 3.7: Estudio del orden del método de Runge-Kutta.

sage: # Ejemplo 3.5sage: var(’x, y’)sage: fun(x, y) = (x^2-y)/2 # segundo miembro de la ecuacio ’nsage: a = 0. # extremo inferiorsage: b = 1. # extremo superiorsage: y0 = 1. # valor inicialsage: N = 10 # particionessage: h = (b-a)/N # paso de mallasage: desolve_rk4(fun , y, ics=[a, y0], end_points =[a, b], step=h)[[0.000000000000000 , 1.00000000000000] ,[0.1, 0.951394036458] ,[0.2, 0.906138090168] ,[0.3, 0.865044190327] ,[0.4, 0.828884763004] ,[0.5, 0.798394562606] ,[0.6, 0.774272509145] ,[0.7, 0.757183435905] ,[0.8, 0.747759751871] ,[0.9, 0.746603023076] ,[1.0, 0.754285476837]]

Si queremos dibujar el resultado, así como la solución exacta, basta con hacer:sage: sol = desolve_rk4(fun , y, ics=[a, y0], end_points =[a, b], step=h)sage: fig1 = list_plot(sol , color=’green ’, legend_label=’RK4’,

Page 80: Apuntes MatemáticasII

80

size=’20’)sage: fig1 += line(sol , color=’green ’)sage: # exactasage: y = function(’y’, x)sage: ec = diff(y, x) == fun(x, y)sage: sol_exacta = desolve(ec , y, ics=[0, y0])sage: #sage: fig2 = plot(sol_exacta , a, b, color=’red’, legend_label=’exacta ’,

gridlines=’True’)sage: (fig1 + fig2).show()

La gráfica resultante es similar a la de la figura 3.7, donde también se ha dibujado el resultadoobtenido con el método de Euler para comparar. Para calcular el error cometido, ejecutamos:sage: error = [abs(sol_exacta(x)-y) for (x, y) in sol]sage: print(’Error = %r’ % max(error ))Error = 9.48253844335e-08

De forma alternativa, el siguiente código proporciona una implementación directa delmétodo RK4:sage: # Me’todo RK4 (Runge -Kutta de cuarto orden)sage: def rk4(fun , a, b, N, y0):... h = (b-a)/N # paso de malla... x = [a] # primer nodo... y = [y0] # valor inicial...... for k in range(N):... x.append(x[k]+h)... K1 = fun(x[k], y[k])... K2 = fun(x[k]+h/2, y[k]+(h/2)*K1)... K3 = fun(x[k]+h/2, y[k]+(h/2)*K2)... K4 = fun(x[k]+h, y[k]+h*K3)... y.append(y[k]+(h/6)*( K1+2*K2+2*K3+K4))...... return zip(x, y)sage: #sage: ### Programa principal ###sage: #sage: # Ejemplo 3.5sage: var(’x, y’)sage: fun(x, y) = (x^2-y)/2 # segundo miembro de la ecuacio ’nsage: a = 0. # extremo inferiorsage: b = 1. # extremo superiorsage: y0 = 1. # valor inicialsage: N = 10 # nu’mero de particionessage: sol = rk4(fun , a, b, N, y0) # me’todo RK4sage: #sage: # solucio ’n exactasage: y = function(’y’, x)sage: ec = diff(y, x) == fun(x, y)sage: sol_exacta = desolve(ec , y, ics=[0, y0])sage: #sage: # erroressage: error = [abs(sol_exacta(x)-y) for (x, y) in sol]sage: print(’Error = %r’ % max(error ))sage: #sage: # gra’ficassage: fig1 = list_plot(sol , color=’blue’, legend_label=’RK4’, size=’20’)sage: fig1 += line(sol , color=’blue’)

Page 81: Apuntes MatemáticasII

3.4 Algunas consideraciones 81

sage: fig2 = plot(sol_exacta , a, b, color=’red’, legend_label=’exacta ’,gridlines=’True’)

sage: (fig1 + fig2).show()Error = 9.48253855437287e-8

Figura 3.7: Ejemplo 3.5: resultados obtenidos con los métodos de Euler y RK4.

Ejemplo 3.6. Consideremos el problema de valor inicial{y′ = −y + cos(x), x ∈ [0, 4π],

y(0) = 1,

cuya solución exacta es

y(x) =sen(x) + cos(x) + e−x

2.

Al resolver el problema mediante los métodos presentados en esta sección se obtienen losresultados de la tabla 3.8. Como puede observarse, el método de Euler es el que proporcionapeores resultados, mientras que el método de Runge-Kutta es el más preciso.

En las figuras 3.8 y 3.9 se han representado las soluciones numéricas obtenidas con N = 25y N = 50 particiones, respectivamente.

3.4. Algunas consideraciones

Existe una forma alternativa de deducir los métodos numéricos presentados en la secciónanterior, más formal desde el punto de vista matemático. Si integramos la ecuación diferencialy′ = f (x, y) entre dos nodos consecutivos, obtenemos:∫ xk+1

xk

y′(x) dx =∫ xk+1

xk

f (x, y(x)) dx ⇒ y(xk+1)− y(xk) =∫ xk+1

xk

f (x, y(x)) dx,

Page 82: Apuntes MatemáticasII

82

N Euler Heun Runge-Kutta

25 1,4781 · 10−1 4,3932 · 10−2 3,9247 · 10−4

50 6,9090 · 10−2 9,6635 · 10−3 2,1724 · 10−5

100 3,3713 · 10−2 2,2901 · 10−3 1,2866 · 10−6

250 1,3254 · 10−2 3,5386 · 10−4 3,1808 · 10−8

500 6,5896 · 10−3 8,7449 · 10−5 1,9651 · 10−9

1000 3,2856 · 10−3 2,1738 · 10−5 1,2211 · 10−10

2500 1,3120 · 10−3 3,4662 · 10−6 3,1230 · 10−12

Tabla 3.8: Errores obtenidos al resolver el problema del ejemplo 3.6.

Figura 3.8: Ejemplo 3.6: soluciones obtenidas con N = 25.

tras aplicar la regla de Barrow en el primer miembro. Por tanto, tenemos que

y(xk+1) = y(xk) +∫ xk+1

xk

f (x, y(x)) dx.

A continuación aproximamos y(xk) e y(xk+1) por yk e yk+1, respectivamente. La integral seaproxima mediante una fórmula de cuadratura o de integración numérica:

yk+1 = yk +

{fórmula de cuadratura para

∫ xk+1

xk

f (x, y(x)) dx}

.

Al aplicar distintas fórmulas de cuadraturas, se obtienen distintos métodos numéricos. Porejemplo, al aproximar la integral mediante la fórmula del rectángulo,∫ xk+1

xk

f (x, y(x)) dx ≈ h f (xk, yk),

se obtiene el método de Euler:yk+1 = yk + h f (xk, yk).

Page 83: Apuntes MatemáticasII

3.4 Algunas consideraciones 83

Figura 3.9: Ejemplo 3.6: soluciones obtenidas con N = 50.

Esta técnica permite construir métodos numéricos más generales que los estudiados en estasección.

Todos los métodos numéricos estudiados pueden aplicarse para la resolución de sistemasde ecuaciones diferenciales. Para ello, basta con aplicar el método elegido a cada una delas componentes del sistema. Por ejemplo, el método de Euler para resolver el problema devalores iniciales dado por

x′(t) = f (t, x(t), y(t)), t ∈ [a, b],

y′(t) = g(t, x(t), y(t)),

x(a) = x0,

y(a) = y0,

adoptaría la siguiente forma:{xk+1 = xk + h f (tk, xk, yk),

yk+1 = yk + hg(tk, xk, yk), k = 0, 1, . . . , N − 1.

De manera análoga se escribirían los métodos de Heun y Runge-Kutta.Por último, consideremos un problema de valores iniciales para una ecuación diferencial

de segundo orden: x′′(t) = f (t, x(t), y(t)),

x(a) = x0,

x′(a) = x′0.

Su resolución numérica pasa por transformarlo en un problema de valores iniciales y aplicaralguno de los métodos numéricos estudiados a dicho problema. Llamando y(t) = x′(t) e

Page 84: Apuntes MatemáticasII

84

y0 = x′0, obtenemos: x′(t) = y(t),

y′(t) = f (t, x(t), y(t)),

x(a) = x0,

y(a) = y0.

En este caso, la solución numérica del sistema consta de dos sucesiones de valores aproxima-dos: {xk}N

k=0, que aproxima a la solución x(t), e {yk}Nk=0, que aproxima a la derivada de la

solución y(t) = x′(t).

3.5. Aplicación: deflexión de vigas en voladizo

La ecuación diferencial que determina el desplazamiento de una viga puede determinarsea partir de la relación existente entre el momento flector M(x) (que depende de la distribuciónde carga que soporta la viga), el radio de curvatura κ(x) de la curva y(x) que define la formade la viga, el módulo de elasticidad E (que depende del material) y el momento de inercia I(que depende de la geometría de la viga). Dicha relación es la siguiente:

M(x) =κ(x)EI

.

Teniendo en cuenta que el radio de curvatura depende de las dos primeras derivadas de y(x),puede deducirse la siguiente ecuación no lineal:

y′′(x) =M(x)

EI(1 + y′(x))3/2, x ∈ [0, L],

donde L es la longitud de la viga.Cuando la flexión de la viga es pequeña, se tiene que y′(x) ≈ 0. Por tanto, asumiendo esta

hipótesis de pequeñas deformaciones, obtenemos:

y′′(x) =M(x)

EI, x ∈ [0, L].

Si consideramos el caso de una viga en voladizo, debemos imponer las siguientes condicionesiniciales:

y(0) = 0, y′(0) = 0.

La condición y(0) = 0 indica que el extremo izquierdo de la viga está situado en el origende coordenadas, mientras que la condición y′(0) = 0 nos dice que dicho extremo permanecefijo. De esta forma hemos expresado y(x) como solución de un problema de valores inicia-les. Para resolverlo numéricamente será necesario escribirlo en forma de sistema, tal y comocomentamos al final de la sección 3.3.

La ecuación diferencial obtenida depende de la forma del momento flector, que a su vezdepende de la distribución de la carga que soporta la viga. Vamos a tener en cuenta dos casos:

Carga uniformemente distribuida P (figura 3.10):

M(x) =∫ L

x

−PL

(t− x) dt = − P2L

(L− x)2.

Page 85: Apuntes MatemáticasII

3.5 Aplicación: deflexión de vigas en voladizo 85

Carga puntual P en el extremo de la viga en voladizo (figura 3.11):

M(x) = −P(L− x).

P

L

Figura 3.10: Deflexión de una viga en voladizo con carga uniformemente distribuida: esquema.

P

L

Figura 3.11: Deflexión de una viga en voladizo con carga puntual en un extremo: esquema.

Consideremos una viga de longitud L = 2 m y tomemos los valores E = 2 · 1011 N/m2

y I = 7,85 · 10−9 m4 (véase el ejemplo 2.24). En las figuras 3.12 y 3.13 se representan losresultados obtenidos al aplicar el método RK4 con N = 20 particiones y P = 150. En la figura3.12 se ha supuesto que la carga está uniformemente distribuida a lo largo de la viga, mientrasque la figura 3.13 representa el caso de una carga puntual situada en el extremo derecho de laviga. Como puede observarse, en este último caso la hipótesis de pequeñas deformaciones esmenos plausible.

Damos a continuación el código Sage que se ha utilizado para resolver los problemasconsiderados:sage: # Deflexio ’n de vigas en voladizosage: # -------------------------------sage: #sage: # Ecuacio ’n: y ’’=(M(x)/(EI ))*(1+y ’)^(3/2) en [0, L].sage: # Condiciones iniciales: y(0)=0, y ’(0)=0.sage: #sage: # En forma de sistema:sage: # y1’ = y2sage: # y2’ = (M(x)/(EI ))*(1+ y2 )^(3/2)

Page 86: Apuntes MatemáticasII

86

Figura 3.12: Viga en voladizo: carga uniformemente distribuida.

Figura 3.13: Viga en voladizo: carga puntual en el extremo de la viga.

sage: #sage: # Condiciones iniciales: y1(0)=0, y2 (0)=0.sage: #sage: # Me’todo: RK4 para sistemassage: #sage: # datos del problemasage: L = 2. # longitud de la vigasage: Q = 0. # carga axialsage: E = 2.e11 # modulo de elasticidadsage: I = 7.85e-9 # momento de inerciasage: P = 150. # cargasage: #sage: # condiciones inicialessage: y10 = 0.

Page 87: Apuntes MatemáticasII

3.5 Aplicación: deflexión de vigas en voladizo 87

sage: y20 = 0.sage: #sage: # segundo miembro de la ecuacio ’n no linealsage: op = 0 # opciones:... # 0: carga uniformemente distribuida... # 1: carga puntual en el extremo de la viga...sage: if (op == 0):... # carga uniformemente distribuida... R(x) = -(P/(2.*L))*(L-x)^2/(E*I)... else:... # carga puntual en el extremo de la viga... R(x) = -P*(L-x)/(E*I)...sage: #sage: ### Me’todo RK4 para sistemas ###sage: #sage: N = 20 # nu’mero de particionessage: h = L/N # paso de mallasage: #sage: var(’x, y1 , y2’)sage: # solucio ’n del caso no linealsage: sol_NL = desolve_system_rk4 ([y2 , R(x)*(1.+ y2)^1.5] , [y1, y2],

ics=[0, y10 , y20], ivar=x, step=h, end_points =2)sage: #sage: # solucio ’n del caso linealsage: sol_L = desolve_system_rk4 ([y2 , R(x)], [y1 , y2],

ics=[0, y10 , y20], ivar=x, step=h, end_points =2)sage: #sage: # dibujamos las solucionessage: sol1 = [[i, j] for (i, j, k) in sol_NL] # solucio ’n no linealsage: sol2 = [[i, j] for (i, j, k) in sol_L] # solucio ’n linealsage: fig1 = list_plot(sol1 , legend_label=’no lineal ’, size=’20’,

gridlines=’True’)sage: fig1 += line(sol1)sage: fig2 = list_plot(sol2 , color=’red’, legend_label=’lineal ’)sage: fig2 += line(sol2 , color=’red’)sage: (fig1 + fig2).show()

Page 88: Apuntes MatemáticasII

88

Page 89: Apuntes MatemáticasII

4 Métodos numéricos para problemas de contorno 89

4. Métodos numéricos para problemas de contorno

4.1. Introducción

En este tema nos centraremos en el desarrollo de métodos numéricos para la resoluciónde problemas de contorno, de la forma

y′′ = f (x, y, y′), x ∈ [a, b],

y(a) = α,

y(b) = β.

En los métodos estudiados en el tema anterior para problemas de valor inicial, la soluciónnumérica se construía de forma recursiva: a partir del valor aproximado yk en el nodo xk,se calcula el valor aproximado yk+1 en el siguiente nodo xk+1; este proceso se repite hastallegar al final del intervalo donde queremos resolver la ecuación. El enfoque para problemasde contorno es distinto: la solución numérica va a venir dada como solución de un sistema deecuaciones, cuyo tamaño dependerá del número de nodos de la partición.

Presentaremos dos métodos fundamentales para el estudio de problemas de contorno: elmétodo de diferencias finitas y el método de elementos finitos. El método de diferencias finitas sebasa en aproximar las derivadas que aparecen en la ecuación diferencial mediante fórmulasadecuadas en cada nodo. El método de elementos finitos se construye a partir de la denomi-nada formulación variacional del problema de contorno, y ofrece mayor adaptabilidad que elmétodo de diferencias finitas a la hora de estudiar fenómenos complejos. En la actualidad,el método de elementos finitos es ampliamente utilizado para resolver problemas científicosy técnicos: cálculo de estructuras, aerodinámica de vehículos, interacciones fluido-estructura,procesamiento de imágenes médicas, optimización de formas, etc.

4.2. Método de diferencias finitas

Uno de los métodos básicos para la resolución numérica de problemas de contorno es elconocido como método de diferencias finitas, que estudiaremos en esta sección. Por simplicidad,nos centraremos en el estudio numérico de un problema lineal de la forma

y′′ + p(x)y′ + q(x)y = r(x), x ∈ [a, b],

y(a) = α,

y(b) = β.

Comencemos construyendo una partición del intervalo [a, b] de la siguiente forma:

a = x0 < x1 < · · · < xN−1 < xN = b,

con xj = a + jh para j = 0, 1, . . . , N, siendo h = b−aN el paso de malla. Los puntos x1, . . . , xN−1

son los nodos interiores de la partición. Evaluando la ecuación diferencial en cada nodo interior,se obtiene:

y′′(xj) + pjy′(xj) + qjy(xj) = rj, j = 1, . . . , N − 1,

Page 90: Apuntes MatemáticasII

90

donde, por simplicidad, hemos definido pj = p(xj), qj = q(xj) y rj = r(xj).Las derivadas de y(x) en cada nodo xj pueden aproximarse mediante las siguientes fór-

mulas:

y′(xj) ≈y(xj+1)− y(xj−1)

2h, y′′(xj) ≈

y(xj+1)− 2y(xj) + y(xj−1)

h2 ,

que son las diferencias finitas que dan nombre al método (figura 4.1).

(xj, y(x

j))

xj

xj-1

xj+1

h h

2h

m_m

+

mc

(xj+1

, y(xj+1))

(xj-1

, y(xj-1))

Figura 4.1: Aproximaciones de la derivada de y(x) en el punto xj.

Observación. Veamos de dónde surgen las fórmulas anteriores. En primer lugar, notemosque y′(xj) no es más que la pendiente de la recta tangente a la curva solución en el punto(xj, y(xj)). Podemos aproximar dicha pendiente de varias formas:

Como la pendiente m+ de la recta que pasa por (xj, y(xj)) y (xj+1, y(xj+1)):

y′(xj) ≈y(xj+1)− y(xj)

xj+1 − xj=

y(xj+1)− y(xj)

h≡ m+.

Como la pendiente m− de la recta que pasa por (xj, y(xj)) y (xj−1, y(xj−1)):

y′(xj) ≈y(xj)− y(xj−1)

xj − xj−1=

y(xj)− y(xj−1)

h≡ m−.

Como la pendiente mc de la recta que pasa por (xj+1, y(xj+1)) y (xj−1, y(xj−1)):

y′(xj) ≈y(xj+1)− y(xj−1)

xj+1 − xj−1=

y(xj+1)− y(xj−1)

2h≡ mc.

Claramente, mc es la media de los valores m+ y m−.

Page 91: Apuntes MatemáticasII

4.2 Método de diferencias finitas 91

Las aproximaciones m+ y m− se denominan descentradas, mientras que mc es una aproxima-ción centrada. Puede probarse que, en general, la aproximación centrada es más precisa quecualquiera de las dos descentradas.

Por otra parte, la segunda derivada en xj se aproxima de la siguiente forma:

y′′(xj) ≈y′(xj)

+ − y′(xj)−

h,

donde y′(xj)± son aproximaciones laterales de la primera derivada en xj. Tomando m+ ≈

y′(xj)+ y m− ≈ y′(xj)

−, obtenemos:

y′′(xj) ≈m+ −m−

h=

y(xj+1)−y(xj)h − y(xj)−y(xj−1)

hh

=y(xj+1)− 2y(xj) + y(xj−1)

h2 ,

que es la fórmula buscada.

Sustituyendo las expresiones para las derivadas en las ecuaciones anteriores y cambiandolos valores exactos y(xj) por valores aproximados yj, resulta:

yj+1 − 2yj + yj−1

h2 + pjyj+1 − yj−1

2h+ qjyj = rj, j = 1, . . . , N − 1.

Nótese que los valores en los extremos del intervalo son conocidos, gracias a las condicionesde contorno:

y0 = y(x0) = y(a) = α, yN = y(xN) = y(b) = β.

En resumen, hemos construido un sistema lineal de N − 1 ecuaciones con N − 1 incógnitas, asaber, {y1, y2, . . . , yN−1}. Reagrupando, el sistema puede escribirse de la siguiente forma:

(h2

pj − 1)

yj−1 + (2− h2qj)yj +

(−h

2pj − 1

)yj+1 = −h2rj, j = 1, 2, . . . , N − 1,

y0 = α,

yN = β.

La solución del sistema nos proporciona un conjunto de aproximaciones a los valores de lasolución exacta en cada uno de los nodos interiores: yj ≈ y(xj).

Notemos que todas las ecuaciones anteriores poseen la misma estructura, a excepción dela primera y la última. En efecto, para j = 1 se tiene que(

h2

p1 − 1)���

αy0 + (2− h2q1)y1 +

(−h

2p1 − 1

)y2 = −h2r1,

de donde

(2− h2q1)y1 +

(−h

2p1 − 1

)y2 = −h2r1 + α

(1− h

2p1

),

mientras que para j = N − 1 se deduce, de forma análoga:(h2

pN−1 − 1)

yN−2 + (2− h2qN−1)yN−1 = −h2rN−1 + β

(1 +

h2

pN−1

).

Page 92: Apuntes MatemáticasII

92

Podemos escribir el sistema lineal en forma matricial:

AY = B,

donde

Y =

y1

y2...

yj...

yN−1

, B =

−h2r1 + α

(1− h

2p1

)−h2r2

...

−h2rj...

−h2rN−1 + β

(1 +

h2

pN−1

)

,

y

A =

2− h2q1 −h2

p1 − 1 0 0 · · · 0h2

p2 − 1 2− h2q2 −h2

p2 − 1 0 · · · 0

0. . . . . . . . .

......

h2

pj − 1 2− h2qj −h2

pj − 1...

.... . . . . . . . .

...

0 · · · h2

pN−2 − 1 2− h2qN−2 −h2

pN−2 − 1

0 · · · 0h2

pN−1 − 1 2− h2qN−1

Como vemos, la matriz A tiene estructura tridiagonal. Este tipo de matrices tiene innumerablesventajas desde un punto de vista numérico a la hora de resolver el sistema lineal.

Observación. La resolución numérica de sistemas lineales constituye una rama fundamen-tal del Análisis Numérico, con importantes aplicaciones prácticas. Las técnicas empleadas sesalen del ámbito de este curso, por lo que no entraremos en más detalles.

Observación. Cuando se consideran condiciones de contorno de tipo Neumann, y′(a) = α

e y′(b) = β, es necesario añadir las ecuaciones correspondientes a j = 0 y j = N, y usardiscretizaciones adecuadas para las derivadas en las condiciones de contorno.

Ejemplo 4.1. Consideremos el problema de contornoy′′ − y = x2 + 1, x ∈ [0, 1],

y(0) = 0,

y(1) = 0,

cuya solución exacta es

y(x) = −3− x2 +4e− 3e2 − 1

ex − 4e− 3e2

e2 − 1e−x.

Page 93: Apuntes MatemáticasII

4.2 Método de diferencias finitas 93

Dividamos el intervalo [0, 1] en cuatro subintervalos; de este modo, N = 4, el paso demalla es h = 1

4 y los nodos de la partición son x0 = 0, x1 = 14 , x2 = 1

2 , x3 = 34 y x4 = 1.

Evaluando la ecuación diferencial en los nodos interiores, resulta:

y′′(xj)− y(xj) = x2j + 1, j = 1, 2, 3.

A continuación, aproximamos mediante diferencias finitas:

yj+1 − 2yj + yj−1

h2 − yj = x2j + 1, j = 1, 2, 3,

Teniendo en cuenta las condiciones de contorno y0 = y(x0) = 0 e y4 = y(x4) = 0, podemosescribir las ecuaciones anteriores del siguiente modo:

y2 − 2y1 +���0

y0

h2 − y1 = x21 + 1

y3 − 2y2 + y1

h2 − y2 = x22 + 1

���0

y4 − 2y3 + y2

h2 − y3 = x23 + 1

(2 + h2)y1 − y2 = −h2(x2

1 + 1)

−y1 + (2 + h2)y2 − y3 = −h2(x22 + 1)

−y2 + (2 + h2)y3 = −h2(x23 + 1)

que en forma matricial se expresan como2 + h2 −1 0−1 2 + h2 −10 −1 2 + h2

y1

y2

y3

= −h2

x21 + 1

x22 + 1

x23 + 1

.

La solución de dicho sistema, una vez sustituidos los valores de h y de los nodos, es:

y1 ≈ −0,102151, y2 ≈ −0,144281, y3 = −0,117303.

En la figura 4.2 se representan la solución exacta y los valores aproximados obtenidos. Dichafigura se ha realizado con el siguiente código Sage:sage: # Ejemplo 4.1sage: #sage: ### Me’todo de diferencias finitas ###sage: #sage: # Ecuacio ’n: y ’’+p(x)y’+q(x)y=r(x), a<x<b.sage: # Condiciones de contorno de tipo Dirichlet:sage: # y(a)=alpha , y(b)=beta.sage: #sage: # Datos del problemasage: #sage: a = 0. # extremo inferior del intervalosage: b = 1. # extremo superior del intervalosage: #sage: N = 4 # nu’mero de particionessage: #sage: p(x) = 0. # coeficiente de y’sage: q(x) = -1. # coeficiente de ysage: r(x) = x^2+1. # te’rmino independiente

Page 94: Apuntes MatemáticasII

94

sage: #sage: alpha = 0. # c. contorno izquierdasage: beta = 0. # c. contorno derechasage: #sage: ### Implementacio ’n del me’todo ###sage: #sage: h = (b-a)/N # paso de mallasage: #sage: X = vector ([a+j*h for j in range(N+1)]) # malladosage: Y = vector ([0. for j in range(N+1)]) # solucio ’nsage: #sage: # condiciones de contornosage: Y[0] = alphasage: Y[N] = betasage: #sage: # te’rmino independientesage: B = vector ([(-h^2)*r(X[j+1]) for j in range(N-1)])sage: B[0] += alpha *(1 -0.5*h*p(X[1]))sage: B[N-2] += beta *(1+0.5*h*p(X[N -1]))sage: #sage: # matriz del sistemasage: A = matrix(RR, N-1, N-1)sage: #sage: for j in range(1, N-1):... A[j-1, j-1] = 2.-q(X[j])*h^2 # diagonal... A[j-1, j] = -1.-0.5*h*p(X[j]) # superdiagonal... A[j, j-1] = -1.+0.5*h*p(X[j]) # subdiagonalsage: A[N-2, N-2] = 2.-q(X[N -1])*h^2 # u’ltimo elemento de la diagonalsage: #sage: # solucio ’n del sistema linealsage: sol = A.inverse ()*B # y=A^(-1)*Bsage: #sage: # actualizacio ’n del vector ysage: for j in range(0, N-1):... Y[j+1] = sol[j]sage: #sage: #################################sage: #sage: # dibujamos los puntossage: sol = zip(X, Y)sage: fig1 = list_plot(sol , color=’blue’, legend_label=’aprox.’)sage: # y los unimos con segmentossage: fig1 += line(sol)sage: #sage: ### Comparacio ’n con la solucio ’n exacta ###sage: y = function(’y’, x)sage: ec = diff(y, x, 2) + p(x)*diff(y, x) + q(x)*y == r(x)sage: sol = desolve(ec, y, ics=[a, alpha , b, beta])sage: #sage: fig2 = plot(sol , a, b, color=’red’, legend_label=’exacta ’)sage: (fig1+fig2).show()

Como disponemos de la solución exacta, es posible determinar el error ej = |y(xj)− yj|cometido en cada uno de los nodos:

e1 ≈ 0,001366, e2 ≈ 0,001853, e3 ≈ 0,001443.

Por tanto, el error global será e = max(e1, e2, e3) ≈ 0,001853.Con Sage, haríamos lo siguiente:

Page 95: Apuntes MatemáticasII

4.3 Aproximación variacional 95

Figura 4.2: Ejemplo 4.1: solución exacta y valores aproximados.

sage: # Ca’lculo de los errores en los nodos interioressage: err = [abs(Y[j]-sol(X[j])) for j in range(1, N)]; err[0.00136648039024440 , 0.00185314651061488 , 0.00144315391661615]

y despuéssage: # Error globalsage: max(err)0.00185314651061488

para determinar el error global.

4.3. Aproximación variacional

En esta sección vamos a introducir las ideas básicas relativas a la formulación variacionalde un problema de contorno. Como veremos, esta formulación será la base que nos permitirádefinir el método de elementos finitos.

Consideremos un problema de contorno lineal de la forma−u′′(x) + q(x)u(x) = f (x), x ∈ [0, 1],

u(0) = 0,

u(1) = 0,

(1)

donde q(x) y f (x) son funciones continuas en [0, 1]. En este contexto es habitual denotar poru a la variable dependiente en lugar de y.

Observación. Si las condiciones de contorno son del tipo u(0) = α, u(1) = β, basta con hacerel cambio w(x) = u(x)− α(1− x)− βx para pasar a un problema equivalente con condicionesde contorno w(0) = 0, w(1) = 0. Asimismo, el cambio w(x) = u(a + (b − a)x) permiteconsiderar el problema en un intervalo arbitrario [a, b]. Por otra parte, el añadir un términode la forma p(x)u′(x) a la ecuación no introduce dificultades matemáticas adicionales en la

Page 96: Apuntes MatemáticasII

96

deducción del método de elementos finitos, por lo que no lo consideraremos en aras de lasimplicidad.

Observación. Las condiciones de contorno del tipo u(0) = α, u(1) = β se denominan condi-ciones de tipo Dirichlet: en ellas se impone el valor que ha de tener la solución en los extremosdel dominio [0, 1]. Otro tipo habitual de condiciones de contorno son las condiciones de tipoNeumann, en las que se especifican los valores de la derivada de la solución en los extremos:u′(0) = α, u′(1) = β. Ambos tipos de condiciones de contorno pueden combinarse, dandolugar a condiciones de tipo mixto; por ejemplo, u(0) = α, u′(1) = β.

Aunque en esta sección sólo estudiaremos el método de elementos finitos para problemasde tipo Dirichlet, dicho método puede adaptarse para resolver problemas de tipo Neumann ode tipo mixto.

Sea u ∈ C2([0, 1]) solución del problema (1): diremos que u es una solución fuerte. Multi-pliquemos la ecuación diferencial por una función arbitraria v ∈ C1([0, 1]) e integremos en elintervalo [0, 1]:

−∫ 1

0u′′(x)v(x) dx +

∫ 1

0q(x)u(x)v(x) dx =

∫ 1

0f (x)v(x) dx.

Supongamos además que v(0) = v(1) = 0 e integremos por partes la primera integral:

−∫ 1

0u′′(x)v(x) dx =

∫ 1

0u′(x)v′(x) dx−

[u′(x)v(x)

]10 =

∫ 1

0u′(x)v′(x) dx.

De esta forma, obtenemos la ecuación variacional asociada al problema (1):∫ 1

0u′(x)v′(x) dx +

∫ 1

0q(x)u(x)v(x) dx =

∫ 1

0f (x)v(x) dx,

para cada función v ∈ C1([0, 1]) tal que v(0) = v(1) = 0.Es importante notar que basta con suponer u ∈ C1([0, 1]) para que la ecuación anterior

tenga sentido; de hecho es suficiente con que las funciones u y v sean de clase C1 a trozos yverifiquen las condiciones de contorno. Estos hechos motivan la introducción del espacio Vformado por todas las funciones v de clase C1 a trozos en [0, 1] que verifican las condicionesde contorno v(0) = v(1) = 0. Notemos que, en particular, la solución u del problema (1)pertenece a V.

La formulación variacional o formulación débil del problema (1) consiste en hallar u ∈ V talque ∫ 1

0u′(x)v′(x) dx +

∫ 1

0q(x)u(x)v(x) dx =

∫ 1

0f (x)v(x) dx, ∀ v ∈ V. (2)

En tal caso, diremos que u ∈ V es una solución débil o variacional; notemos que las condicionesde contorno u(0) = u(1) = 0 se verifican de forma automática al pertenecer u al espacio V.

La principal dificultad que nos encontramos al intentar resolver la ecuación variacional (2)está en el hecho de que el espacio vectorial V es un espacio de dimensión infinita; esto haceque no sea factible una implementación directa en el ordenador. El método de aproximaciónvariacional o método de Galerkin se basa en considerar un subespacio Vh de V de dimensión

Page 97: Apuntes MatemáticasII

4.3 Aproximación variacional 97

finita, y a continuación aproximar la solución u de (2) por la solución uh ∈ Vh de la siguienteecuación variacional discreta:∫ 1

0u′h(x)v′h(x) dx +

∫ 1

0q(x)uh(x)vh(x) dx =

∫ 1

0f (x)vh(x) dx, ∀ vh ∈ Vh. (3)

Diremos que Vh es el espacio de funciones test. La notación Vh hace referencia a que el espaciova a depender del paso de malla elegido: mientras menor sea éste, mejor será la aproximaciónde la solución.

Supongamos que {ϕ1, . . . , ϕn} es una base del espacio Vh, donde n es su dimensión. En talcaso, cualquier elemento vh ∈ Vh puede escribirse como combinación lineal de los elementosde dicha base:

vh(x) =n

∑i=1

vi ϕi(x), v1, . . . , vn ∈ R.

Sustituyendo en (3), resulta:∫ 1

0u′h(x)

( n

∑i=1

vi ϕ′i(x)

)dx +

∫ 1

0q(x)uh(x)

( n

∑i=1

vi ϕi(x))

dx =∫ 1

0f (x)

( n

∑i=1

vi ϕi(x))

dx,

de donden

∑i=1

vi

∫ 1

0u′h(x)ϕ′i(x) dx +

n

∑i=1

vi

∫ 1

0q(x)uh(x)ϕi(x) dx =

n

∑i=1

vi

∫ 1

0f (x)ϕi(x) dx,

y por tanto

n

∑i=1

vi

( ∫ 1

0u′h(x)ϕ′i(x) dx +

∫ 1

0q(x)uh(x)ϕi(x) dx

)=

n

∑i=1

vi

∫ 1

0f (x)ϕi(x) dx.

Al ser los coeficientes {v1, . . . , vn} arbitrarios, deducimos que la ecuación (3) es equivalente a∫ 1

0u′h(x)ϕ′i(x) dx +

∫ 1

0q(x)uh(x)ϕi(x) dx =

∫ 1

0f (x)ϕi(x) dx, i = 1, . . . , n,

es decir, basta con que la ecuación (3) se verifique para los elementos ϕi de la base.Escribamos ahora la solución buscada uh en la base {ϕ1, . . . , ϕn}:

uh(x) =n

∑j=1

uj ϕj(x), u1, . . . , un ∈ R.

Sustituyendo en la ecuación anterior y razonando como antes, obtenemos:

n

∑j=1

uj

∫ 1

0ϕ′i(x)ϕ′j(x) dx +

n

∑j=1

uj

∫ 1

0q(x)ϕi(x)ϕj(x) dx =

∫ 1

0f (x)ϕi(x) dx, i = 1, . . . , n,

o, lo que es lo mismo,

n

∑j=1

uj

( ∫ 1

0ϕ′i(x)ϕ′j(x) dx +

∫ 1

0q(x)ϕi(x)ϕj(x) dx

)=∫ 1

0f (x)ϕi(x) dx, i = 1, . . . , n.

Page 98: Apuntes MatemáticasII

98

Si denotamos

aij =∫ 1

0ϕ′i(x)ϕ′j(x) dx +

∫ 1

0q(x)ϕi(x)ϕj(x) dx, fi =

∫ 1

0f (x)ϕi(x) dx,

podemos escribir la expresión anterior de la siguiente forma:

n

∑j=1

aijuj = fi, i = 1, . . . , n.

Hemos obtenido así un sistema lineal de n ecuaciones y n incógnitas (a saber, los coeficientesui de la solución uh). En forma matricial, dicho sistema se escribe

AU = F,

donde

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

.... . .

...an1 an2 · · · ann

, U =

u1

u2...

un

, F =

f1

f2...fn

.

La solución del sistema nos permitirá construir la solución del problema discreto (3). Lamatriz A se denomina matriz de rigidez y F es el vector de cargas4, aunque en teoría no tengansignificado físico alguno.

Observación. La solución U = (u1, . . . , un)T del sistema lineal permite construir la soluciónnumérica de la forma

uh(x) = u1ϕ1(x) + u2ϕ2(x) + · · ·+ un ϕn(x).

En este caso, dicha solución numérica es una función y no un conjunto de valores aproxima-dos, como sucedía en el método de diferencias finitas. Podemos por tanto usar uh(x) paraaproximar la solución del problema de contorno en cualquier punto del intervalo [0, 1].

En resumen, hemos visto cómo la solución del problema variacional (2) puede aproximar-se mediante la solución de un problema discreto (3), cuyo cálculo se reduce a la resolución deun sistema lineal. En la siguiente sección veremos cómo elegir los elementos ϕi de la base deforma adecuada para que el sistema pueda resolverse de la forma más eficiente posible.

4.4. Método de elementos finitos

El método de elementos finitos se basa en aproximar, mediante el método de Galerkin, lasolución variacional del problema (1) haciendo una elección adecuada de los elementos delespacio de discretización Vh. Dicha elección se realiza intentando que la matriz del sistemaresultante tenga una estructura lo más sencilla posible.

Observación. En las aplicaciones prácticas, las matrices que resultan de realizar el procesode discretización detallado en la sección anterior pueden tener miles, o incluso millones deelementos. La resolución de sistemas de tales tamaños requieren el uso de ordenadores degran potencia, así como la aplicación de técnicas matemáticas adecuadas.

Page 99: Apuntes MatemáticasII

4.4 Método de elementos finitos 99

φi

xi

xi+1

xi-1

Figura 4.3: Gráfica de la función de base ϕi(x).

Consideremos una discretización del intervalo [0, 1],

0 = x0 < x1 < · · · < xN−1 < xN = 1,

con paso de malla h = 1N . Para cada i = 1, . . . , N − 1, consideremos la función de base ϕi(x)

definida como

ϕi(x) =

x− xi−1

hsi xi−1 6 x 6 xi,

xi+1 − xh

si xi 6 x 6 xi+1,

0 en otro caso,

cuya gráfica se representa en la figura 4.3. Cada ϕi(x) es una función de clase C1 a trozos,cuya derivada es

ϕ′i(x) =

1h

si xi−1 < x < xi,

−1h

si xi < x < xi+1,

0 en otro caso.

Nótese que las funciones ϕi(x) y ϕ′i(x) se anulan fuera del intervalo (xi−1, xi+1).Puede demostrarse que la familia de funciones {ϕ1, . . . , ϕN−1} constituyen una base del

subespacio vectorial Vh formado por las funciones continuas y lineales a trozos en [0, 1] quese anulan en los extremos x = 0 y x = 1; en particular, la dimensión de Vh es n = N − 1.

Observación. Para condiciones de contorno de tipo Neumann es necesario añadir dos fun-ciones de base adicionales, ϕ0(x) y ϕN(x), para imponer las condiciones de contorno en cadauno de los extremos del intervalo. Asimismo, el espacio de funciones test Vh debe modificarsede manera adecuada.

4La terminología proviene de la Mecánica de Sólidos, que es el área donde se desarrolló el método de elementosfinitos en la década de los cincuenta del pasado siglo, concretamente en la industria aeronáutica.

Page 100: Apuntes MatemáticasII

100

A continuación vamos a calcular los coeficientes aij de la matriz A, así como los términosindependientes fi. Por simplicidad, a partir de ahora supondremos que las funciones q(x) yf (x) son constantes: q(x) ≡ q, f (x) ≡ f .

Observación. Cuando las funciones q(x) y f (x) no son constantes, es necesario utilizar fórmu-las de cuadratura para aproximar numéricamente las integrales que aparecen en la definiciónde los coeficientes aij y fi.

Fijado un subíndice arbitrario i, notemos que ϕi(x)ϕj(x) ≡ 0 si j 6= i− 1, i, i + 1, ya que ental caso los conjuntos donde ϕi(x) y ϕj(x) no se anulan no tienen puntos en común (véase lafigura 4.4); lo mismo sucede para el producto de las derivadas.

xi

xi+1

xi-1

φi

xi

xj

φj

xi

xi+1

xi-1

φi

xi-2

φi-1

xi+2

φi+1

φi

(a) (b) (c)

Figura 4.4: (a) ϕi ϕi−1 6= 0 en [xi−1, xi]; (b) ϕi ϕi+1 6= 0 en [xi, xi+1]; (c) ϕi ϕj ≡ 0 si j 6= i− 1, i, i + 1.

Por otro lado, resulta que∫ 1

0ϕi(x)ϕi(x) dx =

∫ xi+1

xi−1

(ϕi(x))2dx =∫ xi

xi−1

(x− xi−1

h

)2

dx +∫ xi+1

xi

(xi+1 − x

h

)2

dx =2h3

,

teniendo en cuenta que xi−1 = xi − h y xi+1 = xi + h. De forma similar, se obtienen lasigualdades ∫ 1

0ϕi(x)ϕi−1(x) dx =

∫ xi

xi−1

xi − xh· x− xi−1

hdx =

h6

,

y ∫ 1

0ϕi(x)ϕi+1(x) dx =

∫ xi+1

xi

x− xi

h· xi+1 − x

hdx =

h6

.

Razonando de manera análoga, se deducen las siguientes expresiones:∫ 1

0ϕ′i(x)ϕ′i(x) dx =

2h

,∫ 1

0ϕ′i(x)ϕ′i−1(x) dx = −1

h,

∫ 1

0ϕ′i(x)ϕ′i+1(x) dx = −1

h.

Finalmente, deducimos las fórmulas para los coeficientes aij:

aij =

2h+

23

qh si j = i,

−1h+

16

qh si j = i− 1 o j = i + 1,

0 en otro caso.

Page 101: Apuntes MatemáticasII

4.4 Método de elementos finitos 101

Por otra parte, notemos que∫ 1

0ϕi(x) dx =

∫ xi

xi−1

x− xi−1

hdx +

∫ xi+1

xi

xi+1 − xh

dx =h2+

h2= h,

lo que implica que todos los coeficientes fi tienen la siguiente forma:

fi = f h, i = 1, . . . , N − 1.

A partir de los resultados obtenidos, podemos escribir el sistema lineal que define el mé-todo de elementos finitos como sigue:

2 + 23 qh2 −1 + 1

6 qh2 0 0 · · · 0

−1 + 16 qh2 2 + 2

3 qh2 −1 + 16 qh2 0 · · · 0

0 −1 + 16 qh2 2 + 2

3 qh2 −1 + 16 qh2 · · · 0

.... . . . . . . . .

...

0 · · · −1 + 16 qh2 2 + 2

3 qh2 −1 + 16 qh2

0 · · · 0 −1 + 16 qh2 2 + 2

3 qh2

u1

u2

u3

...

uN−2

uN−1

=

h2 f

h2 f

h2 f...

h2 f

h2 f

.

La matriz A es simétrica y tridiagonal, lo que la hace especialmente adecuada a la hora deresolver numéricamente el sistema lineal.

Ejemplo 4.2. Consideremos el problema de contorno−u′′(x) + u(x) = 2, x ∈ [0, 1],

u(0) = 0,

u(1) = 0,

que tiene como solución exacta la función

u(x) = − 21 + e

(ex + e1−x) + 2.

Para construir la formulación variacional del problema, multiplicamos la ecuación dife-rencial por una función arbitraria v(x), que sea de clase C1 a trozos en [0, 1] y verifiquev(0) = v(1) = 0, y a continuación integramos en [0, 1]:

−∫ 1

0u′′(x)v(x) dx +

∫ 1

0u(x)v(x) dx =

∫ 1

02v(x) dx.

Integrando por partes el primer sumando,

−∫ 1

0u′′(x)v(x) dx =

[u′(x)v(x)

]10 +

∫ 1

0u′(x)v′(x) dx,

y teniendo en cuanta que v(0) = v(1) = 0, resulta:

−∫ 1

0u′′(x)v(x) dx =

∫ 1

0u′(x)v′(x) dx.

Page 102: Apuntes MatemáticasII

102

De esta forma, deducimos la siguiente igualdad:

∫ 1

0u′(x)v′(x) dx +

∫ 1

0u(x)v(x) dx =

∫ 1

02v(x) dx.

Definamos V como el espacio vectorial formado por todas las funciones v(x) de clase C1

a trozos en [0, 1] y que verifican v(0) = v(1) = 0. La formulación variacional del problema esentonces la siguiente: hallar u ∈ V tal que

∫ 1

0u′(x)v′(x) dx +

∫ 1

0u(x)v(x) dx =

∫ 1

02v(x) dx, ∀ v ∈ V.

El siguiente paso consiste en discretizar la ecuación variacional. Para ello, consideremosuna partición del intervalo [0, 1] con N = 4; de esta forma, el paso de malla es h = 1

4 y losnodos vienen dados por x0 = 0, x1 = 1

4 , x2 = 12 , x3 = 3

4 y x4 = 1. Las correspondientesfunciones de base {ϕ1(x), ϕ2(x), ϕ3(x)} se representan en la figura 4.5.

1/2 3/41/4

φ2

0

φ1

φ3

1

Figura 4.5: Funciones de base para h = 14 .

Sea Vh el subespacio vectorial de V formado por todas las funciones vh(x) de la forma

vh(x) = v1ϕ1(x) + v2ϕ2(x) + v3ϕ3(x),

siendo v1, v2, v3 ∈ R valores arbitrarios. El espacio Vh está formado por todas las funcionespoligonales que se anulan en x = 0 y x = 1, y cuyos posibles puntos de no derivabilidad selocalizan en los nodos internos x1 = 1

4 , x2 = 12 y x3 = 3

4 .La formulación variacional discreta del problema es la siguiente: determinar uh ∈ Vh tal

que ∫ 1

0u′h(x)v′h(x) dx +

∫ 1

0uh(x)vh(x) dx =

∫ 1

02vh(x) dx, ∀ vh ∈ Vh.

Tomemos un elemento arbitrario vh(x) = v1ϕ1(x) + v2ϕ2(x) + v3ϕ3(x) en Vh y sustituyámoslo

Page 103: Apuntes MatemáticasII

4.4 Método de elementos finitos 103

en la ecuación variacional:∫ 1

0u′h(x)(v1ϕ′1(x) + v2ϕ′2(x) + v3ϕ′3(x)) dx+∫ 1

0uh(x)(v1ϕ1(x) + v2ϕ2(x) + v3ϕ3(x)) dx

=∫ 1

02(v1ϕ1(x) + v2ϕ2(x) + v3ϕ3(x)) dx.

Reagrupando los términos, resulta:

v1

( ∫ 1

0u′h(x)ϕ′1(x) dx +

∫ 1

0uh(x)ϕ1(x) dx

)+

v2

( ∫ 1

0u′h(x)ϕ′2(x) dx +

∫ 1

0uh(x)ϕ2(x) dx

)+

v3

( ∫ 1

0u′h(x)ϕ′3(x) dx +

∫ 1

0uh(x)ϕ3(x) dx

)= v1

∫ 1

02ϕ1(x) dx + v2

∫ 1

02ϕ2(x) dx + v3

∫ 1

02ϕ3(x) dx.

Tomemos ahora v1 = 1, v2 = v3 = 0; en tal caso, de la igualdad anterior se deduce:∫ 1

0u′h(x)ϕ′1(x) dx +

∫ 1

0uh(x)ϕ1(x) dx =

∫ 1

02ϕ1(x) dx.

Para v1 = v3 = 0 y v2 = 1 se obtiene la ecuación∫ 1

0u′h(x)ϕ′2(x) dx +

∫ 1

0uh(x)ϕ2(x) dx =

∫ 1

02ϕ2(x) dx,

mientras que ∫ 1

0u′h(x)ϕ′3(x) dx +

∫ 1

0uh(x)ϕ3(x) dx =

∫ 1

02ϕ3(x) dx

resulta al elegir v1 = v2 = 0 y v3 = 1.Como la solución buscada uh es un elemento de Vh, podemos escribirla en la forma

uh(x) = u1ϕ1(x) + u2ϕ2(x) + u3ϕ3(x),

donde {u1, u2, u3} son incógnitas a determinar. Sustituyendo la expresión de uh en la primerade las tres ecuaciones anteriores, se obtiene:∫ 1

0(u1ϕ′1(x) + u2ϕ′2(x) + u3ϕ′3(x))ϕ′1(x) dx+∫ 1

0(u1ϕ1(x) + u2ϕ2(x) + u3ϕ3(x))ϕ1(x) dx

=∫ 1

02ϕ1(x) dx,

Page 104: Apuntes MatemáticasII

104

de donde

u1

( ∫ 1

0ϕ′1(x)ϕ′1(x) dx +

∫ 1

0ϕ1(x)ϕ1(x) dx

)+

u2

( ∫ 1

0ϕ′1(x)ϕ′2(x) dx +

∫ 1

0ϕ1(x)ϕ2(x) dx

)+

u3

( ∫ 1

0ϕ′1(x)ϕ′3(x) dx +

∫ 1

0ϕ1(x)ϕ3(x) dx

)=∫ 1

02ϕ1(x) dx.

Si definimos

aij =∫ 1

0ϕ′i(x)ϕ′j(x) dx +

∫ 1

0ϕi(x)ϕj(x) dx, fi =

∫ 1

02ϕi(x) dx,

la expresión anterior puede escribirse como:

a11u1 + a12u2 + a13u3 = f1.

De manera totalmente análoga, pueden deducirse las ecuaciones

a21u1 + a22u2 + a23u3 = f2

ya31u1 + a32u2 + a33u3 = f3.

Los coeficientes aij y fi se determinan explícitamente:

a11 = a22 = a33 = 4924 , a12 = a21 = a23 = a32 = − 95

96 , a13 = a31 = 0, f1 = f2 = f3 = 18 .

En resumen, las incógnitas {u1, u2, u3} se obtienen como solución de un sistema lineal detres ecuaciones, que en forma matricial se escribe como

4924 − 95

96 0

− 9596

4924 − 95

96

0 − 9596

4924

u1

u2

u3

=

181818

.

Obviamente, dicho sistema corresponde al caso general con q = 1 y f = 2.La solución del sistema viene dada por

u1 ≈ 0,171462, u2 ≈ 0,227438, u3 ≈ 0,171462.

El error ei = |u(xi)− ui| cometido en cada nodo interior puede determinarse en este caso, yaque conocemos la solución exacta:

e1 ≈ 0,000815, e2 ≈ 0,001076, e3 ≈ 0,000815.

El error global cometido es pues e = max(e1, e2, e3) ≈ 0,001076.Los resultados obtenidos se representan en la figura 4.6, que ha sido generada con el

siguiente código Sage:

Page 105: Apuntes MatemáticasII

4.4 Método de elementos finitos 105

Figura 4.6: Ejemplo 4.2: solución exacta y valores aproximados.

sage: # Ejemplo 4.2sage: #sage: ### Me’todo de elementos finitos ###sage: #sage: # Ecuacio ’n: -u ’’+qu=f(x), a<x<b.sage: # Condiciones de contorno de tipo Dirichlet:sage: # u(a)=0, u(b)=0.sage: #sage: #sage: # Datos del problemasage: #sage: a = 0. # extremo inferior del intervalosage: b = 1. # extremo superior del intervalosage: #sage: N = 4 # nu’mero de particionessage: #sage: q = 1. # coeficiente de usage: f(x) = 2. # te’rmino independientesage: #sage: alpha = 0. # c. contorno izquierdasage: beta = 0. # c. contorno derechasage: #sage: ### Implementacio ’n del me’todo ###sage: #sage: h = (b-a)/N # paso de mallasage: #sage: X = vector ([a+j*h for j in range(N+1)]) # malladosage: U = vector ([0. for i in range(N+1)]) # solucio ’nsage: #sage: # condiciones de contornosage: U[0] = alphasage: U[N] = betasage: #sage: # te’rmino independientesage: F = vector ([0. for i in range(N-1)])sage: for i in range(1, N):

Page 106: Apuntes MatemáticasII

106

... aux = integral(f(x)*(x-X[i-1])/h, x, X[i-1], X[i])

... aux += integral(f(x)*(X[i+1]-x)/h, x, X[i], X[i+1])

... F[i-1] = h*auxsage: #sage: # matriz del sistemasage: A = matrix(RR, N-1, N-1)sage: #sage: for i in range(1, N-1):... A[i-1, i-1] = 2.+(2/3)*q*h^2 # diagonal... A[i-1, i] = -1.+(1/6)*q*h^2 # superdiagonal... A[i, i-1] = -1.+(1/6)*q*h^2 # subdiagonalsage: A[N-2, N-2] = 2.+(2/3)*q*h^2 # u’ltimo elemento de la diagonalsage: #sage: # solucio ’n del sistema linealsage: sol = A.inverse ()*F # U=A^(-1)*Fsage: #sage: # actualizamos el vector Usage: for i in range(N-1):... U[i+1] = sol[i]sage: #sage: #################################sage: #sage: # dibujamos los puntossage: sol = zip(X, U)sage: fig1 = list_plot(sol , color=’blue’, legend_label=’aprox.’)sage: # y los unimos con segmentossage: fig1 += line(sol)sage: #sage: # Comparacio ’n con la solucio ’n exactasage: u = function(’u’, x)sage: ec = -diff(u, x, 2) + q*u == f(x)sage: sol = desolve(ec, u, ics=[a, alpha , b, beta])sage: #sage: fig2 = plot(sol , a, b, color=’red’, legend_label=’exacta ’)sage: (fig1+fig2).show()

Por último, calculamos los errores cometidos en cada nodo:sage: # Ca’lculo de los errores en los nodos interioressage: err = [abs(U[j]-sol(X[j])) for j in range(1, N)]; err[0.000815468791417362 , 0.00107565359683126 , 0.000815467679347037]

así como el error global:sage: # Error globalsage: max(err)0.00107565359683126

4.5. Algunos comentarios

Los métodos numéricos estudiados en las secciones precedentes pueden aplicarse para laresolución de problemas de contorno no lineales, de la forma

y′′ = f (x, y, y′), x ∈ [a, b],

y(a) = α,

y(b) = β,

Page 107: Apuntes MatemáticasII

4.6 Aplicación: deflexión de vigas empotradas 107

o con otros tipos de condiciones de contorno. En tal caso, la solución numérica se determinaa partir de la solución de un sistema de ecuaciones no lineales, que debe resolverse mediantetécnicas matemáticas apropiadas. El estudio de tales cuestiones queda fuera del alcance deeste curso, por lo que no insistiremos más en ellas.

Los problemas que surgen en las aplicaciones prácticas suelen modelizarse mediante ecua-ciones en derivadas parciales, tanto estacionarias como de evolución (dependientes del tiempo),en dominios bi- o tridimensionales. Tanto el método de diferencias finitas como el de elemen-tos finitos pueden extenderse para resolver problemas de esta índole, siendo el método deelementos finitos el más extendido debido a su mayor flexibilidad y capacidad de adaptacióna problemas en dominios complejos. Tanto el estudio teórico de ecuaciones en derivadas par-ciales como su resolución numérica por el método de elementos finitos requieren de técnicasmatemáticas avanzadas, por lo que no entraremos en más detalles.

Existen varios paquetes informáticos profesionales para aplicar el método de elementosfinitos, especialmente en las áreas de Cálculo de Estructuras y Mecánica de Fluidos. Queremosmencionar aquí la existencia del programa gratuito de código abierto FreeFem++, que puededescargarse desde la página web www.freefem.org/ff++/. Este programa permite resolverdiversos tipos de ecuaciones en derivadas parciales, con distintas clases de condiciones decontorno, en dos y tres dimensiones. En las figuras 4.7 y 4.8 se muestran ejemplos realizadoscon FreeFem++.

Figura 4.7: Deflexión, debido a su propio peso, de una viga tridimensional empotrada en un extremo.

4.6. Aplicación: deflexión de vigas empotradas

Vamos a estudiar la deformación sufrida por una viga empotrada, con cargas axiales ytransversales. Bajo la hipótesis de pequeñas deformaciones (esto es, y′(x) ≈ 0), la deformación

Page 108: Apuntes MatemáticasII

108

Figura 4.8: Comportamiento termodinámico del patio del hotel Monte Málaga.

sufrida por la viga es solución del siguiente problema de contorno:y′′(x)− Q

EIy(x) =

M(x)EI

, x ∈ [0, L],

y(0) = 0,

y(L) = 0,

siendo Q la carga axial, E el módulo de elasticidad, I el momento de inercia, M(x) el momentoflector y L la longitud de la viga. Si suponemos que la carga P está uniformemente distribuida,el momento flector viene dado en este caso por

M(x) =P2

x(L− x).

P

L

Q Q

Figura 4.9: Deflexión de una viga empotrada con cargas axiales y transversales: esquema.

En la figura 4.10 se representan los resultados obtenidos con el método de diferenciasfinitas al considerar diferentes cargas axiales. Los valores de los parámetros son L = 2 m,

Page 109: Apuntes MatemáticasII

4.6 Aplicación: deflexión de vigas empotradas 109

Figura 4.10: Viga empotrada con diferentes cargas axiales.

E = 2 · 1011 N/m2, I = 7,85 · 10−9 m4 y P = 150; para Q se han tomado los valores 100, 500 y1000. Los cálculos han sido realizados usando N = 20 particiones.

A continuación se muestra un código Sage para resolver el problema considerado:

sage: # Deflexio ’n de vigas con cargas axiales y transversalessage: # ------------------------------------------------------sage: #sage: # Ecuacio ’n: y’’- Q/(EI)y=M(x)/(EI) en [0, L].sage: # Condiciones de contorno: y(0)=0, y(L)=0.sage: #sage: # Me’todo: diferencias finitassage: #sage: # Datos del problemasage: #sage: L = 2. # longitud de la vigasage: Q = 100. # carga axialsage: E = 2.e11 # modulo de elasticidadsage: I = 7.85e-9 # momento de inerciasage: P = 150. # carga transversalsage: #sage: a = 0. # extremo inferior del intervalosage: b = L # extremo superior del intervalosage: #sage: N = 20 # nu’mero de particionessage: #sage: p(x) = 0. # coeficiente de y’sage: q(x) = -Q/(E*I) # coeficiente de ysage: r(x) = 0.5*P*x*(L-x)/(E*I) # te’rmino independientesage: #sage: alpha = 0. # c. contorno izquierdasage: beta = 0. # c. contorno derechasage: #sage: ### Implementacio ’n del me’todo ###sage: #sage: h = (b-a)/N # paso de mallasage: #

Page 110: Apuntes MatemáticasII

110

sage: X = vector ([a+j*h for j in range(N+1)]) # malladosage: Y = vector ([0. for j in range(N+1)]) # solucio ’nsage: #sage: # condiciones de contornosage: Y[0] = alphasage: Y[N] = betasage: #sage: # te’rmino independientesage: B = vector ([(-h^2)*r(X[j+1]) for j in range(N-1)])sage: B[0] += alpha *(1 -0.5*h*p(X[1]))sage: B[N-2] += beta *(1+0.5*h*p(X[N -1]))sage: #sage: # matriz del sistemasage: A = matrix(RR, N-1, N-1)sage: #sage: for j in range(1, N-1):... A[j-1, j-1] = 2.-q(X[j])*h^2 # diagonal... A[j-1, j] = -1.-0.5*h*p(X[j]) # superdiagonal... A[j, j-1] = -1.+0.5*h*p(X[j]) # subdiagonalsage: A[N-2, N-2] = 2.-q(X[N -1])*h^2 # u’ltimo elemento de la diagonalsage: #sage: # solucio ’n del sistema linealsage: sol = A.inverse ()*B # y=A^(-1)*Bsage: #sage: # actualizacio ’n del vector ysage: for j in range(0, N-1):... Y[j+1] = sol[j]sage: #sage: #################################sage: #sage: # dibujamos los puntossage: sol = zip(X, Y)sage: fig = list_plot(sol)sage: # los unimos con segmentossage: fig += line(sol)sage: # y mostramos el resultadosage: fig.show()

Para aplicar el método de elementos finitos, reescribimos la ecuación diferencial de lasiguiente forma:

−u′′(x) + q u(x) = f (x),

donde u ≡ y, q = QEI y f (x) = −M(x)

EI . Como era de esperar, al aplicar el método de elemen-tos finitos se obtienen resultados totalmente análogos a los de la figura 4.10. El código Sagecorrespondiente es el siguiente:

sage: # Deflexio ’n de vigas con cargas axiales y transversalessage: # ------------------------------------------------------sage: #sage: # Ecuacio ’n: -u ’’+ Q/(EI)u=-M(x)/(EI) en [0, L].sage: # Condiciones de contorno: u(0)=0, u(L)=0.sage: #sage: # Me’todo: elementos finitossage: #sage: # Datos del problemasage: #sage: L = 2. # longitud de la vigasage: Q = 100. # carga axial

Page 111: Apuntes MatemáticasII

4.6 Aplicación: deflexión de vigas empotradas 111

sage: E = 2.e11 # modulo de elasticidadsage: I = 7.85e-9 # momento de inerciasage: P = 150. # carga transversalsage: #sage: a = 0. # extremo inferior del intervalosage: b = L # extremo superior del intervalosage: #sage: N = 20 # nu’mero de particionessage: #sage: q = Q/(E*I) # coeficiente de usage: r(x) = -0.5*P*x*(L-x)/(E*I) # te’rmino independientesage: #sage: alpha = 0. # c. contorno izquierdasage: beta = 0. # c. contorno derechasage: #sage: ### Implementacio ’n del me’todo ###sage: #sage: h = (b-a)/N # paso de mallasage: #sage: X = vector ([a+j*h for j in range(N+1)]) # malladosage: U = vector ([0. for i in range(N+1)]) # solucio ’nsage: #sage: # condiciones de contornosage: U[0] = alphasage: U[N] = betasage: #sage: # te’rmino independientesage: F = vector ([0. for i in range(N-1)])sage: for i in range(1, N):... aux = integral(f(x)*(x-X[i-1])/h, x, X[i-1], X[i])... aux += integral(f(x)*(X[i+1]-x)/h, x, X[i], X[i+1])... F[i-1] = h*auxsage: #sage: # matriz del sistemasage: A = matrix(RR, N-1, N-1)sage: #sage: for i in range(1, N-1):... A[i-1, i-1] = 2.+(2/3)*q*h^2 # diagonal... A[i-1, i] = -1.+(1/6)*q*h^2 # superdiagonal... A[i, i-1] = -1.+(1/6)*q*h^2 # subdiagonalsage: A[N-2, N-2] = 2.+(2/3)*q*h^2 # u’ltimo elemento de la diagonalsage: #sage: # solucio ’n del sistema linealsage: sol = A.inverse ()*F # U=A^(-1)*Fsage: #sage: # actualizamos el vector Usage: for i in range(N-1):... U[i+1] = sol[i]sage: #sage: #################################sage: #sage: # dibujamos los puntossage: points = zip(X, U)sage: fig = list_plot(points)sage: # los unimos con segmentossage: fig += line(points)sage: # y mostramos el resultadosage: fig.show()

Page 112: Apuntes MatemáticasII

112

Nótese que el término independiente no es constante en este caso, por lo que se han calculadonuméricamente las integrales correspondientes.

Page 113: Apuntes MatemáticasII

4.6 Aplicación: deflexión de vigas empotradas 113

Page 114: Apuntes MatemáticasII

114

5. Probabilidad y Estadística

5.1. Introducción

Es bien sabido que la experimentación constituye una parte fundamental de la Ciencia y laIngeniería. A la hora de realizar un experimento, esperamos obtener resultados similares bajocondiciones esencialmente idénticas. En este tipo de experimentos, denominados deterministas,es posible controlar el valor de las variables involucradas en el experimento.

Por el contrario, existen experimentos en los que no es posible controlar el valor de cier-tas variables. De esta forma, el resultado puede variar de una repetición del proceso a lasiguiente, aunque las condiciones sean básicamente las mismas. Este tipo de experimentos sedenominan aleatorios (del latín aleatorius, propio del juego de dados). Un ejemplo típico seríael lanzamiento de una moneda, en el que a priori no es posible determinar si el resultado serácara o cruz.

Un espacio muestral asociado a un experimento aleatorio está formado por todos los posi-bles resultados del mismo. En el ejemplo de la moneda, el espacio muestral sería el conjunto{cara, cruz}, que también podría representarse como {0, 1} si usamos números. Un experi-mento puede tener distintos espacios muestrales, de entre los cuales debemos elegir aquelque proporcione mayor información.

Ejemplo 5.1. Dos espacios muestrales distintos para el experimento aleatorio del lanzamientode un dado serían los conjuntos {1, 2, 3, 4, 5, 6} y {par, impar}. Este último espacio muestralno sería adecuado para estudiar, por ejemplo, si el resultado obtenido al lanzar el dado esmúltiplo de tres.

Un suceso o evento es un subconjunto A del espacio muestral S, es decir, un conjuntode resultados posibles. Si al realizar un experimento el resultado pertenece al conjunto A,diremos que es suceso ocurrió.

Ejemplo 5.2. Al lanzar una moneda dos veces podemos considerar el espacio muestral

S = {(0, 0), (1, 0), (0, 1), (1, 1)},

donde 0 representa cara y 1 cruz. El subconjunto A = {(1, 0), (0, 1)} representa el suceso deque salga una única cara en los dos lanzamientos.

Se define el suceso seguro como aquel que siempre sucede: A = S. Por el contrario, el sucesoimposible es aquel que nunca puede suceder: A = ∅. Dados dos sucesos A y B, se definen lossiguientes eventos:

A ∪ B (unión): ocurre cuando se da A, B o ambos.

A ∩ B (intersección): ocurre cuando se dan a la vez A y B.

Ac o A′ (complementario): ocurre cuando no se da A.

Este tema está basado casi por completo en el libro Probabilidad y Estadística, de M.R. Spiegel, publicado en laeditorial McGraw-Hill.

Page 115: Apuntes MatemáticasII

5.2 Probabilidad básica 115

A− B (diferencia): ocurre cuando se da A pero no B; es equivalente a A∩ Bc. En particular,Ac = S− A.

Si A ∩ B = ∅, diremos que los sucesos son excluyentes. Las definiciones anteriores puedengeneralizarse para más de dos conjuntos de sucesos.

Ejemplo 5.3. Consideremos de nuevo el experimento de lanzar dos veces una moneda. Sea Ael suceso «sacar al menos una cara» y sea B el evento «el segundo lanzamiento es cruz». En talcaso, si 0 representa cara y 1 cruz, tenemos que A = {(0, 0), (0, 1), (1, 0)} y B = {(0, 1), (1, 1)}.Por tanto,

A ∪ B = {(0, 0), (0, 1), (1, 0), (1, 1)} = S, A ∩ B = {(0, 1)}, Ac = {(1, 1)}

yA− B = {(0, 0), (1, 0)}.

5.2. Probabilidad básica

En un experimento aleatorio siempre existe incertidumbre sobre si ocurrirá o no un ciertosuceso. Para cuantificar dicha incertidumbre, vamos a asignar un número entre 0 y 1 comomedida de la «probabilidad» de que dicho evento suceda.

Observación. También es posible utilizar porcentajes para definir la probabilidad de un even-to. De esta forma, podemos decir que la probabilidad de un suceso es de 1

4 o del 25 %.

Supongamos que un experimento aleatorio admite n resultados igualmente probables. Siun determinado suceso A puede ocurrir de m formas distintas, diremos que la probabilidad deA es m

n , y lo denotaremos como

p(A) =mn

.

Es obvio que p(A) ∈ [0, 1].

Ejemplo 5.4. Supongamos que queremos calcular la probabilidad de obtener un cinco al lan-zar un dado. Como hay seis resultados posibles (n = 6) y sólo uno de ellos es un cinco (m = 1),su probabilidad será entonces de 1

5 . Para que el razonamiento anterior tenga sentido es ne-cesario que el dado no esté cargado: todas las caras deben tener las mismas posibilidades desalir.

Observación. Este enfoque clásico de la probabilidad no es riguroso desde un punto de vistamatemático; por ejemplo, ¿qué significa «igualmente probables»? Baste decir que existe unenfoque axiomático del concepto de probabilidad que permite formalizar la idea intuitiva quehemos presentado aquí.

Dados dos sucesos A, B ∈ S, se verifican las siguientes propiedades:

p(S) = 1 y p(∅) = 0.

p(A ∪ B) = p(A) + p(B) si A ∩ B = ∅.

Page 116: Apuntes MatemáticasII

116

Si A ⊂ B entonces p(A) 6 p(B).

p(Ac) = 1− p(A).

p(A ∪ B) = p(A) + p(B)− p(A ∩ B).

Ejemplo 5.5. Volvamos al ejemplo 5.3 en el que se lanzaba dos veces una misma moneda y seconsideraban los sucesos A «sacar al menos una cara» y B «el segundo lanzamiento es cruz».Se verifica entonces que p(A) = 3

4 , ya que había tres formas distintas de sacar al menos unacara y cuatro resultados posibles. De manera análoga, p(B) = 2

4 = 12 . Asimismo,

p(A ∪ B) = p(S) = 1, p(A ∩ B) = 14 , p(Ac) = 1− p(A) = 1

4 .

La probabilidad de A ∩ B puede deducirse también usando la última propiedad:

p(A ∩ B) = p(A) + p(B)− p(A ∪ B) = 34 +

12 − 1 = 1

4 .

Supongamos que el espacio muestral S consta de n elementos distintos,

S = {a1, a2, . . . , an},

y definamos los sucesos elementales Ai = {ai}, i = 1, . . . , n. Se verifica entonces que

p(S) = p(A1) + p(A2) + · · ·+ p(An) = 1.

Si todos los sucesos elementales Ai son igualmente probables, podemos definir entonces

p(Ai) =1n

, i = 1, . . . , n.

Si ahora A es un suceso formado por m sucesos elementales, entonces su probabilidad será

p(A) =1n+

(m)· · ·+ 1

n=

mn

.

Mediante este procedimiento de asignación de probabilidades recuperamos la definición clá-sica introducida anteriormente.

Ejemplo 5.6. En el lanzamiento de un dado existen seis sucesos elementales, correspondientesa cada una de las caras del dado; esto es, S = {1, 2, 3, 4, 5, 6} y Ai = {i} para i = 1, 2, 3, 4, 5, 6.De esta forma, la probabilidad de cada suceso elemental es p(Ai) =

16 .

Sea ahora A el suceso «sacar un tres o un cinco». Dicho evento puede escribirse comounión de dos sucesos elementales: A = A3 ∪ A5 = {3, 5}, por lo que su probabilidad puedecalcularse como p(A) = 2

6 = 13 .

Vamos a terminar esta sección introduciendo el importante concepto de probabilidad con-dicionada. Supongamos que A y B son sucesos, con p(A) > 0, y denotemos por p(B|A) a laprobabilidad de que suceda B supuesto que A ya sucedió. Al saber que A ocurrió, éste pasa aser el nuevo espacio muestral, por lo que

p(B|A) =p(A ∩ B)

p(A).

A p(B|A) se le llama la probabilidad condicionada de B dado A.

Page 117: Apuntes MatemáticasII

5.3 Distribuciones de probabilidad 117

Ejemplo 5.7. Se lanza un dado y se considera el suceso B «sacar un número menor que 4». Esclaro que la probabilidad de B es

p(B) = p(1) + p(2) + p(3) = 16 +

16 +

16 = 3

6 = 12 .

Supongamos ahora que sabemos que el dado cayó en número impar. Si A es el suceso «serimpar», entonces p(A) = 3

6 = 12 y p(A ∩ B) = p(1) + p(3) = 2

6 = 13 . Por tanto, la probabilidad

de B sabiendo que A sucedió es

p(B|A) =p(A ∩ B)

p(A)=

1/31/2

=23

.

Diremos que los sucesos A y B son independientes si la probabilidad de que ocurra B nose ve afectada por la ocurrencia o no de A. En otras palabras, A y B son independientes sip(B|A) = p(B) o, lo que es lo mismo,

p(A ∩ B) = p(A) p(B).

Ejemplo 5.8. Se lanza un dado dos veces. Vamos a determinar la probabilidad de que en elprimer lanzamiento salga 4, 5 o 6 (suceso A), y en el segundo 1, 2, 3 o 4 (suceso B). Como larealización del primer lanzamiento no influye en el segundo, los sucesos son independientes.Por tanto, la probabilidad de A ∩ B puede calcularse como

p(A ∩ B) = p(A) p(B) =36· 4

6=

13

.

5.3. Distribuciones de probabilidad

Supongamos que a cada punto de un espacio muestral S le asociamos un número. De estaforma tenemos definida una función sobre S, que llamaremos variable aleatoria o estocástica (delgriego στoχαστικóς, hábil en conjeturar). Es usual denotar a las variables aleatorias con lasletras X o Y.

Ejemplo 5.9. Al lanzar una moneda dos veces, podemos considerar el espacio muestral S delejemplo 5.3. Si X es el número de caras (representas por 0) que pueden salir, podemos asignarlos siguientes valores:

(0, 0)→ 2, (1, 0)→ 1, (0, 1)→ 1, (1, 1)→ 0.

Por tanto, X es una variable aleatoria.

Una variable aleatoria es discreta si toma un número finito o infinito numerable de valores.En caso contrario la variable se dice no discreta.

Sea X un variable aleatoria discreta que toma los valores {x1, x2, . . . }. Supongamos quecada valor xi tiene una cierta probabilidad f (xi); denotaremos este hecho así:

p(X = xi) = f (xi), i = 1, 2, . . .

Page 118: Apuntes MatemáticasII

118

Se define la función o distribución de probabilidad de la variable X como

p(X = x) = f (x).

De esta forma, para cada x = xi se obtiene la probabilidad de xi, mientras que para otrosvalores de x se tiene f (x) = 0. Dicho de otro modo, f (x) nos dice la probabilidad de que lavariable X tome el valor x.

Ejemplo 5.10. Calculemos la distribución de probabilidad de la variable X en el ejemplo 5.9.Es claro que, si la moneda no está trucada,

p(0, 0) = 14 , p(1, 0) = 1

4 , p(0, 1) = 14 , p(1, 1) = 1

4 .

Entonces,

p(X = 0) = p(1, 1) = 14 , p(X = 1) = p(1, 0) + p(0, 1) = 1

2 , p(X = 2) = p(0, 0) = 14 .

Se obtiene así la función discreta

f (x) =

14 si x = 0,12 si x = 1,14 si x = 2,

0 en otro caso.

La función de distribución acumulada, o simplemente función de distribución para una variablealeatoria X se define como

F(x) = p(X 6 x), x ∈ R.

Es decir, F(x) nos da la probabilidad de que la variable X tome un valor menor o igual a x,siendo x un número real arbitrario.

Cuando X es una variable discreta con función de probabilidad f (x), podemos escribir

F(x) = p(X 6 x) = ∑u6x

f (u),

donde el sumatorio se realiza sobre todos aquellos valores u que toma X tales que u 6 x.En el caso particular en que X tome un número finito de valores {x1, . . . , xn}, la función dedistribución tiene la siguiente forma:

F(x) =

0 si −∞ < x < x1,

f (x1) si x1 6 x < x2,

f (x1) + f (x2) si x2 6 x < x3,...

...

f (x1) + · · ·+ f (xn) si xn 6 x < ∞.

Page 119: Apuntes MatemáticasII

5.3 Distribuciones de probabilidad 119

Ejemplo 5.11. La función de distribución de la variable aleatoria X del ejemplo 5.10 vienedada por

F(x) =

0 si −∞ < x < 0,14 si 0 6 x < 1,34 si 1 6 x < 2,

1 si 2 6 x < ∞.

La representación gráfica de F(x), que es una función escalonada monótona creciente, puedeverse en la figura 5.1. Observemos, y esto es común a las distribuciones de probabilidad, quelas magnitudes de los saltos en 0, 1 y 2 son las probabilidades asociadas 1

4 , 12 y 1

4 .

Figura 5.1: Distribución de probabilidad F(x) para la variable aleatoria del ejemplo 5.10.

Una variable aleatoria no discreta es absolutamente continua (o simplemente continua) si sufunción de distribución F(x) puede representarse como

F(x) = p(X 6 x) =∫ x

−∞f (u) du, x ∈ R,

donde f (x) verifica:

f (x) > 0, ∀ x ∈ R.∫ ∞

−∞f (x) dx = 1.

Una función f (x) que verifica las propiedades anteriores se denomina función de densidadde probabilidad, o simplemente función de densidad. Nótese asimismo que la función F(x) esmonótona creciente.

Observación. Obsérvese que estas definiciones generalizan a las dadas en el caso discretoanteriormente estudiado.

Page 120: Apuntes MatemáticasII

120

Una consecuencia inmediata de la definición de continuidad es que la probabilidad de quela variable X se encuentre entre dos valores a y b viene dada por

p(a < X < b) =∫ b

af (x) dx = F(b)− F(a).

En particular, la probabilidad de que X tome un valor concreto x es siempre cero. De estaforma, las siguientes expresiones son equivalentes:

p(a < X < b) = p(a 6 X < b) = p(a < X 6 b) = p(a 6 X 6 b).

Ejemplo 5.12. Si se selecciona al azar un individuo de entre un grupo grande de personas,la probabilidad de que su peso X sea exactamente 75 kg es nula. Sin embargo, habrá unaprobabilidad no nula de que su peso esté entre 70 y 80 kg.

Sea f (x) la función de densidad de la variable aleatoria X. Al ser f (x) > 0, su gráficay = f (x) estará siempre por encima del eje de abscisas. La probabilidad de que X se encuentreentre dos puntos dados a y b, esto es,

p(a 6 X 6 b) =∫ b

af (x) dx,

puede entonces interpretarse como el área bajo la curva y = f (x) delimitada por las rectasx = a y x = b.

Ejemplo 5.13. Consideremos la función de densidad dada por

f (x) =

x2

9si 0 < x < 3,

0 en otro caso,

y calculemos la función de distribución asociada. En primer lugar, si x < 0 se tiene que

F(x) =∫ x

−∞f (u) du =

∫ x

−∞0 du = 0.

Si 0 6 x < 3 entonces

F(x) =∫ x

−∞f (u) du =

∫ x

0

u2

9du =

[u3

27

]x

0=

x3

27.

Por último, si x > 3 resulta que

F(x) =∫ x

−∞f (u) du =

∫ 3

0

u2

9du = 1.

En resumen, la función de distribución es

F(x) =

0 si x < 0,

x3

27si 0 6 x < 3,

1 si x 6 3.

Page 121: Apuntes MatemáticasII

5.3 Distribuciones de probabilidad 121

Si, por ejemplo, queremos calcular la probabilidad de que la variable aleatoria asociada Xtome valores entre 1,25 y 2,75, simplemente hacemos

p(1,25 6 X 6 2,75) = F(2,75)− F(1,25) =(2,75)3

27− (1,25)3

27≈ 0,6979.

En la figura 5.2, el área sombreada representa la probabilidad p(1,25 6 X 6 2,75).

Figura 5.2: Gráfica de la función de distribución F(x) y área que representa p(1,25 6 X 6 2,75).

Los conceptos anteriores pueden generalizarse al caso de dos o más variables aleatorias.Si X e Y son variables aleatorias discretas, su función de probabilidad conjunta viene dada por

p(X = x, Y = y) = f (x, y),

donde f (x, y) debe verificar:

f (x, y) > 0, ∀ x, y ∈ R.

∑x

∑y

f (x, y) = 1.

La función de distribución conjunta se define como

F(x, y) = p(X 6 x, Y 6 y) = ∑u6x

∑v6y

f (u, v).

Supongamos que X e Y toman los valores {x1, . . . , xn} y {y1, . . . , yn} respectivamente; laprobabilidad de que ocurra el suceso X = xi e Y = yj es entonces f (xi, f j). Si queremosdeterminar la probabilidad del suceso X = xi, consideramos

f1(xi) ≡ p(X = xi) =n

∑j=1

f (xi, yj).

Page 122: Apuntes MatemáticasII

122

De forma análoga, la probabilidad del suceso Y = yj viene dada por

f2(yj) ≡ p(Y = yj) =n

∑i=1

f (xi, yj).

Las funciones f1(x) y f2(y) así definidas son las funciones de probabilidad marginal de X e Y.

Ejemplo 5.14. La función de probabilidad conjunta para las variables aleatorias discretas X eY viene dada por

f (x, y) = c(2x + y),

si x e y toman valores en {0, 1, 2} y {0, 1, 2, 3} respectivamente, y f (x, y) = 0 en otro caso.Podemos representar las probabilidades asociadas mediante una tabla:

HHHHHHX

Y0 1 2 3 f1(x)

0 0 c 2c 3c 6c1 2c 3c 4c 5c 14c2 4c 5c 6c 7c 22c

f2(y) 6c 9c 12c 15c 42c

Notemos en primer lugar que el valor de la constante c no puede ser cualquiera, ya que lasuma de todas las probabilidades debe ser 1:

∑x

∑y

f (x, y) = 1⇒ 42c = 1⇒ c = 142 .

Para calcular la probabilidad del suceso X = 2 e Y = 1, buscamos el correspondiente valoren la tabla:

p(X = 2, Y = 1) = 5c = 542 .

Asimismo, la probabilidad de que X > 1 e Y 6 2 se determina sumando todos los elementosde la tabla para x = 1, 2 e y = 0, 1, 2:

p(X > 1, Y 6 2) = (2c + 3c + 4c) + (4c + 5c + 6c) = 24c = 2442 = 4

7 .

Las función de probabilidad marginal para X se obtiene sumando, para cada valor de x,todos los elementos de la correspondiente fila; de esta forma,

f1(x) = p(X = x) =

6c = 1

7 si x = 0,

14c = 13 si x = 1,

22c = 1121 si x = 2.

Asimismo, para construir la función de probabilidad marginal para Y sumamos los valoresde la columna correspondiente a cada valor de y; así se obtiene:

f2(y) = p(Y = y) =

6c = 1

7 si x = 0,

9c = 314 si x = 1,

12c = 27 si x = 2,

15c = 514 si x = 3.

Page 123: Apuntes MatemáticasII

5.3 Distribuciones de probabilidad 123

La probabilidad el suceso X = 2 puede calcularse como

p(X = 2) = F1(2) = 1121 .

De forma análoga, la probabilidad de que Y = 1 sería

p(Y = 1) = F2(1) = 314 .

En el caso en que las variables X e Y sean continuas, la función de densidad f (x, y) debeverificar las siguientes propiedades:

f (x, y) > 0, ∀ x, y ∈ R.∫ ∞

−∞

∫ ∞

−∞f (x, y) dx dy = 1.

En este caso, la función de distribución conjunta viene dada por

F(x, y) = p(X 6 x, Y 6 y) =∫ x

−∞

∫ y

−∞f (u, v) du dv.

A partir de la definición de F(x, y), podemos deducir que

F1(x) ≡ p(X 6 x) =∫ x

−∞

∫ ∞

−∞f (u, v) du dv

y

F2(y) ≡ p(Y 6 y) =∫ ∞

−∞

∫ y

−∞f (u, v) du dv.

Las funciones F1(x) y F2(y) son las distribuciones de probabilidad marginal de X e Y. Lascorrespondientes funciones de densidad marginal se definen como

f1(x) =∫ ∞

−∞f (x, v) dv, f2(y) =

∫ ∞

−∞f (u, y) du.

Ejemplo 5.15. Consideremos las variables aleatorias X e Y con función de densidad conjunta

f (x, y) =

{cxy si 0 < x < 4, 1 < y < 5,

0 en otro caso.

El valor de la constante c se determina del siguiente modo:

1 =∫ ∞

−∞

∫ ∞

−∞f (x, y) dx dy =

∫ 4

0

∫ 5

1cxy dx dy = 96c⇒ c = 1

96 .

Para calcular la probabilidad del suceso 1 < X < 2 y 2 < Y < 3, simplemente hacemos∫ 2

1

∫ 3

2cxy dx dy = 5

128 .

Calculemos las distribuciones marginales. Para 0 6 x < 4 se tiene que

F1(x) ≡ p(X 6 x) =∫ x

−∞

∫ ∞

−∞f (x, y) dx dy =

∫ x

0

∫ 5

1cxy dx dy =

x2

16.

Page 124: Apuntes MatemáticasII

124

Si x < 0 entonces f (x, y) = 0, por lo que F1(x) = 0. Por último, para x > 4 se verifica queF1(x) = 1. En resumen,

F1(x) = p(X 6 x) =

0 si x < 0,

x2

16si 0 6 x < 4,

1 si x > 4.

La distribución marginal para Y se calcula de forma análoga:

F2(y) = p(Y 6 y) =

0 si y < 1,

y2 − 124

si 1 6 y < 5,

1 si y > 5.

Las correspondientes densidades marginales son

f1(x) =

x8

si 0 < x < 4,

0 en otro caso,f2(y) =

y12

si 1 < y < 5,

0 en otro caso,

que se determinan derivando las expresiones para F1(x) y F2(y).

Sean X e Y variables aleatorias discretas. Si los eventos X = x e Y = y son independientespara cada valor de x e y, diremos que las variables X e Y son independientes. En tal caso,

p(X = x, Y = y) = p(X = x)p(Y = y),

o bien, en términos de densidades,

f (x, y) = f1(x) f2(y).

Ejemplo 5.16. Las variables aleatorias del ejemplo 5.14 no son independientes, ya que, segúnvimos,

p(X = 2, Y = 1) = 542 6=

1121 ·

314 = p(X = 2)p(Y = 1).

En términos de densidades, f (2, 1) 6= f1(2) f2(1).

En el caso continuo, las variables X e Y son independientes si los sucesos X 6 x e Y 6 yson independientes para cada x e y. Se tiene entonces que

p(X 6 x, Y 6 y) = p(X 6 x)p(Y 6 y),

o bien,F(x, y) = F1(x)F2(y).

También se verifica que f (x, y) = f1(x) f2(y).

Ejemplo 5.17. Las variables aleatorias del ejemplo 5.15 son independientes. Por una parte,

f (x, y) =xy96

=x8· y

12= f1(x) f2(y)

para 0 < x < 4 y 1 < y < 5. En otro caso, f (x, y) = 0 y f1(x) = 0 o f2(y) = 0. Por tanto,f (x, y) = f1(x) f2(y) para cada x, y ∈ R.

Page 125: Apuntes MatemáticasII

5.4 Elementos de Estadística 125

5.4. Elementos de Estadística

Dada una variable aleatoria discreta X que toma los valores {x1, . . . , xn}, definimos suesperanza matemática o valor esperado, E(X), como

E(X) =n

∑j=1

xj p(X = xj).

De manera equivalente, si p(X = xj) = f (xj), entonces

E(X) =n

∑j=1

xj f (xj).

Observación. En el caso particular en que todos los sucesos sean igualmente probables, setiene que p(X = xj) =

1n ; por tanto,

E(X) =x1 + x2 + · · ·+ xn

n.

Es decir, E(X) corresponde a la media aritmética de los valores {x1, . . . , xn}.

Cuando X es una variable aleatoria continua, con función de densidad f (x), la esperanzamatemática de X se define de forma natural como

E(X) =∫ ∞

−∞x f (x) dx,

siempre que dicha integral tenga sentido.Es también habitual llamar media de X a la esperanza matemática E(X), y denotarla por

µX (o simplemente µ si no se presta a confusión). El papel de la media o esperanza es fun-damental en Probabilidad y Estadística; intuitivamente, nos proporciona un valor promedio orepresentativo de los valores que toma la variable X.

Ejemplo 5.18. Supongamos que la función de densidad de una variable aleatoria X es

f (x) =

x2

si 0 < x < 2,

0 en otro caso.

Entonces la media de X es

E(X) =∫ ∞

−∞x f (x) dx =

∫ 2

0

x2

2dx =

[x3

6

]2

0=

23

6=

43

.

Supongamos que X es una variable aleatoria discreta con función de probabilidad f (x).Entonces, si g(x) es una cierta función, Y = g(X) es una nueva variable aleatoria discreta cuyamedia se calcula como

E(Y) = E[g(X)] = ∑x

g(x) f (x).

Page 126: Apuntes MatemáticasII

126

De modo análogo, si X es continua entonces

E[g(X)] =∫ ∞

−∞g(x) f (x) dx.

Estos hechos se generalizan de forma natural al caso de dos o más variables aleatorias:

E[g(X, Y)] = ∑x

∑y

g(x, y) f (x, y)

en el caso discreto, y

E[g(X, Y)] =∫ ∞

−∞

∫ ∞

−∞g(x, y) f (x, y) dx dy

en el caso continuo.

Ejemplo 5.19. Si X es una variable aleatoria discreta con función de probabilidad f (x), setiene que

E(2X + 3) = ∑x(2x + 3) f (x) = 2 ∑

xx f (x) + 3

����>

1∑x

f (x) = 2E(X) + 3.

Asimismo, E(X2) se calcularía del siguiente modo:

E(X2) = ∑x

x2 f (x).

Si X fuese continua, tendríamos:

E(2X + 3) =∫ ∞

−∞(2x + 3) f (x) dx = 2

∫ ∞

−∞x f (x) dx + 3

���

����*1∫ ∞

−∞f (x) dx = 2E(X) + 3,

y

E(X2) =∫ ∞

−∞x2 f (x) dx.

La media µ de una variable aleatoria no nos proporciona información alguna sobre ladispersión de los datos considerados. Para medir dicha dispersión alrededor del valor medio,se introducen los conceptos de varianza y desviación estándar.

La varianza de una variable aleatoria X, Var(X), se define como

Var(X) = E[(X− µ)2],

mientras que su desviación estándar, σX, es la raíz cuadrada de la varianza:

σX =√

Var(X) =√

E[(X− µ)2].

Es usual denotar también la varianza simplemente como σ2X.

Observación. Supongamos que X representa una medida con ciertas unidades o dimensiones,por ejemplo, metros (m). Entonces las unidades de la varianza son m2, mientras que las de ladesviación estándar son metros. Es decir, X y σX tienen las mismas unidades. Este es el motivopor el que, en la práctica, suele utilizarse la desviación estándar en lugar de la varianza.

Page 127: Apuntes MatemáticasII

5.4 Elementos de Estadística 127

Veamos la idea intuitiva detrás de la definición de varianza. Supongamos que X es unavariable aleatoria discreta que toma los valores {x1, . . . , xn}, y sea f (x) su función de proba-bilidad; en tal caso,

Var(X) =n

∑j=1

(xj − µ)2 f (xj).

Si todos los sucesos xj son igualmente probables entonces f (xj) =1n , de donde

Var(X) =(x1 − µ)2 + (x2 − µ)2 + · · ·+ (xn − µ)2

n.

Cada término (xj − µ)2 puede interpretarse como el cuadrado de la distancia del valor xj alvalor promedio µ; la igualdad anterior nos dice que la varianza es la media aritmética dedichas distancias. De esta forma, cuando la varianza es pequeña los valores de X tienden aconcentrarse cerca de la media. Por el contrario, si los valores se distribuyen lejos de la mediaentonces la varianza será grande.

Ejemplo 5.20. En la siguiente tabla se muestran las notas obtenidas por un grupo de estu-diantes en las asignaturas de Ufología y Parapsicología:

Ufología 4,1 4,2 1,4 5,2 3,7 5,5 6,0 5,2 5,2 4,9

Parapsicología 1,5 8,2 2,4 3,1 9,7 1,1 6,0 5,2 6,0 2,1

Si denotamos por X las notas en Ufología, tenemos que su media es

µX =4,1 + 4,2 + 1,4 + 5,2 + 3,7 + 5,5 + 6,0 + 5,2 + 5,2 + 4,9

10= 4,53,

mientras que la desviación estándar viene dada por

σX =

√(4,1− µX)2 + (4,2− µX)2 + · · ·+ (4,9− µX)2

10≈ 1,23.

Para Parapsicología, denotada por Y, tenemos que la media vale

µY =1,5 + 8,2 + 2,4 + 3,1 + 9,7 + 1,1 + 6,0 + 5,2 + 6,0 + 2,1

10= 4,53,

y su desviación estándar es

σY =

√(1,5− µY)2 + (8,2− µY)2 + · · ·+ (2,1− µY)2

10≈ 2,80.

Como vemos, ambas variables poseen la misma media. Sin embargo, las calificaciones deParapsicología están más dispersas respecto del valor medio que las notas de Ufología. Estehecho se refleja en que la desviación estándar de Parapsicología es mayor que la de Ufología.

Veamos cómo realizar el ejemplo usando Sage. En primer lugar, introducimos los valoresde X en una lista:sage: X = [4.1, 4.2, 1.4, 5.1, 3.7, 5.5, 6.0, 5.2, 5.2, 4.9]

Page 128: Apuntes MatemáticasII

128

Para calcular la media de X, basta con sumar los elementos de la lista y dividir por el númerode elementos:

sage: muX = sum(X)/len(X); muX4.53000000000000

Para calcular la desviación típica, hacemos lo siguiente:

sage: sigmaX = sqrt(sum([(xi -muX)^2 for xi in X])/ len(X)); sigmaX1.23454445039456

Los cálculos para la variable Y serían análogos:

sage: Y = [1.5, 8.2, 2.4, 3.1, 9.7, 1.1, 6.0, 5.2, 6.0, 2.1]sage: muY = sum(Y)/len(Y); muY4.53000000000000sage: sigmaY = sqrt(sum([(yi -muY)^2 for yi in Y])/ len(Y)); sigmaY2.80001785708591

También es posible usar los comandos mean y std:

sage: mean(X)4.53000000000000sage: std(X, bias=True)1.23454445039456

En el caso de una variable continua X con densidad f (x), la varianza se define como

σ2X = E[(X− µ)2] =

∫ ∞

−∞(x− µ)2 f (x) dx,

y la desviación estándar como su raíz cuadrada. La idea intuitiva de la varianza es análogaa la del caso discreto: se trata de una medida de la dispersión de los valores de una variablealeatoria alrededor de la media. En la figura 5.3 se representan dos distribuciones continuascon la misma media y distintas desviaciones estándar.

Ejemplo 5.21. Consideremos la variable aleatoria X del ejemplo 5.18 y calculemos su varianzay su desviación estándar. Vimos que la media de X era µ = 4

3 ; por tanto, su varianza será

σ2 =∫ ∞

−∞(x− µ)2 f (x) dx =

∫ 2

0

(x− 4

3

)2 x2

dx =29

,

y su desviación estándar es σ =√

29 =

√2

3 .

Cuando se trata de comparar dos distribuciones diferentes, es habitual considerar variablesaleatorias estandarizadas. Si X es una variable aleatoria con media µ y desviación estándar σ, sedefine la variable estandarizada asociada como

X∗ =X− µ

σ.

Es inmediado comprobar que X∗ tiene media cero y varianza 1.

Page 129: Apuntes MatemáticasII

5.4 Elementos de Estadística 129

Figura 5.3: Distribuciones de probabilidad con la misma media µ y distintas desviaciones: σX < σY.

Consideremos dos variables aleatorias X e Y. Definimos su varianza conjunta o covarianza,Cov(X, Y) o σXY, como

σXY ≡ Cov(X, Y) = E[(X− µX)(Y− µY)].

Puede demostrarse que si las variables X e Y son independientes entonces σXY = 0. Por elcontrario, si las variables son iguales, X = Y, entonces σXY = σXσY. Estos hechos nos dan laidea de definir el coeficiente de correlación

ρ =Cov(X, Y)√

Var(X)Var(Y)=

σXY

σXσY,

que nos da una medida de la dependencia de las variables X e Y. Por construcción, el coefi-ciente de correlación toma valores entre −1 y 1. Cuando ρ = 0 decimos que las variables noestán correlacionadas. Cuando ρ está cerca de 1 las variables tienen un alto grado de correlación,mientras que valores de ρ cercanos a −1 indican una correlación inversa entre las variables.

Ejemplo 5.22. Volvamos al ejemplo 5.20, en el que se comparaban las notas obtenidas enlas asignaturas Ufología (X) y Parapsicología (Y). Vimos que µX = µY = 4,53, σX = 1, 23 yσY = 2,80. La covarianza de X e Y es

σXY =(4,1− 4,53)(1,5− 4,53) + · · ·+ (4,9− 4,53)(2,1− 4,53)

10≈ 0,1021.

Por tanto, el coeficiente de correlación de X e Y toma el valor

ρXY =σXY

σXσY≈ 0,0295.

El valor de ρ, cercano a cero, nos indica que las calificaciones de ambas asignaturas están pococorrelacionadas.

Consideremos ahora las notas obtenidas en la asignatura Pedagogía:

Page 130: Apuntes MatemáticasII

130

Pedagogía 2,1 9,0 2,1 4,3 10,0 0,0 5,3 6,1 7,0 2,2

Si denotamos por Z a la variable aleatoria asociada, se tiene que µZ = 4,81 y σZ ≈ 3,10.Asimismo, las covarianzas relativas a X e Y son σXZ ≈ 0,11 y σYZ ≈ 8,46; de esta forma, setienen los siguientes valores para los coeficientes de correlación:

ρXZ =σXZ

σXσZ≈ 0,0284, ρYZ =

σYZ

σYσZ≈ 0,9743.

Podemos concluir que X y Z están poco correlacionadas, mientras que la correlación de Y yZ es bastante alta. Existe pues una cierta similitud entre las calificaciones en Parapsicología yPedagogía, bien sea por sus similares contenidos, por el tipo de examen o por la calidad desus profesores. Las diferencias respecto a Ufología podrían obedecer a causas análogas.

Los cálculos del ejemplo han sido realizados con el siguiente código Sage:sage: # Ejemplo 5.22sage: X = [4.1, 4.2, 1.4, 5.1, 3.7, 5.5, 6.0, 5.2, 5.2, 4.9]sage: Y = [1.5, 8.2, 2.4, 3.1, 9.7, 1.1, 6.0, 5.2, 6.0, 2.1]sage: Z = [2.1, 9.0, 2.1, 4.3, 10.0, 0.0, 5.3, 6.1, 7.0, 2.2]sage: #sage: n = len(X)sage: muX = sum(X)/nsage: muY = sum(Y)/nsage: muZ = sum(Z)/nsage: #sage: sigmaX = sqrt(sum([(xi -muX)^2 for xi in X])/n)sage: sigmaY = sqrt(sum([(yi -muY)^2 for yi in Y])/n)sage: sigmaZ = sqrt(sum([(zi -muZ)^2 for zi in Z])/n)sage: #sage: covXY = sum ([(xi-muX)*(yi -muY) for (xi,yi) in zip(X,Y)])/n; covXY0.102100000000000sage: rhoXY = covXY /( sigmaX*sigmaY ); rhoXY0.0295364441126556sage: #sage: covXZ = sum ([(xi-muX)*(zi -muZ) for (xi,zi) in zip(X,Z)])/n; covXZ0.108700000000000sage: rhoXZ = covXZ /( sigmaX*sigmaZ ); rhoXZ0.0284044232706738sage: #sage: covYZ = sum ([(yi-muX)*(zi -muZ) for (yi,zi) in zip(Y,Z)])/n; covYZ8.45670000000000sage: rhoYZ = covYZ /( sigmaY*sigmaZ ); rhoYZ0.974323744265441

Existe un importante resultado, denominado desigualdad de Chebyshev, que establece losiguiente: si X es una variable aleatoria con media µ y desviación estándar σ entonces, paracualquier número positivo ε, se verifica que

p(|X− µ| > ε) 6σ2

ε2 .

Si tomamos ε = kσ para un cierto k, entonces la desigualdad toma la forma

p(|X− µ| > kσ) 61k2 .

Page 131: Apuntes MatemáticasII

5.4 Elementos de Estadística 131

Observación. En particular, para el valor k = 2 se tiene que

p(|X− µ| > 2σ) 6 0,25,

o, equivalentemente,p(|X− µ| < 2σ) > 0,75.

Esto significa que al menos el 75 % de valores diferirán de la media en ±2 veces el valor de ladesviación estándar, independientemente de la forma que tenga la distribución X.

Ejemplo 5.23. Para las notas de Ufología del ejemplo 5.20 se tenía que la media era µX = 4,53y la desviación estándar valía σX ≈ 1,23. Por tanto, la desigualdad de Chebyshev nos dice queal menos un 75 % de los valores de X estarán en el intervalo

[µX − 2σX, µX + 2σX] ≈ [2,06, 6,99].

Según la tabla del ejemplo 5.20, el número de notas dentro de dicho intervalo es de 9 entre untotal de 10. Por tanto, en este caso el intervalo contiene al 90 % de los valores que toma X.

Aunque la media es la medida más utilizada para la tendencia central de una distribuciónde probabilidad, también se emplean otras dos medidas:

La moda de una variable aleatoria discreta es el valor que ocurre con más frecuencia; enotras palabras, es el valor con mayor probabilidad de suceder. La moda no es necesaria-mente única.

La mediana es el valor x para el que P(X < x) = 12 y p(X > x) 6 1

2 . Cuando X esuna variable continua, la mediana separa la curva de densidad en dos zonas con áreasiguales de 1

2 cada una. Para una variable discreta no hay una mediana única.

Uno de los ejemplos más importantes de distribución de probabilidad es la distribuciónnormal o distribución gaussiana, cuya función de densidad viene dada por

f (x) =1

σ√

2πe−

(x−µ)2

2σ2 , −∞ < x < ∞,

donde µ y σ son, respectivamente, la media y la desviación estándar. La función de distribu-ción asociada es

F(x) = p(X 6 x) =1

σ√

∫ x

−∞e−

(u−µ)2

2σ2 du, x ∈ R.

Si llamamos Z a la variable estandarizada, cuya media es 1 y su desviación estándar vale 0, setiene que la correspondiente función de densidad es

f (z) =1√2π

e−z22 ,

mientras que la función de distribución es

F(z) = p(Z 6 z) =1√2π

∫ z

−∞e−

u22 du =

12+

1√2π

∫ z

0e−

u22 du

La función f (z) tiene forma de campana: su gráfica puede observarse en la figura 5.4.

Page 132: Apuntes MatemáticasII

132

Figura 5.4: Función de densidad f (z) de la distribución normal estandarizada.

Observación. La distribución normal se utiliza para modelizar numerosas características enpoblaciones humanas: peso, altura, cociente intelectual, etc., así como determinados procesoseconómicos y físicos.

Ejemplo 5.24. El peso promedio de un grupo de 500 estudiantes es de 68 kg y la desviación es-tándar es de 7 kg. Suponiendo que los pesos siguen una distribución normal, nos planteamosel problema de estimar el número de alumnos que pesan entre 54 y 70 kg.

Suponiendo que los pesos se tomaron con el valor más cercano al kg, los pesos registradosentre 54 y 70 kg realmente toman valores entre 53,5 y 70,5 kg. Por comodidad, usaremosvalores normalizados; de esta forma,

53,5 kg ≡ 53,5− 687

= −2,07 en unidades estándar,

70,5 kg ≡ 70,5− 687

= 0,36 en unidades estándar.

Calculamos a continuación1√2π

∫ 0,36

−2,07e−

z22 dz ≈ 0,62.

Este cálculo puede hacerse con el siguiente comando Sage:

sage: N(integral (1/ sqrt (2*pi)*exp(-x^2/2), x, -2.07, 0.36))0.621350260990646

Finalmente, la estimación requerida es de 500 · 0,62 = 310 estudiantes.Calculemos ahora el número esperado de estudiantes que pesan más de 85 kg. Para que

esto suceda, hemos de considerar los estudiantes que pesan al menos 85.5 kg. Teniendo encuenta que

83,5 kg ≡ 83,5− 687

= 2,21 en unidades estándar,

Page 133: Apuntes MatemáticasII

5.4 Elementos de Estadística 133

calculamos1√2π

∫ ∞

2,21e−

z22 dz ≈ 0,0135.

En Sage hacemos lo siguiente:sage: N(integral (1/ sqrt (2*pi)*exp(-x^2/2), x, 2.21, Infinity ))0.0135525811465314

El número de estudiantes será por tanto 500 · 0,0135 = 6,75 ≈ 7.En resumen, podemos decir que la probabilidad de que un estudiante elegido al azar pese

entre 54 y 78 kg es 0,62, mientras que la probabilidad de que pese más de 83 kg es 0.0135.De forma más específica, si X es la variable aleatoria que representa el peso de un alumno,entonces p(53,5 6 X 6 78,5) = 0,62 y p(X > 83,5) = 0,0135. En la figura 5.5 se han dibujadolas áreas correspondientes a cada uno de los casos.

(a) Área que representa p(53,5 6 X 6 78,5). (b) Área que representa p(X > 83,5).

Figura 5.5

En la práctica nos encontramos con el problema de establecer conclusiones válidas sobreun grupo o población grande de individuos u objetos. En muchos casos es difícil o imposibleexaminar la población completa, por que inferimos resultados sobre ésta a partir del examende una pequeña parte denominada muestra. La rama de la Estadística que se ocupa de estetema se conoce con el nombre de teoría de muestras.

Ejemplo 5.25. En las encuestas de intención de voto se realizan predicciones sobre el resultadode unas elecciones a partir de los datos tomados sobre una parte relativamente pequeña delelectorado. En este caso todas las personas con derecho a voto formarían la población, mientrasque aquellos que han sido encuestados conformarían la muestra.

Obviamente, las conclusiones referidas a la población dependerán de si la muestra se tomócorrectamente, es decir, de si ésta representa suficientemente bien a la población. Una formade hacer esto es asegurar que cada miembro de la población tenga la misma probabilidad deestar en la muestra; en tal caso, la muestra se denomina aleatoria.

Page 134: Apuntes MatemáticasII

134

Debido a que la inferencia de muestra a población no puede ser segura, debemos usar ellenguaje de la probabilidad en este contexto. En general, se considera que una población esconocida cuando se conoce la distribución de probabilidad de la variable aleatoria asociada.

5.5. Curva de ajuste, regresión y correlación

En la práctica es frecuente encontrarse con dos o más variables que están relacionadasde alguna forma. Nos planteamos el problema de expresar matemáticamente dicha relaciónmediante una ecuación que una las variables.

Supongamos, por ejemplo, que x e y denotan respectivamente la estatura y el peso de unapersona. Si tomamos una muestra compuesta por n individuos, podemos construir el conjuntode puntos

{(x1, y1), (x2, y2), . . . , (xn, yn)}

y dibujarlos en el sistemas de coordenadas x-y. Se obtiene así el diagrama de dispersión asociado.A menudo es posible aproximar dicho diagrama mediante una curva regular, denominadacurva de aproximación o de ajuste. Si nos fijamos en la figura 5.6 (a), una buena aproximaciónvendría dada por una recta:

y = ax + b,

mientras que en la figura 5.6 (b) podríamos considerar una parábola:

y = ax2 + bx + c.

Sin embargo, los puntos de la figura 5.6 (c) no parecen ajustarse a ninguna curva en particular.

(a) Recta: y = ax + b. (b) Parábola: y = ax2 + bx + c. (c) Puntos totalmente aleatorios.

Figura 5.6: Curvas de regresión.

Una vez determinada la curva de ajuste, podemos usarla para estimar el valor de unade las variables (la variable dependiente) en función de la otra (la variable independiente). Esteproceso se denomina regresión; a la curva de ajuste también se le llama curva de regresión.Cuando la curva es una línea recta la regresión es lineal, mientras que cuando es una parábolala regresión es cuadrática.

Un método básico para construir una curva de regresión es el conocido como método demínimos cuadrados, que explicamos a continuación.

Page 135: Apuntes MatemáticasII

5.5 Curva de ajuste, regresión y correlación 135

Supongamos que y = f (x) es la ecuación de la curva de regresión que queremos determi-nar. En tal caso, para cada elemento xi podemos medir la diferencia di entre el valor yi de lamuestra y el valor f (xi) proporcionado por la curva. A di se le llama error, desviación o residuo,y vale

di = yi − f (xi), i = 1, . . . , n.

(nótese que di puede ser positivo, negativo o cero). Como medida del error global cometidoal ajustar la nube de puntos (xi, yi) mediante la curva de regresión, consideramos el valor5

n

∑i=1

d2i =

n

∑i=1

(yi − f (xi))2.

Cuando esta cantidad sea pequeña el ajuste será bueno, y viceversa. De esta forma, paracalcular la curva de ajuste buscamos aquella que haga mínimo el valor de ∑n

i=1 d2i .

Siguiendo el procedimiento anteriormente comentado, puede demostrarse que la recta demínimos cuadrados asociada a los puntos {(xi, yi) : i = 1, . . . , n},

y = ax + b,

se determina resolviendo sus ecuaciones normales:∑ y = an + b ∑ x,

∑ xy = a ∑ x + b ∑ x2,

(por simplicidad, hemos omitido todos los subíndices). Es sencillo comprobar que la soluciónde este sistema viene dada por

a =

(∑ y

)(∑ x2)− (∑ x

)(∑ xy

)n ∑ x2 −

(∑ x

)2 , b =n ∑ xy−

(∑ x

)(∑ y

)n ∑ x2 −

(∑ x

)2 .

Podemos reescribir b de la forma

b =∑(x− x)(y− y)

∑(x− x)2 ,

donde x e y representan las medias de x e y, respectivamente. Si dividimos por n ambosmiembros de la primera ecuación normal, se obtiene:

y = a + bx.

De esta forma, podemos determinar el coeficiente a a partir de los valores x, y y b.

Observación. La recta de mínimos cuadrados tiene pendiente b y pasa por el punto (x, y),denominado centroide o centro de gravedad de los datos.

Ejemplo 5.26. Consideremos los puntos (xi, yi) dados en la siguiente tabla:

5Los valores de di se elevan al cuadrado para no tener en cuenta los signos. Otra posibilidad sería tomar valoresabsolutos, pero en tal caso la función resultante no sería derivable.

Page 136: Apuntes MatemáticasII

136

xi 1,5 4,4 7,4 8,7 2,6 0,8 5,3 7,2 0,1 3,5

yi −0,2 2,7 4,2 9,4 1,0 1,3 4,5 6,8 −2,2 2,8

Para calcular la recta de mínimos cuadrados asociada, primero calculamos las medias:

x =1n

n

∑i=1

xi = 4,15, y =1n

n

∑i=1

yi = 3,03,

donde n = 10 es el número de puntos. A continuación determinamos el coeficiente b:

b =

n

∑i=1

(xi − x)(yi − y)

n

∑i=1

(xi − x)2≈ 1,0667,

así como el valor de a:y = a + bx ⇒ a = y− bx ≈ −1,3969.

La recta de mínimos cuadrados es, por tanto,

y = −1,3969 + 1,0667x.

En la figura 5.7 se representan tanto el conjunto de puntos como la recta de mínimos cuadra-dos asociada.

Figura 5.7: Ajuste mediante una recta de mínimos cuadrados.

Mediante la recta de mínimos cuadrados podemos estimar el valor de y para cualquierpunto x. Así pues, para x = 8,2 el valor aproximado sería

y = −1,3969 + 1,0667 · 8,2 ≈ 7,35.

El siguiente código Sage permite hacer el ajuste por mínimos cuadrados, así como repre-sentar los resultados de la figura 5.7.

Page 137: Apuntes MatemáticasII

5.5 Curva de ajuste, regresión y correlación 137

sage: # Ejemplo 5.26sage: # Puntossage: X = [1.5, 4.4, 7.4, 8.7, 2.6, 0.8, 5.3, 7.2, 0.1, 3.5]sage: Y = [-0.2, 2.7, 4.2, 9.4, 1.0, 1.3, 4.5, 6.8, -2.2, 2.8]sage: puntos = zip(X,Y)sage: #sage: # Mediassage: muX = sum(X)/len(X)sage: muY = sum(Y)/len(Y)sage: #sage: # Coeficientes rectasage: numb = sum ([(x-muX)*(y-muY) for (x, y) in puntos ])sage: denomb = sum ([(x-muX)^2 for x in X])sage: b = numb/denombsage: a = muY -b*muXsage: a, b( -1.39692791942084 , 1.06672961913755)sage: #sage: # Gra’ficasage: var(’x’)sage: fig = list_plot(puntos , color=’blue’, size=’20’)sage: fig += plot(a+b*x, min(X), max(X), color=’red’, gridlines=True)sage: fig.show()

Puede demostrarse que los coeficientes de la parábola de mínimos cuadrados,

y = a + bx + cx2,

vienen dados como solución del siguiente sistema de ecuaciones normales:∑ y = na + b ∑ x + c ∑ x2,

∑ xy = a ∑ x + b ∑ x2 + c ∑ x3,

∑ x2y = a ∑ x2 + b ∑ x3 + c ∑ x4.

En notación matricial, el sistema se escribe como n ∑ x ∑ x2

∑ x ∑ x2 ∑ x3

∑ x2 ∑ x3 ∑ x4

a

b

c

=

∑ y

∑ xy

∑ x2y

.

Ejemplo 5.27. Consideremos el conjunto de puntos (xi, yi) del ejemplo 5.26. El sistema deecuaciones normales para la parábola de mínimos cuadrados, escrito en forma matricial, que-da de la siguiente forma: 10 41,5 251,65

41,5 251,65 1735,375251,65 1735,375 12780,1093

abc

=

30,3210,47

1514,087

.

Su solución esa ≈ −1,0336, b ≈ 0,7778, c ≈ 0,0332,

Page 138: Apuntes MatemáticasII

138

por lo que la parábola de mínimos cuadrados viene dada por

y = −1,0336 + 0,7778x + 0,0332x2.

Su representación gráfica puede verse en la figura 5.8.

Figura 5.8: Ajuste mediante una parábola de mínimos cuadrados.

En este caso, la estimación del valor de y para x = 8,2 será

y = −1,0336 + 0,7778 · 8,2 + 0,0332 · (8,2)2 ≈ 7,5767.

El código Sage para el ajuste mediante una parábola de mínimos cuadrados es el siguiente:sage: # Ejemplo 5.27sage: # Puntossage: X = [1.5, 4.4, 7.4, 8.7, 2.6, 0.8, 5.3, 7.2, 0.1, 3.5]sage: Y = [-0.2, 2.7, 4.2, 9.4, 1.0, 1.3, 4.5, 6.8, -2.2, 2.8]sage: puntos = zip(X,Y)sage: n = len(X)sage: #sage: # Sumassage: sumaX = sum(X)sage: sumaY = sum(Y)sage: sumaX2 =sum([x^2 for x in X])sage: sumaX3 = sum([x^3 for x in X])sage: sumaX4 = sum([x^4 for x in X])sage: sumaXY = sum([x*y for (x, y) in puntos ])sage: sumaX2Y = sum([x^2*y for (x, y) in puntos ])sage: #sage: # Matriz de coeficientessage: A = matrix ([[n, sumaX , sumaX2],

[sumaX , sumaX2 , sumaX3],[sumaX2 , sumaX3 , sumaX4 ]])

sage: # Te’rmino independientesage: B = vector ([sumaY , sumaXY , sumaX2Y ])sage: # Solucio ’n del sistemasage: (a, b, c) = A.inverse ()*B

Page 139: Apuntes MatemáticasII

5.5 Curva de ajuste, regresión y correlación 139

sage: a, b, c( -1.03363124827865 , 0.777847952346935 , 0.0332033477464275)sage: #sage: # Gra’ficasage: var(’x’)sage: fig = list_plot(puntos , color=’blue’, size=’20’)sage: fig += plot(a+b*x+c*x^2, min(X), max(X), color=’red’,

gridlines=True)sage: fig.show()

Page 140: Apuntes MatemáticasII

140

6. Bibliografía

M. Braun. Ecuaciones Diferenciales y sus Aplicaciones. Grupo Editorial Iberoamérica, 1990.

R.L. Burden, J.D. Faires. Métodos Numéricos. Thompson-Paraninfo, 2004.

S.C. Chapra, R.P. Canale. Métodos Numéricos para Ingenieros. McGraw-Hill, 2003.

C.H. Edwards, D.E. Penney. Ecuaciones Diferenciales Elementales y Problemas con Condicio-nes en la Frontera. Prentice Hall, 2000.

J.M. Gallardo. Ecuaciones Diferenciales Ordinarias. Una Introducción con Sage. 2001.www.sagemath.org/library-publications.html#books

F. Hecht. FreeFem++. http://www.freefem.org/ff++/ftp/freefem++doc.pdf

D. Kincaid, W. Cheney. Análisis Numérico. Adisson-Wesley, 1994.

M.L. Krasnov, A.I. Kiseliov, G.I. Makárenko. Ecuaciones Diferenciales Ordinarias. URSS,2005.

J.H. Mathews, K.D. Fink. Métodos Numéricos con Matlab. Prentice-Hall, 2005.

R.K. Nagel, E.B. Saff, A.D. Snider. Ecuaciones Diferenciales y Problemas con Valores en laFrontera. Pearson, 2002.

J.H. Saiac. Méthode des Éléments Finis. Analyse Numérique des Équations aux Dérivées Partie-lles. http://www.cnam.fr/maths/Membres/saiac/polyB4.pdf

G.F. Simmons, S.G. Krantz. Ecuaciones Diferenciales. Teoría y Práctica. McGraw-Hill, 2007.

M.B. Spiegel. Probabilidad y Estadística. McGraw-Hill, 2010.

The Sage Development Team. Sage Tutorial. http://www.sagemath.org/pdf/SageTutorial.pdf.