aufgabensammlung zur dynamischen optimierung“ · pdf filel¨osung: normalform: max f...

31
Aufgabensammlung zur Dynamischen Optimierung“ K.H. Schild 1. Kuhn/Tucker-Theorie Aufgabe KT.1a: Minimiere f (x, y)= x 2 +2y unter den Nebenbeding.en x 2 + y 2 4, y 0 osung: Normalform: max f (x, y) := -x 2 - 2y u. d. Nbdg. g 1 (x, y) := x 2 + y 2 4 g 2 (x, y) := -y 0 Lagrange-Funktion samt Ableitungen: L(x, y) = -x 2 - 2y - λ 1 (x 2 + y 2 )+ λ 2 y L x (x, y) = -2x - 2λ 1 x L y (x, y) = -2 - 2λ 1 y + λ 2 Kuhn-Tucker-Bedingungen: i. -2x - 2λ 1 x =0 ii. -2 - 2λ 1 y + λ 2 =0 iii. λ 1 0, x 2 + y 2 4, λ 1 · (x 2 + y 2 - 4) = 0 iv. λ 2 0, y 0, λ 2 · y =0 Fall 1: Beide Restriktionen binden : x 2 + y 2 = 4, y =0 [Prinzipiell: 4 Gleichungen (i., ii., NB1, NB2) in 4 Unbekannten (x, y, λ 1 2 ) osen, schauen ob verbleibende zwei Ungln., also λ 1 0, λ 2 0, erf¨ ullt sind. Allg.: Erst die NB-Gln. l¨ osen (ergibt hier y = 0, x = ±2), in i.,ii. einsetzen u. nach λ 1 , λ 2 aufl¨ osen.] Die beiden Restriktionen implizieren y = 0, x = ±2. Sowohl x = +2 als auch x = -2 eingesetzt in i. ergibt λ 1 = -1 < 0, im Widerspr. zu iii. Der Fall liefert keinen KT-Punkt. Fall 2: Restr. 1 bindet, Restr. 2 nicht : x 2 + y 2 = 4, y> 0(λ 2 = 0) [Prinzipiell: 3 Gleichungen (i., ii., NB1) in 3 Unbekannten (x, y, λ 1 ) osen, schauen ob verbleibende zwei Ungln. (λ 1 0, NB2: y 0) erf¨ ullt sind.] Mit λ 2 = 0 bleiben (neben den Ungln. y 0, λ 1 0) 3 Gleichungen in 3 Unbekannten: i. -2x - 2λ 1 x =0 ( ⇐⇒ -2x (1 - λ 1 )=0 ⇐⇒ (x = 0) (λ 1 = -1)) ii. -2 - 2λ 1 y =0 ⇐⇒ λ 1 y = -1 NB1: x 2 + y 2 =4 Da λ 1 = -1 auszuschließen ist, impliziert i.: x = 0, was mit x 2 + y 2 = 4 auf y = ±2 f¨ uhrt. Wegen y> 0 bleibt nur y = +2. Dabei entsteht λ 1 = -1/2 < 0 in ii. Kein KT-Punkt. Fall 3: Restr. 2 bindet, Restr. 1 nicht : x 2 + y 2 < 4, y =0(λ 1 = 0) [Prinzipiell: 3 Gleichungen (i., ii., NB2) in 3 Unbekannten (x, y, λ 2 ) osen, schauen ob verbleibende zwei Ungln. λ 2 0, NB1: x 2 + y 2 4 erf¨ ullt sind.] Mit λ 1 = 0 wird ii. zu λ 2 = 2. Aus i. ergibt sich wieder x = 0. In x = y = 0, λ 2 =21 =0 sind alle KT-Bedingungen erf¨ ullt. Fall liefert KT-Punkt (x =0,y =01 =02 = 2) Fall 4: Keine der Restriktionen bindet : x 2 + y 2 < 4, y> 0(λ 1 = λ 2 = 0) [Prinzipiell: 2 Gleichungen (i., ii.) in 2 Unbekannten (x, y) osen, schauen ob verbleibende zwei Ungln., NB1: x 2 + y 2 4 und NB2: y 0 erf¨ ullt sind. Effektiv behandelt man in diesem Fall das unrestring. Problem und pr¨ uft, ob die NBen erf¨ ullt sind] Mit λ 1 = λ 2 = 0 wird ii. zu -2 = 0. Fall liefert keinen Kuhn-Tucker-Punkt. Hier gibt es also nur den Kuhn-Tucker-Punkt: (x =0,y = 0). Da die negative Zielfkt -f konkav ist, die Restriktionen g 1 ,g 2 konvex sind, befinden wir uns im ‘richtigen’ Konvexit¨ atsszenario, d.h. die hinr. Bed. des zweiten Satzes ist erf¨ ullt. Fazit: (x =0,y = 0) ist die L¨ osung des Problems. Anmerkung: Bei diesem Problem ist Gl. i. ¨ aquivalent zu 2x (1+ λ 1 ) = 0, d.h. x =0 λ 1 = -1. Da λ 1 = -1 ausgeschlossen ist, kann es von vorneherein nur KT-Punkte mit x = 0 geben.

Upload: vuongkhue

Post on 06-Feb-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabensammlung zur”Dynamischen Optimierung“

K.H. Schild

1. Kuhn/Tucker-Theorie

Aufgabe KT.1a: Minimiere f(x, y) = x2 + 2y unter den Nebenbeding.en x2 + y2 ≤ 4, y ≥ 0

Losung: Normalform: max f(x, y) := −x2 − 2y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 4g2(x, y) := −y ≤ 0

Lagrange-Funktion samt Ableitungen:L(x, y) = −x2 − 2y − λ1 (x2 + y2) + λ2 y

L′x(x, y) = −2x− 2λ1 x

L′y(x, y) = −2− 2λ1 y + λ2

Kuhn-Tucker-Bedingungen:i. −2x− 2λ1 x = 0ii. −2− 2λ1 y + λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 4, λ1 · (x2 + y2 − 4) = 0iv. λ2 ≥ 0, y ≥ 0, λ2 · y = 0

Fall 1: Beide Restriktionen binden: x2 + y2 = 4, y = 0[Prinzipiell: 4 Gleichungen (i., ii., NB1, NB2) in 4 Unbekannten (x, y, λ1, λ2)→ losen, schauen ob verbleibende zwei Ungln., also λ1 ≥ 0, λ2 ≥ 0, erfullt sind.Allg.: Erst die NB-Gln. losen (ergibt hier y = 0, x = ±2), in i.,ii. einsetzen u. nach λ1, λ2 auflosen.]Die beiden Restriktionen implizieren y = 0, x = ±2. Sowohl x = +2 als auch x = −2eingesetzt in i. ergibt λ1 = −1 < 0, im Widerspr. zu iii. Der Fall liefert keinen KT-Punkt.

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 4, y > 0 (⇒ λ2 = 0)[Prinzipiell: 3 Gleichungen (i., ii., NB1) in 3 Unbekannten (x, y, λ1)→ losen, schauen ob verbleibende zwei Ungln. (λ1 ≥ 0, NB2: y ≥ 0) erfullt sind.]

Mit λ2 = 0 bleiben (neben den Ungln. y ≥ 0, λ1 ≥ 0) 3 Gleichungen in 3 Unbekannten:i. −2x− 2λ1 x = 0 (⇐⇒ −2x (1− λ1) = 0 ⇐⇒ (x = 0) ∨ (λ1 = −1))ii. −2− 2λ1 y = 0 ⇐⇒ λ1 y = −1

NB1: x2 + y2 = 4Da λ1 = −1 auszuschließen ist, impliziert i.: x = 0, was mit x2 + y2 = 4 auf y = ±2 fuhrt.Wegen y > 0 bleibt nur y = +2. Dabei entsteht λ1 = −1/2 < 0 in ii. ⇒ Kein KT-Punkt.

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 4, y = 0 (⇒ λ1 = 0)[Prinzipiell: 3 Gleichungen (i., ii., NB2) in 3 Unbekannten (x, y, λ2)→ losen, schauen ob verbleibende zwei Ungln. λ2 ≥ 0, NB1: x2 + y2 ≤ 4 erfullt sind.]

Mit λ1 = 0 wird ii. zu λ2 = 2. Aus i. ergibt sich wieder x = 0. In x = y = 0, λ2 = 2, λ1 = 0sind alle KT-Bedingungen erfullt. Fall liefert KT-Punkt (x = 0, y = 0, λ1 = 0, λ2 = 2)

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 4, y > 0 (⇒ λ1 = λ2 = 0)[Prinzipiell: 2 Gleichungen (i., ii.) in 2 Unbekannten (x, y)→ losen, schauen ob verbleibende zwei Ungln., NB1: x2 + y2 ≤ 4 und NB2: y ≥ 0 erfullt sind.Effektiv behandelt man in diesem Fall das unrestring. Problem und pruft, ob die NBen erfullt sind]

Mit λ1 = λ2 = 0 wird ii. zu −2 = 0. Fall liefert keinen Kuhn-Tucker-Punkt.

Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0, y = 0). Da die negative Zielfkt −f konkavist, die Restriktionen g1, g2 konvex sind, befinden wir uns im ‘richtigen’ Konvexitatsszenario, d.h.die hinr. Bed. des zweiten Satzes ist erfullt. Fazit: (x = 0, y = 0) ist die Losung des Problems.Anmerkung: Bei diesem Problem ist Gl. i. aquivalent zu 2x (1+λ1) = 0, d.h. x = 0 ∨ λ1 = −1.Da λ1 = −1 ausgeschlossen ist, kann es von vorneherein nur KT-Punkte mit x = 0 geben.

Page 2: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe KT.1b: Maximiere f(x, y) = x2 + 2y unter den Nebenbeding.en x2 + y2 ≤ 4, y ≥ 0

Losung: Normalform: max f(x, y) := x2 + 2y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 4g2(x, y) := −y ≤ 0

Lagrange-Funktion samt Ableitungen:

L(x, y) = x2 + 2y − λ1 (x2 + y2) + λ2 y

L′x(x, y) = 2x− 2λ1 x

L′y(x, y) = 2− 2λ1 y + λ2

Kuhn-Tucker-Bedingungen:

i. 2x− 2λ1 x = 0ii. 2− 2λ1 y + λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 4, λ1 · (x2 + y2 − 4) = 0iv. λ2 ≥ 0, y ≥ 0, λ2 · y = 0

Fall 1: Beide Restriktionen binden: x2 + y2 = 4, y = 0[Prinzipiell: 4 Gleichungen (i., ii., NB1, NB2) in 4 Unbekannten (x, y, λ1, λ2)→ losen, schauen ob verbleibende zwei Ungln., also λ1 ≥ 0, λ2 ≥ 0, erfullt sind.Allg.: Erst die NB-Gln. losen (ergibt hier y = 0, x = ±2), in i.,ii. einsetzen u. nach λ1, λ2 auflosen.]

Wenn y = 0 in ii., dann ist λ2 = −2 < 0 ⇒ Fall liefert keinen KT-Punkt.

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 4, y > 0 (⇒ λ2 = 0)[Prinzipiell: 3 Gleichungen (i., ii., NB1) in 3 Unbekannten (x, y, λ1)→ losen, schauen ob verbleibende zwei Ungln. (λ1 ≥ 0, NB2: y ≥ 0) erfullt sind.]

Mit λ2 = 0 bleiben (neben den Ungln. y ≥ 0, λ1 ≥ 0) 3 Gleichungen in 3 Unbekannten:

i. 2x− 2λ1 x = 0 (⇐⇒ 2x (1− λ1) = 0 ⇐⇒ (x = 0) ∨ (λ1 = 1))ii. 2− 2λ1 y = 0 ⇐⇒ λ1 y = 1iii. x2 + y2 = 4

Aus i. folgt x = 0 oder λ1 = 1

Fall x = 0: Aus iii. folgt: y2 = 4, also y = +2 oder y = −2. y = −2 scheidet wg. y ≥ 0 aus.Wenn y = +2, dann folgt aus ii.: λ1 = 1

2 . Liefert KT-Punkt (x = 0, y = 2, λ1 = 12 , λ2 = 0)

Fall λ1 = 1: Aus ii. folgt y = 1. Aus iii. folgt x = ±√

3.Liefert zwei weitere KT-Punkte (x = ±

√3, y = 1, λ1 = 1, λ2 = 0)

Insgesamt liefert dieser Fall drei KT-Punkte (potentielle Losungen).

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 4, y = 0 (⇒ λ1 = 0)[Prinzipiell: 3 Gleichungen (i., ii., NB2) in 3 Unbekannten (x, y, λ2)→ losen, schauen ob verbleibende zwei Ungln. λ2 ≥ 0, NB1: x2 + y2 ≤ 4 erfullt sind.]

Mit λ1 = 0 wird ii. zu λ2 = −2 ⇒ Fall liefert keinen Kuhn-Tucker-Punkt

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 4, y > 0 (⇒ λ1 = λ2 = 0)[Prinzipiell: 2 Gleichungen (i., ii.) in 2 Unbekannten (x, y)→ losen, schauen ob verbleibende zwei Ungln., NB1: x2 + y2 ≤ 4 und NB2: y ≥ 0 erfullt sind.Effektiv behandelt man in diesem Fall das unrestring. Problem und pruft, ob die NBen erfullt sind]

Mit λ1 = λ2 = 0 wird ii. zu 2 = 0. Fall liefert keinen Kuhn-Tucker-Punkt.

2

Page 3: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Insgesamt gibt es also die drei Kuhn-Tucker-Punkte: (x = ±√

3, y = 1) und (x = 0, y = 2). (Alledrei stammen hier aus Fall 2, d.h. sie liegen auf dem Rand des Kreises x2 + y2 = 4 mit y > 0).Die Zielfkt f(x, y) = x2 + 2y nimmt in ihnen folgende Werte an:

f(±√

3, 1) = 3 + 2 · 1 = 5f(0, 2) = 0 + 4 = 4.

Fur die Klausur reicht es aus zu sagen: Die einzigen Losungskandidaten sind die beiden Punkte(x = ±

√3, y = 1).

Problem dabei ist: Bei dieser Aufgabe stellen die KT-Bedingungen keine hinreichenden Bedin-gungen fur die Losung dar, da wir uns nicht im ‘richtigen’ Konvexitatsszenario (Zielfunktion fkonkav, Restriktionsfunktionen gj konvex) befinden: Die Zielfkt. ist konvex, nicht konkav. Stren-gennommen mussen fur die Anwendung der KT-Bedingung (außerhalb des Konvexitatsszenarios)auch noch die Punkte, die die Qualifikationsbed. nicht erfullen, ermittelt und als Losungskan-didaten in Betracht gezogen werden. Eine entsprechende, hier nicht vorgefuhrte Analyse (aufBasis der gleichen Fallunterscheidung) zeigt, dass es keine Punkte mit Verletzung der Qualifika-tionsbed. gibt. Außerdem muss sichergestellt sein, dass das vorliegende Problem uberhaupt eineLosung hat (da der Satz sich sonst auf die leere Menge bezieht). Ein beruhmter Satz aus derMathematik besagt, dass eine auf einer kompakten (=beschrankten und abgeschlossenen) Men-ge stetige Fkt dort ihr Max. annimmt. Da der (abgeschlossene) Halbkreis kompakt ist, existierteine Losung. Das Problem hat daher (genau) die beiden Losungen (x = ±

√3, y = 1). �

Aufg. KT.2a Maximiere f(x, y) = x · y unter den Nebenbedingungen x2 + y2 ≤ 2, x + y ≤ 1

Normalform: max f(x, y) := x y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 2g2(x, y) := x + y ≤ 1

Lagrange-Funktion samt Ableitungen:

L(x, y) = x · y − λ1 (x2 + y2)− λ2 (x + y)L′x(x, y) = y − 2λ1 x− λ2

L′y(x, y) = x− 2λ1 y − λ2

Kuhn-Tucker-Bedingungen:

i. y − 2λ1 x− λ2 = 0ii. x− 2λ1 y − λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 2, λ1 · (x2 + y2 − 2) = 0iv. λ2 ≥ 0, x + y ≤ 1, λ2 · (x + y − 1) = 0

3

Page 4: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Fall 1: Beide Restriktionen binden: x2 + y2 = 2, x + y = 1

Man konnte anfangen mit x2 + y2 = 2, x + y = 1 ⇒ x = .., y = ... Aber besser erst:

Subtrahiere ii. von i.:

y − x− 2λ1(x− y) = 0 ⇐⇒ (1 + 2 λ1) · (y − x) = 0 ⇐⇒ λ1 = −12 ∨ y = x

Da λ1 < 0 ausgeschlossen, gilt immer y = x (auch in den anderen Fallen!)

Jetzt x2 + y2 = 2, x + y = 1:

Mit y = x ergibt das einerseits 2x2 = 2 ⇒ x = ±1, andererseits 2x = 1 ⇒ x = 12

Fall liefert also keinen KT-Punkt

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 2, x + y < 1 (⇒ λ2 = 0)

Auch hier gilt x = y. Mit x2 + y2 = 2 folgt x = ±1 = y. Die NB x + y < 1 ist aber nur furx = y = −1 erfullt. Bei x = y = −1 reduziert sich i. auf −1 + 2λ1 = 0, also λ1 = 1

2 ≥ 0.

Da auch ii. erfullt ist, liefert der Fall den KT-Punkt (x = −1, y = −1, λ1 = 12 , λ2 = 0) .

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 2, x + y = 1 (⇒ λ1 = 0)

Mit x = y und x+y = 1 folgt x = y = 12 . Einsetzen in i. liefert 1

2−λ2 = 0, also λ2 = 12 ≥ 0.

Auch ii. und die NB x2 + y2 = 14 + 1

4 = 12 ≤ 2 ist erfullt.

Fall liefert KT-Punkt (x = 12 , y = 1

2 , λ1 = 0, λ2 = 12)

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 2, x + y < 1 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird i. zu y = 0, ii. zu x = 0. Bei x = y = 0 sind auch die NBenx2 + y2 < 2 und x + y < 1 erfullt.

Der Fall liefert also den KT-Punkt (x = 0, y = 0, λ1 = 0, λ2 = 0) .

Anmerkung: Der Nullpunkt (x = 0, y = 0) ist offensichtlich keine Maximalstelle vonf(x, y) = x y, aber die KT-Bedingungen sind ja auch nur notwendige Bedingungen.

Insgesamt gibt es hier die drei Kuhn-Tucker-Punkte ausFall 2 (x = y = −1) mit Zielfunktionswert f(−1,−1) = +1,Fall 3 (x = y = 1

2) mit Zielfunktionswert f(12 , 1

2) = 14 und

Fall 4 (x = y = 0) mit Zielfunktionswert f(0, 0) = 0Da die Zielfkt in x = y = −1 den großten Wert annimmt, ist dies der verbleibende Losungskan-didat.

Problem ist wieder, dass bei dieser Aufgabe die KT-Bedingungen keine hinreichenden Bedingungen furdie Losung darstellen, da wir uns nicht im ‘richtigen’ Konvexitatsszenario (Zielfunktion f konkav, Re-striktionsfunktionen gj konvex) befinden: Die Zielfkt. ist nicht konkav (auch nicht konvex). Strengennom-men mussen fur die Anwendung der KT-Bedingung (außerhalb des Konvexitatsszenarios) auch noch diePunkte, die die Qualifikationsbed. nicht erfullen, ermittelt und als Losungskandidaten in Betracht gezo-gen werden. Bei diesem Beispiel ist sie fur alle (x, y) mit x = y verletzt (∇g1 || ∇g2). Der Maximalwertwird aber auch bei Hinzunahme dieser Punkte weiterhin in x = −1, y = −1 angenommen. Da wir aufeiner kompakten Menge maximieren und eine stetige Funktion dort ihr Maximum annimmt, existiert eineLosung.Fazit: Das Problem hat (genau) die Losung (x = −1, y = −1).

4

Page 5: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufg. KT.2b Maximiere f(x, y) = x · y + x + y unter den Nebenbed. x2 + y2 ≤ 2, x + y ≤ 1

Normalform: max f(x, y) := xy + x + y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 2g2(x, y) := x + y ≤ 1

Lagrange-Funktion samt Ableitungen:

L(x, y) = x · y + x + y − λ1 (x2 + y2)− λ2 (x + y)L′x(x, y) = y + 1− 2λ1 x− λ2

L′y(x, y) = x + 1− 2λ1 y − λ2

Kuhn-Tucker-Bedingungen:

i. y + 1− 2λ1 x− λ2 = 0ii. x + 1− 2λ1 y − λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 2, λ1 · (x2 + y2 − 2) = 0iv. λ2 ≥ 0, x + y ≤ 1, λ2 · (x + y − 1) = 0

Fall 1: Beide Restriktionen binden: x2 + y2 = 2, x + y = 1

Man konnte anfangen mit x2 + y2 = 2, x + y = 1 ⇒ x = .., y = ... usw. Aber besser erst:

Subtrahiere ii. von i.:

y − x− 2λ1(x− y) = 0 ⇐⇒ (1 + 2 λ1) · (y − x) = 0 ⇐⇒ λ1 = −12 ∨ y = x

Da λ1 < 0 ausgeschlossen, gilt immer y = x (auch in den anderen Fallen!)

Jetzt x2 + y2 = 2, x + y = 1:

Mit y = x ergibt das einerseits 2x2 = 2 ⇒ x = ±1, andererseits 2x = 1 ⇒ x = 12

Fall liefert also keinen KT-Punkt

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 2, x + y < 1 (⇒ λ2 = 0)

Auch hier gilt x = y. Mit x2 + y2 = 2 folgt x = ±1 = y. Die NB x + y < 1 ist aber nur furx = y = −1 erfullt. Bei x = y = −1 reduziert sich i. auf −1+1+2 λ1 = 0, also λ1 = 0 ≥ 0.

Es bleibt nur (x = −1, y = −1, λ1 = 0, λ2 = 0) . Das ist tatsachlich ein KT-Punkt

Anmerkung: Hier tritt die Situation ”λ1 = 0, obwohl die 1. Restr. bindet“ auf.

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 2, x + y = 1 (⇒ λ1 = 0)

Mit x = y und x+y = 1 folgt x = y = 12 . Einsetzen in i. liefert 1

2 +1−λ2 = 0, also λ2 = 32 .

Auch ii. und die NB x2 + y2 = 14 + 1

4 = 12 ≤ 2 sind erfullt.

Fall liefert KT-Punkt x = 12 , y = 1

2 , λ1 = 0, λ2 = 32

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 2, x + y < 1 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird i. zu y = −1, ii. zu x = −1. Das liefert genau den KT-Punkt ausFall 2 (der hier aber eigentlich x2 + y2 < 2 verletzt, weil namlich x2 + y2 = 2.)Der Fall liefert also eigentlich keinen (neuen) KT-Punkt

Insgesamt gibt es also die beiden Kuhn-Tucker-Punkte aus Fall 2 (x = y = −1) und Fall 3(x = y = 1

2). Die Zielfkt f(x, y) = xy + x + y nimmt in ihnen folgende Werte an:

f(−1,−1) = 1− 1− 1 = −1f(

12 , 1

2

)= 1

4 + 12 + 1

2 = 54 .

Der einzige Losungskandidat ist somit (x = 12 , y = 1

2).

5

Page 6: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufg. KT.3a Maximiere x2 + y u. d. Nebenbed. x2 + y2 ≤ 1, y ≥ x

Losung:

Normalform: max f(x, y) := x2 + y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 1g2(x, y) := x− y ≤ 0

Lagrange-Funktion samt Ableitungen:

L(x, y) = x2 + y − λ1(x2 + y2)− λ2 (x− y)L′x(x, y) = 2x− 2λ1 x− λ2

L′y(x, y) = 1− 2λ1 y + λ2

Kuhn-Tucker-Bedingungen:i. 2x− 2λ1 x− λ2 = 0ii. 1− 2λ1 y + λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 1, λ1 · (x2 + y2 − 1) = 0iv. λ2 ≥ 0, y ≥ x, λ2 · (y − x) = 0

Fall 1: Beide Restriktionen binden: x2 + y2 = 1, y = x

Mit y = x in x2 + y2 = 1 ergibt sich 2x2 = 1 ⇒ x = ± 1√2

= ±√

22 = y.

Fall x = y = +√

22 : Setzt man dies in i. u. ii. ein, entsteht folgendes lin. Gl.System fur λ1, λ2:√

2− λ1

√2− λ2 = 0 ⇐⇒

√2 λ1 + λ2 =

√2

1− λ1

√2 + λ2 = 0 ⇐⇒

√2 λ1 − λ2 = 1

Addition bzw. Subtraktion der beiden Gln. liefert λ1 = 12

(1 + 1√

2

)bzw. λ2 = 1

2(√

2− 1).

Da λ1 ≥ 0, λ2 ≥ 0: KT-Punkt(x =

√2

2 , y =√

22 , λ1 = 1

2

(1 + 1√

2

), λ2 = 1

2(√

2− 1))

Fall x = y = −√

22 : Setzt man dies in i. u. ii. ein, entsteht folgendes lin. Gl.System fur λ1, λ2:

−√

2 + λ1

√2− λ2 = 0 ⇐⇒

√2 λ1 − λ2 =

√2

1 + λ1

√2 + λ2 = 0 ⇐⇒

√2 λ1 + λ2 = 1

Subtraktion der beiden Gln. liefert λ2 = 12

(1−√

2)

< 0. Also kein weiterer KT-Punkt.

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 1, y > x (⇒ λ2 = 0)Mit λ2 = 0 werden die beiden Lagrange-Gln. zu:

i. 2x− 2λ1 x = 0 ⇐⇒ x = 0 ∨ λ1 = 1ii. 1− 2λ1 y = 0

Fall x = 0: Aus x2 + y2 = 1 und y > x folgt y = 1. Damit in ii.: 1− 2λ1 = 0 ergibt λ1 = 12 .

Da λ1 ≥ 0: KT-Punkt(x = 0, y = 1, λ1 = 1

2 , λ2 = 0).

Fall λ1 = 1: Dann wird ii. zu 1− 2y = 0, also y = 12 . Damit in x2 + y2 = 1 ergibt x2 = 3

4 ,

also x = ±√

32 . Wegen y > x: Nur ein KT-Punkt

(x = −

√3

2 , y = 12 , λ1 = 1, λ2 = 0

).

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 1, y = x (⇒ λ1 = 0)Mit λ1 = 0 wird ii. zu λ2 = −1 < 0. Fall liefert keinen KT-Punkt.

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 1, y > x (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird ii. zu 1 = 0. Fall liefert keinen KT-Punkt.

Die Funktionswerte in den drei KT-Punkten sind:

f(√

22 ,

√2

2

)= 1

2 +√

22 , f(0, 1) = 0 + 1 = 1, f

(−

√3

2 , 12

)= 3

4 + 12 = 5

4

Da√

2 < 34 , ist f

(√2

2 ,√

22

)< f

(−

√3

2 , 12

). Daher kommt nur

(x = −

√3

2 , y = 12

)als Losung in

Frage (Qual.Bed. außen vor). Aus dem Satz von Weierstraß folgt die Existenz einer Losung.Fazit: Der KT-Punkt

(−

√3

2 , 12

)realisiert das globale Maximum von f (Qual.Bed außen vor).

Anm: Zielfkt. hier wieder konvex, nicht konkav; die hinreich. Bed. ist daher nicht anwendbar.

6

Page 7: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufg. KT.3b Maximiere x2 + y u. d. Nebenbed. x2 + y2 ≤ 1, y ≥ 12x

Losung:

Normalform: max f(x, y) := x2 + y u. d. Nbdg.{

g1(x, y) := x2 + y2 ≤ 1g2(x, y) := 1

2x− y ≤ 0Lagrange-Funktion samt Ableitungen:

L(x, y) = x2 + y − λ1(x2 + y2)− λ2 (x/2− y)L′x(x, y) = 2x− 2λ1 x− λ2/2L′y(x, y) = 1− 2λ1 y + λ2

Kuhn-Tucker-Bedingungen:i. 2x− 2λ1 x− λ2/2 = 0ii. 1− 2λ1 y + λ2 = 0iii. λ1 ≥ 0, x2 + y2 ≤ 1, λ1 · (x2 + y2 − 1) = 0iv. λ2 ≥ 0, y ≥ x/2, λ2 · (y − x/2) = 0

Fall 1: Beide Restriktionen binden: x2 + y2 = 1, y = x/2Mit y = 1

2x in x2 + y2 = 1 ergibt sich 54x2 = 1 ⇒ x = ± 2√

5, y = ± 1√

5

Fall x = 2y = + 2√5: Setzt man dies in i. u. ii. ein, entsteht folgendes lin. Gl.Syst. fur λ1, λ2:

4√5− 4√

5λ1 − 1

2λ2 = 0 ⇐⇒ 1 = λ1 +√

58 λ2

1− 2√5λ1 + λ2 = 0 ⇐⇒

√5

2 = λ1 −√

52 λ2

Subtraktion der beiden Gln. ergibt: λ2 = −(√

52 − 1

)/(√5

2 +√

58

). Da

√5 >√

4 = 2, wareλ2 < 0. Es entsteht daher kein KT-Punkt.

Fall x = 2y = − 2√5: Setzt man dies in i. u. ii. ein, entsteht folgendes lin. Gl.Syst. fur λ1, λ2:

− 4√5

+ 4√5λ1 − 1

2λ2 = 0 ⇐⇒ λ1 −√

58 λ2 = 1

1 + 2√5λ1 + λ2 = 0 ⇐⇒ λ1 +

√5

2 λ2 = −√

52

Subtraktion der beiden Gln. ergibt: λ2 =(−

√5

2 − 1)/(√

52 +

√5

8

). Da somit wiederum

λ2 < 0 ware, entsteht kein KT-Punkt.

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y2 = 1, y > x/2 (⇒ λ2 = 0)Mit λ2 = 0 werden die beiden Lagrange-Gln. zu:

i. 2x− 2λ1 x = 0 ⇐⇒ x = 0 ∨ λ1 = 1ii. 1− 2λ1 y = 0

Fall x = 0: Aus x2 + y2 = 1 und y > x/2 folgt y = 1. Damit in ii.: 1 − 2λ1 = 0 ergibtλ1 = 1

2 . Da λ1 ≥ 0: KT-Punkt(x = 0, y = 1, λ1 = 1

2 , λ2 = 0).

Fall λ1 = 1: Dann wird ii. zu 1−2y = 0, also y = 12 . Damit in x2+y2 = 1 ergibt x2 = 3

4 , also

x = ±√

32 . Da bei beiden y > x/2: Zwei KT-Punkte

(x = ±

√3

2 , y = 12 , λ1 = 1, λ2 = 0

).

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y2 < 1, y = x/2 (⇒ λ1 = 0)Mit λ1 = 0 wird ii. zu λ2 = −1 < 0. Fall liefert keinen KT-Punkt.

Fall 4: Keine der Restriktionen bindet: x2 + y2 < 1, y > x (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird ii. zu 1 = 0. Fall liefert keinen KT-Punkt.

Die Funktionswerte in den drei KT-Punkten sind:

f(0, 1) = 0 + 1 = 1, f(±

√3

2 , 12

)= 3

4 + 12 = 5

4

Da 1 < 54 , kommen nur

(x = ±

√3

2 , y = 12

)als Losung in Frage (Qual.Bed. außen vor). Aus dem

Satz von Weierstraß folgt die Existenz (aber nicht unbedingt die Eindeutigkeit) einer Losung.Fazit: Das globale Max. von f wird in den Punkten

(±√

32 , 1

2

)realisiert (sofern Qual.Bed. erf.).

Anm: Zielfkt. hier wieder konvex, nicht konkav; die hinreich. Bed. ist daher nicht anwendbar.

7

Page 8: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufg. KT.4a Minimiere x3 + y2 − 27x− 4y u. d. Nebenbed. x ≥ 0, y ≥ 0

Losung:

Normalform: max f(x, y) := −x3 − y2 + 27x + 4y u. d. Nbdg.{

g1(x, y) := −x ≤ 0g2(x, y) := −y ≤ 0

Lagrange-Funktion samt Ableitungen:

L(x, y) = −x3 − y2 + 27x + 4y + λ1 x + λ2 y

L′x(x, y) = −3x2 + 27 + λ1

L′y(x, y) = −2y + 4 + λ2

Kuhn-Tucker-Bedingungen:

i. −3x2 + 27 + λ1 = 0ii. −2y + 4 + λ2 = 0iii. λ1 ≥ 0, x ≥ 0, λ1 · x = 0iv. λ2 ≥ 0, y ≥ 0, λ2 · y = 0

Fall 1: Beide Restriktionen binden: x = 0, y = 0

Wenn x = 0, folgt aus i.: λ1 = −27 < 0 (und auch: Wenn y = 0, folgt aus ii.: λ2 = −4 < 0).

Fall liefert keinen KT-Punkt

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x = 0, y > 0 (⇒ λ2 = 0)

Wenn x = 0, folgt aus i.: λ1 = −27 < 0. (Aber kein Problem mit λ2 = 0 in ii.: y = 2 > 0)

Fall liefert keinen KT-Punkt

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x > 0, y = 0 (⇒ λ1 = 0)

Wenn y = 0, folgt aus ii.: λ2 = −4 < 0. (Aber kein Problem mit λ1 = 0 in ii.: x2 = 9, alsox = +3).

Fall liefert keinen KT-Punkt

Fall 4: Keine der Restriktionen bindet: x > 0, y > 0 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird i. zu x2 = 9, ii. zu y = 2.

Fall liefert KT-Punkt x = 3, y = 2, λ1 = 0, λ2 = 0

Einziger Losungskandidat ist somit der KT-Punkt aus Fall 4. Dass es sich dabei tatsachlich umdie Losung des Problems handelt, folgt daraus, dass die Zielfunktion f(x, y) = −x3−y2+27x+4ykonkav auf dem zulassigen Bereich {x > 0, y > 0} ist. Denn die Hesse-Matrix

Hf (x, y) =(−6x 0

0 −2

)ist offensichtlich fur x ≥ 0 eine negativ definite Matrix.

8

Page 9: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufg. KT.4b Maximiere f(x, y) = x3 + y2 − 27x− 4y u. d. Nebenbed. x ≥ 0, y ≥ 0

Losung:

Normalform: max f(x, y) := x3 + y2 − 27x− 4y u. d. Nbdg.{

g1(x, y) := −x ≤ 0g2(x, y) := −y ≤ 0

Lagrange-Funktion samt Ableitungen:

L(x, y) = x3 + y2 − 27x− 4y + λ1 x + λ2 y

L′x(x, y) = 3x2 − 27 + λ1

L′y(x, y) = 2y − 4 + λ2

Kuhn-Tucker-Bedingungen:

i. 3x2 − 27 + λ1 = 0ii. 2y − 4 + λ2 = 0iii. λ1 ≥ 0, x ≥ 0, λ1 · x = 0iv. λ2 ≥ 0, y ≥ 0, λ2 · y = 0

Fall 1: Beide Restriktionen binden: x = 0, y = 0

Wenn x = 0, folgt aus i.: λ1 = 27 ≥ 0. Wenn y = 0, folgt aus ii.: λ2 = 4 ≥ 0

Fall liefert KT-Punkt x = 0, y = 0, λ1 = 27, λ2 = 4 mit Fkts.wert f(0, 0) = 0

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x = 0, y > 0 (⇒ λ2 = 0)

Wenn x = 0, folgt aus i.: λ1 = 27 ≥ 0. Wenn λ2 = 0, folgt aus ii.: y = 2 > 0

Fall liefert KT-Punkt x = 0, y = 2, λ1 = 27, λ2 = 0 mit Fkts.wert f(0, 2) = 4− 8 = −4

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x > 0, y = 0 (⇒ λ1 = 0)

Wenn y = 0, folgt aus ii.: λ2 = 4 ≥ 0. Wenn λ1 = 0, folgt aus i.: x2 = 9, also x = ±3. DieNebenBed. x > 0 schließt x = −3 aus.

Fall liefert KT-Punkt x = 3, y = 0, λ1 = 0, λ2 = 4 mit Fkts.wert f(3, 0) = 27−27·3 = −54

Fall 4: Keine der Restriktionen bindet: x > 0, y > 0 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 wird i. zu x2 = 9, ii. zu y = 2.

Fall liefert KT-Punkt x = 3, y = 2, λ1 = 0, λ2 = 0 mit Fkts.wert f(3, 2) = 27 + 4 − 27 ·3− 4 · 2 = −54− 4 = −58

Damit ware x = 0, y = 0 der einzige Losungskandidat. Er ist aber nicht die Losung des Problems,denn das Problem hat offensichtlich gar keine Losung (bzw. sie lautet x = +∞ y = +∞).Verruckterweise ist also von den vier KT-Punkten keiner die Losung des Problems. Der KT-Punkt x = 3, y = 2 aus Fall 4 ist ein lokales Minimum im Innern des zulassigen Bereichs.Der KT-Punkt (x = 0, y = 0) aus Fall 1 ist zwar ein lokales Maximum, aber eben nicht dasglobale (dieser Punkt ware die Losung unter den zusatzlichen Restriktionen x ≤ 3, y ≤ 2).Bei den Punkten x = 0, y = 2 und x = 3, y = 0 zeigt zwar der Gradient der Zielfkt. aus demzulassigen Bereich heraus, aber auf den Randgeraden x = 0 bzw. y = 0 stellen diese Punktelokale Minima der Zielfunktion dar, wahrend sie aus dem Innern heraus auf den Geraden y = 2bzw. x = 3 laufend, tatsachlich Randmaxima sind. Das Problem bei diesem Beispiel ist, dassdie zu maximierende Zielfkt. konvex, nicht konkav auf dem zul. Bereich x ≥ 0, y ≥ 0 ist.

9

Page 10: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe KT.5a: Bringen Sie das Problem

min 4 ln(x2 + 2) + y2 u.d.NB. y ≥ 2− x2, x ≥ 1

in Standard-Form und losen Sie das Problem unter der Annahme, dass eine Losung existiert.Zur Kontrolle: Der einzige Kuhn-Tucker-Punkt ist x = 4

√2, y = 2−

√2 (> 0).

Normalform: max f(x, y) := −4 ln(x2 + 2)− y2 u. d. Nbdg.{

g1(x, y) := −x2 − y ≤ −2g2(x, y) := −x ≤ −1

Lagrange-Funktion samt Ableitungen:

L(x, y) = −4 ln(x2 + 2)− y2 + λ1 (x2 + y − 2) + λ2 x

L′x(x, y) = − 8x

x2 + 2+ 2λ1 x + λ2

L′y(x, y) = −2y + λ1

Kuhn-Tucker-Bedingungen: i. − 8x

x2 + 2+ 2λ1 x + λ2 = 0

ii. −2y + λ1 = 0 ← schon einfach: → λ1 = 2y

iii. λ1 ≥ 0, x2 + y ≥ 2, λ1 · (x2 + y − 2) = 0iv. λ2 ≥ 0, x ≥ 1, λ2 · (x− 1) = 0

Fall 1: Beide Restriktionen binden: x2 + y = 2, x = 1

Mit x = 1 folgt zunachst y = 2 − x2 = 2 − 1 = 1. Einsetzen in ii. liefert zwar λ1 = 2y =2 ≥ 0, aber beim Einsetzen in i.: λ2 = 8x

x2+2− 2λ1 x = 8

3 − 2 · 2 = −43 entsteht λ1 < 0. Der

Fall liefert also keinen KT-Punkt.

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y = 2, x > 1 (⇒ λ2 = 0)Prinzipiell: 3 Gleichungen (i., ii., NB1) in 3 Unbekannten (x, y, λ1)→ losen, schauen ob verbleibende Ungln. λ1 ≥ 0, NB2 (x ≤ 1) erfullt sind.

Gleichungen i. und ii. fur λ2 = 0:

i. − 8x

x2 + 2+ 2λ1 x = 0

ii. 2y = λ1

NB1 y = 2− x2

Substituiere λ1 = 2y und y = 2− x2 in i., liefert Gleichung nur noch in x:

− 8x

x2 + 2+ 4(2− x2) x = 0 ⇐⇒ x = 0 ∨ 4 (4− x4) = 8

⇐⇒ x = 0 ∨ 4− x4 = 2⇐⇒ x = 0 ∨ x4 = 2

Da x > 1, bleibt nur x = + 4√

2. Dann y = 2− x2 = 2−√

2 > 0, λ1 = 2y = 4− 2√

2 > 0

Fall liefert KT-Punkt (x = 4√

2, y = 2−√

2, λ1 = 4− 2√

2, λ2 = 0) .

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y > 2, x = 1 (⇒ λ1 = 0)

Mit x = 1 und λ1 = 0 (⇒ y = 0 aus ii) ist die NB x2 +y > 2 verletzt. Also kein KT-Punkt

Anm: kein Widerspruch aus i.: λ2 = 8xx2+2

− 2λ1 x = 83 + 0 = 8

3 ≥ 0.

Fall 4: Keine der Restriktionen bindet: x2 + y > 2, x > 1 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 bilden i. und ii. ein 2× 2- Gl.System in (x, y) (das einer unrestringiertenOptimierung von f)

Hier sehr einfach: ii. ⇒ y = 0 und Einsetzen in i. liefert: − 8xx2+2

= 0 ⇒ x = 0.

D.h. (0, 0) ware Losng des unrestr. Problems. Da x > 1 gefordert: Kein KT-Punkt

Insgesamt gibt es also nur einen Kuhn-Tucker-Punkt (x = 4√

2, y = 2−√

2). Wenn das Problemein Losung hat, kommt nur dieser Punkt in Frage (Qualifikationsbedingung außen vor).

10

Page 11: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe KT.5b: Gegeben das Problem: min 4 ln(x2 + 2)− y2 u.d.NB. y ≥ 2− x2, x ≥ 1Bestimmen Sie samtliche Kuhn-Tucker-Punkte.Zur Kontrolle: Der einzige Kuhn-Tucker-Punkt ist x = 4

√6, y = 2−

√6 < 0.

Normalform: max f(x, y) := −4 ln(x2 + 2) + y2 u. d. Nbdg.{

g1(x, y) := −x2 − y ≤ −2g2(x, y) := −x ≤ −1

Lagrange-Funktion samt Ableitungen:

L(x, y) = −4 ln(x2 + 2) + y2 + λ1 (x2 + y − 2) + λ2 x

L′x(x, y) = − 8x

x2 + 2+ 2λ1 x + λ2

L′y(x, y) = 2y + λ1

Kuhn-Tucker-Bedingungen:i. − 8x

x2 + 2+ 2λ1 x + λ2 = 0

ii. 2y + λ1 = 0 ← schon einfach: → λ1 = −2y

iii. λ1 ≥ 0, x2 + y ≥ 2, λ1 · (x2 + y − 2) = 0iv. λ2 ≥ 0, x ≥ 1, λ2 · (x− 1) = 0

Fall 1: Beide Restriktionen binden: x2 + y = 2, x = 1

Mit x = 1 folgt y = 2− x2 = 2− 1 = 1. Wegen ii.: λ1 = −2y = −2 < 0: Kein KT-Punkt

Fall 2: Restr. 1 bindet, Restr. 2 nicht: x2 + y = 2, x > 1 (⇒ λ2 = 0)Prinzipiell: 3 Gleichungen (i., ii., NB1) in 3 Unbekannten (x, y, λ1)→ losen, schauen ob verbleibende Ungln. λ1 ≥ 0, NB2 (x ≤ 1) erfullt sind.

Mit λ2 = 0 in i. und ii. und NB1 gehen:

i. − 8x

x2 + 2+ 2λ1 x = 0

ii. 2y = −λ1

NB1 y = 2− x2

Substituiere λ1 = −2y und y = 2− x2 in i., liefert Gleichung nur noch in x:

− 8x

x2 + 2− 4(2− x2) x = 0 ⇐⇒ x = 0 ∨ −8− 4 (4− x4) = 0

⇐⇒ x = 0 ∨ 4− x4 = −2⇐⇒ x = 0 ∨ x4 = 6

Da x > 1, bleibt nur x = + 4√

6. Dann y = 2−x2 = 2−√

6 < 0, λ1 = −2y > 0 (da√

6 > 2)

⇒ Fall liefert KT-Punkt (x = 4√

6, y = 2−√

6, λ1 = −4 + 2√

6, λ2 = 0) .

Fall 3: Restr. 2 bindet, Restr. 1 nicht: x2 + y > 2, x = 1 (⇒ λ1 = 0)

Mit x = 1 und λ1 = 0 (⇒ y = 0 aus ii) ist die NB x2 +y > 2 verletzt. Also kein KT-Punkt

Anm: kein Widerspruch aus i.: λ2 = 8xx2+2

− 2λ1 x = 83 + 0 = 8

3 ≥ 0.

Fall 4: Keine der Restriktionen bindet: x2 + y > 2, x > 1 (⇒ λ1 = λ2 = 0)

Mit λ1 = λ2 = 0 bilden i. und ii. ein 2× 2- Gl.System in (x, y) (das einer unrestringiertenOptimierung von f)

Hier sehr einfach: ii. ⇒ y = 0 und Einsetzen in i. liefert: − 8xx2+2

= 0 ⇒ x = 0.

D.h. (0, 0) ware Losng des unrestr. Problems. Da x > 1 gefordert: Kein KT-Punkt

Insgesamt gibt es also nur einen Kuhn-Tucker-Punkt (x = 4√

6, y = 2−√

6). Wenn das Problemein Losung hat, kommt nur dieser Punkt in Frage (Qualifikationsbedingung außen vor).

11

Page 12: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

2. Variationsrechnung

Aufgabe VR.1: Zu losendes Problem min∫ 2

1

x2(t)t3

dt, x(1) = x1, x(2) = x2

Zeige:a) Die Euler-Gl. ist aq. zu: x− 3

t x = 0b) Die allg. Losung der Euler-Gl. ist: x(t) = A tα1+B tα2 mit passenden αi (A,B = const ∈ R).c) Die Losung des Problems ist: x(t) = 1

15

(16 x1 − x2 + (x2 − x1) t4

)d) Wie lautet die Losung des Problems bei freiem x(2) (anstatt x(2) = x2)?

Losung: Zu losendes Problem: min∫ 2

1

x2(t)t3

dt, x(1) = x1, x(2) = x2

Mit f(t, x, x) =x2

t3ergibt sich

∂f

∂x= 0,

∂f

∂x=

2x

t3,

d

dt

(∂f

∂x(t, x, x)

)= 2

d

dt

( x

t3)

= 2x · t3 − x · 3t2

t6= 2

x · t− 3x

t4

Also ist die Eulergleichung ∂f∂x = d

dt∂f∂x aquivalent zu

x− 3t x = 0

Dies ist eine lineare Diffgl. 2-ter Ordn, homogen.Ansatz: x(t) = tα ⇒ x(t) = α tα−1 ⇒ x(t) = α (α− 1) tα−2:

0 = x(t)− 3t x(t) = α (α− 1) tα−2 − 3 α tα−2 =

(α2 − α− 3α

)tα−2

⇐⇒ α2 − 4α = 0 ⇐⇒ α = 0 ∨ α = 4

Allgemeine Losung der DGl somit:x(t) = A + B t4

Randbedingungen: A + B = x1, A + 16 B = x2(1 11 16

)(AB

)=(

x1

x2

)⇐⇒

(AB

)=

116− 1

(16 −1−1 1

)(x1

x2

)=

115

(16 −1−1 1

)(x1

x2

)Also

A = 1615 x1 − 1

15 x2, B = − 115 x1 + 1

15 x2, x(t) = 115

(16 x1 − x2 + (x2 − x1) t4

)Hinreichende Bedingung: Als Funktion von x, x ist f(t, x, x) = x2

t3konvex fur jedes t ∈ [1, 2]:

H ′′x,x =

(0 00 2/t3

)und diese Matrix ist positiv semidefinit (fur t > 0). ⇒ Insbes: Losung existiert, minimierend.In der Klausur reicht es aus zu sagen: Es ist klar, dass f(t, x, x) = x2

t3als Fkt. von x, x konvex ist.

Transversalitatsbedingung fur freies x(t1): (f ′x)|t=t1 = 0.Da ∂f

∂x = 2 x/t3, bedeutet die Transversalitatsbed. hier: x(t1) = 0 (wobei t1 = 2).Da x(t) = 4Bt3, folgt sofort B = 0. Die Losung ist also die Konstante x(t) = A = x1

Dieses Ergebnis hatte man auch ohne Var.Rechnung bekommen konnen: Das Minimum von∫ 21 x2(t)/t3 dt uber x(t) ist Null – es wird erreicht, wenn x(t) = 0, d.h. wenn x(t) konstant ist.

12

Page 13: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe VR.2a: Zu losendes Problem: min∫ T

0e−x(t)−x(t) dt, x(0) = x0, x(T ) = 0.

Zeigen Sie:a) Die Euler-Gl. ist aq. zu: x + x = −1b) Die allg. Losung der Euler-Gl. ist: A + Be−t − t (A,B = const ∈ R).c) Die Losung des Problems ist: x(t) = T−e−T x0

1−e−T + x0−T1−e−T e−t − t

Losung: Bei f(t, x, x) = e−x−x haben wir:

∂f

∂x= −e−x−x,

∂f

∂x= −e−x−x,

d

dt

(∂f

∂x(t, x, x)

)=

d

dt

(− e−x(t)−x(t)

)= +e−x−x ·

(x + x

)|t

Also ist die Eulergleichung ∂f∂x = d

dt∂f∂x aquivalent zu

−e−x−x = +e−x−x · (x + x) ⇐⇒ x + x = −1

Dies ist eine lineare Diffgl. 2-ter Ordn, inhomogen.Ansatz zur Losung der homogenen Gl. x+ x = 0: x(t) = eλt ⇒ x(t) = λ eλt ⇒ x(t) = λ2 eλt:

0 = λ2x(t) + λx(t) = (λ2 + λ) eλt

⇐⇒ λ2 + λ = 0 ⇐⇒ λ = 0 ∨ λ = −1

Als Fundamentallosungen kann man also wahlen: x1(t) = 1, x2(t) = e−t

Als spezielle Losung von x + x = −1 rate x0(t) = −t (⇒ x = −1⇒ x = 0)Allgemeine Losung der inhomogenen DGl somit

x(t) = A x1(t) + B x2(t) + x0(t) = A + B e−t − t

Die Randbedingungen x(0) = x0, x(T ) = 0 fuhren auf das LGS: A + B = x0, A + B e−T = T :(1 11 e−T

)(AB

)=(

x0

T

)⇐⇒

(AB

)=

1e−T − 1

(e−T −1−1 1

)(x0

T

)=

11− e−T

(T − e−T x0

x0 − T

)Also

x(t) = A + B e−t − t =T − e−T x0

1− e−T+

x0 − T

1− e−Te−t − t

=T (1− e−t) + x0 (e−t − e−T )

1− e−T− t = x0

e−t − e−T

1− e−T+ T

1− e−t

1− e−T− t

Hinreichende Bedingung: Als Funktion von x, x ist f(t, x, x) = e−x−x konvex (fur jedes t):

f ′x = −e−x−x, f ′x = −e−x−x,

(f ′′x,x f ′′x,x

f ′′x,x f ′′x,x

)=(

+1 11 1

)e−x−x = e−x−x

(11

)(1, 1)

und diese Matrix ist positiv semidefinit. ⇒ Insbes: Losung existiert, minimierend.In der Klausur reicht es aus zu sagen: Es ist klar, dass f(x, x) = e−x−x als Fkt. von x, x konvex ist.Anmerkung: Es ist nicht sehr einfach, aus den Formeln den Verlauf der Losung x(t) zu ersehen.Wegen

x(t) = B e−t =x0 − T

1− e−Te−t

hat die Losung einen konvexen Verlauf, wenn T klein (kleiner x0) ist, aber einen konkaven, wennT > x0 ist. Bei T = x0 wird sie zur Verbindungsgeraden x(t) = x0 (1 − t

T ). Man kann zeigen,dass die Losung immer monoton fallend in t ∈ [0, T ] ist. Daher bildet sie im konkaven Fall keinMaximum, im konvexen Fall kein Minimum in [0, T ] aus. Es gilt immer x(t) ∈ [0, x0] ∀ t ∈ [0, T ].Anmerkung: Die Transvers.bed. fur freies x(T ), (f ′x)|t=T = 0, lasst sich wegen ∂f

∂x = −e−x−x <

0 hier nicht erfullen. Das negative Vorzeichen von ∂f∂x bedeutet, dass eine Erhohung des Niveaus

xT der Endwertvorgabe x(T ) = xT den erreichbaren Zielwert verkleinert (d.h. der Minimierungdes Zielfunktionals entgegenkommt): Die Vorgabe ‘x(T ) ≤ xT ’ ware gleichbedeutend mit ‘x(T ) =xT ’. Anschaulich gesagt wird der beste (kleinste) Zielwert bei der Vorgabe ‘xT = +∞’ erreicht.

13

Page 14: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe VR.2b: Zu losendes Problem: min∫ T

0ex(t)−r x(t) dt, x(0) = x0, x(T ) = 0.

Zeigen Sie:a) Die Euler-Gl. ist aq. zu: x− rx = −rb) Die allg. Losung der Euler-Gl. ist: A + Bert + t (A,B = const ∈ R).c) Die Losung des Problems ist: x(t) = erT x0+T

erT−1− T+x0

erT−1er t + t

Losung: Bei f(t, x, x) = ex−r x haben wir:

∂f

∂x= −r ex−r x,

∂f

∂x= ex−r x,

d

dt

(∂f

∂x(t, x, x)

)=

d

dt

(ex(t)−r x(t)

)= ex−r x ·

(x− rx

)|t

Also ist die Eulergleichung ∂f∂x = d

dt

(∂f∂x

)aquivalent zu

−r ex−rx = ex−rx · (x− rx) ⇐⇒ x− rx = −r

Dies ist eine lineare Diffgl. 2-ter Ordn, inhomogen.Ansatz zur Losung der homogenen Gl. x−rx = 0: x(t) = eλt ⇒ x(t) = λ eλt ⇒ x(t) = λ2 eλt:

0 = λ2x(t)− λrx(t) = (λ2 − rλ) eλt

⇐⇒ λ2 − rλ = 0 ⇐⇒ λ = 0 ∨ λ = r

Als Fundamentallosungen kann man also wahlen: x1(t) = 1, x2(t) = ert

Als spezielle Losung von x−rx = −r rate x0(t) = t (⇒ x0(t)−rx0(t) = 0−r ·1 = −r = x0(t))Allgemeine Losung der inhomogenen DGl somit

x(t) = A x1(t) + B x2(t) + x0(t) = A + B er t + t

Die Randbedingungen x(0) = x0, x(T ) = 0 fuhren auf das LGS: A + B = x0, A + B erT = −T :(1 11 erT

)(AB

)=(

x0

−T

)⇐⇒

(AB

)=

1erT − 1

(erT −1−1 1

)(x0

−T

)=

1erT − 1

(erT x0 + T−(x0 + T )

)Also

x(t) = A + B ert + t =erT x0 + T

erT − 1− T + x0

erT − 1er t + t

=(erT − ert) x0 − (ert − 1) T

er T − 1+ t =

1− e−r(T−t)

1− e−rTx0 −

ert − 1erT − 1

T + t

Hinreichende Bedingung: Als Funktion von x, x ist f(t, x, x) = ex−rx konvex (fur jedes t):

f ′x = −rex−rx, f ′x = ex−rx,

(f ′′x,x f ′′x,x

f ′′x,x f ′′x,x

)=(

r2 −r−r 1

)ex−rx = ex−rx

(r−1

)(r, −1)

und diese Matrix ist positiv semidefinit. ⇒ Insbes: Losung existiert, minimierend.In der Klausur reicht es aus zu sagen: Es ist klar, dass f(x, x) = erx−x als Fkt. von x, x konvex ist.Anmerkung: Hier ergibt sich wegen x(t) = B r2 ert = −r2 T+x0

erT−1ert < 0 stets ein konkaver

Verlauf von x(t). Man kann zeigen: Wenn T klein ist, dann ist x(t) durchwegs monoton fallend.Fur genugend große T ist aber x(0) > 0, d.h. x(t) wachst zunachst, um in einem Punkt ts ∈ (0, T )ein Maximum auszubilden und dann in x(T ) = 0 zu enden.Anmerkung: Die Transvers.bed. fur freies x(T ), (f ′x)|t=T = 0 lasst sich wegen ∂f

∂x = ex−rx > 0hier nicht erfullen. Das positive Vorzeichen von ∂f

∂x bedeutet, dass eine Erhohung des Niveaus xT

der Endwertvorgabe x(T ) = xT den erreichbaren Zielwert vergroßert (d.h. der Minimierung desZielfunktionals entgegenlauft): Die Vorgabe ’x(T ) ≥ xT ’ ware gleichbedeutend mit ‘x(T ) = xT ’.Anschaulich gesagt wird der beste (kleinste) Zielwert bei der Vorgabe ‘xT = −∞’ erreicht.

14

Page 15: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe VR.3a: Zu losendes Problem max∫ T

0ln(r x(t)− x(t)

)dt, x(0) = x0, x(T ) = 0

mit gegebenen Konstanten x0, T, r > 0.Zeige:a) Die Euler-Gl. ist aquivalent zu: x− 2r x + r2 x = 0b) Die allg. Losung der Euler-Gl. lautet: x(t) = (A + B t)ert (A,B = const ∈ R).c) Die Losung des Problems ist: x(t) = x0

(1− t

T

)ert

Losung: Mit f(t, x, x) = ln(r x− x

)ist (da d

dv ln(v) = 1v und d

dv−1v = +1

v2 ):

∂f

∂x=

r

r x− x,

∂f

∂x=

−1r x− x

,d

dt

(∂f

∂x

)=

+1(r x− x)2

·(r x− x

).

Also ist die Eulergleichung ∂f∂x = d

dt

(∂f∂x

)aquivalent zu

r

r x− x=

r x− x

(r x− x)2⇐⇒ r (r x− x) = r x− x ⇐⇒ x− 2r x + r2 x = 0

Es liegt also eine homogene lineare Diffgl. 2-ter Ordn. (mit konstanten Koeffizienten) vor.Mit dem Losungsansatz: x(t) = eλt ⇒ x = λ eλt ⇒ x = λ2 eλt:

0 = (λ2x− 2r λ + r2) eλt = (λ− r)2 eλt ⇐⇒ λ = r

erhalt man hier nur eine (lineare unabh.) Fundamentallosung, x1(t) = A ert.1 Entsprechend derLosungsstruktur aus der Aufgabenstellung, versuchen wir es mit x2(t) = B t er t:

x(t) = t er t ⇒ x = t · rert + 1 · ert = (1 + rt) ert ⇒ x = (1 + rt) rert + r ert = (r2t + 2r) ert

Das Einsetzen in die Diffgl. zeigt, dass dies tatsachlich eine weitere Losung der homog. DGl. ist:

x− 2r x + r2 x =[r2t + 2r − 2r (1 + rt) + r2 t

]ert =

[r2t + 2r − 2r − 2r2t + r2t

]ert = 0 · ert

Allgemeine Losung der Eulergl. ist somit:

x(t) = A ert + B(t ert

)= (A + Bt) ert

Die Randbedingung x(0) = x0 liefert sofort A = x0 und dann bestimmt sich B aus x(T ) = 0 zu

x(T ) = (x0 + B T ) erT = 0 ⇒ B = −x0T

Also ist notwendigerweise

x(t) = x0

(1− t

T

)ert [Charakteristik: Barwert e−rtx(t) sinkt linear mit t auf 0]

Hinreichende Bedingung: Als Fkt. von x, x ist f(t, x, x) = ln(rx− x) konkav (fur jedes t):

f ′x =r

rx− x, f ′x =

−1rx− x

,

(f ′′x,x f ′′x,x

f ′′x,x f ′′x,x

)=(

r2 −r−r +1

)−1

(rx− x)2=

−1(rx− x)2

(r−1

)(r, −1)

und diese Matrix ist negativ semidefinit. ⇒ Insbes: Losung existiert, maximierend.In der Klausur reicht es aus zu sagen: Es ist klar, dass f(x, x) = ln(rx−x) als Fkt. von x, x konkav ist.Anmerkung: Fur die Ableitung x(t) der Losung ergibt sich:

x(t) = x0

(1− t

T

)r ert − x0

1T ert = x0

T

[r (T − t)− 1

]ert ( = r x(t)− x0

T ert)x(t) = x0

T

[r (T − t)− 1

]r ert − r x0

T ert = r x0T

[r (T − t)− 2

]ert

Dies zeigt zunachst, dass c(t) := rx(t)− x(t) = x0T ert stets positiv bleibt. Außerdem sieht man,

dass x(ts) = 0 fur ts = T − 1r mit x(ts) < 0. Es gilt immer ts < T und ts > 0, sofern rT > 1.

Fur T < 1/r fallt x(t) im Intervall [0, T ] monton und konkav von x(0) = x0 auf x(T ) = 0.Fur T > 1/r bildet x(t) ein Max. in ts = T − 1/r ∈ (0, T ) aus (insbesondere ist x(ts) > x0).Fur T > 2/r liegt auch noch ein Wendepunkt tw = T − 2/r im Intervall [0, T ].

1Dies liegt daran, dass λ = r hier ein doppelter Eigenwert ist.

15

Page 16: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe VR.3b: Zu losendes Problem max∫ T

0ln(r x(t)− x(t)− k

)dt, x(0) = x0, x(T ) = 0

mit gegebenen Konstanten x0, T, r, k > 0.Zeige:a) Die Euler-Gl. ist aqivalent zu: x− 2r x + r2 x = rkb) Die allg. Losung der Euler-Gl. lautet: x(t) = (A + B t) ert + k

r (A,B = const ∈ R).c) Die Losung x(t) lasst sich darstellen als: e−rt x(t) = x0

(1− t

T

)−(K(t)− t

T K(T ))

mit K(t) := kr (1− e−rt) bzw. K(T ) := k

r (1− e−rT ) als Barwert d. Zahlung k bis Zeit t bzw. T .

Losung: Mit f(t, x, x) = ln(r x− x− k

)ist

∂f

∂x=

( d

duln(u)

)|u=r x−x−k

· ∂

∂x(r x− x− k) =

1r x− x− k

· r =r

r x− x− k∂f

∂x=

( d

duln(u)

)|u=r x−x−k

· ∂

∂x(r x− x− k) =

1r x− x− k

· (−1) =−1

r x− x− kd

dt

(∂f

∂x

)=

( d

du

−1u

)|u=r x−x−k

· d

dt(r x− x− k) =

+1(r x− x− k)2

·(r x− x

)Also ist die Eulergleichung ∂f

∂x = ddt

(∂f∂x

)aquivalent zu

r

r x− x− k=

r x− x

(r x− x− k)2∣∣ × (r x− x− k)2

⇐⇒ r (r x− x− k) = r x− x∣∣ − rx + x + r k

⇐⇒ x− 2r x + r2 x = r k

Dies ist eine lineare Diffgl. 2-ter Ordn, inhomogen.Ansatz zur Losung der homogenen Gl.: x(t) = eλt ⇒ x = λ eλt ⇒ x = λ2 eλt:

0 = (λ2x− 2r λ + r2) eλt = (λ− r)2 eλt

⇐⇒ λ = r

Dies liefert hier nur eine Fundamentallosung, Aer t. Wie vorher, ist eine zweite durch x(t) = t er t

gegeben:

x(t) = t er t ⇒ x = t · rert + 1 · ert = (1 + rt) ert ⇒ x = (1 + rt) rert + r ert = (r2t + 2r) ert

Allgemeine Losung der homogenen DGl. ist somit:

x(t) = A ert + B(t ert

)= (A + Bt) ert

Als spezielle Losung der inhomogenen Gl. kann man x(t) = k/r nehmen. Also:

x(t) =(A + B t

)ert + k

r

Die Randbedingungen x(0) = x0, x(T ) = 0 fuhren auf folgende Bestimmungsgln. fur A und B:

A + kr = x0

(A + B T ) erT + kr = 0

}⇒ A = x0−k

r , B = 1T

(−A−e−rT k

r

)= 1

T

(−x0+k

r (1−e−rT ))

Mit K(T ) := kr (1− e−rT ) bzw. K(t) := k

r (1− e−rt) als dem Barwert der Zahlung k bis zur Zeitt bzw. T lasst sich die Losung x(t) (bzw. deren Barwert e−rtx(t)) schreiben als:

e−rt x(t) = x0

(1− t

T

)− k

r + tT

kr (1− e−rT ) + k

r e−rt = x0

(1− t

T

)−(K(t)− t

T K(T ))

Anmerkung: Der durch k > 0 erzeugte Zusatzterm t → K(t) − tT K(T ) ist die Differenz der

Fkt. K(t) und der Verbindungssekante (0, 0) → (T,K(T )). Da K(t) eine konkave Fkt. ist, istder Term positiv fur t ∈ (0, T ). Man kann zeigen, dass er qualitativ folgenden Verlauf hat:

K(t)− tT K(T ) .= rk

2 t (T − t) = 12 krT 2 t

T

(1− t

T

)Ein kleines k bewirkt also nur sekundare Modifikationen gegenuber k = 0, maximal ca. 1

8 krT 2.Fur großes k relativ zu x0 musste jedoch dieser Term dominieren und x(t) sogar negativ werden.

16

Page 17: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Anwendung: Optimaler KonsumDie vorhergehenden Aufgaben sind Spezialfalle der folgenden Anwendung: Jemand gewinnt imLotto einen Betrag von x0, den er in den folgenden T Jahren nutzenmaximierend konsumierenmochte. Bezeichnet x(t) das Restkapital zur Zeit t, und c(t) den zu optimierenden Konsum(Verbrauch) pro Z.E., r den als konstant angenommenen Kapitalmarktzins und k fixe Kostenfur das Management des Kapitals, so ist x(t) = r x(t) − c(t) − k, also c(t) = rx(t) − x(t) − k.[Man kann k auch als min. erforderl. Konsum sehen.] Wenn U(c) den Nutzen (pro Z.E.) aus demKonsum c darstellt und % die individ. Diskontrate zukunftigen Nutzens, so lautet das Problem:

maxx(t)

∫ T

0e−%t U

(rx(t)− x(t)− k

)dt, x(0) = x0, x(T ) = 0 (← eigentl. x(T ) ≥ 0)

Losung: Mit f(t, x, x) = e−% t U(rx− x− k

)ist

∂f

∂x= e−% t

( d

dcU(c)

)|c=r x−x−k

· ∂

∂x(r x− x− k) = e−% t U ′(c) · r

∂f

∂x= e−% t

( d

dcU(c)

)|c=r x−x−k

· ∂

∂x(r x− x− k) = e−% t U ′(c) · (−1) = −e−% t U ′(c)

d

dt

(∂f

∂x

)= − d

dt

(e−% t U ′(c(t))

)= +% e−% t U ′(c(t))− e−% t U ′′(c) · d

dt(r x− x− k)

= % e−% t U ′(c)− e−% t U ′′(c)(r x− x

)Also ist die Eulergleichung ∂f

∂x = ddt

(∂f∂x

)aquivalent zu (kurze gleich einen gemeins. Faktor e−%t):

r U ′(c) = % U ′(c)− U ′′(c)(r x− x

)⇐⇒ (r − %) U ′(c) = −U ′′(c)

(r x− x

)⇐⇒ (r − %) U ′(c)

U ′′(c) = −r x + x

Zur Abkurzung setzen wir δ := r − %. Dann lautet die Eulergl. (fur beliebige Nutzenfkt U(c)):

Euler-Gl. bei bel. U(c): x− r x + δ U ′(c)−U ′′(c) = 0 mit δ := r − %, c = rx− x− k

Bei U(c) = ln(c) ist U ′(c) = 1c , U ′′(c) = − 1

c2und U ′(c)

−U ′′(c) = +c. Die Eulergl. wird dann wegen

x− r x + δ(rx− x− k

)= x− (r + δ) x + δ r x− δ k

zu der inhomogen linearen DGl.

Euler-Gl. bei U(c) = ln(c): x− (r + δ) x + δr x = δ k

Eine spezielle Losung der inhomogenen Gl. sieht man sofort: x(t) = const = k/r.Der Ansatz mit x(t) = eλ t in der homogenen Gl. fuhrt auf die quadratische Gl.

λ2 − (r + δ)λ + δ r = 0

mit den beiden Losungen λ1 = r, λ2 = δ.2

Die allgemeine Losung der Euler-Gl. lautet also

x(t) = A er t + B eδ t + kr [als Barwert, da δ = r − %: e−rtx(t) = A + B e−%t + k

r e−rt]

Die Randbedingungen x(0) = x0, x(T ) = 0 fuhren auf LGS: A + B = x0, A erT + B eδT = −kr :(

1 1erT eδT

)(AB

)=(

x0

−kr

)⇐⇒

(AB

)=

1eδT − erT

(eδT −1−erT 1

)(x0

−kr

)=

1eδT − erT

(x0e

δT + kr

−x0erT − k

r

)Die Losung erhalt damit folgende Form

x(t) =x0e

δT + kr

eδT − erTer t−

x0erT + k

r

eδT − erTeδ t+

k

r=[−

x0e−%T + k

r e−rT

1− e−%T+

x0 + kr e−rT

1− e−%Te−% t+

k

re−rt

]er t

2Beachte: Nur wenn δ < 0, d.h. % > r, ist wenigstens ein EW < 0. Ich nehme an, das hat folgende Konsequenzen:Wenn % < r ist, kann es initial sogar noch zu einer Vermehrung von x0 kommen (Kapitalmarktzins ist hoch, d.h.es ist attraktiv, x(t) lange groß zu halten). Was in diesem Fall fur T →∞ passiert, ist mir allerdings nicht klar.Es gibt dann kein langfristig stabiles Verhalten mehr. Hat das etwas mit Ponzi-Systemen zu tun?

17

Page 18: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe VR.x / MP.x: Gegeben ist das folgende Variationsproblem

max∫ T

0e−rt

(x(t)− 1

2(x(t))2)dt, x(0) = 0, x(T ) = 0,

wobei T und r gegebene positive Parameter sind. Das Problem kann optional mit der Euler-Gleichung der Variationsrechung oder dem Maximumprinzip explizit gelost werden.Beim Weg uber die Variationsrechnung zeigen Sie:a) Die Euler-Gleichung ist aquivalent zur Diff.Gl. x− r x = −1.b) Die allgemeine Losung der Euler-Gleichung lautet: x(t) = A+B ert+ 1

r t (A,B = const ∈ R)

c) Die Losung der Euler-Gl. unter den gegebenen Randbedingungen ist: x(t) = tr −

Tr

ert−1erT−1

.d) x(t) aus c) ist die eindeutig bestimmte Losung des (Maximierungs-) Problems.Beim Weg uber das Maximumprinzip (mit der Zustandsgl. x = u) gehen Sie wie folgt vor:0. Stellen Sie die Hamilton-Fkt. H(t, x, u, λ) des Problems auf (nehmen Sie gleich λ0 = 1 an)1. Zeigen Sie, dass das Maximumprinzitp hier impliziert, dass: u(t) = ertλ(t).2. Zeigen Sie, dass die adjungierte Gl. hier impliziert, dass: λ(t) = 1

rert +B, B = const

3. Zeigen Sie, dass die Zustandsgl. x = u (zus. mit 1., 2.) impliziert: x(t) = 1r t + B

r ert + A

4. Zeigen Sie, dass die Randbedingungen an x(t) implizieren: x(t) = tr −

Tr

ert−1erT−1

Losung mit Variationsrechnung:a) Hier f(t, x, x) = e−rt

(x− 1

2 x2), also: ∂f

∂x = e−rt, ∂f∂x = −e−rt x, d

dt∂f∂x = +re−rt x− e−rt x.

Euler Gleichung ∂f∂x = d

dt∂f∂x wird nach Kurzen des gemeinsamen Faktors e−rt zu:

e−rt = +r e−rt x− e−rt x ⇐⇒ x− rx = −1

b) Rate als partikulare Losung von x−rx = −1: x0(t) = 1r t (⇒ x0 = 1

r , x0 = 0, x0−rx0 = −1)Allgemeine Losung der homogenen Gl. x − rx = 0: Ansatz x(t) = eλt fuhrt auf λ2 − rλ = 0,d.h. λ = 0 bzw. λ = r. Also: Allgemeine Losung der Eulergleichung: x(t) = A + B ert + t

r .c) Randbedingungen x(0) = 0, x(T ) = 0 fuhren auf LGS: A + B = 0, A + B erT = −T

r :(1 11 erT

)(AB

)=(

0−T

r

)⇐⇒

(AB

)=

1erT − 1

(erT −1−1 1

)(0−T

r

)also:

A = +Tr

1erT−1

,

B = −Tr

1erT−1

.

Somit istx(t) = A + B ert + t

r = Tr

1erT−1

− Tr

1erT−1

erT + tr = t

r −Tr

ert−1erT−1

Losung mit Maximumprinzip:0. Hier H(t, x, u, λ) = e−rt (x− 1

2u2) + λ u, also: H ′x = e−rt, H ′

u = −e−rtu + λ, H ′λ = u.

1. Max.Prinzip: u bestimmt sich aus maxu H(t, x, u, λ). Da H ′′uu = −e−rt < 0: Das maximierende

u ergibt sich aus H ′u = 0, d.h. −e−rtu + λ = 0 ⇐⇒ u = ert λ.

2. Adj. Gleichung: λ erfullt λ = −H ′x = −e−rt. Das kann (hier!) direkt integriert werden und

fuhrt auf: λ(t) = +1re−rt + B, B = const.

3. Max.Prinzip und Adj. Gleichung zusammenfuhren in x = u: λ(t) in Formel fur u(t) aus 1.einsetzen: u(t) = ert λ(t) = 1

r +B ert. Damit lautet die Zustandsgl. x(t) = 1r +B ert. Auch dies

kann man direkt integrieren: Stammfunktion von 1r ist 1

r t, Stammfunktion von B ert ist Br ert.

Somit ist x(t) = tr + B

r ert + A, wobei A die Integrationskonstante ist.

4. Randbedingungen x(0) = 0, x(T ) = 0 fuhren auf LGS: A + 1rB = 0, A + B 1

rerT = −Tr :(

1 1r

1 1r erT

)(AB

)=(

0−T

r

)⇐⇒

(AB

)=

r

erT − 1

(1r erT − 1

r−1 1

)(0−T

r

)also:

A = +Tr

1erT−1

,

B = −T 1erT−1

.

Somit istx(t) = A + B

r ert + tr = T

r1

erT−1− T

r1

erT−1erT + t

r = tr −

Tr

ert−1erT−1

18

Page 19: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

3. Aufgaben zum Maximumprinzip

Aufgabe MP.1: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t) frei

∫ T

0

(− x2(t) + x(t)u(t)− u2(t)

)dt, x(t) = u(t)− x(t), x(0) = x0, x(T ) frei

Gehen Sie dazu folgendermaßen vor:0. Stellen Sie die Hamilton-Fkt. H(t, x, u, λ) des Problems auf (nehmen Sie gleich λ0 = 1 an)

1. Stellen Sie mithilfe des Maximumprinzips u als Funktion von t, x, λ dar: u = u∗(t, x, λ).

2. Stellen Sie das Diff.Gl.System fur x(t), λ(t) auf und losen Sie dieses, indem Sie

a) in der Bewegungsgl. und der adjungierten Gleichung u durch u∗(t, x, λ) substituieren;

b) die allgemeine Losung des entstandenen DGl.-Systems bestimmen; Zur Kontrolle: Ei-

genwerte u. -vektoren von A = 12

(−1 13 1

): α± = ±1, a+ = c+

(13

), a− = c−

(1−1

)c) die allgemeine Losung an die Rand- und Transversalitatsbedingungen anpassen.

3. Ermitteln Sie die optimale Kontrolle u(t)

Schritt 0: Hamilton-Funktion samt partieller Ableitungen:

H(t, x, u, λ) = −x2 + xu− u2 + λ · (u− x)⇒ H ′

x(t, x, u, λ) = −2x + u− λ, H ′u(t, x, u, λ) = x− 2u + λ, H ′

λ(t, x, u, λ) = u− x

Schritt 1: Maximiere H(t, x, u, λ) uber u mit t, x, λ als Parameter. (eigentl. Maximumprinzip):Da H als Funktion von u eine konkave Fkt. ist (nach unten geoffnete Parabel), reicht es dazuaus, die Gl. H ′

u = 0 nach u aufzulosen. Das liefert die Funktion u∗(t, x, λ) als

u∗(t, x, λ) = 12 (x + λ)

Schritt 2: Substituiere u = u∗(t, x, λ) und lose das Hamilton-DGL-System (unter d. Randbed.)a) Hamilton-DGL-System: Da H ′

x = −2x + u− λ, H ′λ = u− x und u = 1

2(x + λ):

x = +H ′λ = u− x = 1

2(x + λ)− x = −12 x + 1

2 λ

λ = −H ′x = 2x− u + λ = 2 x− 1

2(x + λ) + λ = 32 x + 1

Dies ist ein (homogenes) lineares System von Diffgln. mit konstanten Koeffizienten:

y = Ay mit y =(

), A =

(−1

212

32

12

)= 1

2

(−1 13 1

)Nebenrechnung: Eigenwerte von A:

det(A− αI) =∣∣∣∣−1

2 − α 12

32

12 − α

∣∣∣∣ =(− 1

2 − α)(

12 − α

)− 3

4 = −(

14 − α2

)− 3

4 = α2 − 1

Nullsetzen von p(α) := det(A− αI) fuhrt auf die beiden Eigenwerte: α+ = +1, α− = −1.Zu α+ = +1 gehorige Eigenvektoren a := a+ bestimmen sich aus

Aa = +1a(×2)⇐⇒

{−a1 + a2 = 2a1

3a1 + a2 = 2a2

}⇐⇒ a2 = 3a1 ⇐⇒ a+ = c+

(13

)(c+ ∈ R)

Zu α− = −1 gehorige Eigenvektoren a := a− bestimmen sich aus:

Aa = −1a(×2)⇐⇒

{−a1 + a2 = −2a1

3a1 + a2 = −2a2

}⇐⇒ a2 = −a1 ⇐⇒ a− = c−

(1−1

)(c− ∈ R)

19

Page 20: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

b) Die allgemeine Losung des homogenen Systems y = Ay ist y(t) = c+ eα+t a+ + c− eα−t a−mit freien Integrationskonstanten c+, c− ∈ R. Also:

y(t) = c+

(13

)e+t + c−

(1−1

)e−t d.h.

{x(t) = c+ et + c− e−t

λ(t) = 3c+ et − c− e−t

c) Transversalitatsbed. fur freies x(T ): λ(T ) = 0. Zusammen mit x(0) = x0:

x(0) = x0 : c+ + c− = x0

λ(T ) = 0 : 3c+ eT − c− e−T = 0

}⇐⇒

(1 1

3eT −e−T

)(c+

c−

)=(

x0

0

)⇐⇒

(c+

c−

)=

1−e−T − 3eT

(−e−T −1−3eT 1

)(x0

0

)

⇐⇒

{c+ = e−T

e−T +3eT x0

c− = 3eT

e−T +3eT x0

Insgesamt:

x(t) =e−(T−t) + 3 eT−t

e−T + 3eTx0, λ(t) =

3e−(T−t) − 3 eT−t

e−T + 3eTx0

Schritt 3: u∗ bestimmen (aus Schritt 1 und 2):

u∗(t) =12(x(t) + λ(t)

)=

x0

2e−(T−t) + 3 eT−t + 3e−(T−t) − 3 eT−t

e−T + 3eT=

2x0 e−(T−t)

e−T + 3eT

Anmerkung 1 (Hinreichende Bed.):Die Hamilton-Funktion H(t, x, u, λ) = −x2 +xu−u2 + λ · (u−x) ist konkav in (x, u) fur jedest und λ. Der Mangasarin-Satz stellt sicher, dass die ermittelten Funktionen das Problem losen.Anmerkung 2 (λ(0) und Effekt von x0 auf V ):Hier ist x(0) = x0,

λ(0) =3e−T − 3eT

e−T + 3eTx0 = −3(eT − e−T )

e−T + 3eTx0 (< 0 fur x0 > 0), u(0) =

2x0 e−T

e−T + 3eT

Da ∂V∂x0

= λ(0): Eine Vergroßerung von x0 > 0 hatte (ceteris paribus) einen reduzierenden Effekt

auf den erzielten Optimalwert V := maxu

∫ T0 (−x2 + xu− u2) dt u.d.NB. x = u− x.

Anmerkung 3 (H(T ) und Effekt von T auf V ):Hier ist

x(T ) =4x0

e−T + 3eT, λ(T ) = 0, u(T ) =

2x0

e−T + 3eT= 1

2 x(T )

und somit

H(T ) = −x2(T ) + x(T ) u(T )− u2(T ) + λ(T ) · (u(T )− x(T ))

=(−16 + 8− 4) x 2

0

(e−T + 3eT )2=

−12 x 20

(e−T + 3eT )2< 0

Da ∂V∂T = H(T ): Eine Verkleinerung von T schafft stets einen Zuwachs im erzielten Optimalwert.

Wenn man V :=∫ T0 (−x2 + xu − u2) dt u.d.NB. x = u − x als Zielfunktional hat, besteht also

durchgangig ein Anreiz, T zu verkleinern: das optimale T ware T = 0.Anmerkung 4: Da es sich um ein autonomes Problem handelt, ist H konstant langs Losungs-trajektorien (bei festem T ). Mit der Rechnung in Anm. 3 gilt also H(t) = −12 x 2

0

(e−T +3eT )2(fur alle t),

wenn man das ermittelte x(t), u(t), λ(t) in H einsetzt (das konnte man als Probe nachrechnen).

20

Page 21: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe MP.2a: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t) frei

∫ T

0

(2 x(t)− u2(t)

)dt, x(t) = u(t)− 1

4 x(t), x(0) = 0, x(T ) frei

Gehen Sie dazu folgendermaßen vor:

0. Stellen Sie die Hamilton-Fkt. H(t, x, u, λ) des Problems auf (nehmen Sie gleich λ0 = 1 an)

1. Stellen Sie mithilfe des Maximumprinzips u als Funktion von t, x, λ dar: u = u∗(t, x, λ).

2. Stellen Sie das Diff.Gl.System fur x(t), λ(t) auf und losen Sie dieses, indem Sie

a) in der Bewegungsgl. und der adjungierten Gleichung u durch u∗(t, x, λ) substituieren;

b) die allgemeine Losung des entstandenen DGl.-Systems bestimmen; Zur Kontrolle:

Eigenwerte u. -vektoren von A = 14

(−1 20 1

): α± = ±1

4 , a+ = c+

(11

), a− = c−

(10

)c) die allgemeine Losung an die Rand- und Transversalitatsbedingungen anpassen.

3. Ermitteln Sie die optimale Kontrolle u(t)

Schritt 0: Hamilton-Funktion samt partieller Ableitungen:

H(t, x, u, λ) = 2x− u2 + λ · (u− 14 x)

⇒ H ′x(t, x, u, λ) = 2− λ 1

4 , H ′u(t, x, u, λ) = −2 u + λ, H ′

λ(t, x, u, λ) = u− 14 x

Schritt 1: Maximiere H(t, x, u, λ) uber u mit t, x, λ als Parameter. (eigentl. Maximumprinzip):Da H als Funktion von u eine konkave Fkt. ist (nach unten geoffnete Parabel) reicht es dazuaus, die Gl. H ′

u = 0 nach u aufzulosen. Das liefert die Funktion u∗(t, x, λ) als

u∗(t, x, λ) = 12λ

Schritt 2: Substituiere u = u∗(t, x, λ) und lose das Hamilton-DGL-System (unter d. Randbed.)a) Hamilton-DGL-System: Da H ′

x = 2− 14λ , H ′

λ = u− 14x und u = 1

2λ :

x = +H ′λ = u− 1

4x = −14 · x + 1

2 · λ − 0λ = −H ′

x = −2 + 14λ = 0 · x + 1

4 · λ − 2

Dies ist hier ein (inhomogenes) lineares System von Diffgln. mit konstanten Koeffizienten:

y = Ay − b mit y =(

), A =

(−1

412

0 14

)= 1

4

(−1 20 1

), b =

(02

).

Nebenrechnung: Eigenwerte von A:

det(A− αI) =∣∣∣∣−1

4 − α 12

0 14 − α

∣∣∣∣ = −(

14 + α

)(14 − α

)= −

((14

)2 − α2) != 0 ⇐⇒ α± = ±1

4

D.h. die beiden Eigenwerte sind: α+ = 14 , α− = −1

4 .Zu α+ = +1/4 gehorige Eigenvektoren a = a+ bestimmen sich aus

Aa = +14 a

(×4)⇐⇒{−a1 + 2a2 = a1

+a2 = a2

}⇐⇒ a2 = a1 ⇐⇒ a+ = c+

(11

)(c+ ∈ R)

Zu α− = −1/4 gehorige Eigenvektoren a := a− bestimmen sich aus:

Aa = −14 a

(×4)⇐⇒{−a1 + 2a2 = −a1

+a2 = −a2

}⇐⇒ a2 = 0 ⇐⇒ a− = c−

(10

)(c− ∈ R)

21

Page 22: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

b) Die allg. Losung des inhomogenen Systems y = Ay−b ist y(t) = c+ et/4 a++c− e−t/4 a− + y0(t)wobei y0(t) eine partikulare Losung ist. Da b konstant ist, kann man

y0(t) ≡ A−1b =(

14

)−1(−1 20 1

)−1(02

)= 4 1

−1

(1 −20 −1

)(02

)=(−4 80 4

)(0

2

)=(

168

)wahlen (denn dann: y0(t) = 0 = Ay0(t)− b). Allgemeine Losung des DGL-Systems ist also:

y(t) = c+

(11

)e+t/4 + c−

(10

)e−t/4 +

(168

)d.h.

{x(t) = c+ e+t/4 + c− e−t/4 + 16

λ(t) = c+ et/4 + 8

c) Transversalitatsbed. fur freies x(T ): λ(T ) = 0. Zusammen mit x(0) = 0:

x(0) = 0 : c+ + c− + 16 = 0λ(T ) = 0 : c+ e+T/4 + 8 = 0

}⇐⇒

(1 1

e+T/4 0

)(c+

c−

)=(−16−8

)Da die Gl. λ(T ) = 0 nur c+ enthalt, lost man sie am besten direkt danach auf:

c+ = −8 e−T/4

Das ergibt:λ(t) =

[− 8 e−T/4

]e+t/4 + 8 = 8

(1− e−(T−t)/4

)Aus x(0) = 0 ergibt sich dann

c− = −16 − c+ = −16 + 8 e−T/4

Damit:

x(t) = −8 e−T/4 et/4 + (8 e−T/4 − 16) e−t/4 + 16 = 16− 8 e−(T−t)/4 − 16 e−t/4 + 8 e−(t+T )/4

Schritt 3: u∗ bestimmen (aus Schritt 1 und 2):

u∗(t) =12λ(t) = 4

(1− e−(T−t)/4

)Anmerkung 1: (Hinreichende Bed.)Die Hamilton-Funktion H = 2x − u2 + λ · (u − 1

4 x) ist konkav in (x, u) fur jedes t und λ. DerMangasarin-Satz stellt sicher, dass die ermittelten Funktionen das Problem losen.Anmerkung 2: (H(T ) und ”freies T“)Hier ist

x(T ) = 8− 16 e−T/4 + 8 e−2T/4 = 8(1− 2e−T/4 +

(e−T/4

)2) = 8(1− e−T/4

)2u(T ) = 4

(1− e−(T−T )/4

)= 0

λ(T ) = 0

und somit, da H = 2x− u2 + λ · (u− 14 x):

H(T ) = 16(1− e−T/4

)2> 0

Da ∂V∂T = H(T ): Eine Vergroßerung von T schafft stets einen Zuwachs im erzielten Optimalwert

(es besteht durchgangig ein Anreiz, T zu vergroßern, das optimale T ware T =∞)Anmerkung 3: Da es sich um ein autonomes Problem handelt, ist H konstant langs Losungs-trajektorien (bei festem T ). Mit der Rechnung in Anm. 2 gilt also H = 16

(1− e−T/4

)2 (fur allet), wenn man das ermittelte x(t), u(t), λ(t) einsetzt (das konnte man als Probe nachrechnen).

22

Page 23: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe MP.2b: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t) frei

∫ T

0

(q x(t)− β u2(t)

)dt, x(t) = u(t)− δ x(t), x(0) = 0, x(T ) frei

wobei q, β und δ positive Parameter sind. Gehen Sie dazu folgendermaßen vor:

0. Stellen Sie die Hamilton-Fkt. H(t, x, u, λ) des Problems auf (nehmen Sie gleich λ0 = 1 an)

1. Stellen Sie mithilfe des Maximumprinzips u als Funktion von t, x, λ dar: u = u∗(t, x, λ).

2. Stellen Sie das Diff.Gl.System fur x(t), λ(t) auf und losen Sie dieses, indem Sie

a) in der Bewegungsgl. und der adjungierten Gleichung u durch u∗(t, x, λ) substituieren;

b) die allgemeine Losung des entstandenen DGl.-Systems bestimmen; Zur Kontrolle: Ei-

genwerte u. -vektoren von A =(−δ 1

0 +δ

): α± = ±δ,a+ = c+

(1

4βδ

),a− = c−

(10

)c) die allgemeine Losung an die Rand- und Transversalitatsbedingungen anpassen.

3. Ermitteln Sie die optimale Kontrolle u(t)

Schritt 0: Hamilton-Funktion samt partieller Ableitungen:

H(t, x, u, λ) = q x− βu2 + λ · (u− δ x)⇒ H ′

x(t, x, u, λ) = q − λ δ, H ′u(t, x, u, λ) = −2β u + λ, H ′

λ(t, x, u, λ) = u− δ x

Schritt 1: Maximiere H(t, x, u, λ) uber u mit t, x, λ als Parameter. (eigentl. Maximumprinzip):Da H als Funktion von u eine konkave Fkt. ist (nach unten geoffnete Parabel) reicht es dazuaus, die Gl. H ′

u = 0 nach u aufzulosen. Das liefert die Funktion u∗(t, x, λ) als

u∗(t, x, λ) = 12β λ

Schritt 2: Substituiere u = u∗(t, x, λ) und lose das Hamilton-DGL-System (unter d. Randbed.)a) Hamilton-DGL-System: Da H ′

x = q − λ δ, H ′λ = u− δx und u = 1

2β λ:

x = +H ′λ = u− δx = −δ · x + 1

2β · λ − 0, x(0) = x0

λ = −H ′x = −q + λ δ = 0 · x + δ · λ − q, λ(T ) = 0

Das heißt:(x

λ

)=(−δ 1

0 +δ

)(xλ

)−(

0q

)← y = Ay−b mit y =

(xλ

), A =

(−δ 1

0 +δ

), b =

(0q

)Nebenrechnung: Eigenwerte von A:

det(A− αI) =∣∣∣∣−δ − α 1

0 δ − α

∣∣∣∣ = −(δ + α)(δ − α) = −(δ2 − α2) != 0 ⇐⇒ α± = ±δ

D.h. die beiden Eigenwerte sind: α+ = δ, α− = −δ.Zu α+ = +δ gehorige Eigenvektoren a = a+ bestimmen sich aus

Aa = +δ a ⇐⇒{−δa1 + 1

2β v2 = δ a1

+δa2 = δ a2

}⇐⇒ a2 = 4β δ a1 ⇐⇒ a+ = c+

(1

4βδ

)(c+ ∈ R)

Zu α− = −δ gehorige Eigenvektoren a := a− bestimmen sich aus:

Aa = −δ a ⇐⇒{−δ a1 + 1

2β a2 = −δ a1

+δ a2 = −δ a2

}⇐⇒ a2 = 0 ⇐⇒ a− = c−

(10

)(c− ∈ R)

23

Page 24: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

b) Die allg. Losung des inhomogenen Systems y = Ay−b ist y(t) = c+ eδt a++c− e−δt a− + y0(t)wobei y0(t) eine partikulare Losung ist. Da b eine Konstante ist, kann man

y0(t) ≡ A−1b = 1−δ2

(δ − 1

−0 −δ

)(0q

)=( q

2βδ2

)wahlen. Allgemeine Losung des DGL-Systems ist also:

y(t) = c+

(1

4βδ

)e+δt + c−

(10

)e−δt +

( q2βδ2

)d.h.

{x(t) = c+ e+δ t + c− e−δt + q

2βδ2

λ(t) = c+4βδ e+δ t + qδ

c) Transversaltitatsbed. fur freies x(T ): λ(T ) = 0. Zusammen mit x(0) = 0:

x(0) = 0 : c+ + c− + q2βδ2 = 0

λ(T ) = 0 : c+ 4βδ e+δ T + qδ = 0

}⇐⇒

(1 1

4βδ e+δ T 0

)(c+

c−

)=

(− q

2βδ2

− qδ

)Da die Gl. λ(T ) = 0 nur c+ enthalt, lost man sie am besten direkt danach auf:

c+ = − q

4βδ2e−δ T

Das ergibt:

λ(t) =[− q

4βδ2e−δ T

]4βδ e+δ t +

q

δ=

q

δ− q

δe−δ (T−t) =

q

δ

(1− e−δ (T−t)

)Aus x(0) = 0 ergibt sich dann

c− = − q

2βδ2− c+ = − q

2βδ2+

q

4βδ2e−δ T = − q

2βδ2

(1− 1

2 e−δ T)

Damit:

x(t) =[− q

4βδ2

]e−δ T eδt +

[− q

2βδ2

(1− 1

2 e−δ T)]

e−δ t +q

2βδ2

=q

2βδ2

[1− 1

2 e−δ (T−t) −(1− 1

2 e−δ T)e−δ t

]Schritt 3: u∗ bestimmen (aus Schritt 1 und 2): u∗(t) = 1

2β λ(t) = q2β δ

(1− e−δ (T−t)

)Anmerkung: Die Hamilton-Funktion H(t, x, u, λ) = q x − βu2 + λ · (u − δ x) ist konkav in(x, u) fur jedes t und λ. Der Mangasarin-Satz stellt sicher, dass die ermittelten Funktionen dasProblem losen.Anmerkung: Fur x(T ) ergibt sich: x(T ) = q

4βδ2

[2− 1− 2e−δ T + e−δ 2T

]= q

4βδ2

(1− e−δT

)2und damit, da u(T ) = λ(T ) = 0: H(T ) = q2

4βδ2

(1− e−δT

)2> 0. Eine Vergroßerung von T fuhrt

beim behandelten Problem also stets zu Vergroßerung des erreichten Optimalwerts.Als okonom. Anwendung: Der Kapitalstock x(t) eines Unternehmens erwirtschaftet einenErlos von q x(t) pro Zeiteinheit (q = marginaler Erlos einer Kapitaleinheit pro Z.E., = const).Der Kapitalstock zerfallt ”von alleine“ mit einer Rate von δ, kann aber durch Investition mit derRate u(t) verandert werden, was Kosten der Hohe βu2(t) verursacht (zunehmende Grenzkostender Inv.). Wie ist die Investition u(t) zu planen, um die aggregierten Gewinne (= Barwert derGewinne, wenn zukunftige Gewinne nicht diskontiert werden) uber T Perioden zu maximieren?Die durchgefuhrte Rechnung zeigt, dass die Investionsrate u(t) optimalerweise mit u(0) =

q2β δ

(1 − e−δ T

)beginnt, im Laufe der Zeit t reduziert wird und auf u(T ) = 0 endet. Dieses

Ergebnis ist zumindest plausibel, da das UN Gewinne nur uber den Kapitalstock erzielen kann(je großer der Kapitalstock, je hoher der Gewinn), so dass es moglichst schnell einen großen Ka-pitalstock anstrebt. (Es ware bei dieser Anwendung interessant zu diskutieren, welchen Effektdie Zerfallsrate δ auf die initiale Investition u(0) und den finalen Kapitalstock x(T ) hat).

24

Page 25: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe MP.2c: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t) frei

∫ T

0

(q x(t)− β u2(t)− c

)dt, x(t) = u(t)− δ x(t), x(0) = 0, x(T ) frei

wobei q, β, δ, c positive Parameter sind ... [Restl. Aufg.Stellung wie in Aufg. MP2.b]Losung: Da c sich uberall rausdifferenziert, ist die Losung (x(t), u(t), λ(t)) identisch zu der vonAufgabe MP.2b. Das ist auch plausibel, da die Konstante c nur den Beitrag c T zum Zielintegralbeisteuert, der nicht durch u zu beeinflussen ist (sondern nur durch T ).Zusatz: Es gibt allerdings einen Unterschied in der Frage nach dem optimalen T : Gegenuber Aufg.MP.2b ist hier H = H0 − c mit H0 als dem Hamilton von Aufgabe 2b. Mit dem dort ermitteltenH0(T ) = q2

4βδ2

(1− e−δT

)2 ergibt sich hier

H(T ) = q2

4βδ2

(1− e−δT

)2 − c

Die Funktion H0(T ) wachst vom Wert H0(0) = 0 fur T = 0 auf den Wert limT→∞H0(T ) = q2

4βδ2 .

Deswegen hat die Gl. H(T ) = 0 eine Losung T0 > 0 genau fur c < q2

4βδ2 =: cmax, und in diesem Fallgilt H(T ) < 0 fur T < T0 und H(T ) > 0 fur T > T0. Fur c > cmax ist nun H(T ) < 0 fur alleT > 0, d.h. das optimale T ist nun nicht mehr T = ∞, sondern T = 0. Die okonomische Interpretationdavon ist, dass c Fixkosten darstellt, die fur die Dauer T des ”Projektes“ zu leisten sind und daher wie

”Aufrechterhaltungskosten“ wirken. Sind die Fixkosten zu hoch (c > cmax), wird das UN nun nicht mehrT = ∞, sondern T = 0 praferrieren (da H(T ) < 0 fur alle T ). D.h. das UN hat dann keinen Anreiz,ein solches Projekt zu beginnen. Im Fall c < cmax ist die gewunschte Dauer (zur Maximierung von V )nicht etwa das T = T0 mit H(T0) = 0. Denn da H(T ) < 0 fur T < T0 und H(T ) > 0 fur T > T0,stellt T0 eine Dauer minimalen, nicht maximalen (Projekt-) Wertes dar. Bei einer vorgegebenen DauerT < T0, wurde sich das UN dann eine Verkleinerung von T wunschen, bei einer Dauer T > T0 eineVergroßerung von T . Geht man also von ”genugend kleinen Fixkosten“ aus (c < cmax) und unterstellt,dass nur ”genugend große Laufzeiten“ in Betracht kommen (T ≥ T0), so wird das UN nach wie vor T =∞bevorzugen; In dieser Situation sorgen die geringen Fixkosten dafur, dass der Gewinn aus dem Aufbaueines Kapitalstocks eine moglichst lange Laufzeit, d.h. T =∞, attraktiv macht.

Aufgabe MP.2d: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t) frei

∫ T

0

(q x(t)− β u2(t)− c

)dt + A x(T ), x(t) = u(t)− δ x(t), x(0) = 0, x(T ) frei

wobei q, β, δ, c, A positive Parameter sind ... [Restl. Aufg.Stellung wie in Aufg. MP2.b]Losung: Hier Terminalwert S(T, x(T )) = A x(T ). Gegenuber vorhergehenden Aufgaben nurModifikation im Schritt 2c (Randbedingungen): Die Transvers.Bed. fur λ in t = T ist nun:

λ(T ) =∂S

∂x(T, x(T )) = A (statt λ(T ) = 0)

Die Konstante c+ ergibt sich dann aus:

c+ 4βδ e+δ T +q

δ= A ⇐⇒ c+ =

(A− q

δ

) e−δ T

4βδ

und

λ(t) =[(

A− q

δ

) e−δ T

4βδ

]4βδ e+δ t +

q

δ=

q

δ+(A− q

δ

)e−δ (T−t) =

q

δ

(1− e−δ (T−t)

)+A e−δ(T−t)

Da nach wie vor u(t) = 12β λ(t), erhalt man damit die optimale Investitionsrate:

u(t) =q

2βδ+( A

2β− q

2βδ

)e−δ (T−t) =

q

2βδ

(1− e−δ (T−t)

)+

A

2βe−δ(T−t)

Gegenuber Aufg MP.2b: Erhohung des initialen u0(0) = q2βδ

(1 − e−δ T

)um A

2β e−δT und desfinalen u von u0(T ) = 0 auf u(T ) = A

2β . Die hohere Invest.Rate u ist plausibel aus ok. Grunden.

25

Page 26: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe MP.3: Losen Sie folgendes dynam. Optimierungsproblem mit dem Maximumprinzip:

maxu(t)≥0

∫ T

0

(q x(t)− u

32 (t)

)dt, x(t) = u(t), x(0) = 0, x(T ) frei u ≥ 0

wobei q und T positive Parameter sind. Gehen Sie dazu folgendermaßen vor:

0. Stellen Sie die Hamilton-Fkt. H(t, x, u, λ) des Problems auf (nehmen Sie gleich λ0 = 1 an)

1. Stellen Sie mithilfe des Maximumprinzips u als Funktion von t, x, λ dar.Zur Kontrolle: Dies fuhrt hier auf: u = 4

9λ2, wenn λ > 0 sowie u = 0, wenn λ ≤ 0.

2. Ermitteln Sie (in dieser Reihenfolge):

a) λ(t) (aus der adjungierten Gl. und der Transversalitatsbedingung)

b) u(t) (aus Schritt 1 und dem λ(t) aus Schritt 2.a)

c) x(t) (aus der Bewegungsgl. x = u mit dem u aus 2b) und der Anfangsbed. x(0) = 0)

Schritt 0: Hamilton-Funktion samt partieller Ableitungen:

H(t, x, u, λ) = q x− u32 + λ · u

⇒ H ′x(t, x, u, λ) = q, H ′

u(t, x, u, λ) = −32 u

12 + λ, H ′

λ(t, x, u, λ) = u

Schritt 1: Maximiere H(t, x, u, λ) uber u ≥ 0 mit t, x, λ als Parameter. :

Da H als Funktion von u eine konkave Fkt. auf R+ ist (denn H ′′uu = −3

4u−12 < 0 ∀u > 0), ist

das maximierende u die Losung der Gl. H ′u = 0, sofern diese Gleichung eine Losung u ≥ 0 hat.

Andernfalls ist das maximierende u der linke Randpunkt des Restriktionsintervalls [0,∞), d.h.u = 0 (in Frage kame theoretisch auch der ”rechte Randpunkt“ u = +∞, der scheidet hier aberaus, da limu→∞H(t, x, u, λ) = −∞). Die Gleichung −3

2 u12 + λ = 0 hat genau dann eine Losung

u > 0, namlich u = 49λ2, wenn λ > 0 ist. Also ist

u∗(t, x, λ) =

{49 λ2, wenn λ > 00, wenn λ ≤ 0

Schritt 2a: λ(t) erfullt die adjungierte Gl. λ = −H ′x sowie die Transversalitatsbed. λ(T ) = 0.

Da hier −H ′x = −q eine Konstante ist, folgt λ(t) = −qt + B, wobei die Integrationskonstante B

sich wegen λ(T ) = 0 zu B = qT ergibt. Das liefert

λ(t) = q · (T − t)

Schritt 2b: Mit dem λ(t) aus 2a ergibt sich fur das u∗(t, x, λ) aus Schritt 1:

u(t) =

{49 λ2(t), wenn λ(t) > 00, wenn λ(t) ≤ 0

=

{49 q2 (T − t)2, wenn q · (T − t) > 00, wenn q · (T − t) ≤ 0

Da q > 0 und T − t ≥ 0 fur alle t ≤ T , ist durchgangig

u(t) = 49 q2 (T − t)2 (∀ t ≤ T )

(D.h. die Restriktion u(t) ≥ 0 fangt gerade im Endzeitpunkt t = T an zu binden).Schritt 2c: Aus der Diff.Gl. x(t) = u(t) und x(0) = 0 ermittelt sich x(t) zu

x(t) = x(0) +∫ t

0u(s) ds =

∫ t

0

49 q2 (T − s)2 ds = 4

9 q2[− 1

3(T − s)3]s=t

s=0= 4

27 q2[T 3− (T − t)3

]

26

Page 27: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

4. Aufgaben zur dynamischen Programmierung (via Bellman-Prinzip)Aufgabe DP.1a: Gegeben ist folgendes dynam. Optimierungsproblem in diskreter Zeit:

maxut≥0

{ T−1∑t=0

√ut + A xT

}unt. d. NB

{x0 = x,xt+1 = xt − ut fur t = 0, . . . , T − 1

a) Stellen Sie die Bellman-Gleichung fur diese Problem auf.

b) Bestimmen Sie aus der Bellman-Gl. die Optimalwertfunktionen VT (x), VT−1(x) und VT−2(x).

c) Zeigen Sie durch vollstandige Induktion, dass die Optimalwertfunktionen die FormVT−n(x) = n

4A + A x haben, wobei die optimale Politik durch u∗T−n(x) = 14A2 gegeben ist.

d) Welchen zeitl. Verlauf hat die Zustandsvariable xt bei Anwendung der optimalen Politik?

Losung: Hier ist ft(x, u) =√

u und gt(x, u) = x− u fur t = 0, . . . , T − 1 sowie fT (x, u) = Ax.a) Bellman-Gleichung allgemein: Vt(x) = maxu∈U

{ft(x, u) + Vt+1

(gt(x, u)

)}, hier:

Vt−1(x) = maxu≥0

{√u + Vt(x− u)

}fur t = T, T − 1, . . . sowie VT (x) = max

u≥0{A x}

b) VT (x): Da fT (x, u) = Ax nicht von u abhangt, ist VT (x) = maxu≥0{A x} = A x.VT−1(x): Gemaß Bellman-Gl. und VT (x) = A x ergibt sich VT−1(x) als:

VT−1(x) = maxu≥0

{fT−1(x, u) + VT

(gT−1(x, u)

)} (hier)= max

u≥0

{√u + A (x− u)

}Die Fkt. h(u) :=

√u + A (x − u) ist eine konkave Funktion auf R+, denn h′(u) = 1

2√

u− A,

h′′(u) = −12

12 u−3/2 < 0. Sofern es eine Nullstelle u = u∗(x) ≥ 0 von h′(u) gibt, ist diese daher

eine Maximalstelle. Tatsachlich hat h′(u) eine solche Nullstelle:

h′(u) = 0 ⇐⇒ 12√

u−A = 0 ⇐⇒

√u = 1

2A ⇐⇒ u = 14A2 > 0

Also ist u∗T−1(x) = 14A2 und

VT−1(x) =√

14A2 + A

(x− 1

4A2

)= 1

2A + A x− 14A = Ax + 1

4A

VT−2(x): Gemaß Bellman-Gl. und VT−1(x) = A x + 14A ergibt sich VT−2(x) als:

VT−2(x) = maxu≥0

{fT−2(x, u) + VT−1

(gT−2(x, u)

)} (hier)= max

u≥0

{√u + A (x− u) + 1

4A

}Die uber u ≥ 0 zu maximierende Funktion h(u) =

√u + A(x − u) + 1

4A unterscheidet sich vonderjenigen bei VT−1 nur durch den zusatzlichen (von u unabhangigen) Term 1

4A . Auch hier istalso u∗T−2(x) = 1

4A2 und somit

VT−2(x) =√

14A2 + A

(x− 1

4A2

)+ 1

4A = 12A + A x− 1

4A + 14A = Ax + 1

2A

c) Per vollstandiger Induktion zeigen, dass VT−n(x) = A x + n4A fur alle n:

Fur n = 0 stimmt die Formel offenbar. Die Formel gelte fur ein n. Zu zeigen ist, dass dann

VT−n−1(x) = A x + n+14A

Beweis dazu: Gemaß Bellman-Gl. und Induktionsvoraussetzung, VT−n(x) = Ax + n4A , ist

VT−n−1(x) = maxu≥0

{fT−n(x, u) + VT−n

(gT−n(x, u)

)}= max

u≥0

{√u + A (x− u) + n

4A

}Wiederum nimmt die uber u ≥ 0 zu maximierende Fkt. h(u) =

√u + A (x − u) + n

4A ihr Max.in u = 1

4A2 an und

VT−n−1(x) =√

14A2 + A

(x− 1

4A2

)+ n

4A = 12A + Ax− 1

4A + n4A = Ax + n+1

4A

d) Zeitlicher Verlauf von xt:Da hier die optimale Politik die (von x und t) unabhangige Konstan-te 1/(4A2) ist, die in jeder Periode von xt abgezogen wird (denn xt+1 = xt − ut), fallt xt linearin der Zeit t ab, mit jeder Periode um 1/4A2:x1 = x0− 1

4A2 , x2 = x0− 24A2 , . . . , xt = x0 − t

4A2 .

27

Page 28: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Interpretation im Sinne ”optimaler Konsum“: Eine Person verfugt zum Zeitpunkt 0 ubereinen Betrag von x0, den sie uber T Perioden so konsumieren mochte, dass die Summe der

”Perioden-Nutzen“ U(ut) aus dem Konsum ut in der t-ten Periode sowie des ”Restbetrags“ xT ,der mit einem Gewicht A auf ”Nutzeneinheiten“ umgerechnet wird, moglichst groß ist. DasProblem wurde hier unter der Annahme durchgerechnet, dass der Nutzen aus dem Konsum ut

in der t-ten Periode durch U(ut) =√

ut gegeben ist. Das Ergebnis der durchgefuhrten Rechnung(mit der verwendeten Nutzenfunktion) ist, dass die Person dann optimalerweise in jeder Periodedie gleiche Menge ut = 1/4A2 konsumiert, vollkommen unabhangig vom ”Zustand“ xt. Der denNachfahren vererbte Betrag xT = x0 − T

4A2 ist nur dann positiv, wenn A groß oder T klein ist.

Ubersicht uber die folgenden Aufgaben: An der Losung des Problems andert sich prak-tisch nichts, wenn wir die gleiche Aufgabe zeitstetig rechnen (siehe Aufgabe DP.1c). Die Situationandert sich jedoch, wenn das Problem mit unendlichem Zeithorizont (T =∞) und Diskontierungzukunftigen Nutzens betrachtet wird. Dann hat die Optimalwertfunktion V (x) die Struktur b

√x

statt a + b x und die optimale ”Konsum-Politik“ u∗(x) die Form a x (d.h. es ist optimal, einenfesten Anteil a des jeweiligen Restbetrags x zu konsumieren), was statt des linearen Abfallseinen im Zeitverlauf geometrisch (zeitdiskret) bzw. exponentiell (zeitstetig) auf Null abklingen-den Restbetrag xt bzw. x(t) zur Folge hat. Dies gilt gleichermaßen fur die zeitdiskrete wie diezeitstetige Variante. Da die Rechnung im zeitdiskreten Szenario (folgende Aufg. DP.1b) we-sentlich langlichere Nebenrechnungen erfordert als im zeitstetigen Szenario (Aufg DP.1d), wirdempfohlen, sich zunachst mit den ”zeitstetigen“ Aufgaben DP.1c und DP.1d zu beschaftigen.Aufgabe DP.1b∗: Betrachtet wird das folgende zeitdiskrete dynamische Optimierungsproblem:

max0≤ut≤xt

{ ∞∑t=0

(1

1+%

)t√ut

}unt. d. NB

{x0 > 0 gegeben,xt+1 = xt − ut fur t = 0, 1 . . .

a) Stellen Sie die (zeitunabhangige) Bellman-Gleichung fur diese Problem auf.b) Zeigen Sie, dass eine Losung V (x) der Bellman-Gleichung nicht von der Gestalt: V (x) =

a+b x mit Konstanten a, b > 0 sein kann (wie von Aufgabe DP.1a nahegelegt), sofern % > 0.c) Bestimmen Sie die Konstante b > 0 so, dass V (x) = b

√x eine Losung der Bellman-

Gleichung ist und geben Sie die zugehorige Politik u∗(x) an.Hinweis: Setzen Sie β := 1

1+% und zeigen Sie, dass das Max. von h(u) :=√

u + βb√

x− u

in u∗ = x/(1 + (βb)2

)(∈ [0, x]) angenommen wird mit h(u∗) =

√1 + (βb)2

√x.

d) Welchen Zeitverlauf hat die Zustandsvariable xt bei Anwendung der Politik u∗t (x) aus c)?

Losung: a) Zeitunab. Bellman-Gleichung allgemein: V (x) = maxu∈U{f(x, u)+ 1

1+%V(g(x, u)

)},

hier:V (x) = max

0≤u≤x

{√u + 1

1+%V (x− u)}

b) Zeige: V (x) kann nicht die Form V (x) = a + b x haben.Mit diesem Ansatz lautet die Bellman-Gleichung

a + b x = max0≤u≤x

{√u + 1

1+%

(a + b (x− u)

)}Die Maximierung auf der rechten Seite involviert die Funktion h(u) =

√u + 1

1+%

(a + b (x−u)

).

Da h(u) konkav ist, liegt ihr Maximum dort, wo h′(u) = 0 ist (sofern diese Gl. eine Losungu ∈ (0, x) hat, ansonsten ist u = 0 oder u = x).

h′(u) = 12√

u− 1

1+% b = 0 ⇐⇒√

u = 1+%2b ⇐⇒ u =

(1+%2b

)2Fur b > 0 ist also u =

(1+%2b

)2 die Maximalstelle. Einsetzen in die parametrisierte Bellman-Gl.liefert:

a + b x = 1+%2b + 1

1+%

[a + b

(x−

(1+%2b

)2)]Auch ohne weitere Umformungen sieht man: Links ist der Koeffizient von x gleich b, rechts ister gleich 1

1+% b. Es musste b = 11+%b sein, was % = 0 oder b = 0 impliziert.

28

Page 29: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

c) Zeige: Mit V (x) = b√

x entsteht eine Losung der Bellman-Gleichung.Mit diesem Ansatz und der Abkurzung β := 1

1+% fur den Diskontfaktor lautet die Bellman-Gleichung

b√

x = max0≤u≤x

{√u + β b

√x− u

}, β := 1

1+%

Es ist nun das Maximum von h(u) :=√

u + β b√

x− u zu bestimmen:

h′(u) =1

2√

u− βb

12√

x− u= 0 ⇐⇒ βb

√u =

√x− u

⇐⇒ (βb)2 u = x− u

⇐⇒(1 + (βb)2

)u = x

⇐⇒ u =1

1 + (βb)2x =: u∗

[Vor der Quadrierung muss b > 0 angenommen werden → spater sicherstellen]Da h(u) eine konkave Funktion auf dem Intervall [0, x] ist (denn h′′(u) = −1

4u−3/2− βb4 (x−u)−3/2

< 0) und u∗ in [0, x] liegt, liefert die Nullstelle von h′(u) tatsachlich das Max. von h(u) in diesemIntervall. Der Maximalwert ist

h(u∗) =

√1

1 + (βb)2x + βb

√(1− 1

1 + (βb)2)

x =

√1

1 + (βb)2√

x + βb

√(βb)2

1 + (βb)2√

x

=( 1√

1 + (βb)2+

(βb)2√1 + (βb)2

)√x

=1 + (βb)2√1 + (βb)2

√x =

√1 + (βb)2

√x

In Bezug auf die Bellman-Gl. bedeutet dies:

b√

x =√

1 + (βb)2√

x ⇐⇒ b =√

1 + (βb)2

⇐⇒ b2 = 1 + β2 b2

⇐⇒(1− β2

)b2 = 1

⇐ b =1

+√

1− β2

[Es muss +√... gewahlt werden, damit b > 0.]Also wird durch folgende Funktionen eine Losung der zeitunabhangigen Bellman-Gl. definiert:

V (x) =√

x

1− β2mit u∗(x) =

x

1 + (βb)2=

x

1 + β2

1−β2

=x

1−β2+β2

1−β2

=(1− β2

)x

bzw.

V (x) =√

x

1−(

11+%

)2 mit u∗(x) =(1−

(1

1+%

)2)x

d) Der zeitliche Verlauf xt der Zustandsvariable bei der Politik ut = u∗(xt) ist durch

xt+1 = xt − u∗(xt) =[1−

(1− β2

)]xt = β2 xt =

(1

1+%

)2xt

beschrieben. D.h. xt stellt eine geometrisch abklingende Folge mit quadriertem Diskontfaktorals Dampfungsfaktor dar:

xt = β2t x0 =(

11+%

)2tx0, t = 0, 1, . . .

29

Page 30: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe DP.1c: Gegeben ist folgendes dynam. Optimierungsproblem in stetiger Zeit (A > 0):

maxu(t)≥0

{∫ T

t=0

√u(t) dt + A x(T )

}unt. d. NB

{x(0) = x0,x(t) = −u(t) fur t ≥ 0

a) Stellen Sie die Hamilton-Jacobi-Bellman-Gleichung fur dieses Problem auf.

b) Bestimmen Sie Funktionen a(t), b(t) so, dass V (t, x) = a(t) + b(t) x ein Losung der HJB-Gleichung ist und geben Sie die zugehorige optimale Politik u∗(t, x) an.

c) Welchen zeitl. Verlauf hat die Zustandsvariable x(t) bei Anwendung der optimalen Politik?

Losung: a) Hamilton-Jacobi-Bellman-Gleichung des Problems:Generell:

−∂V∂t (t, x) = max

u∈U(t,x)H(t, x, u, ∂V

∂x (t, x)), V (T, x) = S(T, x)

Hier mit H(t, x, u, λ) =√

u− λ u, U(t, x) = {u |u ≥ 0} = R+, S(T, x) = A x:

−∂V∂t (t, x) = max

u≥0

{√u− u ∂V

∂x (t, x)}, V (T, x) = A x

b) Mit dem parametrischen Ansatz V (t, x) = a(t) + b(t) x ist

∂V∂t = a(t) + b(t) x, ∂V

∂x = b(t)

und die HJB-Gleichung wird zu

−a(t)− b(t) x = maxu≥0

{√u− u b(t)

}, a(T ) = 0, b(T ) = A

Das Maximum der konkaven Funktion h(u) =√

u−u b(t) wird dort angenommen, wo h′(u) = 0,sofern diese Gl. eine Losung u > 0 hat (sonst ist u = 0 oder u =∞):

h′(u) =1

2√

u− b(t) = 0 ⇐⇒

√u =

12 b(t)

⇐⇒ u =1

4 b2(t)=: u∗(t, x)

[wobei implizit b(t) > 0 vorausgesetzt wird – das wird sich tatsachlich spater zeigen.]Damit wird die HJB-Gleichung fur V (t, x) = a(t) + b(t) x zu:

−a(t)− b(t) x = 12 b(t) −

14 b2(t)

b(t) = 12 b(t) −

14 b(t) = 1

4 b(t)

und der Koeffizientenvergleich liefert die folgenden Differentialgleichungen fur a(t), b(t):

a(t) = − 14 b(t) , b(t) = 0

Aus b = 0 folgt b(t) = const. Da b(T ) = A, folgt b(t) = A ∀ t [und dies ist > 0].Einsetzen von b(t) = A in die erste Diff.gl. macht diese zu a(t) = − 1

4A2 mit der allg. Losung

a(t) = − 14A2 t + C

Aus a(T ) = 0 ergibt sich die Integrationskonstante C zu C = 14A2 T , so dass

a(t) = 14A2 (T − t)

Insgesamt haben wir

V (t, x) = 14A2 (T − t) + A x mit u∗(t, x) = 1

4 b2(t)= 1

4 A2

als Losung der HJB-Gleichungc) Der zeitliche Verlauf von x(t) ergibt sich aus x(0) = x0, x(t) = −u(t) = −u∗(t, x) = − 1

4 A2 zux(t) = x0 − t

4A2 .(Die Ergebnisformeln sind vollkommen analog zu denen des zeitdiskreten Szenarios, Aufg. DP.1a.)

30

Page 31: Aufgabensammlung zur Dynamischen Optimierung“ · PDF fileL¨osung: Normalform: max f ... Hier gibt es also nur den Kuhn-Tucker-Punkt: (x = 0,y = 0). Da die negative Zielfkt −f

Aufgabe DP.1d: Gegeben ist folgendes zeitstetige dynam. Optimierungsproblem:

maxu(t)≥0

{∫ ∞

t=0e−%t

√u(t) dt

}unt. d. NB

{x(0) = x0 > 0, (x0 gegeben),x(t) = −u(t) fur t ≥ 0

a) Stellen Sie die (zeitunabhangige) Bellman-Gleichung fur diese Problem auf.b) Bestimmen Sie die Konstante b > 0 so, dass V (x) = b

√x eine Losung der Bellman-

Gleichung ist und geben Sie die zugehorige Politik u∗(x) an.Zur Kontrolle: b =

√12% , d.h. V (x) =

√x2% ; fur u∗(x) ergibt sich: u∗(x) = 2% x.

c) Welchen Zeitverlauf x(t) hat die Zustandsvariable bei Anwendung der Politik u∗(x) aus b)?

Losung: a) Zeitunabh. Bellman-Gleichung allgemein: % V (x) = maxu∈U{f(x, u)+V ′(x) g(x, u)},hier:

% V (x) = maxu≥0

{√u− V ′(x) · u

}b) Mit dem Ansatz V (x) = b

√x ist V ′(x) = b

2√

xund die Bellman-Gl. fordert

% b√

x = maxu≥0

{√u− b

2√

xu}

Das Maximum der konkaven Funktion h(u) :=√

u − b2√

xu fur u ≥ 0 wird dort angenommen,

wo h′(u) = 0 ist (es sei denn, es gibt keine Losung u ≥ 0, was hier nicht der Fall ist):

h′(u) = 12√

u− b

2√

x= 0 ⇐⇒

√u = 1

b

√x ⇐⇒ u = x

b2=: u∗(x)

[Im Quadrierungsschritt wurde b > 0 angenommen; das spatere b wird so gewahlt, siehe unten.]Der Maximalwert von h(u) ist:

h(u∗) =√[

xb2

]− b

2√

x

[xb2

]= 1

b

√x− 1

b12

√x = 1

2b

√x

Die Bellman-Gleichung wird damit zu

% b√

x = 12b

√x

Dies ist genau dann fur alle x erfullt, wenn

% b = 12b ⇐⇒ b2 = 1

2% ⇐ b = +√

12%

[b = +√.., da b > 0 sein muss, siehe oben]Indem man die Argumentationskette ruckswarts durchlauft, ist gezeigt, dass

V (x) =√

x2% mit u∗(x) = x

b2= 2% x

eine Losung der Bellman-Gleichung ist.c) Der zeitliche Verlauf von x(t) bei der ”Politik“ u(x) = 2% x ergibt sich aus

x(t) = −u∗(x(t)

)= −2% x(t), x(0) = x0 ⇒ x(t) = e−2% tx0

Anmerkung: Der zeitliche Verlauf des optimalen Konsums (die ”open-loop“-Darstellung) er-gibt sich als u(t) = −x(t) = 2% e−2% t x0. Die feedback-Darstellung u∗(x) = 2% x beschreibtpragnanter als die open-loop Darstellung u(t), was hier die nutzenmaximierende Strategie ist:Pro Zeiteinheit den Anteil 2% des Restbestands x ”verspeisen“. Wenn z.B. % = 5% (pro Jahr),dann erhalt man maximalen Nutzen, wenn jedes Jahr 10% des noch verbliebenen Bestands kon-sumiert werden (sofern die Bellman-Gleichung hinreichend ist). In der zeitdiskreten Variantewar u∗(x) =

(1 −

(1

1+%

)2)x, was bei % = 0.05 mit 1 −

(1

1+%

)2 ≈ 0.093 = 9.3% ≈ 10% im We-sentlichen auf das gleiche Ergebnis fuhrt. Der Faktor 2 gegenuber der Diskontrate % ergibt sichnaturlich nur bei der unterstellten Momentan-Nutzenfunktion U(u) =

√u (statt z.B. U(u) = u

23

oder U(u) = ln(u) oder U(u) = −e−u oder ...).

31