nemesné jónás nikolett alkalmazása - web.cs.elte.hu · köszönetnyilvánítás ezúton...
Post on 30-Aug-2019
10 Views
Preview:
TRANSCRIPT
Eötvös Loránd Tudományegyetem
Természettudományi Kar
Nemesné Jónás Nikolett
Lagrange-féle multiplikátor módszer és
alkalmazása
Matematika BSc, Matematikai elemz® szakirány
Témavezet®:
Szekeres Béla János, tudományos segédmunkatárs
MTA-ELTE Numerikus Analízis és Nagy Hálózatok Kutatócsoport
Budapest, 2017
Köszönetnyilvánítás
Ezúton szeretnék köszönetet mondani témavezet®mnek, Szekeres Béla Jánosnak, aki fel-
keltette érdekl®désem a téma iránt, és segítségével, hasznos tanácsaival hozzájárult a
szakdolgozatom elkészüléséhez.
Köszönettel tartozom a családomnak az egyetemi éveim alatt nyújtott kitartó támogatá-
sukért.
2
Tartalomjegyzék
1. Bevezetés 4
2. Szükséges el®ismeretek 5
2.1. Parciális deriváltak és széls®értékek kapcsolata . . . . . . . . . . . . . . . . 5
2.2. Feltételes széls®érték probléma . . . . . . . . . . . . . . . . . . . . . . . . . 6
3. A Lagrange-multiplikátor módszer alkalmazásai 10
3.1. Többváltozós függvény, egy feltétel . . . . . . . . . . . . . . . . . . . . . . 10
3.2. Háromváltozós függvény, két feltétel . . . . . . . . . . . . . . . . . . . . . . 18
3.3. Feltételek egyenl®tlenségként . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4. További gyakorlati példák 22
4.1. Maximális terméshozam . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2. Henger felületének minimalizálása . . . . . . . . . . . . . . . . . . . . . . . 25
4.3. Maximális entrópia számítása . . . . . . . . . . . . . . . . . . . . . . . . . 26
3
1. fejezet
Bevezetés
A széls®érték feladatok fontos gyakorlati alkalmazása a matematikai analízisnek. Szakdol-
gozatom témája ezzel kapcsolatos, feltételes széls®értékek keresése Lagrange-multiplikátor
módszerrel.
A dolgozat els® fejezetében áttekintem az elmélethez kapcsolódó de�níciókat és téte-
leket a [1] munka alapján.
A második fejezetben egyszer¶ példákon keresztül mutatom be a Lagrange-multiplikátor
módszer alkalmazását.
A harmadik fejezetben pedig néhány gyakorlatban is el®forduló alkalmazást vizsgálok:
terméshozam optimalizálása adott költség- és hozamfüggvények mellett, adott térfogatú
henger felületének minimalizálása, illetve entrópiafüggvény maximalizálása.
4
2. fejezet
Szükséges el®ismeretek
2.1. Parciális deriváltak és széls®értékek kapcsolata
2.1.1. De�níció. Az f függvénynek lokális minimuma (maximuma) van az a ∈ Rn pont-
ban, ha van a-nak olyan K környezete, amiben f értelmezve van, és minden x ∈ K-ra:
f(a) ≤ f(x) (illetve(f(a) ≥ f(x)). Ebben az esetben az f függvény lokális minimumhelyé-
nek (maximumhelyének) nevezzük az a ∈ Rn pontot.
2.1.2. Megjegyzés. Ha minden a-n kívüli x ∈ K-ra f(x) < f(a) (illetve f(x) > f(a)),
akkor szigorúan lokális maximumról, maximumhelyr®l (illetve szigorúan lokális minimum-
ról, minimumhelyr®l) beszélünk. Ezeket közösen lokális széls®értéknek, széls®értékhelynek
nevezzük.
2.1.3. Tétel. Ha az f függvénynek az a ∈ Rn pontban lokális széls®értéke van, és létezik
mindegyik parciális deriváltja a-ban, akkor ezek a parciális deriváltak elt¶nnek ebben az a
pontban, azaz: ∂if(a) = 0,∀i = 1...n-re.
2.1.4. Tétel. Legyen A ⊂ Rn halmaz korlátos és zárt, f : A 7→ R folytonos. Tegyük
fel, hogy f-nek A belsejének minden pontjában léteznek a parciális deriváltjai. Ekkor f a
maximumát (vagy minimumát) A határán, vagy pedig olyan bels® pontban veszi fel, ahol
a parciális deriváltak nullák.
5
2.1.5. De�níció. Jacobi-mátrixnak nevezzük egy n-változós függvény els®rend¶ parciális
deriváltjait tartalmazó mátrixot.
J =
∂f1∂x1
. . . ∂f1∂xn
.... . .
...
∂fm∂x1
. . . ∂fm∂xn
.
2.1.6. De�níció. Legyen f(x), x ∈ D(⊂ Rn) n-változós függvény, melynek létezik minden
másodrend¶ parciális deriváltja az a ∈ D pontban. Hesse-mátrixnak nevezzük az f függvény
másodrend¶ parciális deriváltjaiból alkotott négyzetes mátrixot.
Hf (a) =
∂2f∂x21
(a) ∂2f∂x1∂x2
(a) . . . ∂2f∂x1∂xn
(a)
∂2f∂x2∂x1
(a) ∂2f∂x22
(a) . . . ∂2f∂x2∂xn
(a)...
.... . .
...
∂2f∂xn∂x1
(a) ∂2f∂xn∂x2
(a) . . . ∂2f∂x2n
(a)
.
2.2. Feltételes széls®érték probléma
A feltételes széls®érték keresésekor úgy keressük az adott f(x) függvény széls®értékét,
hogy közben egy, vagy több feltételnek is teljesülnie kell.
2.2.1. Tétel. (Lagrange-féle multiplikátor-módszer) Legyen f(x), x ∈ D(⊂ Rn) n-
változós függvény folytonosan di�erenciálható az a ∈ D pontban, továbbá gi, ∀i = 1...m
folytonosan di�erenciálható függvények, melyek értelmezve vannak az a pontban, és teljesül
rá, hogy gi(a) = 0, valamint g′i(a) Jacobi-mátrix sorvektorai lineárisan függetlenek. Ha f-
nek feltételes széls®értéke van az a-ban a g1(x) = 0, g2(x) = 0, . . . , gm(x) = 0 feltétel
mellett, akkor az L(x) = f(x) + λ1g1(x) + λ2g2(x) + . . . + λmgm(x) = f(x) +m∑i=1
λigi(x)
Lagrange függvény összes parciális deriváltja elt¶nik az a pontban:
∂L
∂xi(a) = 0, (i = 1, 2 . . . n).
Ez a Lagrange-féle multiplikátor módszer szükséges feltétele.
2.2.2. Megjegyzés. A tételben szerepl® λi skalárok a Lagrange-multiplikátorok, amelyek
közül legalább az egyik nem nulla.
6
A bizonyítás el®tt szükséges az egyváltozós implicitfüggvény-tétel ismerete:
2.2.3. Tétel. (Egyváltozós implicitfüggvény-tétel) Tegyük fel, hogy a kétváltozós,
valós érték¶ f függvény elt¶nik az (a, b) ∈ R2 pontban, és folytonos az (a, b) egy kör-
nyezetében. Tegyük fel, hogy a ∂2f parciális derivált létezik, véges és nullától különböz® az
(a, b) pont egy környezetében. Ekkor léteznek olyan δ és ε pozitív számok, hogy:
1. Minden x ∈ (a − δ, a + δ)-hoz létezik egyetlen ϕ(x) ∈ (b − ε, b + ε) szám, melyre
f(x, ϕ(x)) = 0, továbbá
2. az így de�niált ϕ függvény folytonos az (a− δ, a+ δ) intervallumban.
A 2.2.1 Tétel bizonyítása. A bizonyítást n = 2, m = 1 és feltételes minimum esetén
végezzük, de a feltételes maximum esete is hasonlóan gondolható meg. A feltételek alapján
a g := g1 : R2 → R függvény folytonosan di�erenciálható, és az a := (a1, a2) pontban
g(a1, a2) = 0. Ebben a pontban a rangfeltétel
rang(∂1g(a1, a2), ∂2g(a1, a2)) = 1.
Ezért feltehetjük, hogy ∂2g(a1, a2) 6= 0. Ekkor az egyváltozós implicitfüggvény-tétel szerint
létezik a1-nek K(a1) és a2-nek K(a2) környezete, és létezik olyan ϕ : K(a1) → K(a2)
di�erenciálható függvény, amelyre
minden x ∈ K(a1) esetén g(x, ϕ(x)) = 0,
és ϕ(a1) = a2. Ez azt jelenti, hogy
H ={(x, y) ∈ R2 | g(x, y) = 0
}⊃{(x, ϕ(x)) ∈ R2 | x ∈ K(a1)
}=: H∗. (2.1)
Azaz g(a1, ϕ(a1)) = 0, melyet deriválva teljesül, hogy
∂1g(a1, a2) + ϕ′(a1)∂2g(a1, a2) = 0. (2.2)
Mivel az f függvény H halmazra vett lesz¶kítésének lokális minimuma van az (a1, a2) ∈ H
pontban, ezért létezik r > 0, hogy az (a1, a2) pont Kr(a1, a2) környezetére
minden (x, y) ∈ Kr(a1, a2) ∩H esetén f(x, y) ≥ f(a1, a2). (2.3)
7
A (2.1) alapján x ∈ K(a1) esetén (x, ϕ(x)) ∈ H∗ ⊂ H. Felhasználva, hogy ϕ folytonos
K(a1)-en, meggondolható, hogy létezik olyan K∗(a1) ⊂ K(a1) környezet, hogy
minden x ∈ K∗(a1) esetén (x, ϕ(x)) ∈ Kr(a1, a2) ∩H.
Így (2.3)-ból következik, hogy
minden x ∈ K∗(a1) esetén f(x, ϕ(x)) ≥ f(a1, ϕ(a1)) = f(a1, a2).
Ez azt jelenti, hogy a
h : K∗(a1)→ R,
h(x) := f(x, ϕ(x))
valós függvénynek lokális minimuma van az a1 pontban. A h függvény di�erenciálható
(di�erenciálható függvények kompozíciója), ezért h′(a1) = 0. A kompozíciófüggvény deri-
válási szabályai alapján
h′(x) = f ′(x, ϕ(x)) · (x′, ϕ′(x)) =
= 〈(∂1f(x, ϕ(x)), ∂2f(x, ϕ(x))) , (1, ϕ(x))〉 =
= ∂1f(x, ϕ(x)) + ϕ′(x)∂2f(x, ϕ(x)).
Ezért
h′(a1) = ∂1f(a1, a2) + ϕ′(a1)∂2f(a1, a2) = 0. (2.4)
Legyen λ ∈ R tetsz®leges szám, és szorozzuk meg λ-val a (2.2) egyenl®séget, majd adjuk
össze a (2.4) egyenl®séggel, így nyerjük az alábbi azonosságot
∂1f(a1, a2) + λ∂1g(a1, a2) + ϕ′(a1) [∂2f(a1, a2) + λ∂2g(a1, a2)] = 0. (2.5)
A λ szám megválasztható úgy, hogy
∂2f(a1, a2) + λ∗∂2g(a1, a2) = 0 (2.6)(a λ∗ := −∂2f(a1, a2)
∂2g(a1, a2)megfelel®
). Ha a λ∗ esetén (2.5)-ben a szögletes zárójelben lév®
tényez® 0, akkor
∂1f(a1, a2) + λ∗∂1g(a1, a2) = 0 (2.7)
8
is teljesül. Összesítve az eredményeket, azt kapjuk, hogy ha az f függvénynek feltételes
minimuma van a g = 0 feltétel mellett, az a = (a1, a2) pontban, akkor az F := f + λ∗g
függvénynek az els® változó szerinti parciális deriváltja 0 (ezt mutatja (2.7)), és a második
változó szerinti parciális deriváltja is 0 (ezt mutatja (2.6)).
Tehát
F ′(a) = F ′(a1, a2) = (∂1F (a1, a2), ∂2F (a1, a2)) = 0.
�
2.2.4. Tétel. (Elégséges feltétel) A 2.2.1 Tétel feltételei mellett az L Lagrange-függvény
Hesse-mátrixa az a pontban pozitív de�nit, akkor az f függvénynek lokális minimuma van
az a pontban, a gi = 0, i = 1...m feltétel mellett, ha pedig az L Lagrange-függvény Hesse-
mátrixa az a pontban negatív de�nit, akkor az f függvénynek lokális minimuma van az a
pontban a gi = 0, i = 1...m feltétel mellett.
9
3. fejezet
A Lagrange-multiplikátor módszer
alkalmazásai
3.1. Többváltozós függvény, egy feltétel
3.1.1. Példa. Határozzuk meg az f(x, y) = x2+y2 függvény széls®értékhelyét a g(x, y) =
x+ y = 10 feltétel mellett.
Els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els®rend¶ parciális deri-
váltakat, amiket egyenl®vé teszünk nullával.
L(x, y) = x2 + y2 + λ(x+ y − 10).
∂L
∂x= 2x+ λ = 0, (3.1)
∂L
∂y= 2y + λ = 0. (3.2)
A (3.1) és (3.2) egyenletekb®l lehetséges széls®érték helyeket kapunk, de ezek még
függnek a bevezetett λ multiplikátortól:
x =−λ2, (3.3)
y =−λ2. (3.4)
10
A (3.3), (3.4) formulákból következik, hogy −λ2= x = y, továbbá az x+y = 10 feltétel
miatt x = y = 5.
Az f(x, y) = x2 + y2 függvény széls®értékei az x + y = 10 feltétel mellett az (x, y) =
(5, 5) pont, aminek értéke:
f(5, 5) = 52 + 52 = 25 + 25 = 50.
Ez az érték a függvény minimuma, mivel a feltételnek megfelel® (x, y) pontpárokat behe-
lyettesítve 50-nél nagyobb értékeket kapunk.
3.1.2. Példa. Határozzuk meg az f(x, y) = x+2y függvény széls®értékhelyét a g(x, y) =
x2 + y2 = 4 feltétel mellett. Els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk
az els®rend¶ parciális deriváltakat.
L(x, y, λ) = x+ 2y + λ(x2 + y2 − 4).
Els®rend¶ parciális deriváltak, amiket egyenl®vé teszünk nullával:
∂L
∂x= 1 + 2xλ = 0, (3.5)
11
∂L
∂y= 2 + 2yλ = 0. (3.6)
Az (3.5) és (3.6) egyenletekb®l lehetséges széls®értékhelyeket kapunk, de ezek még
függnek a bevezetett λ multiplikátortól:
x =−12λ, (3.7)
y =−1λ. (3.8)
A (3.7) és (3.8) értékeket a feltételbe visszahelyettesítve kapunk a λ-ra megfelel® ér-
tékeket, amiket a parciális deriváltakba beírva megkapjuk a keresett (x, y) helyet:
λ1 =
√5
4, (3.9)
λ2 = −√5
4. (3.10)
Mindkét λ esetén vissza kell helyettesítenünk a parciális deriváltakba, hogy az összes
lehetséges széls®értékhelyet megkapjuk:
• λ1 =√5
4esetén:
1 + 2x
√5
4= 0, (3.11)
2 + 2y
√5
4= 0. (3.12)
A (3.11) és (3.12) egyenletekb®l álló egyenletrendszert megoldva kapjuk az egyik lehetséges
széls®érték helyet:
(x1, y1) =
(−2√5,−4√5
).
• λ2 = −
(√5
4
)esetén hasonlóan járunk el:
1 + 2x
(−√5
4
)= 0, (3.13)
12
2 + 2y
(−√5
4
)= 0. (3.14)
A (3.13) és (3.14) egyenletekb®l álló egyenletrendszert megoldva kapjuk a másik lehetséges
széls®értékhelyet:
(x2, y2) =
(2√5,4√5
).
Az f(x, y) = x + 2y függvénynek a g(x, y) = x2 + y2 = 4 feltétel mellett az (x1, y1) =(−2√5,−4√5
)és (x2, y2) =
(2√5,4√5
)pontokban van széls®értéke, aminek értékei:
• (x1, y1) esetében minimuma van:
f
(−2√5,−4√5
)=
(−2√5+ 2
(−4√5
))=−10√
5≈ −4, 47.
• (x2, y2) esetében maximuma van:
f
(2√5,4√5
)=
(2√5+ 2
(4√5
))=
10√5≈ 4, 47.
13
3.1.3. Példa. Határozzuk meg az f(x, y) = xy függvény széls®értékét a g(x, y) = 3x2 +
y2 = 6 feltétel mellett. Ahogyan eddig, el®ször a Lagrange-függvényt írjuk fel, majd
kiszámoljuk a parciális deriváltakat:
L(x, y) = xy + λ(3x2 + y2 − 6). (3.15)
∂L
∂x= y + λ6x = 0, (3.16)
∂L
∂y= x+ λ2y = 0. (3.17)
A (3.16) és a (3.17) egyenleteket rendezve kapjuk az alábbi összefüggést:
y = −λ6x, (3.18)
x = −λ2y. (3.19)
Felhasználva a (3.19) formulát, y-ra a következ® egyenl®séget kapjuk:
y = 12λ2y. (3.20)
Ha y nulla, akkor a (3.19) miatt x-nek is nullának kell lennie, de ez nem teljesítené a
feltételt, így y 6= 0. Tehát a (3.20) egyenl®ség csak akkor teljesülhet, ha
12λ2 = 1.
Helyettesítsük be a (3.18) egyenletet a feltételbe, majd hozzuk megfelel® alakra:
3x2 + (−λ6x)2 = 6
3x2 + 36λ2x2 = 6,
ami ekvivalens azzal, hogy
3x2 + 3(12λ2)x2 = 6. (3.21)
Mivel 12λ2 = 1, ezért (3.21) a következ®t jelenti:
3x2 + 3x2 = 6. (3.22)
(3.22)-ból következik, hogy x = ±1, y = ±√3.
Az f(x, y) = xy függvény széls®értékhelye és annak értéke a g(x, y) = 3x2+y2 = 6 feltétel
mellett a következ®k:
14
f(1,√3) =
√3, f(1,−
√3) = −
√3
f(−1,√3) = −
√3, f(−1,−
√3) =
√3
Az (x, y) = (1,√3) és a (x, y) = (−1,−
√3) pontokban maximuma, míg a (x, y) =
(1,−√3) és a (x, y) = (−1,
√3) pontokban pedig minimuma van.
3.1.4. Példa. Keressük meg az f(x, y, z) = x2−y2 széls®értékét a g(x, y, z) = x2+2y2+
3z2 = 1 feltétel mellett. A Lagrange-függvény felírása után meghatározzuk a parciális
deriváltakat:
L(x, y, z) = x2 − y2 + λ(x2 + 2y2 + 3z2 − 1).
∂L
∂x= 2x+ 2λx = 0, (3.23)
∂L
∂y= −2y + 4λy = 0, (3.24)
∂L
∂z= 6λz = 0. (3.25)
A (3.25) egyenlet csak akkor teljesülhet, ha λ = 0 vagy z = 0.
15
• Els®ként nézzük meg azt az esetet, amikor λ = 0. Ebben az esetben, a (3.23) és a
(3.24) formulákból következik, hogy x = 0 és y = 0. Így a feltételb®l azt kapjuk,
hogy z = ± 1√3.
(x1, y1, z1) =
(0, 0,
1√3
),
(x2, y2, z2) =
(0, 0,− 1√
3
).
• Másodszor nézzük meg azt az esetet, amikor a λ 6= 0. A (3.25) egyenletb®l kö-
vetkezik, hogy z = 0. Mivel a z változó csak a feltételben szerepel, így további
esetszétválasztásra van szükségünk.
1. Ha x = 0. Ekkor a feltételb®l következik, hogy y = ± 1√2, azaz
(x3, y3, z3) =
(0,
1√2, 0
),
(x4, y4, z4) =
(0,− 1√
2, 0
).
1. Ha x 6= 0. Ebben az esetben a (3.23) egyenl®ség csak akkor teljesül, ha λ = 1.
Ezzel együtt (3.24) csak akkor igaz, ha y = 0. Ezeket a feltételbe visszahelyet-
tesítve megkapjuk az utolsó két széls®értékhelyet:
(x5, y5, z5) = (1, 0, 0),
(x6, y6, z6) = (−1, 0, 0).
Végeredményben kapott széls®értékhelyek, és ott a függvény értéke:
f
(0, 0,
1√3
)= 0, f
(0, 0,− 1√
3
)= 0,
f
(0, 0,
1√2
)=
1√2, f
(0, 0,− 1√
2
)= − 1√
2,
f(1, 0, 0) = 1, f(−1, 0, 0) = 1.
3.1.5. Példa. Határozzuk meg az f(x, y, z) = x + y + 2z függvény széls®értékhelyét a
g(x, y, z) = x2 + y2 + z2 = 3 feltétel mellett. El®ször felírjuk a Lagrange függvényt a λ
16
multiplikátor bevezetésével, majd meghatározzuk az x, y, és z szerinti parciális deriválta-
kat:
L(x, y, z) = x+ y + 2z + λ(x2 + y2 + z2 − 3). (3.26)
∂L
∂x= 1 + 2xλ = 0, (3.27)
∂L
∂y= 1 + 2yλ = 0, (3.28)
∂L
∂z= 2 + 2zλ = 0. (3.29)
A (3.27), (3.28) és a (3.29) által alkotott egyenletrendszert elvégezve kapuk egy lehet-
séges (x, y, z) széls®érték helyet, de ezek függnek λ-tól:
x = − 1
2λ, (3.30)
y = − 1
2λ, (3.31)
z = −1
λ. (3.32)
Ezeket a feltételbe visszahelyettesítve kapunk λ-ra két megfelel® értéket:
λ1 = −1√2, (3.33)
λ2 =1√2. (3.34)
A (3.33) és (3.34) segítségével megkapjuk a feltételt kielégít® széls®értékhelyeket:
1. λ1 = −1√2esetén:
(x1, y1, z1) =
(√2
2,
√2
2,√2
).
2. λ2 =1√2esetén:
(x2, y2, z2) =
(−√2
2,−√2
2,−√2
).
17
Ebben a két pontban a függvény értéke a következ®:
f
(√2
2,
√2
2,√2
)=
√2
2+
√2
2+ 2√2 = 3
√2, ami a függvény maximuma,
f
(−√2
2,−√2
2,−√2
)= −√2
2−√2
2− 2√2 = −3
√2, ami pedig a függvény minimuma.
3.2. Háromváltozós függvény, két feltétel
Olyan eset is adódhat, amikor két feltételt is �gyelembe kell vennünk. Ekkor két λ mul-
tiplikátort is be kell vezetnünk. A következ® példában egy ilyen esetet vizsgálunk.
3.2.1. Példa. Határozzuk meg az f(x, y, z) = x2 +3xy+2y2 +4y+0.5z2 +12 függvény
széls®értékét a g1(x, y, z) = x+ y + z = 4 és a g2(x, y, z) = x− z = 2 feltételek mellett.
Els®ként írjuk fel a Lagrange-függvényt, majd határozzuk meg az els®rend¶ parciális de-
riváltakat.
L(x, y, z) = x2 + 3xy + 2y2 + 4x+ 0.5z2 + 12 + λ1(x+ y + z − 4) + λ2(x− z − 2).
Az els®rend¶ parciális deriváltak, amiket egyenl®vé teszünk nullával:
∂L
∂x= 2x+ 3y + 4 + λ1 + λ2 = 0, (3.35)
∂L
∂y= 3x+ 4y + λ1 = 0, (3.36)
∂L
∂z= z + λ1 − λ2 = 0. (3.37)
A (3.35), (3.36) és a (3.37) egyenletekb®l lehetséges széls®értékhelyeket kapunk, de
ezek még függnek a bevezetett λ1, λ2 multiplikátoroktól:
x = λ1 + 4λ2 + 16,
y = −λ1 − 12− 3λ2,
z = −λ1 + λ2.
18
A fenti (x, y, z) értéket a g1 és g2 feltételekb®l álló egyenletrendszerbe visszahelyettesítjük,
és így kapunk λ1-re, és λ2-re megfelel® eredményeket:
λ1 = −4,
λ2 = −2.
A λ1, és λ2 értékeket, a (3.35), (3.36) és a (3.37) parciális deriváltakba behelyettesítve
megkapjuk a feltételeknek eleget tev® (x, y, z) megoldásokat:
x = 4,
y = −2,
z = 2.
Az f(x, y, z) függvény széls®értékhelye a g1 és a g2 feltétel mellett az (x, y, z) = (4,−2, 2),
az értéke pedig : 42 + 3 · 4 · (−2) + 2 · (−2)2 + 4 · 4 + 0, 5 · 22 + 12 = 30. Ez az érték a
függvény minimuma, mert a feltételt kielégít® pontokat behelyettesítve nagyobb értéket
kapunk, például az (x, y, z) = (2, 2, 0) pont esetén a függvény értéke :
22 + 3 · 2 · 2 + 2 · 22 + 4 · 2 + 0, 5 · 02 + 12 = 44.
3.3. Feltételek egyenl®tlenségként
Amikor a feltétel, vagy a feltételek nem egyenl®ség, hanem egyenl®tlenség formájában
vannak megadva, a tartomány peremét, és a belsejét is külön-külön meg kell vizsgálni.
Ennek oka, hogy a lehetséges széls®értékek vagy a tartomány belsejében, vagy a peremen
találhatók a 2.1.4 Tétel szerint.
3.3.1. Példa. Határozzuk meg az f(x, y) = (x−1)2+(y−3)2 függvény széls®értékhelyét
a g1(x, y) = x+ y ≤ 2 és a g2(x, y) = y ≥ x feltételek mellett.
Ahogyan eddig, els®ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els®rend¶
parciális deriváltakat, majd ezeket egyenl®vé tesszük nullával:
L(x, y) = (x− 1)2 + (y − 3)2 + λ1(x+ y − 2) + λ2(x− y).
19
∂L
∂x= 2(x− 1) + λ1 + λ2 = 0, (3.38)
∂L
∂y= 2(y − 3) + λ1 − λ2 = 0. (3.39)
Azoknál a feladatoknál, ahol egyenl®tlenséggel vannak megadva a feltételek, ott több
esetet kell megvizsgálnunk. A lehetséges esetek a λ multiplikátorok és a feltételek alapján
kerülnek szétválasztásra:
λ1(x+ y − 2) = 0,
λ2(x− y) = 0.
• I. eset: amikor a tartomány belsejében nézzük meg a lehetséges széls®értékeket.
λ1 = 0, λ2 = 0:
Mivel mindkét λ nulla, ezért a 2(x − 1) = 0 és a 2(y − 3) = 0 egyenleteket megoldva
kapunk x-re, és y-ra lehetséges értéket: (x, y) = (1, 3). Ezt a pontot még ellen®riznünk
kell, hogy teljesítik-e a feltételeket:
1 + 3 = 4 � 2: nem teljesíti a feltételt, így ez a pont nem megfelel® széls®értékhely.
• II. eset: λ1 = 0, λ2 6= 0:
Mivel λ2 6= 0, ezért a második feltételb®l képzett λ2(x− y) = 0 akkor és csak akkor lehet
0, ha (x− y) = 0, ami ekvivalens azzal, hogy x = y. Ezek alapján a
2(x− 1) + λ2 = 0,
(y − 3)− λ2 = 0.
egyenletrendszert megoldva kapjuk, hogy λ2 = −2, majd ezt felhasználva kapjuk a követ-
kez® lehetséges széls®értékhelyet: (x, y) = (2, 2), amit még ellen®riznünk kell. A g1(x, y) =
x+ y ≤ 2 feltételbe visszahelyettesítve láthatjuk, hogy ezt a pont nem teljesíti, emiatt ez
is hamis megoldás.
• III. eset: λ1 6= 0, λ2 = 0:
20
Ennél az esetnél mivel λ1 6= 0, ezért a g1 feltételb®l indulunk ki. λ1(x + y − 2) = 0
csak akkor lehet, ha (x+ y − 2) = 0, amib®l következik, hogy x = 2− y. Hasonlóan a II.
esethez megoldjuk a
2(x− 1) + λ1 = 0,
(y − 3) + λ1 = 0
egyenletrendszert, ami után megkapjuk a λ1 = −2 + 2y és az (x, y) = (0, 2) eredményt.
Ez az (x, y) eredmény megfelel® széls®értékhely, mert a g1 és a g2 feltételt is teljesíti. Az
f(x, y) = (x− 1)2 + (y − 3)2 függvénynek ebben a pontban az értéke:
f(0, 2) = (0− 1)2 + (2− 3)2 = 2.
• IV. eset, amikor egyik λ érték sem nulla: λ1 6= 0, λ2 6= 0.
Ekkor a λ1(x + y − 2) = 0 és λ2(x − y) = 0 egyenletekb®l kiindulva kapunk x-re és y-ra
megfelel® értéket. Mivel egyik λ se nulla, ezért az
x+ y − 2 = 0,
x− y = 0
egyenletrendszert kell megoldanunk, amib®l következik, hogy x = 1, y = 1, λ1 = 2,
λ2 = −2. A kapott (x, y) = (1, 1) értéket ellen®riznünk kell. Visszahelyettesítjük a g1 és a
g2 feltételbe, és láthatjuk, hogy mindkett®t teljesíti, így az eredeti függvénynek az (1, 1)
pontban is van széls®értéke, aminek értéke:
f(1, 1) = (1− 1)2 + (1− 3)2 = 4.
Végeredményben a négy eset megvizsgálása után azt kaptuk eredményül, hogy az eredeti
f(x, y) = (x− 1)2 + (y − 3)2 függvénynek a g1 és a g2 feltétel mellett maximuma van az
(x, y) = (1, 1) pontban, értéke 4, és minimuma van az (x, y) = (0, 2) pontban, ahol az
értéke 2.
21
4. fejezet
További gyakorlati példák
4.1. Maximális terméshozam
4.1.1. Példa. Egy gazdaság A,B,C tábláján a talajtól függ®en más-más fajta m¶trágyát
használ. Megállapították, hogy az A táblán a holdankénti terméshozam és a m¶trágya
mennyisége közötti kapcsolatot a 4+3x−2x2, a B táblán a 4+5y−y2, a C táblán pedig a
2+ 6z− 3z2 formulák tükrözik. Az A, B, C táblák nagysága rendre: 500, 200, és 100 hold
nagyságú. A különböz® m¶trágyafajták milyen mennyisége mellett lesz a terméshozam
maximális a 3 táblán együtt, azon feltétel mellett, hogy a m¶trágya beszerzésére 20000
Ft áll rendelkezésre, és a m¶trágyák egységára 40, 30, 20 Ft?
Megoldás. A feladatban a maximális terméshozamot kell meghatározni úgy, hogy telje-
süljön a feltétel az adott adatok mellett. A feltétel függvénye a következ® lesz:
g(x, y, z) = 500 · 40x+ 200 · 30y + 100 · 20z = 20000x+ 6000y + 2000z ≤ 20000 (4.1)
ami a következ®k alapján áll össze:
Az A táblára az x fajta m¶trágya kell, aminek az egységára 40 Ft, a tábla nagysága 500
hold, ezért:
A := 500 · 40x.
22
A másik kett®, B és C táblákra vonatkozó összefüggésekre hasonlóan adódik, hogy:
B := 200 · 30y,
C := 100 · 20z.
Ezek összege legfeljebb 20000, mert a beszerzésre ekkora keretösszeg áll rendelkezésre,
továbbá
x, y, z ≥ 0. (4.2)
Amit pedig maximalizálnunk kell, az
F (x, y, z) = 500(4 + 3x− 2x2) + 200(4 + 5y − y2) + 100(2 + 6z − 3z2).
Ez a terméshozam és a m¶trágyák mennyisége közti kapcsolatot adja meg, �gyelembe
véve a táblák nagyságát.
A (4.1) és a (4.2) feltételek egy tetraédert határoznak meg. Ebben az esetben a (2.1.4)
Tétel szerint meg kell néznünk, hogy a célfüggvény a tartomány belsejében vagy a peremén
veszi fel a széls®értékét.
Amennyiben a tartomány belsejében, úgy a 2.1.3. Tétel szerint teljesül a következ®
egyenletrendszer:∂F
∂x= 1500− 2000x = 0, (4.3)
∂F
∂y= 1000− 400y = 0, (4.4)
∂F
∂z= 600− 600z = 0. (4.5)
A (4.3), (4.4) és a (4.5) egyenletekb®l kapunk x, y, z-re lehetséges értékeket, amit le
kell ellen®riznünk, hogy teljesíti-e a feltételt.
x =1500
2000=
3
4,
y =1000
400= 2.5,
z =600
600= 1.
A feltételbe visszahelyettesítve kapjuk, hogy
23
20000 · 34+ 6000 · 2.5 + 2000 · 1 = 32000 � 20000,
ezért maximum csak a peremen lehet, ami azt jelenti, hogy a feltétel az alábbi lesz:
g(x, y, z) = 500 · 40x+ 200 · 30y + 100 · 20z = 20000x+ 6000y + 2000z = 20000. (4.6)
A maximalizálandó F függvény és a (4.6) feltételb®l álló Lagrange-függvény a követ-
kez®:
L(x, y, z) = 500(4 + 3x− 2x2) + 200(4 + 5y − y2) + 100(2 + 6z − 3z2)+
+λ(20000x+ 6000y + 2000z − 20000).
Az x, y és z szerinti parciális deriváltak:
∂L
∂x= 500(3− 4x) + 20000λ = 0, (4.7)
∂L
∂y= 200(5− 2y) + 6000λ = 0, (4.8)
∂L
∂z= 100(6− 6z) + 2000λ = 0. (4.9)
A (4.7), (4.8) és a (4.9) egyenletek megoldásaként kapjuk, hogy
x =3
4+ 10λ, (4.10)
y =5
2+ 15λ, (4.11)
z = 1 +10
3λ. (4.12)
Ezek az (x, y, z) értékek még függnek λ-tól, de a feltételbe visszahelyettesítve kapunk
λ-ra helyes értéket, amib®l már következik a feladat megoldása:
20000
(3
4+ 10λ
)+ 6000
(5
2+ 15λ
)+ 2000
(1 +
10
3λ
)= 20000. (4.13)
A (4.13) egyenletb®l ekvivalens átalakításokkal kapjuk λ-ra a következ® értéket:
λ = − 18
445.
24
Ezt a λ-t felhasználva megkapjuk a helyes megoldást:
x =3
4+ 10
(−18445
)=
123
356≈ 0, 345,
y =5
2+ 15
(−18445
)=
337
178≈ 1, 893,
z = 1 +10
3
(−18445
)=
77
89≈ 0, 865.
A feladatban kért maximális terméshozam az (x, y, z) = (0.345, 1.893, 0.865) mennyiségek
mellett teljesül.
4.2. Henger felületének minimalizálása
4.2.1. Példa. Határozzuk meg, hogy adott V térfogat esetén milyen sugár és magasság
mellett lesz a henger felülete minimális. Kör alapú henger felülete:
A = 2πr2 + 2πrh,
ahol r a sugár és h a magasság. A térfogat adott, ami legyen:
V = πr2h.
Ezek az adatok alapján fel tudjuk írni a Lagrange-függvényt, ahol A a minimalizálandó
függvény, V pedig a feltétel:
L(r, h) = 2πr2 + 2πrh+ λ(πr2h− V ).
Készítsük el a parciális deriváltakat, amiket egyenl®vé teszünk nullával:
∂L
∂r= 4πr + 2πh+ λπrh = 0, (4.14)
∂L
∂h= 2πr + λπr2 = 0. (4.15)
Vegyük észre, hogy a (4.14) és a (4.15) formulákat átrendezve, fel tudjuk írni a kett®
egyenlet arányát, amib®l kapunk h-ra és r-re egy helyes összefüggést:
4πr + 2πh = −λπrh,
2πr = −λπr2.
25
Most vegyük ezek arányát, és hozzuk egyszer¶bb alakra:
4πr + 2πh
2πr=−λπrh−λπr2
,
amib®l következik, hogy2r + h
r=h
r. (4.16)
A (4.16) formulából ekvivalens átalakítással a következ® összefüggést kapjuk:
h = 2r. (4.17)
Azaz a henger felülete minimális lesz (4.17) összefüggés esetén, ami azt jelenti, hogy a
magasság kétszerese a sugárnak. Ezek után még vissza kell helyettesítünk a térfogatot
meghatározó összefüggésbe, hogy r-re, és h-ra megkapjuk a megfelel® értéket:
V = πr2h = πr22r.
r =3
√V
2π,
h = 2r = 23
√V
2π.
4.3. Maximális entrópia számítása
4.3.1. Példa. Legyen X a természetes számokon értelmezett valószín¶ségi változó, mely-
nek eloszlása P{X = i} = pi, i = 0, 1, 2, . . .
Célunk az entrópia maximalizálása, az E{X} = 13.5 várható érték feltétel mellett, ahol
az entrópia függvény az alábbi formulával adott:
H(X) = −∞∑i=0
pilog(pi). (4.18)
Továbbá felhasználjuk az alábbi két feltételt:
∞∑i=0
pi = 1, (4.19)
26
azaz, hogy {pi}i∈N eloszlás, illetve a várható értéke:
E {X} =∞∑i=0
i · pi = 13.5, (4.20)
ahol pi az i-dik elemi esemény valószín¶sége.
A (4.18), (4.19) és (4.20) formulák segítségével fel tudjuk írni a Lagrange függvényt a
feladat megoldásához:
L = −∞∑i=0
pilog(pi) + λ1
((∞∑i=0
i · pi)− 13.5
)+ λ2
((∞∑i=0
pi
)− 1
).
Els®ként megnézzük a Lagrange-függvény pi szerinti deriváltját:
∂L
∂pi= −log(pi)− 1 + λ1 · i+ λ2 = 0, ahol i = 0, 1, 2, . . . (4.21)
A (4.21) egyenletb®l ekvivalens átalakításokkal kifejezzük pi -t:
log (pi) = −1 + λ1 · i+ λ2
elog(pi) = eλi·i︸︷︷︸αi
· eλ2−1︸ ︷︷ ︸β
pi = αi · β, i = 0, 1, 2, . . . (4.22)
Ezzel beláttuk, hogy {pi : i = 0, 1, 2, . . .} egy mértani sor, ami az eloszlásparaméterek (α
és β) meghatározásánál segítségünkre lesz, ugyanis fel tudjuk használni az alábbi, mértani
sor összegképletére vonatkozó azonosságot:
∞∑i=0
pi =1
(1− p).
Ez alapján tudjuk kiszámolni λ2-re vonatkozó összefüggést:
∞∑i=0
pi =∞∑i=0
αi · β = β∞∑i=0
αi =β
(1− α). (4.23)
A (4.19) és (4.23) egyenletek alapján ki tudjuk fejezni β-t:
β = 1− α.
27
A α eloszlásparamétert a (4.20) és (4.22) azonosságok felhasználásával számolhatjuk
ki:
∞∑i=0
i · pi =∞∑i=0
i · αi · β = β
∞∑i=0
i · αi = β · α∞∑i=0
i · α(i−1) = β · α
(∞∑i=0
αi
)′=
= β · α ·(
1
1− α
)′= β · α ·
(1
(1− α)2
).
Mivel az el®z® lépésben kaptuk, hogy β = 1− α, ezért végeredményben:∞∑i=0
i · pi =α
1− α,
azaz
E {X} = α
1− α= 13.5, amib®l következik, hogy α =
13.5
14.5és β =
2
29.
Innen adódnak a Lagrange-multiplikátorok értékei:
λ1 = log2(α) = log2
(13.5
14.5
),
λ2 = log2(β) = log2
(2
29
).
A fentiekben azt mutattuk meg, hogy a {pi : i = 0, 1, 2 . . .} a feltételes entrópiafüggvény
széls®értékhelye, azt azonban nem tudjuk, hogy minimum, vagy maximum. Ezért legyen
{pi}i∈N eloszlás a következ® alakú
pi =
1
2, ha i = 13 vagy i = 14,
0, egyébként
Világos, hogy erre teljesülnek a (4.19) és (4.20) feltételek, azaz {pi}i∈N valóban való-
szín¶ségi eloszlás és a várható értéke 13,5. Az entrópia értéke:
−1
2(log(13) + log(14)) < 0.
Mivel
−∞∑i=0
pilogpi = −∞∑i=0
2
29
(13.5
14.5
)i· log
(2
29
(13.5
14.5
)i)> 0,
hiszen az összeg minden tagja negatív. Ezzel megmutattuk, hogy az entrópia függvénynek
maximuma van a {pi : i = 0, 1, 2 . . .} széls®értékhelyen.
28
Irodalomjegyzék
[1] Laczkovich Miklós - T. Sós Vera: Analízis II., Nemzeti Tankönyvkiadó, 2007
[2] Fekete Zoltán - Zalay Miklós: Többváltozós függvények analízise, M¶szaki Könyvki-
adó, 2007
[3] Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Bevezetés az adatbányászatba,
Panem Kft, 2011
[4] http://www.uni-miskolc.hu/ matente/oktatasi%20tananyagok/
/FELTETELES_OPTIMALIZALAS.pdf
[5] https://en.wikipedia.org/wiki/Lagrange_multiplier
29
30
top related