szervező erők az adatbázisokban
DESCRIPTION
Szervező erők az adatbázisokban. Szervező erők az adatbázisokban. Bevezető Áttekintés : mi az önszerveződő adatbázis ? Mi a szervező erő ? A folyamat mögötti dinamika : j átékelmélet Bevezető példa : fogolydilemma Alapfogalmak , Nash- egyensúly - PowerPoint PPT PresentationTRANSCRIPT
1 / 51
High Speed Networks Laboratory
Szervező erők adatbázisokban
2 / 51
1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?
2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly
3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban
Szervező erők az adatbázisokban
3 / 51
• Megtervezett adatbázis → evolúció alkotta adatbázis• Mennyi zene / film van a számítógépeden?
• Rugalmas adatstruktúra kell• Önszerveződő adatbázisok:
• A kapcsolódást nem egy központi egység határozza meg• A csomópontok saját maguk döntik el, hova kapcsolódnak
• Struktúra és lekérdezés• Az adatbázis önszerevződő jellege meghatározza a kialakuló topológiát• A topológia meghatározza, milyen a hatékony keresés
• Internet, Blogok• Google Fordító• Szocális hálózat• P2P hálózat• Folding@home
Paradigmaváltás az adatbázisokban
4 / 51
1. Hálózat méret: Csomópontok száma• Ezres, milliós, esetleg milliárdos méretek esetén lehet
statisztikai adatokkal jól jellemezni egy hálózatot
2. Klaszterezettség: “Csoportosulás” mértéke• A szomszéd node-jaim kapcsolódnak-e egymáshoz? Ha 1
akkor mindig, ha 0 akkor soha!
3. Átmérő: Kis átmérő, rövid utak, “kisvilág” jelleg• Egy rácsban igen nagy átmérők lehetnek, míg pl. a teljes gráf
átmérője 1.
4. Hasonlósági paraméter (γ): Mennyire hasonló a szerepük? (skálafüggetlen szerkezet) • Ha a szám magas, akkor az egyének nagyon hasonlítanak,
ha alacsony akkor (~ 2) akkor erősen eltérő szerepek vannak
5. Fokszámeloszlás: a csúcsok mekkora hányadának k a fokszáma?• Egyenletes? Binomiális? Valami más?
Struktúra és lekérdezés: hálózatparaméterek
5 / 51
• Evolúció alkotta adatbázis1.Nem véletlenszerű kapcsolatok, “csoportosuló”2.Kis átmérő, rövid utak, kisvilág3.Skálafüggetlen szerkezet: erősen változó szerepek a hálózatban
Struktúra és lekérdezés
6 / 51
• Egy már meglévő adatbázis melyik pontjához fogunk kapcsolódni?
• Minél népszerűbb• Népszerűség ~ minél több
kapcsolata van eddig
• Preferenciális kapcsolódás A kapcsolódáshoz a jelölt esélye
arányos a fokszámmal• A gazdag egyre gazdagabb lesz• Növekedéssel együtt:
skálafüggetlen hálózat
Preferenciális kapcsolódás
7 / 51
• Keresőmotorok1. Feltérképezés: crawling & indexing2. Adjunk releváns választ3. Search Engine Optimization
Struktúra és lekérdezés
8 / 51
High Speed Networks Laboratory
• Jon Kleinberg: Nem csak a topológia érdekes, hanem hogy gyorsan meg is lehet találni a célt, térkép nélkül
• Az optimális modell kereséshez
• Távolság: d(u,v) lépkedésekszáma a szomszédokon
• A rácson két pont között az kapcsolat valószínűsége ~d(u,v)-r
• Mohó keresési algoritmus
Kiegészítés: kisvilág-hálózat Kleinberg modellje
9 / 51
• Keresés egy kisvilág-adatbázisban• A rácson két pont között az kapcsolat valószínűsége ~ d(u,v)-r
• gyorsan meg is lehet találni a célt, térkép nélkül = mohó keresés
Navigálás a Kleinberg-modellben
10 / 51
1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?
2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly
3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban
Szervező erők az adatbázisokban
11 / 51
• Neumann János – 1928• A fejszámológép :)• A legyes feladat megoldója
• mi a racionális viselkedés olyan helyzetekben, ahol minden résztvevő döntéseinek eredményét befolyásolja a többiek lehetséges választása
• stratégiai problémák elmélete
• Hogyan jelentkezik az önszerveződő adatbázisokban?
• Milyen dinamikákban ismerhető fel?
Játékelmélet, mint szervező erő
12 / 51
• Egyensúly megtalálása• Trade-off keresése
• gyors keresés vs. bonyolultság• Evolúciós szerveződés vs. tervezett struktúra
• Mit csináljunk este?
Játékelmélet, mint szervező erő
13 / 51
Bevezető példa: fogolydilemma• Egy bűncselekmény
két gyanúsítottal• Mindkettő hallgat: egy-
egy év• Mindkettő bevallja: öt-
öt év• Egyik hallgat, másik
bevallja: hallgató 20 év, másik szabadul
• Mi fog történni?
14 / 51
• Ugyanez a helyzet:• Doppingolás sportversenyen• Cigaretta-reklámozás két gyártó között• Kartell egy oligopóliumban
• Airbus és Boeing
Fogolydilemma folytatás
15 / 51
• Játék, játékosok: A és B• Stratégia: egy játékos lehetséges választási lehetőségei
• Lehetséges stratégiák halmaza1. (confess,confess)2. (confess, silent)3. (silent, confess)4. (silent, silent)
• Kifizetési (payoff) matrix• cél: a kifizetést minimalizálni
Alapfogalmak
16 / 51
• Egy játékos legjobbválasz-leképezése: az a stratégia, ami a többi játékos adott stratégiája esetén a legkedvezőbb eredményt adja,
• Attól kérjük a csomagot egy P2P hálózatban, akitől várhatóan a leggyorsabban tudjuk letölteni
• Arra megyünk, amerre a legrövidebb az út
Alapfogalmak: legjobbválasz-leképezés
17 / 51
• John Nash• Amerikai matematikus• Közgazdasági Nobel-díj 1994• Egy csodálatos elme
• Nash-egyensúly• Legjobbválasz-leképezés a többiek stratégiájára• Olyan eleme a stratégiahalmaznak,ahonnan senkinek se éri meg elmozdulni, ha a többiek nem változtatnak
• ZH-n ha mindenki puskázik
Alapfogalmak: Nash-egyensúly
18 / 51
Nash-egyensúly• Mi lesz a Nash-egyensúlyi pont?
• (vall,vall)• Ha A vall, B-nek nem éri meg
hallgatni• Ugyanígy fordítva
• Kívülálló szemszögéből nem mindig látszik racionálisnak
• Érezzük, hogy jobban járnának, ha mindketten hallgatnának
• De mégsem• Ezért van egyáltalán a lehetőség,
hogy valljanak
19 / 51
1. Megsejtjük, és leellenőrizzük a definíciót.
• Ráérzünk, hogy a (vall,vall) a Nash-egyensúlyt adó stratégia
• A ráérzünk része felvet némi problémát, de ettől most eltekintünk…
• Ellenőrizendő: feltéve, hogy a másik résztvevő nem mozdul el, nem éri meg változtatni
Nash-egyensúly megtalálása
20 / 51
2. Dominált stratégiák eliminálásával
• Dominált stratégia: A játékos s
stratégiája dominált, ha van olyan s-től különböző si stratégia, hogy B játékos minden választására jobban megéri s helyett si-t választani
• Ha ezek sorozatos elhagyása után egyetlen stratégia-pár marad, akkor az Nash-egyensúly• A-nál és B-nél is a “remain silent” dominált stratégia
Nash-egyensúly megtalálása
21 / 51
• Dominált stratégiák elhagyásával keressük meg a Nash-egyensúlyi pontot az alábbi kifizetési mátrixban!
Feladat: Nash-egyensúly megtalálása
22 / 51
• Dominált stratégiák elhagyásával keressük meg a Nash-egyensúlyi pontot az alábbi kifizetési mátrixban!
Feladat: Nash-egyensúly megtalálása
23 / 51
1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?
2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly
3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban
Szervező erők az adatbázisokban
24 / 51
• Játékelmélet: egyensúly megtalálása• Trade-off
• Bonyolultság vs. gyorsaság• Tervezés vs.
• Egy önszerveződő hálózatban: hogyan dől el, hogy ki mit merre küld?• Evolúció alkotta hálózat: összekapcsolódtak: utána a struktúra már
megvan, merre továbbítanak?• Merre megy az adat?
A játékelmélet önszerveződő adatbázisokban
25 / 51
• x = 4000 csomagot küld PeerA a PeerB-nek• pay-off = az áltviteli idő ellentettje • Mennyi idő alatt ér célba?
Egyensúlyi forgalom
26 / 51
• Egy Nash-egyensúly: egyenlően elosztják egymást
1. Ez tényleg Nash-egyensúly• Próbáljuk ki, ha valaki változtatni akar• Amerre ő megy, 2001/100 + 45 az átvitel ideje > 65 • Jobban megéri nem váltani
2. Nincs másik• Tegyük fel, hogy van valami máselosztás, ami egyensúly• Aki a lassabb úton van, annakmegéri átváltani a gyorsabbra• Egyenlő elosztás jön ki
Nash-egyensúly az előző hálózatban
27 / 51
• Mi a paradoxon?
Braess paradoxon
28 / 51
• Adjunk hozzá egy új élet a hálózathoz!
Braess paradoxon
29 / 51
• Azt várjuk, hogy ha javítunk a hálózaton, egyensúlyi helyzetben gyorsabb lesz az átvitel• Naná, rövidítünk, csak nem romlik el…
• De! a Nash-egyensúlyi pont hosszabb időt jelent• Volt: fele A → C → B, fele A → D → B• Mindenkinek megéri az A → C → D → B-t választani
• Valóban Nash-egyensúly• Összes idő 40 + 40 = 80• Szemben az eddigi 65-tel
Braess paradoxon
30 / 51
• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,
az Nash-egyensúly!
Braess-paradoxon: gyakorló feladat
31 / 51
• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,
az Nash-egyensúly!
Braess-paradoxon: gyakorló feladat
32 / 51
• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,
az Nash-egyensúly!
• x-nek az ACB és az ADB is dominált stratégia, mindkettő ACDB által• y-nak szintén
Braess-paradoxon: gyakorló feladat
33 / 51
• Intuíció: ha upgrade-elünk valamit, akkor az jobb lesz• Paradoxon: egy új kapcsolat hozzáadásával lassabb lett az átvitel
• Pl. fogolydilemmában a Vall opció hozzáadása a Hallgathoz• Egyetlen él behúzásával mennyire romlik el a költség?
• Legfeljebb 4/3-szorosára nő• Az előző példa a legrosszabb, ami előfordulhat
• Felmerülő kérdések:1. Van-e egyensúlyi forgalomminta?2. Ha igen, van-e olyan, aminek a költsége nincs túl messze a
közösségi optimumtól?3. Milyen az a hálózat, amiben beáll az optimum?4. Hogyan tervezhető olyan hálózat, ami kivédi a rossz egyensúlyi
helyzeteket?5. Mennyivel lehet rosszabb az egyensúly az optimálisnál?
Braess-paradoxon: megjegyzések
34 / 51
• Már láttuk: átviteli idő az egyensúlyban nem biztos, hogy optimális• Mennyire lehetünk messze az optimumtól?
• Minden élre: travel-time függvény• Lineáris, átmenő forgalom függvénye• Te(x) = aex+be
Egyensúly vs optimum
• Forgalomminta: a küldött csomagok által választott útvonalak összessége
35 / 51
• Közösségi költség: a forgalommintához tartozó átviteli idők összege• Egyensúlyi költség: közösségi költség a Nash-egyensúlyi állapotban• Közösségi optimum: a lehető legkisebb közösségi költségű állapot
• Két fontos kérdés:1. Van-e egyensúlyi állapotra vezető forgalomminta?2. Ha igen, van-e olyan, aminek a költsége nincs túl messze a
közösségi optimumtól?
Egyensúly vs optimum
36 / 51
• Adunk egy algoritmust, ami konkrétan talál egyet, majd megmutatjuk, hogy az helyes
LEGJOBBVÁLASZ-ALGORITMUS1. Kiidulás: egy tetszőleges forgalmi minta2. Ha egyensúly KÉSZ3. Egyébként: létezik legalább egy csomag, aminek a legjobbválasza a
többire egy gyorsabb út• Válasszunk egy tetszőleges ilyet; az váltson át erre
4. GOTO 2.
• Ha valaha is megáll:• Mindenki olyan állapotban van, ami legjobbválasz-leképezés a helyzetre• Azaz Nash-egyensúly
• Kell: egy idő után megáll• Nem triviális, hogy megáll
• Pl. Matching Pennies játék
Forgalmi minta megtalálása az egyensúlyban
37 / 51
• Adódik: közösségi költség• Van olyan legjobbválasz, amitől nő, és van olyan, amitől csökken
• Helyette: egy forgalomminta potenciális energiája• A hálózat élein a potenciális energiák összege
• Egy él potenciális energiája• x csomagot küld•
A javulás mértéke: mennyire jó az aktuális megoldás?
38 / 51
• Legjobbválasz-leképezés lépésekkel a forgalomminta potenciális energiája csökken
Egyensúly beállása
39 / 51
Egyensúly beállása
40 / 51
Bizonyítás: elég azt megmutatni, hogy a legjobbválasz-leképezések során a potenciális energia szigorúan csökken
Mert: véges sok forgalomminta van csak véges sok különböző értéke lehet; mindig nemnegatívHa minden lépés során szigorúan csökken: egy idő után nem csökkenhet tovább; mindenki legjobbválasz leképezést ad az adott helyzetre = egyensúly
• Pont azért csökken, mert legjobbválasz lépés történik• Az e élen ha x1 csomag megy, a potenciális energia:
• Ha egy csomag elhagyja:
• Helyette átvált az f élre, ahol eddig x2 csomag volt, a potenciális energia:
• A rendszer energiájából levonódik: a régi útvonalon az átviteli idő• Hozzáadódik: az új útvonal átviteli ideje• A változás mértéke pont a csomag átviteli idejének csökkenése• Tehát a potenciális energia legjobbválasz lépés során szigorúan csökken
Állítás: A Legjobbválasz-algoritmus megáll
41 / 51
• A potenciális energia és a travel time kapcsolata egyetlen élre• Energy(e) = e él potenciális energiája• x csomag esetén:
• = • tehát: • Továbbá:
Egyensúly vs közösségi optimum?
42 / 51
• Mivel , ezért
• Azaz a következő adódik:
A potenciális energia legalább az átviteli idő fele
43 / 51
• Legyen Z egy forgalomminta• Energy (Z) = az élek potenciális energiáinak összege, ha a csomagok a Z
mintát követik• Social-Cost(Z) = az átviteli idők összege Z forgalmi minta mellett
• Induljunk ki egy közösségileg optimális Z mintából legjobbválasz-leképezések Z’ egyensúlyi minta• A közösségi költség nőhet is, de a potenciális energia csak csökkenhet• A közösségi költség a potenciális energia legfeljebb kétszerese• Tehát a közösségi költség tetszőleges állapotban a kiindulási potenciális
energiának is legfeljebb kétszerese• Azaz az egyensúlyi költség a szociális optimum költségének is legfeljebb
kétszerese
• Megj. Itt is igaz az állítás 4/3-os szorzóval, de azt nem bizonyítjuk.
Az egész rendszerre vonatkoztatva:
44 / 51
Bizonyítás:• Legyen Z a közösségileg optimális minta, Z’ az egyensúlyi minta• A legjobbválasz-leképezések során a potenciális energia csak
csökkenhet
• Már korábban láttuk:
• Az eddigieket összerakva adódik:
A potenciális energia módszerével egy egyensúlyi állapot költségére adható korlát.
Állítás: Az egyensúlyi költség a szociális optimum költségének legfeljebb 2x-ese
45 / 51
1.a 1000 csomagot küldünk A → B. Mi a Nash-egyensúlyi állapot?
Gyakorló feladatok 1.
46 / 51
1.a egyenlően oszlik el a két lehetséges útvonalon1.b Létrejön egy új kapcsolat a hálózatban: C → D, 0 átviteli idővel. Mi most a Nash-egyensúly?Gyakorló feladatok 1.
0
47 / 51
1.c Javul az átvitel sebessége a C → B és A → D utakon. Mi most a Nash-egyensúly?
Gyakorló feladatok 1.
0
5
5
48 / 51
• 2.a. 300 csomagot küldünk A B, a lehetséges útvonalak az ábrán láthatóak. Milyen x és y értékek mellett áll be a Nash-egyensúly?
Gyakorló feladatok 2.
49 / 51
• 2.b. Létrejön egy új kapcsolat A-ból B-be, amin a csomagok számától függetlenül 5 az átviteli idő. Mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő az a) ponthoz képest?
Gyakorló feladatok 2.
5
50 / 51
• 2.c. Az A B kapcsolat megszakad, de helyette létrejön egy új, C és D között, amin 0 idő alatt érnek át a csomagok. Mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő?
Gyakorló feladatok 2.
0
51 / 51
• 2.d. Visszaépül az A B kapcsolat, miközben a C és D közötti is megmarad. Ebben az esetben mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő?
Gyakorló feladatok 2.
0
5