szervező erők az adatbázisokban

51
1 / 51 High Speed Networks Laboratory Szervező erők adatbázisokban

Upload: casey

Post on 12-Jan-2016

51 views

Category:

Documents


7 download

DESCRIPTION

Szervező erők az adatbázisokban. Szervező erők az adatbázisokban. Bevezető Áttekintés : mi az önszerveződő adatbázis ? Mi a szervező erő ? A folyamat mögötti dinamika : j átékelmélet Bevezető példa : fogolydilemma Alapfogalmak , Nash- egyensúly - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Szervező erők az adatbázisokban

1 / 51

High Speed Networks Laboratory

Szervező erők adatbázisokban

Page 2: Szervező erők az adatbázisokban

2 / 51

1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?

2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly

3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban

Szervező erők az adatbázisokban

Page 3: Szervező erők az adatbázisokban

3 / 51

• Megtervezett adatbázis → evolúció alkotta adatbázis• Mennyi zene / film van a számítógépeden?

• Rugalmas adatstruktúra kell• Önszerveződő adatbázisok:

• A kapcsolódást nem egy központi egység határozza meg• A csomópontok saját maguk döntik el, hova kapcsolódnak

• Struktúra és lekérdezés• Az adatbázis önszerevződő jellege meghatározza a kialakuló topológiát• A topológia meghatározza, milyen a hatékony keresés

• Internet, Blogok• Google Fordító• Szocális hálózat• P2P hálózat• Folding@home

Paradigmaváltás az adatbázisokban

Page 4: Szervező erők az adatbázisokban

4 / 51

1. Hálózat méret: Csomópontok száma• Ezres, milliós, esetleg milliárdos méretek esetén lehet

statisztikai adatokkal jól jellemezni egy hálózatot

2. Klaszterezettség: “Csoportosulás” mértéke• A szomszéd node-jaim kapcsolódnak-e egymáshoz? Ha 1

akkor mindig, ha 0 akkor soha!

3. Átmérő: Kis átmérő, rövid utak, “kisvilág” jelleg• Egy rácsban igen nagy átmérők lehetnek, míg pl. a teljes gráf

átmérője 1.

4. Hasonlósági paraméter (γ): Mennyire hasonló a szerepük? (skálafüggetlen szerkezet) • Ha a szám magas, akkor az egyének nagyon hasonlítanak,

ha alacsony akkor (~ 2) akkor erősen eltérő szerepek vannak

5. Fokszámeloszlás: a csúcsok mekkora hányadának k a fokszáma?• Egyenletes? Binomiális? Valami más?

Struktúra és lekérdezés: hálózatparaméterek

Page 5: Szervező erők az adatbázisokban

5 / 51

• Evolúció alkotta adatbázis1.Nem véletlenszerű kapcsolatok, “csoportosuló”2.Kis átmérő, rövid utak, kisvilág3.Skálafüggetlen szerkezet: erősen változó szerepek a hálózatban

Struktúra és lekérdezés

Page 6: Szervező erők az adatbázisokban

6 / 51

• Egy már meglévő adatbázis melyik pontjához fogunk kapcsolódni?

• Minél népszerűbb• Népszerűség ~ minél több

kapcsolata van eddig

• Preferenciális kapcsolódás A kapcsolódáshoz a jelölt esélye

arányos a fokszámmal• A gazdag egyre gazdagabb lesz• Növekedéssel együtt:

skálafüggetlen hálózat

Preferenciális kapcsolódás

Page 7: Szervező erők az adatbázisokban

7 / 51

• Keresőmotorok1. Feltérképezés: crawling & indexing2. Adjunk releváns választ3. Search Engine Optimization

Struktúra és lekérdezés

Page 8: Szervező erők az adatbázisokban

8 / 51

High Speed Networks Laboratory

• Jon Kleinberg: Nem csak a topológia érdekes, hanem hogy gyorsan meg is lehet találni a célt, térkép nélkül

• Az optimális modell kereséshez

• Távolság: d(u,v) lépkedésekszáma a szomszédokon

• A rácson két pont között az kapcsolat valószínűsége ~d(u,v)-r

• Mohó keresési algoritmus

Kiegészítés: kisvilág-hálózat Kleinberg modellje

Page 9: Szervező erők az adatbázisokban

9 / 51

• Keresés egy kisvilág-adatbázisban• A rácson két pont között az kapcsolat valószínűsége ~ d(u,v)-r

• gyorsan meg is lehet találni a célt, térkép nélkül = mohó keresés

Navigálás a Kleinberg-modellben

Page 10: Szervező erők az adatbázisokban

10 / 51

1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?

2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly

3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban

Szervező erők az adatbázisokban

Page 11: Szervező erők az adatbázisokban

11 / 51

• Neumann János – 1928• A fejszámológép :)• A legyes feladat megoldója

• mi a racionális viselkedés olyan helyzetekben, ahol minden résztvevő döntéseinek eredményét befolyásolja a többiek lehetséges választása

• stratégiai problémák elmélete

• Hogyan jelentkezik az önszerveződő adatbázisokban?

• Milyen dinamikákban ismerhető fel?

Játékelmélet, mint szervező erő

Page 12: Szervező erők az adatbázisokban

12 / 51

• Egyensúly megtalálása• Trade-off keresése

• gyors keresés vs. bonyolultság• Evolúciós szerveződés vs. tervezett struktúra

• Mit csináljunk este?

Játékelmélet, mint szervező erő

Page 13: Szervező erők az adatbázisokban

13 / 51

Bevezető példa: fogolydilemma• Egy bűncselekmény

két gyanúsítottal• Mindkettő hallgat: egy-

egy év• Mindkettő bevallja: öt-

öt év• Egyik hallgat, másik

bevallja: hallgató 20 év, másik szabadul

• Mi fog történni?

Page 14: Szervező erők az adatbázisokban

14 / 51

• Ugyanez a helyzet:• Doppingolás sportversenyen• Cigaretta-reklámozás két gyártó között• Kartell egy oligopóliumban

• Airbus és Boeing

Fogolydilemma folytatás

Page 15: Szervező erők az adatbázisokban

15 / 51

• Játék, játékosok: A és B• Stratégia: egy játékos lehetséges választási lehetőségei

• Lehetséges stratégiák halmaza1. (confess,confess)2. (confess, silent)3. (silent, confess)4. (silent, silent)

• Kifizetési (payoff) matrix• cél: a kifizetést minimalizálni

Alapfogalmak

Page 16: Szervező erők az adatbázisokban

16 / 51

• Egy játékos legjobbválasz-leképezése: az a stratégia, ami a többi játékos adott stratégiája esetén a legkedvezőbb eredményt adja,

• Attól kérjük a csomagot egy P2P hálózatban, akitől várhatóan a leggyorsabban tudjuk letölteni

• Arra megyünk, amerre a legrövidebb az út

Alapfogalmak: legjobbválasz-leképezés

Page 17: Szervező erők az adatbázisokban

17 / 51

• John Nash• Amerikai matematikus• Közgazdasági Nobel-díj 1994• Egy csodálatos elme

• Nash-egyensúly• Legjobbválasz-leképezés a többiek stratégiájára• Olyan eleme a stratégiahalmaznak,ahonnan senkinek se éri meg elmozdulni, ha a többiek nem változtatnak

• ZH-n ha mindenki puskázik

Alapfogalmak: Nash-egyensúly

Page 18: Szervező erők az adatbázisokban

18 / 51

Nash-egyensúly• Mi lesz a Nash-egyensúlyi pont?

• (vall,vall)• Ha A vall, B-nek nem éri meg

hallgatni• Ugyanígy fordítva

• Kívülálló szemszögéből nem mindig látszik racionálisnak

• Érezzük, hogy jobban járnának, ha mindketten hallgatnának

• De mégsem• Ezért van egyáltalán a lehetőség,

hogy valljanak

Page 19: Szervező erők az adatbázisokban

19 / 51

1. Megsejtjük, és leellenőrizzük a definíciót.

• Ráérzünk, hogy a (vall,vall) a Nash-egyensúlyt adó stratégia

• A ráérzünk része felvet némi problémát, de ettől most eltekintünk…

• Ellenőrizendő: feltéve, hogy a másik résztvevő nem mozdul el, nem éri meg változtatni

Nash-egyensúly megtalálása

Page 20: Szervező erők az adatbázisokban

20 / 51

2. Dominált stratégiák eliminálásával

• Dominált stratégia: A játékos s

stratégiája dominált, ha van olyan s-től különböző si stratégia, hogy B játékos minden választására jobban megéri s helyett si-t választani

• Ha ezek sorozatos elhagyása után egyetlen stratégia-pár marad, akkor az Nash-egyensúly• A-nál és B-nél is a “remain silent” dominált stratégia

Nash-egyensúly megtalálása

Page 21: Szervező erők az adatbázisokban

21 / 51

• Dominált stratégiák elhagyásával keressük meg a Nash-egyensúlyi pontot az alábbi kifizetési mátrixban!

Feladat: Nash-egyensúly megtalálása

Page 22: Szervező erők az adatbázisokban

22 / 51

• Dominált stratégiák elhagyásával keressük meg a Nash-egyensúlyi pontot az alábbi kifizetési mátrixban!

Feladat: Nash-egyensúly megtalálása

Page 23: Szervező erők az adatbázisokban

23 / 51

1. Bevezető• Áttekintés: mi az önszerveződő adatbázis?• Mi a szervező erő?

2. A folyamat mögötti dinamika: játékelmélet• Bevezető példa: fogolydilemma• Alapfogalmak, Nash-egyensúly

3. Az adatforgalom modellezése játékelmélettel • Optimális átvitel vs. átvitel önszerveződő hálózatban

Szervező erők az adatbázisokban

Page 24: Szervező erők az adatbázisokban

24 / 51

• Játékelmélet: egyensúly megtalálása• Trade-off

• Bonyolultság vs. gyorsaság• Tervezés vs.

• Egy önszerveződő hálózatban: hogyan dől el, hogy ki mit merre küld?• Evolúció alkotta hálózat: összekapcsolódtak: utána a struktúra már

megvan, merre továbbítanak?• Merre megy az adat?

A játékelmélet önszerveződő adatbázisokban

Page 25: Szervező erők az adatbázisokban

25 / 51

• x = 4000 csomagot küld PeerA a PeerB-nek• pay-off = az áltviteli idő ellentettje • Mennyi idő alatt ér célba?

Egyensúlyi forgalom

Page 26: Szervező erők az adatbázisokban

26 / 51

• Egy Nash-egyensúly: egyenlően elosztják egymást

1. Ez tényleg Nash-egyensúly• Próbáljuk ki, ha valaki változtatni akar• Amerre ő megy, 2001/100 + 45 az átvitel ideje > 65 • Jobban megéri nem váltani

2. Nincs másik• Tegyük fel, hogy van valami máselosztás, ami egyensúly• Aki a lassabb úton van, annakmegéri átváltani a gyorsabbra• Egyenlő elosztás jön ki

Nash-egyensúly az előző hálózatban

Page 27: Szervező erők az adatbázisokban

27 / 51

• Mi a paradoxon?

Braess paradoxon

Page 28: Szervező erők az adatbázisokban

28 / 51

• Adjunk hozzá egy új élet a hálózathoz!

Braess paradoxon

Page 29: Szervező erők az adatbázisokban

29 / 51

• Azt várjuk, hogy ha javítunk a hálózaton, egyensúlyi helyzetben gyorsabb lesz az átvitel• Naná, rövidítünk, csak nem romlik el…

• De! a Nash-egyensúlyi pont hosszabb időt jelent• Volt: fele A → C → B, fele A → D → B• Mindenkinek megéri az A → C → D → B-t választani

• Valóban Nash-egyensúly• Összes idő 40 + 40 = 80• Szemben az eddigi 65-tel

Braess paradoxon

Page 30: Szervező erők az adatbázisokban

30 / 51

• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,

az Nash-egyensúly!

Braess-paradoxon: gyakorló feladat

Page 31: Szervező erők az adatbázisokban

31 / 51

• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,

az Nash-egyensúly!

Braess-paradoxon: gyakorló feladat

Page 32: Szervező erők az adatbázisokban

32 / 51

• PeerA és PeerB két nagy csomagot küld, x=2000 és y=2000 méretűek• Írjuk fel mátrix-alakban az átfutási időket!• Mutassuk meg, hogy ha mindketten az A → C → D → B-t választják,

az Nash-egyensúly!

• x-nek az ACB és az ADB is dominált stratégia, mindkettő ACDB által• y-nak szintén

Braess-paradoxon: gyakorló feladat

Page 33: Szervező erők az adatbázisokban

33 / 51

• Intuíció: ha upgrade-elünk valamit, akkor az jobb lesz• Paradoxon: egy új kapcsolat hozzáadásával lassabb lett az átvitel

• Pl. fogolydilemmában a Vall opció hozzáadása a Hallgathoz• Egyetlen él behúzásával mennyire romlik el a költség?

• Legfeljebb 4/3-szorosára nő• Az előző példa a legrosszabb, ami előfordulhat

• Felmerülő kérdések:1. Van-e egyensúlyi forgalomminta?2. Ha igen, van-e olyan, aminek a költsége nincs túl messze a

közösségi optimumtól?3. Milyen az a hálózat, amiben beáll az optimum?4. Hogyan tervezhető olyan hálózat, ami kivédi a rossz egyensúlyi

helyzeteket?5. Mennyivel lehet rosszabb az egyensúly az optimálisnál?

Braess-paradoxon: megjegyzések

Page 34: Szervező erők az adatbázisokban

34 / 51

• Már láttuk: átviteli idő az egyensúlyban nem biztos, hogy optimális• Mennyire lehetünk messze az optimumtól?

• Minden élre: travel-time függvény• Lineáris, átmenő forgalom függvénye• Te(x) = aex+be

Egyensúly vs optimum

• Forgalomminta: a küldött csomagok által választott útvonalak összessége

Page 35: Szervező erők az adatbázisokban

35 / 51

• Közösségi költség: a forgalommintához tartozó átviteli idők összege• Egyensúlyi költség: közösségi költség a Nash-egyensúlyi állapotban• Közösségi optimum: a lehető legkisebb közösségi költségű állapot

• Két fontos kérdés:1. Van-e egyensúlyi állapotra vezető forgalomminta?2. Ha igen, van-e olyan, aminek a költsége nincs túl messze a

közösségi optimumtól?

Egyensúly vs optimum

Page 36: Szervező erők az adatbázisokban

36 / 51

• Adunk egy algoritmust, ami konkrétan talál egyet, majd megmutatjuk, hogy az helyes

LEGJOBBVÁLASZ-ALGORITMUS1. Kiidulás: egy tetszőleges forgalmi minta2. Ha egyensúly KÉSZ3. Egyébként: létezik legalább egy csomag, aminek a legjobbválasza a

többire egy gyorsabb út• Válasszunk egy tetszőleges ilyet; az váltson át erre

4. GOTO 2.

• Ha valaha is megáll:• Mindenki olyan állapotban van, ami legjobbválasz-leképezés a helyzetre• Azaz Nash-egyensúly

• Kell: egy idő után megáll• Nem triviális, hogy megáll

• Pl. Matching Pennies játék

Forgalmi minta megtalálása az egyensúlyban

Page 37: Szervező erők az adatbázisokban

37 / 51

• Adódik: közösségi költség• Van olyan legjobbválasz, amitől nő, és van olyan, amitől csökken

• Helyette: egy forgalomminta potenciális energiája• A hálózat élein a potenciális energiák összege

• Egy él potenciális energiája• x csomagot küld•

A javulás mértéke: mennyire jó az aktuális megoldás?

Page 38: Szervező erők az adatbázisokban

38 / 51

• Legjobbválasz-leképezés lépésekkel a forgalomminta potenciális energiája csökken

Egyensúly beállása

Page 39: Szervező erők az adatbázisokban

39 / 51

Egyensúly beállása

Page 40: Szervező erők az adatbázisokban

40 / 51

Bizonyítás: elég azt megmutatni, hogy a legjobbválasz-leképezések során a potenciális energia szigorúan csökken

Mert: véges sok forgalomminta van csak véges sok különböző értéke lehet; mindig nemnegatívHa minden lépés során szigorúan csökken: egy idő után nem csökkenhet tovább; mindenki legjobbválasz leképezést ad az adott helyzetre = egyensúly

• Pont azért csökken, mert legjobbválasz lépés történik• Az e élen ha x1 csomag megy, a potenciális energia:

• Ha egy csomag elhagyja:

• Helyette átvált az f élre, ahol eddig x2 csomag volt, a potenciális energia:

• A rendszer energiájából levonódik: a régi útvonalon az átviteli idő• Hozzáadódik: az új útvonal átviteli ideje• A változás mértéke pont a csomag átviteli idejének csökkenése• Tehát a potenciális energia legjobbválasz lépés során szigorúan csökken

Állítás: A Legjobbválasz-algoritmus megáll

Page 41: Szervező erők az adatbázisokban

41 / 51

• A potenciális energia és a travel time kapcsolata egyetlen élre• Energy(e) = e él potenciális energiája• x csomag esetén:

• = • tehát: • Továbbá:

Egyensúly vs közösségi optimum?

Page 42: Szervező erők az adatbázisokban

42 / 51

• Mivel , ezért

• Azaz a következő adódik:

A potenciális energia legalább az átviteli idő fele

Page 43: Szervező erők az adatbázisokban

43 / 51

• Legyen Z egy forgalomminta• Energy (Z) = az élek potenciális energiáinak összege, ha a csomagok a Z

mintát követik• Social-Cost(Z) = az átviteli idők összege Z forgalmi minta mellett

• Induljunk ki egy közösségileg optimális Z mintából legjobbválasz-leképezések Z’ egyensúlyi minta• A közösségi költség nőhet is, de a potenciális energia csak csökkenhet• A közösségi költség a potenciális energia legfeljebb kétszerese• Tehát a közösségi költség tetszőleges állapotban a kiindulási potenciális

energiának is legfeljebb kétszerese• Azaz az egyensúlyi költség a szociális optimum költségének is legfeljebb

kétszerese

• Megj. Itt is igaz az állítás 4/3-os szorzóval, de azt nem bizonyítjuk.

Az egész rendszerre vonatkoztatva:

Page 44: Szervező erők az adatbázisokban

44 / 51

Bizonyítás:• Legyen Z a közösségileg optimális minta, Z’ az egyensúlyi minta• A legjobbválasz-leképezések során a potenciális energia csak

csökkenhet

• Már korábban láttuk:

• Az eddigieket összerakva adódik:

A potenciális energia módszerével egy egyensúlyi állapot költségére adható korlát.

Állítás: Az egyensúlyi költség a szociális optimum költségének legfeljebb 2x-ese

Page 45: Szervező erők az adatbázisokban

45 / 51

1.a 1000 csomagot küldünk A → B. Mi a Nash-egyensúlyi állapot?

Gyakorló feladatok 1.

Page 46: Szervező erők az adatbázisokban

46 / 51

1.a egyenlően oszlik el a két lehetséges útvonalon1.b Létrejön egy új kapcsolat a hálózatban: C → D, 0 átviteli idővel. Mi most a Nash-egyensúly?Gyakorló feladatok 1.

0

Page 47: Szervező erők az adatbázisokban

47 / 51

1.c Javul az átvitel sebessége a C → B és A → D utakon. Mi most a Nash-egyensúly?

Gyakorló feladatok 1.

0

5

5

Page 48: Szervező erők az adatbázisokban

48 / 51

• 2.a. 300 csomagot küldünk A B, a lehetséges útvonalak az ábrán láthatóak. Milyen x és y értékek mellett áll be a Nash-egyensúly?

Gyakorló feladatok 2.

Page 49: Szervező erők az adatbázisokban

49 / 51

• 2.b. Létrejön egy új kapcsolat A-ból B-be, amin a csomagok számától függetlenül 5 az átviteli idő. Mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő az a) ponthoz képest?

Gyakorló feladatok 2.

5

Page 50: Szervező erők az adatbázisokban

50 / 51

• 2.c. Az A B kapcsolat megszakad, de helyette létrejön egy új, C és D között, amin 0 idő alatt érnek át a csomagok. Mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő?

Gyakorló feladatok 2.

0

Page 51: Szervező erők az adatbázisokban

51 / 51

• 2.d. Visszaépül az A B kapcsolat, miközben a C és D közötti is megmarad. Ebben az esetben mi a Nash-egyensúlyi állapot? Hogyan változik a teljes átviteli idő?

Gyakorló feladatok 2.

0

5