zoranpopovictanjavukovic

Upload: kupres123

Post on 05-Apr-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/2/2019 ZoranPopovicTanjaVukovic

    1/148

    Seminarski rad: Osnove vestacke inteligencije I

    Popovic Zoran, Tanja Vukovic

    Centar za multidisciplinarne studijeUniverzitet u Beogradu

    18. decembar 2006

    Sazetak

    Ovaj tekst je sazetak knjiga [JL] i [GN] i predstavlja pregled osnovnihkoncepat vestacke inteligencije. Tekst je napisan kao deo ispita izpredmeta Uvog u vestacku inteligenciju.

    Profesor: Predrag Janicic

  • 8/2/2019 ZoranPopovicTanjaVukovic

    2/148

    Osnove vestacke inteligencije I 1

    Sadrzaj

    1 Poglavlje 1 - vestacka inteligencija, istorijski razvoj i uvod 51.1 Definicija i oblasti bavljenja VI . . . . . . . . . . . . . . . . . 61.2 Kratak uspon i pad, zatim renesansa . . . . . . . . . . . . . . 8

    1.3 Oblasti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2 Poglavlje 2 - Predstavljanje problema 112.1 Pojam problema . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Resavanje problema, uopsteni koraci . . . . . . . . . . . . . . 112.3 Notacije, nacini reprezentovanja . . . . . . . . . . . . . . . . . 122.4 Modeli grafova u VI . . . . . . . . . . . . . . . . . . . . . . . . 13

    2.4.1 Reprezentovanje znanja u automatskom resavanju problema 142.4.2 Graficko reprezentovanje znanja u automatskom resavanju

    problema . . . . . . . . . . . . . . . . . . . . . . . . . 17

    2.4.3 Graficka reprezentacija i prirodni jezik . . . . . . . . . 182.5 Trazenje pravog reprezentovanja . . . . . . . . . . . . . . . . . 182.6 Programski jezici PROLOG i LISP . . . . . . . . . . . . . . . 192.7 Grafovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    2.7.1 Petri-mreze . . . . . . . . . . . . . . . . . . . . . . . . 20

    3 Formalni sistemi - deklarativno znanje i zakljucivanje 233.1 Definicija formalnih sistema . . . . . . . . . . . . . . . . . . . 233.2 Iskazni racun i predikatski racun prvog reda . . . . . . . . . . 253.3 Zakljucivanje . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    4 Rezolucija 304.1 Klauzalna forma . . . . . . . . . . . . . . . . . . . . . . . . . 304.2 Unifikacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.3 Princip rezolucije . . . . . . . . . . . . . . . . . . . . . . . . . 324.4 Rezolucija i jednakost . . . . . . . . . . . . . . . . . . . . . . . 344.5 Strategije rezolucije . . . . . . . . . . . . . . . . . . . . . . . . 35

    4.5.1 Strategije brisanja . . . . . . . . . . . . . . . . . . . . 354.5.2 Jedinicna rezolucija . . . . . . . . . . . . . . . . . . . . 364.5.3 Ulazna rezolucija . . . . . . . . . . . . . . . . . . . . . 364.5.4 Linearna rezolucija . . . . . . . . . . . . . . . . . . . . 364.5.5 Rezolucija skupom podrske . . . . . . . . . . . . . . . 364.5.6 Uredena rezolucija . . . . . . . . . . . . . . . . . . . . 37

  • 8/2/2019 ZoranPopovicTanjaVukovic

    3/148

    2 Seminarski rad

    4.5.7 Usmerena rezolucija . . . . . . . . . . . . . . . . . . . 37

    4.5.8 Sekvencijalno zadovoljenje uslova . . . . . . . . . . . . 37

    5 Zakljucivanje sa nesigurnim uverenjima i drugi nacini zakljucivanja 38

    5.1 Nemonotono zakljucivanje . . . . . . . . . . . . . . . . . . . . 38

    5.2 Taksonomijske hijerarhije i pretpostavljeno zakljucivanje (defaultreasoning) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    5.3 Indukcija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    5.4 Verovatnosno zakljucivanje . . . . . . . . . . . . . . . . . . . . 43

    5.5 Jedno formalno zasnivanje verovatnosne logike . . . . . . . . . 46

    5.6 Znanja i uverenja . . . . . . . . . . . . . . . . . . . . . . . . . 48

    5.6.1 Iskazna logika uverenja . . . . . . . . . . . . . . . . . . 48

    5.7 Meta-znanje i meta-zakljucivanje . . . . . . . . . . . . . . . . 51

    6 Stanje i akcije 566.1 Stanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    6.2 Akcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    6.3 Problem okvira . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    6.4 Redosled akcija . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    6.5 Uslovljenost . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    7 Planiranje 64

    7.1 Pocetno stanje . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    7.2 Ciljevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

    7.3 Akcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647.4 Planovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    7.5 Grinov metod . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    7.6 Blokovi akcija . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    7.7 Uslovni planovi . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    7.8 Smer planiranja . . . . . . . . . . . . . . . . . . . . . . . . . 69

    7.9 Odsecanje nedostiznoscu . . . . . . . . . . . . . . . . . . . . . 70

    7.10 Poravnavanje stanja (usaglasavanje) . . . . . . . . . . . . . . . 70

    7.11 Ukidanje aksioma okvira . . . . . . . . . . . . . . . . . . . . . 72

    7.12 C iljna regresija . . . . . . . . . . . . . . . . . . . . . . . . . . 72

    7.13 Razlike stanja . . . . . . . . . . . . . . . . . . . . . . . . . . 75

  • 8/2/2019 ZoranPopovicTanjaVukovic

    4/148

    Osnove vestacke inteligencije I 3

    8 Arhitektura inteligentnih agenata 778.1 Tropisticni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 778.2 Histereticni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 798.3 Agenti nivoa znanja . . . . . . . . . . . . . . . . . . . . . . . . 808.4 Agenti znanja u koracima . . . . . . . . . . . . . . . . . . . . 838.5 Agenti s namerom . . . . . . . . . . . . . . . . . . . . . . . . . 868.6 Promisljeni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 90

    9 Klasicne metode resavanja problema 929.1 Algoritmi za koje su poznata polinomijalna resenja . . . . . . 989.2 Klasifikacija problema prema slozenosti . . . . . . . . . . . . . 1009.3 klasa NP: nedeterministicki polinomijalni problemi . . . . . . 101

    10 Resavanje problema propagiranjem i nabrajanjem 10610.1 Gradijent metode . . . . . . . . . . . . . . . . . . . . . . . . . 106

    10.2 Linearno programiranje . . . . . . . . . . . . . . . . . . . . . . 10710.3 Gradijent metoda u teoriji grafova . . . . . . . . . . . . . . . . 10710.4 Heuristicko pretrazivanje . . . . . . . . . . . . . . . . . . . . . 10810.5 A algoritam . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10810.6 Implicitno nabrajanje propagiranjem uslova . . . . . . . . . . 11010.7 Dinamicko programiranje . . . . . . . . . . . . . . . . . . . . . 11210.8 GPS - General Problem Solver . . . . . . . . . . . . . . . . . . 115

    11 Programi - igre, psihologija resavanja problema 11711.1 Drvo pretrazivanja (drvo ispravnih poteza) . . . . . . . . . . . 11711.2 Evaluacija pozicije . . . . . . . . . . . . . . . . . . . . . . . . 117

    11.3 MINIMAX izbor i algoritam, alfa-beta algoritam . . . . . . . . 11811.4 - kresanje (odsecanje) . . . . . . . . . . . . . . . . . . . . . 12011.5 Psiholoska izucavanja resavanja problema i igranja . . . . . . . 12211.6 Teorija igara . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

    12 Ekspertni sistemi 12612.1 MYCIN - primer . . . . . . . . . . . . . . . . . . . . . . . . . 12612.2 Produkcioni sistemi . . . . . . . . . . . . . . . . . . . . . . . . 12812.3 Ekspertni sistemi zasnovani na logici prvog reda . . . . . . . . 13112.4 Deklarativno-proceduralna kontroverza . . . . . . . . . . . . . 13112.5 Razliciti tipovi znanja i njihova reprezentacija . . . . . . . . . 133

    12.5.1 Reprezentovanje znanja . . . . . . . . . . . . . . . . . . 134

  • 8/2/2019 ZoranPopovicTanjaVukovic

    5/148

    4 Seminarski rad

    12.5.2 Osobine sistema produkcionih pravila . . . . . . . . . . 135

    13 Ucenje 13713.1 Primer STRIPS . . . . . . . . . . . . . . . . . . . . . . . . . . 13913.2 Ucenje pravila i planova . . . . . . . . . . . . . . . . . . . . . 139

    13.3 Ucenje karakteristika i koncepta, Vereov primer . . . . . . . . 140

  • 8/2/2019 ZoranPopovicTanjaVukovic

    6/148

    Osnove vestacke inteligencije I 5

    1 Poglavlje 1 - vestacka inteligencija, istorijski

    razvoj i uvod

    Istorijski gledano, jos je Lajbnic pominjao ,,univerzalnu algebru kojom

    bi se svekolika ljudska znanja (ukljucujuci i etiku i metafiziku) obuhvatilajednog dana u jedinstvenom deduktivnom sistemu. Frege, jedan od osnivacamoderne simbolicke logike, je predlozio notacioni sistem za mehanicko rezo-novanje. Carls Bebidz 1834. konstruise mehanicku ,,analiticku masinu kojaracuna i stampa neke matematicke proracune, imao je nameru da napravii masinu za igranje saha. Tek napretkom informatike i tehnologije 1940-tih i 1950-tih nastaju prvi rezultati koji spadaju u domen VI. McCulloch iWalter Pits jos 1943. godine predlaz prvi model vestacke neuronske mreze, a1951. godine Marvin Minsky i Dave Edmonds prave prvi elektronski racunar(SNARC, sa 3000 vakuumskih cevi) zasnovan na takvoj mrezi (u okviru

    doktorske disertacije za ciju je komisiju bilo diskutabilno da li se moze takavrad svrstati u matematiku - clan komisije, Jonh von Neumann, izjavio jeda ce biti jednog dana ako vec nije - ironicno, upravo je Minski teorijskimrezultatima ,,pokopao nesto kasnije ovu oblast za narednih par decenija).Nekoliko istrazivaca na Dartmut koledzu 1956. g. (Dartmouth College)ucestvuje u seminaru koji organizuje McCarthy na temu VI (koji je prvipredlozio upravo taj naziv za tu oblast, a poznat je i kao otac LISP-a koji jebio znacajan alat u VI, a i dans je u izvesnom obimu) gde su Allen Newell iHerbert Simon prezentovali ,,Logic Theorist - prvi program za automatskodokazivanje teorema (Bertrand Rasel je bio zadovoljan rezultatima, pogotovu

    jednim generisanim dokazom koji je bio kraci nego jedan naveden u ,,Principia

    Mathematica - svi su ipak bili svesni da su to samo pocetni rezultati),gde su ucestvovali i Minski, Senon, Semjuel, Solomonov i drugi. Vestackainteligencija belezi prve uspehe akademske prirode kao sto su prvi program zaigranje saha (Claude Shannonn, 1955, poznat i kao otac savremene statistickeinformacione teorije - zajedno sa Alanom Tjuringom - ovo se smatra jednimod najbitnijih presudnih rezultata u istoriji VI) ili dama (Arthur Samuel,1963), automatsko dokazivanje teorema (pomenuti ,,Logic Theorist, Simoni Newell), kao i ambiciozan pokusaj ostvarivanja opsteg sistema za resavanjeproblema GPS (General Problem Solver - Newell, 1960). Sajmon i Njueldaju 1963. pretpostavku sistema fizickih simbola koja je uspesno naknadnoosporavana, ali je vazan deo istorije: svaki sistem (ljudski ili vestacki) kojise smatra inteligentnim mora da radi tako da uzima fizicke sablone (simbole,

  • 8/2/2019 ZoranPopovicTanjaVukovic

    7/148

    6 Seminarski rad

    ,,physical patterns), kombinuje ih u strukture (izraze) i rukuje njima (koristeciprocese) da bi proizveo nove strukture (izraze). Sustina zablude, cije suposledice razvejane tek pojavom prvih ekspertnih sistema, jeste nedostatakdomenskog znanja potrebnog inteligentnim sistemima umesto iskljucivog os-lanjanja na sintaksnu analizu.

    1.1 Definicija i oblasti bavljenja VI

    Definicija 1.1 Bilo koji problem za koji ne postoji efikasno algoritamskoresenje je problem vestacke Inteligencije (VI).

    Ovu definiciju i jedan dobar deo strukture ovog teksta dugujem [JL] i [GN].Ovakva definicija daje prakticniji i bolji pogled na pojam VI od uobicajeneMakartijeve (MIT) definicije da je to oblast racunarstva ciji je cilj rezonovanjena racunaru na nacin koji je slican ljudskom. Iako ova potonja definicija daje

    intuitivniji i u nekom smislu precizniji opis oblasti kojima se bavi VI, ona vodika ozbiljnim ontoloskim pitanjima i problemima: imamo sliku o ljudima kaosvesnim, slobodim, umnim i racionalnim bicima, a u isto vreme ljudi su agentiu fizickom svetu ustrojenom u naucnom smislu deterministicki i materijalno,lisenom smisla (mehanicisticki i partikularno, gde cestice nemaju svest).Kako to onda da u takvom svetu postoje ljudi kao bica sa svescu i namerom? Da li je moguce um preneti iz jednog organskog bica u punom smislu uneki fizicki sistem zasnovan iskljucivo na postojecoj ili buducoj informacionojtehnologiji ? Ovo su samo neka pitanja koje Dzon Serl vesto postavlja u[JS], povezuje ih i odgovara na njih, a na poslednje pitanje uglavnom dajenegativan odgovor. Medutim, to ne znaci da su oblasti VI rekle sve sto imaju

    (daleko od toga), naprotiv - te oblasti vec su ostvarile sjajne rezultate, i umnogome pomogle kao alati i ljudima i nauci. Kognitivne nauke, ali i onekoje su u vezi sa njom a nisu u direktnoj vezi sa VI i racunarstvom, mogupomoci istrazivanjima u oblasti VI, ali cesto se desava i obratno. Na kraju, nepostoji potpuno dobra definicija VI jer ne postoji ni potpuno dobra definicijainteligencije i pojmova u vezi nje.

    Efikasnost se moze jasno, pa cak i formalno definisati komplesnoscu al-goritma - npr. polinomijalna kompleksnost (i NP) je dobra i pozeljna (usmislu efikasnosti) - prvi teorijski rezultati nastaju tek pocetkom 1970-tihgodina (Steven Cook, Richard Karp). VI se moze smatrati eksperimentalnomnaukom u kojoj se eksperimenti vrse na racunaru u okviru modela koji su

  • 8/2/2019 ZoranPopovicTanjaVukovic

    8/148

    Osnove vestacke inteligencije I 7

    izrazeni programima i cijim se testiranjem i doradivanjem postizu neki modeliljudske inteligencije (kojima se ova npr. moze bolje razumeti - ne postojirealno ocekivanje niti cilj da VI zameni ljudsku inteligenciju osim u nekimspecificnim oblastima ljudske delatnosti i primenama racunarstva cije granicepomera VI). Pod algoritmom obicno podrazumevamo ureden konacan niz

    precizno definisanih operacija koje mogu biti izvrsene (na racunaru). Alito ne znaci da ce biti izvrsene u nekom ,,razumnom vremenu - postojimatematicki formalizam kojim se ovo moze preciznije obuhvatiti i definisatikao sto su to npr. Tjuringove masine i slicni formalizmi (Alan Tjuring,inace je jedan od prvih informaticara i jedan od prvih istrazivaca VI nadigitalnim racunarima, ustanovio je prvi praktican test programa VI u komerazdvojeni ucestvuju ljudi, programi i ispitivaci) . Na primer, ne postoji,,klasican algoritam za igranje saha koji bi mogao da se koristi upotrebljivo

    jer bi algoritmu koji bi ispitao sve moguce pozicije za svaki potez bile potrebnibarem milioni godina i na najbrzim postojecim racunarskim sistemima.

    Osnovne dve osobine oblasti kojima se bavi VI (bez osvrta na nekeodredene dobro definisane metode):

    1. ticu se obrade simbolickih podataka (nasuprot tradicionalnoj numerickojobradi kao primeni racunara)

    2. uvek ukljucuju nekakav element izbora: nedeterminizam kojim se kazeda ne postoji algoritam na osnovu koga bi izabrali neku opciju u skupumogucih za datu situaciju

    Racunari danas sve bolje rukuju multimedijalnim sadrzajima ali je to rukovanjei njihova obrada jos uvek daleko od onoga sto ljudska cula i svest pruzajuu opazanju i razumevanju sveta. Zato prva osobina nudi osnovu resavanjaprvog problema na koji se nailazi u VI - sakupljanje informacija. Postojedobro ustanovljeni formalizmi i u matematici i u igrama koji cine simbolicke(nenumericke) podatke posebno znacajnim. S druge strane, prepoznavanje iobrada (pattern recognition) zvucnih i vizuelnih signala predstavlja izazov zasebe, ali je posebno zanimljivo razumevanje i zakljucivanje koje sledi nakontoga.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    9/148

    8 Seminarski rad

    1.2 Kratak uspon i pad, zatim renesansa

    Nakon pocetnog entuzijazma nastalog pod uticajem tehnoloskog razvojaracunara do pocetka 70-tih brzo se doslo do zakljucka o pravoj tezini problemaVI, npr. da za automatsko prevodenje nisu dovoljni samo sintaksna analiza,

    recnik i dobri algoritmi pretrage vec i znanje o semantici jezika, pa i opsteznanje i iskustvo (poznat je primer o programima za automatsko prevodenje,kada se izmedu bar dva jezika nekoliko puta ista recenica prevede - anegdotakaze da je od engleske poslovice ,,Daleko od ociju, od srca tako dobijen,,nevidljivi idiot). Takvi problemi su narusili nerealno idealnu sliku o VI ioznacili period njene krize, o cemu npr. pise Dreyfys 1972. i kasnije Lighthill1973. ciji preterano kritican izvesta j utice na sudbine mnogih istrazivackihprojekata (problem nije bio u VI vec u zahtevima od tada mlade oblasti).Prvi uspesni ekspertni sistemi kao sto je to bio DENDRAL i MYCIN (EdwardFeigenbaum) predstavljaju pocetak izlaska iz te krize. Osnovu izlaska cini

    i posmatranje domenskog (deklarativnog) znanja inteligentnih sistema, gdesu vazni bili uopsteni alati kao sto su frejmovi (okviri, pocetkom 1970-tih)Minskog kojima se to znanje formalizuje ali i prakticno koristi. Minski je biopoznat i kao tvorac mirkosvetovakao probnih formalnih poligona za resvanjeproblema VI (koje je davao svojim studentima), kakav je bio i Svet blokova(sistem SHRDLU koji je razvio Terry Winograd 1971. je bio veoma uspesanu resavanju njegovih problema, ali je bio potpuno neprimenjiv za bilo kakvouopstavanje zbog nedostatka domenskog znanja, koje je u tom slucaju bilo,,utkano u sintaksnu analizu tog sistema). Negde 1972. Alain Colmerauer

    je razvio Prolog, sledeci jezik VI (posle LISP-a) koji pored ostalih klasifikacijaspada u deklarativne programske jezike i jedan je od najznacajnijih alata VI.

    Od 1980-tih godina nakon prvih pokusaja industrijalizacije VI (i racunari5. generacije, pored jezika) i eksplozije PC industrije pocinje zreliji periodrazvoja VI sa akcentom na primeni postojecih teorija, novim metodamai teorijskoj potvrdi novih metoda - neki rezultati u oblasti prepoznavanjagovora ili racunarske vizije su tako blizi realnom svetu (naspram teorijskihmikrosvetova) i prakticnoj upotrebi. Masinsko ucenje koristi dostignucamatematicke statistike, ali i nove metode cija je primena vec sada nezamenljiva.Ideja inteligentnog samostalnog entiteta ili agenta koji kontinualno funkcioniseu stvarnom svetu sa usadenom inteligencijom (situated intelligence) takodepostaje sve aktuelnija (predlog uopstenog resenja kroz SOAR arhitekturukao primer - Newell, Rosenbloom, John Laird, ili life-long learning, TomM. Mitchell). Ideja deklarativnog znanja razvojem WWW-a postaje sve

  • 8/2/2019 ZoranPopovicTanjaVukovic

    10/148

    Osnove vestacke inteligencije I 9

    aktuelnija idejom semantickog web-a (Tim Berners-Lee, koji je ujedno i idejnitvorac web-a zasnovanog na HTTP i HTML, regulisanog W3C), gde pojamweb ontologije prirodno nasleduje okvire Marvina Minskog.

    1.3 OblastiInteligentnim sistemima nazivamo programske sisteme i druge prakticne

    rezultate VI, odnosno posledicu jedne od neformalnih definicija VI (kaooblasti racunarstva koja je posvecena inteligentnim sistemima): entiteti kojiimaju sposobnost inteligentnog ponasanja koje srecemo kod ljudi. Medutim,ovakav pristup definisanju ima dodatnu slabost - u oblastima kakve su masinskoucenje ili ekspertni sistemi, javlja se potreba za resavanjem problema kojimatreba prevazici neki ljudski nedostatak. Na primer, velika kolicina znanjakojim je tesko upravljati cak i uz pomoc veceg broja ljudi - formalna definicijau uvodnom poglavlju ne ostavlja nedoumice u tom pogledu, ali ne objasnjava

    potrebu i nacin na koji ljudi zele da upravljaju znanjem. Oblasti vestackeinteligencije sa nekim podoblastima i tipovima inteligentnih sistema (nekeod njih ili bar najveci deo bice objasnjen u ovom tekstu detaljnije) jesu:

    ekspertni sistemi - sistemi kojima se cuva i eksploatise znanje na nacinslican ljudskim ekspertima

    masinsko ucenje - metode klasifikacije, otkrivanja znanja (Data Mining),dobavljanje informacija (information retrieval), indukcija, prepoznavanjesablona (pattern recognition)

    igre - teorija igara i primene, sah ... predstavljanje znanja - jezici predstavljanja znanja, strukture rasud ivanje (rezonovanje) - pretrazivanje, razlicite metode rasud ivanja

    (od Aristotelovih silogizama do danas) i automatsko dokazivanje teorema,formalno automatsko dokazivanje ispravnosti

    obrada prirodnog jezika - masinsko prevodenje, razumevanje i analizadijaloga, automatsko ispravljanje i generisanje

    agenti - multi-agentski sistemi i primene, softboti, web mining

    govor - problemi prepoznavanje, generisanje i razumevanja govora, pre-poznavanje govornika i autentifikacija

  • 8/2/2019 ZoranPopovicTanjaVukovic

    11/148

    10 Seminarski rad

    vizija - problemi interpretacije i razumevanja slika racunska inteligencija (soft computing) - fazi logika i sistemi, neuronske

    mreze, genetski algoritmi, primene u automatskom odlucivanju i upravljanju

    robotika kognitivne nauke (multidisciplinarna oblast u kojoj se preplicu VI i

    psihologija, filozofija, neurologija, biologija, lingvistika, antropologija):uverenja, kreativnost, emocije, pamcenje, percepcija, priroda inteligencijei svesti, usadena sposobnost saznavanja (kognicija), i mnoge ,,kombinacijekakva je i evolutivna psihogija (uticaj bioloske strukture organizma napsihu i obratno - jedinke kao eksponenti DNK)

    edukacija - inteligentni tutorski sistemi

    inteligentni interfejsi - modeliranje korisnika, dijaloga i objasnjenja,

    veza sa tehnologijom

    filozofski aspekti, eticke i drustvene implikacijeNaredno poglavlje ima takode uvodni karakter, gde se pre svega ilustrujeznacaj pojmova problema i resenja, znanja i njegovog reprezentovanja. Poglavlja8, 12 i 13 (i donekle 7) izlaze izvan okvira ovog teksta, ali predstavljaju dobarnagovestaj daljih saznanja u vezi ostalih osnovnih pojmova VI.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    12/148

    Osnove vestacke inteligencije I 11

    2 Poglavlje 2 - Predstavljanje problema

    2.1 Pojam problema

    Problema postajemo svesni kada zelimo da nesto postignemo ali ne znamo

    kako da do toga dodemo, ne znamo njegovo resenje (ili postupak, algoritamkojim bismo dosli do toga). Problem uvek podrazumeva i neko resenjeili potragu za resenjem. Za razliku od problema u svakodnevnom zivotu,problemi skolskog tipa su obicno precizno opisani zajedno sa ponudenimpodacima neophodnim za njegovo resavanje, pogotovu matematicki problemiili igre. U realnom svetu problem moze biti opisan prirodnim jezikom (cijerazumevanje u smislu interpretacije predstavlja jedan od osnovnih primeraproblema VI) koji sa tacke gledista resavanja problema ima barem cetiriozbiljna nedostatka: nekompletnost (bez konteksta lako moze doci do nespo-razuma u razgovoru), redundantnost, nejasnoca tj. visesmislenost i gramatickaneispravnost. Potrebno je zato najpre naci formu zapisa problema tako da

    se ovi nedostaci izbegnu. Primer za to su zatvoreni izrazi:

    x X : K(x)gde se pod tim podrazumeva da za dati skup X (cime je implicitno datastruktura skupa sa svojim operacijama) treba naci sve njegove elemente xza koje je ispunjen skup ogranicenja K(x). Ovo obicno vodi ka postupkutrazenja prvog resenja koje smanjuje dalji prostor resenja koji treba pretrazitii dozvoljenim transformacijama se tako iterativno dolazi do konacnog zatvo-renog izraza koji daje direktno resenje. Variajante ovakvih problema mogubiti resavanje slagalice (gde je lako navesti sve dozvoljene transoformacije

    od pocetnog stanja do zavrsnog) ili dokazivanje jednacine gde izbor i brojtransformacija uopste nije jednostavno naci.

    2.2 Resavanje problema, uopsteni koraci

    Uobicajen redosled koraka u resavanju problema mogao bi biti:

    1. Procitaj ili upamti problem s razumevanjem

    2. Izvedi neposredne zakljucke o tome ako je moguce (time se moze docido nedostajucih podataka i elegantnije formulacije)

    3. Poigraj se sa dobijenim zakljuccima i upamcenim cinjenicama (veomabitan korak ljudima)

  • 8/2/2019 ZoranPopovicTanjaVukovic

    13/148

    12 Seminarski rad

    4. Porazmisli o svemu, ostavi da stvari sazru

    5. Potrazi bolju formulaciju, uoci zatvoren izraz

    6. Nadi delimicno resenje i vrati se na 2. korak ili nadi konacno resenje

    7. Proveri ispravnost resenja, potrazi moguce uopstenje

    Postupak koji je predlozio George Polya (1956) se moze uporediti sa prethodnim:

    1. Shvati problem (podaci, nepoznate, uslovi, crtez, itd.)

    2. Napravi plan (veza podataka i nepoznatih, potproblemi i ranije resavaniproblemi, drugacija formulacija, i sl.)

    3. Sprovedi plan (da li su svi koraci jasni i da li se mogu potkrepitidokazima ?)

    4. Prouci dobijeno resenje (da li je ispravno, da li se moze primeniti naneke druge probleme)

    Dakle, inteligentno resavanje problema pretpostavlja stvaranje plana za njegovoresavanja.

    2.3 Notacije, nacini reprezentovanja

    Kao sto je pomenuto, nacin zapisivanja i reprezentovanja problema jeveoma bitan deo resavanja jer pojednostavljuje i cesto ubrzava resavanje.Ljudski um se u svakodnevnom zivotu rukovodi apstraktnim modelima sto

    zapocinje u razlicitim slojevima od samih cula sve do psihickih procesa.Koriste se nizovi simbola i seme za zapis teksta, muzike ili matematickihizraza koji su sustinski grafickog karaktera. Matematicke notacije su polaznaosnova za izgradivanje formalizama koji su nam neophodni za proucavanjeovakvih modela.

    Svi notacioni sistemi uopsteno se sastoje od simbola objekata i simbolaoperatora (arnost - koliko objekata napadaju) koji predstavljaju moguceakcije nad objektima. Linearne notacije predstavljaju niske ovakvih simbola.Pravilno formirane niske definisane prema redosledu objekata i operatoradaju izraze koji mogu imati vrednost (primeri: infiksni, prefiksni (poljski) ipostfiskni zapisi aritmetickih izraza, izraza teorije skupova ili logickih izraza).

  • 8/2/2019 ZoranPopovicTanjaVukovic

    14/148

    Osnove vestacke inteligencije I 13

    Koriscenjem grafova tj. drveta kao specijalne vrste grafova koji su primer,,dvodimenzione notacije se ovakvi izrazi mogu takode zapisati (cvorovisu operatori, listovi objekti, a redosledom obilaska i citanja drveta se mozedobiti linearan zapis i obratno).

    Ovo nas dovodi do zapisa koji su upotrebljivi u algoritmima i programima(liste su znacajne zbog toga posebno, pogotovu u nekim programskim jezicimakao sto je LISP) i takode se mogu pokazati ekvivalentnim nekim prethodnimstrukturama. Liste se mogu posmatrati kao uredene trojke (S,L,R) gde je S,,glava ili operator, a L i R su takode liste ili ,,rep(leva i desna ,,sestra,redosled kao kod obrnute poljske notacije). Naravno, niz ovakvih trojki je umemoriji indeksiran i pocinje sa pomenutom trojkom, dok su L i R zapravopokazivaci na clanove niza, i listovi imaju objekte umesto operatora (listoviimaju ,,L=R=null, null je oznaka prazne liste). Transformacije nad ovakvimstrukturama kao sto su zamena podliste drugom listom ili brisanje podliste

    - u uobicajenoj infiksnoj notaciji se svode na zamenu ili brisanje podtermaili grane na drvetu.

    Sd

    dd

    dd

    d

    b

    a

    S a b

    2.4 Modeli grafova u VI

    Grafovi su znacajan alat za reprezentaciju objekata i znanja kao dva bitnanivoa prisutna kako u matematici (npr. objekti, izrazi naspram relacija,teorema) tako i drugim oblastima. U vestackoj inteligenciji se tako mogulakse razmatrati problemi masinskog dokazivanja teorema, problemi vizijei govora, automatskog resavanja problema i razumevanja prirodnog jezika.Upotreba grafova je i u tome od znacaja kako ljudima, tako i programimai resenjima VI u smislu modela grafova. U jednom od narednih odeljaka

  • 8/2/2019 ZoranPopovicTanjaVukovic

    15/148

    14 Seminarski rad

    bice kratko navedene formalne definicije grafova i njihovih osobina, a vecnaceta tema reprezentacije znanja (i strukture znanja) bice dalje pojasnjena.Grafovi takode predstavljaju i jedan od bitnih spojeva razlicitih formalnodefinisanih problema i njihovih prakticnih resenja u VI.

    2.4.1 Reprezentovanje znanja u automatskom resavanju problema

    ... transformacija ...

    Spoljasnja reprezentacija

    '&

    $%Formalni iskaz problema

    '&

    $%Formalni iskaz resenja

    E

    Interna reprezentacija

    '&

    $%Interni iskaz problema

    '&

    $%Interni iskaz resenja

    Ec

    T

    (ilustracija odnosa formalnog i internog reprezentovanja problema i resenja)

    Interna reprezentacija je zapravo prostor resenja u kome se od nekog pocetnogstanja nekim postupkom resavanja stize do resenja (prostor resenja je definisani

    podskup prostora stanja).Relacija (time i graf kao nacin prikaza relacije) moze imati osobine koje

    je cine relacijom ekvivalencije (R,S,T) ili relacijom poretka. Takvi grafovi sukorisni u algoritmima za masinsko dokazivanje gde se heuristike standardnihalgoritama za rad sa grafovima svode na heuristike u dokazivanju. Graf mozebiti od pomoci kao vizuelno i intuitivno pomagalo coveku i ekvivalentnastruktura u programu, ili moze biti od pomoci kao struktura koja opisujepostupke u resavanju problema i odnose medu objektima (noseci njihovusintaksu i semantiku). Heuristike (kao precice u postupku resavanja nekogproblema koje daju efikasnije algoritme) se porede npr. s internim znanjemnekog matematicara kada resava neki problem i uopste su veoma znacajneza VI, kao i razdvajanje eksterne (,,sintaksnog) reprezentovanja znanja i

  • 8/2/2019 ZoranPopovicTanjaVukovic

    16/148

    Osnove vestacke inteligencije I 15

    internog (,,semantickog). Nekoliko interesantnih primera / skica automatskogdokaza teorema u geometriji i teoriji skupova:

    Primer 1 - polazeci od topoloskog reprezentovanja skupova (Merialdo, 1979)umesto Venovih dijagrama:

    1

    BA

    321

    B

    A

    32

    mogu se dobiti pregledniji grafovi kao pomoc u resavanju. Primer:ako je A zatvorenje skupa A (najmanji zatvoren skup koji sadrzi A) iA = A C(A) njegova granica, vazi:

    Teorema 1 A = (A A) (C(A) A)A

    4321

    C(A)C(A)

    A

  • 8/2/2019 ZoranPopovicTanjaVukovic

    17/148

    16 Seminarski rad

    Na grafu se ,,vidi da su ,,atomski elementi(zapravo reprezenti klasaelemenata datih osobina) granice - atomi 2 i 4, a tvrdenje sledi postoisto tako vazi da je A A = atom 2 i C(A) A = atom 4.

    Primer 2 Trazenje geometrijskog mesta tacaka ili konstrukcija lenjirom isestarom su takode moguca primena upotrebe grafova u VI. Primerproblema: ako je dat krug k i dve tacke A i B van tog kruga konstruisatipravu p kroz A tako da su njeni preseci C i D sa k jednako udaljeni odB.

    k

    B

    I

    C

    D

    (d)

    (d)

    A

    O

    R

    Program moze kao i covek da pode od pretpostavke da gotovo resenjepostoji kao u dijagramu iznad, konstruisuci dva bitna objekta - pravu d itacku I koja polovi CD. Elementi ovakvog dijagrama se predstavljajuu tabeli ciji su redovi oblika: naziv objekta (d), tip (prava), stepenslobode (1), predstavnici (B, I - pripadaju d) - ovakav red se nalazi napocetku resavanja problema. Stepen slobode govori koliko je elementodreden (npr. prava je odredena dvema razlicitim tackama, B je zadataa I tek treba odrediti). Prava d potpuno zadata tackama O i Bkoincidira sa d posto su trouglovi BC D i OCD jednakostranicni, OIi BI bisektrise CD i time ista (jedinstvena) prava, sto daje red upomenutoj tabeli: d prava 0 d, B, I, O. Vazi da I pripada OB.Posto je ugao AIB prav to znaci da I pripada krugu nad precnikom

  • 8/2/2019 ZoranPopovicTanjaVukovic

    18/148

    Osnove vestacke inteligencije I 17

    AB koji je time potpuno odreden a time i I kao njegov presek sa d.Odatle sledi da je p potpuno odredena tackama I i A.

    Primer 3 Primer iz teorije skupova sa preslikavanjima i kompozicijama kojije uspesno resio program DATE (Pastre, 1978) kao i jos oko 150 teorema

    u vezi teorije skupova, preslikavanja, kongruencija i kardinalnostu. Primerteoreme koju DATE moze da dokaze:

    Teorema 2 Ako su f : A B, g : B C, h : C A tripreslikavanja i ako za dva od bilo koja od tri preslikavanja k1 = hgf,k2 = f h g, k3 = g f h vazi da su surjekcije (NA) i da je treceinjekcija (1-1), onda su sva tri preslikavanja f, g i h bijekcije.

    2.4.2 Graficko reprezentovanje znanja u automatskom resavanjuproblema

    O automatskom resavanju i razvijanju grafa moze se govoriti i kroz primerI - ILI drveta trazenja resenja (npr. logicki iskaz se razvije i od korena,,diskutuje prema listovima):

    CVOR ,,I"

    PG1pPG12PG11

    PGnPG2PG1

    ...

    ...

    CVOR ,,ILI"

    Cvorovi ,,ILI se odnose na disjunkcije a cvorovi ,,I se odnose na konjunkcije.Svaka podgrana (PG) predstavlja podcilj u pretrazi koji se moze resavatiposebnim metodama koje opet mogu proizvesti svoje podgrane (podciljeve).Tada je veoma pozeljno svesti takvo drvo na jednu granu (da li zbog nacinapretrazivanja ili zbog samog problema nedeterminizma prisutnog u VI to

    je tesko dostizno). Razbijanje problema na podprobleme kao i drveta napoddrvece je korisna osobina i jednog i drugog - primeri (neki detalji su u

  • 8/2/2019 ZoranPopovicTanjaVukovic

    19/148

    18 Seminarski rad

    [JL]): PRET (resavanje trigonometrijskih problema, Grandbastien, 1974),PARI (problemi celobrojne aritmetike, Burgoin, 1978) ili automatsko do-kazivanje teorema iskaznog racuna (Pitrat, 1966). Primer je i uporedivanjeproblema optimizacije u operacionim istrazivanjima gde se iskazi oblika ,,procesprethodi procesu uz potrebna vremena za izvrsenje i ,,procesi se nemogu

    paralelno izvrsiti resavaju algoritimima optimizacije putanje kroz graf ibojenja grafa, redom.

    2.4.3 Graficka reprezentacija i prirodni jezik

    Veza sintakse i semantike jezika je presudna kod problema razumevanjaprirodnog jezika u cilju automatskog prevodenja. Prvi pokusaji koji su seoslanjali samo na sintaksu i prevod reci u rec su se pokazali nedovoljnim,vec je potrebno u recniku dati nekakvo semanticko znacenje na osnovu kojegprogram gradi semanticku konstrukciju dela teksta, kao i dosta pragmaticnog

    ljudskog znanja o svetu uopste. Kontekstno slobodne gramatke NoamaComskog s pravilima transformacija (npr. LR1) su morale biti nadogradenegramatikama u kojima bi jezicki automat u nekom trenutku analize se vracaona prethodne nivoe obilaska drveta transformacija i razresio neke semantickeprobleme da bi nastavio analizu (rekurzivne gramatike viseg reda).

    Prosirene Mreze Prelaska (Augmented Transition Networks - ATN, Woods,1975) mogu se koristiti za sintaksno-semanticku analizu i predstavljaju grafoveciji su cvorovi ili reci, ili semanticke familije ili podgrafovi (tako da je ovakvareprezentacija sustinski rekurzivna). Ono sto je interesantno za njih je da

    jezicki procesor koji ovako tekst analizira gradi na osnovu semantickih pravila

    internu formu koja se zove semanticka mreza (semantic network) i kojapredstavlja rezultat obrade recenice prirodnog jezika (u [JL] dat je primervezan za analizu elektricnih kola). Grafovi su korisni i kao formalni oblikreprezentacije podataka i znanja, ali i kao intuitivan ljudski alat za resavanjeproblema.

    2.5 Trazenje pravog reprezentovanja

    Trazenje pravog nacina reprezentovanja problema je skoro uvek najznacijnijikorak u resavanju problema - primer problema: dva crna skakaca s jednestrane i dva bela s druge na 3x3 sahovskoj tabli treba da zamene mesta u stomanjem broju koraka. Kada se uoci da su pozicije skakaca elementi skupa

  • 8/2/2019 ZoranPopovicTanjaVukovic

    20/148

    Osnove vestacke inteligencije I 19

    ciklicne strukture reda 8 onda se lako uoci i resenje.

    2.6 Programski jezici PROLOG i LISP

    PROLOG i LISP su jedni od najznacajnijih programskih jezika bitnih zaVI. Njihov znacaj i primene u vestackoj inteligenicji (pored istorijskih) subrojne. Lista kao osnovna struktura podataka u LISP-u je ujedno i nacinreprezentovanja znanja (sam program je takode lista pa se npr. u nekimgenetskima algoritmima koristi kao struktura koja se rekombinuje; mnogisistemi kao sto je to npr. CLIPS su inspirisani ovim jezikom, itd). Jednomusvojeno iskustvo sa ovakvom strukturom i funkcionalnom filozofijom prog-ramiranja se lako prenosi i u druge pristupe programiranju i VI. Njegovasintaksa se moze vrlo jednostavno definisati

    := |

    := ( ) := | |

    := niska alfanumerika bez razmaka (standardni identifikator)

    i specijalnih znakova.

    gde je nil je prazna lista bez elemenata. Prvi atom liste je funkcija koja mozebiti ugradena (npr. funkcija QUOTE koja zaustavlja evaluaciju L za (QUOTE L)ili skraceno L) a evaluacija funkcije tako zadate listom je izvrsavanje LISPprograma.

    U ostatku teksta ce se uglavnom koristiti ,,kvazi-predikatski jezik i re-prezentacija znanja koja ukazuje na predikatski racun prvog reda ili bliskeforme. Ako se uzmu u obzir Hornove klauzule i rezolucija, takav nacinreprezentovanja znanja i jezik su najblizi PROLOG-u. PROLOG takodekoristi liste (sintaksa oblika [e1, ,en] ili [glava|rep], dok se u tekstukoristi ,,. tacka umesto vertikalne crte ,,|) ali ne kao osnovnu strukturupodataka, odnosno nacin reprezentovanja znanja.

    2.7 Grafovi

    Formalna matematicka definicija grafa je:

  • 8/2/2019 ZoranPopovicTanjaVukovic

    21/148

    20 Seminarski rad

    Definicija 2.1 Struktura G = (X, R) je graf gde je X skup cvorova ilitemena grafa, a R je binarna relacija nad skupom X (R X X).

    Ako je R simetricna, kaze se da graf nije orijentisan i veze izmedu cvorova su

    ivice, a ako je antisimetricna (bitan je redosled temena) onda su veze izmedutemena lukovi.

    Definicija 2.2 G = (Y, V) je parcijalni graf grafa G = (X, U) akkoY = X i V U.

    G je pod-graf grafa G akko Y X i V = U W gde jeW = { (v, w) | v X Y w X Y}

    (uklonjena su neka temena zajedno s lukovima).

    Stepen cvora je broj suseda tj. ukupan broj prethodnika i naslednika (ulaznihi izlaznih lukova).

    Putanja od temena a do temena b u G je konacni niz temena c1,...,cntd. je a = c1 i b = cn i svaki (ci, ci1) U. Ako graf nije orijentisan onda

    je dovoljno da(ci, ci1) U ili (ci1, ci) U i onda je putanja lanac kojipovezuje a i b.

    Ciklus je zatvoren lanac tj. a = b.

    Ako za za svaka dva cvora grafa postoji lanac koji ih povezuje kaze se daje graf povezan, a ako ih povezuje putanja (graf je orijentisan) onda je jako povezan.

    Postoji mnogi alati teorije grafova i algoritmi koji su korisni i u mnogimkonkretnim primenama (npr. Warshall-ov algortiam za tranzitivno zatvorenje,problemi najkracih puteva i drugo). Jedno od veoma korisnih prosirenjapojma grafa su Petri mreze (i njeni derivati).

    2.7.1 Petri-mreze

    Osnovnu postavku Petri mreza u svojoj doktorskoj disertaciji dao je CarlAdam Petri, cija se formalna definicija odnosi na standardne ili obicne Petri

  • 8/2/2019 ZoranPopovicTanjaVukovic

    22/148

    Osnove vestacke inteligencije I 21

    mreze kao najrasprostanjeniji dijalekat (vrsta). Postoje i mnoga prosirenja,primene i posledice ovog alata. Petri mreza kao struktura se oslanja na pojammulti-skupa (skup u kome je dozvoljeno ,,ponavljanje elementa - multiset,bag - formalno par (S, f) gde je f : S N preslikavanje koje slika elementosnovnog skupa S u broj ponavljanja - u sustini dovoljno je f kao multiskup

    ako se S podrazumeva), broj ponavljanja elementa x multiskupa B, x B,se oznacava i sa #(x, B) (njegova kardinalnost).

    Definicija 2.3 Petri mreza je petorka C = (P,T ,B,F,), gde je:

    P = {p1,...,pn} neprazan skup mesta, T = {t1,...,tm} neprazan skup prelaza td. P T = , F : T NP, ulazna funkcija preslikava prelaz u multiskup ulaznih

    mesta,

    B : T

    NP, izlazna funkcija preslikava prelaz u multiskup izlaznih

    mesta,

    : P N je funkcija markiranja koja dodeljuje nenegativan ceo brojmestu, ali moze predstavljena i kao n-dimenzionalni vektor markiranja = (p1,...,pn), n = |P| gde je i broj tokena u mestu pi.

    Prelaz ti T moze biti upaljen ako je:(pi P)pi #(pi, F(tj))

    Paljenjem prelaza tj T dolazi do promene vektora markiranja u novivektor takav da je:

    (pi P)pi = pi #(pi, F(tj)) + #(pi, B(tj))Nizom paljenja prelaza se definise izvrsavanje Petri mreze.

    Graf Petri mreze G = (V, A) je takav da skup cvorova V = {v1,...,vs}koga cine dva disjunktna skupa V = P T, P T = (skup mesta i skupprelaza), i A = {a1,...,ar} skup lukova gde vredi:

    (ai A)ai = (vj , vk) (vj P vk T) (vj T vk P)Graficka reprezentacija mesta je obicno krug ili elipsa (sa nekom oznakomtokena oznacavanja), a prelaz pravougaonikom ili vertikalnom crtom. Takose graf sastoji pre svega iz dva tipa lukova:

  • 8/2/2019 ZoranPopovicTanjaVukovic

    23/148

    22 Seminarski rad

    ulaznih (od mesta ka prelazu - vazi ako je F(tj, pi) > 0, ako je vrednostveca od 1 upisuje se iznad luka)

    izlaznih (od prelaza ka mestu - vazi ako je B(tj, pi) > 0, ako je vrednostveca od 1 upisuje se iznad luka)

    Moguce su mnoge primene i primeri ovakvih struktura: modeli i formalnaverifikacija distribuiranih sistema (multi-agentskih sistema, primera radi),komunikacionih protokola, upavljanje projektima i planiranje, modeli multi-procesorskih sistema, itd.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    24/148

    Osnove vestacke inteligencije I 23

    3 Formalni sistemi - deklarativno znanje i zakljucivanje

    Formalno predstavljanje znanja je neophodan korak u reprezentovanjuznanja i izgradivanju osnovnih struktura u programu pa i u VI. Formalnisistemi su vrsta apstraktnih struktura kojima se mogu strogo matematicki

    zasnovati formalni jezici, matematicka logika ili druge strukture i osnovnematematicke oblasti koje su neophodne kao osnovni primeri formalnog rep-rezentovanja znanja i zakljucivanja o njemu - za strogo zasnivanje neophodnobi bilo definisati pojmove kao sto su: niz, nizovi simbola (niske - je praznarec duzine 0, n je skup svih niski duzine n nad alfabetom , =

    iN

    i),jezik kao podskup svih niski datog alfabeta ciji su elementi recenice, formalna(kontekstno slobodna) gramatika kao struktura G = (V , T , P , S ) (gde su Vneterminalni simboli, T terminalni, P skup produkcija tj. relacija medurecenicama kojima se zadaju pravila izvodenja (koraka transformacije) recenica,S je pocetni neterminalni simbol) i jezik L(G) njome definisan, itd.

    3.1 Definicija formalnih sistema

    Definicija 3.1 Formalni sistem (FS) je uredena petorka (,G ,A,P,T ) gdeje:

    1. konacni alfabet (ciji su elementi terminalni simboli jezika formalnogsistema)

    2. G formalna gramatika - kao nacin strogog definisanja pravila formiranjaispravnih recenica (wff - well formed formulas) odnosno formula FS

    3. A skup recenica koje predstavljaju aksiome - formule FS koje imajuposebnu ulogu u FS.

    4. P konacan skup pravila izvodenja (ili dedukcija, zakljucivanja) recenica(ispravnih u sistemu) u obliku relacija recenica:

    U1, U2,...Up W1, W2, ...Wncime se oznacava izvodenje iz reci Ui (1 i p) u reci Wj (1 j n)

    5. T skup teorema - formula FS koje se mogu izvesti iz aksioma, ukljucujucii aksiome

  • 8/2/2019 ZoranPopovicTanjaVukovic

    25/148

    24 Seminarski rad

    Dokaz je konacan niz reci M1,...,Mr ciji su clanovi ili aksiome ili reciizvedene iz prethodnih clanova tog niza prema pravilima izvodenja (4).

    Teorema t je rec (formula) za koju postoji dokaz tako da je Mr

    t i pise se

    t. Aksiome su teoreme po definiciji. Dok se za nisku moze u konacnombroju koraka odrediti da li je ispravna recenica, za pitanje da li je formulateorema to ne mora biti tako.

    Vazi: T L(G) . Kao sto postoje neterminalni simboli kod formalnihgramatika koji nisu deo alfabeta ali ucestvuju u produkcijama (svojevrsnepromenljive, konacno izvedena recenica ih ne sadrzi), tako se i u aksiomama ipravilima izvodenja mogu koristiti gde zamenjuju bilo koju ispravnu recenicuFS (prakticno se mogu shvatiti i interpretirati kao sheme aksioma i pravila -

    npr. jedna aksioma sa takvim simbolom predstavlja zapis prebrojivo mnogoaksioma, koliko ima i formula FS). Pravila koja sadrze takve promenljive zovuse prepravljanja (re-writing - odnose se na deo recenice leve strane pravila),inace su zovu produkcijama. Pretpostavka je da je broj aksioma i recenicarekurzivno prebrojiv (postoji pravilo, algoritam po kome se moze doci dosvakog u konacnom broju koraka).

    Pored ovih apstraktnih struktura, znacajan je i pojam konceptualizacijekao modela univerzalne algebre, odnosno trojke (, F , R) gde je skupelemenata domena, F skup funkcija (elementi su f : n , razlicitiharnosti n), R skup relacija konceptualizacije (elementi su

    m, razlictih

    arnosti m). Uz predikatski racun prvog reda (PR1) kao odgovarajuci jezikkonceptualizacije dobijamo sintaksni nivo deklarativnog znanja koji odredujealfabet sa tri klase: simbolima konstanti domena, konstanti funkcija i konstantirelacija, a uz interpretaciju (preslikavanje ovakvih elemenata jezika u od-govarajuce elemente konceptualizacije tj. modela) dobija se deklarativnasemantika, veza izmedu sintakse (jezika) i semantike (konceptualizacije).Znanje formalizovano ovakvim strukturama se naziva deklarativnim znanjem.Znacaj pojma konceptualizacije je i taj da ne mora da zavisi od izbora jezika,tako da umesto PR1 to moze da bude jezik binarne tabele, semanticke mreze,okvira (koji se uglavnom mogu svesti na PR1, proceduralni deo okvira se

    jedino ne uklapa) ili neki drugi.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    26/148

    Osnove vestacke inteligencije I 25

    Pomenuti formalni sistemi su osnova za definisanje pojma formalnog matematickogdokaza, gde se obicno podrazumeva Hilbertov sistem dedukcije koji posmatralogiku sa cisto sintaksnog aspekta, dok teorija modela (univerzalna algebra+ logika) tezi semantickom pogledu. Definicija FS potice iz knjige [JL], oformalnim jezicima se moze saznati vise iz [HU], dok se o deklarativnom

    znanju i zakljucivanju moze saznati vise iz [GN]. Slede primeri i pojasnjenja.

    3.2 Iskazni racun i predikatski racun prvog reda

    Tako je iskazni racun jedan od najpoznatijih primera formalnih sistema(klasican oblik matematicke logike u uzem smislu, kao i Bulova algegbra,dok se u sirem smislu podrazumeva i teorija modela, teorija skupova i teorijaizracunljivosti), i mnogo vise od toga - prethodi definiciji predikatskog racunaprvog reda (PR1), koji je osnova mnogih prakticnih inteligentnih sistemai osnovni primer matematickog jezika i zakljucivanja kao modela ljudskog

    razmisljanja - PR1 se moze formalizovati (u smislu prethodno definisanihFS) i prakticno koristiti kao reprezentacija znanja, ali i kao metod dedukcije(zakljucivanja o znanju i njegovim posledicama):

    alfabet: {p,q,r,s...,,,,,(,)} ako su w, w1 i w2 pravilne recenice onda su to i:

    slovo alfabeta, (w),w,w1

    w2,

    w1 w2,w1 w2

    sema aksioma (koje ukljucuju i iako se moze sistem definisati potpunobez disjunkcije koja se onda naknadno definise: p q (p q), itime se nesto smanji broj aksioma, ali to ne znaci da je onda dedukcijaefikasnija):

    p (q p) (1)(p (q r)) ((p q) (p r)) (2)

    p

    q

    p (3)

    p q q (4)

  • 8/2/2019 ZoranPopovicTanjaVukovic

    27/148

    26 Seminarski rad

    p (q (p q)) (5)p p q (6)q q q (7)

    (p q) ((r q) (p r q)) (8)(p q) ((p q) p) (9)

    p (p q) (10)p p (11)

    (umesto (2) moze (p q) ((p (q r)) (p r)),i umesto (9) i (10) moze p p)

    modus ponens je dovoljan kao jedino pravilo izvodenja:w1, w1 w2 w2

    (mada se mogu koristiti i druga kao sto su to npr. modus tolens: w2,w1 w2 w1, -eliminacija: w1 w2 w1, w2, -uvodenje: w1,w2 w1 w2, itd.)

    Kod iskaznog racuna preslikavanje reci u izraz sa funkcijama kao interpre-tacijama logickih operatora nad skupom B - takvo preslikavanje u izraz kojizavisi samo od slova u njemu je interpretacija (bez vrednosti promenljivih),a za niz koknretnih vrednosti slova u B se kaze da je valuacija promenljivih.Ako se tako definise semantika reci iskaznog racuna nad skupom B = {, }(Bulova algebra), onda su validne reci (tautologije) one cija je istinitosnavrednost uvek

    (ili istinite) bez obzira na vredost promenljivih i interpretaciju

    (i pokazuje se da je svaka tautologija teorema iskaznog racuna, Emil Post,1921).

    Vazne osobine ovog formalnog sistema su (ili nekog drugog formalnost sistemaprvog reda): nekontradiktornost (konzistentnost), kompletnost (svaka validnarec ili njena negacija su teoreme sistema), odlucive (uvek postoji postupakkojim se u konacno mnogo koraka za bilo koju rec utvrduje da li jeste ili nijeteorema).

    Sledeci vazan primer formalnog sistema je predikatski racun prvog reda (PR1)gde se uvode i pojmovi predikata odnosno relacije (odredene arnosti), univerzalnikvantifikator , promenljive i konstante (kvantifikator se definise sa (x)P

  • 8/2/2019 ZoranPopovicTanjaVukovic

    28/148

    Osnove vestacke inteligencije I 27

    (x)P).

    Dodatne aksiome pored aksioma iskaznog racuna:

    (

    x)P(x)

    P(u) (aksiom partikularizacije),

    ((x)(w1 w2)) (w1 (x)w2), x nije slobodna u w1.

    Dodatna pravila izvodenja:

    generalizacija: w (x)w, gde je x slobodna u w).

    Definicija interpretacije je takode prosirena uz pojmove apstraktne strukture,konceptualizacije (koja uz PR1 daje model deklarativnog znanja), kao trojke(, F , R) gde je domen - skup iz koga interpretacije mogu uzimati vrednosti,

    F je skup funkcija, R je skup relacija tako da su ti objekti slike (pise senpr. I() = I) funkcionalnih i relacionih konstanti kojima su gradenitermi (izrazi nad konstantama, promenljivama i funkcijama, npr. formalnaaritmetika) i atomski iskazi redom (kojima se ,,prosiruju formule iskaznogracuna). Formule mogu biti i kvantifikovane - stroga definicija je rekurzivnogkaraktera. Tada se moze definisati: |=I [V] ili rec je zadovoljena akkopostoji interpretacija I i valucija V td. je istinita. Interpretacija I je modelreci (formule) ako je zadovoljena za svaku valuaciju. Ako je rec zadovoljenabez obzira na interpretaciju onda je tautologija (|= ). Formula moze seizvesti koristeci se i formulama nekog skupa formula (hipoteza, npr. bazapodataka u PROLOG programu, ,,baza znanja) kao da su aksiome sto se

    zapisuje kao . Ako je formula zadovoljena za svaku interpretacijuza koju je zadovoljen i skup hipoteza onda se kaze da je logicka posledicaili implikacija tog skupa formula i pise se |= . Skup je teorija ako jezatvoren logickom implikacijom (ne postoji teorema izvan njega koja proizilaziiz tog skupa) i moze kao deo formalnog sistema isto biti konzistentan, kompletanili odluciv. Teorija je konacno aksiomatizabilna ako posto ji konacna baza(podskup reci) iz kojih se mogu izvesti svi elementi . Teorija je nekonzistentnaako ne postoji interpretacija i valuacija tako da je svaki element zadovoljen.Takode, moze se pokazati |= za datu PR1 teoriju . Za datuteoriju (ili sistem) i njene dve interpretacije I, J se kaze da su elementarnoekvivalentne (I

    J) akko vazi

    |=

    I

    |=

    J za proizvoljnu teoremu .

  • 8/2/2019 ZoranPopovicTanjaVukovic

    29/148

    28 Seminarski rad

    Za PR1 kao formalni sistem se pokazuje da jeste nekontradiktoran, kompletan(Gedelova teorema kompletnosti kojom se prakticno pokazuje da je u PR1zadoljovost ekvivalentna konzistentnosti, odnosno semanticka vrednost formuleekvivalentna je sintaksnoj - ovo je povezano i sa osobinom kompaktnosti: poteoremi kopmaktnosti svaki nekonzistentan skup formula u PR1 ima konacan

    nekonzistentan podskup tj. skup je konzistentan ako je takav i svaki njegovkonacan podskup - ovu lepu osobinu nema, recimo, PR2 gde se kvantifikujui predikati pored promenljivih) ali da nije odluciv (Church-ova teorema:postoje neodlucivi formalni sistemi, Gedelova teorema nekompletnosti), kaoni teorija grupa, prstena i polja (sto je Tarski pokazao - dok su npr. projekivnageometrija i teorija zatvorenih realnih polja odlucive). Formalna aritmetika(Peano zasnovao oslanjajuci se na PR1) nije kompletna (Gedelov dokaz a-ritmetizacijom). Znacajna ogranicenja formalnih sistema pokazuje i teoremaTarskog - postoje formalni sistemi u kojima za svaku interpretaciju postojivaljana rec za koju ne postoji dokaz.

    Sledece teoreme su prakticno veoma korisne:Teorema 3 (Teorema Dedukcije)Ako je

    {} onda je ( ).Teorema 4 (Pravilo T)Ako je 1, ..., n i {1,...,n} tada je .Teorema 5 (Teorema kontrapozicije){} akko {} .

    Teorema 6 (Teorema odbacivanja)Ako je

    {} nekonzistentna tada je .

    Teorema 7 (Teorema generalizacije)Ako je i je promenljiva koja se pojavljuje kao slobodna u onda ().Ovim teoremama se npr. moze skratiti formalan dokaz ako se koriste kaosvojevrsna heuristika (kao i dodatnim pravilim zakljucivanja). Postoje imnoge alternativne logike i njihovi formalni sistemi sa svojim osobinama idomenima primene - npr. intuicionisticka (naglasava matematicki konstruk-tivizam pre nego pojam istine, npr. u PR1 problem egzistencije stepena

    iracionalnih brojeva koji je racionalan:

    2

    2

    2

    = 2 Q iako o osnovi 2

    2

    ne moramo da znamo da li je takva - kod intuicionisticke logike to nije dokaz),modalna, temporalna, itd.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    30/148

    Osnove vestacke inteligencije I 29

    3.3 Zakljucivanje

    Automatsko dokazivanje teorema s obzirom na sve prethodno moze dabude veoma tezak problem. Neki metod zakljucivanja tj. dokazivanja teorema

    je ispravan ako je svaki zakljucak dobijen postupkom tog metoda iz njegove

    baze znanja logicka posledica te baze (kompletan ako vazi i obratno) u smislulogicke implikacije i zakljucivanja u PR1. Postoje klase formalnih sistema imetodi koji su u tome uspesni, a jedan od poznatijih je algoritam rezolucije(na kome se bazira interpretacija PROLOG programa).

    Procedura zakljucivanja predstavlja izbor narednog koraka zakljucivanja kaosto je to npr. Markovljeva funkcija next koja slika skup recenica baze znanja(kojima su zadate polazne pretpostavke i izvedene posledice) u naredni,izvedeni skup recenica baze znanja. Moze da zavisi od prethodnih zakljucaka(istorije) makar implicitno zbog same prirode procedure. Ako se baza znanjau svakom koraku izvodenja uvecava tj. ako je svaki naredni korak nadskup

    prethodnog onda je procedura zakljucivanja inkrementalna.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    31/148

    30 Seminarski rad

    4 Rezolucija

    Rezolucija je primer metode zakljucivanja koja se moze efikasno automa-tizovati, i u odredenim slucajevima se pokazuje da je to ispravna i kompletnaprocedura zakljucivanja.

    4.1 Klauzalna forma

    Rezolucija se primenjuje nad jednim pojednostavljenim oblikom izrazaPR1 ciji su osnovni elementi klauzule. Klauzule se sastoje od literala koji suzapravo atomski predikati (pozitivni literali) ili njihove negacije (negativniliterali), a klauzula je disjunkcija literala. Od posebnog znacaja su Hornoveklauzule koje sadrze najvise jedan pozitivan literal. Klauzalna forma jekonjunkcija klauzula. Skica algoritma za pretvaranje iskaza PR1 u klauzalnuformu je (oblik PRENEX algoritma za normalnu formu iskaza):

    1. izbacivanje implikacija: se zamenjuje sa se zamenjuje sa se zamenjuje sa ( ) ( )

    2. ulazak negacije: se zamenjuje sa ( ) se zamenjuje sa ( ) se zamenjuje sa

    se zamenjuje sa zamenjuje se sa 3. standardizovanje promenljivih - za svaki kvantifikator posebna promenljiva:

    npr. (xP(x)) (xP(x)) zamenjuje se sa (xP(x)) (yP(y))4. eliminacija kvantifikatora - eliminacija egzistencijalnog kvantifikatora,

    skolemizacija:

    svaka formula koja nije pod dejstvom univerzalnog kvantifikatora oblika(

    x)P(x) se zamenjuje formulom P(C) gde je C (Skolemova) konstantakoja se ne javlja ni u jednoj drugoj formuli.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    32/148

    Osnove vestacke inteligencije I 31

    Svaka formula prethodnog oblika koja je i pod dejstvom univerzalnogkvantifikatora se zamenjuje formulom u kojoj je promenljiva pod dejstvomegzistencijalnog kvantifikatora zamenjena (Skolemovom) funkcijom (ar-gumenti su promenljive pod dejstvom univerzalnog kvantifikatora) koja

    se ne javlja ni u jednom drugoj formuli.Npr. xyP(x,y,F(x, y)) umesto xyzP(x,y,z).

    5. eliminacija kvantifikatora - eliminacija univerzalnog kvantifikatora:posto drugih kvantifikatora nema, nema ni zabune ako se uklone svikvantifikatori (slicno generalizaciji).

    6. svodenje na disjukntivnu normalnu formu: ( ) se zamenjuje sa ( ) ( )

    7. zapis klauzalne forme:

    npr. umesto P (Q R) pise se: {P}, {Q, R}8. standardizacija promenljivih:

    zamene se promenljive td. se ni jedna promenljiva ne javlja u viseklauzula od jedne.

    4.2 Unifikacija

    Unifikacija je postupak u kojem se dva izraza izjednacavaju (ukoliko jeto moguce) zamenama promenljivih odgovarajucim termovima. Vise takvihzamena (,,vezivanja) promenljivih x1,...,xn termovima t1,...,tn je supstitucija

    = {x1/t1,...,xn/tn} pod uslovom da se ni jedna od navedenih promenljivihne javlja ni u jednom od termova. Supstitucija primenjena na neku formulupredstavlja jednu instancu te formule. Ako supstitucija nema nijednupromenljivu koju ima supstitucija onda je razlicita od . Kompozicijadveju takvih supstitucija (zapisuje se postfiksno, kao i primena supstitucijena izraz) se dobija tako sto se najpre primene zamene iz na a onda sedobijenom dodaju zamene iz . Supstitucija je opstija ili jednako opstijaod ako () = . Najopstiji unifikator (nou) izraza i je opstiji odbilo koje druge supstitucije koja koja izjednacava ta dva izraza ( = )tj. () = = . Jedinstven je do na imenovanje promenljivih.

    Rekurzivni algoritam za trazenje nou za dva izraza je (moze se uopstiti):

  • 8/2/2019 ZoranPopovicTanjaVukovic

    33/148

    32 Seminarski rad

    Nou(x,y)

    if x=y ==> Return()

    if Var(x) ==> Return(Nouvar(x,y))

    if Var(y) ==> Return(Nouvar(y,x))

    if Const(x) or Const(y) ==> Return(FALSE)if Not(Length(x)==Length(y)) ==> Return(FALSE)

    i=0, g=[]

    loop

    if i==Length(x) ==> Return(g)

    s=Nou(Part(x,i),Part(y,i))

    if s==FALSE ==> Return(FALSE)

    g=Compose(g,s)

    x=Substitute(x,g)

    y=Substitute(y,g)

    i=i+1end loop

    end Nou

    Nouvar(x,y)

    if Includes(x,y) ==> Return(FALSE)

    Return([x/y])

    end Nouvar

    Objasnjenje, ukratko: ,,vec implementiran predikat Var tj. funkcija jeistinita ako je argument promenljiva, Cons ako je argument konstanta (ukljucujucii funkcijsku konstantu tj. ime funkcije - npr. Part(F(A,B,C),0) == F,

    Part(F(A,B,C),1) == A, itd. a vazi Const(F)=TRUE), Compose spaja dveliste, Substitute primenjuje na izraz listu zamena (supstituciju).

    je faktor ako ( )() = nou() td. = .

    4.3 Princip rezolucije

    Slicno modus ponensu - ako se primeni na jednostavan slucaj prikazanklauzulama sa prostim literalima izgleda ovako:

    {R,P}, {Q, P}{R,Q}

  • 8/2/2019 ZoranPopovicTanjaVukovic

    34/148

    Osnove vestacke inteligencije I 33

    Horizontalnom crtom je razdvojena rezolventa (izvedena klauzula) od polaznihklauzula, slicno zapisu pravila u PR1. Pozitivne (bez ) i negativne instanceliterala (sa ) P koje se javljaju u polaznim klauzulama se ,,potiru. Uopstem slucaju, literali sadrze terme sa promenljivama i tada je neophodanalgoritam unifikacije da bi se primenilo pravilo rezolucije:

    , , ( {})( {}), td. je = nou(, )

    Ako je rezolventa (zakljucak principom rezolucije) prazna klauzula, to znacida je u pitanju kontradikcija medu pretpostavkama tj. postoji kontradikcijau bazi znanja.

    Dedukcija (zakljucak) rezolucijom na osnovu baze (znanja) je niz klauzulaciji je element i ciji je svaki clan dobijen primenom principa rezolucije ilina klauzulu iz ili na nekog prethodnog clana niza. Kada se prikazuje nizkoraka zakljucivanja dodaje se na kraju ako pripada bazi ili redni brojkoraka na osnovu kojih se zakljucuje, ili ako je u pitanju negirani cilj(ako je cilj pokazati ispravnost upita zadatog klauzulom ili literalom onda senjegova negacija ,,privremeno ubaci u bazu da bi se doslo do kontradikcije- odbacivanje rezolucijom, sistem je nezadovoljiv).

    Algoritam kojim se realizuje automatska dedukcija rezolucijom se svodi nagradenje stabla zakljucivanja (po nivoima, pocevsi od baze kao polaznognivoa, ,,resolution trace, npr. dva pokazivaca (jedan ,,sporije, jedan ,,brze)

    prolaze kroz sve rezolvente ukljucujuci i novonastale) sve do ispunjenja uslova.Uslov je obicno ili prazna klauzula kojom se trazi odgovor ISTINA / NEISTINAna postavljen cilj (zadatu klauzulu), ili se traze vrednosti promenljivih (,,fill-in-the-blank) koje zadovoljavaju postavljeni cilj gde se onda koristi pomocnipredikat Ans(X1,...) onolike arnosti koliko nepoznatih ucestvuje u upitu.Primer - upit glasi P(z,Jon):

    1. {F(Art,Jon)} 2. {F(Bob,Kim)} 3. {F(x,y),P(x,y)} 4. {

    P(z,Jon),Ans(z)}

  • 8/2/2019 ZoranPopovicTanjaVukovic

    35/148

    34 Seminarski rad

    5. {P(Art,Jon)} 1, 36. {P(Bob,Kim)} 2, 37. {F(w,Jon),Ans(w)} 3, 4

    8. {Ans(Art)} 4, 59. {Ans(Art)} 1, 7

    Pokazuje se da je princip rezolucije ispravan i kompletan metod dedukcije(koristeci Erbranove teoreme, Erbranov svet konstantnih terma ...).

    4.4 Rezolucija i jednakost

    Programsko prikljucenje (procedural attachment) je korisno prosirenjepostupka rezolucije (kao i bilo koje druge dedukcione procedure) - predikat

    (literal) ili funkicja se evaluira tako sto se izvrsi program tj. kod koji vracanjegovu vrednost. Time se moze smanjiti broj koraka dedukcije, ali tomoze biti i problem jer u takvim slucajevima princip rezolucija nemora bitidovoljno mocan pa se mora pribeci ipak doslednom aksiomatskom definisanju.Primer je relacija jednakosti koja ima podrazumevane osobine, recimo klasicnarekurzivna definicja faktorijala:

    fact(0) = 1, fact(k) = k fact(k 1))

    Rezolucija nije dovoljna za takvu definiciju, vec se ili mora preformulisatitako da su svi termi bez promenljivih na prvom nivou literala u kojima se

    javljaju:

    Fact(0) = 1k 1 = j Fact(j) = m k m = n Fact(k) = n

    ili se aksiomatizuje jednakost a onda i aksiome supstitucije terma termimaza svaku relaciju i funkciju:

    x x = xxy x = y y = x

    x

    y

    z x = y

    y = z

    x = zkjm k = j Fact(j) = m Fact(k) = m

  • 8/2/2019 ZoranPopovicTanjaVukovic

    36/148

    Osnove vestacke inteligencije I 35

    kjmn j = m k m = n k j = n

    4.5 Strategije rezolucije

    Drvo rezolucije lako moze da ekplozivno naraste i time postupak dedukcijepostaje neefikasan. U ovom poglavlju se razmatraju varijante kao strategijei heuristike kojima se to moze izbeci. Osnovna osobina svih ovih strategija

    je upotreba Hornovih klauzula. Moze se pokazati da ako se baza znanjasastoji samo od Hornovih klauzula, da je svaka od ovih strategija ispravan ikompletan metod dedukcije.

    4.5.1 Strategije brisanja

    Jedan nacin poboljsanja rezolucije je brisanje nepotrebnih klauzula izbaze u odredenim slucajevima.

    Eliminacija cistih literala:Literal je cist ako se nigde u bazi znanja ne pojavljuje nijednja njegovakomplementarna instanca. Klauzule koje ga sadrze su beskorisna za odbacivanjerezolucijom i zato se mogu brisati iz baze. Dovoljno je jednom primeniti ovopravilo na pocetku procesa rezolucije.

    Eliminacija tautologija:Tautologija je klauzula koja sadrzi komplementarne literale. Pokazuje se dazadovoljivost baze znanja ne zavisi uopste od takvih klauzula, prema tomemogu biti brisane. Unifikacija se ne koristi, za razliku od prethodnog, da bise doslo do tautologija, i ovo pravilo moze biti upotrebljeno nakon svakogdedukcionog koraka.

    Eliminacija podklauzula:Klauzula je podklauzula (,,subsumption) klauzule akko postoji supstitucija td.

    . Podklauzule se mogu brisati i ovo pravilo kao i prethodno se

    moze primenjivati nakon svakog koraka dedukcije.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    37/148

    36 Seminarski rad

    4.5.2 Jedinicna rezolucija

    Jedinicna rezolventa je ona kojoj je bar jedan roditelj jedinicna klauzula,tj. sa samo jednim literalom (singlton). Jedinicna rezolucija je ona u kojojsu sve rezovlente jedinicne. Jedinicno odbacivanje je ono koje je dostignuto

    jedinicnom dedukcijom.

    4.5.3 Ulazna rezolucija

    Ulazna rezolventa je ona kojoj je bar jedan roditelj element baze znanja.Ulazna rezolucija je ona u kojoj su sve rezovlente ulazne. Ulazno odbacivanje

    je ono koje je dostignuto ulaznom dedukcijom.

    4.5.4 Linearna rezolucija

    Linearna rezolucija (ancestry-filtered) je vid uopstenja ulazne rezolucije.Linearna rezolventa ima bar jednog roditelja koji je ili u bazi znanja ili jepredak svog drugog roditelja. Linearna rezolucija pocinje gornjom klauzulom(iz baze znanja), i svaki sledeci korak sledi iz poslednje rezolvente (bliskiroditelj) i klauzule koja je u bazi znanja ili predak prvog / bliskog roditelja(daleki roditelj).

    4.5.5 Rezolucija skupom podrske

    Ako odbacime sve rezolvente iskljucivo nad klauzulama iz skupa znanjakoji je zadovoljiv pokazuje se da to ne utice na odbacivanje rezolucijom.Podskup skupa (baze znanja) td. je zadovoljiv zove se skupompodrske za . Rezolvetna skupom podrske ima uvek jednog roditelja iz ili

    je potomak od . Dedukcija skupom podrske se sastoji od rezolventi skupompodrske.

    Ako je baza zadovoljiva onda su negirane klauzule cilja upravo skuppodrske. Dokazi dobijeni ovom metodom polaze od cilja unatrag i obicnosu ,,citkiji od drugih.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    38/148

    Osnove vestacke inteligencije I 37

    4.5.6 Uredena rezolucija

    Ova strategija je veoma restriktivna ali i veoma efikasna. Klauzule setretiraju kao uredeni nizovi literala i rezolvente mogu biti samo nad prvimliteralima u klauzuli.

    4.5.7 Usmerena rezolucija

    Ovo je vid uredene rezolucije u kojem se klauzule razvrstavaju u dvegrupe Hornovih klazula: prednje (pozitivni literal je na kraju) i zadnje(pozitivni literal je na pocetku). Tako onda imamo dve vrste rezolventi irezolucija: unapred (u kojem ucestvuju prednje) i unazad (u kojem ucestvujuzadnje). Za neke upite je efikasnije koristiti jednu podstrategiju od druge.Sam problem biranja podstrategije je NP-kompletan.

    4.5.8 Sekvencijalno zadovoljenje uslova

    Ovo je strategija koja se koristi za ciljeve gde se traze vrednosti i gde suupiti oblika npr.:

    P Q R

    ... gde se traze vrednosti promenljivih za koje je zadovoljen. Sam redosledformula u konjunkciji upita je bitan u odnosu na broj konstantnih literalapo svakom konjunktu u bazi znanja. Pokazuje se da je optimalan redosledodreden td. se pretrazivanje procena kostanja minimizuje kao i samo kostanjeredosleda tj. broj dedukcionih koraka potrebnih da bi se doslo do cilja.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    39/148

    38 Seminarski rad

    5 Zakljucivanje sa nesigurnim uverenjima i

    drugi nacini zakljucivanja

    5.1 Nemonotono zakljucivanje

    U ovom poglavlju se razmatraju metodi dedukcije u kojima dodavanjeformule skupu pretpostavki utice na zakljucak. Kod logickog zakljicivanja uPR1 to nije bio slucaj i zato se zove monotonim. Nemonotono zakljucivanjemoze zavisiti i od celog skupa pretpostavki a ne od njegovog podskupa,ili od formula koje ne pripradaju skupu pretpostavki. Ovakvo proserenjezakljucivanja moze biti od znacaja za sistem koji npr. treba da se prilagodinepotpunoj bazi znanja.

    Skup formula se moze zatvoriti logickom implikacijom () ali to nemora

    dati kompletnu teoriju. Najjednostavniji metod kompletiranja je pretpostavkazatvorenog sveta (PZS, ,,closed-world assumption). Jednostavno, ako se zakonstantni literal ne moze izvesti da pripada teoriji niti njegova negacija,onda se njegova negacija dodaje u skup uverenja pu - pretpostavljena uverenja,pored skupa ispravnih aksioma teorije, pu je onda dopunjena teorija. P ZS() akko (pu) |= . Pokazuje se da ako je konzistentnabaza i sastoji od Hornovih klauzula onda je i P ZS() konzistentna. UzPZS se obicno koristi i pretpostavka jedinstvenih imena (PJI, ,,unique namesassumption) koja primenjuje princip PZS na jednakost ( (t1 = t2) {t1 = t2} pu), kao i pretpostavka zatvorenja domena (PZD, ,,domainclosure assumption), kojom se prakticno svaki kvantifikator moze zameniti

    konacnim disjunkcijama i konjunkcijama. PZD je zadat aksiomom ({(x)x =t1 x = tn} pu), gde su ti konstante objekata jezika, pod uslovom danema funkcijskih konstanti u jeziku (inace postoji beskonacan broj termovanad konstantama koje bi trebalo staviti u ovakvu aksiomu ili ih kvantifikovati).PZD prevazilazi ogranicenje da su jedino one konstante objekata koje se

    javljaju u bazi moguce.

    Baza se takode moze kompletirati u odnosu na svoje predikate tako dase pretpostavlja da zadate cinjenice u bazi definisu sve zadovoljive vrednostipredikata. Moze se pokazati da je ovo ekvivalentno postupku PZS uz nekepretpostavke. Sustinu cini COMP[; P] kompletiranje predikata P u bazi koje daje prosirenje baze tako da P vazi samo za one vrednosti za koje je

  • 8/2/2019 ZoranPopovicTanjaVukovic

    40/148

    Osnove vestacke inteligencije I 39

    P istinit u bazi, za koje baza to ,,dozvoljava. Npr. ako je = {P(A)}onda vazi P(A) ((x)x = A P(x)) a formula (x)P(x) x = A dajepotreban uslov da bude zadovoljeno iskljucivo jedino P(A). U tom slucaju

    je COMP[; P] ( ((x)P(x) x = A)) ((x)P(x) x = A)(moze se odmah koristiti i ekvivalencija umesto implikacije). Ako je =

    {P(A), P(B)} onda vazi COMP[; P] ((x)P(x) x = A x = B).Kompletiranje predikata odgovara PZS u odnosu na predikat gde se PZSprimenjuje samo u odnosu na zadati skup predikata (ako je to skup svihpredikata u bazi onda se poklapa sa PZS, npr. iz = {(x)Q(x) P(x), Q(A), R(B) P(B)} se dobija R(B) i P(B) u opstem slucaju, au odnosu na predikat P se dobija samo P(B) sto posle dovodi do zakljuckaR(B)) - tu se javlja problem nekonzistentnosti iako se koristi baza Hornovihklauzula u odnosu na predikat (npr. ako je = {P(A)Q, P(B)Q} ondase u odnosu na P dobija i P(A) i P(B), sto je nekonzistentno sa ). Zato sekompletiranje radi samo sa predikatima usamljenimu bazi - skup klauzula je

    usamljen u P akko svaka klauzula sa pozitivnim pojavljivanjem (instancom)P ima najvise jedno takvo pojavljivanje. Usamljene klauzule u odnosu napredikat jesu Hornove, ali obratno ne vazi. Postoji postupak paralelnogkompletiranja usamljenih klauzula za skup predikata u bazi, za koji se mozepokazati da cuva konzistentnost, i u kojem se pazi da ne dode do cirkularnihdefinicija (predikati = {P1, , Pn} su uredeni: za svaku (x)Ei Pi(x)disjunkciju klauzula iz baze za Pi, Ei da sadrzi nijedan iz {Pi, , Pn} nitinegativne instance iz {P1, , Pi1}) i gde se kompletiranje skupa predikatadobija kao konjunkcija kompletiranja pojedinih predikata. U opstem slucajukompletiranje je COMP[; P] def ((x)P(x)

    Ei) gde su Ei

    leve strane implikacija klauzula u normalnoj formi u bazi (

    x)Ei

    P(x)

    koje se mogu grupisati disjunkcijom. Normalna forma klauzula je oblikax(y(x = t) Q1 Qm) P(x) gde se pod x = t podrazumevax1 = t1 xn = tn, ti su termi, x promenljive koje se ne javljaju u ti a Qiliterali u kojima se ne javlja P.

    Ovo se moze uopstiti minimalnim modelom, konstrukcijom u PR2 (kvantifikujuse predikati) td. kompletiranje predikata ,,radi i za formule oblika P(A) P(B) koje nisu usamljene u bazi (cirkumskripcija): CIRC[, P] ((P)((P)P P) P P) gde je A B def ((x)A(x) B(x))a x moze biti i n-torka promenljivih.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    41/148

    40 Seminarski rad

    5.2 Taksonomijske hijerarhije i pretpostavljeno zakljucivanje(default reasoning)

    Cesto je potrebno predstaviti bazu znanja u obliku seme odnosa meduobjektima, kao to je to npr. ,,Noj(x)

    Ptica(x), odnosno upotrebom

    relacije ,,JESTE koja je parcijalno uredena i tranzitivna (Noj JESTEPtica). Mogu postojati izuzeci u ovakvom odnosu nasledivanja koji se opisujupravilima prekidanja nasledivanja (inheritance cancellation rules). Svakiobjekat moze imati neke opisane osobine koje su date skupom recenica osobinaP, a prethodne recenice o odnosima i izuzecima odnosa daju H - taksonomijskuhijerarhiju. Dobro je takva pravila napisati dovoljno uopsteno - npr. ako jedata recenica u P: Stvar(x) Ab1(x) leti(x) gde je opisanaosobina letenja stvari, onda je pravilo izuzetka u H: Ptica(x) Ab1(x),gde je Ab1 predikat koji se vezuje za odredeni tip izuzetka, abnormalnosti.Da bi primer bio kompletan, u H se mogu uvrstiti onda:

    Stvar(Tviti)

    Ptica(x) Stvar(x)Ptica(x) Ab1(x)Noj(x) Ptica(x)Noj(x) Ab2(x)Leteci-Noj(x) Noj(x)Leteci-Noj(x) Ab3(x)

    sto se moze prikazati i grafom, dok se u P mogu uvrstiti recenice:

    Stvar(x) Ab1(x) leti(x)Ptica(x) Ab2(x) leti(x)Noj(x) Ab3(x) leti(x)Leteci-Noj(x) leti(x)

    Kompletiranjem (paralelnim) predikata u H se dobijaju recenice:

    1. Stvar(x) Ptica(x) x=Tviti2. Ptica(x) Noj(x)3. Noj(x) Leteci-Noj(x)4.

    Leteci-Noj(x)

    5. Ab1(x) Ptica(x)

  • 8/2/2019 ZoranPopovicTanjaVukovic

    42/148

    Osnove vestacke inteligencije I 41

    6. Ab2(x) Noj(x)7. Ab3(x) Leteci-Noj(x)

    Iz toga se moze zakljuciti da Tviti ne leti jer je stvar, ali ako se izmeni tvrdnjai pretpostavi da je Tviti ptica onda se kompletirane formule o stvarima i

    pticama menjaju (Stvar(x) Ptica(x), Ptica(x) Noj(x) x=Tviti)i moze zakljuciti da Tviti leti. Tako se sistem vremenom menja u toku samogucenja cinjenica. Ovaj proces delimicnog kompletiranja u bazi naziva serazdvojenim kompletiranjem (delimited completion). Moze biti korisno, opetprimera radi, zakljuciti da sve ptice lete osim onih za koje se ekplicitno tvrdida ne lete. Nemonotono zakljucivanje moze biti i posledica nestandardnihpravila zakljucivanja, pretpostavljenih (prototipnih) pravila (default rules)i pretpostavljenih teorija: (x) : (x) (x). Prosirenje (, D) baze skupom pretpostsavljenih pravila D sadrzi (X0) ako postoji instanca X0za x td. (X0) sledi iz (, D) i (X0) je konzistentna sa (, D). Npr.

    ptica(x) : leti(x) leti(x) (ovo ujedno primer normalnih pravila kod kojihje = ), ili PZS u odnos na predikat P::P(x)P(x)

    Problem sa univerzalno kvantifikovanim recenicama sa implikacijom i izuzecimakao kod taksonomijskih hijerarhija je poznat kao problem kvalifikacije (Lifschitz,1986). Zato je zgodno koristiti proceduru zakljucivanja sa privremenimpretpostavkama odnosno pretpostavljenim rasudivanjem.

    5.3 IndukcijaVeoma vazna osobina zakljucivanja je i uopstavanje zakljucivanja. Bazu

    znanja delimo na bazu uverenja nad kojom se rade uopstavanja i pozadinskuteoriju td. ( |= ). Tada je induktivni zakljucak ( ) akko:

    1. hipoteza je konzistenta sa pozadinskom teorijom:( |= )

    2. hipoteza objasnjava bazu:{} |=

    Indukcija je pomak od pojedinog ka opstem pod nekim uslovima, nacinzakljucivanja opravdan induktivnom hipotezom (IH, poznat je primer Peanovog

  • 8/2/2019 ZoranPopovicTanjaVukovic

    43/148

    42 Seminarski rad

    modela prirodnih brojeva) - na primer, ako vazi P(A) onda vazi P(x), poduslovom da nije P(x) (ne postoji negativan primer). Indukcija je povezana

    je i sa problemima (masinskog) ucenja i verovatnosnog zakljucivanja. Primermoze biti i problem klasifikacije cinjenica prema nekim atributima i kriteri-

    jumima (kao u sistemu i algoritmu ID3 gde se generise pravilo klasifikacija

    ulaznih cinjenica). Primer postupka induktivnog zakljucivanja je i problemformacije koncepta. Definise se formalno cetvorka (P,N,C, ) kao problemformacije koncepta gde je P skup pozitivnih instanci koncepta (potvrdujuga), N skup negativnih, C skup svih koncepata koji se koriste da bi sedefinisao prostor hipoteza problema formacije (koncept daje istinitosnu vrednostza datu instancu, pozitivnu ili negativnu; konceptualni bias - PR1 zakljucimora ju pripadati definisanom recniku) i je logicki bias (zakljuci moraju bitiodredene forme zadate jezikom , formalnom teorijom kao vidom ugradjenogznanja) i uvodi se pojam prihvatljve relacije (ako zadovoljava biase, definisananad C u jeziku ). Prihvatljiva relacija je karakteristicna ako zadovoljena

    za sve iz P, diskriminanta ako ne zadovoljava nijednu iz N i dopustljiva jeako zadovoljava oba uslova. Skup svih dopustljivih relacija je skup verzijaV, a graf verzija u kojem su orijentisani lukovi relacijom opstosti - cvor p jemanje opsti od cvora q ako je p q (ispravni podskup relacije kao skupa, ilivise specifican). Skup V je dobro formiran ako za svaki lanac u grafu postojiminimalni i maksimalni element, S skup (specificna granica) minimalnih aG (generalna, uopstena granica) maksimalnih elemenata. Tada vazi:

    Teorema 8 Za (P,N,C, ) sa dobro formiranim V i S, G skupovima tadar V akko je ogranicena elementima iz S i G.Postoji postupak eliminacije kandidatakojim se za svaku (pozitivnu i negativnu

    simetricno) instancu tj. uneti podatak prepravljaju skupovi G i S (umestocelog prostora V) td. je pokrivena nova cinjenica. Algoritam dovodi doS = G tj. ostaje samo jedna instanca u V. Prethodna teorema (kao i sampostupak i njegove osobine) garantuje resenje i to u konacnom broju koraka.

    Zavisno od prirode problema neki put je moguce uticati na izbor naredneinstance i traziti informacije o njenoj klasifikaciji - moguce je vrsiti eksperimente.Ovo nudi mogucnost dodatnog poboljsavanja postupka. Osnovni tip poboljsanja

    je npr. izbor instance koja ce prepoloviti prostor verzija, ali cesto samotrazenje takve instance moze da bude zahtevno samo po sebi. Ako se definiseproizvod prostora verzija, a time i faktorizacija, moguce je dobiti bolje rezultatei varijante algoritma. Pored formacije koncepta nezavisne od domena postojei sistemi kao sto su to npr. Meta-DENDRAL ili ID3 koji su ,,model-driven tj.

  • 8/2/2019 ZoranPopovicTanjaVukovic

    44/148

    Osnove vestacke inteligencije I 43

    koji su manje ili vise zavisni od domena jer pretpostavljaju da su svi podaci naraspologanju na samom pocetku, dok su ostali inkrementalni (data-driven).Vise o ovome i o nemonotonom zakljucivanju se moze naci u [GN].

    5.4 Verovatnosno zakljucivanjePotrebno je povezati pojam iskaza sa pojmom slucajne promenljive tako

    sto ce svaki iskaz imati distribuciju slucajne promenljive sa dve vrednosti{1-p,p}. Tako atom P (dogadaj) je istinit sa verovatnocom p, a P saverovatnocom 1 p. Sa dva konstantna atoma mozemo formirati raspodeluvisedimenzionalne slucajne promenljive (za slozene dogadaje {P, Q}, {P, Q},{P, Q}, {P, Q}) i njihove verovatnoce:

    p(P Q) = p1p(P Q) = p2p(P Q) = p3p(P Q) = p4

    tada su verovatnoce dogadaja odnosno konstantnih atoma P i Q verovatnocemarginalnih raspodela takve visedimenzionalne slucajne promenljive za {P, Q}:

    p(P) = p1 + p2 =

    ip(P|Q = Qi)p(Q) = p1 + p3 =

    ip(Q|P = Pi)

    Najcesce nisu date slozene verovatnoce i bez njihove distribucije je tesko onjima znati dovoljno na osnovu distribucije marginalnih promenljivih. Takose Bajesovo pravilo moze upotrebiti slicno modus ponensu: ako je p(Q|P)uslovna verovatnoca dogadaja Q ako je P ispunjeno. To je deo slucajevaza koje je P ispunjeno kada je i Q ispunjeno: p(Q|P) = p1p1+p2 =

    p(P,Q)p(P) ,

    p(P, Q) = p(P Q). Obrnuto, p(P|Q) = p(P, Q)/p(Q) i odatle sledi:

    p(Q|P) = p(P|Q)p(Q)p(P)

    Dakle, Bajesovo pravilo nudi mogucnost da se zakljuci nesto i o uzroku naosnovu posledice.

    p(Q|P) = p(P|Q)p(Q)p(P)

  • 8/2/2019 ZoranPopovicTanjaVukovic

    45/148

    44 Seminarski rad

    p(Q|P)p(Q|P) =

    p(P|Q)p(Q)p(P|Q)p(Q)

    O(E) =defp(E)

    p(E) =p(E)

    1 p(E)(,,izgledi za E) pa ako je (faktor dovoljnosti) =def p(P|Q)p(P|Q) i (faktor potrebnosti) =def

    p(P|Q)p(P|Q) onda je:

    O(Q|P) = O(Q), O(Q|P) = O(Q)Postoji povezanost vrednosti i :

    =1 p(P|Q)1 p(P|Q)

    ali su obe neophodne da bi se nasla uslovna verovatnoca za Q ako je P ili

    P posebno. Posto je je 0 < p(P|Q) < 1, ako je < 1 onda je > 1i obratno, kao i = 1 akko = 1. O tome treba voditi racuna prilikomgradenja baze znanja. Cesto se koriste logaritmi ovih koeficijenata l = log koji se nazivaju indeksi dovoljnosti (sto je veci to je i p(Q|P) vece) i l = log indeks potrebnosti (sto je manji to je i p(Q|P) manje). Takode, vazi vezaizmedu p(Q) i O(Q):

    p(Q) = O(Q)/(O(Q) + 1)

    Na osnovu ovoga svega, ako je poznato p(Q) i ako se pretpostavi P ili Ponda se moze izracunati uslovna verovatnoca za Q. Ekspertni sistemi (rule-

    based) koriste bazu znanja u kojima se nalaze i pravila oblika P Q daQ moze slediti iz P. U PR1 to znaci da se moze zakljuciti Q uz to praviloako je P istinito, ali u verovatnosnom zaljucivanju to nije tako, ili bar nije

    jednostavno doci do verovatnoce p(Q) uz p(P Q) pored p(P), ali akouz pravilo se veze i njegovo i onda je to moguce. A ako se sa P izrazinesigurnost u pretpostavku P (tj. P) i sa p(P|P) verovatnoca da je P ondase moze pretpostaviti da je p(Q|P, P) = p(Q|P) i p(Q|P, P) = p(Q|P)(P i P su zavisne u tom smislu) i vazi:

    p(Q|P) = p(Q, P|P)+p(Q, P|P) = p(Q|P, P)p(P|P)+p(Q|P, P)p(P|P)gde je ondap(Q

    |P) linearna interpolacija verovatnoce izmedu kranjih vrednosti

    da je P tacno ili nije znajuci verovatnocu da je P. Zanimljivo, ako je

  • 8/2/2019 ZoranPopovicTanjaVukovic

    46/148

    Osnove vestacke inteligencije I 45

    p(P|P) = p(P) onda je p(Q|P) = p(Q) - gubi se informacija o uticajuP na Q. Slicno prethodnom, ako su {P1,...,Pn} hipoteze koje su uslovnonezavisne (jaka pretpostavka, moze se samo opravdati samo do izvesne mere,aproksimativno), onda se verovatnoca zakljucka Q moze izracunati, kao i dase uslove verovatnoce za Pi nekakvim uverenjima P

    i . Tada uz pomenutu

    pretpostavku i pretpostavku da su obzervacije Pi nezavisne od Pj osimodgovarajuce ,,svojePi, i da Q ne zavisi dodatno od P

    i , vazi:

    p(Q|P2, P1) = p(Q|P2, P1)p(P2|P2) + p(Q|P2, P1)p(P2|P2)

    gde je O(Q|P2, P1) = 2O(Q|P1) i O(Q|P2, P1) = 2O(Q|P1). Tu senaslucuje iterativni postupak u kome se koristi prethodno izracunato O(Q|P1)gde se za svako Pi vezuje odgovarajuci par i i i.

    Tako se mogu graditi mreze zakljucivanja (inference networks) - npr. ako

    su P1, P2, P3, P4 uslovno nezavisne, A zavisi od P1, P2 i B zavisi od P3, P4onda su i A i B uslovno nezavisne i zakljucak Qf koji sledi iz A, B zavisi odnjih. Mnogi ekspertni sistemi ih koriste. Zakljucivanje unapred (forwad-chaining) propagiranjem pravila nad cinjenicama sve do zakljucka nalaziverovatnocu zakljucka u mrezi. Zakljucivanje unazad (backward-chaining- slican mehanizam, ,,forward-propagation i ,,back-propagation, postojikod nekih klasa neuronskih mreza kao sto je perceptron, gde se takorecimenjaju koeficijenti pravila na osnovu pocetnih pretpostavki, izracunatog izadatog zakljucka) npr. analizira drvo mreze zakljucivanja trazeci pocetnupretpostavku koja najvise utice na zakljucak - onda se interaktivno unosiverovatnoca takvih pretpostavki ako je potrebno dok se ne potvrdi uticaj na

    zakljucak. Problem je ako neki od meduzakljucaka zavisi od nekih drugihmeduzakljucaka iako se pretpostavlja da su nezavisni iz bilo kog razloga.To se resava obicno dodatnim ad hoc mehanizmima i podesavanjima. Akoimamo pravilo oblika P1 ...Pn Q onda treba najpre izaracunati zavisnuverovatnocu za P = P1 ... Pn, iskaz koji nije atom - npr. neki ekspertnisistemi koriste p(P) = mini[p(Pi)] ili p(P1 ... Pn) = maxi[p(Pi)] iakobi uz pretpostavku da su Pi nezavisne verovatnoca konjunkcije bila manjaod navedenog minumuma, ali u kranjem slucaju gde sve verovatnoce imajuvrednosti 0 ili 1 i jedno i drugo se svodi na Bulovu algebru (koja se poklapa safuzzy teorijom skupova u ovakvom specijalnom slucaju - Zadeh, 1965-1975- svakom elementu i podskupu dodeljena je funkcija koja meri pripadnostskupu, sto bi moglo da se tumaci kao verovatnoca, ali to onda nije fuzzy

  • 8/2/2019 ZoranPopovicTanjaVukovic

    47/148

    46 Seminarski rad

    teorija u opstem slucaju).

    5.5 Jedno formalno zasnivanje verovatnosne logike

    Formalno zasnivanje verovatnosne logike se vezuje za formalno zasnivanjeslucajnih promenljivih i verovatnoce. Ako je recenica u svetu W1 istinita,a u svetu W2 nije, posto ne znamo u kojem od ta dva sveta zaista jeste(,,u stvarnom svetu moze biti samo u jednom od ta dva) to se izrazavaverovatnocom p da pripada W1, odnosno 1 p da pripada W2. Ako imamovise reci onda ima i vise kombinacija svetova u kojima su tacne, ali npr.za 1 2 ne uzimaju se u obzir svetovi gde je 1 tacno kao i 1 2, a2 nije. Za skup recenica je moguce napraviti semanticko drvo i takoodrediti moguce svetove - svaka recenica moze biti tacna ili ne (pozitivni ilinegativni literal je tacan), na svakom nivou po jedna iz , i od korena (prve

    recenice) do lista (zadnje recenice) postoje putevi koji daju konzistentneskupove (kombinacije), ostali se odbacuju (moze se prikazati tabelarno - imaih prakticno 22

    broj slova

    a ne 2||, gde su slova iskazne promenljive, odnosnoosobine za koje se vezuju elementarni dogadaji). Verovatnoca recenica jeonda zbir verovatnoca svetova u kojima je tacna. Neka ima K nepraznihskupova u K = {Wi} mogucih svetova za L recenica iz , i ako su nabrojani,neka je onda P kolona dimenzije K veorvatnoca [pi]

    T vezanih za odredeniskup svetova Wi. Neka su recenice j u nabrojane, L-dimenzioni vektoriV1,..., VK odgovaraju konzistentnim valuacijama recenica u td. i-tomskupu svetova Wi odgovara Vi = [vji ]T gde je:

    vji =

    1, j tacna u Wi0, j netacna u WiNeka je onda L K matrica V = [V1, ..., VK]. Ako je L-dimenziona kolona = [j ]

    T verovatnoca recenica j iz onda je:

    = VP

    uz uslov

    ipi = 1 za 0 pi 1 (*). Ako je skup uverenja (belief)- recenica sa njihovim poznatim i verovatnocama, verovatnosna derivacija(probabilistic entailment) recenice iz se moze svesti na problem resavanjasistema linearnih nejednacina gde je = {} i V je dobijeno npr.semantickim drvetom - ova metoda se moze prosiriti Skolemizacijom i na

  • 8/2/2019 ZoranPopovicTanjaVukovic

    48/148

    Osnove vestacke inteligencije I 47

    PR1. se moze prosiriti sa i V sa jednim redom (npr. prvi red) za tuformulu da bi se dodao i uslov (*). Ako se doda kao poslednji red = [vi]u V tada je:

    =

    1..

    .j

    ...

    =

    1 1 1v11 v12

    v1K

    ... . . .

    vL1 vL2 vLKv1 v2 vK

    P

    Ako se sa V oznaci V bez poslednjeg reda (za ) i sa kolona bez zadnjegclana u , tada se najpre resavanjem po P sistema

    = VP dobija = p() = P. Sistem najcesce ima mnogo resenja i zato je interesantnonaci interval u kome se krece resenje.

    Primer: = {(y)P(y), (x)P(x) Q(x)}, = (z)Q(z) (npr. prvinivo semantickog drveta ima dve grane: P(A) i P(y), sledeci je narednaformula u i njena negacija, i treci je i njena negacija - za svaki list ondaimamo kolona nula i jedinica za formule i negacije po nivoima). Tada semoze pokazati da je:

    p((y)P(y)) +p((x)P(x) Q(x)) 1 p((z)Q(z)) 1

    Ovo se moze dobiti tako sto se 2. i 3. jednacina za V saberu i od togase oduzme prva odakle se dobije da je p1 = 1 + 2 1 i na osnovu toga

    p3 = 1 + 2 1 +p2 +p4 (3 jednacine, posto je zadnja ona kojom se racunaverovatnoca , i 4 nepoznatih pi). Ova