zoranpopovictanjavukovic

8/2/2019 ZoranPopovicTanjaVukovic

1/148

Seminarski rad: Osnove vestacke inteligencije I

Popovic Zoran, Tanja Vukovic

Centar za multidisciplinarne studijeUniverzitet u Beogradu

18. decembar 2006

Sazetak

Ovaj tekst je sazetak knjiga [JL] i [GN] i predstavlja pregled osnovnihkoncepat vestacke inteligencije. Tekst je napisan kao deo ispita izpredmeta Uvog u vestacku inteligenciju.

Profesor: Predrag Janicic


2/148

Osnove vestacke inteligencije I 1

Sadrzaj

1 Poglavlje 1 - vestacka inteligencija, istorijski razvoj i uvod 51.1 Definicija i oblasti bavljenja VI . . . . . . . . . . . . . . . . . 61.2 Kratak uspon i pad, zatim renesansa . . . . . . . . . . . . . . 8

1.3 Oblasti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Poglavlje 2 - Predstavljanje problema 112.1 Pojam problema . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2 Resavanje problema, uopsteni koraci . . . . . . . . . . . . . . 112.3 Notacije, nacini reprezentovanja . . . . . . . . . . . . . . . . . 122.4 Modeli grafova u VI . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4.1 Reprezentovanje znanja u automatskom resavanju problema 142.4.2 Graficko reprezentovanje znanja u automatskom resavanju

problema . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.4.3 Graficka reprezentacija i prirodni jezik . . . . . . . . . 182.5 Trazenje pravog reprezentovanja . . . . . . . . . . . . . . . . . 182.6 Programski jezici PROLOG i LISP . . . . . . . . . . . . . . . 192.7 Grafovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.7.1 Petri-mreze . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Formalni sistemi - deklarativno znanje i zakljucivanje 233.1 Definicija formalnih sistema . . . . . . . . . . . . . . . . . . . 233.2 Iskazni racun i predikatski racun prvog reda . . . . . . . . . . 253.3 Zakljucivanje . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4 Rezolucija 304.1 Klauzalna forma . . . . . . . . . . . . . . . . . . . . . . . . . 304.2 Unifikacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314.3 Princip rezolucije . . . . . . . . . . . . . . . . . . . . . . . . . 324.4 Rezolucija i jednakost . . . . . . . . . . . . . . . . . . . . . . . 344.5 Strategije rezolucije . . . . . . . . . . . . . . . . . . . . . . . . 35

4.5.1 Strategije brisanja . . . . . . . . . . . . . . . . . . . . 354.5.2 Jedinicna rezolucija . . . . . . . . . . . . . . . . . . . . 364.5.3 Ulazna rezolucija . . . . . . . . . . . . . . . . . . . . . 364.5.4 Linearna rezolucija . . . . . . . . . . . . . . . . . . . . 364.5.5 Rezolucija skupom podrske . . . . . . . . . . . . . . . 364.5.6 Uredena rezolucija . . . . . . . . . . . . . . . . . . . . 37


3/148

2 Seminarski rad

4.5.7 Usmerena rezolucija . . . . . . . . . . . . . . . . . . . 37

4.5.8 Sekvencijalno zadovoljenje uslova . . . . . . . . . . . . 37

5 Zakljucivanje sa nesigurnim uverenjima i drugi nacini zakljucivanja 38

5.1 Nemonotono zakljucivanje . . . . . . . . . . . . . . . . . . . . 38

5.2 Taksonomijske hijerarhije i pretpostavljeno zakljucivanje (defaultreasoning) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.3 Indukcija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

5.4 Verovatnosno zakljucivanje . . . . . . . . . . . . . . . . . . . . 43

5.5 Jedno formalno zasnivanje verovatnosne logike . . . . . . . . . 46

5.6 Znanja i uverenja . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.6.1 Iskazna logika uverenja . . . . . . . . . . . . . . . . . . 48

5.7 Meta-znanje i meta-zakljucivanje . . . . . . . . . . . . . . . . 51

6 Stanje i akcije 566.1 Stanja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6.2 Akcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6.3 Problem okvira . . . . . . . . . . . . . . . . . . . . . . . . . . 58

6.4 Redosled akcija . . . . . . . . . . . . . . . . . . . . . . . . . . 59

6.5 Uslovljenost . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

7 Planiranje 64

7.1 Pocetno stanje . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

7.2 Ciljevi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

7.3 Akcije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647.4 Planovi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

7.5 Grinov metod . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

7.6 Blokovi akcija . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

7.7 Uslovni planovi . . . . . . . . . . . . . . . . . . . . . . . . . . 68

7.8 Smer planiranja . . . . . . . . . . . . . . . . . . . . . . . . . 69

7.9 Odsecanje nedostiznoscu . . . . . . . . . . . . . . . . . . . . . 70

7.10 Poravnavanje stanja (usaglasavanje) . . . . . . . . . . . . . . . 70

7.11 Ukidanje aksioma okvira . . . . . . . . . . . . . . . . . . . . . 72

7.12 C iljna regresija . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7.13 Razlike stanja . . . . . . . . . . . . . . . . . . . . . . . . . . 75


4/148


8 Arhitektura inteligentnih agenata 778.1 Tropisticni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 778.2 Histereticni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 798.3 Agenti nivoa znanja . . . . . . . . . . . . . . . . . . . . . . . . 808.4 Agenti znanja u koracima . . . . . . . . . . . . . . . . . . . . 838.5 Agenti s namerom . . . . . . . . . . . . . . . . . . . . . . . . . 868.6 Promisljeni agenti . . . . . . . . . . . . . . . . . . . . . . . . . 90

9 Klasicne metode resavanja problema 929.1 Algoritmi za koje su poznata polinomijalna resenja . . . . . . 989.2 Klasifikacija problema prema slozenosti . . . . . . . . . . . . . 1009.3 klasa NP: nedeterministicki polinomijalni problemi . . . . . . 101

10 Resavanje problema propagiranjem i nabrajanjem 10610.1 Gradijent metode . . . . . . . . . . . . . . . . . . . . . . . . . 106

10.2 Linearno programiranje . . . . . . . . . . . . . . . . . . . . . . 10710.3 Gradijent metoda u teoriji grafova . . . . . . . . . . . . . . . . 10710.4 Heuristicko pretrazivanje . . . . . . . . . . . . . . . . . . . . . 10810.5 A algoritam . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10810.6 Implicitno nabrajanje propagiranjem uslova . . . . . . . . . . 11010.7 Dinamicko programiranje . . . . . . . . . . . . . . . . . . . . . 11210.8 GPS - General Problem Solver . . . . . . . . . . . . . . . . . . 115

11 Programi - igre, psihologija resavanja problema 11711.1 Drvo pretrazivanja (drvo ispravnih poteza) . . . . . . . . . . . 11711.2 Evaluacija pozicije . . . . . . . . . . . . . . . . . . . . . . . . 117

11.3 MINIMAX izbor i algoritam, alfa-beta algoritam . . . . . . . . 11811.4 - kresanje (odsecanje) . . . . . . . . . . . . . . . . . . . . . 12011.5 Psiholoska izucavanja resavanja problema i igranja . . . . . . . 12211.6 Teorija igara . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

12 Ekspertni sistemi 12612.1 MYCIN - primer . . . . . . . . . . . . . . . . . . . . . . . . . 12612.2 Produkcioni sistemi . . . . . . . . . . . . . . . . . . . . . . . . 12812.3 Ekspertni sistemi zasnovani na logici prvog reda . . . . . . . . 13112.4 Deklarativno-proceduralna kontroverza . . . . . . . . . . . . . 13112.5 Razliciti tipovi znanja i njihova reprezentacija . . . . . . . . . 133

12.5.1 Reprezentovanje znanja . . . . . . . . . . . . . . . . . . 134


5/148

4 Seminarski rad

12.5.2 Osobine sistema produkcionih pravila . . . . . . . . . . 135

13 Ucenje 13713.1 Primer STRIPS . . . . . . . . . . . . . . . . . . . . . . . . . . 13913.2 Ucenje pravila i planova . . . . . . . . . . . . . . . . . . . . . 139

13.3 Ucenje karakteristika i koncepta, Vereov primer . . . . . . . . 140


6/148


1 Poglavlje 1 - vestacka inteligencija, istorijski

razvoj i uvod

Istorijski gledano, jos je Lajbnic pominjao ,,univerzalnu algebru kojom

bi se svekolika ljudska znanja (ukljucujuci i etiku i metafiziku) obuhvatilajednog dana u jedinstvenom deduktivnom sistemu. Frege, jedan od osnivacamoderne simbolicke logike, je predlozio notacioni sistem za mehanicko rezo-novanje. Carls Bebidz 1834. konstruise mehanicku ,,analiticku masinu kojaracuna i stampa neke matematicke proracune, imao je nameru da napravii masinu za igranje saha. Tek napretkom informatike i tehnologije 1940-tih i 1950-tih nastaju prvi rezultati koji spadaju u domen VI. McCulloch iWalter Pits jos 1943. godine predlaz prvi model vestacke neuronske mreze, a1951. godine Marvin Minsky i Dave Edmonds prave prvi elektronski racunar(SNARC, sa 3000 vakuumskih cevi) zasnovan na takvoj mrezi (u okviru

doktorske disertacije za ciju je komisiju bilo diskutabilno da li se moze takavrad svrstati u matematiku - clan komisije, Jonh von Neumann, izjavio jeda ce biti jednog dana ako vec nije - ironicno, upravo je Minski teorijskimrezultatima ,,pokopao nesto kasnije ovu oblast za narednih par decenija).Nekoliko istrazivaca na Dartmut koledzu 1956. g. (Dartmouth College)ucestvuje u seminaru koji organizuje McCarthy na temu VI (koji je prvipredlozio upravo taj naziv za tu oblast, a poznat je i kao otac LISP-a koji jebio znacajan alat u VI, a i dans je u izvesnom obimu) gde su Allen Newell iHerbert Simon prezentovali ,,Logic Theorist - prvi program za automatskodokazivanje teorema (Bertrand Rasel je bio zadovoljan rezultatima, pogotovu

jednim generisanim dokazom koji je bio kraci nego jedan naveden u ,,Principia

Mathematica - svi su ipak bili svesni da su to samo pocetni rezultati),gde su ucestvovali i Minski, Senon, Semjuel, Solomonov i drugi. Vestackainteligencija belezi prve uspehe akademske prirode kao sto su prvi program zaigranje saha (Claude Shannonn, 1955, poznat i kao otac savremene statistickeinformacione teorije - zajedno sa Alanom Tjuringom - ovo se smatra jednimod najbitnijih presudnih rezultata u istoriji VI) ili dama (Arthur Samuel,1963), automatsko dokazivanje teorema (pomenuti ,,Logic Theorist, Simoni Newell), kao i ambiciozan pokusaj ostvarivanja opsteg sistema za resavanjeproblema GPS (General Problem Solver - Newell, 1960). Sajmon i Njueldaju 1963. pretpostavku sistema fizickih simbola koja je uspesno naknadnoosporavana, ali je vazan deo istorije: svaki sistem (ljudski ili vestacki) kojise smatra inteligentnim mora da radi tako da uzima fizicke sablone (simbole,


7/148

6 Seminarski rad

,,physical patterns), kombinuje ih u strukture (izraze) i rukuje njima (koristeciprocese) da bi proizveo nove strukture (izraze). Sustina zablude, cije suposledice razvejane tek pojavom prvih ekspertnih sistema, jeste nedostatakdomenskog znanja potrebnog inteligentnim sistemima umesto iskljucivog os-lanjanja na sintaksnu analizu.

1.1 Definicija i oblasti bavljenja VI

Definicija 1.1 Bilo koji problem za koji ne postoji efikasno algoritamskoresenje je problem vestacke Inteligencije (VI).

Ovu definiciju i jedan dobar deo strukture ovog teksta dugujem [JL] i [GN].Ovakva definicija daje prakticniji i bolji pogled na pojam VI od uobicajeneMakartijeve (MIT) definicije da je to oblast racunarstva ciji je cilj rezonovanjena racunaru na nacin koji je slican ljudskom. Iako ova potonja definicija daje

intuitivniji i u nekom smislu precizniji opis oblasti kojima se bavi VI, ona vodika ozbiljnim ontoloskim pitanjima i problemima: imamo sliku o ljudima kaosvesnim, slobodim, umnim i racionalnim bicima, a u isto vreme ljudi su agentiu fizickom svetu ustrojenom u naucnom smislu deterministicki i materijalno,lisenom smisla (mehanicisticki i partikularno, gde cestice nemaju svest).Kako to onda da u takvom svetu postoje ljudi kao bica sa svescu i namerom? Da li je moguce um preneti iz jednog organskog bica u punom smislu uneki fizicki sistem zasnovan iskljucivo na postojecoj ili buducoj informacionojtehnologiji ? Ovo su samo neka pitanja koje Dzon Serl vesto postavlja u[JS], povezuje ih i odgovara na njih, a na poslednje pitanje uglavnom dajenegativan odgovor. Medutim, to ne znaci da su oblasti VI rekle sve sto imaju

(daleko od toga), naprotiv - te oblasti vec su ostvarile sjajne rezultate, i umnogome pomogle kao alati i ljudima i nauci. Kognitivne nauke, ali i onekoje su u vezi sa njom a nisu u direktnoj vezi sa VI i racunarstvom, mogupomoci istrazivanjima u oblasti VI, ali cesto se desava i obratno. Na kraju, nepostoji potpuno dobra definicija VI jer ne postoji ni potpuno dobra definicijainteligencije i pojmova u vezi nje.

Efikasnost se moze jasno, pa cak i formalno definisati komplesnoscu al-goritma - npr. polinomijalna kompleksnost (i NP) je dobra i pozeljna (usmislu efikasnosti) - prvi teorijski rezultati nastaju tek pocetkom 1970-tihgodina (Steven Cook, Richard Karp). VI se moze smatrati eksperimentalnomnaukom u kojoj se eksperimenti vrse na racunaru u okviru modela koji su


8/148


izrazeni programima i cijim se testiranjem i doradivanjem postizu neki modeliljudske inteligencije (kojima se ova npr. moze bolje razumeti - ne postojirealno ocekivanje niti cilj da VI zameni ljudsku inteligenciju osim u nekimspecificnim oblastima ljudske delatnosti i primenama racunarstva cije granicepomera VI). Pod algoritmom obicno podrazumevamo ureden konacan niz

precizno definisanih operacija koje mogu biti izvrsene (na racunaru). Alito ne znaci da ce biti izvrsene u nekom ,,razumnom vremenu - postojimatematicki formalizam kojim se ovo moze preciznije obuhvatiti i definisatikao sto su to npr. Tjuringove masine i slicni formalizmi (Alan Tjuring,inace je jedan od prvih informaticara i jedan od prvih istrazivaca VI nadigitalnim racunarima, ustanovio je prvi praktican test programa VI u komerazdvojeni ucestvuju ljudi, programi i ispitivaci) . Na primer, ne postoji,,klasican algoritam za igranje saha koji bi mogao da se koristi upotrebljivo

jer bi algoritmu koji bi ispitao sve moguce pozicije za svaki potez bile potrebnibarem milioni godina i na najbrzim postojecim racunarskim sistemima.

Osnovne dve osobine oblasti kojima se bavi VI (bez osvrta na nekeodredene dobro definisane metode):

1. ticu se obrade simbolickih podataka (nasuprot tradicionalnoj numerickojobradi kao primeni racunara)

2. uvek ukljucuju nekakav element izbora: nedeterminizam kojim se kazeda ne postoji algoritam na osnovu koga bi izabrali neku opciju u skupumogucih za datu situaciju

Racunari danas sve bolje rukuju multimedijalnim sadrzajima ali je to rukovanjei njihova obrada jos uvek daleko od onoga sto ljudska cula i svest pruzajuu opazanju i razumevanju sveta. Zato prva osobina nudi osnovu resavanjaprvog problema na koji se nailazi u VI - sakupljanje informacija. Postojedobro ustanovljeni formalizmi i u matematici i u igrama koji cine simbolicke(nenumericke) podatke posebno znacajnim. S druge strane, prepoznavanje iobrada (pattern recognition) zvucnih i vizuelnih signala predstavlja izazov zasebe, ali je posebno zanimljivo razumevanje i zakljucivanje koje sledi nakontoga.


9/148

8 Seminarski rad

1.2 Kratak uspon i pad, zatim renesansa

Nakon pocetnog entuzijazma nastalog pod uticajem tehnoloskog razvojaracunara do pocetka 70-tih brzo se doslo do zakljucka o pravoj tezini problemaVI, npr. da za automatsko prevodenje nisu dovoljni samo sintaksna analiza,

recnik i dobri algoritmi pretrage vec i znanje o semantici jezika, pa i opsteznanje i iskustvo (poznat je primer o programima za automatsko prevodenje,kada se izmedu bar dva jezika nekoliko puta ista recenica prevede - anegdotakaze da je od engleske poslovice ,,Daleko od ociju, od srca tako dobijen,,nevidljivi idiot). Takvi problemi su narusili nerealno idealnu sliku o VI ioznacili period njene krize, o cemu npr. pise Dreyfys 1972. i kasnije Lighthill1973. ciji preterano kritican izvesta j utice na sudbine mnogih istrazivackihprojekata (problem nije bio u VI vec u zahtevima od tada mlade oblasti).Prvi uspesni ekspertni sistemi kao sto je to bio DENDRAL i MYCIN (EdwardFeigenbaum) predstavljaju pocetak izlaska iz te krize. Osnovu izlaska cini

i posmatranje domenskog (deklarativnog) znanja inteligentnih sistema, gdesu vazni bili uopsteni alati kao sto su frejmovi (okviri, pocetkom 1970-tih)Minskog kojima se to znanje formalizuje ali i prakticno koristi. Minski je biopoznat i kao tvorac mirkosvetovakao probnih formalnih poligona za resvanjeproblema VI (koje je davao svojim studentima), kakav je bio i Svet blokova(sistem SHRDLU koji je razvio Terry Winograd 1971. je bio veoma uspesanu resavanju njegovih problema, ali je bio potpuno neprimenjiv za bilo kakvouopstavanje zbog nedostatka domenskog znanja, koje je u tom slucaju bilo,,utkano u sintaksnu analizu tog sistema). Negde 1972. Alain Colmerauer

je razvio Prolog, sledeci jezik VI (posle LISP-a) koji pored ostalih klasifikacijaspada u deklarativne programske jezike i jedan je od najznacajnijih alata VI.

Od 1980-tih godina nakon prvih pokusaja industrijalizacije VI (i racunari5. generacije, pored jezika) i eksplozije PC industrije pocinje zreliji periodrazvoja VI sa akcentom na primeni postojecih teorija, novim metodamai teorijskoj potvrdi novih metoda - neki rezultati u oblasti prepoznavanjagovora ili racunarske vizije su tako blizi realnom svetu (naspram teorijskihmikrosvetova) i prakticnoj upotrebi. Masinsko ucenje koristi dostignucamatematicke statistike, ali i nove metode cija je primena vec sada nezamenljiva.Ideja inteligentnog samostalnog entiteta ili agenta koji kontinualno funkcioniseu stvarnom svetu sa usadenom inteligencijom (situated intelligence) takodepostaje sve aktuelnija (predlog uopstenog resenja kroz SOAR arhitekturukao primer - Newell, Rosenbloom, John Laird, ili life-long learning, TomM. Mitchell). Ideja deklarativnog znanja razvojem WWW-a postaje sve


10/148


aktuelnija idejom semantickog web-a (Tim Berners-Lee, koji je ujedno i idejnitvorac web-a zasnovanog na HTTP i HTML, regulisanog W3C), gde pojamweb ontologije prirodno nasleduje okvire Marvina Minskog.

1.3 OblastiInteligentnim sistemima nazivamo programske sisteme i druge prakticne

rezultate VI, odnosno posledicu jedne od neformalnih definicija VI (kaooblasti racunarstva koja je posvecena inteligentnim sistemima): entiteti kojiimaju sposobnost inteligentnog ponasanja koje srecemo kod ljudi. Medutim,ovakav pristup definisanju ima dodatnu slabost - u oblastima kakve su masinskoucenje ili ekspertni sistemi, javlja se potreba za resavanjem problema kojimatreba prevazici neki ljudski nedostatak. Na primer, velika kolicina znanjakojim je tesko upravljati cak i uz pomoc veceg broja ljudi - formalna definicijau uvodnom poglavlju ne ostavlja nedoumice u tom pogledu, ali ne objasnjava

potrebu i nacin na koji ljudi zele da upravljaju znanjem. Oblasti vestackeinteligencije sa nekim podoblastima i tipovima inteligentnih sistema (nekeod njih ili bar najveci deo bice objasnjen u ovom tekstu detaljnije) jesu:

ekspertni sistemi - sistemi kojima se cuva i eksploatise znanje na nacinslican ljudskim ekspertima

masinsko ucenje - metode klasifikacije, otkrivanja znanja (Data Mining),dobavljanje informacija (information retrieval), indukcija, prepoznavanjesablona (pattern recognition)

igre - teorija igara i primene, sah ... predstavljanje znanja - jezici predstavljanja znanja, strukture rasud ivanje (rezonovanje) - pretrazivanje, razlicite metode rasud ivanja

(od Aristotelovih silogizama do danas) i automatsko dokazivanje teorema,formalno automatsko dokazivanje ispravnosti

obrada prirodnog jezika - masinsko prevodenje, razumevanje i analizadijaloga, automatsko ispravljanje i generisanje

agenti - multi-agentski sistemi i primene, softboti, web mining

govor - problemi prepoznavanje, generisanje i razumevanja govora, pre-poznavanje govornika i autentifikacija


11/148

10 Seminarski rad

vizija - problemi interpretacije i razumevanja slika racunska inteligencija (soft computing) - fazi logika i sistemi, neuronske

mreze, genetski algoritmi, primene u automatskom odlucivanju i upravljanju

robotika kognitivne nauke (multidisciplinarna oblast u kojoj se preplicu VI i

psihologija, filozofija, neurologija, biologija, lingvistika, antropologija):uverenja, kreativnost, emocije, pamcenje, percepcija, priroda inteligencijei svesti, usadena sposobnost saznavanja (kognicija), i mnoge ,,kombinacijekakva je i evolutivna psihogija (uticaj bioloske strukture organizma napsihu i obratno - jedinke kao eksponenti DNK)

edukacija - inteligentni tutorski sistemi

inteligentni interfejsi - modeliranje korisnika, dijaloga i objasnjenja,

veza sa tehnologijom

filozofski aspekti, eticke i drustvene implikacijeNaredno poglavlje ima takode uvodni karakter, gde se pre svega ilustrujeznacaj pojmova problema i resenja, znanja i njegovog reprezentovanja. Poglavlja8, 12 i 13 (i donekle 7) izlaze izvan okvira ovog teksta, ali predstavljaju dobarnagovestaj daljih saznanja u vezi ostalih osnovnih pojmova VI.


12/148


2 Poglavlje 2 - Predstavljanje problema

2.1 Pojam problema

Problema postajemo svesni kada zelimo da nesto postignemo ali ne znamo

kako da do toga dodemo, ne znamo njegovo resenje (ili postupak, algoritamkojim bismo dosli do toga). Problem uvek podrazumeva i neko resenjeili potragu za resenjem. Za razliku od problema u svakodnevnom zivotu,problemi skolskog tipa su obicno precizno opisani zajedno sa ponudenimpodacima neophodnim za njegovo resavanje, pogotovu matematicki problemiili igre. U realnom svetu problem moze biti opisan prirodnim jezikom (cijerazumevanje u smislu interpretacije predstavlja jedan od osnovnih primeraproblema VI) koji sa tacke gledista resavanja problema ima barem cetiriozbiljna nedostatka: nekompletnost (bez konteksta lako moze doci do nespo-razuma u razgovoru), redundantnost, nejasnoca tj. visesmislenost i gramatickaneispravnost. Potrebno je zato najpre naci formu zapisa problema tako da

se ovi nedostaci izbegnu. Primer za to su zatvoreni izrazi:

x X : K(x)gde se pod tim podrazumeva da za dati skup X (cime je implicitno datastruktura skupa sa svojim operacijama) treba naci sve njegove elemente xza koje je ispunjen skup ogranicenja K(x). Ovo obicno vodi ka postupkutrazenja prvog resenja koje smanjuje dalji prostor resenja koji treba pretrazitii dozvoljenim transformacijama se tako iterativno dolazi do konacnog zatvo-renog izraza koji daje direktno resenje. Variajante ovakvih problema mogubiti resavanje slagalice (gde je lako navesti sve dozvoljene transoformacije

od pocetnog stanja do zavrsnog) ili dokazivanje jednacine gde izbor i brojtransformacija uopste nije jednostavno naci.

2.2 Resavanje problema, uopsteni koraci

Uobicajen redosled koraka u resavanju problema mogao bi biti:

1. Procitaj ili upamti problem s razumevanjem

2. Izvedi neposredne zakljucke o tome ako je moguce (time se moze docido nedostajucih podataka i elegantnije formulacije)

3. Poigraj se sa dobijenim zakljuccima i upamcenim cinjenicama (veomabitan korak ljudima)


13/148

12 Seminarski rad

4. Porazmisli o svemu, ostavi da stvari sazru

5. Potrazi bolju formulaciju, uoci zatvoren izraz

6. Nadi delimicno resenje i vrati se na 2. korak ili nadi konacno resenje

7. Proveri ispravnost resenja, potrazi moguce uopstenje

Postupak koji je predlozio George Polya (1956) se moze uporediti sa prethodnim:

1. Shvati problem (podaci, nepoznate, uslovi, crtez, itd.)

2. Napravi plan (veza podataka i nepoznatih, potproblemi i ranije resavaniproblemi, drugacija formulacija, i sl.)

3. Sprovedi plan (da li su svi koraci jasni i da li se mogu potkrepitidokazima ?)

4. Prouci dobijeno resenje (da li je ispravno, da li se moze primeniti naneke druge probleme)

Dakle, inteligentno resavanje problema pretpostavlja stvaranje plana za njegovoresavanja.

2.3 Notacije, nacini reprezentovanja

Kao sto je pomenuto, nacin zapisivanja i reprezentovanja problema jeveoma bitan deo resavanja jer pojednostavljuje i cesto ubrzava resavanje.Ljudski um se u svakodnevnom zivotu rukovodi apstraktnim modelima sto

zapocinje u razlicitim slojevima od samih cula sve do psihickih procesa.Koriste se nizovi simbola i seme za zapis teksta, muzike ili matematickihizraza koji su sustinski grafickog karaktera. Matematicke notacije su polaznaosnova za izgradivanje formalizama koji su nam neophodni za proucavanjeovakvih modela.

Svi notacioni sistemi uopsteno se sastoje od simbola objekata i simbolaoperatora (arnost - koliko objekata napadaju) koji predstavljaju moguceakcije nad objektima. Linearne notacije predstavljaju niske ovakvih simbola.Pravilno formirane niske definisane prema redosledu objekata i operatoradaju izraze koji mogu imati vrednost (primeri: infiksni, prefiksni (poljski) ipostfiskni zapisi aritmetickih izraza, izraza teorije skupova ili logickih izraza).


14/148


Koriscenjem grafova tj. drveta kao specijalne vrste grafova koji su primer,,dvodimenzione notacije se ovakvi izrazi mogu takode zapisati (cvorovisu operatori, listovi objekti, a redosledom obilaska i citanja drveta se mozedobiti linearan zapis i obratno).

Ovo nas dovodi do zapisa koji su upotrebljivi u algoritmima i programima(liste su znacajne zbog toga posebno, pogotovu u nekim programskim jezicimakao sto je LISP) i takode se mogu pokazati ekvivalentnim nekim prethodnimstrukturama. Liste se mogu posmatrati kao uredene trojke (S,L,R) gde je S,,glava ili operator, a L i R su takode liste ili ,,rep(leva i desna ,,sestra,redosled kao kod obrnute poljske notacije). Naravno, niz ovakvih trojki je umemoriji indeksiran i pocinje sa pomenutom trojkom, dok su L i R zapravopokazivaci na clanove niza, i listovi imaju objekte umesto operatora (listoviimaju ,,L=R=null, null je oznaka prazne liste). Transformacije nad ovakvimstrukturama kao sto su zamena podliste drugom listom ili brisanje podliste

- u uobicajenoj infiksnoj notaciji se svode na zamenu ili brisanje podtermaili grane na drvetu.

Sd

dd

dd

d

b

a

S a b

2.4 Modeli grafova u VI

Grafovi su znacajan alat za reprezentaciju objekata i znanja kao dva bitnanivoa prisutna kako u matematici (npr. objekti, izrazi naspram relacija,teorema) tako i drugim oblastima. U vestackoj inteligenciji se tako mogulakse razmatrati problemi masinskog dokazivanja teorema, problemi vizijei govora, automatskog resavanja problema i razumevanja prirodnog jezika.Upotreba grafova je i u tome od znacaja kako ljudima, tako i programimai resenjima VI u smislu modela grafova. U jednom od narednih odeljaka


15/148

14 Seminarski rad

bice kratko navedene formalne definicije grafova i njihovih osobina, a vecnaceta tema reprezentacije znanja (i strukture znanja) bice dalje pojasnjena.Grafovi takode predstavljaju i jedan od bitnih spojeva razlicitih formalnodefinisanih problema i njihovih prakticnih resenja u VI.

2.4.1 Reprezentovanje znanja u automatskom resavanju problema

... transformacija ...

Spoljasnja reprezentacija

'&

$%Formalni iskaz problema

'&

$%Formalni iskaz resenja

E

Interna reprezentacija

'&

$%Interni iskaz problema

'&

$%Interni iskaz resenja

Ec

T

(ilustracija odnosa formalnog i internog reprezentovanja problema i resenja)

Interna reprezentacija je zapravo prostor resenja u kome se od nekog pocetnogstanja nekim postupkom resavanja stize do resenja (prostor resenja je definisani

podskup prostora stanja).Relacija (time i graf kao nacin prikaza relacije) moze imati osobine koje

je cine relacijom ekvivalencije (R,S,T) ili relacijom poretka. Takvi grafovi sukorisni u algoritmima za masinsko dokazivanje gde se heuristike standardnihalgoritama za rad sa grafovima svode na heuristike u dokazivanju. Graf mozebiti od pomoci kao vizuelno i intuitivno pomagalo coveku i ekvivalentnastruktura u programu, ili moze biti od pomoci kao struktura koja opisujepostupke u resavanju problema i odnose medu objektima (noseci njihovusintaksu i semantiku). Heuristike (kao precice u postupku resavanja nekogproblema koje daju efikasnije algoritme) se porede npr. s internim znanjemnekog matematicara kada resava neki problem i uopste su veoma znacajneza VI, kao i razdvajanje eksterne (,,sintaksnog) reprezentovanja znanja i


16/148


internog (,,semantickog). Nekoliko interesantnih primera / skica automatskogdokaza teorema u geometriji i teoriji skupova:

Primer 1 - polazeci od topoloskog reprezentovanja skupova (Merialdo, 1979)umesto Venovih dijagrama:

1

BA

321

B

A

32

mogu se dobiti pregledniji grafovi kao pomoc u resavanju. Primer:ako je A zatvorenje skupa A (najmanji zatvoren skup koji sadrzi A) iA = A C(A) njegova granica, vazi:

Teorema 1 A = (A A) (C(A) A)A

4321

C(A)C(A)

A


17/148

16 Seminarski rad

Na grafu se ,,vidi da su ,,atomski elementi(zapravo reprezenti klasaelemenata datih osobina) granice - atomi 2 i 4, a tvrdenje sledi postoisto tako vazi da je A A = atom 2 i C(A) A = atom 4.

Primer 2 Trazenje geometrijskog mesta tacaka ili konstrukcija lenjirom isestarom su takode moguca primena upotrebe grafova u VI. Primerproblema: ako je dat krug k i dve tacke A i B van tog kruga konstruisatipravu p kroz A tako da su njeni preseci C i D sa k jednako udaljeni odB.

k

B

I

C

D

(d)

(d)

A

O

R

Program moze kao i covek da pode od pretpostavke da gotovo resenjepostoji kao u dijagramu iznad, konstruisuci dva bitna objekta - pravu d itacku I koja polovi CD. Elementi ovakvog dijagrama se predstavljajuu tabeli ciji su redovi oblika: naziv objekta (d), tip (prava), stepenslobode (1), predstavnici (B, I - pripadaju d) - ovakav red se nalazi napocetku resavanja problema. Stepen slobode govori koliko je elementodreden (npr. prava je odredena dvema razlicitim tackama, B je zadataa I tek treba odrediti). Prava d potpuno zadata tackama O i Bkoincidira sa d posto su trouglovi BC D i OCD jednakostranicni, OIi BI bisektrise CD i time ista (jedinstvena) prava, sto daje red upomenutoj tabeli: d prava 0 d, B, I, O. Vazi da I pripada OB.Posto je ugao AIB prav to znaci da I pripada krugu nad precnikom


18/148


AB koji je time potpuno odreden a time i I kao njegov presek sa d.Odatle sledi da je p potpuno odredena tackama I i A.

Primer 3 Primer iz teorije skupova sa preslikavanjima i kompozicijama kojije uspesno resio program DATE (Pastre, 1978) kao i jos oko 150 teorema

u vezi teorije skupova, preslikavanja, kongruencija i kardinalnostu. Primerteoreme koju DATE moze da dokaze:

Teorema 2 Ako su f : A B, g : B C, h : C A tripreslikavanja i ako za dva od bilo koja od tri preslikavanja k1 = hgf,k2 = f h g, k3 = g f h vazi da su surjekcije (NA) i da je treceinjekcija (1-1), onda su sva tri preslikavanja f, g i h bijekcije.

2.4.2 Graficko reprezentovanje znanja u automatskom resavanjuproblema

O automatskom resavanju i razvijanju grafa moze se govoriti i kroz primerI - ILI drveta trazenja resenja (npr. logicki iskaz se razvije i od korena,,diskutuje prema listovima):

CVOR ,,I"

PG1pPG12PG11

PGnPG2PG1

...

...

CVOR ,,ILI"

Cvorovi ,,ILI se odnose na disjunkcije a cvorovi ,,I se odnose na konjunkcije.Svaka podgrana (PG) predstavlja podcilj u pretrazi koji se moze resavatiposebnim metodama koje opet mogu proizvesti svoje podgrane (podciljeve).Tada je veoma pozeljno svesti takvo drvo na jednu granu (da li zbog nacinapretrazivanja ili zbog samog problema nedeterminizma prisutnog u VI to

je tesko dostizno). Razbijanje problema na podprobleme kao i drveta napoddrvece je korisna osobina i jednog i drugog - primeri (neki detalji su u


19/148

18 Seminarski rad

[JL]): PRET (resavanje trigonometrijskih problema, Grandbastien, 1974),PARI (problemi celobrojne aritmetike, Burgoin, 1978) ili automatsko do-kazivanje teorema iskaznog racuna (Pitrat, 1966). Primer je i uporedivanjeproblema optimizacije u operacionim istrazivanjima gde se iskazi oblika ,,procesprethodi procesu uz potrebna vremena za izvrsenje i ,,procesi se nemogu

paralelno izvrsiti resavaju algoritimima optimizacije putanje kroz graf ibojenja grafa, redom.

2.4.3 Graficka reprezentacija i prirodni jezik

Veza sintakse i semantike jezika je presudna kod problema razumevanjaprirodnog jezika u cilju automatskog prevodenja. Prvi pokusaji koji su seoslanjali samo na sintaksu i prevod reci u rec su se pokazali nedovoljnim,vec je potrebno u recniku dati nekakvo semanticko znacenje na osnovu kojegprogram gradi semanticku konstrukciju dela teksta, kao i dosta pragmaticnog

ljudskog znanja o svetu uopste. Kontekstno slobodne gramatke NoamaComskog s pravilima transformacija (npr. LR1) su morale biti nadogradenegramatikama u kojima bi jezicki automat u nekom trenutku analize se vracaona prethodne nivoe obilaska drveta transformacija i razresio neke semantickeprobleme da bi nastavio analizu (rekurzivne gramatike viseg reda).

Prosirene Mreze Prelaska (Augmented Transition Networks - ATN, Woods,1975) mogu se koristiti za sintaksno-semanticku analizu i predstavljaju grafoveciji su cvorovi ili reci, ili semanticke familije ili podgrafovi (tako da je ovakvareprezentacija sustinski rekurzivna). Ono sto je interesantno za njih je da

jezicki procesor koji ovako tekst analizira gradi na osnovu semantickih pravila

internu formu koja se zove semanticka mreza (semantic network) i kojapredstavlja rezultat obrade recenice prirodnog jezika (u [JL] dat je primervezan za analizu elektricnih kola). Grafovi su korisni i kao formalni oblikreprezentacije podataka i znanja, ali i kao intuitivan ljudski alat za resavanjeproblema.

2.5 Trazenje pravog reprezentovanja

Trazenje pravog nacina reprezentovanja problema je skoro uvek najznacijnijikorak u resavanju problema - primer problema: dva crna skakaca s jednestrane i dva bela s druge na 3x3 sahovskoj tabli treba da zamene mesta u stomanjem broju koraka. Kada se uoci da su pozicije skakaca elementi skupa


20/148


ciklicne strukture reda 8 onda se lako uoci i resenje.

2.6 Programski jezici PROLOG i LISP

PROLOG i LISP su jedni od najznacajnijih programskih jezika bitnih zaVI. Njihov znacaj i primene u vestackoj inteligenicji (pored istorijskih) subrojne. Lista kao osnovna struktura podataka u LISP-u je ujedno i nacinreprezentovanja znanja (sam program je takode lista pa se npr. u nekimgenetskima algoritmima koristi kao struktura koja se rekombinuje; mnogisistemi kao sto je to npr. CLIPS su inspirisani ovim jezikom, itd). Jednomusvojeno iskustvo sa ovakvom strukturom i funkcionalnom filozofijom prog-ramiranja se lako prenosi i u druge pristupe programiranju i VI. Njegovasintaksa se moze vrlo jednostavno definisati

:= |

:= ( ) := | |

:= niska alfanumerika bez razmaka (standardni identifikator)

i specijalnih znakova.

gde je nil je prazna lista bez elemenata. Prvi atom liste je funkcija koja mozebiti ugradena (npr. funkcija QUOTE koja zaustavlja evaluaciju L za (QUOTE L)ili skraceno L) a evaluacija funkcije tako zadate listom je izvrsavanje LISPprograma.

U ostatku teksta ce se uglavnom koristiti ,,kvazi-predikatski jezik i re-prezentacija znanja koja ukazuje na predikatski racun prvog reda ili bliskeforme. Ako se uzmu u obzir Hornove klauzule i rezolucija, takav nacinreprezentovanja znanja i jezik su najblizi PROLOG-u. PROLOG takodekoristi liste (sintaksa oblika [e1, ,en] ili [glava|rep], dok se u tekstukoristi ,,. tacka umesto vertikalne crte ,,|) ali ne kao osnovnu strukturupodataka, odnosno nacin reprezentovanja znanja.

2.7 Grafovi

Formalna matematicka definicija grafa je:


21/148

20 Seminarski rad

Definicija 2.1 Struktura G = (X, R) je graf gde je X skup cvorova ilitemena grafa, a R je binarna relacija nad skupom X (R X X).

Ako je R simetricna, kaze se da graf nije orijentisan i veze izmedu cvorova su

ivice, a ako je antisimetricna (bitan je redosled temena) onda su veze izmedutemena lukovi.

Definicija 2.2 G = (Y, V) je parcijalni graf grafa G = (X, U) akkoY = X i V U.

G je pod-graf grafa G akko Y X i V = U W gde jeW = { (v, w) | v X Y w X Y}

(uklonjena su neka temena zajedno s lukovima).

Stepen cvora je broj suseda tj. ukupan broj prethodnika i naslednika (ulaznihi izlaznih lukova).

Putanja od temena a do temena b u G je konacni niz temena c1,...,cntd. je a = c1 i b = cn i svaki (ci, ci1) U. Ako graf nije orijentisan onda

je dovoljno da(ci, ci1) U ili (ci1, ci) U i onda je putanja lanac kojipovezuje a i b.

Ciklus je zatvoren lanac tj. a = b.

Ako za za svaka dva cvora grafa postoji lanac koji ih povezuje kaze se daje graf povezan, a ako ih povezuje putanja (graf je orijentisan) onda je jako povezan.

Postoji mnogi alati teorije grafova i algoritmi koji su korisni i u mnogimkonkretnim primenama (npr. Warshall-ov algortiam za tranzitivno zatvorenje,problemi najkracih puteva i drugo). Jedno od veoma korisnih prosirenjapojma grafa su Petri mreze (i njeni derivati).

2.7.1 Petri-mreze

Osnovnu postavku Petri mreza u svojoj doktorskoj disertaciji dao je CarlAdam Petri, cija se formalna definicija odnosi na standardne ili obicne Petri


22/148


mreze kao najrasprostanjeniji dijalekat (vrsta). Postoje i mnoga prosirenja,primene i posledice ovog alata. Petri mreza kao struktura se oslanja na pojammulti-skupa (skup u kome je dozvoljeno ,,ponavljanje elementa - multiset,bag - formalno par (S, f) gde je f : S N preslikavanje koje slika elementosnovnog skupa S u broj ponavljanja - u sustini dovoljno je f kao multiskup

ako se S podrazumeva), broj ponavljanja elementa x multiskupa B, x B,se oznacava i sa #(x, B) (njegova kardinalnost).

Definicija 2.3 Petri mreza je petorka C = (P,T ,B,F,), gde je:

P = {p1,...,pn} neprazan skup mesta, T = {t1,...,tm} neprazan skup prelaza td. P T = , F : T NP, ulazna funkcija preslikava prelaz u multiskup ulaznih

mesta,

B : T

NP, izlazna funkcija preslikava prelaz u multiskup izlaznih

mesta,

: P N je funkcija markiranja koja dodeljuje nenegativan ceo brojmestu, ali moze predstavljena i kao n-dimenzionalni vektor markiranja = (p1,...,pn), n = |P| gde je i broj tokena u mestu pi.

Prelaz ti T moze biti upaljen ako je:(pi P)pi #(pi, F(tj))

Paljenjem prelaza tj T dolazi do promene vektora markiranja u novivektor takav da je:

(pi P)pi = pi #(pi, F(tj)) + #(pi, B(tj))Nizom paljenja prelaza se definise izvrsavanje Petri mreze.

Graf Petri mreze G = (V, A) je takav da skup cvorova V = {v1,...,vs}koga cine dva disjunktna skupa V = P T, P T = (skup mesta i skupprelaza), i A = {a1,...,ar} skup lukova gde vredi:

(ai A)ai = (vj , vk) (vj P vk T) (vj T vk P)Graficka reprezentacija mesta je obicno krug ili elipsa (sa nekom oznakomtokena oznacavanja), a prelaz pravougaonikom ili vertikalnom crtom. Takose graf sastoji pre svega iz dva tipa lukova:


23/148

22 Seminarski rad

ulaznih (od mesta ka prelazu - vazi ako je F(tj, pi) > 0, ako je vrednostveca od 1 upisuje se iznad luka)

izlaznih (od prelaza ka mestu - vazi ako je B(tj, pi) > 0, ako je vrednostveca od 1 upisuje se iznad luka)

Moguce su mnoge primene i primeri ovakvih struktura: modeli i formalnaverifikacija distribuiranih sistema (multi-agentskih sistema, primera radi),komunikacionih protokola, upavljanje projektima i planiranje, modeli multi-procesorskih sistema, itd.


24/148


3 Formalni sistemi - deklarativno znanje i zakljucivanje

Formalno predstavljanje znanja je neophodan korak u reprezentovanjuznanja i izgradivanju osnovnih struktura u programu pa i u VI. Formalnisistemi su vrsta apstraktnih struktura kojima se mogu strogo matematicki

zasnovati formalni jezici, matematicka logika ili druge strukture i osnovnematematicke oblasti koje su neophodne kao osnovni primeri formalnog rep-rezentovanja znanja i zakljucivanja o njemu - za strogo zasnivanje neophodnobi bilo definisati pojmove kao sto su: niz, nizovi simbola (niske - je praznarec duzine 0, n je skup svih niski duzine n nad alfabetom , =

iN

i),jezik kao podskup svih niski datog alfabeta ciji su elementi recenice, formalna(kontekstno slobodna) gramatika kao struktura G = (V , T , P , S ) (gde su Vneterminalni simboli, T terminalni, P skup produkcija tj. relacija medurecenicama kojima se zadaju pravila izvodenja (koraka transformacije) recenica,S je pocetni neterminalni simbol) i jezik L(G) njome definisan, itd.

3.1 Definicija formalnih sistema

Definicija 3.1 Formalni sistem (FS) je uredena petorka (,G ,A,P,T ) gdeje:

1. konacni alfabet (ciji su elementi terminalni simboli jezika formalnogsistema)

2. G formalna gramatika - kao nacin strogog definisanja pravila formiranjaispravnih recenica (wff - well formed formulas) odnosno formula FS

3. A skup recenica koje predstavljaju aksiome - formule FS koje imajuposebnu ulogu u FS.

4. P konacan skup pravila izvodenja (ili dedukcija, zakljucivanja) recenica(ispravnih u sistemu) u obliku relacija recenica:

U1, U2,...Up W1, W2, ...Wncime se oznacava izvodenje iz reci Ui (1 i p) u reci Wj (1 j n)

5. T skup teorema - formula FS koje se mogu izvesti iz aksioma, ukljucujucii aksiome


25/148

24 Seminarski rad

Dokaz je konacan niz reci M1,...,Mr ciji su clanovi ili aksiome ili reciizvedene iz prethodnih clanova tog niza prema pravilima izvodenja (4).

Teorema t je rec (formula) za koju postoji dokaz tako da je Mr

t i pise se

t. Aksiome su teoreme po definiciji. Dok se za nisku moze u konacnombroju koraka odrediti da li je ispravna recenica, za pitanje da li je formulateorema to ne mora biti tako.

Vazi: T L(G) . Kao sto postoje neterminalni simboli kod formalnihgramatika koji nisu deo alfabeta ali ucestvuju u produkcijama (svojevrsnepromenljive, konacno izvedena recenica ih ne sadrzi), tako se i u aksiomama ipravilima izvodenja mogu koristiti gde zamenjuju bilo koju ispravnu recenicuFS (prakticno se mogu shvatiti i interpretirati kao sheme aksioma i pravila -

npr. jedna aksioma sa takvim simbolom predstavlja zapis prebrojivo mnogoaksioma, koliko ima i formula FS). Pravila koja sadrze takve promenljive zovuse prepravljanja (re-writing - odnose se na deo recenice leve strane pravila),inace su zovu produkcijama. Pretpostavka je da je broj aksioma i recenicarekurzivno prebrojiv (postoji pravilo, algoritam po kome se moze doci dosvakog u konacnom broju koraka).

Pored ovih apstraktnih struktura, znacajan je i pojam konceptualizacijekao modela univerzalne algebre, odnosno trojke (, F , R) gde je skupelemenata domena, F skup funkcija (elementi su f : n , razlicitiharnosti n), R skup relacija konceptualizacije (elementi su

m, razlictih

arnosti m). Uz predikatski racun prvog reda (PR1) kao odgovarajuci jezikkonceptualizacije dobijamo sintaksni nivo deklarativnog znanja koji odredujealfabet sa tri klase: simbolima konstanti domena, konstanti funkcija i konstantirelacija, a uz interpretaciju (preslikavanje ovakvih elemenata jezika u od-govarajuce elemente konceptualizacije tj. modela) dobija se deklarativnasemantika, veza izmedu sintakse (jezika) i semantike (konceptualizacije).Znanje formalizovano ovakvim strukturama se naziva deklarativnim znanjem.Znacaj pojma konceptualizacije je i taj da ne mora da zavisi od izbora jezika,tako da umesto PR1 to moze da bude jezik binarne tabele, semanticke mreze,okvira (koji se uglavnom mogu svesti na PR1, proceduralni deo okvira se

jedino ne uklapa) ili neki drugi.


26/148


Pomenuti formalni sistemi su osnova za definisanje pojma formalnog matematickogdokaza, gde se obicno podrazumeva Hilbertov sistem dedukcije koji posmatralogiku sa cisto sintaksnog aspekta, dok teorija modela (univerzalna algebra+ logika) tezi semantickom pogledu. Definicija FS potice iz knjige [JL], oformalnim jezicima se moze saznati vise iz [HU], dok se o deklarativnom

znanju i zakljucivanju moze saznati vise iz [GN]. Slede primeri i pojasnjenja.

3.2 Iskazni racun i predikatski racun prvog reda

Tako je iskazni racun jedan od najpoznatijih primera formalnih sistema(klasican oblik matematicke logike u uzem smislu, kao i Bulova algegbra,dok se u sirem smislu podrazumeva i teorija modela, teorija skupova i teorijaizracunljivosti), i mnogo vise od toga - prethodi definiciji predikatskog racunaprvog reda (PR1), koji je osnova mnogih prakticnih inteligentnih sistemai osnovni primer matematickog jezika i zakljucivanja kao modela ljudskog

razmisljanja - PR1 se moze formalizovati (u smislu prethodno definisanihFS) i prakticno koristiti kao reprezentacija znanja, ali i kao metod dedukcije(zakljucivanja o znanju i njegovim posledicama):

alfabet: {p,q,r,s...,,,,,(,)} ako su w, w1 i w2 pravilne recenice onda su to i:

slovo alfabeta, (w),w,w1

w2,

w1 w2,w1 w2

sema aksioma (koje ukljucuju i iako se moze sistem definisati potpunobez disjunkcije koja se onda naknadno definise: p q (p q), itime se nesto smanji broj aksioma, ali to ne znaci da je onda dedukcijaefikasnija):

p (q p) (1)(p (q r)) ((p q) (p r)) (2)

p

q

p (3)

p q q (4)


27/148

26 Seminarski rad

p (q (p q)) (5)p p q (6)q q q (7)

(p q) ((r q) (p r q)) (8)(p q) ((p q) p) (9)

p (p q) (10)p p (11)

(umesto (2) moze (p q) ((p (q r)) (p r)),i umesto (9) i (10) moze p p)

modus ponens je dovoljan kao jedino pravilo izvodenja:w1, w1 w2 w2

(mada se mogu koristiti i druga kao sto su to npr. modus tolens: w2,w1 w2 w1, -eliminacija: w1 w2 w1, w2, -uvodenje: w1,w2 w1 w2, itd.)

Kod iskaznog racuna preslikavanje reci u izraz sa funkcijama kao interpre-tacijama logickih operatora nad skupom B - takvo preslikavanje u izraz kojizavisi samo od slova u njemu je interpretacija (bez vrednosti promenljivih),a za niz koknretnih vrednosti slova u B se kaze da je valuacija promenljivih.Ako se tako definise semantika reci iskaznog racuna nad skupom B = {, }(Bulova algebra), onda su validne reci (tautologije) one cija je istinitosnavrednost uvek

(ili istinite) bez obzira na vredost promenljivih i interpretaciju

(i pokazuje se da je svaka tautologija teorema iskaznog racuna, Emil Post,1921).

Vazne osobine ovog formalnog sistema su (ili nekog drugog formalnost sistemaprvog reda): nekontradiktornost (konzistentnost), kompletnost (svaka validnarec ili njena negacija su teoreme sistema), odlucive (uvek postoji postupakkojim se u konacno mnogo koraka za bilo koju rec utvrduje da li jeste ili nijeteorema).

Sledeci vazan primer formalnog sistema je predikatski racun prvog reda (PR1)gde se uvode i pojmovi predikata odnosno relacije (odredene arnosti), univerzalnikvantifikator , promenljive i konstante (kvantifikator se definise sa (x)P


28/148


(x)P).

Dodatne aksiome pored aksioma iskaznog racuna:

(

x)P(x)

P(u) (aksiom partikularizacije),

((x)(w1 w2)) (w1 (x)w2), x nije slobodna u w1.

Dodatna pravila izvodenja:

generalizacija: w (x)w, gde je x slobodna u w).

Definicija interpretacije je takode prosirena uz pojmove apstraktne strukture,konceptualizacije (koja uz PR1 daje model deklarativnog znanja), kao trojke(, F , R) gde je domen - skup iz koga interpretacije mogu uzimati vrednosti,

F je skup funkcija, R je skup relacija tako da su ti objekti slike (pise senpr. I() = I) funkcionalnih i relacionih konstanti kojima su gradenitermi (izrazi nad konstantama, promenljivama i funkcijama, npr. formalnaaritmetika) i atomski iskazi redom (kojima se ,,prosiruju formule iskaznogracuna). Formule mogu biti i kvantifikovane - stroga definicija je rekurzivnogkaraktera. Tada se moze definisati: |=I [V] ili rec je zadovoljena akkopostoji interpretacija I i valucija V td. je istinita. Interpretacija I je modelreci (formule) ako je zadovoljena za svaku valuaciju. Ako je rec zadovoljenabez obzira na interpretaciju onda je tautologija (|= ). Formula moze seizvesti koristeci se i formulama nekog skupa formula (hipoteza, npr. bazapodataka u PROLOG programu, ,,baza znanja) kao da su aksiome sto se

zapisuje kao . Ako je formula zadovoljena za svaku interpretacijuza koju je zadovoljen i skup hipoteza onda se kaze da je logicka posledicaili implikacija tog skupa formula i pise se |= . Skup je teorija ako jezatvoren logickom implikacijom (ne postoji teorema izvan njega koja proizilaziiz tog skupa) i moze kao deo formalnog sistema isto biti konzistentan, kompletanili odluciv. Teorija je konacno aksiomatizabilna ako posto ji konacna baza(podskup reci) iz kojih se mogu izvesti svi elementi . Teorija je nekonzistentnaako ne postoji interpretacija i valuacija tako da je svaki element zadovoljen.Takode, moze se pokazati |= za datu PR1 teoriju . Za datuteoriju (ili sistem) i njene dve interpretacije I, J se kaze da su elementarnoekvivalentne (I

J) akko vazi

|=

I

|=

J za proizvoljnu teoremu .


29/148

28 Seminarski rad

Za PR1 kao formalni sistem se pokazuje da jeste nekontradiktoran, kompletan(Gedelova teorema kompletnosti kojom se prakticno pokazuje da je u PR1zadoljovost ekvivalentna konzistentnosti, odnosno semanticka vrednost formuleekvivalentna je sintaksnoj - ovo je povezano i sa osobinom kompaktnosti: poteoremi kopmaktnosti svaki nekonzistentan skup formula u PR1 ima konacan

nekonzistentan podskup tj. skup je konzistentan ako je takav i svaki njegovkonacan podskup - ovu lepu osobinu nema, recimo, PR2 gde se kvantifikujui predikati pored promenljivih) ali da nije odluciv (Church-ova teorema:postoje neodlucivi formalni sistemi, Gedelova teorema nekompletnosti), kaoni teorija grupa, prstena i polja (sto je Tarski pokazao - dok su npr. projekivnageometrija i teorija zatvorenih realnih polja odlucive). Formalna aritmetika(Peano zasnovao oslanjajuci se na PR1) nije kompletna (Gedelov dokaz a-ritmetizacijom). Znacajna ogranicenja formalnih sistema pokazuje i teoremaTarskog - postoje formalni sistemi u kojima za svaku interpretaciju postojivaljana rec za koju ne postoji dokaz.

Sledece teoreme su prakticno veoma korisne:Teorema 3 (Teorema Dedukcije)Ako je

{} onda je ( ).Teorema 4 (Pravilo T)Ako je 1, ..., n i {1,...,n} tada je .Teorema 5 (Teorema kontrapozicije){} akko {} .

Teorema 6 (Teorema odbacivanja)Ako je

{} nekonzistentna tada je .

Teorema 7 (Teorema generalizacije)Ako je i je promenljiva koja se pojavljuje kao slobodna u onda ().Ovim teoremama se npr. moze skratiti formalan dokaz ako se koriste kaosvojevrsna heuristika (kao i dodatnim pravilim zakljucivanja). Postoje imnoge alternativne logike i njihovi formalni sistemi sa svojim osobinama idomenima primene - npr. intuicionisticka (naglasava matematicki konstruk-tivizam pre nego pojam istine, npr. u PR1 problem egzistencije stepena

iracionalnih brojeva koji je racionalan:

2

2

2

= 2 Q iako o osnovi 2

2

ne moramo da znamo da li je takva - kod intuicionisticke logike to nije dokaz),modalna, temporalna, itd.


30/148


3.3 Zakljucivanje

Automatsko dokazivanje teorema s obzirom na sve prethodno moze dabude veoma tezak problem. Neki metod zakljucivanja tj. dokazivanja teorema

je ispravan ako je svaki zakljucak dobijen postupkom tog metoda iz njegove

baze znanja logicka posledica te baze (kompletan ako vazi i obratno) u smislulogicke implikacije i zakljucivanja u PR1. Postoje klase formalnih sistema imetodi koji su u tome uspesni, a jedan od poznatijih je algoritam rezolucije(na kome se bazira interpretacija PROLOG programa).

Procedura zakljucivanja predstavlja izbor narednog koraka zakljucivanja kaosto je to npr. Markovljeva funkcija next koja slika skup recenica baze znanja(kojima su zadate polazne pretpostavke i izvedene posledice) u naredni,izvedeni skup recenica baze znanja. Moze da zavisi od prethodnih zakljucaka(istorije) makar implicitno zbog same prirode procedure. Ako se baza znanjau svakom koraku izvodenja uvecava tj. ako je svaki naredni korak nadskup

prethodnog onda je procedura zakljucivanja inkrementalna.


31/148

30 Seminarski rad

4 Rezolucija

Rezolucija je primer metode zakljucivanja koja se moze efikasno automa-tizovati, i u odredenim slucajevima se pokazuje da je to ispravna i kompletnaprocedura zakljucivanja.

4.1 Klauzalna forma

Rezolucija se primenjuje nad jednim pojednostavljenim oblikom izrazaPR1 ciji su osnovni elementi klauzule. Klauzule se sastoje od literala koji suzapravo atomski predikati (pozitivni literali) ili njihove negacije (negativniliterali), a klauzula je disjunkcija literala. Od posebnog znacaja su Hornoveklauzule koje sadrze najvise jedan pozitivan literal. Klauzalna forma jekonjunkcija klauzula. Skica algoritma za pretvaranje iskaza PR1 u klauzalnuformu je (oblik PRENEX algoritma za normalnu formu iskaza):

1. izbacivanje implikacija: se zamenjuje sa se zamenjuje sa se zamenjuje sa ( ) ( )

2. ulazak negacije: se zamenjuje sa ( ) se zamenjuje sa ( ) se zamenjuje sa

se zamenjuje sa zamenjuje se sa 3. standardizovanje promenljivih - za svaki kvantifikator posebna promenljiva:

npr. (xP(x)) (xP(x)) zamenjuje se sa (xP(x)) (yP(y))4. eliminacija kvantifikatora - eliminacija egzistencijalnog kvantifikatora,

skolemizacija:

svaka formula koja nije pod dejstvom univerzalnog kvantifikatora oblika(

x)P(x) se zamenjuje formulom P(C) gde je C (Skolemova) konstantakoja se ne javlja ni u jednoj drugoj formuli.


32/148


Svaka formula prethodnog oblika koja je i pod dejstvom univerzalnogkvantifikatora se zamenjuje formulom u kojoj je promenljiva pod dejstvomegzistencijalnog kvantifikatora zamenjena (Skolemovom) funkcijom (ar-gumenti su promenljive pod dejstvom univerzalnog kvantifikatora) koja

se ne javlja ni u jednom drugoj formuli.Npr. xyP(x,y,F(x, y)) umesto xyzP(x,y,z).

5. eliminacija kvantifikatora - eliminacija univerzalnog kvantifikatora:posto drugih kvantifikatora nema, nema ni zabune ako se uklone svikvantifikatori (slicno generalizaciji).

6. svodenje na disjukntivnu normalnu formu: ( ) se zamenjuje sa ( ) ( )

7. zapis klauzalne forme:

npr. umesto P (Q R) pise se: {P}, {Q, R}8. standardizacija promenljivih:

zamene se promenljive td. se ni jedna promenljiva ne javlja u viseklauzula od jedne.

4.2 Unifikacija

Unifikacija je postupak u kojem se dva izraza izjednacavaju (ukoliko jeto moguce) zamenama promenljivih odgovarajucim termovima. Vise takvihzamena (,,vezivanja) promenljivih x1,...,xn termovima t1,...,tn je supstitucija

= {x1/t1,...,xn/tn} pod uslovom da se ni jedna od navedenih promenljivihne javlja ni u jednom od termova. Supstitucija primenjena na neku formulupredstavlja jednu instancu te formule. Ako supstitucija nema nijednupromenljivu koju ima supstitucija onda je razlicita od . Kompozicijadveju takvih supstitucija (zapisuje se postfiksno, kao i primena supstitucijena izraz) se dobija tako sto se najpre primene zamene iz na a onda sedobijenom dodaju zamene iz . Supstitucija je opstija ili jednako opstijaod ako () = . Najopstiji unifikator (nou) izraza i je opstiji odbilo koje druge supstitucije koja koja izjednacava ta dva izraza ( = )tj. () = = . Jedinstven je do na imenovanje promenljivih.

Rekurzivni algoritam za trazenje nou za dva izraza je (moze se uopstiti):


33/148

32 Seminarski rad

Nou(x,y)

if x=y ==> Return()

if Var(x) ==> Return(Nouvar(x,y))

if Var(y) ==> Return(Nouvar(y,x))

if Const(x) or Const(y) ==> Return(FALSE)if Not(Length(x)==Length(y)) ==> Return(FALSE)

i=0, g=[]

loop

if i==Length(x) ==> Return(g)

s=Nou(Part(x,i),Part(y,i))

if s==FALSE ==> Return(FALSE)

g=Compose(g,s)

x=Substitute(x,g)

y=Substitute(y,g)

i=i+1end loop

end Nou

Nouvar(x,y)

if Includes(x,y) ==> Return(FALSE)

Return([x/y])

end Nouvar

Objasnjenje, ukratko: ,,vec implementiran predikat Var tj. funkcija jeistinita ako je argument promenljiva, Cons ako je argument konstanta (ukljucujucii funkcijsku konstantu tj. ime funkcije - npr. Part(F(A,B,C),0) == F,

Part(F(A,B,C),1) == A, itd. a vazi Const(F)=TRUE), Compose spaja dveliste, Substitute primenjuje na izraz listu zamena (supstituciju).

je faktor ako ( )() = nou() td. = .

4.3 Princip rezolucije

Slicno modus ponensu - ako se primeni na jednostavan slucaj prikazanklauzulama sa prostim literalima izgleda ovako:

{R,P}, {Q, P}{R,Q}


34/148


Horizontalnom crtom je razdvojena rezolventa (izvedena klauzula) od polaznihklauzula, slicno zapisu pravila u PR1. Pozitivne (bez ) i negativne instanceliterala (sa ) P koje se javljaju u polaznim klauzulama se ,,potiru. Uopstem slucaju, literali sadrze terme sa promenljivama i tada je neophodanalgoritam unifikacije da bi se primenilo pravilo rezolucije:

, , ( {})( {}), td. je = nou(, )

Ako je rezolventa (zakljucak principom rezolucije) prazna klauzula, to znacida je u pitanju kontradikcija medu pretpostavkama tj. postoji kontradikcijau bazi znanja.

Dedukcija (zakljucak) rezolucijom na osnovu baze (znanja) je niz klauzulaciji je element i ciji je svaki clan dobijen primenom principa rezolucije ilina klauzulu iz ili na nekog prethodnog clana niza. Kada se prikazuje nizkoraka zakljucivanja dodaje se na kraju ako pripada bazi ili redni brojkoraka na osnovu kojih se zakljucuje, ili ako je u pitanju negirani cilj(ako je cilj pokazati ispravnost upita zadatog klauzulom ili literalom onda senjegova negacija ,,privremeno ubaci u bazu da bi se doslo do kontradikcije- odbacivanje rezolucijom, sistem je nezadovoljiv).

Algoritam kojim se realizuje automatska dedukcija rezolucijom se svodi nagradenje stabla zakljucivanja (po nivoima, pocevsi od baze kao polaznognivoa, ,,resolution trace, npr. dva pokazivaca (jedan ,,sporije, jedan ,,brze)

prolaze kroz sve rezolvente ukljucujuci i novonastale) sve do ispunjenja uslova.Uslov je obicno ili prazna klauzula kojom se trazi odgovor ISTINA / NEISTINAna postavljen cilj (zadatu klauzulu), ili se traze vrednosti promenljivih (,,fill-in-the-blank) koje zadovoljavaju postavljeni cilj gde se onda koristi pomocnipredikat Ans(X1,...) onolike arnosti koliko nepoznatih ucestvuje u upitu.Primer - upit glasi P(z,Jon):

1. {F(Art,Jon)} 2. {F(Bob,Kim)} 3. {F(x,y),P(x,y)} 4. {

P(z,Jon),Ans(z)}


35/148

34 Seminarski rad

5. {P(Art,Jon)} 1, 36. {P(Bob,Kim)} 2, 37. {F(w,Jon),Ans(w)} 3, 4

8. {Ans(Art)} 4, 59. {Ans(Art)} 1, 7

Pokazuje se da je princip rezolucije ispravan i kompletan metod dedukcije(koristeci Erbranove teoreme, Erbranov svet konstantnih terma ...).

4.4 Rezolucija i jednakost

Programsko prikljucenje (procedural attachment) je korisno prosirenjepostupka rezolucije (kao i bilo koje druge dedukcione procedure) - predikat

(literal) ili funkicja se evaluira tako sto se izvrsi program tj. kod koji vracanjegovu vrednost. Time se moze smanjiti broj koraka dedukcije, ali tomoze biti i problem jer u takvim slucajevima princip rezolucija nemora bitidovoljno mocan pa se mora pribeci ipak doslednom aksiomatskom definisanju.Primer je relacija jednakosti koja ima podrazumevane osobine, recimo klasicnarekurzivna definicja faktorijala:

fact(0) = 1, fact(k) = k fact(k 1))

Rezolucija nije dovoljna za takvu definiciju, vec se ili mora preformulisatitako da su svi termi bez promenljivih na prvom nivou literala u kojima se

javljaju:

Fact(0) = 1k 1 = j Fact(j) = m k m = n Fact(k) = n

ili se aksiomatizuje jednakost a onda i aksiome supstitucije terma termimaza svaku relaciju i funkciju:

x x = xxy x = y y = x

x

y

z x = y

y = z

x = zkjm k = j Fact(j) = m Fact(k) = m


36/148


kjmn j = m k m = n k j = n

4.5 Strategije rezolucije

Drvo rezolucije lako moze da ekplozivno naraste i time postupak dedukcijepostaje neefikasan. U ovom poglavlju se razmatraju varijante kao strategijei heuristike kojima se to moze izbeci. Osnovna osobina svih ovih strategija

je upotreba Hornovih klauzula. Moze se pokazati da ako se baza znanjasastoji samo od Hornovih klauzula, da je svaka od ovih strategija ispravan ikompletan metod dedukcije.

4.5.1 Strategije brisanja

Jedan nacin poboljsanja rezolucije je brisanje nepotrebnih klauzula izbaze u odredenim slucajevima.

Eliminacija cistih literala:Literal je cist ako se nigde u bazi znanja ne pojavljuje nijednja njegovakomplementarna instanca. Klauzule koje ga sadrze su beskorisna za odbacivanjerezolucijom i zato se mogu brisati iz baze. Dovoljno je jednom primeniti ovopravilo na pocetku procesa rezolucije.

Eliminacija tautologija:Tautologija je klauzula koja sadrzi komplementarne literale. Pokazuje se dazadovoljivost baze znanja ne zavisi uopste od takvih klauzula, prema tomemogu biti brisane. Unifikacija se ne koristi, za razliku od prethodnog, da bise doslo do tautologija, i ovo pravilo moze biti upotrebljeno nakon svakogdedukcionog koraka.

Eliminacija podklauzula:Klauzula je podklauzula (,,subsumption) klauzule akko postoji supstitucija td.

. Podklauzule se mogu brisati i ovo pravilo kao i prethodno se

moze primenjivati nakon svakog koraka dedukcije.


37/148

36 Seminarski rad

4.5.2 Jedinicna rezolucija

Jedinicna rezolventa je ona kojoj je bar jedan roditelj jedinicna klauzula,tj. sa samo jednim literalom (singlton). Jedinicna rezolucija je ona u kojojsu sve rezovlente jedinicne. Jedinicno odbacivanje je ono koje je dostignuto

jedinicnom dedukcijom.

4.5.3 Ulazna rezolucija

Ulazna rezolventa je ona kojoj je bar jedan roditelj element baze znanja.Ulazna rezolucija je ona u kojoj su sve rezovlente ulazne. Ulazno odbacivanje

je ono koje je dostignuto ulaznom dedukcijom.

4.5.4 Linearna rezolucija

Linearna rezolucija (ancestry-filtered) je vid uopstenja ulazne rezolucije.Linearna rezolventa ima bar jednog roditelja koji je ili u bazi znanja ili jepredak svog drugog roditelja. Linearna rezolucija pocinje gornjom klauzulom(iz baze znanja), i svaki sledeci korak sledi iz poslednje rezolvente (bliskiroditelj) i klauzule koja je u bazi znanja ili predak prvog / bliskog roditelja(daleki roditelj).

4.5.5 Rezolucija skupom podrske

Ako odbacime sve rezolvente iskljucivo nad klauzulama iz skupa znanjakoji je zadovoljiv pokazuje se da to ne utice na odbacivanje rezolucijom.Podskup skupa (baze znanja) td. je zadovoljiv zove se skupompodrske za . Rezolvetna skupom podrske ima uvek jednog roditelja iz ili

je potomak od . Dedukcija skupom podrske se sastoji od rezolventi skupompodrske.

Ako je baza zadovoljiva onda su negirane klauzule cilja upravo skuppodrske. Dokazi dobijeni ovom metodom polaze od cilja unatrag i obicnosu ,,citkiji od drugih.


38/148


4.5.6 Uredena rezolucija

Ova strategija je veoma restriktivna ali i veoma efikasna. Klauzule setretiraju kao uredeni nizovi literala i rezolvente mogu biti samo nad prvimliteralima u klauzuli.

4.5.7 Usmerena rezolucija

Ovo je vid uredene rezolucije u kojem se klauzule razvrstavaju u dvegrupe Hornovih klazula: prednje (pozitivni literal je na kraju) i zadnje(pozitivni literal je na pocetku). Tako onda imamo dve vrste rezolventi irezolucija: unapred (u kojem ucestvuju prednje) i unazad (u kojem ucestvujuzadnje). Za neke upite je efikasnije koristiti jednu podstrategiju od druge.Sam problem biranja podstrategije je NP-kompletan.

4.5.8 Sekvencijalno zadovoljenje uslova

Ovo je strategija koja se koristi za ciljeve gde se traze vrednosti i gde suupiti oblika npr.:

P Q R

... gde se traze vrednosti promenljivih za koje je zadovoljen. Sam redosledformula u konjunkciji upita je bitan u odnosu na broj konstantnih literalapo svakom konjunktu u bazi znanja. Pokazuje se da je optimalan redosledodreden td. se pretrazivanje procena kostanja minimizuje kao i samo kostanjeredosleda tj. broj dedukcionih koraka potrebnih da bi se doslo do cilja.


39/148

38 Seminarski rad

5 Zakljucivanje sa nesigurnim uverenjima i

drugi nacini zakljucivanja

5.1 Nemonotono zakljucivanje

U ovom poglavlju se razmatraju metodi dedukcije u kojima dodavanjeformule skupu pretpostavki utice na zakljucak. Kod logickog zakljicivanja uPR1 to nije bio slucaj i zato se zove monotonim. Nemonotono zakljucivanjemoze zavisiti i od celog skupa pretpostavki a ne od njegovog podskupa,ili od formula koje ne pripradaju skupu pretpostavki. Ovakvo proserenjezakljucivanja moze biti od znacaja za sistem koji npr. treba da se prilagodinepotpunoj bazi znanja.

Skup formula se moze zatvoriti logickom implikacijom () ali to nemora

dati kompletnu teoriju. Najjednostavniji metod kompletiranja je pretpostavkazatvorenog sveta (PZS, ,,closed-world assumption). Jednostavno, ako se zakonstantni literal ne moze izvesti da pripada teoriji niti njegova negacija,onda se njegova negacija dodaje u skup uverenja pu - pretpostavljena uverenja,pored skupa ispravnih aksioma teorije, pu je onda dopunjena teorija. P ZS() akko (pu) |= . Pokazuje se da ako je konzistentnabaza i sastoji od Hornovih klauzula onda je i P ZS() konzistentna. UzPZS se obicno koristi i pretpostavka jedinstvenih imena (PJI, ,,unique namesassumption) koja primenjuje princip PZS na jednakost ( (t1 = t2) {t1 = t2} pu), kao i pretpostavka zatvorenja domena (PZD, ,,domainclosure assumption), kojom se prakticno svaki kvantifikator moze zameniti

konacnim disjunkcijama i konjunkcijama. PZD je zadat aksiomom ({(x)x =t1 x = tn} pu), gde su ti konstante objekata jezika, pod uslovom danema funkcijskih konstanti u jeziku (inace postoji beskonacan broj termovanad konstantama koje bi trebalo staviti u ovakvu aksiomu ili ih kvantifikovati).PZD prevazilazi ogranicenje da su jedino one konstante objekata koje se

javljaju u bazi moguce.

Baza se takode moze kompletirati u odnosu na svoje predikate tako dase pretpostavlja da zadate cinjenice u bazi definisu sve zadovoljive vrednostipredikata. Moze se pokazati da je ovo ekvivalentno postupku PZS uz nekepretpostavke. Sustinu cini COMP[; P] kompletiranje predikata P u bazi koje daje prosirenje baze tako da P vazi samo za one vrednosti za koje je


40/148


P istinit u bazi, za koje baza to ,,dozvoljava. Npr. ako je = {P(A)}onda vazi P(A) ((x)x = A P(x)) a formula (x)P(x) x = A dajepotreban uslov da bude zadovoljeno iskljucivo jedino P(A). U tom slucaju

je COMP[; P] ( ((x)P(x) x = A)) ((x)P(x) x = A)(moze se odmah koristiti i ekvivalencija umesto implikacije). Ako je =

{P(A), P(B)} onda vazi COMP[; P] ((x)P(x) x = A x = B).Kompletiranje predikata odgovara PZS u odnosu na predikat gde se PZSprimenjuje samo u odnosu na zadati skup predikata (ako je to skup svihpredikata u bazi onda se poklapa sa PZS, npr. iz = {(x)Q(x) P(x), Q(A), R(B) P(B)} se dobija R(B) i P(B) u opstem slucaju, au odnosu na predikat P se dobija samo P(B) sto posle dovodi do zakljuckaR(B)) - tu se javlja problem nekonzistentnosti iako se koristi baza Hornovihklauzula u odnosu na predikat (npr. ako je = {P(A)Q, P(B)Q} ondase u odnosu na P dobija i P(A) i P(B), sto je nekonzistentno sa ). Zato sekompletiranje radi samo sa predikatima usamljenimu bazi - skup klauzula je

usamljen u P akko svaka klauzula sa pozitivnim pojavljivanjem (instancom)P ima najvise jedno takvo pojavljivanje. Usamljene klauzule u odnosu napredikat jesu Hornove, ali obratno ne vazi. Postoji postupak paralelnogkompletiranja usamljenih klauzula za skup predikata u bazi, za koji se mozepokazati da cuva konzistentnost, i u kojem se pazi da ne dode do cirkularnihdefinicija (predikati = {P1, , Pn} su uredeni: za svaku (x)Ei Pi(x)disjunkciju klauzula iz baze za Pi, Ei da sadrzi nijedan iz {Pi, , Pn} nitinegativne instance iz {P1, , Pi1}) i gde se kompletiranje skupa predikatadobija kao konjunkcija kompletiranja pojedinih predikata. U opstem slucajukompletiranje je COMP[; P] def ((x)P(x)

Ei) gde su Ei

leve strane implikacija klauzula u normalnoj formi u bazi (

x)Ei

P(x)

koje se mogu grupisati disjunkcijom. Normalna forma klauzula je oblikax(y(x = t) Q1 Qm) P(x) gde se pod x = t podrazumevax1 = t1 xn = tn, ti su termi, x promenljive koje se ne javljaju u ti a Qiliterali u kojima se ne javlja P.

Ovo se moze uopstiti minimalnim modelom, konstrukcijom u PR2 (kvantifikujuse predikati) td. kompletiranje predikata ,,radi i za formule oblika P(A) P(B) koje nisu usamljene u bazi (cirkumskripcija): CIRC[, P] ((P)((P)P P) P P) gde je A B def ((x)A(x) B(x))a x moze biti i n-torka promenljivih.


41/148

40 Seminarski rad

5.2 Taksonomijske hijerarhije i pretpostavljeno zakljucivanje(default reasoning)

Cesto je potrebno predstaviti bazu znanja u obliku seme odnosa meduobjektima, kao to je to npr. ,,Noj(x)

Ptica(x), odnosno upotrebom

relacije ,,JESTE koja je parcijalno uredena i tranzitivna (Noj JESTEPtica). Mogu postojati izuzeci u ovakvom odnosu nasledivanja koji se opisujupravilima prekidanja nasledivanja (inheritance cancellation rules). Svakiobjekat moze imati neke opisane osobine koje su date skupom recenica osobinaP, a prethodne recenice o odnosima i izuzecima odnosa daju H - taksonomijskuhijerarhiju. Dobro je takva pravila napisati dovoljno uopsteno - npr. ako jedata recenica u P: Stvar(x) Ab1(x) leti(x) gde je opisanaosobina letenja stvari, onda je pravilo izuzetka u H: Ptica(x) Ab1(x),gde je Ab1 predikat koji se vezuje za odredeni tip izuzetka, abnormalnosti.Da bi primer bio kompletan, u H se mogu uvrstiti onda:

Stvar(Tviti)

Ptica(x) Stvar(x)Ptica(x) Ab1(x)Noj(x) Ptica(x)Noj(x) Ab2(x)Leteci-Noj(x) Noj(x)Leteci-Noj(x) Ab3(x)

sto se moze prikazati i grafom, dok se u P mogu uvrstiti recenice:

Stvar(x) Ab1(x) leti(x)Ptica(x) Ab2(x) leti(x)Noj(x) Ab3(x) leti(x)Leteci-Noj(x) leti(x)

Kompletiranjem (paralelnim) predikata u H se dobijaju recenice:

1. Stvar(x) Ptica(x) x=Tviti2. Ptica(x) Noj(x)3. Noj(x) Leteci-Noj(x)4.

Leteci-Noj(x)

5. Ab1(x) Ptica(x)


42/148


6. Ab2(x) Noj(x)7. Ab3(x) Leteci-Noj(x)

Iz toga se moze zakljuciti da Tviti ne leti jer je stvar, ali ako se izmeni tvrdnjai pretpostavi da je Tviti ptica onda se kompletirane formule o stvarima i

pticama menjaju (Stvar(x) Ptica(x), Ptica(x) Noj(x) x=Tviti)i moze zakljuciti da Tviti leti. Tako se sistem vremenom menja u toku samogucenja cinjenica. Ovaj proces delimicnog kompletiranja u bazi naziva serazdvojenim kompletiranjem (delimited completion). Moze biti korisno, opetprimera radi, zakljuciti da sve ptice lete osim onih za koje se ekplicitno tvrdida ne lete. Nemonotono zakljucivanje moze biti i posledica nestandardnihpravila zakljucivanja, pretpostavljenih (prototipnih) pravila (default rules)i pretpostavljenih teorija: (x) : (x) (x). Prosirenje (, D) baze skupom pretpostsavljenih pravila D sadrzi (X0) ako postoji instanca X0za x td. (X0) sledi iz (, D) i (X0) je konzistentna sa (, D). Npr.

ptica(x) : leti(x) leti(x) (ovo ujedno primer normalnih pravila kod kojihje = ), ili PZS u odnos na predikat P::P(x)P(x)

Problem sa univerzalno kvantifikovanim recenicama sa implikacijom i izuzecimakao kod taksonomijskih hijerarhija je poznat kao problem kvalifikacije (Lifschitz,1986). Zato je zgodno koristiti proceduru zakljucivanja sa privremenimpretpostavkama odnosno pretpostavljenim rasudivanjem.

5.3 IndukcijaVeoma vazna osobina zakljucivanja je i uopstavanje zakljucivanja. Bazu

znanja delimo na bazu uverenja nad kojom se rade uopstavanja i pozadinskuteoriju td. ( |= ). Tada je induktivni zakljucak ( ) akko:

1. hipoteza je konzistenta sa pozadinskom teorijom:( |= )

2. hipoteza objasnjava bazu:{} |=

Indukcija je pomak od pojedinog ka opstem pod nekim uslovima, nacinzakljucivanja opravdan induktivnom hipotezom (IH, poznat je primer Peanovog


43/148

42 Seminarski rad

modela prirodnih brojeva) - na primer, ako vazi P(A) onda vazi P(x), poduslovom da nije P(x) (ne postoji negativan primer). Indukcija je povezana

je i sa problemima (masinskog) ucenja i verovatnosnog zakljucivanja. Primermoze biti i problem klasifikacije cinjenica prema nekim atributima i kriteri-

jumima (kao u sistemu i algoritmu ID3 gde se generise pravilo klasifikacija

ulaznih cinjenica). Primer postupka induktivnog zakljucivanja je i problemformacije koncepta. Definise se formalno cetvorka (P,N,C, ) kao problemformacije koncepta gde je P skup pozitivnih instanci koncepta (potvrdujuga), N skup negativnih, C skup svih koncepata koji se koriste da bi sedefinisao prostor hipoteza problema formacije (koncept daje istinitosnu vrednostza datu instancu, pozitivnu ili negativnu; konceptualni bias - PR1 zakljucimora ju pripadati definisanom recniku) i je logicki bias (zakljuci moraju bitiodredene forme zadate jezikom , formalnom teorijom kao vidom ugradjenogznanja) i uvodi se pojam prihvatljve relacije (ako zadovoljava biase, definisananad C u jeziku ). Prihvatljiva relacija je karakteristicna ako zadovoljena

za sve iz P, diskriminanta ako ne zadovoljava nijednu iz N i dopustljiva jeako zadovoljava oba uslova. Skup svih dopustljivih relacija je skup verzijaV, a graf verzija u kojem su orijentisani lukovi relacijom opstosti - cvor p jemanje opsti od cvora q ako je p q (ispravni podskup relacije kao skupa, ilivise specifican). Skup V je dobro formiran ako za svaki lanac u grafu postojiminimalni i maksimalni element, S skup (specificna granica) minimalnih aG (generalna, uopstena granica) maksimalnih elemenata. Tada vazi:

Teorema 8 Za (P,N,C, ) sa dobro formiranim V i S, G skupovima tadar V akko je ogranicena elementima iz S i G.Postoji postupak eliminacije kandidatakojim se za svaku (pozitivnu i negativnu

simetricno) instancu tj. uneti podatak prepravljaju skupovi G i S (umestocelog prostora V) td. je pokrivena nova cinjenica. Algoritam dovodi doS = G tj. ostaje samo jedna instanca u V. Prethodna teorema (kao i sampostupak i njegove osobine) garantuje resenje i to u konacnom broju koraka.

Zavisno od prirode problema neki put je moguce uticati na izbor naredneinstance i traziti informacije o njenoj klasifikaciji - moguce je vrsiti eksperimente.Ovo nudi mogucnost dodatnog poboljsavanja postupka. Osnovni tip poboljsanja

je npr. izbor instance koja ce prepoloviti prostor verzija, ali cesto samotrazenje takve instance moze da bude zahtevno samo po sebi. Ako se definiseproizvod prostora verzija, a time i faktorizacija, moguce je dobiti bolje rezultatei varijante algoritma. Pored formacije koncepta nezavisne od domena postojei sistemi kao sto su to npr. Meta-DENDRAL ili ID3 koji su ,,model-driven tj.


44/148


koji su manje ili vise zavisni od domena jer pretpostavljaju da su svi podaci naraspologanju na samom pocetku, dok su ostali inkrementalni (data-driven).Vise o ovome i o nemonotonom zakljucivanju se moze naci u [GN].

5.4 Verovatnosno zakljucivanjePotrebno je povezati pojam iskaza sa pojmom slucajne promenljive tako

sto ce svaki iskaz imati distribuciju slucajne promenljive sa dve vrednosti{1-p,p}. Tako atom P (dogadaj) je istinit sa verovatnocom p, a P saverovatnocom 1 p. Sa dva konstantna atoma mozemo formirati raspodeluvisedimenzionalne slucajne promenljive (za slozene dogadaje {P, Q}, {P, Q},{P, Q}, {P, Q}) i njihove verovatnoce:

p(P Q) = p1p(P Q) = p2p(P Q) = p3p(P Q) = p4

tada su verovatnoce dogadaja odnosno konstantnih atoma P i Q verovatnocemarginalnih raspodela takve visedimenzionalne slucajne promenljive za {P, Q}:

p(P) = p1 + p2 =

ip(P|Q = Qi)p(Q) = p1 + p3 =

ip(Q|P = Pi)

Najcesce nisu date slozene verovatnoce i bez njihove distribucije je tesko onjima znati dovoljno na osnovu distribucije marginalnih promenljivih. Takose Bajesovo pravilo moze upotrebiti slicno modus ponensu: ako je p(Q|P)uslovna verovatnoca dogadaja Q ako je P ispunjeno. To je deo slucajevaza koje je P ispunjeno kada je i Q ispunjeno: p(Q|P) = p1p1+p2 =

p(P,Q)p(P) ,

p(P, Q) = p(P Q). Obrnuto, p(P|Q) = p(P, Q)/p(Q) i odatle sledi:

p(Q|P) = p(P|Q)p(Q)p(P)

Dakle, Bajesovo pravilo nudi mogucnost da se zakljuci nesto i o uzroku naosnovu posledice.

p(Q|P) = p(P|Q)p(Q)p(P)


45/148

44 Seminarski rad

p(Q|P)p(Q|P) =

p(P|Q)p(Q)p(P|Q)p(Q)

O(E) =defp(E)

p(E) =p(E)

1 p(E)(,,izgledi za E) pa ako je (faktor dovoljnosti) =def p(P|Q)p(P|Q) i (faktor potrebnosti) =def

p(P|Q)p(P|Q) onda je:

O(Q|P) = O(Q), O(Q|P) = O(Q)Postoji povezanost vrednosti i :

=1 p(P|Q)1 p(P|Q)

ali su obe neophodne da bi se nasla uslovna verovatnoca za Q ako je P ili

P posebno. Posto je je 0 < p(P|Q) < 1, ako je < 1 onda je > 1i obratno, kao i = 1 akko = 1. O tome treba voditi racuna prilikomgradenja baze znanja. Cesto se koriste logaritmi ovih koeficijenata l = log koji se nazivaju indeksi dovoljnosti (sto je veci to je i p(Q|P) vece) i l = log indeks potrebnosti (sto je manji to je i p(Q|P) manje). Takode, vazi vezaizmedu p(Q) i O(Q):

p(Q) = O(Q)/(O(Q) + 1)

Na osnovu ovoga svega, ako je poznato p(Q) i ako se pretpostavi P ili Ponda se moze izracunati uslovna verovatnoca za Q. Ekspertni sistemi (rule-

based) koriste bazu znanja u kojima se nalaze i pravila oblika P Q daQ moze slediti iz P. U PR1 to znaci da se moze zakljuciti Q uz to praviloako je P istinito, ali u verovatnosnom zaljucivanju to nije tako, ili bar nije

jednostavno doci do verovatnoce p(Q) uz p(P Q) pored p(P), ali akouz pravilo se veze i njegovo i onda je to moguce. A ako se sa P izrazinesigurnost u pretpostavku P (tj. P) i sa p(P|P) verovatnoca da je P ondase moze pretpostaviti da je p(Q|P, P) = p(Q|P) i p(Q|P, P) = p(Q|P)(P i P su zavisne u tom smislu) i vazi:

p(Q|P) = p(Q, P|P)+p(Q, P|P) = p(Q|P, P)p(P|P)+p(Q|P, P)p(P|P)gde je ondap(Q

|P) linearna interpolacija verovatnoce izmedu kranjih vrednosti

da je P tacno ili nije znajuci verovatnocu da je P. Zanimljivo, ako je


46/148


p(P|P) = p(P) onda je p(Q|P) = p(Q) - gubi se informacija o uticajuP na Q. Slicno prethodnom, ako su {P1,...,Pn} hipoteze koje su uslovnonezavisne (jaka pretpostavka, moze se samo opravdati samo do izvesne mere,aproksimativno), onda se verovatnoca zakljucka Q moze izracunati, kao i dase uslove verovatnoce za Pi nekakvim uverenjima P

i . Tada uz pomenutu

pretpostavku i pretpostavku da su obzervacije Pi nezavisne od Pj osimodgovarajuce ,,svojePi, i da Q ne zavisi dodatno od P

i , vazi:

p(Q|P2, P1) = p(Q|P2, P1)p(P2|P2) + p(Q|P2, P1)p(P2|P2)

gde je O(Q|P2, P1) = 2O(Q|P1) i O(Q|P2, P1) = 2O(Q|P1). Tu senaslucuje iterativni postupak u kome se koristi prethodno izracunato O(Q|P1)gde se za svako Pi vezuje odgovarajuci par i i i.

Tako se mogu graditi mreze zakljucivanja (inference networks) - npr. ako

su P1, P2, P3, P4 uslovno nezavisne, A zavisi od P1, P2 i B zavisi od P3, P4onda su i A i B uslovno nezavisne i zakljucak Qf koji sledi iz A, B zavisi odnjih. Mnogi ekspertni sistemi ih koriste. Zakljucivanje unapred (forwad-chaining) propagiranjem pravila nad cinjenicama sve do zakljucka nalaziverovatnocu zakljucka u mrezi. Zakljucivanje unazad (backward-chaining- slican mehanizam, ,,forward-propagation i ,,back-propagation, postojikod nekih klasa neuronskih mreza kao sto je perceptron, gde se takorecimenjaju koeficijenti pravila na osnovu pocetnih pretpostavki, izracunatog izadatog zakljucka) npr. analizira drvo mreze zakljucivanja trazeci pocetnupretpostavku koja najvise utice na zakljucak - onda se interaktivno unosiverovatnoca takvih pretpostavki ako je potrebno dok se ne potvrdi uticaj na

zakljucak. Problem je ako neki od meduzakljucaka zavisi od nekih drugihmeduzakljucaka iako se pretpostavlja da su nezavisni iz bilo kog razloga.To se resava obicno dodatnim ad hoc mehanizmima i podesavanjima. Akoimamo pravilo oblika P1 ...Pn Q onda treba najpre izaracunati zavisnuverovatnocu za P = P1 ... Pn, iskaz koji nije atom - npr. neki ekspertnisistemi koriste p(P) = mini[p(Pi)] ili p(P1 ... Pn) = maxi[p(Pi)] iakobi uz pretpostavku da su Pi nezavisne verovatnoca konjunkcije bila manjaod navedenog minumuma, ali u kranjem slucaju gde sve verovatnoce imajuvrednosti 0 ili 1 i jedno i drugo se svodi na Bulovu algebru (koja se poklapa safuzzy teorijom skupova u ovakvom specijalnom slucaju - Zadeh, 1965-1975- svakom elementu i podskupu dodeljena je funkcija koja meri pripadnostskupu, sto bi moglo da se tumaci kao verovatnoca, ali to onda nije fuzzy


47/148

46 Seminarski rad

teorija u opstem slucaju).

5.5 Jedno formalno zasnivanje verovatnosne logike

Formalno zasnivanje verovatnosne logike se vezuje za formalno zasnivanjeslucajnih promenljivih i verovatnoce. Ako je recenica u svetu W1 istinita,a u svetu W2 nije, posto ne znamo u kojem od ta dva sveta zaista jeste(,,u stvarnom svetu moze biti samo u jednom od ta dva) to se izrazavaverovatnocom p da pripada W1, odnosno 1 p da pripada W2. Ako imamovise reci onda ima i vise kombinacija svetova u kojima su tacne, ali npr.za 1 2 ne uzimaju se u obzir svetovi gde je 1 tacno kao i 1 2, a2 nije. Za skup recenica je moguce napraviti semanticko drvo i takoodrediti moguce svetove - svaka recenica moze biti tacna ili ne (pozitivni ilinegativni literal je tacan), na svakom nivou po jedna iz , i od korena (prve

recenice) do lista (zadnje recenice) postoje putevi koji daju konzistentneskupove (kombinacije), ostali se odbacuju (moze se prikazati tabelarno - imaih prakticno 22

broj slova

a ne 2||, gde su slova iskazne promenljive, odnosnoosobine za koje se vezuju elementarni dogadaji). Verovatnoca recenica jeonda zbir verovatnoca svetova u kojima je tacna. Neka ima K nepraznihskupova u K = {Wi} mogucih svetova za L recenica iz , i ako su nabrojani,neka je onda P kolona dimenzije K veorvatnoca [pi]

T vezanih za odredeniskup svetova Wi. Neka su recenice j u nabrojane, L-dimenzioni vektoriV1,..., VK odgovaraju konzistentnim valuacijama recenica u td. i-tomskupu svetova Wi odgovara Vi = [vji ]T gde je:

vji =

1, j tacna u Wi0, j netacna u WiNeka je onda L K matrica V = [V1, ..., VK]. Ako je L-dimenziona kolona = [j ]

T verovatnoca recenica j iz onda je:

= VP

uz uslov

ipi = 1 za 0 pi 1 (*). Ako je skup uverenja (belief)- recenica sa njihovim poznatim i verovatnocama, verovatnosna derivacija(probabilistic entailment) recenice iz se moze svesti na problem resavanjasistema linearnih nejednacina gde je = {} i V je dobijeno npr.semantickim drvetom - ova metoda se moze prosiriti Skolemizacijom i na


48/148


PR1. se moze prosiriti sa i V sa jednim redom (npr. prvi red) za tuformulu da bi se dodao i uslov (*). Ako se doda kao poslednji red = [vi]u V tada je:

=

1..

.j

...

=

1 1 1v11 v12

v1K

... . . .

vL1 vL2 vLKv1 v2 vK

P

Ako se sa V oznaci V bez poslednjeg reda (za ) i sa kolona bez zadnjegclana u , tada se najpre resavanjem po P sistema

= VP dobija = p() = P. Sistem najcesce ima mnogo resenja i zato je interesantnonaci interval u kome se krece resenje.

Primer: = {(y)P(y), (x)P(x) Q(x)}, = (z)Q(z) (npr. prvinivo semantickog drveta ima dve grane: P(A) i P(y), sledeci je narednaformula u i njena negacija, i treci je i njena negacija - za svaki list ondaimamo kolona nula i jedinica za formule i negacije po nivoima). Tada semoze pokazati da je:

p((y)P(y)) +p((x)P(x) Q(x)) 1 p((z)Q(z)) 1

Ovo se moze dobiti tako sto se 2. i 3. jednacina za V saberu i od togase oduzme prva odakle se dobije da je p1 = 1 + 2 1 i na osnovu toga

p3 = 1 + 2 1 +p2 +p4 (3 jednacine, posto je zadnja ona kojom se racunaverovatnoca , i 4 nepoznatih pi). Ova

zoranpopovictanjavukovic

Documents