kraken toolset - cycorp inc. (seminarium)

Download Kraken toolset - Cycorp Inc. (seminarium)

If you can't read please download the document

Upload: arkadiusz-janicki

Post on 16-Apr-2017

716 views

Category:

Spiritual


2 download

TRANSCRIPT

















KRAKEN toolset
Cycorp Inc.

Arkadiusz Janicki

Uniwersytet Wrocawski, wiosna 2008

Maszynowe Rozumienie Jzyka Naturalnego

prowadzcy: dr Pawe Rychlikowski

Knowledge Formation and Dialogue
Using the KRAKEN Toolset, 2002, Cycorp, Inc.

Kraken-Knowledge Rich Acquisition of Knowledge
from Experts Who Are Non-Logicians

Final technical rept. Jun 2000-Feb 2004, Cycorp, Inc.

KRAKEN toolset
Cycorp Inc.

1. Historia Krakenw

2. Cele i zadania systemu

3. Architektura

4. Podsumowanie

KRAKEN toolset
Cycorp Inc.

KRAKEN - legendarny stwr morski.

Pierwszym, ktry opisa to monstrum w epoce nowoytnej, by Erik Pontoppidan w swoim dziele z 1755 r. - Natural History of Norway.
Jeszcze wczeniej pisa o nim Pliniusz Starszy - potwr mia blokowa Cienin Gibraltarsk, nie przepuszczajc podrujcych tamtdy okrtw.

Wedle opowieci eglarskich, krakeny byy czsto brane za wyspy. Kiedy marynarze wychodzili na ld budzili potwora, ktry si zanurza, wcigajc pod wod zaog wraz z okrtem.

W legendach Kraken jest znany rwnie jako Triangul. Jest pod wadz Neptuna, lecz sucha tego, kogo zobaczy zaraz po przebudzeniu. Zasypia na sto lat, by pniej przez kolejne sto atakowa statki.

rdo: Wikipedia.pl

Cycorp, Inc., Austin, Texas, is being awarded an $8,504,113
cost-plus-fixed-fee contract to provide for design, development, and delivery of the Knowledge Rich Acquisition of Knowledge from Experts who are Non-Logicians (KRAKEN) software system.

O co tak naprawd chodzi?

Knowledge-Rich Acquisition
of Knowledge from Experts
who are Non-logicians

Pozyskiwanie obszernej wiedzy od ekspertw, ktrzy nie s logikami.

KRAKEN Cycorp, Inc.

CYCORP, Inc.
Cycorp, Inc. to firma zajmujca si technologiami reprezentacji wiedzy, wnioskowania, przetwarzania jzyka naturalnego, integracj danych semantycznych, zarzdzania informacj itp.

CYC Project
Dugoterminowy projekt zapocztkowany przez dr Douglas Leant'a w 1984 r. Przedsiwzicie majce na celu stworzenie prawdziwej sztucznej inteligencji.

CYCORP, Inc.
udostpnia rdze ontologii na licencji Public Domain, dodatkowo oferuje darmow licencj na narzdzia programistyczne dla spoecznoci naukowej.

Baza Wiedzy CYC

Aktualnie najwiksza na wiecie ustrukturalizowana baza wiedzy. Ponad 190.000 poj zawierajcych relacje (funkcje, predykaty), kolekcje i wpisy indywidualne. Pojcia poczone s 2.200.000 asercjami wyraonymi w CycL.

1. Historia Krakenw

2. Cele i zadania systemu

3. Architektura

4. Podsumowanie

KRAKEN toolset
Cycorp Inc.

Sytuacja na pocztku projektu

W ramach projektu Rapid Knowledge Formation powstaa potrzeba szybkiego i poprawnego wprowadzania danych do systemu sztucznej inteligencji.

Podczas pracy nad poprzednim projektem HPKF (High-Performance Knowledge Base) okazao si, e system potrafi czasami odpowiada na pytania, ktre wydawayby si bez odpowiedzi (LOL!)

Transfer wiedzy do systemu by utrudniony: najpierw eksperci musieli nauczy ontologw, a ontologowie uczyli system

Pomysy

Stworzenie systemu umoliwiajcego komunikacj w jzyku naturalnym.

Na interfejs Krakena mona patrze jak na metafor rozmowy eksperta z laikiem (lub pana i wadcy uczcego stwora co jest dobre a co ze).
Mog uywa specjalistycznego sownictwa, ktre trzeba zdefiniowa w trakcie rozmowy.

Rozmowa powinna by przeprowadzona w ten sposb, aby uzyska najlepsz reprezentacj i logik zgromadzonej wiedzy. (Nie zadajemy pyta Czy statki s jadalne?)

KRAKEN Cycorp, Inc.

Cele i zadania systemu:
(wyspecyfikowanie przy starcie projektu)

1) Bogaty zestaw narzdzi narzdzia do wprowadzania wiedzy powinny bazowa na wiedzy

2) Narzdzia zalene od kontekstu system powinien modelowa zachowanie uytkownika, aby dostarczy mu odpowiednich informacji i waciwie interpretowa polecenia

3) Gbokie rozumienie tekstu

4) Prowadzenie rozmowy i klaryfikacja system powinien umie wypyta uytkownika o szczegy dotyczce tematy rozmowy

KRAKEN Cycorp, Inc.

5) Planowanie i rozwizywanie problemw system powinien planowa swj dialog z uytkownikiem, ale take powinien potrafi rozwiza jego problemy.

6) Wnioskowanie dotyczce metodologii wprowadzania wiedzy

7) Ustrukturalizowana baza wiedzy podstawowe pojcia powinny by wyranie reprezentowane

8) System powinien obsugiwa anafory, katafory np.
Mapa ukrada banana i go zjada.
('Koki zdaniowe', 'wskaniki zdaniowe' - ang. discourse pegs)

KRAKEN Cycorp, Inc.

9) Heterogeniczno system powinien wsppracowa z wieloma rnymi systemami

10) Metafory, analogie i porwnania

11) Wspieranie wsppracy i nadzoru system musi wspiera wspprac wprowadzajcych dane, a take umoliwia sprawdzanie i poprawianie danych wprowadzonych przez innych.

12) Automatyczne mierzenie wydajnoci

13) System powinien by uyteczny nie tylko do celw wojskowych, ale potencjalnie take dla przemysu i innych instytucji.

KRAKEN plan dziaania

Rok pierwszy 2000

Textbook Knowledge Challenge Problem (TKCP)
Zadanie polegao na wprowadzeniu do systemu treci ksiki Biologia komrki podstawy - Alberts, et. al.

okazao si, e czsto w zdaniach pojawia si metafora, a CycL bdc do precyzyjnym jzykiem, nie pozwala na opisywanie zachowa przedmiotw w poprzez analogi do zachowa ywych istot.

Rok drugi 2001

Wydarzenia z 11 wrzenia odmieniy bieg prac. Zmieniy si cele i skad druyn. Odpada Teknowledge, przychodzi NWU wraz znarzdziem do szkicowanianuSketch Battlespace.

Northwestern University's nuSketch BattleSpace.

KRAKEN plan dziaania

Rok trzeci 2002

Kolejne zwrot akcji i zmiany w skadzie

Powrt do podstawowych celw projektu, przede wszystkim dotyczcych uniwersalnoci powstajcego systemu

Powstaj nowe narzdzia Factivore, Analysis Diagram Tool. Inne umieraj mierci naturaln (interfejs HTML)

Integracja z GIS'em

Czas na refleksje

1. Historia Krakenw

2. Cele i zadania systemu

3. Architektura

4. Podsumowanie

KRAKEN toolset
Cycorp Inc.

Procesor tekstu

Zawiera komponenty odpowiedzialne za przetwarzanie jzyka naturalnego

Parser fraz zdaniowych - wyszukiwanie rozbioru zdania, z moliwoci ograniczenia liczby rozbiorw, przeszukiwanych kategorii, oglnego kosztu.
- Rezygnacja z HPSG
- informacje syntaktyczne i sownikowe zostaj.
- Hybrydowy system top-down/bottom-up

Parser fraz rzeczownikowych

W przeciwiestwie do pozostaych elementw Procesora tekstu ten modu wykorzystuje intensywnie baz wiedzy Cyc'a.

Parser szablonw

Generator jzyka naturalnego

Natural language generation system

Produkuje sowa, fragmenty zda i zdania na podstawie danych z bazy wiedzy i szablonw

iCycL - Intermediate CYC Language

Jzyk ewoluowa przez 15 lat, aktualnie mona go porwna do logiki wysokiego poziomu.

Obserwacja: ludzie zazwyczaj nie mwi jzykami formalnymi. Wniosek: pozwalamy na nieformalne struktury zdaniowe, jak np. jest-Niedospecyfikowany, troch, kilka, ...

If two brigades in one battalion are being attacked, then the brigade is being attacked.(implies (and (isa ?THE-1ST-TASK AssignedTaskType) (targetInAttackTask ?THE-1ST-TASK ?THE-1ST-BATALLION) (isa ?THE-1ST-BATALLION Batallion-MilitaryEchelon) (subOrganizations ?THE-BRIGADE ?THE-1ST-BATALLION) (isa ?THE-BRIGADE Brigade-MilitaryEchelon) (different ?THE-1ST-TASK ?THE-2ND-TASK) (isa ?THE-1ST-TASK AssignedTaskType) (different ?THE-1ST-BATALLION ?THE-2ND-BATALLION) (isa ?THE-2ND-BATALLION Batallion-MilitaryEchelon) (subOrganizations ?THE-BRIGADE ?THE-2ND-BATALLION) (targetInAttackTask ?THE-2ND-TASK ?THE-2ND-BATALLION)) (targetInAttackTask ?THE-1ST-TASK ?THE-BRIGADE))

If a unit is assigned to attack another unit, then it is responsible for that unit.(implies (and (isa ?UNITA ModernMilitaryUnit-Deployable) (different ?UNITA ?UNITB) (isa ?UNITB ModernMilitaryUnit-Deployable) (targetInAttackTask ?THE-ATTACKING-TASK ?UNITA) (unitAssignedToAction ?THE-ATTACKING-TASK ?UNITB) (isa ?THE-ATTACKING-TASK AssignedTaskType)) (unitAssignedToUnit ?UNITB ?UNITA))

Fragment wiedzy w jzyku CycL

Specjalistyczne narzdzia wprowadzania tekstu

Deskryptor biaych kart (sailent descriptor)

Zadaje pytania odnonie wszelkich nowo wprowadzonych poj

Pocztkowo modu zadawa uytkownikowi po jednym pytaniu, w ustalonym porzdku; niektrym ekspertom bardzo si to nie podobao, poniewa musieli odpowiada na pytania, ktre wg systemu miay by interesujce, a nie byy i w dodatku nie miay adnego zwizku z omawianym zagadnieniem.

Aktualnie dua cz funkcjonalnoci zostaa przeniesiona do Factivore'a

Specjalistyczne narzdzia wprowadzania tekstu

Adwersarz precyzji (precision suggestor)

Przy wprowadzaniu
danych sugeruje
implikacje.

WFF-Repair

(WFF Well-Formed
Formula) sprawdza
poprawno
semantyczn

Specjalistyczne narzdzia wprowadzania tekstu

Asystent sownikowy

Wyszukiwanie nie tylko po nazwie, ale take po waciwociach gramatycznych. Dziki temu moemy uywa systemu nie tylko w rozwizaniach angielskojzycznych (jeszcze nie przetestowane)

Glossary

Wczeniej: Concept Refinement Interviewer, jeszcze wczeniej Salient Descriptor

Narzdzie do gromadzenia faktw

Osobna aplikacja stand-alone napisana w Javie

Factivore

Factivore

Factivore

Query Library

Query Library

Precission Suggestor

Why Not? (ISI)

Rysowanie bazy wiedzy
/ KB Graphing

Analysis Diagram Tool

Wielu wojskowym ekspertom jest atwiej wyraa si w formie procedur, ni w formie konkretnych sytuacji i uniwersalnych regu.

To procedura, a konkretnie historia wnioskowania, ustanawia kontekst wnioskowania ekspertw i sprawia, e daje si zarzdza procesem decyzyjnym.

Eksperci wiedz o tym co ju zostao rozwaone i postanowione.

1. Historia Krakenw

2. Cele i zadania systemu

3. Architektura

4. Podsumowanie

KRAKEN toolset
Cycorp Inc.

Wskazwki od ekspertw (COA Course of Action)

First, we had to develop meaningful (measurable) evaluation criteria, when COA standards (like the principles of war) are generally expressed in platitudes (e.g. Achieve surprise, establish overwhelming force superiority at the decisive point, allocate minimum force to secondary efforts).

Second, we had to develop an understanding of how to enter the rules; that is, how to break down a rule into manageable entry pieces (we had to communicate with KRAKEN on KRAKENs conditions).

Third, the process of actual entry required that we deal with the limited and sometimes erroneous military knowledge in KRAKEN, which we generally gained awareness of through trial and error.

Wskazwki dla projektantw UI w NLP

Pytania zadawane przez system powinny by sensowne (poprawne semantycznie).

Nie pytamy o rzeczy, ktre ju wiemy.

Pytania powinny by interesujce szczeglnie interesujce jest uczenie nowych faktw, o ktrych nic nie wiemy (wyjtki: wiele atrybutw: przyjani si z, mwi w jzyku)

Wydaje si, e pytanie jest bardziej interesujce, jeli zwiksza prawdopodobiestwo odpowiedzi na kolejne pytania

Wskazwki dla projektantw UI w NLP

Unikaj wszelkich niepotrzebnych opnie (rezygnacja z DHTML na rzecz Javy i stopniowego wywietlania elementw interfejsu)

Stwrz odpowiednie narzdzia pokrywajce najwiksz cz zapotrzebowania uytkownikw (Osobne narzdzia dla kadego sweet point'a.)

Szerokie spektrum interakcji z uytkownikiem:

swobodna rozmowa

forma porednia (frazy rzeczownikowe)

komunikacja graficzna

komunikacja binarna tak-nie

Podsumowanie

Wskanik wiedzy pozyskiwanej z uyciem Factivora by najwyszy z testowanych do tej pory w RKF narzdzi oglnego uytku .

Z powodu ograniczonych funduszy w roku trzecim integracja zGIS'em bya bardzo prosta, ale udao si osign wyrane postpy w wykorzystaniu moliwoci GIS'a do wnioskowania symbolicznego.

Najlepiej sprawdziy si interfejsy graficzno/tekstowe napisane w Javie, co sugeruje, e to jest waciwy kierunek dla tego typu rozwiza.

Plany

Cyc bdzie kontynuowa prac nad leksykonem pod ktem pokrycia szeregu oglnych problemw NLP, nie zwizanych z adnym konkretnym projektem

Prace nad EMBT - example-based machine translation. Mapowania pomidzy zdaniami w jzyku naturalnym a ich odpowiednikami w CycL.

Factivore i Query Library od razu zaprzgnite do pracy gdzie si dao.

Analysis Diagram Tool grant od SBIR'a (Small Business Innovation Research)

Salient Descriptor + Factivore = trafniejsze pytania dla uytkownika

Gdzie mona by wykorzysta KRAKEN'a?

Inteligentny asystent osobisty

Narzdzia szkoleniowe dla uczniw

Gos z kratki podpowiadajcy adeptom sztuki wojennej podejmowa waciwe decyzje przy duej informacji danych

Wsparcie dla jakichkolwiek projektw opartych o wiedz

Dzikuj za uwag :)