tecniche fuzzy per l'elaborazione del linguaggio naturale
Post on 10-Apr-2015
184 Views
Preview:
DESCRIPTION
TRANSCRIPT
Michele FilanninoUniversità degli Studi di Bari “A.Moro”Dipartimento di Informatica
Research: http://www.di.uniba.it/~swap/Twitter: @bronko85
Working Capital - BarCampBari, 13 luglio 2010
/15
• Età: 24 anni;
• Laureato in Informatica e tecnologie per la produzione del software in meno di 3 anni, cum laude;
• Laureando magistrale in Informatica;
• Membro del SWAP Research Group (Semantic Web Access & Personalization);
• Blogger per melablog.it.
Chi sonoInformazioni
2
/15
MotivazioniQuantità di dati in Internet
155 milioni di siti web
5 milioni di Tb* di dati
Un uomo impiegherebbe 57000 anni per leggerli.
1,8 miliardi di utenti (crescita esponenziale)
* Google ne ha indicizzato solo lo 0,004% ;)Dati forniti da Eric Shmidt, CEO di Google, durante una conferenza del 2005 | Fonte: SoftPedia 3
“It’s not information overload.It’s filter failure”
Clay Shirky (al Web2.0 Expo del 2008)
/15
Information filteringMotori di ricerca
• non differenziano i risultati in base agli utenti;
• richiedono all’utente una parziale conoscenza dei documenti cercati;
• offrono risultati errati o banali* poiché non
comprendono il linguaggio naturale.
* L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino, and P. Molino. Introducing Serendipity in a Content-based Recommender System. In F. Xhafa, F. Herrera, A. Abraham, M. Koppen, and J. M. Benitez, editors, Proceedings of the Eighth International Conference on Hybrid Intelligent Systems HIS-2008 , pages 168-173. IEEE Computer Society Press, Los Alamitos, California, 2008. ISBN 978-0-7695-3326-1. 5
/15
Il presenteSemantica, Web3.0, etc...
• Ontologie -> Logiche descrittive;
• Realizzazione from scratch molto onerosa;
• Utilizzo limitato a domini molto specifici;
• bassa precisione, risultati poco pertinenti, complessità computazionale elevata.
6
“Nella misura in cui le leggi della matematica si riferiscono alla realtà non sono certe.
E nella misura in cui sono certe, non si riferiscono alla realtà.”
Albert Einstein
/15
Idea!
• Utilizzare logica fuzzy per restituire
risultati più intelligenti.• Ridimensionare l’uso di algoritmi basati su
logica classica;
• Rifiutare di formalizzare i meccanismi sottesi al linguaggio naturale umano;
8
/15
Logica fuzzyLotfi Zadeh, 1965*
• Logica del ragionamento approssimato;
• Esprime incertezza;
• Estende la classica teoria degli insiemi;
• Consente di profilare le interpretazioni degli utenti.
• Fuzzy-relazioni tra concetti ontologici
L. A. Zadeh. Fuzzy sets. Information and Control, 8(3):338–353, June 19659
/15
Il sistema softwareCapacità
• Interpreterà il linguaggio naturale (italiano ed inglese);
• Eliciterà i concetti ontologici presenti nel testo;
• Sarà facilmente integrabile in sistemi terzi.
10
/15
FunzionamentoInput, output
Testo semplice
Pagina social network
Pagina web
INPUT
Concetti ontologicipertinenti (anche nascosti)
Concetti ontologici significativi per il profilo
Concetti ontologici correlati(anche nascosti)
OUTPUT
11
/15
Scenario applicativoIntegrazione in un motore di ricerca classico
Query Query
Queryarricchita
Utente
<<
Motore diricerca
Documenti pertinentirestituiti
Documenti restituitida un sistema classico
12
/15
Scenario applicativoIntegrazione in un sistema di raccomandazioni
Profilo, Posizione
geografica, Data
Concettipertinenti
UtenteSistema di
raccomandazioni
Prodotti/servizi pertinentirestituiti
13
/15
• Studio sui concetti di gradualità e vaghezza nella ingegneria della conoscenza;
• Membro del progetto SWOP (Semantic Web-service Opened Platform);
• Realizzazione di un algoritmo per il calcolo della similarità semantica tra frasi (SAWA);
• Sogno di diventare un ricercatore.
ProgettiIn corso...
14
/15
Grazie per l’attenzione
15
top related