Applicazione di tecniche e strumenti dicomunicazione multimodale e di valutazione
della leggibilità e complessità di contenuti web
Applicazione di tecniche e strumenti dicomunicazione multimodale e di valutazione
della leggibilità e complessità di contenuti web
Tesi di Laurea di Davide CerianiTesi di Laurea di Davide Ceriani
Milano, 23 Luglio 2004
“Il potere del web sta nella sua universalità. Un aspetto essenziale è che tutti possano accedervi a prescindere dalle disabilità”
Tim Berners-Lee
Indice di presentazioneIndice di presentazione
Introduzione al tema AccessibilitàIl progetto navigAbileProject Management di navigAbileIl Dizionario di navigAbile
Un sistema di analisi di leggibilità e comprensibilità di un testoConclusioni e Future Works
Accessibilità e usabilitàAccessibilità e usabilità
Usabilità. Un sito usabile soddisfa i bisogni informativi dell’utente in modo efficace ed efficiente, fornendogli facilità di accesso e navigabilitàAccessibilità. Un sito accessibile è un ambiente multimediale in cui il contenuto informativo, le procedure di navigazione e i servizi disponibili siano pienamente fruibili da qualsiasi tipo di utente indipendentemente:
dalle sue capacità, dalla sua abilitàdalla configurazione hardware e software disponibile
Il rapporto tra queste due caratteristiche in un sito web è di fondamentale importanza per la sua corretta fruizione
AccessibilitàAccessibilità
Progettare pagine web accessibili significa:garantire a tutti gli utenti della rete la fruibilità delle informazioni e dei servizi disponibiliporre l’utente e le sue esigenze al centro dell’attenzione
Benefici non solo per i disabili, ma per chiunque utilizzi il web per lavoro o per reperire informazioniFondamentale per l’accessibilità è la separazione della forma dal contenuto: il significato di un documento deve essere salvato separatamente da come deve apparireCSSUn sito accessibile dovrebbe sfruttare i cosiddetti equivalenti multimodali
NormativaNormativa
A livello internazionale, l’ente più rappresentativo preposto alla definizione delle linee guida per il tema dell’accessibilità dei documenti web è il WAI (Web Accessibility Initiative) proposto dal W3COttenere una certificazione riconosciuta spesso non basta: con i validatori si può verificare solamente un sottoinsieme dei requisiti di accessibilità (accessibilità sostanziale e non formale)Legge Stanca (Gennaio 2004): lo scopo della legge è quello di abbattere le "barriere virtuali" che limitano l’accesso dei disabili alla Società della InformazioneLimiti della normativa: carenza di norme per la tutela dei disabili cognitivi
Perchè un sito accessibilePerchè un sito accessibile
Valore etico e sociale del progettoPossibilità di raggiungere un bacino di utenza più vasto e di conseguenza la possibilità di aumentare la propria quota di mercatoL’attenzione alla tematica sociale dell’accessibilità può costituire un vantaggio competitivo in termini di immagineIl disaccoppiamento contenuti-presentazione può aprire la strada alla portabilità del sito (su browser speciali per disabili, WAP, UMTS, PocketPC, Digitale Terrestre…)
La CAALa CAALa Comunicazione Aumentativa Alternativa è un insieme di metodi, strategie e ausili di comunicazione che servono per potenziare le capacità del soggetto di comunicareQuando una persona non può accedere ai normali mezzi espressivi (parola - scrittura), può ricorrere ad un codice alternativo per rendere trasmissibile il proprio pensieroI sistemi iconici, in sostituzione del sistema alfabetico, strutturalmente molto più complesso, per la loro facilità di comprensione del significato rappresentato, costituiscono una notevole facilitazione nell’ambito della CAAEsempi di linguaggi iconici: PCS, Bliss, PICSYM
Il progetto navigAbileIl progetto navigAbile
Un web che possa essere uno strumento di formazione e di crescita per tutti, e in particolare per i disabili in età evolutivaUn web a cui la persona disabile possa accedere in modo semplice e intuitivoUn web che si adatti al linguaggio e alle esigenze di accessibilità / navigabilità dell’utente e non viceversa
Progettare, sviluppare e validare scientificamente un’architettura abilitante per migliorare l’accessibilità del web prioritariamente ai disabili in età evolutiva, permettendo loro, attraverso l’utilizzo e l’esplorazione della Rete, di recuperare, valorizzare e potenziare le diverse abilità possedute.
LA VISION
LA MISSIONI disabili in Italia sono circa 3 milioni. Moltissimi di loro sono giovani e potenziali utenti di internet ma esclusi dal web. La vision del progetto navigAbile è quella di contribuire a realizzare un web diverso:
in partnership con:
Focus del progettoFocus del progetto
Oggi vi è una “cultura web” diffusa (soprattutto tra i giovani anche disabili) e gli ausili hanno raggiunto una ragionevole maturità. Sono invece bloccanti le barriere che riguardano il cuore del “sistema web”, ossia le caratteristiche di accessibilità di siti e portali. Da lì bisogna partire per creare un web più accessibile
Strumenti personali - ausili e strumentazione
HW e SW (e.g. tastiere e mouse
speciali)
Caratteristiche di accessibilità
sito/portale: sono le “rampe di
accesso elettroniche” per il
web
Formazione e
“cultura web”
Servizi futuri
Servizio
Servizio
Servizio
Focus del progetto navigAbile
I servizi di navigAbileI servizi di navigAbile
Servizio I Requisiti dell’Evoluzione navigAbile
Servizi di Registrazione e Profilazione
Il servizio di registrazione e profilazione deve permettere di raccogliere anche informazioni rispetto alle esigenze di accessibilità dell’utente
Servizi di Personalizzazione e Navigazione:
I contenuti devono essere presentati nel modo più adatto all’utente fornendo on-line, dove possibile, il supporto necessario per la navigazione e la fruizione degli stessi da parte di tutti
Servizi di Gestione dei Contenuti:
I servizi redazionali devono mettere in condizione i “redattori” di fornire contenuti altamente accessibili e disponibili in versioni alternative
Servizio
Servizio
Servizio
Risultati del progettoRisultati del progetto
Servizi architetturali: navigAbile è innanzitutto un’architettura orientata ai servizi (SOA). Servizi di base:
Semplificazione struttura e contenuti: esistono 3 livelli di semplificazione dei contenuti: Basic, Easy, StandardDizionario multimodaleTabella di comunicazione
Sito dedicato di navigAbile (www.navigabile.it): è nato per tre esigenze diverse:
Sottoporre a test i servizi architetturali, realizzando un primo esempio di applicazione che li mostrasse in azioneApplicare i servizi navigAbile a un contesto semplice ma realistico di un sito di informazioneMettere a disposizione agli utenti coinvolti nella sperimentazione alcuni servizi web accessibili, quali la bacheca o le news
L’architetturaL’architettura
Obiettivi dell’architettura SOA:
Non ghettizzazioneServizi condivisibiliNon invasivitàSemplicità d’usoProfilazione e personalizzazioneFlessibilità
Project ManagementProject Management
Si possono individuare tre componenti fondamentali che hanno caratterizzato il project management di navigAbile:
Interdisciplinarietà: competenze distribuite tra diversi attoriSpecificità del testing: valutazione dell’esperienza della coppia utente-tutorValidazione scientifica sulla base dei risultati del testing
Planning secondo la logica del “think big, start small, scale fast”
Il dizionario di navigAbileIl dizionario di navigAbile
FORMA_FLESSA: la tabella che contiene tutte le forme flesse dei lemmi della lingua italiana. Ad esempio per il lemma “andare” sono presenti le forme flesse: “vado”, “vai”, etc. Per ogni forma flessa è presente una tag grammaticale che permette di ottenere la forma flessa a partire dal lemma origineLEMMA: contiene tutti i lemmi della lingua italiana. I lemmi uguali hanno lo stesso attributo “LINK_LEMMA” che viene usato per la relazione con la tabella “FORMA_FLESSA”. L’attributo “VDB_INFO” codifica l’appartenenza o meno al Vocabolario di Base di De Mauro
FORMA_FLESSA
PK,FK1 ID
VOCABOLO CD_TAG_GRAMMATICALEFK1 LINK_LEMMA
LEMMA
PK ID
FK2 LEMMA_ORIGINEFK1 LINK_LEMMA CD_CATEGORIA_GRAMMATICALE CD_FORMA VDB_INFO ID_CATEGORIA ID_CATEGORIA_PADRE URL_PCS URL_BLISS URL_PICSYM URL_IMMAGINE_GENERICA URL_ANIMAZIONE URL_SUONO_PREREG PCS_VISIBLE
SINONIMI
PK ID
ID_LEMMA SINONIMO ID_GRUPPO
DESCRIZIONI
PK ID
LEMMA SILLABAZIONE ETIMOLOGIA CATEGORIA GRAMMATICALE ID1 ID2 DESCRIZIONE
Scenari di utilizzo del dizionarioScenari di utilizzo del dizionario
Navigazione visuale del dizionario:Per categoriePer ordine alfabetico
Supporto al calcolo degli indici di comprensibilità e leggibilità di un testoVisualizzazione dei dettagli di una voce del dizionario (con tabella DESCRIZIONI)Contiene le informazioni per l’analisi sintattica. Ogni lemma ha nei suoi attributi delle informazioni che specificano la sua categoria grammaticale.Servizio di suggerimento dei sinonimi (thesaurus) più comprensibili (con tabella SINONIMI)
Leggibilità e comprensibilitàLeggibilità e comprensibilità
Entrambe intuitivamente sono legate alla facilità con cui si riesce a catturare l’informazione presente in un testoLeggibilità
VisivaLinguistica
La leggibilità linguistica di un testo dipende dal modo in cui sono strutturate le sue frasi: periodi brevi che contengono parole brevi sono più leggibili di frasi lunghe, così come frasi lineari sono più leggibili di frasi involute, ricche di incisi e subordinateLa comprensibilità di un testo dipende dalle parole che contiene, ma anche dalla condivisione di un universo culturale: gli specialisti di un settore specifico si comprendono perché condividono un contesto comune
Analisi della comprensibilità:il Vocabolario di Base di De Mauro
Analisi della comprensibilità:il Vocabolario di Base di De Mauro
Il Vocabolario di Base della lingua italiana (VdB) di Tullio De Mauro, pubblicato nel 1997, è un elenco dei lemmi più comuni, elaborato prevalentemente secondo criteri statisticiI lemmi del VdB sono classificati in tre livelli:
Vocabolario fondamentale: circa 2000 lemmi: sono i più frequenti in assoluto della nostra linguaVocabolario di alto uso: i successivi 2.750 lemmi dell'insieme preso dal LIF (Lessico di frequenza della lingua italiana contemporanea)Vocabolario di alta disponibilità: 2.350 lemmi determinati in vario modo, soprattutto con dizionari dell'italiano comune
L’indicatore di comprensibilità di navigAbile
L’indicatore di comprensibilità di navigAbile
L’indicatore di comprensibilità si basa sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del Vocabolario di Base di Tullio De Mauro e fornisce un’indicazione quantitativa sulla comprensibilità delle parole del testo, sulla base delle scelte lessicali dell’autore.
Nf: numero lemmi del VdB fondamentaleNu: numero lemmi del VdB ad alto usoNd: numero lemmi del VdB ad alta
disponibilitàN: numero totale di lemmi=1, =0.75, =0.5
100
N
NNNI dufCOMP
Analisi di leggibilità: GulpeaseAnalisi di leggibilità: Gulpease
Un indice di leggibilità è una formula matematica che, attraverso un calcolo statistico, è in grado di predire la reale difficoltà di un testo in base a una scala predefinita di valori, dipendente dal grado di istruzione del lettoreLa formula per il calcolo dell’Indice Gulpease è stata determinata verificando con una serie di test la reale comprensibilità di un corpus di testi I limiti di questo indicatore stanno nella sua parzialità: non tiene conto infatti della struttura sintattica della frase, che è un elemento fondamentale che determina la complessità della frase
P
F
P
LG N
N
N
NI 3001089
NL: numero di lettereNP: numero di paroleNF: numero di frasi
Un nuova metodologia per la valutazione della leggibilità con strumenti di analisi sintattica
Un nuova metodologia per la valutazione della leggibilità con strumenti di analisi sintattica
Parser chunk-IT: è uno shallow parser RobustezzaEsistono 10 tipi di chunk per l’italiano:
Chunk nominale: “la mia casa”Chunk preposizionale: “di mio figlio”Chunk verbale “rimangono”Altri tipi: aggettivo, avverbio, gerundio, infinito, participio, predicato, subordinato
Esempio di frase divisa in chunk:“A Milano, una speciale squadra ripulirà la città dai graffiti.”“A Milano”P_C “una speciale squadra”N_C “ripulirà”FV_C “la città”N_C “dai graffiti”P_C
Possibili impieghi del parser:Calcolo leggibilitàDisambiguazione lemmiKeyword extractionAnalisi delle concordanze
L’indicatore di leggibilità propostoL’indicatore di leggibilità proposto
La metodologia introdotta per la valutazione della leggibilità mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintatticaIntroduzione di un nuovo indicatore ottenuto come media (eventualmente pesata) di una serie di features:
Numero medio di parole per fraseNumero medio di lettere per fraseNumero medio di chunk per fraseDistribuzione delle tipologie di chunk
I pesi sono stati ricavati con criteri statistici sulla base di un corpus di testi semplificati, validati da un team di linguisti
TCGLEGG IcIbIaI
1
100
F
C
C
N
NI
C
T
iii
T N
NwkI
1
Numero medio di chunk per frase
Peso del chunk di tipo i-esimo
Numero di chunk del tipo i-esimo
Lo schema del sistema di analisiLo schema del sistema di analisi
L’insieme di questi due indicatori consente di avere una comparazione quantitativa tra diversi testi e quindi in particolare, nell’ambito del progetto navigAbile, permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia
Conclusioni sull’accessibilitàConclusioni sull’accessibilitàRiassumendo possiamo individuare due strategie principali per affrontare il problema dell’accessibilità dei portali web:
Impiego di versioni paralleleDesign for All: prevede l’impiego di una sola versione che deve tener conto dei bisogni e delle esigenze di tutti gli utenti a cui è rivolto il portale
navigAbile propone una soluzione che unisce i pregi dei due approcci, attraverso la profilazione e personalizzazione, che permettono una presentazione dei contenuti che si adatta alle abilità e alle esigenze dell’utenteCon la condivisione dei servizi si ha una riduzione dei costi legati all’accessibilità dei portali che utilizzano i servizi di navigabile
Nuovo metodo di valutazione di leggibilità e comprensibilitàValutazione comprensibilità: basata sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del VdBValutazione leggibilità: l’indicatore proposto mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintattica, ottenute attraverso uno shallow parser
Comparazione quantitativa che permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia.Notevole valore aggiunto per navigAbile, che ha come obiettivo primario il raggiungimento della massima fruibilità dell’informazione da parte di tutte le tipologie di utenti
Conclusioni sull’analizzatore di comprensibilità e leggibilità
Conclusioni sull’analizzatore di comprensibilità e leggibilità
Analisi dei 2 indici
Future worksFuture worksIpotesi di attribuzione dei pesi per il calcolo dell’indice di leggibilità complessivo, e relativa validazione, eventualmente effettuata con diverse categorie di utentiIpotesi alternativa di attribuzione dei pesi dell’indicatore di leggibilità, basata sulle probabilità condizionate di concatenamento di chunk consecutiviComponente architetturale per l’estrazione delle keywordsSfruttamento del parser per l’analisi delle concordanzeComponenti architetturali per la gestione del BlissWord Predictor da integrare nel compositore frasi