edizione digitale di testi epigrafici classici e medievali daniele fusi
TRANSCRIPT
Edizione digitale di testi epigrafici classici e medievali
Daniele Fusi
http://www.fusisoft.it/
Edizione digitale
Obiettivi
Molteplici media e pubblici
unica banca dati
cd-rom o dvdsito web
chiosco musealelibri
libri elettronici
Vari livelli di specializzazione
unica banca datiepigrafia archeologia
filologia elinguisticapaleografia
livelli di fruizione
Longevità
uso di tecnologie standard indipendenza da qualsiasi particolare forma
e medium di pubblicazione dei dati elevata capacità di trasformazione dei dati,
intrinseca al progetto editoriale
Esempi di uso specialistico: sistemi esperti linguistico: software di flessione morfologica
diacronica e sincronica; lemmatizzazione automatica
metrico: software di analisi e scansione metrica di versi greci e latini; corpus metrico
paleografico: algoritmi di riconoscimento neurale, corpora paleografici interattivi
Realizzazione ed espansione
Principi generali
Semantizzazione dei contenuti
lemma
morfologia
etimo
traducente
fraseologia
opera
etc ...
Semantizzazione: usi
lemma
morfologia
etimo
traducente
fraseologia
opera
elenco alfabetico dei lemmi, diretto o inverso
elenco dei lemmi per categoria grammaticale
dizionario etimologico (elenco lemmi per radicale)
vocabolario bilingue (italiano <> greco)
ricerca per fraseologia
elenco dei luoghi citati, elenco dei lemmi per occorrenza
etc ...
ricerche combinate
lemmamorfologia
etimoopera
etc ...
Peculiarità del documento epigrafico
supporto: monumento e funzione contesto storico e materiale materiale, tecnica, forme
testo: lingua o dialetto ortografia ed ‘errori’
Ortografia e prassi editoriali
Διονύσις1. Ἀντώνιος2. Ἀντώνις
η = ι (= υ, ει, οι, υι, ηι)3. Ἀντώνης (m. -ης)
Διονύσις1. Ἀντώνιος2. Ἀντώνις
η = ι (= υ, ει, οι, υι, ηι)3. Ἀντώνης (m. -ης)
Livelli di semantizzazione del testo minimo: puro testo
A • FABIO • A • F • FABI-ANO • EQVITI
ROMANO • DECV-D RIONI • OST MQVI • VIXIT • ANNIS •XXII • M • XI • D • XX •
A • FABIVS • TROPHIMVSPATER • FECIT
nomen
Livelli di semantizzazione del testo medio: testo continuo marcato (es. XML)
A • FABIO • A • F • FABI-ANO • EQVITI
ROMANO • DECV-D RIONI • OST MQVI • VIXIT • ANNIS •XXII • M • XI • D • XX •
A • FABIVS • TROPHIMVSPATER • FECIT
abbreviazione = Aulo
titolo
numerale
<x>A</x> • <y>FABIO</y> • A • F • FABI-ANO • <z>EQVITI</z>
ROMANO • DECV-D RIONI • OST MQVI • VIXIT • ANNIS •
XXII • M • XI • D • <n>XX</n> •A • FABIVS • TROPHIMVS
PATER • FECIT
<x>A</x> • <y>FABIO</y> • A • F • FABI-ANO • <z>EQVITI</z>
ROMANO • DECV-D RIONI • OST MQVI • VIXIT • ANNIS •
XXII • M • XI • D • <n>XX</n> •A • FABIVS • TROPHIMVS
PATER • FECIT
Testo continuo marcato: vantaggi semantizzazione standardizzazione (es. XML, Unicode) testo continuo interpretabile e fungibile a
diversi livelli piattaforma di scambio, trasformabilità
Testo continuo marcato: svantaggi
nidificazione e complicazione della struttura
limite alla sovrapposizione di tag
costrizione del dato metatestuale
nomen
<ln><x>A</x> • <y>FABIO<y> • A • F • FABI-</ln><ln>ANO • <z>EQVITI</z></ln>
abbreviazione = Aulo
praenomen
patronimico
nome completo =
Aulo Fabio Auli filio Fabiano
abbreviazione = Auli
abbreviazione = filio
titolo
etc. ...
cognomen
Banca dati
non semplice testo marcato ma banca dati altamente strutturata
luogo
dati di scavo
data
bibliografiatesto
apparato
luogo: [......]
data: [......]
dati scavo: [...]
bibliogr.: [...]
testo: [...]
apparato: [...]
etc. etc.
Dal testo continuo alla banca dati
corpus
intestazione
gruppidi testi
gruppidi testi iscrizioniiscrizioni
dati identificativi
classificazione
luogo
data
dati di scavo
descr. fisica
descr. paleografica
media associati
bibliografia
commento
testo
apparato etc. ...
abcdefg hijklmno pqrstuvwxy z
...
Banca dati XML
testo ‘amorfo’ e decomposto, massima separazione forme / contenuto
struttura slegata dal testo e dettata da soli criteri semantici
dato metatestuale libero di espandersi e strutturarsi secondo le sue specificità
struttura aperta: espansione in pubblicazione (media e pubblici) e redazione (aggiunta di materiale e specializzazione)
Edizione elettronica
incluso testo XMLcontinuo (es. TEI)
indicizzazione automaticain database relazionali
unica banca dati (repertorio) XML diversi output per varimedia e pubblici
trasform
azion
e
media associati
Banca dati (repertorio) XML
conservazione dei vantaggi di XML: standardizzazione (XML, Unicode, etc.) formato di scambio flessibilità e apertura a espansione
eliminazione degli svantaggi di XML: semplificazione delle strutture (nidificazione) no limitazioni intrinseche (sovrapposizione) velocità di accesso nella pubblicazione tramite
indicizzazioni automatiche in database relazionali
Trasformazione testuale(1) repertorio strutturato
(2) preprocessing
Trasformazione testuale(1) repertorio strutturato
(2) preprocessing
(3) conversione e pubblicazione:
• medium e formati (HTML, PDF, DOC, SQL, TEI, etc.)
• risorse tipografiche (es. font)
• impaginazione tipografica
Esempi di realizzazione
Stratigrafia testuale e ramificazione
Stratificazione del testo
HPHNH testo di base come sulla pietra
EIPHNH
EN EIPHNH edd.
la pace qui va intesa...
“in pace”
... altri strati ...
strato ortografico:istruzione H > EI
strato di apparato
strato di commento
strato di traduzione
Strato ortografico: indici e ricerca doppio testo: ortografia storica (KATAKITE)
e normativa (KATAKEITAI) ricerche intelligenti:
effettuabili su ogni strato: KATAKITE = KATAKEITAI, EPYHSEN = EPOIHSEN
parametri avanzati (es. tutte le parole con I per EI, tutte le forme di KEITAI con E per AI, tutti gli errori nelle forme di KEITAI [KITE: I=EI, E=AI], ...)
creazione automatica di indici: linguistici di errori paleografici
Esempi di espansione unica struttura di banca dati, unico software
distribuito (web) di data entry e trasformazione
nuovi strati: nessi e legature prosopografia citazioni letterarie
nuovi rami (specializzazione): paleografia descrizione fisica