EDIzIONE EPIGRAFICA DIGITALE DI TESTI GRECI E LATINI: … · EDIZIONE EPIgRAFICA DIgItAlE DI tEStI...

43
121 EDIZIONE EPIGRAFICA DIGITALE DI TESTI GRECI E LATINI: DAL TESTO MARCATO ALLA BANCA DATI Daniele Fusi * Obiettivi di questa edizione Negli ultimi anni si vanno moltiplicando i progetti di edizioni elettroniche di materiale classico, sia esso letterario, papiraceo o epigrafico; in quest’ultimo campo, benché a partire dai fondamen- tali inquadramenti di Krummrey-Panciera 1 siano stati definiti gli in- dispensabili criteri editoriali, le realizzazioni concrete di edizioni elettroniche e i semplici progetti appaiono ancora alquanto vari e diseguali, sia nel materiale preso in esame che nella sua struttu- razione sul piano della tecnologia dell’informazione. Nondimeno, ognuno di questi progetti indipendentemente dal suo livello di at- tuazione può apportare un contributo alla definizione di una qual- che base comune che renda possibile una loro futura integrazione, sicché nessuno degli sforzi compiuti per ogni progetto debba an- dare perduto o rimanere isolato nel suo ambito senza possibilità di dialogo con altri sistemi. Con il mio progetto, che in realtà rientra nell’ambito di un sistema integrato di processi e strutturazione dei dati messi in campo per iniziative editoriali di tipo sia accademico che commer- ciale, non intendo affatto definire un modo univoco di strutturare e gestire l’informazione relativa ai testi epigrafici o proporre stan- dard alternativi ai pochi che fortunatamente si vanno affermando, come quelli basati su dialetti di XML come TEI e in particolare EpiDoc. Piuttosto, mi interessa in questa sede offrire un contributo per illuminare i diversi punti di vista relativi all’edizione digitale e ancor prima alla strutturazione di materiale che proprio nella va- rietà dei suoi aspetti riguarda da vicino diversi campi di studio al di là dell’epigrafia in senso stretto: archeologia, paleografia, storia, filologia, linguistica, ecc., e che in virtù di questa ampia fungibilità deve potersi configurare in primo luogo come strumento di lavoro, * [email protected] 1 Krummery - Panciera 1980, pp. 205-15.

Transcript of EDIzIONE EPIGRAFICA DIGITALE DI TESTI GRECI E LATINI: … · EDIZIONE EPIgRAFICA DIgItAlE DI tEStI...

121

EDIzIONE EPIGRAFICA DIGITALE DI TESTI GRECI E LATINI DAL TESTO MARCATO ALLA bANCA DATI

Daniele Fusi

Obiettivi di questa edizione

Negli ultimi anni si vanno moltiplicando i progetti di edizioni elettroniche di materiale classico sia esso letterario papiraceo o epigrafico in questrsquoultimo campo bencheacute a partire dai fondamen-tali inquadramenti di Krummrey-Panciera1 siano stati definiti gli in-dispensabili criteri editoriali le realizzazioni concrete di edizioni elettroniche e i semplici progetti appaiono ancora alquanto vari e diseguali sia nel materiale preso in esame che nella sua struttu-razione sul piano della tecnologia dellrsquoinformazione Nondimeno ognuno di questi progetti indipendentemente dal suo livello di at-tuazione puograve apportare un contributo alla definizione di una qual-che base comune che renda possibile una loro futura integrazione siccheacute nessuno degli sforzi compiuti per ogni progetto debba an-dare perduto o rimanere isolato nel suo ambito senza possibilitagrave di dialogo con altri sistemi

Con il mio progetto che in realtagrave rientra nellrsquoambito di un sistema integrato di processi e strutturazione dei dati messi in campo per iniziative editoriali di tipo sia accademico che commer-ciale non intendo affatto definire un modo univoco di strutturare e gestire lrsquoinformazione relativa ai testi epigrafici o proporre stan-dard alternativi ai pochi che fortunatamente si vanno affermando come quelli basati su dialetti di XML come TEI e in particolare EpiDoc Piuttosto mi interessa in questa sede offrire un contributo per illuminare i diversi punti di vista relativi allrsquoedizione digitale e ancor prima alla strutturazione di materiale che proprio nella va-rietagrave dei suoi aspetti riguarda da vicino diversi campi di studio al di lagrave dellrsquoepigrafia in senso stretto archeologia paleografia storia filologia linguistica ecc e che in virtugrave di questa ampia fungibilitagrave deve potersi configurare in primo luogo come strumento di lavoro

fusidanieletiscaliit1 Krummery - Panciera 1980 pp 205-15

122

DANIElE FuSI

un punto di partenza piuttosto che di arrivo per gli studiosiIn questo ambito il progetto qui presentato nasce anzitutto

nella prospettiva del filologo e dellrsquoinformatico ed egrave fortemente improntato da una decisa separazione tra i contenuti e la loro presentazione basata sulla nozione chiave della trasformazione un unico contenuto altamente strutturato dal punto di vista se-mantico puograve assumere forme potenzialmente infinite sia riguardo alla selezione e allrsquoordinamento del materiale che al suo formato elettronico La trasformazione di questo contenuto si adatteragrave di volta in volta ai diversi tipi di pubblico dellrsquoopera (che puograve variare dal visitatore occasionale di un museo allo studente fino allo stu-dioso di professione) come ai diversi media in cui essa puograve essere pubblicata (CD-ROM o dvd siti web libri cartacei o elettronici chioschi multimediali ecc)

Inoltre il medesimo contenuto deve poter essere espandibile non solo in senso quantitativo (con lrsquoaggiunta di nuovo materiale) ma anche in senso qualitativo consentendo cioegrave lrsquoaggiunta allrsquoin-formazione preesistente di informazione specializzata magari nel senso di una specifica disciplina di studi Questrsquoultimo requisito risulta particolarmente rilevante specie in ambito epigrafico dove la quantitagrave di materiale e il suo interesse per numerose altre discipline (filologia linguistica storia archeologia paleografia ecc) egrave tale da rendere indispensabile ottimizzare le risorse investite in unrsquoedizio-ne consentendo in massimo grado il riuso dellrsquoinformazione esi-stente e la sua adattabilitagrave in qualsiasi particolare direzione

Lrsquoedizione progettata deve quindi essere anzitutto unica per tutti i media pubblici e diversi campi di specializzazione cui ci si desideri riferire consentendo cosigrave una sua gestione centralizzata indipendente dalla sua pubblicazione in un ambito specifico in tal modo si minimizza lo sforzo di manutenzione dellrsquoinformazione che rimane unica bencheacute votata a diverse edizioni Ciograve naturalmente implica che lrsquoinformazione risulti quanto piugrave possibile autonoma e astratta da una qualsiasi veste specifica che finirebbe inevitabilmen-te per condizionare i suoi impieghi e limitare la sua espandibilitagrave in questo senso la netta separazione fra lrsquounico contenuto e le di-verse forme in cui potenzialmente esso si puograve incarnare richiede un sistema profondamente votato alla trasformazione dinamica della sua informazione ovvero unrsquoattenta progettazione della sua strut-tura e la creazione di numerosi strumenti software realizzati ad hoc per gestire immissione modifica e conversione dei dati in qualsiasi direzione Non si tratta quindi di assumere a modello alcuna spe-cifica forma finale di edizione e sulla sua base arricchire un testo epigrafico della necessaria informazione metatestuale ad esempio

12

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

imitando una scheda epigrafica con un testo variamente marcato da tag piuttosto si intende creare qui una vera banca dati nel senso piugrave generico del termine dove lrsquoinformazione egrave strutturata in modo da isolare ogni elemento semanticamente diverso in un suo conte-nitore separato con una sorta di scomposizione della tradizionale scheda epigrafica fino agli atomi dei suoi componenti costitutivi Questa informazione elementare cosigrave atomizzata e classificata potragrave poi essere ricomposta in modo automatico e dinamico in qualsiasi forma specifica richiesta dal particolare tipo di edizione formato elettronico medium e pubblico cui ci si intenda riferire

La trasformazione come dote intrinseca del progetto editoria-le egrave inoltre parte dellrsquoindispensabile attenzione alla longevitagrave del-lrsquoopera che si intende realizzare non egrave infatti raro il caso di opere digitali concepite solo pochi anni fa eppure giagrave rese obsolete non solo dallrsquoavanzare delle tecnologie fatto comunque inevitabile sul medio e lungo periodo ma anche e soprattutto dalla loro eccessi-va peculiaritagrave nella strutturazione e codifica del testo Persino nel campo dellrsquoeditoria commerciale infatti puograve accadere che la versio-ne digitale di opere stampate pochi anni fa risulti oggi addirittura indecifrabile costringendo a complessi sforzi di analisi e riconver-sione percheacute realizzata magari con lrsquoausilio di codifiche proprieta-rie ideate ad hoc per quella data opera e gli strumenti informatici dellrsquoepoca Se non egrave dunque possibile (neacute drsquoaltronde auspicabile) che le tecnologie impiegate oggi rimangano immutate nonostante i rapidissimi mutamenti dellrsquoorizzonte informatico egrave perograve necessario adoperare ogni sforzo nellrsquoideazione e realizzazione di opere digita-li di portata cosigrave ampia come quelle di testi epigrafici o letterari in modo che in un futuro non troppo remoto sia possibile riconvertirle facilmente piuttosto che abbandonarle allrsquoobsolescenza A questo scopo accanto alla capacitagrave di trasformazione e alla complementare tendenza alla massima separazione possibile dellrsquounico contenuto dalle sue molteplici forme occorre basare lrsquoopera digitale su stan-dard ampiamente diffusi e affermati per i quali sussiste la garanzia di unrsquoadeguata documentazione e dotazione di software capace di trattarli per gli scopi dellrsquoedizione come in futuro di convertirli in altre tecnologie

Specificitagrave dellrsquoedizione digitale

In termini piugrave semplici si puograve meglio intendere la natura di questo progetto a partire da alcuni banali esempi concreti nel cam-po dellrsquoeditoria elettronica specie italiana spesso accade che opere

12

DANIElE FuSI

tradizionalmente edite su carta ricevano una veste elettronica di solito ancillare rispetto alla loro veste originaria come ad esempio per dizionari repertori testuali o altre opere di consultazione Tutta-via non egrave raro constatare come in questi casi lrsquoedizione elettronica finisca per ridursi a un mero clone di quella cartacea trasposta piugrave o meno identica dal medium del libro tradizionale a quello del CD-ROM o dvd accade persino che si offra la semplice versione elettro-nica del testo stampato aggiungendo magari qualche funzione di ricerca a tutto testo o qualche contenuto multimediale senza tenere in alcun conto la specificitagrave del medium elettronico

Un testo stampato infatti necessariamente offre solo un limita-to numero di modi di accedere allrsquoinformazione in esso contenuta che viene predisposta dallrsquoautore in un certo ordine con una certa selezione e una specifica veste tipografica magari aggiungendo a corredo diversi indici per la consultazione sigrave da consentire un uso piugrave diversificato dellrsquoopera Per quanta cura si possa mettere in tali operazioni egrave comunque inevitabile che il ventaglio degli usi con-sentiti da una simile opera rimanga intrinsecamente limitato dalla forma in cui essa si egrave incarnata per la stampa Per fare un esempio banale lrsquoedizione di un corpus testuale puograve contenere un indice di antroponimi toponimi o altri aspetti ritenuti notevoli per una qualsiasi disciplina (letteratura storia geografia prosopografia ar-cheologia religione linguistica ecc) consentendo cosigrave di fruire dellrsquoopera in modi diversi corrispondenti agli intenti del suo utente ma quando un particolare tipo di indice manchi lo strumento offer-to da tale edizione saragrave di fatto praticamente inutile a meno di non effettuare una faticosa ricerca manuale al suo interno tanto meno fattibile quanto piugrave lrsquoopera risulti voluminosa In tal caso lrsquoutente potragrave rivolgersi magari a edizioni specializzate laddove esse siano disponibili o integrare lrsquoinformazione incrociando i dati provenienti da altre edizioni ma egrave comunque evidente che tali operazioni ri-chiederanno molto tempo quando pure esse risultino possibili in base al materiale disponibile

In questo senso unrsquoedizione elettronica che si limiti a ripro-durre in toto quella cartacea o in altri termini la stessa edizio-ne cartacea trasportata su un medium diverso puograve certo offrire un minimo vantaggio consentendo se non altro ricerche a tutto testo sullrsquointero contenuto dellrsquoopera allo stesso modo in cui egrave ovviamente piugrave facile trovare tutte le occorrenze di una parola in un testo digitale piuttosto che sfogliando le pagine della sua forma stampata Tuttavia egrave facile comprendere come una simile trasposizione dei contenuti in un altro medium non costituisca propriamente una vera opera digitale nella misura in cui essa

125

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

condivide con la cartacea le stesse limitazioni strutturali che sia infatti piugrave semplice cercare una parola al suo interno dipende semplicemente dalla diversitagrave del medium ma rimane il fatto che entrambe le edizioni mostrano unici ordinamenti selezioni in-dicizzazioni e forme di presentazione dei dati che lrsquoutente non puograve in alcun modo alterare a posteriori in altri termini entrambe le edizioni in seacute dicono sempre la stessa cosa e lo fanno sempre nello stesso modo secondo la vecchia accusa mossa da Platone alla parola scritta Se poi si pensa a testi piugrave complessi come vo-cabolari o anche schede epigrafiche egrave ovvio che anche la ricerca a tutto testo perderagrave molta della sua utilitagrave applicandosi indistin-tamente a una lunga e amorfa sequenza di parole senza possibi-litagrave di distinguere cosa al suo interno rappresenti nel caso di un vocabolario lemma traducente citazione paradigma spiegazione etimo ecc o nel caso di una scheda epigrafica classificazione col-locazione storica e geografica testo apparato commento ecc La consultazione di un tale vocabolario elettronico diverrebbe quindi pressocheacute infruttuosa dato che non sarebbe possibile limitare la ricerca a un ambito semantico specifico (ricerca per lemma ricerca per traducente ricerca per citazione etc) allrsquointerno dellrsquoindistin-to flusso di parole che costituisce il suo testo Qualora invece in questo flusso indistinto di parole si individui in modo univoco ogni porzione rilevante di testo secondo il proprio ruolo seman-tico (quanto rappresenta il lemma lrsquoetimologia la morfologia il traducente la fraseologia ecc) diverragrave subito possibile utilizzare questo unico contenuto per molteplici scopi e in molteplici forme ad esempio si potranno generare automaticamente elenchi alfabe-tici (diretti o inversi) dei lemmi o raggruppamenti di lemmi per categoria morfologica o attestazione in una data opera autore o contesto o anche realizzare sempre in modo del tutto automati-co un rudimentale vocabolario bilingue semplicemente estraendo tutti i traducenti in un elenco alfabetico con il rimando al relativo lemma Lrsquoutente dellrsquoedizione digitale potragrave inoltre effettuare ri-cerche combinate anche molto complesse ad esempio per trova-re tutti i lemmi inizianti con determinate lettere appartenenti a determinate categorie morfologiche riconducibili alla medesima radice attestati in determinati autori eo opere ecc egrave insomma evidente che in tal modo le possibilitagrave di consultazione di una simile edizione risulteranno subito virtualmente infinite fornendo uno strumento assai piugrave utile di una mera trasposizione digitale di unrsquoopera concepita su carta Puograve certo accadere che siano di fatto edite come opere elettroniche mere trasposizioni su cd o dvd di testi pubblicati a stampa ignorando completamente le spe-

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

122

DANIElE FuSI

un punto di partenza piuttosto che di arrivo per gli studiosiIn questo ambito il progetto qui presentato nasce anzitutto

nella prospettiva del filologo e dellrsquoinformatico ed egrave fortemente improntato da una decisa separazione tra i contenuti e la loro presentazione basata sulla nozione chiave della trasformazione un unico contenuto altamente strutturato dal punto di vista se-mantico puograve assumere forme potenzialmente infinite sia riguardo alla selezione e allrsquoordinamento del materiale che al suo formato elettronico La trasformazione di questo contenuto si adatteragrave di volta in volta ai diversi tipi di pubblico dellrsquoopera (che puograve variare dal visitatore occasionale di un museo allo studente fino allo stu-dioso di professione) come ai diversi media in cui essa puograve essere pubblicata (CD-ROM o dvd siti web libri cartacei o elettronici chioschi multimediali ecc)

Inoltre il medesimo contenuto deve poter essere espandibile non solo in senso quantitativo (con lrsquoaggiunta di nuovo materiale) ma anche in senso qualitativo consentendo cioegrave lrsquoaggiunta allrsquoin-formazione preesistente di informazione specializzata magari nel senso di una specifica disciplina di studi Questrsquoultimo requisito risulta particolarmente rilevante specie in ambito epigrafico dove la quantitagrave di materiale e il suo interesse per numerose altre discipline (filologia linguistica storia archeologia paleografia ecc) egrave tale da rendere indispensabile ottimizzare le risorse investite in unrsquoedizio-ne consentendo in massimo grado il riuso dellrsquoinformazione esi-stente e la sua adattabilitagrave in qualsiasi particolare direzione

Lrsquoedizione progettata deve quindi essere anzitutto unica per tutti i media pubblici e diversi campi di specializzazione cui ci si desideri riferire consentendo cosigrave una sua gestione centralizzata indipendente dalla sua pubblicazione in un ambito specifico in tal modo si minimizza lo sforzo di manutenzione dellrsquoinformazione che rimane unica bencheacute votata a diverse edizioni Ciograve naturalmente implica che lrsquoinformazione risulti quanto piugrave possibile autonoma e astratta da una qualsiasi veste specifica che finirebbe inevitabilmen-te per condizionare i suoi impieghi e limitare la sua espandibilitagrave in questo senso la netta separazione fra lrsquounico contenuto e le di-verse forme in cui potenzialmente esso si puograve incarnare richiede un sistema profondamente votato alla trasformazione dinamica della sua informazione ovvero unrsquoattenta progettazione della sua strut-tura e la creazione di numerosi strumenti software realizzati ad hoc per gestire immissione modifica e conversione dei dati in qualsiasi direzione Non si tratta quindi di assumere a modello alcuna spe-cifica forma finale di edizione e sulla sua base arricchire un testo epigrafico della necessaria informazione metatestuale ad esempio

12

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

imitando una scheda epigrafica con un testo variamente marcato da tag piuttosto si intende creare qui una vera banca dati nel senso piugrave generico del termine dove lrsquoinformazione egrave strutturata in modo da isolare ogni elemento semanticamente diverso in un suo conte-nitore separato con una sorta di scomposizione della tradizionale scheda epigrafica fino agli atomi dei suoi componenti costitutivi Questa informazione elementare cosigrave atomizzata e classificata potragrave poi essere ricomposta in modo automatico e dinamico in qualsiasi forma specifica richiesta dal particolare tipo di edizione formato elettronico medium e pubblico cui ci si intenda riferire

La trasformazione come dote intrinseca del progetto editoria-le egrave inoltre parte dellrsquoindispensabile attenzione alla longevitagrave del-lrsquoopera che si intende realizzare non egrave infatti raro il caso di opere digitali concepite solo pochi anni fa eppure giagrave rese obsolete non solo dallrsquoavanzare delle tecnologie fatto comunque inevitabile sul medio e lungo periodo ma anche e soprattutto dalla loro eccessi-va peculiaritagrave nella strutturazione e codifica del testo Persino nel campo dellrsquoeditoria commerciale infatti puograve accadere che la versio-ne digitale di opere stampate pochi anni fa risulti oggi addirittura indecifrabile costringendo a complessi sforzi di analisi e riconver-sione percheacute realizzata magari con lrsquoausilio di codifiche proprieta-rie ideate ad hoc per quella data opera e gli strumenti informatici dellrsquoepoca Se non egrave dunque possibile (neacute drsquoaltronde auspicabile) che le tecnologie impiegate oggi rimangano immutate nonostante i rapidissimi mutamenti dellrsquoorizzonte informatico egrave perograve necessario adoperare ogni sforzo nellrsquoideazione e realizzazione di opere digita-li di portata cosigrave ampia come quelle di testi epigrafici o letterari in modo che in un futuro non troppo remoto sia possibile riconvertirle facilmente piuttosto che abbandonarle allrsquoobsolescenza A questo scopo accanto alla capacitagrave di trasformazione e alla complementare tendenza alla massima separazione possibile dellrsquounico contenuto dalle sue molteplici forme occorre basare lrsquoopera digitale su stan-dard ampiamente diffusi e affermati per i quali sussiste la garanzia di unrsquoadeguata documentazione e dotazione di software capace di trattarli per gli scopi dellrsquoedizione come in futuro di convertirli in altre tecnologie

Specificitagrave dellrsquoedizione digitale

In termini piugrave semplici si puograve meglio intendere la natura di questo progetto a partire da alcuni banali esempi concreti nel cam-po dellrsquoeditoria elettronica specie italiana spesso accade che opere

12

DANIElE FuSI

tradizionalmente edite su carta ricevano una veste elettronica di solito ancillare rispetto alla loro veste originaria come ad esempio per dizionari repertori testuali o altre opere di consultazione Tutta-via non egrave raro constatare come in questi casi lrsquoedizione elettronica finisca per ridursi a un mero clone di quella cartacea trasposta piugrave o meno identica dal medium del libro tradizionale a quello del CD-ROM o dvd accade persino che si offra la semplice versione elettro-nica del testo stampato aggiungendo magari qualche funzione di ricerca a tutto testo o qualche contenuto multimediale senza tenere in alcun conto la specificitagrave del medium elettronico

Un testo stampato infatti necessariamente offre solo un limita-to numero di modi di accedere allrsquoinformazione in esso contenuta che viene predisposta dallrsquoautore in un certo ordine con una certa selezione e una specifica veste tipografica magari aggiungendo a corredo diversi indici per la consultazione sigrave da consentire un uso piugrave diversificato dellrsquoopera Per quanta cura si possa mettere in tali operazioni egrave comunque inevitabile che il ventaglio degli usi con-sentiti da una simile opera rimanga intrinsecamente limitato dalla forma in cui essa si egrave incarnata per la stampa Per fare un esempio banale lrsquoedizione di un corpus testuale puograve contenere un indice di antroponimi toponimi o altri aspetti ritenuti notevoli per una qualsiasi disciplina (letteratura storia geografia prosopografia ar-cheologia religione linguistica ecc) consentendo cosigrave di fruire dellrsquoopera in modi diversi corrispondenti agli intenti del suo utente ma quando un particolare tipo di indice manchi lo strumento offer-to da tale edizione saragrave di fatto praticamente inutile a meno di non effettuare una faticosa ricerca manuale al suo interno tanto meno fattibile quanto piugrave lrsquoopera risulti voluminosa In tal caso lrsquoutente potragrave rivolgersi magari a edizioni specializzate laddove esse siano disponibili o integrare lrsquoinformazione incrociando i dati provenienti da altre edizioni ma egrave comunque evidente che tali operazioni ri-chiederanno molto tempo quando pure esse risultino possibili in base al materiale disponibile

In questo senso unrsquoedizione elettronica che si limiti a ripro-durre in toto quella cartacea o in altri termini la stessa edizio-ne cartacea trasportata su un medium diverso puograve certo offrire un minimo vantaggio consentendo se non altro ricerche a tutto testo sullrsquointero contenuto dellrsquoopera allo stesso modo in cui egrave ovviamente piugrave facile trovare tutte le occorrenze di una parola in un testo digitale piuttosto che sfogliando le pagine della sua forma stampata Tuttavia egrave facile comprendere come una simile trasposizione dei contenuti in un altro medium non costituisca propriamente una vera opera digitale nella misura in cui essa

125

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

condivide con la cartacea le stesse limitazioni strutturali che sia infatti piugrave semplice cercare una parola al suo interno dipende semplicemente dalla diversitagrave del medium ma rimane il fatto che entrambe le edizioni mostrano unici ordinamenti selezioni in-dicizzazioni e forme di presentazione dei dati che lrsquoutente non puograve in alcun modo alterare a posteriori in altri termini entrambe le edizioni in seacute dicono sempre la stessa cosa e lo fanno sempre nello stesso modo secondo la vecchia accusa mossa da Platone alla parola scritta Se poi si pensa a testi piugrave complessi come vo-cabolari o anche schede epigrafiche egrave ovvio che anche la ricerca a tutto testo perderagrave molta della sua utilitagrave applicandosi indistin-tamente a una lunga e amorfa sequenza di parole senza possibi-litagrave di distinguere cosa al suo interno rappresenti nel caso di un vocabolario lemma traducente citazione paradigma spiegazione etimo ecc o nel caso di una scheda epigrafica classificazione col-locazione storica e geografica testo apparato commento ecc La consultazione di un tale vocabolario elettronico diverrebbe quindi pressocheacute infruttuosa dato che non sarebbe possibile limitare la ricerca a un ambito semantico specifico (ricerca per lemma ricerca per traducente ricerca per citazione etc) allrsquointerno dellrsquoindistin-to flusso di parole che costituisce il suo testo Qualora invece in questo flusso indistinto di parole si individui in modo univoco ogni porzione rilevante di testo secondo il proprio ruolo seman-tico (quanto rappresenta il lemma lrsquoetimologia la morfologia il traducente la fraseologia ecc) diverragrave subito possibile utilizzare questo unico contenuto per molteplici scopi e in molteplici forme ad esempio si potranno generare automaticamente elenchi alfabe-tici (diretti o inversi) dei lemmi o raggruppamenti di lemmi per categoria morfologica o attestazione in una data opera autore o contesto o anche realizzare sempre in modo del tutto automati-co un rudimentale vocabolario bilingue semplicemente estraendo tutti i traducenti in un elenco alfabetico con il rimando al relativo lemma Lrsquoutente dellrsquoedizione digitale potragrave inoltre effettuare ri-cerche combinate anche molto complesse ad esempio per trova-re tutti i lemmi inizianti con determinate lettere appartenenti a determinate categorie morfologiche riconducibili alla medesima radice attestati in determinati autori eo opere ecc egrave insomma evidente che in tal modo le possibilitagrave di consultazione di una simile edizione risulteranno subito virtualmente infinite fornendo uno strumento assai piugrave utile di una mera trasposizione digitale di unrsquoopera concepita su carta Puograve certo accadere che siano di fatto edite come opere elettroniche mere trasposizioni su cd o dvd di testi pubblicati a stampa ignorando completamente le spe-

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

12

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

imitando una scheda epigrafica con un testo variamente marcato da tag piuttosto si intende creare qui una vera banca dati nel senso piugrave generico del termine dove lrsquoinformazione egrave strutturata in modo da isolare ogni elemento semanticamente diverso in un suo conte-nitore separato con una sorta di scomposizione della tradizionale scheda epigrafica fino agli atomi dei suoi componenti costitutivi Questa informazione elementare cosigrave atomizzata e classificata potragrave poi essere ricomposta in modo automatico e dinamico in qualsiasi forma specifica richiesta dal particolare tipo di edizione formato elettronico medium e pubblico cui ci si intenda riferire

La trasformazione come dote intrinseca del progetto editoria-le egrave inoltre parte dellrsquoindispensabile attenzione alla longevitagrave del-lrsquoopera che si intende realizzare non egrave infatti raro il caso di opere digitali concepite solo pochi anni fa eppure giagrave rese obsolete non solo dallrsquoavanzare delle tecnologie fatto comunque inevitabile sul medio e lungo periodo ma anche e soprattutto dalla loro eccessi-va peculiaritagrave nella strutturazione e codifica del testo Persino nel campo dellrsquoeditoria commerciale infatti puograve accadere che la versio-ne digitale di opere stampate pochi anni fa risulti oggi addirittura indecifrabile costringendo a complessi sforzi di analisi e riconver-sione percheacute realizzata magari con lrsquoausilio di codifiche proprieta-rie ideate ad hoc per quella data opera e gli strumenti informatici dellrsquoepoca Se non egrave dunque possibile (neacute drsquoaltronde auspicabile) che le tecnologie impiegate oggi rimangano immutate nonostante i rapidissimi mutamenti dellrsquoorizzonte informatico egrave perograve necessario adoperare ogni sforzo nellrsquoideazione e realizzazione di opere digita-li di portata cosigrave ampia come quelle di testi epigrafici o letterari in modo che in un futuro non troppo remoto sia possibile riconvertirle facilmente piuttosto che abbandonarle allrsquoobsolescenza A questo scopo accanto alla capacitagrave di trasformazione e alla complementare tendenza alla massima separazione possibile dellrsquounico contenuto dalle sue molteplici forme occorre basare lrsquoopera digitale su stan-dard ampiamente diffusi e affermati per i quali sussiste la garanzia di unrsquoadeguata documentazione e dotazione di software capace di trattarli per gli scopi dellrsquoedizione come in futuro di convertirli in altre tecnologie

Specificitagrave dellrsquoedizione digitale

In termini piugrave semplici si puograve meglio intendere la natura di questo progetto a partire da alcuni banali esempi concreti nel cam-po dellrsquoeditoria elettronica specie italiana spesso accade che opere

12

DANIElE FuSI

tradizionalmente edite su carta ricevano una veste elettronica di solito ancillare rispetto alla loro veste originaria come ad esempio per dizionari repertori testuali o altre opere di consultazione Tutta-via non egrave raro constatare come in questi casi lrsquoedizione elettronica finisca per ridursi a un mero clone di quella cartacea trasposta piugrave o meno identica dal medium del libro tradizionale a quello del CD-ROM o dvd accade persino che si offra la semplice versione elettro-nica del testo stampato aggiungendo magari qualche funzione di ricerca a tutto testo o qualche contenuto multimediale senza tenere in alcun conto la specificitagrave del medium elettronico

Un testo stampato infatti necessariamente offre solo un limita-to numero di modi di accedere allrsquoinformazione in esso contenuta che viene predisposta dallrsquoautore in un certo ordine con una certa selezione e una specifica veste tipografica magari aggiungendo a corredo diversi indici per la consultazione sigrave da consentire un uso piugrave diversificato dellrsquoopera Per quanta cura si possa mettere in tali operazioni egrave comunque inevitabile che il ventaglio degli usi con-sentiti da una simile opera rimanga intrinsecamente limitato dalla forma in cui essa si egrave incarnata per la stampa Per fare un esempio banale lrsquoedizione di un corpus testuale puograve contenere un indice di antroponimi toponimi o altri aspetti ritenuti notevoli per una qualsiasi disciplina (letteratura storia geografia prosopografia ar-cheologia religione linguistica ecc) consentendo cosigrave di fruire dellrsquoopera in modi diversi corrispondenti agli intenti del suo utente ma quando un particolare tipo di indice manchi lo strumento offer-to da tale edizione saragrave di fatto praticamente inutile a meno di non effettuare una faticosa ricerca manuale al suo interno tanto meno fattibile quanto piugrave lrsquoopera risulti voluminosa In tal caso lrsquoutente potragrave rivolgersi magari a edizioni specializzate laddove esse siano disponibili o integrare lrsquoinformazione incrociando i dati provenienti da altre edizioni ma egrave comunque evidente che tali operazioni ri-chiederanno molto tempo quando pure esse risultino possibili in base al materiale disponibile

In questo senso unrsquoedizione elettronica che si limiti a ripro-durre in toto quella cartacea o in altri termini la stessa edizio-ne cartacea trasportata su un medium diverso puograve certo offrire un minimo vantaggio consentendo se non altro ricerche a tutto testo sullrsquointero contenuto dellrsquoopera allo stesso modo in cui egrave ovviamente piugrave facile trovare tutte le occorrenze di una parola in un testo digitale piuttosto che sfogliando le pagine della sua forma stampata Tuttavia egrave facile comprendere come una simile trasposizione dei contenuti in un altro medium non costituisca propriamente una vera opera digitale nella misura in cui essa

125

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

condivide con la cartacea le stesse limitazioni strutturali che sia infatti piugrave semplice cercare una parola al suo interno dipende semplicemente dalla diversitagrave del medium ma rimane il fatto che entrambe le edizioni mostrano unici ordinamenti selezioni in-dicizzazioni e forme di presentazione dei dati che lrsquoutente non puograve in alcun modo alterare a posteriori in altri termini entrambe le edizioni in seacute dicono sempre la stessa cosa e lo fanno sempre nello stesso modo secondo la vecchia accusa mossa da Platone alla parola scritta Se poi si pensa a testi piugrave complessi come vo-cabolari o anche schede epigrafiche egrave ovvio che anche la ricerca a tutto testo perderagrave molta della sua utilitagrave applicandosi indistin-tamente a una lunga e amorfa sequenza di parole senza possibi-litagrave di distinguere cosa al suo interno rappresenti nel caso di un vocabolario lemma traducente citazione paradigma spiegazione etimo ecc o nel caso di una scheda epigrafica classificazione col-locazione storica e geografica testo apparato commento ecc La consultazione di un tale vocabolario elettronico diverrebbe quindi pressocheacute infruttuosa dato che non sarebbe possibile limitare la ricerca a un ambito semantico specifico (ricerca per lemma ricerca per traducente ricerca per citazione etc) allrsquointerno dellrsquoindistin-to flusso di parole che costituisce il suo testo Qualora invece in questo flusso indistinto di parole si individui in modo univoco ogni porzione rilevante di testo secondo il proprio ruolo seman-tico (quanto rappresenta il lemma lrsquoetimologia la morfologia il traducente la fraseologia ecc) diverragrave subito possibile utilizzare questo unico contenuto per molteplici scopi e in molteplici forme ad esempio si potranno generare automaticamente elenchi alfabe-tici (diretti o inversi) dei lemmi o raggruppamenti di lemmi per categoria morfologica o attestazione in una data opera autore o contesto o anche realizzare sempre in modo del tutto automati-co un rudimentale vocabolario bilingue semplicemente estraendo tutti i traducenti in un elenco alfabetico con il rimando al relativo lemma Lrsquoutente dellrsquoedizione digitale potragrave inoltre effettuare ri-cerche combinate anche molto complesse ad esempio per trova-re tutti i lemmi inizianti con determinate lettere appartenenti a determinate categorie morfologiche riconducibili alla medesima radice attestati in determinati autori eo opere ecc egrave insomma evidente che in tal modo le possibilitagrave di consultazione di una simile edizione risulteranno subito virtualmente infinite fornendo uno strumento assai piugrave utile di una mera trasposizione digitale di unrsquoopera concepita su carta Puograve certo accadere che siano di fatto edite come opere elettroniche mere trasposizioni su cd o dvd di testi pubblicati a stampa ignorando completamente le spe-

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

12

DANIElE FuSI

tradizionalmente edite su carta ricevano una veste elettronica di solito ancillare rispetto alla loro veste originaria come ad esempio per dizionari repertori testuali o altre opere di consultazione Tutta-via non egrave raro constatare come in questi casi lrsquoedizione elettronica finisca per ridursi a un mero clone di quella cartacea trasposta piugrave o meno identica dal medium del libro tradizionale a quello del CD-ROM o dvd accade persino che si offra la semplice versione elettro-nica del testo stampato aggiungendo magari qualche funzione di ricerca a tutto testo o qualche contenuto multimediale senza tenere in alcun conto la specificitagrave del medium elettronico

Un testo stampato infatti necessariamente offre solo un limita-to numero di modi di accedere allrsquoinformazione in esso contenuta che viene predisposta dallrsquoautore in un certo ordine con una certa selezione e una specifica veste tipografica magari aggiungendo a corredo diversi indici per la consultazione sigrave da consentire un uso piugrave diversificato dellrsquoopera Per quanta cura si possa mettere in tali operazioni egrave comunque inevitabile che il ventaglio degli usi con-sentiti da una simile opera rimanga intrinsecamente limitato dalla forma in cui essa si egrave incarnata per la stampa Per fare un esempio banale lrsquoedizione di un corpus testuale puograve contenere un indice di antroponimi toponimi o altri aspetti ritenuti notevoli per una qualsiasi disciplina (letteratura storia geografia prosopografia ar-cheologia religione linguistica ecc) consentendo cosigrave di fruire dellrsquoopera in modi diversi corrispondenti agli intenti del suo utente ma quando un particolare tipo di indice manchi lo strumento offer-to da tale edizione saragrave di fatto praticamente inutile a meno di non effettuare una faticosa ricerca manuale al suo interno tanto meno fattibile quanto piugrave lrsquoopera risulti voluminosa In tal caso lrsquoutente potragrave rivolgersi magari a edizioni specializzate laddove esse siano disponibili o integrare lrsquoinformazione incrociando i dati provenienti da altre edizioni ma egrave comunque evidente che tali operazioni ri-chiederanno molto tempo quando pure esse risultino possibili in base al materiale disponibile

In questo senso unrsquoedizione elettronica che si limiti a ripro-durre in toto quella cartacea o in altri termini la stessa edizio-ne cartacea trasportata su un medium diverso puograve certo offrire un minimo vantaggio consentendo se non altro ricerche a tutto testo sullrsquointero contenuto dellrsquoopera allo stesso modo in cui egrave ovviamente piugrave facile trovare tutte le occorrenze di una parola in un testo digitale piuttosto che sfogliando le pagine della sua forma stampata Tuttavia egrave facile comprendere come una simile trasposizione dei contenuti in un altro medium non costituisca propriamente una vera opera digitale nella misura in cui essa

125

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

condivide con la cartacea le stesse limitazioni strutturali che sia infatti piugrave semplice cercare una parola al suo interno dipende semplicemente dalla diversitagrave del medium ma rimane il fatto che entrambe le edizioni mostrano unici ordinamenti selezioni in-dicizzazioni e forme di presentazione dei dati che lrsquoutente non puograve in alcun modo alterare a posteriori in altri termini entrambe le edizioni in seacute dicono sempre la stessa cosa e lo fanno sempre nello stesso modo secondo la vecchia accusa mossa da Platone alla parola scritta Se poi si pensa a testi piugrave complessi come vo-cabolari o anche schede epigrafiche egrave ovvio che anche la ricerca a tutto testo perderagrave molta della sua utilitagrave applicandosi indistin-tamente a una lunga e amorfa sequenza di parole senza possibi-litagrave di distinguere cosa al suo interno rappresenti nel caso di un vocabolario lemma traducente citazione paradigma spiegazione etimo ecc o nel caso di una scheda epigrafica classificazione col-locazione storica e geografica testo apparato commento ecc La consultazione di un tale vocabolario elettronico diverrebbe quindi pressocheacute infruttuosa dato che non sarebbe possibile limitare la ricerca a un ambito semantico specifico (ricerca per lemma ricerca per traducente ricerca per citazione etc) allrsquointerno dellrsquoindistin-to flusso di parole che costituisce il suo testo Qualora invece in questo flusso indistinto di parole si individui in modo univoco ogni porzione rilevante di testo secondo il proprio ruolo seman-tico (quanto rappresenta il lemma lrsquoetimologia la morfologia il traducente la fraseologia ecc) diverragrave subito possibile utilizzare questo unico contenuto per molteplici scopi e in molteplici forme ad esempio si potranno generare automaticamente elenchi alfabe-tici (diretti o inversi) dei lemmi o raggruppamenti di lemmi per categoria morfologica o attestazione in una data opera autore o contesto o anche realizzare sempre in modo del tutto automati-co un rudimentale vocabolario bilingue semplicemente estraendo tutti i traducenti in un elenco alfabetico con il rimando al relativo lemma Lrsquoutente dellrsquoedizione digitale potragrave inoltre effettuare ri-cerche combinate anche molto complesse ad esempio per trova-re tutti i lemmi inizianti con determinate lettere appartenenti a determinate categorie morfologiche riconducibili alla medesima radice attestati in determinati autori eo opere ecc egrave insomma evidente che in tal modo le possibilitagrave di consultazione di una simile edizione risulteranno subito virtualmente infinite fornendo uno strumento assai piugrave utile di una mera trasposizione digitale di unrsquoopera concepita su carta Puograve certo accadere che siano di fatto edite come opere elettroniche mere trasposizioni su cd o dvd di testi pubblicati a stampa ignorando completamente le spe-

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

125

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

condivide con la cartacea le stesse limitazioni strutturali che sia infatti piugrave semplice cercare una parola al suo interno dipende semplicemente dalla diversitagrave del medium ma rimane il fatto che entrambe le edizioni mostrano unici ordinamenti selezioni in-dicizzazioni e forme di presentazione dei dati che lrsquoutente non puograve in alcun modo alterare a posteriori in altri termini entrambe le edizioni in seacute dicono sempre la stessa cosa e lo fanno sempre nello stesso modo secondo la vecchia accusa mossa da Platone alla parola scritta Se poi si pensa a testi piugrave complessi come vo-cabolari o anche schede epigrafiche egrave ovvio che anche la ricerca a tutto testo perderagrave molta della sua utilitagrave applicandosi indistin-tamente a una lunga e amorfa sequenza di parole senza possibi-litagrave di distinguere cosa al suo interno rappresenti nel caso di un vocabolario lemma traducente citazione paradigma spiegazione etimo ecc o nel caso di una scheda epigrafica classificazione col-locazione storica e geografica testo apparato commento ecc La consultazione di un tale vocabolario elettronico diverrebbe quindi pressocheacute infruttuosa dato che non sarebbe possibile limitare la ricerca a un ambito semantico specifico (ricerca per lemma ricerca per traducente ricerca per citazione etc) allrsquointerno dellrsquoindistin-to flusso di parole che costituisce il suo testo Qualora invece in questo flusso indistinto di parole si individui in modo univoco ogni porzione rilevante di testo secondo il proprio ruolo seman-tico (quanto rappresenta il lemma lrsquoetimologia la morfologia il traducente la fraseologia ecc) diverragrave subito possibile utilizzare questo unico contenuto per molteplici scopi e in molteplici forme ad esempio si potranno generare automaticamente elenchi alfabe-tici (diretti o inversi) dei lemmi o raggruppamenti di lemmi per categoria morfologica o attestazione in una data opera autore o contesto o anche realizzare sempre in modo del tutto automati-co un rudimentale vocabolario bilingue semplicemente estraendo tutti i traducenti in un elenco alfabetico con il rimando al relativo lemma Lrsquoutente dellrsquoedizione digitale potragrave inoltre effettuare ri-cerche combinate anche molto complesse ad esempio per trova-re tutti i lemmi inizianti con determinate lettere appartenenti a determinate categorie morfologiche riconducibili alla medesima radice attestati in determinati autori eo opere ecc egrave insomma evidente che in tal modo le possibilitagrave di consultazione di una simile edizione risulteranno subito virtualmente infinite fornendo uno strumento assai piugrave utile di una mera trasposizione digitale di unrsquoopera concepita su carta Puograve certo accadere che siano di fatto edite come opere elettroniche mere trasposizioni su cd o dvd di testi pubblicati a stampa ignorando completamente le spe-

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

126

DANIElE FuSI

cificitagrave del diverso medium per mancata strutturazione dei dati preesistenti scarsa capacitagrave o convenienza di affrontare una loro vera riconversione elettronica o fraintendimento della specifica natura dellrsquoedizione elettronica rispetto alla cartacea tuttavia la specificitagrave dellrsquoedizione digitale consiste proprio nelle possibilitagrave virtualmente infinite di consultazione e presentazione dei dati che essa offre Una volta infatti che si disponga di unrsquoinformazione di partenza opportunamente strutturata sul piano semantico diviene possibile selezionarla riordinarla e assegnarle la veste tipografica piugrave adatta alle puntuali richieste che lrsquoutente pone di volta in volta al programma di consultazione in questo senso non si ha piugrave lsquounarsquo pubblicazione ma di fatto il materiale viene ripubblicato dinami-camente in tempo reale a ogni specifica richiesta dellrsquoutente nei modi e nelle vesti piugrave adatti a soddisfarla incrociando magari i dati secondo modalitagrave complesse dipendenti dai parametri forniti Per fare un esempio banale chiunque ha sperimentato quanto differiscano una ricerca di una parola in un indice di un libro e la ricerca di termini su un motore di ricerca in internet con la possi-bilitagrave di incrociare i parametri associarli con operatori restringere o allargare i campi di interrogazione effettuare nuove ricerche a partire da risultati appena ottenuti ecc2

Peculiaritagrave del documento epigrafico

Il documento epigrafico da cui trae origine il progetto qui pre-sentato egrave ovviamente peculiare nella misura in cui generalmente egrave portatore di un testo giuntoci direttamente sul suo supporto origi-nale Qualsiasi edizione deve quindi tener conto di questo duplice aspetto materiale e linguistico il testo egrave parte integrante di un mo-numento inserito in un dato contesto siccheacute lrsquoaspetto materiale (ma-nufatto contesto decorazione funzione ecc) deve sempre potersi affiancare ad esso che egrave prezioso testimone dellrsquoevoluzione della

2 In realtagrave un tale esempio per quanto universalmente comprensibile po-trebbe risultare fuorviante nella misura in cui di fatto le attuali tecnologie di ricerca di informazione su web si basano su indicizzazioni piugrave o meno com-plesse ma comunque puramente formali dei contenuti delle pagine HTML come chiunque sperimenta continuamente nel confrontarsi con la ridondanza e la pertinenza dei risultati ottenuti rispetto alle proprie intenzioni Proba-bilmente solo OWL o altre tecnologie di definizione semantica dei contenuti potranno fornire la base per ricerche veramente mirate e infinitamente piugrave efficaci delle attuali

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

127

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

lingua o delle sue particolaritagrave regionali3 Si consideri ad esempio lrsquoepigrafe greca riportata nella fotografia (digitale) qui sotto accanto alla sua edizione cartacea (in IGUR 443)

Figura 1

Come si vede dinanzi a grafie non standard come ἐπύησεν Διονύσις ἰς lrsquoeditore ha scelto di conformarsi al testo originale piuttosto che la normalizzazione ortografica ἐποίησεν Διονύσιος εἰς naturalmente nel caso di unrsquoedizione cartacea una scelta (a meno di non voler stampa-re il testo due volte) egrave drsquoobbligo e qualsiasi scelta non puograve che risul-tare compromissoria nel caso della grafia lsquostoricarsquo si rispetta la stori-citagrave del documento originale ma si sacrifica la leggibilitagrave dellrsquoedizione per il pubblico meno specializzato nel caso della grafia normalizzata si stampa un testo facilmente comprensibile da qualsiasi utente del-lrsquoedizione e conforme alle nostre convenzioni ortografiche ma inevi-tabilmente falsato rispetto alla realtagrave linguistica coeva Egrave naturalmente

3 Ovviamente il lapicida che nota ad esempio con I quanto oggi si scrive con EI non fa altro che esprimere in forma scritta un suono della propria lingua corrente Come avvertiva Reinach pure con qualche schematismo (1885 p 238) laquole mot drsquoortographie eacuteveille en nous une ideacutee de regravegle qui a eacuteteacute longtemps eacutetrangegravere agrave lrsquoantiquiteacute Pour nous lrsquoortographe est une maniegravere fixe drsquoeacutecrire les mots en deacutepit souvent de la prononciation qursquoon leur donne pour les anciens jusqursquoagrave lrsquoeacutepoque alexandrine [hellip] lrsquoortographie proprament dite nrsquoexiste pas et lrsquoon eacutecrit les mots comme on les prononce Lrsquoeacutecriture eacutetait vivante chez eux elle est savante chez nous Ils la conformaient agrave la parole nous la reacuteglons sur lrsquoeacutetymologie ou la tradition Chez eux elle repreacutesente ce qui se dit chez nous elle est souvent un teacutemoignage de ce qui ne se dit plusraquo

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

12

DANIElE FuSI

possibile aggiungere un apparato con le lezioni originali ma in ogni caso il testo che si presenta in prima istanza deve essere il frutto di una delle due scelte e motivi pratici spesso limitano la possibilitagrave di aggiunte di questo tipo a unrsquoedizione su carta Peraltro questo stesso esempio mostra come una simile scelta possa risultare ancora piugrave complessa non si tratta solo di lsquomeccanichersquo e relativamente banali trasposizioni ortografiche corrispondenti allrsquoitacismo (οι per υ ει per ι) ma di fenomeni di evoluzione della lingua dotati spesso di conse-guenze importanti per lrsquointero sistema Una forma come Διονύσις infat-ti rappresenta lrsquoesito di una catena di trasformazioni linguistiche che bencheacute basata sullo stesso fenomeno di partenza (lrsquoitacismo) finisce per avere conseguenze sul sistema morfologico configurandosi come un vero metaplasmo Egrave infatti noto che dallrsquoetagrave ellenistica la tenden-ziale caduta della vocale posttonica in una forma come Διονύσι(ο)ς provoca una generale deriva dei sostantivi in -ι(ο)ς appartenenti alla seconda declinazione che terminando ormai in -is come i maschili della prima declinazione in -ης = -is finiscono per passare a que-strsquoultima essendo una grafia come Ἀντώνης assai piugrave comprensibile al parlante rispetto allrsquouscita -ις di una forma sincopata come Ἀντώνις4 In tal caso ci si trova dunque dinanzi a un vero metaplasmo che ha le sue origini nella fonetica e si ripercuote pesantemente sul siste-ma flessivo nominale della lingua greca dinanzi al quale risulteragrave evidente che nessuna scelta editoriale si puograve imporre in modo siste-matico Drsquoaltronde rimane necessaria lrsquoadozione di una convenzione ortografica omogenea almeno allrsquointerno della medesima edizione e il problema risulta ancor piugrave importante se si pensa poi alla costru-zione di indici e repertori specie nel caso di edizioni digitali egrave infatti ovvio che memorizzando solamente una forma come ἐπύησεν in una ipotetica edizione digitale lrsquoutente che cercasse tutte le occorrenze della parola ἐποίησεν non troverebbe alcun risultato bencheacute un testo presentante questa parola (sia pure in una forma diversa) sia presente nel corpus e viceversa Proprio unrsquoedizione digitale perograve puograve offrire lrsquoopportunitagrave di superare le inevitabili prassi compromissorie legate per ovvi motivi pratici allrsquoedizione cartacea nella misura in cui rispet-tando la sua specificitagrave diviene possibile presentare dinamicamente lo stesso testo in modi diversi con tutti i dati complementari che si ritengano utili

4 Alla fine del periodo romano lo stesso fenomeno assieme al proliferare dei diminutivi in -ιον e forse allrsquoinflusso del latino -ārium provoca la creazione di neutri in -ιν (spesso -αριν) di seconda declinazione

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

129

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Realizzazione

La realizzazione di questo progetto prende dunque le mosse dal rispetto delle specificitagrave dellrsquoedizione digitale da un lato e delle peculiaritagrave del testo epigrafico dallrsquoaltro con la sua duplice faccia materiale e testuale

a) Aspetto materiale multimedialitagrave interattivitagrave applicazioni grafiche

La prima ovvia fase per unrsquoedizione come quella qui presen-tata egrave costituita dallrsquoacquisizione del materiale tramite la realiz-zazione di fotografie digitali da un lato e il reperimento di tutta la principale bibliografia relativa dallrsquoaltro Sin dallrsquoinizio quin-di lrsquoedizione assume una fisionomia multimediale ovviamente tanto piugrave adatta a unrsquoedizione digitale e tale aspetto egrave riflesso anche nei percorsi paralleli che testo e immagini seguono nelle fasi successive Da un lato dunque si procederagrave al trattamento elettronico del materiale fotografico sottoposto ove necessario a piugrave o meno complesse manipolazioni digitali su specializzati applicativi di fotoritocco allo scopo di isolare ed esaltare al me-glio lrsquoinformazione testuale proveniente dalla pietra Inoltre un particolare aspetto di tali manipolazioni egrave rappresentato per ogni singola iscrizione (o solamente per quelle ritenute piugrave rilevanti) dalla realizzazione di un suo fedele calco digitale ottenuto in modo del tutto virtuale a partire dalla sua immagine con la so-vrapposizione di lsquofoglirsquo virtuali allrsquoimmagine fotografica originale e il tracciamento dei contorni delle lettere si ottiene un vero e proprio calco tendenzialmente assai fedele ai tratti dellrsquoorigi-nale isolato poi dallo sfondo e ricolorato per essere proiettato su una superficie bianca come un tradizionale disegno a china Rimandando per qualche ulteriore dettaglio su queste fasi a un mio precedente intervento che sarebbe inutile ripetere in questa sede5 egrave sufficiente mostrare un piccolo esempio relativo allo sta-dio iniziale e finale dellrsquoestrazione del calco digitale dalla foto-grafia opportunamente ritoccata

5 Fusi 2001-2002 pp 177-210

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

10

DANIElE FuSI

Figura 2a Fotografia originale ritoccata

Figura 2b Una delle fasi intermedie per la tracciatura del calco digitale

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 2c Estrazione del calco digitale

Inoltre il redattore puograve aggiungere contestualmente anche un insieme di informazioni sussidiarie alle immagini dellrsquoiscrizione (fo-tografie e calchi) rappresentanti la connessione diretta fra il testo e la sua immagine grafica per ogni immagine infatti egrave possibile definire una serie di lsquomappersquo strati didascalie e misurazioni vir-tuali implementati tutti in modo del tutto separato dallrsquoimmagine stessa in file XML distinti Le mappe correlano porzioni di testo dellrsquoepigrafe a regioni della sua immagine in modo che lrsquoutente possa visualizzare entrambe in modo sincronizzato il programma di consultazione consentiragrave di raggiungere la porzione di testo de-siderata nellrsquoimmagine o viceversa di individuare la porzione di testo semplicemente posizionando il cursore sulla regione ad esso corrispondente nellrsquoimmagine stessa Similmente immagini di varia natura (ad esempio calchi) possono essere sovrapposte con vario grado di opacitagrave come strati successivi allrsquoimmagine fotografica di base dellrsquoepigrafe Ogni immagine puograve inoltre avere un qualsiasi numero di gruppi di didascalie visualizzate in un qualsiasi punto dellrsquoimmagine fotografica ciascuno deputato a marcare un insieme coerente di osservazioni visuali

Uno dei vantaggi della natura multimediale e dinamica dellrsquoedi-zione epigrafica elettronica facilmente esemplificabile e relativo sia allrsquoeditore che allrsquoutente finale egrave inoltre costituito da un banale

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

12

DANIElE FuSI

aspetto paleografico egrave infatti buona prassi editoriale corredare ogni epigrafe di almeno alcune misurazioni ritenute piugrave essenziali per una migliore descrizione paleografica come ad esempio lrsquoaltezza media delle lettere la larghezza media del loro solco ecc Natural-mente ovvi motivi pratici inducono qualsiasi editore a limitare le misurazioni agli aspetti ritenuti a vario titolo piugrave significativi trascu-randone altri che magari risulterebbero eccessivi per unrsquoopera non specialistica o che comunque anche in questrsquoultima si potrebbero ritenere meno essenziali e dunque trascurabili Anche unrsquoedizione con specifici interessi paleografici infatti non potrebbe che offri-re sempre un insieme finito rispetto alle innumerevoli misurazioni che potrebbero essere fatte sulla pietra per i motivi piugrave disparati In unrsquoedizione elettronica tuttavia diviene possibile un approccio diverso anche se in certa misura complementare oltre a riportare un predefinito insieme di misurazioni fatte a priori dallrsquoeditore essa puograve consentire allo stesso utente di effettuarne un infinito numero di altre a seconda dei suoi specifici interessi Affiancando infatti al testo una o piugrave immagini fotografiche dellrsquoepigrafe ripresa accanto a una scala metrica si ha la possibilitagrave di utilizzare lrsquoimmagine di questrsquoultima per dedurre in modo approssimativo la lunghezza di un qualsiasi segmento tracciato dallrsquoutente (ad esempio utilizzan-do un mouse) sullrsquoimmagine stessa Si tratta dunque in fondo di avvalersi del tradizionale riferimento visivo della striscia metrica utile per valutare con uno sguardo le dimensioni approssimative dellrsquooggetto per attingere perograve a una precisione assai maggiore di quella raggiungibile dagli occhi del lettore dato che il programma di consultazione puograve misurare con precisione ogni lunghezza in rapporto a quella della striscia metrica e operare istantaneamente le dovute proporzioni per riportare la misurazione corrispondente In un simile programma lrsquoutente non dovragrave ad esempio che cliccare su due punti qualsiasi dellrsquoimmagine fotografica per ottenere imme-diatamente la misura della loro distanza Naturalmente si deve tener presente che simili misurazioni sono in vario grado approssimative dipendendo da fattori come la risoluzione della fotografia ed even-tuali distorsioni ottiche ma in generale esse risultano assai precise in relazione agli scopi con cui sono effettuate tanto piugrave che il loro fine principale non consiste tanto nel produrre una cifra assoluta quanto piuttosto nellrsquooffrire un termine di paragone rispetto ad altri tracciati nella stessa o in altre epigrafi Peraltro il programma che consente tali misurazioni egrave in grado di fornire una misura appros-simativa dellrsquoerrore statistico ad esse connesso in dipendenza dalla risoluzione dellrsquoimmagine fotografica egrave infatti ovvio che unrsquoimma-gine dove 50 punti sullo schermo corrispondano a 1 centimetro

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

potragrave fornire delle misurazioni intrinsecamente piugrave precise di una dove a 1 centimetro corrispondano solo 10 punti in entrambi i casi comunque il programma offre sempre la stima di tale errore sigrave da consentire una maggiore precisione nella raccolta dei dati

Ancora una volta in riferimento alla filosofia generale del pro-getto egrave importante osservare come tutti questi elementi relativi al-lrsquoimmagine fotografica dellrsquoepigrafe non si trovino inseriti nellrsquoim-magine stessa coerentemente allo sforzo di mantenere il contenuto quanto piugrave separato possibile da una qualsiasi specifica presenta-zione alle immagini originali si affiancano dei file autonomi conte-nenti tutta la meta-informazione relativa a mappe strati didascalie e misurazioni saragrave poi compito del software unire questi due tipi di informazione (le immagini da un lato le informazioni ad esse relative dallrsquoaltro) presentandole allrsquoutente come unrsquounitagrave in realtagrave solo apparente dal punto di vista della loro collocazione nella banca dati Appare qui particolarmente evidente come lrsquoinformazione sia sempre mantenuta distinta nella sua specificitagrave (in tal caso informa-zione grafica e informazione meta-grafica) e del tutto indipendente da una particolare veste editoriale dato che lrsquoinformazione meta-grafica rappresenta un mero testo XML che saragrave trasformato in un aspetto visibile sulla fotografia originale dal programma di consul-tazione un testo si fa dunque immagine allrsquoatto stesso della fruizio-ne dellrsquoedizione da parte dellrsquoutente finale e piugrave elementi semplici distinti vengono composti a formare un insieme complesso Il ruolo della trasformazione e la scomposizione in elementi atomici che ne egrave alla base sigrave da risultare del tutto indipendenti da una qualsiasi forma predefinita non potrebbe essere piugrave evidente Drsquoaltronde aspetti particolarmente interattivi come mappe e misurazioni vir-tuali non avrebbero possibilitagrave di essere pubblicati in altro modo diverso da quello dinamico una mappa ha senso nel consentire lrsquoin-dividuazione di testo nella fotografia o viceversa e le misurazioni vengono addirittura eseguite (sia pure in modo virtuale) dallrsquoutente stesso dellrsquoedizione

Ulteriori applicazioni grafiche repertorio paleografico virtuale e modelli neurali

La disponibilitagrave di fedeli calchi digitali direttamente tratti dal-le fotografie consente inoltre ulteriori interessanti applicazioni nel-lrsquoambito di unrsquoedizione elettronica che si configura anzitutto come attivo strumento di ricerca Specialmente nella prospettiva di una potenziale scalabilitagrave dellrsquoedizione infatti appare evidente la possi-bilitagrave di estrarre dai calchi le sagome delle singole lettere per poi

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

DANIElE FuSI

costituire dei veri e propri repertori paleografici virtuali contenenti la forma di ogni lettera dellrsquoalfabeto cosigrave come appare sulla pietra dei testi presenti nel corpus

Figure 3 e 4 Calco digitale e alcune lettere estratte dal calco

Questa operazione puograve risultare ancor piugrave utile laddove il corpus risulti sufficientemente ampio ed esteso cronologicamente nella misura in cui diviene possibile assegnare la specificitagrave di alcuni tratti delle lettere a determinate epoche sulla base di criteri non paleografici in tal modo si definiscono (per quanto indicati-vi) dei punti di riferimento lungo lrsquoasse temporale dellrsquoevoluzione del tratto grafico rispetto ai quali diviene possibile fornire degli indizi di datazione su base paleografica per altre epigrafi Questo repertorio diviene dunque uno strumento prezioso non solo per lrsquoaspetto strettamente paleografico ma anche per la sua capacitagrave di offrire indizi cronologici sulla base della semplice analisi della forma delle lettere di un testo epigrafico Lrsquoedizione elettronica consente peraltro di estendere questo tipo di analisi comparati-va su una scala difficilmente gestibile con strumenti tradizionali affidando a programmi specializzati il compito di effettuare i con-fronti anche su migliaia o decine di migliaia di campioni attinti dal repertorio interno al corpus A questo scopo si possono utilizzare con profitto tecniche di analisi neuronale rendono il programma capace di apprendere e generalizzare a partire da un insieme di campioni Senza entrare in dettagli si deve evidenziare che un simile approccio offre il vantaggio di evitare qualsiasi definizione aprioristica da parte dellrsquoautore egrave infatti il programma stesso che

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

apprendendo dai campioni si forma per cosigrave dire unrsquoidea astratta di ogni forma tanto piugrave precisa quanto piugrave vasto sia il materiale di partenza Saragrave quindi sufficiente presentare al programma un numero adeguato di esempi di forme per ciascuna lettera allrsquointer-no di un lasso cronologico predefinito traendole direttamente dai calchi digitali percheacute esso sia in grado di formarsi un modello pa-radigmatico per ogni forma rispetto al quale valutare ogni nuova lettera incontrata Ad esempio dopo aver addestrato il programma a riconoscere un alfabeto definito come caratteristico di I-II seco-lo dC semplicemente presentandogli varie decine di esempi per ogni lettera dinanzi a una lettera appartenente a unrsquoepigrafe del tutto estranea al corpus e dunque mai incontrata in precedenza il programma saragrave in grado di giudicare il suo grado di somiglianza con lrsquolsquoidearsquo che esso si egrave formato per ogni lettera degli alfabeti del I-II secolo e di fornire quindi un indizio cronologico per una da-tazione su base paleografica Peraltro la specifica natura di questi algoritmi consente di evitare il rischio di falsi positivi nellrsquointer-rogazione del repertorio quando il programma non disponga di sufficiente esperienza per giudicare una forma troppo distante da quelle giagrave incontrate durante lrsquoapprendimento esso non produrragrave accostamenti arbitrari ma risponderagrave semplicemente di non esse-re in grado di riconoscerla Si realizza in tal modo un vero reper-torio paleografico interattivo capace di fornire uno strumento di ricerca tanto piugrave potente quanto piugrave vasto saragrave il corpus da esso dominato e di apprendere in modo dinamico dal materiale che viene presentato e aggiunto di volta in volta6

b) Aspetto testuale dal testo marcato alla banca dati

Se multimedialitagrave interattivitagrave e applicazioni grafiche piugrave o meno evolute risultano abbastanza intuitive dalle specificitagrave dellrsquoedizione propriamente digitale forse meno immediate ma

6 Questo tipo di tecniche puograve inoltre dimostrarsi fruttuoso anche in altre aree dellrsquoedizione digitale si pensi ad esempio alla possibilitagrave di una analisi completa (e automatica) sul piano grafico e di una conseguente consultazione molto piugrave intuitiva di tutti quegli aspetti difficilmente codificabili in forma testuale come le forme di una lettera ma anche i segni non alfabetici di sigilli o bolli su questa via si potrebbe ad esempio pensare a banche dati grafiche dove i modi stessi della consultazione siano anchrsquoessi grafici per esempio definiti da qualche segno tracciato dallrsquoutente con un mouse che conduca a trovare tutte le forme simili presenti nellrsquoedizione digitale

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

16

DANIElE FuSI

piugrave rilevanti sono poi le conseguenze di tale specificitagrave nella strutturazione dellrsquoinformazione testuale Naturalmente la pura trasposizione di un testo su un medium elettronico non puograve che superficialmente considerarsi una vera edizione digitale percheacute questrsquoultima sia fruibile in modi e vesti virtualmente infiniti egrave ne-cessario anzitutto che il suo contenuto sia adeguatamente strut-turato dal punto di vista semantico Se ci si limita al semplice te-sto i livelli di semantizzazione che esso puograve assumere nella sua forma digitale possono essere di grado molto vario uno minimo puograve essere ad esempio rappresentato dalla semplice trasposizio-ne di un testo continuo da una pagina di carta a un testo elet-tronico riportandolo magari su un applicativo di videoscrittura Egrave evidente che in tal caso le possibilitagrave di fruizione di un simile testo saranno assai limitate non andando molto oltre la lettura a video o la ricerca a tutto testo di una parola al suo interno Unrsquooperazione molto piugrave fruttuosa puograve invece essere rappresen-tata dallrsquoattribuzione di una qualche forma di marcatura semanti-ca a questo testo ad esempio in un testo come

A bull FABIO bull A bull F bull FABI-

ANO bull EQVITID ROMANO bull DECV- M

RIONI bull OSTQVI bull VIXIT bull ANNIS bull

XXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVS

PATER bull FECIT

potrebbero essere in qualche modo marcate le abbreviazioni (A(ulus) A(uli) F(abi) etc) le cariche del personaggio (equiti Romano decurioni) le lettere indicanti numeri (XXII XI XX) e quantrsquoaltro si desideri individuare come rilevante o disambigua-re nel flusso altrimenti indistinto di testo In effetti molte edi-zioni digitali recenti adottano questo tipo di strategia partendo dal testo di base per applicarvi marcature piugrave o meno raffinate e complesse solitamente implementate utilizzando XML Simili edizioni hanno indubbiamente numerosi vantaggi e possono ri-sultare piugrave che soddisfacenti rispetto agli scopi proposti dai loro autori esse realizzano infatti un certo livello di semantizzazione del dato testuale che non egrave piugrave un flusso indistinto di lettere ma viene opportunamente caratterizzato secondo il tipo di in-

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

formazioni di cui egrave portatore tecnologie come XML e Unicode ampiamente utilizzate a questi scopi risultano poi molto valide nella misura in cui rappresentano degli standard consolidati e universalmente diffusi e danno luogo a un modello di edizione molto compatta e semplice dove tutta lrsquoinformazione egrave contenu-ta in un file di testo marcato interpretabile e fungibile a diversi livelli e facilmente utilizzabile anche come piattaforma di scam-bio in virtugrave della intrinseca vocazione alla trasformazione propria di XML (anzitutto tramite tecnologie complementari e altrettanto diffuse come XSLT) Un semplice applicativo di videoscrittura sul versante redazionale e un browser web da parte del fruitore dellrsquoedizione sono in tal caso giagrave strumenti sufficienti per la pub-blicazione di testi digitali bencheacute richiedano allrsquoeditore lo sforzo di inserire testo seguendo un determinato schema di marcature definito a priori

In un progetto come quello qui presentato tuttavia il testo non rappresenta che uno dei possibili contenuti da inserire in un grande contenitore di dati strutturato capace di espandersi e specializzarsi indefinitamente Questo progetto infatti rientra nellrsquoambito di procedure editoriali messe a punto con il relativo software per realizzare pubblicazioni digitali eo tradizionali di tipo assai diverso siano esse a vocazione scientifica o commer-ciale corpora di testi letterari o epigrafici cataloghi di materiale archeologico vocabolari bilingui dizionari tematici etc In que-sto scenario che qui non egrave possibile descrivere per ovvi motivi di economia una procedura unificata consente a tutti questi ma-teriali quale che sia la loro natura e provenienza di confluire in unrsquounica struttura contenente i dati soggetti poi a numerose fasi di trasformazione che conducono alla pubblicazione finale Non si tratta dunque semplicemente di pubblicare un testo in formato digitale bensigrave di raccogliere dati assai eterogenei tra cui puograve figurare anche il testo epigrafico in una struttura sempre capace di espandersi

In questo ambito dunque il testo per quanto accuratamente marcato egrave lungi dallrsquoesaurire il repertorio dei possibili contenu-ti che devono tuttavia trovare ciascuno un proprio posto e una propria ben definita strutturazione allrsquointerno dellrsquoinsieme Sche-maticamente rispetto al modello di pubblicazione di un testo marcato si potrebbero raggruppare i dati di questo tipo edizio-ne in tre grandi categorie dati testuali dati meta-testuali e dati extra-testuali Oltre al testo in seacute infatti devono trovare posto tutte quelle informazioni strettamente connesse a una qualsia-si porzione del testo edito (come apparato critico commento

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

DANIElE FuSI

annotazioni paleografiche e materiali dati prosopografici e sto-rici osservazioni linguistiche e filologiche ecc) ma anche dati non dipendenti da una specifica porzione di testo ma in qualche modo pertinenti alla raccolta dei materiali che si intende pubbli-care (come dati archeologici e fisici relativi a un monumento o al suo contesto introduzioni monografiche di carattere filologico storico linguistico paleografico ecc bibliografie generali re-pertori multimediali di documenti correlati come ad es raffigu-razioni vascolari o reperti di qualsiasi altra natura e cosigrave via) In questo senso il composito contenitore che deve poter organizza-re tutti questi tipi di dati non egrave piugrave costituito dal solo testo edito che in una pubblicazione a base XML funge da struttura portante dellrsquointera pubblicazione bensigrave da una struttura assimilabile me-taforicamente a un albero espandibile indefinitamente e di cui il testo stesso non rappresenta che uno dei rami

Peraltro una simile struttura si rende necessaria non solo per contenere tutti i dati di natura extra-testuale ma anche per rendere possibile una grande libertagrave di espansione nella codifica di qualsiasi dato meta-testuale al di lagrave di progetti dove il testo puograve essere la parte minoritaria o addirittura mancare si pensi ad esempio alla specificitagrave del testo epigrafico dove il complesso di tutta lrsquoinformazione non testuale associata per vari motivi (ar-cheologici artistici paleografici filologici storici linguistici ecc) allrsquoiscrizione finisce spesso per essere quantitativamente molto superiore e notevolmente varia rispetto al testo in seacute ma anche rispetto alle intrinseche limitazioni delle tecnologie di marcatura Per fare un esempio banale si consideri di nuovo il testo citato sopra in un simile testo si potrebbero voler marcare le abbre-viazioni in quanto tali con il relativo scioglimento (riquadro 1) e magari anche i vari componenti del nome dei personaggi con le relative cariche e ruoli (ad es a fini prosopografici riquadro 2) in tal modo si dovrebbe ad esempio marcare in qualche modo la prima A come abbreviazione di A(ulo) ma anche come prenome del personaggio allo stesso modo in cui si marcherebbero Fabio e Fabiano come nomen e cognomen contemporaneamente il patronimico A(uli) F(ilio) dovrebbe essere marcato sia in quanto tale che come duplice abbreviazione noncheacute rientrare nella piugrave estesa marcatura relativa al nome del personaggio nel suo insie-me (dal prenome sino al cognomen) ecc Giagrave per queste poche informazioni metatestuali si dovrebbero applicare marcature a una buona porzione del testo e in qualche modo sovrapposte le une alle altre

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Qualsiasi aggiunta di dati relativi poi a interessi specifici siano essi di natura epigrafica paleografica archeologica artistica stori-ca filologica linguistica etc dovrebbe poi essere in qualche modo inserita nel sistema delle marcature che finirebbe cosigrave per crescere su se stesso generando unrsquoenorme nidificazione e complessitagrave di ostacolo sia allrsquoinserimento dei dati che al loro trattamento automa-tico inoltre per questa via si giungerebbe comunque al limite og-gettivo imposto da una tecnologia di marcatura come XML che non consente la sovrapposizione di diverse marcature allo stesso modo in cui sarebbe impossibile evidenziare con diversi colori la stessa porzione di testo Drsquoaltra parte a uno standard per la pubblicazione di testi epigrafici in quanto tale piattaforma comune ben definita per la codifica e lo scambio di certi di un tipo molto specifico non si dovrebbe neppure chiedere di snaturarsi ed estendersi a dismisura per includere arbitrariamente qualsiasi dato meta- o extratestuale che ogni singolo progetto ritenga opportuno memorizzare in forma digitale Nellrsquoambito di progetti in cui si richiede di trattare mate-riale tanto vario e anche del tutto privo di riferimento a un testo unrsquoedizione basata esclusivamente sul testo marcato come struttura portante finirebbe dunque per costringere il dato metatestuale che deve inoltre poter essere espandibile in qualsiasi momento senza pregiudizio per il materiale esistente e la sua struttura

Il modello qui proposto pertanto dovendo adeguarsi agli obiet-tivi evidenziati sopra abbandona lrsquoimpostazione piugrave strettamente lsquotipograficarsquo dellrsquoedizione basata sul testo marcato non si tratta piugrave di partire da un testo ideale o concretamente preesistente da marca-re con opportuni tag ma piuttosto di definire una struttura dei dati siano essi testuali metatestuali o extratestuali ancora piugrave remota da una qualsiasi specifica incarnazione formale Naturalmente la sche-da epigrafica rimane lrsquoideale punto di partenza per la definizione del tipo di materiale da trattare ma la sua organizzazione interna non assume necessariamente la scheda come modello di struttura-

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

1

D bull M bull A bull FABIO bull A bull F bull FABI-ANO bull EQVITIROMANO bull DECV-RIONI bull OSTQVI bull VIXIT bull ANNIS bullXXII bull M bull XI bull D bull XX bullA bull FABIVS bull TROPHIMVSPATER bull FECIT

2

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

10

DANIElE FuSI

zione dei dati Di fatto quanto giace lsquodietro le quintersquo dellrsquoedizio-ne (o meglio delle edizioni potenzialmente pubblicabili a partire dallrsquounico insieme di dati) ha una struttura definita anzitutto dalla necessitagrave da un lato di scomporre lrsquoinformazione fino al suo atomo e dallrsquoaltro di mantenere i contenuti quanto piugrave possibile indipen-denti da una qualsiasi forma specifica Non si tratta piugrave di assumere alla base un testo epigrafico per poi inserirvi per quanto possibile ogni altra informazione tramite marcature piugrave o meno complesse ma di costituire una vera e propria banca dati epigrafica dove ogni tipo di dato incluso (ma non solo) il testo viene scomposto nei suoi elementi e memorizzato a parte secondo le sue specificitagrave a partire da questa banca dati poi apposito software provvederagrave a recuperare i vari elementi a ricombinarli e presentarli nel modo e nella veste piugrave adatti alla richiesta dellrsquoutente La pubblicazione ad esempio in forma di tradizionale scheda non egrave quindi il modello di partenza per la strutturazione interna dei dati ma il punto di arrivo di una serie di trasformazioni piugrave o meno complesse che opera-no sulla banca dati epigrafica riassemblandone i vari componenti opportunamente selezionati filtrati e riordinati in tempo reale per soddisfare nel modo piugrave adatto le richieste dellrsquoutente I dati in seacute rimangono invece il piugrave possibile lsquoamorfirsquo strutturati e atomici per consentire lrsquoadattamento a qualsiasi forma e la loro selezione a par-tire da ricerche incrociate

In questo modello dunque si puograve assimilare lrsquoedizione non piugrave a un testo sequenziale marcato ma a una sorta di albero del-lrsquoinformazione dal cui tronco si dipartono molteplici diramazioni ciascuna capace di ospitare un determinato tipo di dato e di cre-scere virtualmente allrsquoinfinito sulla stessa pianta con nuovi rami che rampollano dal tronco esistente la cui struttura e contenuti ri-mangono nondimeno inalterati Fuor di metafora questa struttura viene nondimeno realizzata con le medesime tecnologie impiegate da altri tipi di edizione come vi sono dei testi marcati rappresenta-ti da file XML che costituiscono tutta lrsquoopera cosigrave qui questi alberi di dati sono costituiti da semplici file XML che racchiudono tutti i dati dellrsquoedizione in una struttura gerarchica Mentre perograve nelle edizioni piugrave strettamente testuali XML egrave usato come tecnologia per marcare il testo delle iscrizioni disposto in sequenza per formare il corpus qui lo stesso XML egrave usato piuttosto come articolato conte-nitore di informazione dove il testo egrave solo uno dei tanti contenuti e non rappresenta la base portante dellrsquoopera il tag dunque non egrave tanto un marcatore del testo bensigrave un contenitore di dati non necessariamente testuali Lrsquouso di XML in questo senso si giustifica anzitutto per motivi pratici dato che consente di includere tutto

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

11

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

il materiale dellrsquoedizione in semplici file di testo producendo cosigrave una struttura estremamente compatta portabile e trasformabile in altri formati

Nellrsquoambito di questo progetto dunque XML rappresenta un ideale contenitore di informazione percheacute oltre alla sua natura standardizzata e alla sua ampia diffusione in altri tipi di proget-ti editoriali consente di raccogliere grandi repertori di dati con-ferendo loro una ben definita struttura semantica ma lasciando contemporaneamente spazio a notevoli capacitagrave di espansione e specializzazione senza alterare il materiale preesistente In tale prospettiva XML come uno degli standard per eccellenza nello scambio di dati fra sistemi diversi rappresenta non solo un ver-satile intermediario per consentire lo scambio di informazioni tra diversi progetti editoriali ma anche allrsquointerno di questo singolo progetto un intermediario tra le diverse fasi redazionali dellrsquoopera La storia stessa di questo progetto infatti ha comportato e compor-ta tuttora una notevole fluiditagrave nella definizione delle sue strutture e dei suoi contenuti in funzione delle diverse finalitagrave proposte da un primo nucleo essenzialmente incentrato sul testo epigrafico e funzionale a precipui interessi linguistici metrici7 o comunque specialistici a una vera e propria edizione epigrafica di testi greci e latini classici per poi estendersi da un lato al mondo medie-vale e dallrsquoaltro alla raccolta di una grande varietagrave di documenti non solo testuali relativi al teatro antico il progetto si egrave evoluto ampliando la gamma dei suoi contenuti e specializzando in di-verse direzioni i dati metatestuali noncheacute seguendo lrsquoevoluzione delle tecnologie informatiche degli ultimi anni Questo percorso evolutivo ha dunque richiesto un continuo rimaneggiamento delle strutture concepite al suo avvio e del relativo software redazionale creato ad hoc per esse implicando cosigrave anche molteplici trasfor-mazioni dei contenuti giagrave esistenti In questo senso il vantaggio di conservare tutta lrsquoinformazione in contenitori XML capaci di me-morizzare ogni dato al suo posto nella struttura ma nel contempo di espandersi e trasformarsi in modo assai semplice consiste cosigrave nel produrre una notevole longevitagrave dellrsquoinsieme suscettibile di rinnovarsi anche profondamente senza che i dati giagrave esistenti va-dano perduti Lrsquoedizione digitale a monte non egrave che un insieme di file di testo codificati secondo standard internazionali (in questo

7 Sulla specializzazione dellrsquoedizione digitale in senso linguistico e metrico e sulle potenzialitagrave dellrsquouso di sistemi esperti anche a scopi editoriali si veda piugrave oltre

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

12

DANIElE FuSI

caso Unicode) e strutturati secondo la sintassi di tecnologie ormai universali come XML cui eventualmente si collegano risorse multi-mediali (es fotografie calchi filmati ecc) che rimangono sempre autonome ciograve offre la migliore garanzia non solo di longevitagrave per lrsquoopera ai cui contenuti egrave altrettanto facile accedere come a un qualsiasi semplice testo ma anche di apertura allrsquoespansione e alla trasformazione A valle di questo insieme si trovano appun-to in primo luogo quelle trasformazioni operate dal software che consentono di pubblicare lrsquounico contenuto nelle molteplici forme per i diversi pubblici e media che si desiderano considerare e in prospettiva tutte le trasformazioni che potranno essere necessarie per riconvertire i contenuti in tecnologie future quando quelle di oggi risulteranno ormai obsolete

Fasi redazionali

Il modello qui adottato per la struttura della banca dati si basa dunque essenzialmente su considerazioni semantiche e lo-giche che dalla tradizionale scheda epigrafica traggono un primo alimento per la definizione delle proprie categorie queste tutta-via dietro le quinte sono opportunamente ristrutturate e scom-poste per consentire il migliore trattamento automatico dei dati Il primo requisito egrave infatti costituito dalla completa trattabilitagrave automatica dei dati anche a scapito della loro immediata leggibi-litagrave da parte di un utente umano ciograve garantisce la possibilitagrave di trasformarli facendo loro assumere qualunque veste e di poter attingere ad essi secondo le modalitagrave e gli intenti piugrave disparati Drsquoaltra parte appositi strumenti software di uso redazionale e destinati allrsquoutente finale con ricca interfaccia grafica sono depu-tati a schermare il redattore o il lettore dalla complessitagrave dei dati garantendo la facilitagrave della loro immissione e modifica come del loro recupero da parte del lettore Bencheacute come giagrave osservato i dettagli relativi allrsquoimplementazione prevedano anche lrsquouso di veri e propri database relazionali generati automaticamente dal-lrsquoindicizzazione dei contenuti ritenuti sensibili e rappresentanti un vero e proprio portale di accesso ai dati della piugrave varia natura distribuiti nei contenitori XML tali programmi operano essen-zialmente generando o manipolando codice XML che costituisce la base di partenza della banca dati epigrafica propriamente det-ta Sebbene la scelta di XML possa qui apparire meno ovvia nella misura in cui non si tratta di marcare (cioegrave strutturare) il testo di una scheda epigrafica ma di realizzare una banca dati del tutto

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

indipendente da una forma specifica essa egrave comunque facilmen-te comprensibile considerando che

bull XML egrave uno standard ampiamente diffuso per lo scambio di dati complessi assieme alle loro stesse definizioni nella misura in cui si tratta di un formato autodescrittivo le sue applicazioni sono sempre piugrave estese e stanno modificando profondamente il panorama del-lrsquoinformatica dalla creazione di pagine HTML per il web al rilevante ruolo in sistemi di ultima generazione per la creazione di software come il DotNet framework promosso da Microsoft

bull XML egrave portabile (in quanto semplice testo e dunque platform-independent) aperto ad espansione ed estremamente duttile in quanto alla base di innumerevoli tipi di trasformazione creati per esso un insieme di tag specializzati per la trasformazione di XML in altro XML (da semplice filtro o riordinamento dei dati a profonde alterazioni della loro struttura) o virtualmente in qualsiasi altro for-mato (HTML RTF PDF o altro formato tipografico via XSLFO ecc) definiscono un vero linguaggio di trasformazione (XSLT) che pure in seacute altro non egrave che un testo XML e alle sue capacitagrave di trasforma-zione si possono aggiungere estensioni personalizzate a seconda del compito da affrontare

bull direttamente proporzionale al successo di XML egrave il supporto degli attuali programmi e strumenti di sviluppo software a questa tecnologia la maggior parte del software di nuova generazione per il trattamento di dati consente di gestire XML a cominciare da ap-plicativi della diffusione di Office

bull XML affianca alla strutturazione dei dati la possibilitagrave di una loro rigorosa descrizione formale tramite la creazione di schemi anchrsquoessi rappresentati da semplici file XML creati avvalendosi di una speciale serie di tag definita appositamente per la descrizione semantica del contenuto e del tipo di ogni dato (XSDL) Questo da un lato rende lrsquoXML completamente autodescrittivo e dallrsquoaltro consente di disporre costantemente di un riferimento preciso in ogni suo dettaglio per la strutturazione dei dati e la convalida del-la loro forma e contenuti garantendo in tal modo lrsquointegritagrave della banca dati

bull con la sua strutturazione lsquoad alberorsquo XML consente di descrive-re strutture di alta complessitagrave ben adatte a materiale come testo non facilmente costringibile in schemi troppo rigidi almeno nelle prime fasi della progettazione dellrsquoedizione digitale tanto piugrave in funzione della massima apertura allrsquoespansione e allo scambio dei dati cui qualsiasi progetto in ambito epigrafico dovrebbe tendere

Nel progetto qui presentato dunque lrsquoedizione di dati non ne-cessariamente testuali consiste in semplici file XML dove una strut-

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

DANIElE FuSI

tura gerarchica contiene tutta lrsquoinformazione scomposta e codificata secondo le sue peculiaritagrave Questi file in qualsiasi numero possono riferirsi a unrsquounica struttura (ad es quella relativa ai testi epigrafici) o a piugrave strutture diverse (ad es relative a materiali archeologici) de-stinate a confluire nella pubblicazione integrata per lrsquoutente finale in entrambi i casi comunque una serie di trasformazioni successive assicura la massima flessibilitagrave nella loro presentazione e nello stes-so tempo garantisce flessibilitagrave espandibilitagrave e collaborazione con progetti anche del tutto diversi La figura qui sotto riassume le prin-cipali fasi che conducono dalle banche dati XML alla pubblicazione di una qualsiasi selezione del loro materiale

Figura 7

A monte del sistema si trovano le banche dati XML che sono anzitutto sottoposte a una completa indicizzazione automatica ca-pace di raccogliere tutte le informazioni ritenute sensibili per una specifica presentazione Il frutto di questa indicizzazione egrave rappre-sentato da uno o piugrave database relazionali che rappresentano cosigrave il principale intermediario fra lrsquoutente dellrsquoedizione e i dati che ne sono alla base questo tipo di tecnologia garantisce scalabilitagrave e performance dellrsquoedizione digitale unitamente a tutta la potenza di interrogazioni a base SQL Naturalmente queste doti provengono da una struttura assai piugrave rigida di quella associabile a un file XML liberamente espandibile ma questo non costituisce un limite per il sistema dato che i database relazionali sono qui il prodotto auto-matico dellrsquoindicizzazione di materiali che si trovano contenuti al-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

trove nei file XML In tal modo si unisce la versatilitagrave e la portabilitagrave di XML alla scalabilitagrave e potenza di SQL evitando gli inconvenienti pratici di entrambe le tecnologie Peraltro un ulteriore vantaggio di questo modello sta nel fatto che in questi database possono con-vergere indicizzazioni provenienti da banche dati appartenenti a progetti del tutto diversi purcheacute suscettibili di definire un terreno comune in tal modo si realizza una sorta di portale di accesso con-divisibile fra progetti eterogenei ed indipendenti

La richiesta dellrsquoutente (nel caso di edizioni interattive) o degli autori dellrsquoedizione (nel caso di edizioni lsquotradizionalirsquo su carta o al-tro medium) viene poi riformulata dal software di pubblicazione in modo da accedere ai dati tramite interrogazione del database rela-zionale e per suo tramite risalire ai contenuti memorizzati a monte nei vari file XML Questi contenuti sono cosigrave individuati selezionati e raccolti allrsquointerno di un nuovo contenitore strutturato anchrsquoesso un file XML generato dinamicamente allrsquoatto della richiesta per in-cludere tutti i dati necessari per soddisfarla

Questo contenitore poi puograve subire ulteriori manipolazioni a se-conda delle finalitagrave dellrsquoedizione che basate come sono sulla lsquocom-petenzarsquo dei dati da parte del software consentono di alterarli ben oltre il livello del singolo tag infine una volta giunto al suo stadio finale questo file XML viene trasformato per mezzo di XSLT CSS e tecnologie correlate per generare lrsquooutput da presentare allrsquoutente sia esso HTML RTF PDF o quantrsquoaltro si desideri ottenere secondo i media e i pubblici scelti per lrsquoedizione

Come si vede il passaggio finale egrave comune alle edizioni di testi basate su TEI un testo XML viene trasformato in una delle infinite vesti formali che si desidera attribuirgli con la differenza che qui non si tratta solo di testo neacute questo file XML si trova alla base dellrsquoedizione ma costituisce il prodotto di numerose trasformazioni intermedie

Immissione dei dati e codifica del testo

Si egrave visto come in questo modello concepito per soddisfare esi-genze di progetti molto eterogenei ma inquadrabili in un processo editoriale comune tutti i dati che si desidera inserire nellrsquoedizione siano essi testuali metatestuali o extratestuali sono memorizzati al loro posto e secondo la loro specifica natura allrsquointerno di una arti-colata struttura XML contenuta in file di testo cui si associano ester-namente tutte le risorse multimediali Per gestire lrsquoinserimento e la scomposizione dei dati in queste strutture si utilizza un apposito

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

16

DANIElE FuSI

software che scherma i redattori dalle complessitagrave della codifica sot-tostante consentendo loro di digitare testo come in un applicativo di videoscrittura o inserire ogni dato con lrsquoausilio di unrsquointerfaccia grafica semplice e modulare Lrsquoillustrazione anche sommaria di que-sto applicativo andrebbe oltre gli scopi di questo scritto siccheacute mi limiterograve qui a presentare unrsquoimmagine della sua interfaccia a scopo puramente esemplificativo

Figura 8

Lrsquoimmagine mostra uno dei numerosi pannelli di immissione dei dati relativo al testo epigrafico (in alto a destra) assieme a pannelli elencanti il contenuto del corpus (a sinistra) lrsquoelenco del-le risorse multimediali associate (in basso) ecc In generale per lrsquoutente si tratta di riempire i vari campi di una scheda epigrafica virtuale articolata visivamente in una serie di pannelli ciascuno relativo a un dato tipo di informazioni (paleografiche testuali lin-guistiche filologiche storiche archeologiche multimediali ecc) la particolare struttura del programma consente ad esso di cresce-re assieme allrsquoedizione dato che egrave facile aggiungere nuovi pan-nelli per consentire lrsquoimmissione di nuovi tipi di contenuti Ogni modifica effettuata in un qualsiasi campo della scheda epigrafica

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

17

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

presentata allrsquoutente viene immediatamente codificata e inserita nella struttura XML del file in uso senza che lrsquoutente abbia alcu-na specifica consapevolezza di come questo avvenga dato che il programma si incarica di leggere i dati codificati per visualizzarli nella scheda ed effettuare lrsquooperazione inversa per ogni nuovo inserimento In tal modo si evita di dover sottoporre i redattori a lunghe e complesse fasi di addestramento necessarie magari in altri tipi di progetto dove lrsquoutente stesso egrave deputato a inserire tag XML accanto al testo e si sottopone inoltre ogni immissione a una immediata convalida che riduce la possibilitagrave di errori In questa fase lrsquoopera consiste semplicemente di un qualsiasi numero di file XML ciascuno dei quali contenente un gruppo di epigrafi con tutti i dati ad esse relativi uno o piugrave componenti del personale della redazione inserisce questi dati (o almeno la parte minimale di essi8) utilizzando il programma e lavorando di volta in volta in un file specifico senza necessariamente avere accesso allrsquoinsieme di tutti i file che costituiscono il corpus una volta terminata la fase di immissione egrave dunque operazione banale raccogliere nuovamente insieme tutti i file allrsquointerno del corpus

I file XML che costituiscono lrsquoedizione sono codificati in Uni-code ormai lo standard di fatto sia per la sua diffusione che per la sua compatibilitagrave con i principali standard precedenti (e con il con-corrente ISO 10646 che dagli anni Novanta ha finito per sincroniz-zarsi con esso grazie allrsquoestensione dello spazio di codifica dovuta allrsquointroduzione dei piani con codepoint da 21 e non piugrave 16 bit) Sul piano pratico tuttavia permangono alcune difficoltagrave connesse a questo standard anzitutto data la sua genesi non tutti i caratteri ne-cessari a testi specialistici di ambito umanistico risultano disponibili bencheacute i continui aggiornamenti migliorino la situazione Drsquoaltra parte pochi prodotti software (inclusi sistemi operativi e strumenti di sviluppo) sono aggiornati alle ultime versioni dello standard e in ogni caso la digitazione dei testi puograve spesso risultare problematica La grande varietagrave di piattaforme applicativi di videoscrittura e font utilizzati per i testi greci rende spesso difficile individuare una so-luzione capace di soddisfare almeno la maggior parte dei potenziali redattori ciascuno dei quali tende a mantenere le proprie abitudini

8 Bencheacute la scheda epigrafica nella sua forma attuale comprenda centinaia di campi per soddisfare tutte le esigenze per cui il progetto egrave stato sviluppato la maggior parte di essi rimane opzionale siccheacute lrsquoutente egrave sempre libero di inserire solo i dati essenziali rimandando magari ad altro momento il loro completamento

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

1

DANIElE FuSI

di digitazione Non egrave anzi raro trovare chi ancora oggi continui a digitare testi greci avvalendosi di font dalla codifica del tutto arbi-traria dando quindi luogo a inevitabili problemi di portabilitagrave ogni volta che il testo debba essere trasferito da una macchina allrsquoaltra Una simile situazione talora caotica non puograve perograve giustificare la semplice prosecuzione di una simile prassi che nuoce ovviamente ancor piugrave in progetti editoriali di ampio respiro Per il progetto qui presentato dunque si egrave scelta la codifica Unicode ma con lrsquoadozio-ne di alcune strategie utili a superare entrambe le difficoltagrave citate Non egrave qui possibile descrivere gli strumenti software e le soluzioni adottate a questo scopo ma basteragrave ricordare che grazie a conver-titori testuali di natura euristica realizzati per questo come per altri progetti editoriali la codifica del testo nei file a monte dellrsquoedizio-ne non condiziona in alcun modo lrsquouso delle risorse tipografiche impiegate neacute per la sua pubblicazione neacute per la sua digitazione dato che il software egrave in grado in qualsiasi momento di convertire in modo automatico qualsiasi codifica arbitraria di uno o piugrave font in Unicode o viceversa Pertanto la questione relativa alla lsquoscelta di un fontrsquo spesso confusa con quella della codifica del testo non si pone neacute a livello teorico (percheacute il font egrave semplicemente una risorsa tipografica e in quanto tale appartiene alla presentazione e non al contenuto dunque alle fasi successive del processo editoriale) neacute a livello pratico (dato che rimane possibile adottare i font preferiti Unicode o meno per presentare lrsquounico contenuto) Nel modello qui illustrato inoltre egrave possibile rappresentare qualsiasi carattere utile allrsquoedizione sia esso presente o meno nello standard eo nel font prescelto (che ovviamente per quanto appena detto non deve necessariamente corrispondere ad alcun font scelto per la pubblica-zione finale) senza introdurre alcun codice di carattere arbitrario Quanto infine allrsquoimmissione di testo una volta superati i problemi relativi alla disponibilitagrave dei caratteri rappresentabili con il font pre-scelto si tratta solo di fornire adeguato supporto software per la di-gitazione rispetto alla quale sono disponibili due strategie comple-mentari utilizzando il programma di immissione dei dati si dispone direttamente di unrsquointerfaccia creata appositamente per digitare in modo semplice testo greco e latino con tutti i relativi diacritici con lrsquoausilio (a scelta) di tastiera mouse e tastiere virtuali visualizzate direttamente sullo schermo In alternativa9 gli stessi strumenti sof-tware realizzati per il programma di immissione sono disponibili direttamente dallrsquointerno di applicativi di videoscrittura come MS Word per consentire di digitare testo Unicode al suo interno o di convertire automaticamente in Unicode testo digitato utilizzando il proprio font preferito quale che sia la sua codifica

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

19

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Stratificazione del testo e ortografia

Si egrave dunque visto quale sia la codifica adottata per il testo greco (o latino) della banca dati epigrafica XML e come in ogni caso lrsquouso di Unicode sia poco piugrave di un dettaglio relativo alla sua implemen-tazione interna dato che appositi strumenti software consentono da un lato lrsquoimmissione di testo greco o latino nella forma familiare al redattore per poi generare automaticamente Unicode e dallrsquoaltro la trasformazione di Unicode in un qualsiasi altro formato di output In questo senso in linea teorica il redattore come lrsquoutente finale non hanno alcuna consapevolezza del contenuto nella sua struttura interna dato che ogni sua visualizzazione implica intrinsecamente una sua trasformazione

Un ulteriore esempio utile a illustrare in modo meno astratto lrsquoeffettiva realizzazione della rigorosa separazione tra lrsquounico con-tenuto e le sue molteplici forme egrave costituito non piugrave dalla codifica del testo ma dalla sua struttura allrsquointerno della banca dati XML che offre peraltro un esempio di organizzazione dei contenuti me-tatestuali Tutti gli esempi sinora illustrati hanno mostrato come sia costante la cura di mantenere la neutralitagrave del contenuto e la sua sistematica scomposizione e strutturazione nei suoi elementi atomi-ci sigrave da offrire poi possibilitagrave di una loro ricomposizione in modi e forme virtualmente infiniti Anche la strutturazione del testo quindi non fa eccezione e si riferisce in particolar modo alla soluzione dei problemi relativi allrsquoortografia del testo epigrafico citati sopra relativi al rapporto tra la grafia storica e quella convenzionale Pe-raltro a proposito dei limiti relativi alla marcatura del testo si egrave giagrave visto come sia possibile associare a porzioni del testo svariatissime e virtualmente infinite annotazioni di ogni sorta di carattere (epigra-fico paleografico archeologico storico prosopografico filologico linguistico ecc) in questo senso tenendo conto della necessitagrave di mantenere una struttura facilmente trasformabile e sempre aperta allrsquoespansione senza pregiudizio per il materiale giagrave esistente non sarebbe possibile (neacute auspicabile) inserire tutti questi dati allrsquointer-no del testo originale sottoforma di marcatura

9 Questa soluzione si propone in particolare per il web nella prospettiva di un trasferimento del programma dal computer dellrsquoutente a un server cui lrsquoutente si collega per immettere dati remotamente In tal caso lrsquoutente puograve aver giagrave digitato il testo nel suo applicativo di videoscrittura preferito con il suo font preferito sia esso Unicode o meno ed egrave in grado di copiarlo di-rettamente nella scheda epigrafica che provvederagrave alla sua riconversione in Unicode

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

150

DANIElE FuSI

In conformitagrave al principio della memorizzazione separata di ogni singolo dato nel suo specifico contenitore allrsquointerno della grande struttura gerarchica ad albero alla base della banca dati la soluzione qui adottata per consentire di associare senza limitazioni qualsiasi tipo di informazione a qualsiasi porzione di testo si puograve assimilare allrsquoimmagine di un libro dove un qualsiasi numero di pagine egrave colle-gato allrsquounica costola che le tiene insieme Fuor di metafora la costola del libro egrave rappresentata dal testo cosigrave come appare sulla pietra e le pagine sono costituite da qualsiasi tipo di dato metatestuale si vo-glia associare a una qualsiasi porzione di questo testo Ogni pagina contiene un certo tipo di dato metatestuale strutturato e codificato secondo i propri principi e collegato per riferimento al testo origina-le In tal modo mentre il testo originale rimane inalterato e riflette in tutto lrsquoortografia lsquostoricarsquo del documento rimane possibile aggiungere in qualsiasi momento e senza alcuna limitazione nuovi lsquostratirsquo sopra questo testo ciascuno contenente informazione specifica a un dato campo di interesse Ciograve vale anzitutto per il primo strato metatestuale che definisco lsquoortograficorsquo nel testo di base (la costola del metaforico libro) si riportano esattamente le varie righe cosigrave come appaiono sul-la pietra con tutti gli eventuali lsquoerrorirsquo ortografici e la loro impagina-zione originale qualsiasi lsquocorrezionersquo tesa a ripristinare la nostra con-venzionale ortografia standard rispetto a quanto appare sulla pietra viene invece ospitata a parte su un apposito strato ortografico In tal modo si memorizza da un lato il testo del documento nella sua grafia storica e dallrsquoaltro tutte le varianti normalizzate secondo la prassi ortografica comune questo consente dunque di superare qualsiasi compromesso nella pubblicazione del testo cosigrave come qualsiasi dif-ficoltagrave pratica nellrsquouso dellrsquoedizione infatti il testo che si memorizza risulta in qualche modo lsquodoppiorsquo sia nella sua forma originale che in quella normalizzata pur evitando ridondanze nella misura in cui nello strato ortografico complementare al testo di base si annotano solo le forme che richiedono normalizzazione senza ripetere lrsquointero testo Allrsquoatto della pubblicazione poi lo stesso utente dellrsquoedizione puograve decidere di visualizzare il testo nella sua forma originale o nor-malizzata o in una qualsiasi combinazione delle due (pes forma normalizzata nel testo e forma originale nellrsquoapparato) inoltre qua-lora effettui una ricerca allrsquointerno del corpus saragrave indifferente se ad essere cercata sia la forma nella sua grafia storica (ad es ἐπύησεν) o normalizzata (ad es ἐποίησεν) in entrambi i casi infatti il programma di consultazione saragrave in grado di rintracciare il testo in cui essa occorre dato che puograve estendere la ricerca sia al testo di base (dove appare ἐπύησεν) sia allo strato ortografico (dove appare ἐποίησεν) Infine un si-mile approccio apre la possibilitagrave di ricerche avanzate combinando le

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

151

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

informazioni dello strato ortografico con quelle del testo di base ad esempio lrsquoutente potrebbe cercare tutte le forme di ἐποίησεν con una data grafia itacistica o tutte le parole che in qualsiasi testo presentino υ per οι ecc egrave facile in questo senso comprendere le potenzialitagrave di una simile edizione in campo paleografico e linguistico tanto piugrave che lo stesso programma di pubblicazione potragrave generare in modo del tutto automatico indici estremamente dettagliati e completi di tutte le corrispondenze ortografiche capaci di essere usati come di repertori di errori paleografici o fatti linguistici notevoli Basteragrave infatti che il programma di pubblicazione ripercorra il testo di ogni epigrafe assieme al suo strato ortografico raccogliendo e classificando le cor-rispondenze tra le due grafie storica e convenzionale per generare automaticamente elenchi completi e dettagliati destinati alla consulta-zione da parte dellrsquoutente dellrsquoedizione sia essa digitale o cartacea

Naturalmente questo egrave solo uno degli infiniti tipi di dato che si possono voler associare a una specifica porzione del testo di base numerosi altri strati sono stati creati o aggiunti nel corso dellrsquoespan-sione del progetto originale realizzando cosigrave concretamente quella architettura aperta che si egrave definita come una delle finalitagrave dellrsquoedi-zione qui presentata ad esempio a partire da un testo greco o latino con i soli strati ortografico e di commento (per qualsiasi commento generico associato a una porzione del testo originale) si sono aggiun-ti nel tempo una serie di nuovi strati per contenere dati relativi alle piugrave diverse discipline dellrsquoantichitagrave come filologia (strati di apparato critico per la costituzione del testo e strato delle citazioni letterarie in esso riportate) paleografia (strato riportante dati su nessi e legature del testo di base) storia (strato con dati prosopografici su ogni perso-naggio citato nel testo di base strato cronologico per lrsquoassociazione di datazioni precise a qualsiasi personaggio o evento citato nel testo) ciascuno dotato della sua propria struttura e di una corrispondente interfaccia nel programma di immissione dei dati In questrsquoultimo un apposito pannello egrave deputato alla visualizzazione e immissione di informazione relativa a ogni strato una volta selezionato lo strato di interesse da una casella a discesa il testo di base viene automatica-mente colorato in modo da evidenziare tutta lrsquoinformazione associata in quello strato a ogni porzione di testo consentendo la modifica o lrsquoinserzione dei dati10 Il redattore non deve quindi far altro che

10 Come per numerosi altri aspetti del programma egrave facile immaginare la sua espandibilitagrave parallela a quella della banca dati da esso gestita anche rispetto agli strati metatestuali saragrave infatti sufficiente aggiungere nuove voci alla casella degli strati e nuove finestre di dialogo per modificare i dati per rendere il pro-gramma in grado di gestire nuovi strati avvalendosi dellrsquointerfaccia esistente

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

152

DANIElE FuSI

selezionare una porzione del testo di base e associarvi il tipo di in-formazione che desidera in base allo strato prescelto senza alcuna nozione relativa alla struttura XML gestita dal programma

Figura 9

Questi due esempi relativi alla codifica del testo greco o lati-no e alla sua strutturazione per righe e strati multipli con tutte le annesse operazioni di trasformazione illustrano a sufficienza sul piano metodologico il tipo di implementazione adottato per i vari aspetti dellrsquoedizione elettronica unicitagrave del contenuto e sua separa-zione dalle molteplici forme da esso rivestibili scomposizione del contenuto in elementi atomici e loro strutturazione e classificazio-ne semantica trasformazioni automatiche piugrave o meno complesse a ogni livello per la generazione di output derivanti dalla varia com-binazione di questi elementi il tutto realizzabile con un notevole apparato di strumenti software realizzati ad hoc In tale ambito si comprendono meglio anche le prospettive filologica da un lato e informatica dallrsquoaltro alla base dei principi teorici del progetto che tuttavia nelle intenzioni dellrsquoautore possono progredire ben oltre anche sulla base della sua realizzazione

Pubblicazione e competenza del software

Si egrave visto come una volta terminata la fase di acquisizione e strutturazione del materiale sia per i suoi aspetti multimediali che per quelli piugrave strettamente testuali una serie di file di immagine (fotografie e calchi) e file XML (banca dati delle iscrizioni e file di informazione meta-grafica) rigorosamente separati ma correlati fra loro costituisce il materiale completo della banca dati del corpus A partire da questi dati una serie di quattro o cinque fasi successi-

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

15

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

ve di trasformazione conduce poi alla generazione automatica del prodotto finale in modo predeterminato o interattivo a seconda del tipo di pubblicazione Se non egrave qui possibile descrivere con minore approssimazione tali fasi puograve tuttavia essere utile evidenziare come vari tipi di trasformazione presumano nel software quanto si puograve definire con una metafora linguistica una certa lsquocompetenzarsquo del dato trattato egrave proprio questa competenza che discende diretta-mente dalla scomposizione semantica dellrsquoinformazione a rendere possibili trattamenti automatici anche complessi Per brevitagrave se ne possono qui citare un paio relativi alle interazioni fra strati e alla trasformazione del testo fino al livello del singolo carattere ben oltre le usuali tipologie basate sulla individuazione dei tag in un testo marcato

In primo luogo si pensi alla stratificazione dei dati metatestuali rispetto al testo di base si egrave visto come fra gli strati trovi posto an-che lrsquoinformazione relativa allrsquoapparato critico che in certi casi egrave ov-viamente suscettibile di alterare direttamente lo stesso testo di base cui si riferisce Un esempio banale egrave rappresentato da una variante accettata dallrsquoeditore in sostituzione o aggiunta al testo di base per cui bencheacute i due tipi di informazione giacciano su piani distinti allrsquoatto della pubblicazione essi sono combinati per modificare il testo di base quando lrsquoutente desideri visualizzarlo nella sua forma definita dallrsquoeditore Un caso piugrave complesso si realizza poi con lrsquoin-terazione fra testo di base strato di apparato e strato ortografico ad esempio a una grafia itacistica come μνίας memorizzata come tale nel testo di base egrave associata nello strato ortografico una grafia standard come μνείας (con tutti i dettagli operativi della corrispon-denza tra le due forme) Quando lrsquoutente decide di visualizzare il te-sto edito nella sua forma normalizzata il software di pubblicazione provvede a estrarre la grafia μνείας dallo strato ortografico sostituirla nel testo di base allrsquooriginario μνίας e qualora lrsquoapparato critico sia stato selezionato fra i componenti dellrsquooutput desiderato aggiunge autonomamente una voce allrsquoapparato per indicare la grafia origi-naria (ad es μνείας lapis) Tutto ciograve naturalmente non tocca mai i dati memorizzati nelle strutture XML a monte dellrsquoedizione ma avviene dinamicamente allrsquoatto della consultazione interattiva manipolando il file XML generato sul momento in base ai dati raccolti con unrsquoin-terrogazione al database relazionale In tal caso dunque il software si avvale della propria cognizione della relazione fra i dati scompo-sti e correlati fra loro dietro le quinte per ricombinarli e alterarli a seconda delle esigenze dellrsquoutente

A questo esempio di trasformazione se ne puograve affiancare un secondo operante a un livello ancora piugrave basso sino allrsquoatomo del

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

15

DANIElE FuSI

carattere Si egrave giagrave detto come la sua pubblicazione risulti del tutto indipendente da una specifica risorsa tipografica dato che il con-vertitore euristico citato sopra egrave utilizzabili per transcodificare il testo quale che sia il formato di output prescelto consentendo cosigrave lrsquouso di qualsiasi font sia esso Unicode o meno Ancor prima di que-sta operazione di transcodifica peraltro si puograve collocare unrsquoulterio-re serie di trasformazioni derivanti direttamente dalla lsquocompetenzarsquo che il programma ha del testo epigrafico inserito nella banca dati guadagnata attraverso operazioni di parsing la cui complessitagrave sfug-girebbe necessariamente a una tecnologia di trasformazione come XSLT e resa possibile dellrsquouso di una codifica come Unicode Questa tecnologia infatti non egrave banalmente solo una lista che assegna un codice numerico a ogni carattere del testo11 ma rappresenta una vera e propria banca dati di caratteri dove di ciascuno si definisce significato forme contestuali disposizione nel rigo di testo posizio-ne dei diacritici valore rispetto alle varie operazioni di processing del testo ecc Ad esempio dinanzi a un codice numerico Unicode il software puograve giagrave sapere a priori se si tratti di una lettera maiu-scola o minuscola e a quale sistema di scrittura appartenga o se sia un segno di interpunzione di apertura o chiusura una cifra un simbolo ecc Questo tipo di competenza a livello di carattere puograve quindi essere messa a frutto per ottenere forme anche molto diver-se fra loro e collocabili in qualsiasi punto intermedio fra il testo di una tradizionale edizione a stampa e quello inciso sulla superficie della pietra Il modo piugrave semplice per illustrare in breve queste ope-razioni egrave citarne qualche esempio concreto a partire dallo stesso programma di immissione dei dati che include anche le funzioni di pubblicazione anzitutto a beneficio del redattore abilitato a perso-nalizzare ogni aspetto delle trasformazioni effettuate Ad esempio si consideri la figura riportata qui sotto relativa a una delle numerose interfacce offerte dal programma per queste operazioni di pretrat-tamento del testo

11 Naturalmente anche questa corrispondenza egrave poi meno banale di quanto per semplicitagrave qui intendo mostrare si pensi solo che nel caso di Unicode la mappatura di un carattere (che giagrave rappresenta unrsquoastrazione rispetto alla no-zione di glyph) passa in realtagrave attraverso almeno quattro stadi principali con-cettualmente enumerati come abstract character repertoire coded character set storage format serialization format

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

155

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Figura 10

Come si vede egrave possibile scegliere se nel testo pubblicato si desideri sciogliere o meno le abbreviazioni (e nel secondo caso aggiungere un punto dopo le lettere relative allrsquoabbrevia-zione non soluta) come trattare lo scioglimento di abbreviazioni particolari in rapporto al testo che ne deriva (ad es quelle du-plicate per indicare un plurale come DD(omini) o quelle dotate di una lettera diversa nella forma abbreviata come C(aius)12) se visualizzare o meno integrazioni editoriali lettere in rasura o in

12 Simili opzioni sono finalizzate non solo a soddisfare diversi pubblici ma anche a produrre un testo ulteriormente manipolabile in modo automatico senza che il programma si trovi dinanzi a monstra come ddomini o Caius invece dei corretti domini e Gaius

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

156

DANIElE FuSI

litura aggiunte del lapicida lettere oggi scomparse dalla pietra linee tracciate sopra le lettere nel testo originale inoltre si puograve decidere se visualizzare lettere particolari come le claudiane o H = h del greco o un sigma lunato o sostituirle con le loro for-me piugrave standard (ad es trasformando la H in spirito aspro o un sigma lunato nella sua forma standard finale o meno a seconda del contesto) se visualizzare o meno tutti i diacritici moderni sulle lettere come trattare quelli antichi come lrsquoapex se visua-lizzare lrsquointerpunzione moderna e antica se visualizzare tutte le lettere in maiuscola se inserire o meno gli spazi che dividono le parole nellrsquoedizione moderna ma in scriptio continua nel testo ecc Inoltre si puograve decidere il livello di interazione del testo di base con quegli strati metatestuali direttamente coinvolti nella sua trasformazione come anzitutto lrsquoapparato critico e lo strato ortografico consentendo cosigrave la sostituzione delle grafie storiche con quelle normalizzate lrsquoinserzione degli opportuni diacritici editoriali (tipicamente parentesi) e le lezioni del testo originale con quelle proposte in apparato ed accettate dallrsquoeditore In tal modo il software combina e riassembla diversi tipi di informazio-ne scomposti e memorizzati ciascuno nel suo contenitore gene-rando di volta in volta lrsquooutput richiesto dallrsquoutente o dallrsquoeditore Ad esempio un testo del tutto fittizio come

M(arcus) Iūl(ius) middot Cae[sar] diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

potrebbe essere pubblicato in forme diverse a seconda delle scelte effettuate

M Iūl Cae diacutevus μῆνιν ἄειδε θεά Πηληϊάδεω Ἀχιλῆος ἅρπη

MIULCAEDIacuteVUSMHNIAEIΔΕΘΆΠΗΛΗΙΆΔΕΩΆΧΊΛΗΌΣΗΆΡΠΗ

M Iul Cae diacutevus μηνιν αειδε θεα Πηληιαδεω Αχιληος hαρπη

Figura 11

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

157

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

Questo tipo di trasformazione dunque non rappresenta un sem-plice requisito tecnico come nel caso della transcodifica testuale ne-cessaria per generare qualsiasi codifica e formato digitali desiderati ma consente allrsquoeditore come al fruitore dellrsquoedizione di scegliere in ogni momento il tipo di informazioni da visualizzare nel testo e quanto esso debba apparire vicino a quello originale selezionando nel dettaglio ogni aspetto relativo alle convenzioni editoriali di un testo epigrafico A tale scopo il programma si basa appunto sulla sua competenza del testo originale di cui egrave in grado di individuare i diversi elementi come integrazioni scioglimenti di abbreviazioni interventi editoriali uso di lettere e diacritici ecc

Peraltro egrave importante ribadire come tutti questi tipi di trasfor-mazione non alterino in alcun modo il contenuto della banca dati che si trova collocato molto piugrave a monte del testo XML generato automaticamente nelle fasi successive del processo di pubblica-zione si tratta solo di definire diversi modi di attingere ad essi e di combinarli nel generare dinamicamente la forma desiderata In tal modo si ottiene una grande versatilitagrave dellrsquounico contenuto dellrsquoedizione capace di assumere forme virtualmente infinite in formati di volta in volta adatti al medium e al pubblico prescelti proprio in virtugrave della semantizzazione e della scomposizione dei suoi dati effettuata dallrsquoautore con lrsquoausilio del software di immis-sione dati Inoltre questa capacitagrave di trasformazione puograve essere messa a frutto non solo per gli scopi della pubblicazione (per cui essa egrave ovviamente parte integrante del progetto editoriale) ma an-che per convertire lrsquoedizione in un qualsiasi altro formato (ad es TEI) magari al fine di scambiare i dati con altri corpora digitali o in prospettiva per adeguarsi al mutato panorama delle tecnologie informatiche mantenendo lrsquoopera aggiornata e al riparo dal peri-colo di una precoce obsolescenza

Prospettive

Come si egrave ricordato il progetto qui presentato egrave frutto di una costante evoluzione ed espansione rese possibili dallrsquoadozione sin dalla sua origine di una struttura appositamente concepita per es-sere il piugrave possibile aperta e versatile e rispetto alla quale si giusti-ficano le varie scelte relative alle tecnologie adottate e la creazione (tuttora in corso) di tutta una serie di strumenti software capaci di operare in sinergia per supportare tutte le sue fasi editoriali Se da un lato la sua recente espansione al mondo medievale con tutte le necessarie aggiunte alla struttura della banca dati testimo-

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

15

DANIElE FuSI

nia concretamente di questa sua versatilitagrave anche lrsquoinserimento di questo progetto editoriale nellrsquoambito di piugrave ampie iniziative come quella promossa dallrsquoUniversitagrave di Sydney per la raccolta del materiale documentario relativo al teatro greco antico rappresenta lrsquooccasione per dimostrare la funzionalitagrave di questa architettura anche ben oltre gli scopi per i quali il progetto originario egrave stato avviato Si egrave infatti visto che un aspetto fondamentale del progetto egrave costituito dallrsquouso di grandi e articolati contenitori XML che nelle prime fasi redazionali consentono di strutturare e memorizzare ogni tipo di informazione con grande duttilitagrave e fluiditagrave requisito essenziale specie durante lrsquoavvio di progetti editoriali di ampio respiro per i quali egrave inevitabile partire con un semplice abbozzo di idea destinato a definirsi meglio nel corso stesso della raccolta e dellrsquoanalisi del materiale Nel caso di questa espansione dun-que tale caratteristica risulta ancora piugrave utile nella misura in cui si tende a creare una grande banca dati dove lrsquoaspetto epigrafico saragrave in prospettiva solo uno dei numerosi considerati accanto ad esempio a testi letterari e documenti materiali come vasi ostraka maschere teatrali ecc In questo ambito saragrave infatti possibile ope-rare sempre allrsquointerno della medesima struttura redazionale e in certa misura con gli stessi strumenti software giagrave disponibili semplicemente affiancando allrsquolsquoalberorsquo dellrsquoinformazione relativo a testi epigrafici nuovi lsquoalberirsquo ciascuno dei quali specializzato per contenere e strutturare al meglio un dato tipo di contenuti La capacitagrave di trasformazione implicita in ciascuno di essi faragrave poi sigrave che sia possibile unificare tutte queste fonti di informazione in un insieme coerente opportunamente indicizzato e strutturato per la pubblicazione su diversi media e per diversi pubblici nondimeno le procedure generali e la filosofia alla base di questo progetto rimarranno inalterate a dimostrazione della effettiva sua capaci-tagrave di soddisfare gli scopi per i quali egrave stato concepito unrsquounica banca dati altamente strutturata dal solo punto di vista semantico diviene cosigrave capace di trasformarsi in forme virtualmente infini-te adatte ai media e ai pubblici piugrave disparati e nel contempo di estendere i suoi contenuti nel senso della specializzazione come dellrsquoespansione a dati persino privi di un contenuto testuale Pe-raltro il progetto qui illustrato egrave parte di un panorama che nelle intenzioni del suo autore puograve risultare ancora piugrave ampio in virtugrave proprio delle prospettive filologiche e linguistiche cui accennavo in principio Di fatto la disponibilitagrave di edizioni elettroniche di corpora testuali classici al di lagrave degli ovvi benefici come strumenti di studio e consultazione a ogni livello da quello del visitatore occasionale fino allo studioso specialista offre in prospettiva an-

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

159

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

che enormi potenzialitagrave di analisi automatica Molti degli strumen-ti software utilizzati in questo progetto infatti sono parte di un piano di lavoro assai piugrave vasto che trae origine dai miei interessi linguistici e metrici e si alimenta parallelamente di opere in corso di realizzazione per case editrici operanti nellrsquoambito delle lingue classiche Una seconda generazione di software da me realizzato o in corso di realizzazione seguendo le ultime tecnologie nellrsquoam-bito dellrsquoingegneria del software per il mercato dellrsquoinformatica personale (anzitutto il DotNet framework di Microsoft) mira infatti a porre le basi per veri sistemi esperti delle lingue classiche fina-lizzati a ricerche concrete come ad esempio lrsquoanalisi automatica prosodica metrica e linguistica di testi poetici13 o la creazione di una grammatica storica elettronica della lingua latina e greca ca-pace di offrire la completa flessione di ogni lemma del vocabolario completa di tutti i suoi stadi storici intermedi ricostruiti o attestati In questo senso la disponibilitagrave di corpora testuali di estensione paragonabile a quella degli attuali CD-ROM Packard Humanities per la letteratura greca o latina ma tratti da materiale epigrafico di estremo interesse sul piano linguistico anzitutto per la prezio-sa testimonianza della viva evoluzione linguistica potrebbe offri-re interessanti campi di ricerca per analisi informatizzate a vasto raggio capaci di fornire dati abbondanti dettagliati e di prima mano su fenomeni metrici e linguistici di ogni sorta raccolti con un metodo coerente e rigoroso nella misura in cui richiede una severa formalizzazione per essere compreso da una macchina La disponibilitagrave di materiale in formato elettronico puograve ovviamente costituire lrsquoindispensabile premessa per simili ricerche tanto piugrave se come nel caso del progetto qui presentato i principi stessi alla base dellrsquoedizione siano concepiti sin dallrsquoinizio come funzionali ad applicazioni il piugrave possibile diversificate e non strettamente epigrafiche come indagini paleografiche o linguistiche Peraltro a loro volta questi progetti possono fornire interessanti interazio-ni anche in rapporto allrsquoedizione elettronica ad esempio al di lagrave del rilevante e intrinseco interesse teorico la creazione di un motore flessivo per una lingua classica offre poi numerose appli-cazioni pratiche specie nellrsquoambito dellrsquoeditoria elettronica dalla quale drsquoaltra parte un simile progetto trae origine (nellrsquoimmediato

13 Di unrsquoanalisi informatizzata relativa a testi epici greci per un totale di circa novantamila versi ho offerto un saggio in Fusi 2002a e in Fusi 2002b frutto entrambi di una prima generazione di strumenti software realizzati in occasio-ne della mia tesi di dottorato

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

160

DANIElE FuSI

il riconoscimento del lemma cui una forma flessa appartiene) per limitarsi solo ad alcuni esempi piugrave da vicino connessi allrsquoedizione epigrafica la disponibilitagrave di ogni forma flessa puograve essere sfruttata a scopi molto vari a seconda del contesto

bull in un corpus di testi siano essi epigrafici papiracei o lsquolet-terarirsquo diviene possibile lemmatizzare ogni singola parola ricon-ducendo tutte le sue varie forme flesse allrsquounico lemma egrave infatti evidente che consultando i prodotti della flessione forme come laudābat laudētis laudāti erimus ecc potranno tutte essere ri-condotte allrsquounico lemma laudō fornendo anzitutto unrsquoindica-zione assai piugrave significativa della frequenza testuale di ogni lsquopa-rolarsquo Peraltro questo vantaggio non si limita allrsquoaspetto lsquostaticorsquo relativo ad esempio alla creazione di indici in unrsquoedizione ma sul piano lsquodinamicorsquo della pubblicazione elettronica una simile capacitagrave rende infinitamente piugrave efficace una ricerca allrsquointerno di corpora testuali tanto piugrave in lingue flessive complesse come quelle classiche in esse infatti una singola lsquoparolarsquo puograve assumere anche centinaia di forme diverse a seconda della sua flessione che sarebbe ben difficile far rientrare in espressioni di ricerca (senza peraltro considerare che la gran parte degli strumenti di ricerca offre capacitagrave assai limitate per la loro formulazione senza ricorrere neppure alla potenza delle espressioni regolari) Di fatto attualmente si tenta di rimediare a questa situazione effettuando piugrave ricerche per la stessa parola e limitandosi alle forme che si reputano piugrave frequenti oppure allargando le maglie della ricerca sigrave da produrre un enorme numero di risultati non pertinenti Avvalendosi invece della capacitagrave flessiva del motore sarebbe semplice richiedere la ricerca di tutte le forme di laudō affidando al programma di consultazione il compito di effettuare la ricerca richiesta in rapporto a tutte le possibili forme che tale parola puograve assumere nella sua flessione

bull unrsquoulteriore applicazione pratica di facile comprensione egrave in questo ambito una semplice specializzazione di quanto appena il-lustrato in rapporto a edizioni elettroniche di natura epigrafica si pensi ad esempio alla possibilitagrave di costruire un repertorio completo delle abbreviazioni presenti in tutte le iscrizioni del corpus dotato peraltro di unrsquoinformazione aggiuntiva che nessun repertorio carta-ceo fornisce come la frequenza testuale di ciascuna di esse La crea-zione di un simile repertorio egrave possibile solo in virtugrave della capacitagrave di lemmatizzare offerta dal motore flessivo nella misura in cui ad esempio forme come f(īlius) f(īlī) f(īliī) f(īliae) f(iliīs) f(īliārum) ecc devono essere tutte ricondotte alla medesima parola cui cor-risponde la stessa abbreviazione F la cui frequenza saragrave dunque

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

161

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

costituita dalla somma delle frequenze di tutte le sue forme flessebull specie per testi spesso mutili come epigrafi o papiri un reper-

torio di tutte le forme flesse a partire da un lessico sufficientemente completo della lingua latina (comrsquoegrave quello che ha dato origine al progetto) potrebbe poi essere utilizzato come strumento ausiliario per lrsquoeditore stesso si pensi ad esempio alla possibilitagrave di suggerire tutte le possibili integrazioni di una parola mutila di cui magari si conoscano solo alcune lettere iniziali eo finali e unrsquoestensione approssimativa un programma potrebbe in tal caso effettuare una ricerca completa su tutto il repertorio delle forme flesse per sugge-rire tutte quelle che formalmente risultino compatibili con lo spazio della lacuna Naturalmente lrsquoeditore dovrebbe poi compiere comun-que una scelta in base a criteri ben piugrave rilevanti ma lo spettro delle possibilitagrave suggerite dal programma potrebbe in ogni caso costituire un comodo punto di partenza e considerare anche forme cui un editore potrebbe non giungere a pensare14

bull unrsquoapplicazione banale di un tale repertorio puograve inoltre essere offerta da sistemi di controllo di testi elettronici quale che sia la loro destinazione per citare esempi ovvi in virtugrave della loro diffu-sione si possono citare i numerosi meccanismi di controllo orto-grafico implementati nei piugrave comuni applicativi di videoscrittura o desktop-publishing siccheacute ad esempio un tale repertorio potrebbe

14 Non sarebbe peraltro possibile obiettare che simili risultati si possano raggiungere anche tramite la mera indicizzazione di un vasto corpus testuale egrave noto ad esempio che meritorie opere come il Thesaurus Linguae Graecae offrono un indice completo di tutte le forme che appaiono nei testi che co-munque risulta per sua natura diverso rispetto a quello offerto da un motore flessivo laddove infatti il repertorio si limita a elencare le parole attestate nei testi inclusi nel corpus senza peraltro consentire una loro lemmatizzazione le forme flesse sulla base teorica da un motore possono naturalmente includere anche forme effettivamente non attestate nei testi in nostro possesso o inclusi nel corpus ma del tutto legittime rispetto alla grammatica della lingua Nes-sun corpus testuale infatti per quanto ampio e completo potrebbe contenere tutte le forme possibili della lingua latina o greca incluse varianti dialettali o arcaiche per fare un banale esempio di fantasia il fatto che magari nessuno dei nostri testi includa una forma di genitivo come rŏsāī per il termine rŏsa non implica certo che una tale forma non sia esistita ma semplicemente che essa del tutto legittima rispetto alla grammatica latina non egrave attestata nei testi a noi giunti Dato che il motore flessivo genera tutte le forme lsquogrammaticalirsquo di una parola essa potragrave invece figurare nel suo repertorio di termini e quindi essere adeguatamente considerata in tutti i casi in cui sia necessario effettuare ricostruzioni (come ad esempio per sanare lacune) o affrontare qualsiasi tipo di ricerca in cui quanto sia rilevante non sia lrsquoeffettiva attestazione ma la pura lsquogrammaticalitagraversquo di una forma

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

162

DANIElE FuSI

facilmente individuare inevitabili errori di digitazione presenti in corpora testuali o opere come vocabolari siano essi destinati alla pubblicazione elettronica o cartacea

bull dal punto di vista strettamente linguistico oltre allrsquoovvio inte-resse implicato dalla realizzazione di un simile motore egrave facile im-maginare le molteplici applicazioni cui sarebbe possibile piegare un repertorio di tutte le forme lsquogrammaticalirsquo della lingua ad esem-pio anche solo per lrsquoanalisi statistica delle strutture formali della lingua stessa (frequenze dei fonemi ordine delle loro sequenze tipi sillabici configurazioni accentuali configurazioni quantitative ecc) con tutte le connessioni e le implicazioni a osservazioni ge-nerali di natura prosodica e metrica15

bull rispetto ad altri strumenti informatici di analisi evoluta come ad esempio quelli realizzati in concomitanza al motore per lrsquoanalisi prosodica e metrica di testi poetici classici la capacitagrave di lemma-tizzare e individuare i rapporti sintattici fra parole allrsquointerno del verso costituisce poi un interessante presupposto per lrsquoideazione di strumenti ancor piugrave raffinati capaci di riconoscere la strutturazione superficiale della frase sigrave da aggiungere a criteri puramente formali informazioni di natura sintattica e semantica allrsquoarticolazione com-plessiva del verso

Naturalmente questi sono solo alcuni esempi di applicazioni piugrave o meno complesse ma comunque in grado di mostrare le po-tenzialitagrave scientifiche e pragmatiche derivanti non solo dalla proget-tazione di edizioni elettroniche concepite secondo principi teorici e metodologici aperti al piugrave vasto campo di utilizzo ma anche dal-lrsquointerazione di diversi progetti accomunati dallrsquouso dello strumen-to informatico e per conseguenza dalla realizzazione di software estremamente specializzato nellrsquoambito della programmazione for-temente orientata agli oggetti la versatilitagrave e il riutilizzo di ogni stru-mento creato allrsquointerno di un progetto per contribuire alla realizza-zione di altri progetti costituisce il paradigma di unrsquoedizione capace

15 Si pensi ad esempio ai numerosi casi in cui sia necessario interpretare un fenomeno metrico per decidere della sua natura piugrave o meno lsquointenzionalersquo (fenomeno effettivamente ricercato dal poeta per scopi artistici) o lsquoaccidentalersquo (fenomeno risultante semplicemente dallrsquointerazione piugrave o meno complessa di fattori di natura linguistica) un classico caso per il latino egrave ad esempio il rapporto fra configurazioni quantitative e accentuali nella clausola esametrica donde lrsquoapparente attenzione della versificazione latina alla regolazione di accenti in clausola che in realtagrave discende in larga parte dalla regolazione delle quantitagrave (di cui lrsquoaccento latino egrave ovviamente in funzione)

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15

16

EDIZIONE EPIgRAFICA DIgItAlE DI tEStI gRECI E lAtINI

non solo di presentarsi come strumento di ricerca o divulgazione con la massima espandibilitagrave e versatilitagrave possibili ma anche fon-damento di ulteriori progetti informatici rivolti ad altri campi delle scienze dellrsquoantichitagrave

Bibliografia

Fusi 2001-2002 = D Fusi Epigrafia informatica progetto per unrsquoedizione elettronica di materiale epigrafico in laquoSeiaraquo ns VI-VII (2001-2002) pp 177-210

Fusi 2002a = D Fusi Fra metrica e linguistica per la contestualizzazione di alcune leggi esametriche in Lrsquoesametro greco e latino analisi proble-mi e prospettive Atti del convegno (Fisciano 28-29 maggio 2002) a cura di E Di Lorenzo pp 33-63

Fusi 2002b = D Fusi Appunti sulla prosodia del Lussorio di Shackleton-Bailey alcune questioni di metodo in F Bertini (a cura di) Luxoriana Genova 2002 pp 193-313

Krummrey - Panciera 1980 = H Krummrey - S Panciera Criteri di edizione e segni diacritici in laquoTituliraquo II (1980) pp 205-15