ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte...

33
ARCHIVISTICA III.0 La modellizzazione, la codifica digitale e le fonti storico- archivistiche Lezione 5 DOTT.SSA SERENA FALLETTA

Transcript of ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte...

Page 1: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

ARCHIVISTICA III.0 La modellizzazione, la codifica

digitale e le fonti storico-archivistiche

Lezione 5

DOTT.SSA SERENA FALLETTA

Page 2: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Una questione metodologica

Quesiti teorici: all’epistemologia delle fonti storiche in relazione alla metodologia e alla strumentazione adottate

La teoria e la prassi: quante riflessioni sono state oziosamente proposte su questo antichissimo rapporto dialettico, ma quale rivoluzione radicale e dirompente ha prodotto l’informatica, per la quale il detto è fatto, l’algoritmo è la propria realizzazione e per conseguenza, chi non teorizza, o teorizza male, produce danni (T. Orlandi Prefazione a R. Mordenti, Informatica e critica dei testi, Roma 2001 (Informatica e discipline umanistiche, 10), p. 8)

Page 3: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Informatica umanistica: ricomporre relazioni perdute?

Natura ibrida del computer e del digitale:

Ø  strumenti e ambiente nel quale siamo immersi

Ø  oggetti e memoria

Ø  materia e informazione

Ø  intreccio tra technè ed episteme

Essenza principalmente metodologica e non applicativa dell'IU

Cfr.: D.J. Froger, La critique des textes et son automatisation, Paris 1968; Convegno Internazionale di Parigi: La pratique des ordinateurs dans la critique des textes del 1978

NB.: i l dato vincola l ’ interpretazione così come l’interpretazione vincola il dato

Page 4: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Nuove soluzioni per vecchi problemi

Trascrivere e codificare hanno sempre messo chi lo fa di fronte a delle scelte fondative

In ambiente informatico tuttavia siamo COSTRETTI a ripensare radicalmente la nozione stessa di TESTO e di DOCUMENTO

ê

La codifica di un testo su supporto digitale, come ogni processo di rappresentazione che coinvolge il computer, è mediata da un apposito linguaggio formale, vincolato da rigide regole sintattiche che richiedono la risoluzione di ogni ambiguità

Page 5: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Il testo atomizzato

Codifica come processo più complesso, che impone riflessione sul problema testuale

What is text, really? OHCO = Ordered Hierarchy of Content Objects : gerarchia ordinata di parti dotate di contenuto con una struttura a grafo che ne organizza gli insiemi come oggetti astratti, ordinati in modo sequenziale e lineare e rappresentati dalle segmentazioni successive e contingue del discorso

Page 6: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Trascrizione come codifica

Costringe a:

1) interrogarsi analiticamente su cosa si sta codificando, ricodificando o decodificando

2) scomporre questo qualcosa in elementi discreti

3) ordinare in modo sequenziale le operazioni per evitare ambiguità, contraddizioni e ridondanze

4) formulare tutto ciò rigorosamente

I n a l t r e p a r o l e : fo r n i r e a d e g u a t a q u a n t i t à d i informazione sull'informazione

Page 7: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Non neutralità dei linguaggi di codifica

gli strumenti di ricerca e le descrizioni veicolano sempre ideologie, visioni del mondo e soprattutto della storia; tendono insomma a trasmettere un’immagine della documentazione che contiene nuclei di interpretazione storiografica più o meno forti, ma comunque in grado di condizionare il modo in cui essa, e il processo della sua produzione, vengono percepiti dal ricercatore. Qualsiasi ipotesi di strutturazione dell’informazione contiene, quindi, implicitamente, se non esplicitamente, una proposta di attribuzione di senso all’informazione stessa: ciò vale ancora di più quando questa venga inserita in una cornice tecnologica (S. Vitali, “Archivi on line”: qualche riflessione metodologica, in Workshop su Archivi storici e archivi digitali tra ricerca e comunicazione, Firenze 2000)

Page 8: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

La soggettività del codificatore

la soggettività dello studioso è un presupposto ineliminabile dello studio storico, così come la soggettività lo è di qualsiasi forma o attività di conoscenza

G. Galasso (Nient’altro che storia. Saggi di teoria e metodologia della storia cit., p. 115

a condizione di conoscerlo, padroneggiarlo e soprattutto non attribuirgli prerogative improprie, non c’è alcuna fondata ragione perché il computer alteri la qualità di un problema

T. Detti, Lo storico e il computer: approssimazioni, in Storia & Computer. Alla ricerca del passato con l’informatica cit., pp. 83-104:104

il programma del programmatore: questo è quel che mi interessa (F. Braudel)

Page 9: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Documento cartaceo vs. documento elettronico

Page 10: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

La modellizzazione

Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza astrazione. Quest’ultima consiste nel prendere la porzione dell’universo considerata e nel sostituirla con un modello avente struttura analoga, ma più semplice (A. Rosenblueth, N. Wiener, The role of the Models in Science, in «Philosophical science», 12 (1945), pp. 316-321:320.)

Page 11: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Tipologia di astrazioni

classificazione: individuazione delle caratteristiche comuni di entità diverse e definizione una c l a s s e s u p e r i o r e c h e l e rappresenti aggregazione: definizione di una classe di oggetti integrando le caratteristiche di ognuna delle classi subordinate in una nuova classe generalizzazione: definizione di una classe come unione di un insieme di classi che ereditano le caratterist iche della classe superiore

Page 12: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Granularità

GRANULARE: ridotto in granuli; composto di granuli; costituito da elementi a forma di granuli (una sostanza). Per estensione: ruvido, scabro (una superficie); granuloso (DIZIONARIO ITALIANO) A measure of the size of the segments into which memory is divided for purposes of either memory protection or virtual-memory management (DICTIONARY OF COMPUTING) Granularity is the relative size, scale, level of detail, or depth of penetration that characterizes an object or activity. It may help to think of it as: which type of ‘granule’ are we looking at? This term is used in astronomy, photography, physics, linguistics, and fairly often in information technology. It can refer to the level of a hierarchy of objects or actions, to the fineness of detail in a photograph, or to the amount of information that is supplied in describing a person’s age. Its meaning is not always immediately clear to those unfamiliar with the context in which it’s being used (WHATIS.COM)

Page 13: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Discrezionalità

la necessità di una sperimentazione graduale, relativamente indolore, attenta ai linguaggi di codifica ma affatto destabilizzante rispetto alle pratiche tradizionali della critica documentaria, non potrà sortire particolari successi se orientata al collaudo di standard universali e ‘chiusi’, applicati o presumibilmente applicabili a qualsiasi fenomeno testuale: occorrerà tenere sempre ben presente che un testo giuridico, un testo letterario, un testo documentario, ovvero un corpus di testi difficilmente potranno essere ingabbiati entro strutture logico-semantiche o di semplice descrizioni uniformi e ripetitive se non rinunciando a esplicitarne, nelle scelte della codifica, gli elementi legati alle rispettive specificità e storicità (M. Ansani, Un passaggio complicato. L’edizione di fonti storiche in rete, in Il documento immateriale. Ricerca storica e nuovi linguaggi, in «L’Indice dei libri del mese», Dossier 4 (maggio 2000), a cura di G. Abbatista e A. Zorzi)

Page 14: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Il modello entità/relazione

e n t i t à : e l e m e n t i c o n proprietà omogenee nel contesto in esame attributi: descrivono le entità e rappresentano le proprietà della classe relazioni: individuano i legami logici tra le istanze di una o più entità

Page 15: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

RECAP: codifica, modellizzazione, interpretazione

1. nessun sistema di marcatura è indipendente da un accordo preventivo su ciò che interessa recuperare informaticamente 2. ciò che si vuole codificare è ciò che si vuole conservare 3. i documenti storici veicolano contenuti e informazioni che vanno riconosciuti preventivamente e collegati tra loro 4. codificare significa quindi operare delle scelte memorizzare e codificare un testo, farne un’edizione – così come in passato – significa introdurre una nostra griglia interpretativa tra le sue pieghe: rompere i legami che in esso ci appaiono naturali per disporre le sue parti (quelle parti che siamo riusciti ad individuare) in un ordine diverso (G. Gigliozzi, Il testo e il computer. Manuale di informatica per gli studi letterari, Milano 1997 (Sintesi), p. 209)

Page 16: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Modelli di marcatura standardizzati: TEI Text Encoding Initiative: progetto di ricerca internazionale volto allo sviluppo di un sistema di codifica uniforme per la rappresentazione dell’informazione testuale e la gestione dei dati umanistico-letterari in formato elettronico Promosso da •  Association for Computers and the Humanities (ACH) •  Association for Computational Linguistics (ACL) •  Association for Literary and Linguistic Computing (ALLC) Poughkeepsie Principles TEI Consortium http://www.tei-c.org •  standard libero finalizzato all’interscambio di documenti

umanistici tra piattaforme informatiche differenti •  indipendente da una particolare applicazione software •  adatto alla rappresentazione di tutte le categorie e

caratteristiche testuali possibili

Page 17: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

DTD di TEI

•  oltre 500 elementi •  schema modulare (fragments) •  3 gruppi di tag (tag sets) combinati tra

loro: Core tag set : nucleo minimo di elementi comuni ad ogni tipo di testo Base tag set: diversi tag set specifici per vari tipi di documenti fondamentali (lirica, prosa, dramma) Additional DTD tag set: include elementi per la rappresentazione di caratteristiche utili ad evidenziare determinate peculiarità del testo (codifica di apparati di varianti, r a p p r e s e n t a z i o n e d i s t r u t t u r e ipertestuali, codifica di fonti primarie)

https://www.tei-c.org/Vault/P4/pizza.html

TEI-Lite

Page 18: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Caratteristiche e limiti di TEI

•  si basa su una formalizzazione delle consuetudini nella produzione di documenti testuali definite a partire dalla diffusione della stampa

•  codifica strutture e funzioni convenzionalmente vigenti nei testi letterari, in prosa o in poesia

•  pur prevedendo marcatori utili nella descrizione delle trascrizioni, della tradizione manoscritta e dell’apparato critico è più adatto alla codifica del testo letterario

•  non prevede marcatori relativi alla storicità dell’oggetto testuale

•  inadeguato e insoddisfacente dal punto di vista contenutistico e semantico

•  si approccia al testo come rappresentazione grafica di un oggetto documentario o letterario

Page 19: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Modelli di marcatura standardizzati: CEI

CEI: Charters Encoding Initiative•  adattamento di TEI alla documentazione storica

medievale e moderna •  propone terminologia di codifica standard per

l’interoperabilità di risorse digitali che rappresentano documenti

•  basato sul Vocabulaire International de la Diplomatique

•  normalizza gli elementi del discorso diplomatistico

MAnon riesce ad abbracciare i dati semi-strutturati ripropone anche in questo caso una codifica dell'aspetto materiale

Page 20: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Modelli di marcatura NON standardizzati: UN ESPERIMENTO

Una possibile via da seguire: integrare CEI con un set autonomo di elementi e attributi, calibrato sulle caratteristiche specifiche della documentazione archivistica

ES. un CODICE DIPLOMATICO

Page 21: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Modelli di marcatura NON standardizzati: UN ESPERIMENTO

Page 22: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di apparato

Page 23: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di struttura

<TENOR/> <PROTOCOLLO/> <INVOCATIO/> <INTITULATIO/> <INSCRIPTIO/> <DTCRON/> (= data cronica) <DTTOP/> (= data topica) <APPRECATIO/> <FORMPERP/>

<TESTO/> <ARENGA/> <NARRATIO/> <PROMULGATIO/> <DISPOSITIO/> <SANCTIO/> <CORROBORATIO/>

<ESCATOCOLLO/> <DTTOP/> <DTCRON/> <RECOGNITIO/> <SUBSCRIPTIO/> <SMS/> <IT/> <COMPLETIO/>

I marcatori definiscono l’articolazione del discorso documentario

Griglia non rigida:

consente numerose eccezioni

Page 24: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Toponimi (tag <TOP/>):

attributi obbligatori nm = “normalizzazione del nome”

id = “identificazione del toponimo: “Nome, Comune, Provincia”

ove non sia possibile con valore “non-identificato”

ove sia incerto con valore “incerto”

Toponimi identificati loc = “localizzazione storica”

ub = “ubicazione”

es. <TOP nm="Saganum" id="Sagana, Comune di Monreale, Pa" ub="Contrada Sagana" loc="Val di Mazara">Saganum</TOP>.

Page 25: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Elementi geografici (tag <TOP/>):

attributi obbligatori nm = “normalizzazione del nome”

id = “denominazione dell’elemento, tipologia”

tipo= “categoria geografica di appartenenza”

loc = “localizzazione storica” (con possibile valore “incerto”)

ub = “ubicazione” (con possibile valore “incerto”)

es. <TOP nm=“Cribellum, acqua" id=“Sorgente del Gabriele, Comune di Palermo, Pa" ub=“Pendici di Monte Caputo" loc="Val di Mazara“ tipo=“sorgente”>aquam Cribelli</TOP>.

Page 26: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Microtoponimi (tag <TOP/>):

attributi obbligatori nm = “normalizzazione del nome”

id = “identificazione del microtoponimo: Nome, Comune, Provincia”

tipo= “categoria toponimica di appartenenza”

loc = “localizzazione storica” (con possibile valore “incerto”)

ub = “ubicazione” (con possibile valore “incerto”)

es. <TOP nm=“Calatrasis, castellum" id=“Castello di Calatrasi, Comune di Roccamena, Pa" ub=“Monte Maranfusa" loc="Val di Mazara“ tipo=“castello”>castellum Calatrasi</TOP>.

Page 27: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Persone (tag <PERSONA/>):

attributi obbligatori: nm = “normalizzazione del nome”

id = “identificazione della persona” (con possibile valore “non-identificato”)

attributi facoltativi: attributi di parentela = “fil, pat, mat, sor, fr, vir, ux”

tit= “titolo, carica, qualifica o mestiere”

es. <PERSONA nm=“Silvester, comes Marsici" id=“Silvestro, conte di Marsico" tit=“comes" fil=“Guillelmus, comes Marsici“>Silvestri comitis Marsici</PERSONA>.

Page 28: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Istituzioni ecclesiastiche (tag <ECCL/>):

attributi obbligatori: nm = “normalizzazione del nome”

id = “identificazione dell’istituzione” (con possibile valore “non-identificato”) tipo = “tipologia dell’istituzione”

ub= “città o provincia” (con possibile valore “non-identificato”)

es. <ECCL nm=“Montis Regalis, ecclesia" id=“S. Maria Nova di Monreale" tipo=“chiesa“ ub=“Comune di Monreale, Pa”>Montis Regalis ecclesie</ECCL>.

Page 29: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Metainformazioni di testo: marcatori di contenuto

Elenchi e descrizioni di beni :

tag <BENIMM/>

tag <BENMOB/>

Eventi e fatti storici:

tag <EVENT/>

Redattore del documento:

tag <SCRIPT/>

Testimoni del documento: tag <TT/>

Page 30: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Articolazione del documento marcato

Page 31: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Esempio di documento codificato secondo il modello proposto

Page 32: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Esempio di documento codificato secondo il modello proposto

Page 33: ARCHIVISTICA III.0 La modellizzazione, la codifica ... · La modellizzazione Nessuna parte costitutiva dell’universo è talmente semplice da lasciarsi afferrare e controllare senza

Esempio di documento codificato secondo il modello proposto