Documento - Area Sistemi Informativihost.uniroma3.it/docenti/latorre/corsi/ts/05/ts05-u2.pdf ·...
Transcript of Documento - Area Sistemi Informativihost.uniroma3.it/docenti/latorre/corsi/ts/05/ts05-u2.pdf ·...
1
LL’’ANALISI SEMIAUTOMATICA ANALISI SEMIAUTOMATICA DELDEL TESTOTESTO
2.2.
I documentiI documenti testualitestuali
DocumentoDocumentoZing. 3: Qualsiasi cosa che costituisce materiale d’informazione o può essere utile a documentare q.c.(“quel manoscritto è un valido documento per la tua ricerca”).
Disc1: Ciò che, con la sua stessa esistenza, o grazie a quanto reca impresso, scritto, fa conoscere qlco., o la fa conoscere meglio. (Sin.: testimonianza)(“un interessante documento della vita degli uomini preistorici”)
Disc5 (inform.): Qualsiasi file creato da un’applicazione e identificato con un nome.
documenti non testualidocumenti non testuali documenti testualidocumenti testuali
Tipi di documentiTipi di documenti
I documenti possono essere classificati secondo diversi criteri, in base a:
Cartaceo,Cartaceo,Lapide,Lapide,Tela dipinta,Tela dipinta,Pellicola,Pellicola,MagneticoMagneticoElettronico,Elettronico,……
materialemateriale
Tipi di documentiTipi di documenti
I documenti possono essere classificati secondo diversi criteri, in base a:
Testo,Testo,Immagine,Immagine,Tabella,Tabella,Schema grafico,Schema grafico,Filmato,Filmato,Brano musicale,Brano musicale,……
Cartaceo,Cartaceo,Lapide,Lapide,Tela dipinta,Tela dipinta,Pellicola,Pellicola,MagneticoMagneticoElettronico,Elettronico,……
strutturastrutturamaterialemateriale
2
Tipi di documentiTipi di documenti
I documenti possono essere classificati secondo diversi criteri, in base a:
Reperto giudiziarioReperto giudiziarioReperto archieologicoReperto archieologicoOpera artisticaOpera artisticaProva dProva d’’esameesameDocumento dDocumento d’’identitidentitàà……
Testo,Testo,Immagine,Immagine,Tabella,Tabella,Schema grafico,Schema grafico,Filmato,Filmato,Brano musicale,Brano musicale,……
Cartaceo,Cartaceo,Lapide,Lapide,Tela dipinta,Tela dipinta,Pellicola,Pellicola,MagneticoMagneticoElettronico,Elettronico,……
funzionefunzionestrutturastrutturamaterialemateriale
esercizio 2.1
Documento testualeDocumento testuale
Un Un documentodocumento testuale testuale contiene un contiene un testotesto, , su un supporto su un supporto materialematerialein una certa in una certa formaforma
Lo stesso Lo stesso testotesto può essere contenuto può essere contenuto in molti in molti documentidocumenti diversi diversi
(manoscritti, libri stampati, lapide, CD-ROM, pagina WWW, …)
l’evoluzione delle tecnologie testuali
oralità
scrittura
stampa
videoscrittura
esercizio 2.2 CodiceCodice
3
Le Le partiparti di un codice di un codice (semiologico)(semiologico)
–– ll’’alfabetoalfabeto del codicedel codice–– ll’’alfabeto latinoalfabeto latino–– le cifre le cifre ““arabearabe””–– i simboli della chimicai simboli della chimica–– i colori del semaforoi colori del semaforo–– i pulsanti di uni pulsanti di un’’automaautoma
–– le le paroleparole del codice del codice (i (i ““codicicodici””))[le stringhe [le stringhe ben formate ben formate (es. cod. fiscale)(es. cod. fiscale)]]–– parole, numeri, parole, numeri, ……
–– le regole le regole sintattichesintattiche–– le regole le regole semantichesemantiche
rappresentazione diretta (significati > significanti)rappresentazione diretta (significati > significanti)transcodificazione (codice transcodificazione (codice αα > codice > codice ββ))
(es.: trascrizioni, traslitterazioni, conversioni, (es.: trascrizioni, traslitterazioni, conversioni, ……))
codificazione di codificazione di carattericaratteri
…………
22BB
129129€€
…………
666622
656511
…………
44DD
33CC
11AA
Cod. Cod. decimaledecimale
caratterecarattere
codificazione di codificazione di carattericaratteri
………………
101022BB
1000000110000001129129€€
………………
10000101000010666622
10000011000001656511
………………
10010044DD
111133CC
1111AA
Cod. binariaCod. binariaCod. Cod. decimaledecimale
caratterecarattere
Codice binarioCodice binario
Codice binarioCodice binario èè un codice il cui alfabeto un codice il cui alfabeto èè ““binariobinario””, cio, cioèè costituito da 2 soli costituito da 2 soli simboli.simboli.
Per esempio:Per esempio:| (acceso), o (spento)| (acceso), o (spento)
ssìì, no, no
+ (pi+ (piùù), ), -- (meno)(meno)
☻☻ ((bianco) , bianco) , ☺☺ ((nero)nero)
1 (uno), 0 (zero)1 (uno), 0 (zero)
……
Codice Codice ““Latin 1Latin 1”” ((ANSIANSI))esercizi 2.3, 2.4
4
intervallointervallo
testo piano (semplice, non impaginato)
testo ricco(formattato, impaginato) esercizio 2.5
visualizzazione etichette di formattazione
Esempio di pagina Web
e del suo sorgente
5
Codificazioni
• Codificazioni ad alto livello etichette metatestuali
• Codificazioni a basso livello ASCII, Lat 1, Unicodice
esercizio 2.6