Librerie digitali Alcune considerazioni...

10
1 Librerie digitali Gestione di immagini e foto di oggetti 2 Digitalizzazione di immagini Alcune considerazioni generali Determinare gli scopi Requisiti degli utenti Requisiti di chi conversa il dato Acquisire una volta, usare più volte Creare una versione master dell’immagini ottenuta dalla prima scansione dell’immagine Creare nuove versioni, partendo da quella master, in funzione dell’uso che si farà dell’immagine 3 Immagini vettoriali Insiemi di percorsi (path) Coordinate Informazioni sui colori SVG coding http://www.tasi.ac.uk/advice/vector/svg_code.txt Usate generalmente per Font Disegni Grafici Mappe Immagine vettoriale 4 Esempio 5 Immagini Raster/Bitmap Immagini raster/bitmap Una griglia di punti individuali Ogni pixel è caratterizzato da un differente colore Usate generalmente per Immagini Foto Immagine Bitmap 6 Fotografie Formati Stampe Negativi Requisiti “Fedeltà” dei colori Contrasto Rendering

Transcript of Librerie digitali Alcune considerazioni...

1

Librerie digitali

Gestione di immagini e foto di oggetti

2

Digitalizzazione di immagini� Alcune considerazioni generali

� Determinare gli scopi� Requisiti degli utenti� Requisiti di chi conversa il dato

� Acquisire una volta, usare più volte� Creare una versione master dell’immagini ottenuta

dalla prima scansione dell’immagine� Creare nuove versioni, partendo da quella master,

in funzione dell’uso che si farà dell’immagine

3

Immagini vettoriali� Insiemi di percorsi (path)� Coordinate� Informazioni sui colori� SVG coding

� http://www.tasi.ac.uk/advice/vector/svg_code.txt� Usate generalmente per� Font� Disegni� Grafici� Mappe Immagine vettoriale

4

Esempio

5

Immagini Raster/Bitmap� Immagini raster/bitmap� Una griglia di punti individuali� Ogni pixel è caratterizzato da un differente colore

� Usate generalmente per� Immagini� Foto

Immagine Bitmap6

Fotografie

� Formati � Stampe� Negativi

� Requisiti� “Fedeltà” dei colori� Contrasto� Rendering

2

7

Immagini che ritraggono documenti� Possono essere in

bianco e nero o a colori

� Requisiti� É necessario che le

scritte siano leggibili� Utile anche per le

fasi successive di OCR

8

Mappe� Possono essere

� Scansioni di materiale cartaceo

� Immagini digitali� Ci sono requisiti

maggiori� Possibilità di fare

zoom� Panoramiche� Centramento rispetto

a delle coordinate

9

Mappe� Ci sono requisiti maggiori

� Possibilità di fare zoom� Immagini, relative a zone diverse, con un livello di

dettaglio maggiore rispetto all’immagine della mappa completa

� Centramento rispetto a delle coordinate� Necessità di dati sulle coordinate della zona

rappresentata� Necessità di strumenti appositi per navigare le

immagini

10

I cinque fattori fondamentali� Risoluzione� Bit Depth� Tecnica di rappresentazione del colore� Compressione� Formato

11

Risoluzione� Unità di misura solitamente utilizzate

� dpi (Dots per inch)� ppi (Pixels per inch)

� Risoluzione� Numero di pixel per inch dell’immagine

scansionata� Esempio: � immagine da 8x10 inch scansionata a 300ppi = 2400 x

3000 pixels

12

Risoluzione e scansione� Ottica vs. interpolata� Ottica

� Numero di sensori dello scanner = cosa vede lo scanner

� Interpolata� Numero di pixel che il software può ottenere

partendo da cosa “vede” lo scanner� Risoluzione più alta di quella ottica

3

13

Scelta della risoluzione adatta� Generalmente

conviene usare una risoluzione che soddisfa, come qualità, le esigenze dell’utente

� Non usare una risoluzione (molto) più alta� Spreco di spazio

Cornell’s online digital imaging tutorial: <http://www.library.cornell.edu/preservation/tutorial/conversion/conversion-03.html>

14

Confronto tra risoluzioni diverse

15

600dpi vs. 300dpi

16

Bit Depth� Numero di bit usati per rappresentare le

informazioni sul colore di ogni pixel� 1 bit (1) = 21 = 2 colori/tonalità (bianco e nero)� 2 bit (01) = 22 = 4 colori/tonalità� 4 bit (0010) = 24 = 16 colori/tonalità� 8 bit (11010001) = 28 = 256 colori/tonalità

17

Confronto tra bit depth diversi

1 bit 2 bit (4 colori)

4 bit (16 colori) 8 bit (256 colori)18

Tecnica di rappresentazione del colore� RGB� Gli scanner e le telecamere solitamente hanno

sensori per rilevare rosso, verde e blu� Ognuno dei tre canali è memorizzato in modo

separato� 8 bit per ogni canale = 24 bit color

� CMYK � Ciano, magenta, giallo e nero� Solitamente usato per “pre-press” printing di alta

qualità

4

19

Approccio consigliato per l’acquisizione delle immagini� Confrontare la foto corrente e la scena

originale (se possibile)� L’immagine master dovrebbe essere 8 bit

per canale (8-bit grayscale, 24-bit RGB)� Di più solo per progetto particolari

� Gli aggiustamenti di colore devrebbero essere fatti tramite il software dello scanner prima di fare la scansione dell’immagine

� Usare tutti i toni di colore possibili20

Gestione dei colori in presenza di più strumenti� International Color Consortium� Standard per la traduzione dei colori tra strumenti

o sistemi diversi� Tutti gli strumenti dovrebbero essere

caratterizzati da profili ICC� video� scanner� stampanti

21

Gestione dei colori in presenza di più strumenti� Includere nelle immagini master i profili ICC

profiles in master images

22

Compressione� Compressione � Senza perdita d’informazione (Lossless

compression)� Con perdita d’informazione (Losy compression)

� Utile per ridurre la dimensione dei file� Svantaggi� Alcuni formati sono propritari

� Problema per l’interoperabilità tra strumenti e sistemi

23

Compressione senza perdita� Riduzione dello spazio occupato senza

perdere nessun dato� Il file originale, e quindi l’mmagine, può essere

ricreato senza perdite partendo dal file compresso� Riduzione basata sulle ridondanze� Codifiche dei dati più efficienti� LZW (Lempei, Ziv, and Welch)� Sostituzione di pattern con codici� I codici più corti sono usati per i pattern più

frequenti24

Compressione con perdita� Riduzione dello spazio occupato tramite

l’eliminazione di parte dei dati� Il file originale, e quindi l’mmagine, non può

essere ricreato senza perdite partendo dal file compresso

� Riduzioni irrilevanti� Eliminazione di informazioni che sono non

percettibili da parte di chi vede l’immagine� Esempio� Compressione JPEG

5

25

Compressione� Immagine a dimensione originale, 8x e 16x

Senza compressione

Compressione con perdita

Massima compressione JPEG

(Photo: TASI training © Technical Advisory Service f or Images) 26

Compressione� Alcune tecniche di compressione

comunemente usate� Fractal

� Immagini rappresentate tramite formule matematiche� Wavelet

� Immagini viste come segnali

27

TIFF - Tag Image File Format� Formato solitamente prescelto per

l’archiviazione delle immagini� I dati sono etichettati� http://partners.adobe.com/public/developer/en/

tiff/TIFF6.pdf� Supporto di diversi “color spaces”� Supporto di molte tecniche di compressione� LZW, G3 and G4

28

JPEG2000� Standard di compressione ISO che include

più metodi di compressione� Sia metodi di compressione senza perdita� Sia metodi con perdita

� Le immagini vengono sezionate il blocchi (di dimensione fissa) nel momento della creazione del file JPEG2000� Ciò permette in seguito di decodificare in modo

indipendente e selettivo solo i blocchi di interesse� Utile ad esempio per gli zoom sulle mappe

29

JPEG2000� Possibile includere dei metadati nel file

dell’immagine� Esempio di applicazione che usa immagini

salvate nel formato JPEG2000� http://lids.hul.harvard.edu:8080/lids/lids?id=83956

7&buttons=y

30

JPEG� Il formato JPEG non è sempre uguale al

metodo di compressione JPEG (spesso lo è)� Usato solitamente per � Fotografie

6

31

GIF� Sviluppato nel 1987 per video CompuServ� Usato solitamente per � Monitor

� Non adatto per le stampe� Usa la tecnica di compressione LZW

32

PNG� Pensato per sostituire lo standard GIF a

causa di alcuni problemi legati a LZW� Usa la tecnica di compressione senza perdita

LZ77� Poco accettato� La compressione e la decompressione sono

operazioni intense dal punto di vista della CPU� Tempi di risposta lenti da parte dei programmi di

visualizzazione� Poco supportato dai browser

33

PNG� Compressione migliore rispetto a TIFF LZW� Può diventare lo standard per le immagini master

34

Confronto tra le dimensioni dei file generati� Immagine 1943x1702 pixel, 24-bit RGB

4MB (lossless)JPEG2000

1.0MBJPG

6.5MBPNG

8.4MBTIFF LZW

9.9MBTIFF

Dimensione (MB)Tipo file

35

Metadati caratteristici dei vari formati� Ogni formato include al suo interno una serie

di metadati sulle caratteristiche tecniche dell’immagine� Dimensione� Tipo di codifica usata� ...

� Elenco di metadati (tag) per alcuni formati comunemente usati� http://owl.phy.queensu.ca/~phil/exiftool/TagNam

es/index.html 36

Quali formati usare� Best practice attuale� Immagine master

� TIFF (non compresso)� Derivate

� JPEG (per il web)

7

37

Metadati tecnici per le immagini� MIX – Metadata for Still Images in XML� Sviluppato da� The Library of Congress' Network Development e

MARC Standards Office� NISO Technical Metadata for Digital Still Images

Standards Committee� http://www.niso.org/standards/resources/Z39_87_

trial_use.pdf

38

Workflow per il processo di digitalizzazione delle immagini� Fase di pianificazione� Fase di produzione

39

Fase di pianificazione� Definire gli obiettivi del progetto nel quale si

useranno le immagini� Definire le specifiche per le immagini master� Definire le specifiche per le immagini

consegnabili/trasferibili� Selezionare lo strumento per le scansioni� Sviluppare e testare le procedure di

digitalizzazione

40

Fase di pianificazione� Sviluppare e testare le procedure per la

verifica della qualità� Determinare quali metadati memorizzare� Documentare il processo di acquisizione

41

Fase di produzione� Controllo degli oggetti da digitalizzare� Dove si trova l’oggetto?� Ho digitalizzato tutti gli oggetti?� Ho restituito tutti gli oggetti al suo proprietario?

� Control flow� Quanti oggetti posso digitalizzare oggi?� I file sono stati validati e verificati?� I file sono stati sottoposti al processo di backup?

42

Fase di produzione� Alcuni riferimeti� http://hul.harvard.edu/ois/services/digproj/LDI_Im

aging_Projects_Workflow.pdf� http://www.law.harvard.edu/library/collections/spe

cial/online-collections/portraits/workplan.php� http://www.dlib.indiana.edu/internal/dmic/old/wylie

8

43

Revisione della qualità� Un processo di revisione della qualità è

essenziale� Caratteristiche oggettive

� Dimensione in pixel� Risoluzione� Bit depth

� Caratteristiche soggettive� Artefatti in fase di scansione� Orientamento� ....

Librerie digitali

Geographic Information System (GIS) e Mappe

45

Differenza tra dati spaziali egeografici � I dati “geografici” si riferiscono alla terra

� Spazio a due dimensioni� Superficie della terra

� Spazio a tre dimensioni� Terra rappresentata in tre dimensioni

� Tutte le coordinate sono referenziate rispetto alla terra

46

Differenza tra dati spaziali e geografici� I dati “spaziali” si riferiscono ad un qualunque

sistema multidimensionale in cui sono rappresentati punti, linee, superfici, ..� Le coordinate sono referenziate rispetto ad un

oggetto che varia in funzione del dominio� Le immagine mediche sono referenziate rispetto al

corpo dell’uomo� I disegni tecnici sono referenziati rispetto all’oggetto

meccanico che si sta rappresentando� I dati geografici sono un sottoinsieme di quelli

spaziali� Anche se spesso i due termini sono usati in modo

intercambiabile

47

Definizione di Geographic Information System (GIS)� Definizione data dall’agenzia United States

Geological Survey (USGS)� "In the strictest sense, a GIS is a computer

system capable of assembling, storing, manipulating, and displaying geographically referenced information, i.e. data identified according to their locations. Practitioners also regard the total GIS as including operating personnel and the data that go into the system."

48

GIS: concetti di base� I sistemi GIS gestiscono le relazioni tra dati in

base alla loro collocazione geografica� La collocazione geografica è effettuata

tramite diversi sistemi di riferimento� Coordinate in uno spazio a tre dimensioni (X,Y,Z)� Latitudine, longitudine� Codici di avviamento postale� ....

9

49

GIS: concetti di base� Punti� Linee� Poligoni� Layer� Attributi (caratteristiche)

50

Layer� Ogni livello rappresenta

una tipologia specifica di informazioni

� Esempi� Strade� Disposizione degli

edifici� Confini degli stati� Fiumi e laghi

51

Mappe (immagini) diverse per obiettivi diversi

Strade Fiumi

Curve di livello Digital elevation model (DEM)

52

Rappresentazioni raster e vettoriali� Raster (bitmap)

� Versione matriciale (a griglia) della mappa� Il valore di ogni cella è associato ad un particolare

significato semantico� Esempio: 1=pianura, 2=montagna, ..

� Rappresentazione vettoriale� Insieme di

� Punti� Linee (insiemi di punti)� Aree (sagome delimitate da linee)� Ad ogni area è associato un significato semantico

53

Raster vs. Vettoriale

Rappresentazione raster

Rappresentazione vettoriale

54

Raster vs. Vettoriale

Rappresentazione raster

Rappresentazione vettoriale

10

55

Rappresentazioni raster vs. vettoriali� Alcuni vantaggi della rappresentazione

vettoriale rispetto a quella raster� Possibilità di rappresentare in modo più compatto

le informazioni fondamentali di interesse� A scapito di una perdita minima di dettagli rispetto alla

rappresentazione raster� Sono già disponibili delle informazioni sugli

oggetti presenti nell’immagine e sulla loro forma� Semplificazione dell’operazione di ricerca di oggetti

56

Cartografia� La cartografia di

un’area geografica non è composta solo da immagini e layer

� Ci sono altre informazioni aggiuntive� Legende� Scala� ...

57

GIS Metadata� Il comitato Federal Geographic Data

Committee (FGDC) ha definito dei metadati standard per il GIS

� Content Standard for Digital Geospatial Metadata (CSDGM)� Descrizione del contenuto

� Spatial Data Transfer Standard (SDTS)� Standard per il trasferimento di dati tra software

per la gestione di dati spaziali