La visione artificiale - Computer Vision & Multimedia...
Transcript of La visione artificiale - Computer Vision & Multimedia...
La Visione Artificiale
La visione delle macchineLa visione umanaAcquisizione di immagine
Visione Artificiale 08/09 Operazioni puntuali 2
Copyright
• Alcune slide sono tratte dal testo:– Digital Image Processing
– Materiale didattico relativo si trova al sito• www.imageprocessingbook.com
Visione Artificiale 08/09 Operazioni puntuali 3
Attività della Visione Artificiale
• Signal processing ‘50• Computer Graphic ‘60• Pattern Recognition ‘70• Computer Vision ‘80• Multimedia ‘90
Visione Artificiale 08/09 Operazioni puntuali 4
Visione Artificiale
• È l’insieme dei processi che mirano a costruire una descrizione del mondo a partire da immagini
• Ha lo scopo di emulare la visione umana attraverso:– L’acquisizione– L’eleborazione al calcolatore– La comprensione delle immagini
Visione Artificiale 08/09 Operazioni puntuali 5
Visione Artificiale
• Sono coinvolti molti aspetti, ma il più importante è la Elaborazione delle Immagini
– Il settore dell’informatica che definisce tecniche ed algoritmi per trattare immagini digitali
• Obiettivi:– Produrre sistemi artificiali (completamente automatici e basati
sul calcolatore) che manifestano un comportamento visivo con prestazioni paragonabili a quelle di un sistema biologico
Visione Artificiale 08/09 Operazioni puntuali 6
Interdisciplinarità
• La Visione Artificiale è un campo altamente multidisciplinare che include competenze di
– Image processing– Informatica– Intelligenza artificiale– Neurofisiologia– Psicologia– Fisica– …
Visione Artificiale 08/09 Operazioni puntuali 7
La visione umana
Visione Artificiale 08/09 Operazioni puntuali 8
La visione umana
• L’occhio umano è paragonabile ad una macchina fotografica in cui:– La cornea e il
cristallino costituiscono l’obiettivo
– L’iride e la pupilla corrispondono al diaframma
– La retina è l’elemento sensibile (pellicola)
Visione Artificiale 08/09 Operazioni puntuali 9
La visione umana
• Sulla retina si forma l’immagine degli oggetti osservati• Esistono due tipi di recettori:
– Coni– Bastoncelli
Visione Artificiale 08/09 Operazioni puntuali 10
La visione umana - Coni
• Circa 6 o 7 milioni per occhio• Siti nella parte centrale della retina, detta fovea• Altamente sensibili al colore e ad alti livelli di illuminazione• Forniscono anche piccoli dettagli• Responsabili della visione diurna• Connessione 1 a 1 con le terminazioni nervose
Visione Artificiale 08/09 Operazioni puntuali 11
La visione umana - Bastoncelli
• Circa 100 milioni per occhio• Consentono una visione globale della scena• Distribuiti in modo più uniforme sull’intera superficie della
retina• Praticamente insensibili al colore• Sensibili a bassi livelli di illuminazione• Responsabili della visione notturna• Connessione n a 1 con le terminazioni nervose
Visione Artificiale 08/09 Operazioni puntuali 12
Sensibilità di coni e bastoncelli
Visione Artificiale 08/09 Operazioni puntuali 13
Distribuzione di coni e bastoncelli
Visione Artificiale 08/09 Operazioni puntuali 14
Distribuzione di coni e bastoncelli
• Fino a 150000 coni per mm2
• La tecnologia attuale del silicio è in grado di ottenere una simile densità di sensori
• I problemi della visione artificiale non sono quindi nei sensori, ma nel processo di elaborazione
• Occorre quindi integrare l’intelligenza e l’esperienza umana
Visione Artificiale 08/09 Operazioni puntuali 15
La percezione umana
Visione Artificiale 08/09 Operazioni puntuali 16
La percezione umana
Visione Artificiale 08/09 Operazioni puntuali 17
Illusioni Ottiche
Visione Artificiale 08/09 Operazioni puntuali 18
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 19
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 20
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 21
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 22
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 23
Lo spettro elettromagnetico
Visione Artificiale 08/09 Operazioni puntuali 24
Immagini a ultrasuoni
Visione Artificiale 08/09 Operazioni puntuali 25
L’Immagine
• Una immagine è una rappresentazione spaziale bidimensionale di un oggetto 2D o 3D o di una scena.
• Nel campo dell’elaborazione di immagini per immagine si intende generalmente la rappresentazione dopo il processo di digitalizzazione.
• Dal punto di vista del programmatore un’immagine è una matrice bidimensionale di valori omogenei.
Visione Artificiale 08/09 Operazioni puntuali 26
Sistema di acquisizione
Componenti di un sistema di acquisizione♦ La telecamera (in generale un sensore elettronico)♦ Memoria immagine (frame grabber)♦ Monitor♦ Calcolatore♦ Database♦ Attuatore
Visione Artificiale 08/09 Operazioni puntuali 27
A/D MemoriaImmagine D/A
Monitor
Sistema di acquisizione
DatabaseImmaginirisultati numerici
comandi di controllo
A/D: convertitore analogico/digitaleD/A: convertitore digitale/analogico
comandi di controllo
Visione Artificiale 08/09 Operazioni puntuali 28
Sensore elettronico
Visione Artificiale 08/09 Operazioni puntuali 29
Esempi di sensori
Visione Artificiale 08/09 Operazioni puntuali 30
Esempi di sensori
Visione Artificiale 08/09 Operazioni puntuali 31
L’acquisizione
Visione Artificiale 08/09 Operazioni puntuali 32
L’acquisizione
Visione Artificiale 08/09 Operazioni puntuali 33
L’acquisizione
Visione Artificiale 08/09 Operazioni puntuali 34
Illuminazione
• L’illuminazione non sempre è un parametro controllabile:– In applicazioni indoor è in genere possibile realizzare un
impianto di illuminazione adatto al problema da risolvere– In applicazioni outdoor normalmente l’illuminazione non è sotto
controllo
Visione Artificiale 08/09 Operazioni puntuali 35
Back lighting
Diffusore
Visione Artificiale 08/09 Operazioni puntuali 36
Luce strutturata
• Usata per l’acquisizione e la ricostruzione 3D
Visione Artificiale 08/09 Operazioni puntuali 37
Luce strutturata
Visione Artificiale 08/09 Operazioni puntuali 38
Luce strutturata
Visione Artificiale 08/09 Operazioni puntuali 39
Dal Segnale Analogico alla Matrice
Tensione
Tempo
Tempo
1 14 17 1PIXEL
Trasduzione
Quantizzazione
Campionamento
Immagine Digitale
Visione Artificiale 08/09 Operazioni puntuali 40
Il processo di digitalizzazione
• Il segnale acquisito da una telecamera è tipicamente un segnale continuo che descrive l’intensità del segnale luminoso secondo una scansione per linee
• La digitalizzazione trasforma un segnale continuo discretizzandolo sia nella dimensione spaziale, che in quella dei livelli di grigio (convertitore A/D analogico/digitale)
• Il segnale convertito viene memorizzato in una memoria immagine che funge da interfaccia tra l’elaboratore, il monitor e l’elemento di acquisizione
• Tra la memoria immagine ed il monitor vi è un convertitore D/A (digitale/analogico)
Visione Artificiale 08/09 Operazioni puntuali 41
Scansione Regolare
• Scansione semplice Scansione interallacciata
Visione Artificiale 08/09 Operazioni puntuali 42
Risoluzione spaziale
• La risoluzione spaziale è la più piccola dimensione dell’oggetto osservato che può essere discriminata
• La cella di risoluzione è la più piccola area elementare associata ad un valore in una immagine digitale
• Generalmente la cella elementare è un quadrato ma si possono anche avere celle rettangolari o esagonali
Visione Artificiale 08/09 Operazioni puntuali 43
Tassellazione quadrata
Pixel a distanza 1
Pixel a distanza 2
Pixel a distanza 3
Pixel a distanza 4
Visione Artificiale 08/09 Operazioni puntuali 44
Tassellazione esagonale
Visione Artificiale 08/09 Operazioni puntuali 45
Tassellazione triangolare
Visione Artificiale 08/09 Operazioni puntuali 46
Risoluzione spaziale
Visione Artificiale 08/09 Operazioni puntuali 47
Risoluzione spaziale
• Pixel (contrazione di picture element) è descritto dalla posizione spaziale di una cella elementare (riga, colonna) e dal valore ad essa associato
• Alcune dimensioni frequenti per immagini digitali sono 256x256, 512x512, 1024x1024
• Risoluzioni dei monitor:– 640x480, 1024x768 (4/3)– 1280x1024 (5/4), 1280x800 (16/10)– HDTV 1125 righe (16/9)
Visione Artificiale 08/09 Operazioni puntuali 48
Risoluzione nella scala di grigi
• Una immagine binaria è una immagine in cui ogni pixel può assumere solo due valori: (0,1), (vero, falso), (oggetto, sfondo)
– una immagine binaria utilizza solo un bit per pixel• Una immagine a toni di grigio è una immagine in cui ogni
pixel assume valori in un intervallo più ampio– valori tipici sono [0, 63], [0, 255], [0, 1023], rispettivamente 6, 8,
10 bit per pixel• Un osservatore umano percepisce una scala continua di
grigi osservando immagini memorizzate con 8 bit
Visione Artificiale 08/09 Operazioni puntuali 49
Risoluzione nella scala dei grigi
Visione Artificiale 08/09 Operazioni puntuali 50
Aliasing
Visione Artificiale 08/09 Operazioni puntuali 51
Antialiasing