Marco Cristani Teoria e Tecniche del Riconoscimento1 Metodo di Fisher, Principal Component Analysis...

Marco CristaniTeoria e Tecniche del Riconoscimento 1

Teoria e Tecniche del Riconoscimento

Metodo di Fisher, Principal Component Analysis

Facoltà di Scienze MM. FF. NN.

Università di Verona

A.A. 2010-11

• Il problema è quello di ridurre la dimensionalità dello spazio delle features in modo da rendere il problema di classificazione computazionalmente trattabile.

• È in sostanza la proiezione delle feature caratterizzanti un campione su una retta, cioè su una direzione (da un problema d-dimensionale ad un problema 1-dimensionale).

La trasformata di Fisher

• Si supponga di avere un insieme di N campioni d-dimensionali x1, .., xN, di cui N1 classificati come 1 ed N2 classificati come 2.

• Si vuole cercare una trasformazione w, ossia una combinazione lineare delle componenti di x tale da generare i corrispondenti campioni (scalari) y1,..., yN:

wt x = y

• Geometricamente, se la norma di w è pari a 1 allora ogni yi è la proiezione del campione xi sulla retta di direzione w.

• Siccome si vuole separare le due classi anche nel nuovo spazio monodimensionale allora si considera come misura di separazione la differenza delle medie dei campioni. Quindi:

medie prima della trasformazione

medie dopo la trasformazione

• Si vuole ottenere che la differenza tra le medie delle due classi (trasformate) sia grande rispetto alla deviazione standard di ogni classe.

• Allora, si definisce il discriminante lineare di Fisher come la funzione lineare wtx per la quale la funzione J è massima:

dove sono le dispersioni (scatter) dei campioni classificati 1 ed 2, rispettivamente, definite come:

• Si vuole che le dispersioni siano abbastanza piccole, ossia, che i campioni di una classe siano abbastanza concentrati intorno al valore medio.

• Per ottenere J come una funzione esplicita di w si definiscono le matrici di dispersione (scatter matrices) Si ed Sw:

21~ e ~ ss

~ ~( )s y mi j

x m x m( ) ( )

121 SSSw

• Analogamente:

• In tal modo:

SB = (m1 - m2) (m1 - m2)t

• Quindi per ottenere J(w) massimo, si deve esplicitare J in funzione diretta di w e quindi derivarlo rispetto a w ed eguagliare a 0.

~ ~ ( )s Sii

y m( ) w x w m w w

ww wt Sss 2

1~~ ~ ~m m St

• Derivando ottengo che:

che è la trasformata di Fisher.

w m m 0 11 2

PCA• Il dato = un vettore

N-dimensionale di valori di pixel

• Supponiamo N=2 dati = punti 2D

Come posso descrivere in modo compatto questi M punti?

• SOL 1: Con un punto (vettore) solo, che minimizzi la distanza media quadratica con tutti i pti

2)()0()0(0 )( argmin

• Soluzione: il vettore media

Problema

m poco espressivo!!!

• Supp. una retta di proiezione nello spazio

Alcune vanno bene ... altre no.intuitivamente

• SOL2: Con una retta di proiezione, che minimizzi la distanza media quadratica con tutti i pti

• In questo caso useremmo una dimensione per descrivere i dati (la posizione sulla retta)!

PCA• Per convenienza, imponiamo passaggio dalla media, e

specifichiamo quindi i punti della retta come

emx )()( kk a)(kx

2)()(...1

, argmin...1

• Troviamo quindi i coefficienti che minimizzano la distanza quadratica

Mkka ...1

PCA• Sostituendo in otteniamo

, ossia mxe )()( ' kka e,...1

)(1 Mk

2)(1 mxSee'e

• Minimizzare significa massimizzare tenuto conto che

, via moltiplicatori di Lagrange; ossia

)()( 'mxmxS

e1J See'1e 1 ee'See' u

• Minimizzo;

Scatter matrix ≈ mat. di covarianza

A conti fatti:1. e deve essere autovettore;2. Poiché

deve essere massimo

ee'See'

Esempio

717.0615.0

615.0617.0S

735.0)1(e

678.0)2(e

049.0)1( 284.1)2(

• La matrice di covarianza è

• Ottengo 2 autovettori (e autovalori): quale prendo?

Esempio - osservazioni

717.0615.0

615.0617.0S• La matrice di covarianza è simmetrica, reale

gli autovettori {e} sono ortogonali, formanti una base per lo spazio N dimensionale

gli autovalori più grandi si hanno nelle direzioni di

massima dispersione dei dati

735.01e

678.02e

049.01 284.12

Esempio - osservazioni

)()( emx

• I coefficienti , per i =1,...,N, sono le componenti del punto

per la base trovata

• Quindi un punto può essere scritto come

Da PCA ad eigenfaces• Dato un gruppo di punti, ho trovato la base che descrive lo

scattering dei punti

• Ogni punto puo’ essere mappato tramite i componenti della base (numero componenti = numero dimensioni N)

• Usare meno componenti (le componenti principali) permette di proiettare i punti in un sottospazio altamente informativo riduzione della dimensionalità dei punti

• Ora passiamo alle facce (...punti!)dataset di M facce, N dimensioni

N.B.:di solito,M<<N

Da PCA ad eigenfaces (2)• Preprocessing -

– Le immagini devono contenere esclusivamente facce (no outliers)

– Le immagini devono essere ragionevolmente prive di rumore

– Le facce devono avere la stessa dimensione riscalamento

– Stesse condizioni di illuminazione, o compensazione

– Non ci deve essere sfondoritaglia le facce, catturale su sfondo neutro (alternativa: background subtraction)

– In maniera automatica, utilizzo di un metodo di face detection

Eigenfaces - proiezioni• Dopo aver ricavato gli autovettori {e} (eigenfaces) dalla matrice

di covarianza S, calcolo le componenti {a} (o proiezione) per la faccia x

• Le ricostruzioni, g, possono avvenire anche nei sottospazi descritti dalle eigenfaces con eigenvalues più grandi – riduzione dimensionalità

mxemxemxe N',...,',' 21

1a 2a Na

NNaaa eeemx ,...,2211

8877665544332211 eeeeeeee aaaaaaaa … NNa exxg

10 20 30 50 70 82n.

coeff.

Eigenfaces• Autovettori {e} (eigenfaces): in pratica?

1e 2e 3e

Eigenfaces - problema

• Sia pertanto S = AA’

• Con un’img 256 x 256 ho : problemi di overflow!

• Trick: calcolo gli autovettori di , ossia , tenuto conto

che di solito si usano 20-30 eigenfaces e che

)()2()1(

N x M N x N

65536 65536S

MM 'AA e~

eAeAAAeeAA~ ~

~ ~'~ ~'

eAe ~ quindi

Eigenfaces - note

• Gli M autovalori di A’A corrispondono agli M autovalori più grandi di S (così come i corrispondenti autovettori)

Eigenfaces - algoritmo

1. Sottraggo ad ogni immagine x(k) ,k=1...M, la media

ottenendo i vettori da cui costruisco la matrice

2. Calcolo M autovettori di formando la matrice

3. Ricavo gli M autovettori più grandi di S = AA’, ossia

o in forma matriciale

4. Ricavo i corrispondenti componenti (o coeff. di proiezione)

o in forma matriciale

MM 'AA Mii ,...,1

ii eAe ˆ

)()( ~' ki

kia xe

)(~ kx

MMMNMN VAU

M xUω

Proprietà chiave della rappresentazione ad eigenfaces

• 2 immagini usate per costruire l’eigenspace

• è la proiezione nell’eigenspace dell’img

allora,

ossia, la distanza nell’eigenspace è approssimativamente uguale alla distanza tra due immagini.

21, xx

|||||||| 1212 xxωω

Riconoscimento con le eigenfaces1. Analizza il database d’immagini etichettato (<volti,identità>)

a) Esegui PCA — calcola le eigenfaces, formo Ub) Calcola i K coefficienti per ogni immagine x(k) k=1,...,Mc) Calcola le M proiezioni nello spazio delle eigenfaces ω(k) k=1,...,Md) Calcolo la soglia

2. Data una nuova img (da riconoscere) x, a) Ne sottraggo la media del dataset di training m, ottengob) Proietto, ossia calcolo le K componenti

c) Calcolo il set di distanze

Mkjkj ,...,1,per max )()( ωω

TRAINING

',...,,~21 Kaaa ωx

Mkkk ,...,1per 2)(2)( ωω

xU'ω ~

RICONOSCIMENTO

Riconoscimento con le eigenfaces3. Ricostruisco la faccia usando eigenfaces e componenti

4. Calcolo la distanza tra la faccia di partenza incognita e la ricostruzione

5. Se• non è una faccia

• è una nuova faccia

• è una faccia conosciuta, la kbest-esima, dove

~ oppure ~1

Uωgeg

RICONOSCIMENTO

~~ 22 xg

M1,...,k , e )(k

)(min e k

)(best argmin k

Dettagli pratici

K Mi =

• Quanti eigenvector usare?• Controlla il decadimento degli

eigenvalues• Dati “buoni” ossia trattabili

hanno poche dimensioni ad alta varianza

• Nel caso in cui tutti gli N autovalori sono stati calcolati per un dataset N-dimensionale vale

1covered

Problemi eigenfaces

• Illuminazione: stessi soggetti con differente illuminazione risultano lontani nello spazio delle eigenfaces

• Pose differenti :le componenti di un volto frontale non servono per un riconoscimento con profili

• Allineamento differente• Espressione facciale differente• Outlier

– Sample outliers = non facce– Intra-sample outliers = facce affette

da rumore

Problemi eigenfaces (2)

• Funzionale solo per la rappresentazione di dati appartenenti ad un’unica classe

• Non separano classi differenti

Marco Cristani Teoria e Tecniche del Riconoscimento1 Metodo di Fisher, Principal Component Analysis...

Documents

Transcript of Marco Cristani Teoria e Tecniche del Riconoscimento1 Metodo di Fisher, Principal Component Analysis...

Marco Cristani Teoria e Tecniche del Riconoscimento1 Principal Component Analysis, Metodo di Fisher Facoltà di Scienze MM. FF. NN. Università di Verona.

Marco Cristani Teoria e Tecniche del Riconoscimento1 Stima non parametrica di modelli Facoltà di Scienze MM. FF. NN. Università di Verona A.A. 2011-12.

Università di Verona Facoltà di Scienze MM.FF.NN. Corso di ...profs.sci.univr.it/~cristanm/teaching/cium_files/lezione...1 Complementi di Interazione Uomo-Macchina Dr. Marco Cristani

Fisher House

Documento1 - marinellavitulli.itmarinellavitulli.it/wordpress/wp-content/uploads/2013/09/locandina.pdf · CONFEZIONAMENTO ALIMENTARE ... FISHER Ore 16.40 - L'effetto Loto : ... Nanocompositi

IL TEOREMA DI FISHER E WEIL NELL’ATTUALE ...tesi.eprints.luiss.it/6788/1/leombroni-tesi-2011.pdfIl termine immunizzazione finanziaria identifica una metodologia matematica finalizzata

Allarme carenza Elio - soluzioni per GC e GC-MS by Thermo Fisher Scientific

Ecumenismo Quotidiano - centroeugenioiv.org · In tanti luoghi cristani di diversa tradizione stanno facende l’esperienza ecumenica della commemorazione comune del 500° anniversario

INDICE DESCRIZIONE ACCESSIBILITA’ CENNI STORICI … · parte da equipaggi non turchi ma da suddit dell'impero (nordafricani in maggioranza) e da cristani rinnegat . I contngent

Xmas Meier - Ila Bêka · 2017. 11. 13. · Paul Marantz / Fisher Marantz Stone Partnership, Erco, Lüdenschied impresa costruttrice / Builder Lamaro Appalti realizzazione macchine

5. Stato assoluto o stato liberale? - · o stato liberale? Fisher: i limiti dell’assolutismo Secondo l’inglese Herbert A. Laurens Fisher (1865-1940) fu proprio nel corso del

BOLLETTINO NOVITA’ MAGGIO-LUGLIO 201215 *Structural geology algorithms : vectors and tensors / Richard W. Allmendinger, Nestor Cardozo, Donald M. Fisher. - Cambridge Cambridge University

Informatica per il commercio elettronico Matteo Cristani.

carboidrati, lipidi e amminoacidi [modalit compatibilit ]annaonofri.net/files/carboidrati_lipidi_e_amminoacidi... · 2015-04-24 · grafica a croce ( proiezione di Fisher ) e propose

Bollettino tecnico Guida alla scelta delle valvole rotative Ottobre … · 2019-06-17 · Guida alla scelta delle valvole rotative Fisher™ Valvole rotative Fisher tipiche VALVOLA

1 Matteo Cristani Dipartimento di Informatica Facoltà di Scienze MM. FF. NN. Università degli Studi di Verona cristani Corso.

VVeerriittaass iinn ccaarriittaattee - fondazionegp2.org · cristani per una testimonianza sempre più condivisa di Cristo nella Chiesa e al mondo. Sono tanti i gesti e le parole

1 Matteo Cristani Dipartimento di Informatica Facoltà di Scienze MM. FF. NN. Università degli Studi di Verona cristani Corso di.

Religioni e Culture in Dialogo Sarajevo, 9-11 settembre 2012 · la Promozione dell’Unità dei Cristani, Santa Sede Paulo Lockmann Presidente del Consiglio Metodista Mondiale ...

Cammina re - casadelgiovane.eu · don Arturo Cristani,Donatella Gandini, Bruno Donesana, Nadia Malinverni, Roberta Di Nardo HannO COllaBORatO aquEstO nuMERO Don Arturo Cristani, Sandro