Tecniche di image forsensic per l’identificazione della sorgente

25
UNIVERSITÀ DEGLI STUDI DI FIRENZE Facoltà di Ingegneria Corso di Laurea in INGEGNERIA INFORMATICA Identificazione Identificazione del del dispositivo dispositivo sorgente sorgente mediante mediante tecniche tecniche di di Image Image Forensics Forensics Tesi di Laurea di ANDREA GUIDIERI e FRANCESCO MEI Relatori: Prof. Alessandro Piva Ing. Alessia De Rosa Ing. Roberto Caldelli Ing. Francesca Uccheddu Anno Accademico 2009/2010

description

Tecniche di image forsensic per l’identificazione della sorgente - Andrea Guidieri, Francesco Mei - AA 2009-2010 Relatori: Prof. Alessandro Piva, Dr. Roberto Caldelli, Dr. Alessia De Rosa, Dr. Francesca Uccheddu

Transcript of Tecniche di image forsensic per l’identificazione della sorgente

Page 1: Tecniche di image forsensic per l’identificazione della sorgente

UNIVERSITÀ

DEGLI STUDI DI FIRENZE

Facoltà

di Ingegneria

Corso di Laurea inINGEGNERIA INFORMATICA

IdentificazioneIdentificazione

deldel

dispositivodispositivo

sorgentesorgentemediantemediante

tecnichetecniche

didi

ImageImage

ForensicsForensics

Tesi di Laurea di

ANDREA GUIDIERIe

FRANCESCO MEI

Relatori:Prof. Alessandro Piva

Ing. Alessia De Rosa

Ing. Roberto Caldelli

Ing. Francesca Uccheddu

Anno Accademico 2009/2010

Page 2: Tecniche di image forsensic per l’identificazione della sorgente

SommarioSommario

• Digital Forensic• Identificazione sorgente di acquisizione• Estrazione caratteristiche

• Classificazione dispositivo sorgente • Risultati sperimentali• Conclusioni

o Color Filter Arrayo Rumore

Page 3: Tecniche di image forsensic per l’identificazione della sorgente

Digital ForensicsDigital ForensicsComputer Forensics: Disciplina che si occupa di Identificare Conservare Analizzare Documentare

reperti informatici

al fine di presentare prove digitali valide in procedure civili e penali.

Multimedia Forensics:Branca della Computer Forensics che

focalizza lo studio su contenuti multimediali

per verificarne validità

e affidabilità

in ambito legale.

Page 4: Tecniche di image forsensic per l’identificazione della sorgente

Image ForensicsImage Forensics

Riconoscimento del dispositivo sorgente

Page 5: Tecniche di image forsensic per l’identificazione della sorgente

Obiettivo della tesiObiettivo della tesi

Analisi interpolazione CFA Analisi Rumore

Classificatore

Page 6: Tecniche di image forsensic per l’identificazione della sorgente

Obiettivo della tesiObiettivo della tesi

Page 7: Tecniche di image forsensic per l’identificazione della sorgente

Color Filter ArrayColor Filter Array

Schema a blocchi del funzionamento di una fotocamera digitale

Page 8: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche CFAEstrazione caratteristiche CFA

ObiettivoObiettivo: Determinazione dei coefficienti di interpolazione delle tre bande di colore.

IpotesiIpotesi: Utilizzo del pattern Bayer e sue permutazioni

Uso di un algoritmo di interpolazione tra• Bilineare• Bicubico• Mediano

• Smooth Hue• Gradient Based• Adaptive Color Plane

Page 9: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche CFAEstrazione caratteristiche CFA

Determinazione zone ad alto gradiente orizzontale, verticale e zona “liscia”

Gradiente orizzontaleGradiente verticale Zona liscia

Page 10: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione features CFAEstrazione features CFA

Risoluzione sistema lineare, per ogni zona e ogni banda di colore.

Page 11: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche CFAEstrazione caratteristiche CFA

Page 12: Tecniche di image forsensic per l’identificazione della sorgente

Rumore nei dispositivi digitaliRumore nei dispositivi digitali

Il rumore è

un segnale non desiderato di origine naturale o artificiale che si sovrappone all’informazione trasmessa o elaborata in un sistema.

In fotografia l’effetto è

visibile come una variazione del colore dei pixel che determina un calo di qualità

dell’immagine.

Page 13: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––

Denoising Denoising ––

Calcolo media e deviazione standard del Rumore

2 valori ×

5 filtri ×

3 bande RGB = 30 caratteristiche

Immagine originale Immagine “denoised” Rumore

Filtri utilizzati:o Lineare a media 3x3o Lineare gaussiano 3x3

o Mediana 3x3o Adattivo di Wiener 3x3 e 5x5

Page 14: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumoreEstrazione caratteristiche del rumore ––

Analisi Wavelet Analisi Wavelet ––

First-Order Discrete WaveletDecomposition

• Calcolo deviazione standard HL, LH e HH

Page 15: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumoreEstrazione caratteristiche del rumore ––

Analisi Wavelet Analisi Wavelet ––

• Confronto tra distribuzione gaussiana N(μ,

σ²), la cui media e varianza sono derivate dalla sottobanda, e la distribuzione dei coefficienti della sottobanda stessa.

2 valori × 3 sottobande × 3 bande RGB = 18 caratteristiche

Page 16: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––

Neighborhood prediction Neighborhood prediction ––

Ipotesi: Ottima predizione pixel nelle zone “lisce”

dell’immagine

Localizzazione zone mediante gradiente e sogliatura

Ulteriore suddivisione in zone lisce chiare e scure

Page 17: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––

Neighborhood prediction Neighborhood prediction ––

Ricostruzione zone lisce mediante interpolazione lineare

Page 18: Tecniche di image forsensic per l’identificazione della sorgente

Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––

Neighborhood prediction Neighborhood prediction ––

Confronto tra valori b’

predetti e originali b.

Calcolo media e deviazione standard di Δb=|b’

b|

2 valori × 2 zone lisce × 3 bande RGB = 12 caratteristiche

Page 19: Tecniche di image forsensic per l’identificazione della sorgente

Classificatore SVMLibClassificatore SVMLib

Organizzazione caratteristiche in vettori

Divisione in set per addestramento e testing del classificatore

Training set

Testing set

Page 20: Tecniche di image forsensic per l’identificazione della sorgente

Classificazione e Classificazione e risultati sperimentalirisultati sperimentali

Dispositivi usati per i test:

Page 21: Tecniche di image forsensic per l’identificazione della sorgente

Classificazione e Classificazione e risultati sperimentalirisultati sperimentali

Database immagini:

100 immagini dai 3 modelli, 1/3 per modello

100 immagini dai 3 modelli, 1/3 per modello

100 immagini dai 3 modelli, 1/3 per modello

• Modalità

testing:

Generazione casuale di training set e testing set Leave-one-out: 99% training set, 1% testing set 80-20: 80% training set, 20% testing set

Page 22: Tecniche di image forsensic per l’identificazione della sorgente

Riconoscimento della sorgenteRiconoscimento della sorgente

Determinazione della tipologia di dispositivo.

100 prove

80 –

20

Leave-one-out

Page 23: Tecniche di image forsensic per l’identificazione della sorgente

Riconoscimento della sorgenteRiconoscimento della sorgente

Determinazione della tipologia di dispositivo con variazione della finestra di analisi,da 512 x 512 a 256 x 256. 100 prove

80 –

20

Leave-one-out

Page 24: Tecniche di image forsensic per l’identificazione della sorgente

Riconoscimento della sorgenteRiconoscimento della sorgente

Determinazione della tipologia di dispositivo con variazione a 0.3 MP delle foto da cellulare. 100 prove

80 –

20

Leave-one-out

Page 25: Tecniche di image forsensic per l’identificazione della sorgente

ConclusioniConclusioni

Utilizzo di coefficienti di interpolazione e caratteristiche del rumore per discriminare le tipologie di dispositivo sorgente

Varietà

di prove effettuate in condizioni diverse

Sviluppi futuriIdentificazione di immagini esterne al databaseRobustezza del sistema a diverse compressioni JPEG