Post on 28-Jan-2015
description
UNIVERSITÀ
DEGLI STUDI DI FIRENZE
Facoltà
di Ingegneria
Corso di Laurea inINGEGNERIA INFORMATICA
IdentificazioneIdentificazione
deldel
dispositivodispositivo
sorgentesorgentemediantemediante
tecnichetecniche
didi
ImageImage
ForensicsForensics
Tesi di Laurea di
ANDREA GUIDIERIe
FRANCESCO MEI
Relatori:Prof. Alessandro Piva
Ing. Alessia De Rosa
Ing. Roberto Caldelli
Ing. Francesca Uccheddu
Anno Accademico 2009/2010
SommarioSommario
• Digital Forensic• Identificazione sorgente di acquisizione• Estrazione caratteristiche
• Classificazione dispositivo sorgente • Risultati sperimentali• Conclusioni
o Color Filter Arrayo Rumore
Digital ForensicsDigital ForensicsComputer Forensics: Disciplina che si occupa di Identificare Conservare Analizzare Documentare
reperti informatici
al fine di presentare prove digitali valide in procedure civili e penali.
Multimedia Forensics:Branca della Computer Forensics che
focalizza lo studio su contenuti multimediali
per verificarne validità
e affidabilità
in ambito legale.
Image ForensicsImage Forensics
Riconoscimento del dispositivo sorgente
Obiettivo della tesiObiettivo della tesi
Analisi interpolazione CFA Analisi Rumore
Classificatore
Obiettivo della tesiObiettivo della tesi
Color Filter ArrayColor Filter Array
Schema a blocchi del funzionamento di una fotocamera digitale
Estrazione caratteristiche CFAEstrazione caratteristiche CFA
ObiettivoObiettivo: Determinazione dei coefficienti di interpolazione delle tre bande di colore.
IpotesiIpotesi: Utilizzo del pattern Bayer e sue permutazioni
Uso di un algoritmo di interpolazione tra• Bilineare• Bicubico• Mediano
• Smooth Hue• Gradient Based• Adaptive Color Plane
Estrazione caratteristiche CFAEstrazione caratteristiche CFA
Determinazione zone ad alto gradiente orizzontale, verticale e zona “liscia”
Gradiente orizzontaleGradiente verticale Zona liscia
Estrazione features CFAEstrazione features CFA
Risoluzione sistema lineare, per ogni zona e ogni banda di colore.
Estrazione caratteristiche CFAEstrazione caratteristiche CFA
Rumore nei dispositivi digitaliRumore nei dispositivi digitali
Il rumore è
un segnale non desiderato di origine naturale o artificiale che si sovrappone all’informazione trasmessa o elaborata in un sistema.
In fotografia l’effetto è
visibile come una variazione del colore dei pixel che determina un calo di qualità
dell’immagine.
Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––
Denoising Denoising ––
Calcolo media e deviazione standard del Rumore
2 valori ×
5 filtri ×
3 bande RGB = 30 caratteristiche
Immagine originale Immagine “denoised” Rumore
Filtri utilizzati:o Lineare a media 3x3o Lineare gaussiano 3x3
o Mediana 3x3o Adattivo di Wiener 3x3 e 5x5
Estrazione caratteristiche del rumoreEstrazione caratteristiche del rumore ––
Analisi Wavelet Analisi Wavelet ––
First-Order Discrete WaveletDecomposition
• Calcolo deviazione standard HL, LH e HH
Estrazione caratteristiche del rumoreEstrazione caratteristiche del rumore ––
Analisi Wavelet Analisi Wavelet ––
• Confronto tra distribuzione gaussiana N(μ,
σ²), la cui media e varianza sono derivate dalla sottobanda, e la distribuzione dei coefficienti della sottobanda stessa.
2 valori × 3 sottobande × 3 bande RGB = 18 caratteristiche
Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––
Neighborhood prediction Neighborhood prediction ––
Ipotesi: Ottima predizione pixel nelle zone “lisce”
dell’immagine
Localizzazione zone mediante gradiente e sogliatura
Ulteriore suddivisione in zone lisce chiare e scure
Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––
Neighborhood prediction Neighborhood prediction ––
Ricostruzione zone lisce mediante interpolazione lineare
Estrazione caratteristiche del rumore Estrazione caratteristiche del rumore ––
Neighborhood prediction Neighborhood prediction ––
Confronto tra valori b’
predetti e originali b.
Calcolo media e deviazione standard di Δb=|b’
–
b|
2 valori × 2 zone lisce × 3 bande RGB = 12 caratteristiche
Classificatore SVMLibClassificatore SVMLib
Organizzazione caratteristiche in vettori
Divisione in set per addestramento e testing del classificatore
Training set
Testing set
Classificazione e Classificazione e risultati sperimentalirisultati sperimentali
Dispositivi usati per i test:
Classificazione e Classificazione e risultati sperimentalirisultati sperimentali
Database immagini:
100 immagini dai 3 modelli, 1/3 per modello
100 immagini dai 3 modelli, 1/3 per modello
100 immagini dai 3 modelli, 1/3 per modello
• Modalità
testing:
Generazione casuale di training set e testing set Leave-one-out: 99% training set, 1% testing set 80-20: 80% training set, 20% testing set
Riconoscimento della sorgenteRiconoscimento della sorgente
Determinazione della tipologia di dispositivo.
100 prove
80 –
20
Leave-one-out
Riconoscimento della sorgenteRiconoscimento della sorgente
Determinazione della tipologia di dispositivo con variazione della finestra di analisi,da 512 x 512 a 256 x 256. 100 prove
80 –
20
Leave-one-out
Riconoscimento della sorgenteRiconoscimento della sorgente
Determinazione della tipologia di dispositivo con variazione a 0.3 MP delle foto da cellulare. 100 prove
80 –
20
Leave-one-out
ConclusioniConclusioni
Utilizzo di coefficienti di interpolazione e caratteristiche del rumore per discriminare le tipologie di dispositivo sorgente
Varietà
di prove effettuate in condizioni diverse
Sviluppi futuriIdentificazione di immagini esterne al databaseRobustezza del sistema a diverse compressioni JPEG