Autenticazione Continua Durante la Navigazione WebBasata sulla Dinamica del Mouse
Corso di laurea magistrale in Ingegneria Informatica
Daniele De Gan
DIA - Universita degli Studi di Trieste
Relatoreprof. Alberto Bartoli
Correlatoriprof. Eric Medvet
dott. Andrea De Lorenzo
Autenticazione e dinamica del mouse
Autenticazione nel web
Autenticazione:
Processo di verifica dell’identita per autorizzare l’accesso ai servizi
nel web paradigma Username - Password
Limitazioni:
a punto di accesso
partecipazione attiva utente
furto credenziali
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 2 / 22
Autenticazione e dinamica del mouse
Problema
Si cerca un metodo di autenticazione web:
continuo
non invasivo
Le motivazioni:
ovviare alle possibili limitazioni dei sistemi tradizionali
meccanismo di supporto alle password
richiesta di maggior protezione dei dati sensibili
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 3 / 22
Autenticazione e dinamica del mouse
La dinamica del mouse
Dinamica del mouse:
Successione di eventi
movimenti
click
scroll
. . .
Considerata una biometrica:
caratteristica dell’utente (ipotesi)
inconscia
non necessario hardware aggiuntivo
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 4 / 22
Autenticazione e dinamica del mouse
Obiettivo della tesi
Sistema di autenticazione continua basato sulla dinamica del mouse
autenticare l’utente in base al suo utilizzo del mouse
supporto al meccanismo tradizionale di autenticazione
Fornire:
metodo di analisi
valutazioni del sistema
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 5 / 22
Stato dell’arte
In letteratura
Diversi studi ma:
ambienti fortemente controllati
interazioni utente (serie di operazioni predefinite)
vincoli dispositivi
In commercio:
nessun prodotto che utilizzi esclusivamente la dinamica del mouse
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 6 / 22
Stato dell’arte
Approccio di analisi
L’approccio consolidato in letteratura prevede:
1 raccolta dati
2 feature extraction
Feature:
Proprieta individuale e misurabile di un fenomeno osservatoEsempi → distanza percorsa, velocita media, ...
3 classificazione con strumenti di Machine Learning
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 7 / 22
Raccolta dati
Raccolta dati
Utilizzato uno strumento sviluppato in precedenza:
registra e salva su file tutti gli eventi durante la navigazione
mousetastiera
completamente trasparente all’utente
proxy server + servizio web
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 8 / 22
Raccolta dati
Raccolta dati
1 settimana
5 utenti del laboratorio
modalita
navigazione liberanessun vincolo
Utente Eventi registrati
1 160 9982 260 1583 206 1304 339 5325 244 140
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 9 / 22
Raccolta dati
Eventi
Gli eventi registrati hanno:
codice evento
posizione assoluta → punto piano
timestamp → ordinati
Ottenute 5 sequenze di eventi ordinate per timestamp
Codice Evento X Y Time
. . . . . . . . . . . .64 690 263 137093460597764 734 725 137093460659664 724 656 13709346075844 740 594 13709346081118 740 594 13709346086121 740 594 1370934609072
. . . . . . . . . . . .
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 10 / 22
Analisi dei dati
Sottosequenze
Idea:
Autenticare utenti in base alla dinamica precedente i click
Dalla sequenza di eventi:
Individuati gli eventi “click”
Selezionati N eventi precedenti ad ogni click
Per ogni utente:
Sequenza → Click → Insieme di sottosequenze
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 11 / 22
Analisi dei dati
Le features
Ogni evento:
puo essere considerato un punto su un piano
sequenza di eventi → traiettoria
ha un’informazione temporale
Definite 39 features numeriche
durata
distanza
velocita
accelerazioni
direzioni dei movimenti
. . .
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 12 / 22
Analisi dei dati
Feature extraction
Calcolo delle features, per ogni sottosequenza:
vettore le cui componenti sono i valori delle features
Per ogni utente:
Sequenza → Click → Insieme di sottosequenze → Insieme di vettori difeatures
Utente Numero vettori
1 10872 15123 10024 18395 1110
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 13 / 22
Analisi dei dati
SVM
Support Vector Machines:
apprendimento supervisionato
computer vision, riconoscimento facciale, OCR
classificazione binaria
Ogni SVM e associata ad un utente (legittimo).
Training:
vettori utente legittimo + vettori utenti non legittimi → modello
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 14 / 22
Analisi dei dati
Autenticazione
SVM:
input: vettore
output: legittimo/non legittimo
Strumento sviluppato:
input: insiemi di w vettori consecutivi
output:
maggioranza classe “legittimo” → utente autenticatoaltrimenti → utente non autenticato
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 15 / 22
Valutazione sperimentale
Indici di prestazione
Input legittimo
sistema classifica non legittimo → FALSO POSITIVO
FPR (False Positive Rate)
Input non legittimo
sistema classifica legittimo → FALSO NEGATIVO
FNR (False Negative Rate)
Accuracy
Numero di classificazioni esatte su numero totale di input
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 16 / 22
Valutazione sperimentale
Esperimento #1
Parametri fissati:
N = 10 eventi prima del click
w = 11 larghezza finestra di valutazione
Utente FPR σ FPR FNR σ FNR Accuracy
1 14.28 2.64 29.18 6.52 73.842 10.47 7.32 12.44 3.71 88.023 12.38 6.91 26.81 10.94 76.304 16.29 7.49 26.91 8.00 75.155 10.47 6.46 32.48 10.32 71.98
Media 12.78 6.16 25.56 7.89 77.05
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 17 / 22
Valutazione sperimentale
Esperimento #2
Parametri:
N = 10 eventi prima del click
w ∈ {1, . . . , 60} larghezza finestra variabile
w FPR FNR Accuracy Prima valutazione (min.)
11 12.78 25.56 77.05 9.115 10.50 21.07 81.10 12.525 7.52 15.04 86.46 25.045 4.38 8.53 92.26 37.560 3.06 6.64 94.01 49.1
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 18 / 22
Valutazione sperimentale
Esperimento #2
1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
0.5
0.6
0.7
0.8
0.9
1.0
w
Acc
ura
cy
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 19 / 22
Valutazione sperimentale
Esperimento #3
Mutua informazione features-utente
ordinato features per valore mutua informazione decrescentetraining con 1/4, 2/4 e 3/4 delle features
0 10 20 30 40 50 60
0.5
0.6
0.7
0.8
0.9
w
Acc
ura
cy
1/4 features2/4 features3/4 features4/4 features
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 20 / 22
Valutazione sperimentale
Conclusioni
Obiettivi raggiunti:
sistema di autenticazione continua basata su dinamica del mouse
non invasivo
Sviluppi futuri:
aumento dimensioni dataset e valutazione
anomaly detection
Daniele De Gan (DIA - UniTs) Relazione attivita tesi 21 / 22
Top Related