EEG - Datamining pres. 08-10-2013

16
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining Ing. Claudio Camuto 1

description

Slide riassuntive sull'applicazione di tecniche di datamining ed entropiche all'elaborazione di tracciati EEG di soggetti epilettici.

Transcript of EEG - Datamining pres. 08-10-2013

Page 1: EEG - Datamining pres. 08-10-2013

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Ing. Claudio Camuto

1

Page 2: EEG - Datamining pres. 08-10-2013

Obiettivi

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

E se si trovasse un modo di predire le crisi epilettiche dall’EEG?

Certo, come no! L’EEG è solo un ammasso di dati incomprensibili che ti da informazioni solo quando è troppo tardi!!!E se si potesse usare anche

per scoprire i soggetti epilettici anche se non hanno mai avuto crisi? Fantascienza!!! E poi son

tanti dati…sono 900000 record a seduta per paziente! Li guarderai ad uno ad uno?Data mining ed

entropie!!!

Data…che? Entro… cosa? Mah…son un po’ scettico….

Vedrai!!!

Page 3: EEG - Datamining pres. 08-10-2013

L’epilessia breve introduzione

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

«Ictal», che rappresenta l’intervallo durante il quale avviene la crisi epilettica ;

«Perictal», che rappresenta ciò che precede e segue la crisi, rispettivamente «Preictal» e «postictal»;

«Interictal», che rappresenta l’intervallo fra una crisi e l’altra.

Fasi epilettiche:

Durante le fasi di «interictal» e «perictal» il tracciato è molto, almeno in apparenza, a quello di un paziente sano;

Durante la fase di «ictal» il tracciato diventa molto irregolare

Caratterizzazione tracciato EEG epilettico:

Tracciato dell’elettrodo Fp1 di un paziente epilettico, evidenziate le crisi

Page 4: EEG - Datamining pres. 08-10-2013

La sorgente: il tracciato EEG

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

«L’elettroencefalogramma (EEG),è una misura del flusso di corrente extracellulare che viene generato dalla somma delle attività di un elevato numero di neuroni»

Costituisce un esame semplice da seguire e poco invasivo

Fornisce diverse informazioni visibili ad occhio nudo

Largamente utilizzato nell’analisi delle dinamiche celebrali

Si ritiene che contenga delle informazioni celate utilizzabili a fini diagnostici

Il segnale è ricavato dalla sovrapposizione dei segnali dei vari strati

attraversati;

Presenta degli artefatti, per cui sono necessarie post-elaborazioni

Perché preferirlo ad altri esami:

Problemi da affrontare:

Page 5: EEG - Datamining pres. 08-10-2013

Strumenti: Il data mining

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Descrittivo, descrive e classifica i dati;

Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di

predire l’andamento futuro dei dati;

Tipi di mining:

«Con il termine “data mining” si intendono tutte quelle tecniche atte ad estrarreinformazioni nascoste da un insieme vasto di dati; tali informazioni non sonooccultate o criptate ma, semplicemente, non direttamente visibili all’utente»

Perche servono?

La quantità di dati da analizzare è notevole in quanto un EEG si compone dei segnali di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi una sola seduta genera di un solo paziente genera 900000 record di almeno 21 campi

Page 6: EEG - Datamining pres. 08-10-2013

Strumenti: Il data mining

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Utilizzabile solo quando si conoscono già le classi del sistema, per questa ragione viene chiamato «supervised learning»;

Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello è spesso un albero decisionale con struttura IF…ELSE;

Necessita di un insieme di dati di apprendimento detto training set per generare il modello;

Necessita di un insieme di dati detto test set per verificare il modello creato.

Classificazione:

Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero

raggruppamenti di oggetti con caratteristiche simili):

Si tratta di un decision tree;

Calcola ad ogni iterazione l’attributo che maggiormente separa i dati, ne crea

quindi una diramazione; procede ricorsivamente sui rami creati;

Provvede ad eseguire il pruning dei dati.

Algoritmo J48:

Page 7: EEG - Datamining pres. 08-10-2013

Strumenti: Il data mining

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Utilizzato principalmente quando non si conoscono a priori le classi da creare;

Deve essere possibile calcolare la distanza fra due dati;

Un dato può appartenere ad un solo cluster, a cui è vicino, e deve essere distante dagli altri;

Non deve essere rilevante l’ordine con cui vengono forniti i dati;

Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna comprendere ciò che l’algoritmo ha classificato.

Clustering:

Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a

caratteristiche comuni, senza conoscere a priori le classi:

Algoritmo Simple K-Means:

Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati un elemento da assegnare a ciascuno che diventa temporaneamente il centro;

Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al più vicino e ne ricalcola il centro facendo una media fra i dati del cluster.

Page 8: EEG - Datamining pres. 08-10-2013

Strumenti: Le entropie

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne

esistono varie formulazioni fra cui la più nota è Shannon; sono state provate an Tsallis,

Renyi, Permutation Entropy (al variare degli indici P e M).

Perche servono?

Dalle analisi effettuate in campo medico si è visto che prima della crisi il cervello che solitamente è un sistema altamente caotico diventa più «ordinato»; come meccanismo di sicurezza, per ripristinare il «caos» originale viene generata la crisi e quindi uno strumento che calcola il livello di disordine è sicuramente utile

Page 9: EEG - Datamining pres. 08-10-2013

Strumenti: WEKA

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono

realizzati in modo tale da essere facilmente integrati nel codice di altri software

Page 10: EEG - Datamining pres. 08-10-2013

EEG-entropie-mining

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Lavoro svolto:

Caricamento dei dati da file su database;

Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining);

Utilizzando pl/sql e i dati forniti: Estrazione dei «precrisi» dei vari pazienti;

Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le «crisi» dei vari

pazienti;

Utilizzando WEKA: Clustering dei vari «precrisi»;

Utilizzando WEKA: Clustering dei vari intervalli fra le «crisi»;

Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi;

Software;

Test su altri EEG: Alzheimer.

Page 11: EEG - Datamining pres. 08-10-2013

EEG-entropie-miningClustering segnale «precrisi» di tutti i campioni – prima crisi

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Estrazione del «precrisi» della prima crisi, preictal, e analisi con Clustering a due classi su tutti i pazienti epilettici:

I valori calcolati sul campione N. 14 rispetto alle entropie, in ordine:

P1M3,

P1M4,

P2M3,

P2M4

In rosso il segnale, in verde l’esordio crisi, in blu il segnale classificato in una categoria differente

Page 12: EEG - Datamining pres. 08-10-2013

EEG-entropie-miningClustering segnale «precrisi» di tutti i campioni – crisi successive

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Estrazione del «precrisi» delle crisi successive alla prima, interictal, e analisi con Clustering a due classi su tutti i pazienti epilettici:

I valori calcolati sul campione N. 5 rispetto alle entropie, in ordine:

P1M3,

P1M4,

P2M3,

P2M4

In rosso il segnale, in verde l’esordio crisi, in blu il segnale classificato in una categoria differente

Page 13: EEG - Datamining pres. 08-10-2013

Software

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Motivazioni:

Fornire un punto di accesso alle tecniche di mining anche a personale non informatico;

Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne altre approfondendo e verificando i risultati ottenuti;

Estendere le ricerche anche ad altri ambiti (es. Alzheimer).

Tecnologia: Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib;

Oracle + Tomcat.

Caratteristiche:

Web Application con profilazione utente;

Procedure guidate (wizard) per agevolare l’inserimento dei dati, la commissione di nuove analisi da effettuare, la creazione di grafici;

Scheduling delle attività con avviso per e-mail del completamento per non sovraccaricare il server (alcune elaborazioni richiedono ore);

Generazione grafici png e jpeg;

Integrazione delle tecniche di mining di WEKA.

Page 14: EEG - Datamining pres. 08-10-2013

Software

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Page 15: EEG - Datamining pres. 08-10-2013

Conclusioni

Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining

Conclusioni sui dati elaborati:

Le potenzialità di questa combinazione Mining-Entropie sono evidenti;

Spesso è stato possibile trovare un segnale prima della crisi interpretabile come

precrisi;

Tutti i pazienti vanno analizzati singolarmente per trovare l’entropia e le

caratteristiche del segnale precrisi;

In tutti i casi è stato possibile separare pazienti epilettici (senza crisi) da sani.

Possibili applicazioni:

Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile

diagnosticare la patologia epilettica anche in pazienti apparentemente sani;

Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi

in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla;

Page 16: EEG - Datamining pres. 08-10-2013

Grazie per la vostra cortese attenzione