Ica analisi digruppo

19
ICA per analisi di gruppo Simone Romano 1 1 Università degli Studi di Salerno Elaborazione di segnali ed immagini biomediche Prof. Fabrizio Esposito S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 1 / 19

Transcript of Ica analisi digruppo

ICA per analisi di gruppo

Simone Romano1

1Università degli Studi di Salerno

Elaborazione di segnali ed immagini biomedicheProf. Fabrizio Esposito

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 1 / 19

Introduzione

L’utilizzo dell’ICA è molto diffuso per lo studio di resting-state fMRIcon il GLM è possibile studiare attivazioni con un protocollodefinitol’ICA è utilizzata per analisi multivariate data-driven

Diverse soluzioni utilizzano l’ICA peranalisi singoleanalisi di gruppo

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 2 / 19

ICA per analisi di gruppo

Analisi di gruppo con l’ICAICA su dati aggregati di tutti i soggettiICA eseguita singolarmente su ogni soggetto e aggregazione deirisultati

ProblemaEffettuata l’ICA su ogni soggetto, come mettiamo in corrispondenza lecomponenti estratte per i vari soggetti?

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 3 / 19

Aggregazione componenti

Diversi approcciIndependent component analysis of fMRI group studies byself-organizing clustering [1] [2]clustering delle componenti dei vari soggetti rispetto a deitemplate

si crea un cluster per ogni templatesi calcola uno score (GOF o altri) per ogni componente rispetto adogni templateogni componente è associata al cluster relativo al template con cuiha score maggiore

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 4 / 19

Idea proposta

Approccio alternativo presentatoICA singolarmente per ogni soggetto (50 componenti)aggregazione dati in un’unica matriceclustering su tutti i datigenerazione di un file per ogni cluster contenente la componente di ognisoggetto associata a quel cluster (se presente) più la componente media

Un punto fondamentale della Cluster analysisdefinizione di una misura di similarità o di distanza tra gli oggetti

Dipende molto dalla tipologia di dati

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 5 / 19

Clustering

Algoritmi di clustering utilizzatikmeans - distanza euclideakmeans - Pearsonkmedoids - Pearsonkmedoids - Spearman

Validazione risultatiPer la scelta del k è stato utilizzato il coefficiente della Silhouette.

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 6 / 19

Clustering vincolato

Nei risultati del clustering possono presentarsi le seguenti condizioni:1 un cluster non contiene componenti di un soggetto

si può assumere che quel soggetto non possiede quellacomponente

2 un cluster contiene più componenti di uno stesso soggettoprobabilmente il clustering ha raggruppato più componenti similidello stesso soggetto

Con il clustering si vogliono unire le componenti simili dei vari soggettiogni cluster deve al massimo una componente per ogni soggetto

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 7 / 19

Clustering vincolato - 1

È stata realizzata una funzione per vincolare i risultati del clusteringinput

vettore con indice del cluster per ogni osservazionematrice delle distanze di ogni punto da ogni centroidevettore di vincoli CL (coppie di elementi che non possono starenello stesso cluster)

outputnuovo vettore con indice del cluster per ogni osservazione

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 8 / 19

Clustering vincolato - 2

L’alogoritmo:foreach cluster C do

foreach coppia ∈ CL dolascia nel cluster l’elemento più vicino al centroide

endend

Miglioramento risultatiDopo aver aggiunti i vincoli ai risultati del clustering è possibileeliminare da ogni cluster le componenti lontane dalla componentemedia del cluster.

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 9 / 19

Dataset e procedura

L’approccio descritto è stato applicato ad un dataset di 11 soggettiICA a partire dai VTC di ogni paziente (50 componenti)vettorizzazione di ogni componente e aggregazione di tutte lecomponenti di tutti i soggetticlustering con gli approcci descrittirimozione da ogni cluster degli elementi che non rispettano ivincoligenerazione di un file .ica per ogni cluster contenente:

la componente di ogni soggetto (se presente) associata a quelcluster (ordinati per distanza dal centroide)componente media del cluster

visualizzazione risultati in BrainVoyager utilizzando un VMR inTalairach

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 10 / 19

Scelta del k

Risultati della Silhouette per ogni tipologia di clustering utilizzata:

5 10 15 20 25 30-0.01

0

0.01

0.02

0.03

0.04

0.05

0.06

Silhouette PamPearsonSilhouette PamSpearmanSilhouette KmeansEuclideanSilhouette KmeansPearson

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 11 / 19

Qualità cluster

Risultati della Silhouette per kmeans con distanza euclidea:

0

0.2

0.4

kmeansEuclidean 5

0

0.2

0.4

kmeansEuclidean 10

0

0.2

0.4

kmeansEuclidean 15

0

0.2

0.4

kmeansEuclidean 20

0

0.2

0.4

kmeansEuclidean 25

0

0.2

0.4

kmeansEuclidean 30

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 12 / 19

Qualità cluster - 1

Risultati della Silhouette per kmeans con correlazione di Pearson:

0

0.2

0.4

kmeansPearson 5

0

0.2

0.4

kmeansPearson 10

0

0.2

0.4

kmeansPearson 15

0

0.2

0.4

kmeansPearson 20

0

0.2

0.4

kmeansPearson 25

0

0.2

0.4

kmeansPearson 30

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 13 / 19

Qualità cluster - 2

Risultati della Silhouette per Pam con correlazione di Spearman:

-0.10

0.10.20.3

PamSpearman 5

-0.10

0.10.20.3

PamSpearman 10

-0.10

0.10.20.3

PamSpearman 15

-0.10

0.10.20.3

PamSpearman 20

-0.10

0.10.20.3

PamSpearman 25

-0.10

0.10.20.3

PamSpearman 30

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 14 / 19

Qualità cluster - 2

Risultati della Silhouette per Pam con correlazione di Pearson:

00.10.20.3

PamPearson 5

00.10.20.3

PamPearson 10

00.10.20.3

PamPearson 15

00.10.20.3

PamPearson 20

00.10.20.3

PamPearson 25

00.10.20.3

PamPearson 30

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 15 / 19

Risultati

Componente media - cluster 5 Pam Pearson:

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 16 / 19

Risultati - 1

Componente media - cluster 7 Pam Pearson:

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 17 / 19

Risultati - 2

Componente media - cluster 4 Pam Spearman:

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 18 / 19

Riferimenti I

Esposito et al.Independent component analysis of fMRI group studies byself-organizing clustering.Neuroimage 25 193-2015, 2005.http://u.cs.biu.ac.il/~louzouy/courses/seminar/ica2.pdf

E. Quattrocki Knight et al.Self-organizing group level Independent Component Analysisreveals task-related activity as well as resting state networksduring auditory stimulation.Proc. Intl. Soc. Mag. Reson. Med. 19, 2011.http://cds.ismrm.org/protected/11MProceedings/files/1595.pdf

S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 19 / 19