Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof....

30
Ricerca di Nuclei Ricerca di Nuclei Galattici Attivi in Galattici Attivi in Survey Fotometriche Survey Fotometriche Multibanda Multibanda Relatori: Relatori: Candidato: Candidato: Ch.mo Prof. Giuseppe Longo Ch.mo Prof. Giuseppe Longo Stefano Stefano Cavuoti Cavuoti Dott. Maurizio Paolillo Dott. Maurizio Paolillo

Transcript of Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof....

Page 1: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Ricerca di Nuclei Ricerca di Nuclei Galattici Attivi inGalattici Attivi in

Survey Fotometriche Survey Fotometriche MultibandaMultibanda

Relatori:Relatori: Candidato:Candidato:

Ch.mo Prof. Giuseppe LongoCh.mo Prof. Giuseppe Longo Stefano CavuotiStefano Cavuoti

Dott. Maurizio PaolilloDott. Maurizio Paolillo Matricola 60/958Matricola 60/958

Page 2: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

MotivazioniMotivazioni

Le survey moderne hanno prodotto, e ancora più lo faranno in futuro, Le survey moderne hanno prodotto, e ancora più lo faranno in futuro, un’enorme quantità di dati (molti TB). un’enorme quantità di dati (molti TB).

Tali dati non possono essere trattati con le tradizionali tecniche statistiche Tali dati non possono essere trattati con le tradizionali tecniche statistiche ma impongono l’adozione di un nuovo paradigma di “Data Mining” in larga ma impongono l’adozione di un nuovo paradigma di “Data Mining” in larga parte basato su tecniche di A.I. (Artificial Intelligence) che aiutino parte basato su tecniche di A.I. (Artificial Intelligence) che aiutino l’operatore a comprimere l’informazione e renderla intellegibile.l’operatore a comprimere l’informazione e renderla intellegibile.

In questo lavoro si è mostrato come tali tecniche possano consentire di In questo lavoro si è mostrato come tali tecniche possano consentire di ottenere risultati significativi in un campo di grande attualità ed interesse: ottenere risultati significativi in un campo di grande attualità ed interesse: la ricerca di Nuclei Galattici Attivi (AGN) in survey fotometriche la ricerca di Nuclei Galattici Attivi (AGN) in survey fotometriche multibandamultibanda. .

Page 3: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Nuclei Galattici AttiviNuclei Galattici Attivi

Galassia NormaleGalassia Normale Seyfert 2Seyfert 2Seyfert 1Seyfert 1QuasarQuasar

Oggetti con morfologia ottica simile, ma caratteristiche fisiche Oggetti con morfologia ottica simile, ma caratteristiche fisiche completamente diversecompletamente diverse

Page 4: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Modello Unificato degli AGNModello Unificato degli AGN

Buco NeroBuco Nero

Disco di Accrescimento Disco di Accrescimento (Emissione UV, Ottica)(Emissione UV, Ottica)

Dust Torus Dust Torus (Emissione IR)(Emissione IR)

Broad Line Region (BLR) Broad Line Region (BLR) (Emissione Ottica)(Emissione Ottica)

Narrow Line Region (NLR) Narrow Line Region (NLR) (Emissione Ottica)(Emissione Ottica)

Jet (Emissione X, Gamma e Radio) Jet (Emissione X, Gamma e Radio)

Page 5: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Modello Unificato degli AGNModello Unificato degli AGN

Linea di Vista Ortogonale al piano del disco: Linea di Vista Ortogonale al piano del disco: BLAZARBLAZARLa materia nel jet si muove a velocità relativistica, quindi la radiazione La materia nel jet si muove a velocità relativistica, quindi la radiazione emessa è fortemente collimata (beamed) e può variare con periodi molto emessa è fortemente collimata (beamed) e può variare con periodi molto brevi. Sono caratterizzati da una intensa variabilità con tempi scala molto brevi. Sono caratterizzati da una intensa variabilità con tempi scala molto brevi. I blazar sono anche gli unici oggetti dove la radiazione gamma tra brevi. I blazar sono anche gli unici oggetti dove la radiazione gamma tra 100 MeV fino ai 10100 MeV fino ai 1033 GeV, risulta in generale energeticamente dominante. GeV, risulta in generale energeticamente dominante.

Linea di Vista obliqua rispetto al piano del disco: Linea di Vista obliqua rispetto al piano del disco: TIPO 1TIPO 1Si è in grado di osservare direttamente la regione centrale. Dallo spettro Si è in grado di osservare direttamente la regione centrale. Dallo spettro emergono le componenti broad-lines, narrow-lines e l’emissione dal disco emergono le componenti broad-lines, narrow-lines e l’emissione dal disco di accrescimento. Le righe spettrali permesse risultano molto allargate nel di accrescimento. Le righe spettrali permesse risultano molto allargate nel dominio delle frequenze con una componente stretta sovrapposta.dominio delle frequenze con una componente stretta sovrapposta.

Linea di vista parallela al piano del disco: Linea di vista parallela al piano del disco: TIPO 2TIPO 2Tutta la regione centrale è oscurata, compresi buco nero, disco di Tutta la regione centrale è oscurata, compresi buco nero, disco di accrescimento e broad line region. Tutto ciò che si può osservare è accrescimento e broad line region. Tutto ciò che si può osservare è l’emissione dovuta al dust torus (prevalentemente nell’infrarosso) e le righe l’emissione dovuta al dust torus (prevalentemente nell’infrarosso) e le righe di emissione delle NLR.di emissione delle NLR.

Page 6: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Le Diverse FenomenologieLe Diverse Fenomenologie

Page 7: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Nuclei Galattici AttiviNuclei Galattici Attivi

Allo stato attuale il riconoscimento degli AGN avviene o da Allo stato attuale il riconoscimento degli AGN avviene o da un’osservazione dello spettro “ad occhio” o tramite linee empiriche un’osservazione dello spettro “ad occhio” o tramite linee empiriche basate su rapporti di righebasate su rapporti di righe

Entrambi i metodi utilizzano informazioni spettroscopiche che sono Entrambi i metodi utilizzano informazioni spettroscopiche che sono “time consuming” (uno spettro per oggetto). “time consuming” (uno spettro per oggetto).

In questo lavoro di tesi si è cercato di ottenere una classificazione In questo lavoro di tesi si è cercato di ottenere una classificazione degli AGN basata su dati fotometrici (una lastra per centinaia di degli AGN basata su dati fotometrici (una lastra per centinaia di oggetti).oggetti).

Il passaggio dallo Il passaggio dallo spazio dei parametri spettroscopicospazio dei parametri spettroscopico a quello a quello dei dei parametri fotometriciparametri fotometrici è possibile in quanto la presenza di è possibile in quanto la presenza di righe di emissione in una data banda influenza il flusso nella stessa righe di emissione in una data banda influenza il flusso nella stessa e di conseguenza il colore. Nella fotometria le righe con cui si e di conseguenza il colore. Nella fotometria le righe con cui si classificano gli AGN scompaiono; inoltre la misura del redshift classificano gli AGN scompaiono; inoltre la misura del redshift fotometrico è molto meno accurata. Per eliminare, almeno in parte, fotometrico è molto meno accurata. Per eliminare, almeno in parte, la degenerazione introdotta dalla mancanza delle righe è utile la degenerazione introdotta dalla mancanza delle righe è utile usare i redshift fotometrici più accurati possibili.usare i redshift fotometrici più accurati possibili.

Page 8: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

I dati utilizzati provengono dal database della Sloan Digital Sky Survey che I dati utilizzati provengono dal database della Sloan Digital Sky Survey che copre circa un quarto della volta celeste.copre circa un quarto della volta celeste.

FotometriaFotometria::

Copertura: 9583 sq. deg.Copertura: 9583 sq. deg.Oggetti Osservati: 287 MOggetti Osservati: 287 MVolume dei Dati: Volume dei Dati:

Immagini: 10 TBImmagini: 10 TB

Cataloghi: 6 TBCataloghi: 6 TB3x103x1088 oggetti oggetti

Spettroscopia:Spettroscopia:

Copertura: 7425 sq. deg.Copertura: 7425 sq. deg.Oggetti Osservati: 1.2 MOggetti Osservati: 1.2 MVolume dei Dati: 310 GBVolume dei Dati: 310 GB

Sloan Digital Sky SurveySloan Digital Sky Survey

Necessità di un Necessità di un approccio approccio

automatico automatico all’analisi dei dati all’analisi dei dati

(data mining)(data mining)

Intelligenza artificialeIntelligenza artificiale

Page 9: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Reti Neurali BiologicheReti Neurali Biologiche

Cervello umano:Cervello umano:

esistono vari tipi di neuroniesistono vari tipi di neuroni

il cervello è costituito in media di 10 miliardi di neuroni impacchettatiil cervello è costituito in media di 10 miliardi di neuroni impacchettati

con densità dell’ordine di 80000 neuroni per mmcon densità dell’ordine di 80000 neuroni per mm33

ogni neurone interagisce con 1000-10000 neuroniogni neurone interagisce con 1000-10000 neuroni

il collegamento sinaptico è possibile anche tra neuroni anche molto distantiil collegamento sinaptico è possibile anche tra neuroni anche molto distanti

l’elaborazione risiede in intere regioni ben localizzatel’elaborazione risiede in intere regioni ben localizzate

la struttura cerebrale è sempre in evoluzionela struttura cerebrale è sempre in evoluzione

l’elaborazione dell’informazione che viene diffusa in parallelo tra migliaia di l’elaborazione dell’informazione che viene diffusa in parallelo tra migliaia di neuroni porta all’emergere dei processi cognitivineuroni porta all’emergere dei processi cognitivi

Page 10: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Reti Neurali - MLPReti Neurali - MLP

L’algoritmo detto Multi Layer Perceptron (MLP) si basa sul concetto di L’algoritmo detto Multi Layer Perceptron (MLP) si basa sul concetto di perceptrone, derivato dal neurone biologico mentre il metodo di perceptrone, derivato dal neurone biologico mentre il metodo di apprendimento si basa sul metodo gradient-descent che permette di trovare apprendimento si basa sul metodo gradient-descent che permette di trovare un minimo locale di una funzione in uno spazio a N dimensioni. I pesi un minimo locale di una funzione in uno spazio a N dimensioni. I pesi associati ai collegamenti tra gli strati di neuroni, si inizializzano a valori associati ai collegamenti tra gli strati di neuroni, si inizializzano a valori piccoli e casuali e poi si applica la regola di apprendimento presentando alla piccoli e casuali e poi si applica la regola di apprendimento presentando alla rete dei pattern di esempio. rete dei pattern di esempio.

Page 11: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Reti Neurali - SVMReti Neurali - SVMDato un training set formato da coppie features-label (xDato un training set formato da coppie features-label (xii, y, yii), i = 1…l ), i = 1…l

dove xdove xii RRnn e y e yii {1,−1} {1,−1}ll..Le Support Vector Machine (SVM) cercano di risolvere il seguente problema di ottimizzazione: Le Support Vector Machine (SVM) cercano di risolvere il seguente problema di ottimizzazione:

con la condizione:con la condizione:I vettori xI vettori xii vengono mappati in un uno spazio a più dimensioni rispetto a quelle vengono mappati in un uno spazio a più dimensioni rispetto a quelle

che aveva inizialmente dalla funzione . Quindi la SVM trova una iperpiano di che aveva inizialmente dalla funzione . Quindi la SVM trova una iperpiano di separazione col maggior margine possibile in questo nuovo spazio. separazione col maggior margine possibile in questo nuovo spazio.

C > 0 è un termine di correzione dell’errore.C > 0 è un termine di correzione dell’errore.

E’ la cosiddetta funzione di kernel, per i miei esperimenti ho usato:E’ la cosiddetta funzione di kernel, per i miei esperimenti ho usato:

Detto radial basis function (RBF)Detto radial basis function (RBF)

, ,1

1min

2

lT

ib

i

C

( ( ) ) 1Ti i iy x b

( , ) ( ) ( )Ti j i jK x x x x

2( , ) exp( ), 0i j i jK x x x x

Page 12: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Reti Neurali - SVMReti Neurali - SVM

Il procedimento utilizzato per la ricerca della rete migliore che ho Il procedimento utilizzato per la ricerca della rete migliore che ho utilizzato è quello proposto da Chih-Wei Hsu, Chih-Chung Chang, e Chih-utilizzato è quello proposto da Chih-Wei Hsu, Chih-Chung Chang, e Chih-Jen Lin (creatori delle LIBSVM);Jen Lin (creatori delle LIBSVM);

Essendoci due parametri (C e Gamma) da scegliere che non possono Essendoci due parametri (C e Gamma) da scegliere che non possono essere presi a priori sono stati eseguiti 110 addestramenti; il range di essere presi a priori sono stati eseguiti 110 addestramenti; il range di variazione è C = 2variazione è C = 2−5−5, 2, 2−3−3, ...2, ...21515, Gamma= 2, Gamma= 2−15−15, 2, 2−13−13…2…23 3 (un fattore 4 tra un (un fattore 4 tra un valore e il successivo), gli addestramenti sono stati fatti utilizzando la valore e il successivo), gli addestramenti sono stati fatti utilizzando la cross validation facendo dividere il dataset di train in 5 parti.cross validation facendo dividere il dataset di train in 5 parti.

Dato il peso ,è praticamente impossibile eseguire questi Dato il peso ,è praticamente impossibile eseguire questi processi in serie su un desktop, e si è quindi deciso di processi in serie su un desktop, e si è quindi deciso di usare la tecnologia GRID, usando le macchine del usare la tecnologia GRID, usando le macchine del progetto SCoPE.progetto SCoPE.

A tal fine sono stati creati degli script in Python per la creazione dei file jdl A tal fine sono stati creati degli script in Python per la creazione dei file jdl e per l’analisi dei risultati.e per l’analisi dei risultati.

Page 13: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Cataloghi utilizzati:Cataloghi utilizzati:

G. Sorrentino et al. (2006) (catalogo)G. Sorrentino et al. (2006) (catalogo)

G. Kauffmann et al. (2003) (rapporti di righe)G. Kauffmann et al. (2003) (rapporti di righe)

R. D’Abrusco et al. (2007) (redshift) R. D’Abrusco et al. (2007) (redshift)

I primi due cataloghi sono stati usati per costruire la base di I primi due cataloghi sono stati usati per costruire la base di conoscenza con cui addestrare le reti neurali, mentre il terzo ha conoscenza con cui addestrare le reti neurali, mentre il terzo ha fornito per gli oggetti presenti nei primi due cataloghi stime del fornito per gli oggetti presenti nei primi due cataloghi stime del redshift per tutti gli oggetti.redshift per tutti gli oggetti.

Page 14: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Catalogo di G. Sorrentino et al. (2006)Catalogo di G. Sorrentino et al. (2006)

z compreso tra 0.05 e 0.095.z compreso tra 0.05 e 0.095.

oggetti più luminosi di M(r) = -20.00oggetti più luminosi di M(r) = -20.00

Vengono suddivisi in AGN o meno in base al modello empirico di Kewley:Vengono suddivisi in AGN o meno in base al modello empirico di Kewley:

β

α

β

α

β

α

[OIII]λ5007 0.61log = +1.19

[NII]λ6583H log -0.47H

[OIII]λ5007 0.72log = +1.30

[SII]λλ6717,6731H log -0.32H

[OIII]λ5007 0.73log = +1.19

[OI]λ6300H log -0.59H

Sono definiti Seyfert 1 gli oggetti per cui risulta oSono definiti Seyfert 1 gli oggetti per cui risulta oFWHM(HFWHM(H) > 1.5FWHM([OIII] ) > 1.5FWHM([OIII] 5007) 5007)

oppureoppureFWHM(HFWHM(H) > 1200Kms) > 1200Kms-1-1

e contestualmentee contestualmenteFWHM([OIII] FWHM([OIII] 5007) < 800Kms5007) < 800Kms-1-1

Tutti gli altri vengono classificati come Seyfert 2Tutti gli altri vengono classificati come Seyfert 2

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Page 15: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3

Oggetti divisi dalla linea di Kewley:Oggetti divisi dalla linea di Kewley:

β

α

[OIII]λ5007 0.61log = +1.19

[NII]λ6583H log -0.47H

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Page 16: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3

Oggetti divisi dalla linea di Kauffman:Oggetti divisi dalla linea di Kauffman:

β

α

[OIII]λ5007 0.61log = +1.3

[NII]λ6583H log -0.05H

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Page 17: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3

Oggetti divisi dalla linea ricavata da Heckman:Oggetti divisi dalla linea ricavata da Heckman:

β α

[OIII]λ5007 [NII]λ6583=2.1445 0.465

H H

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Page 18: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3Catalogo di G. Kauffman et al. (2003) 0.02<z<0.3

Risultato finaleRisultato finale

Scelta della Base di ConoscenzaScelta della Base di Conoscenza

Page 19: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Redshift fotometriciRedshift fotometriciIl Catalogo di D’Abrusco et al. (2007) contiene stime di z fotometrico, Il Catalogo di D’Abrusco et al. (2007) contiene stime di z fotometrico, con un’accuratezza pari a con un’accuratezza pari a rob rob = 0.02, misurata dalla= 0.02, misurata dalla dispersione dispersione

attorno allo zero della variabile scarto (z_phot - z_spec) (anche attorno allo zero della variabile scarto (z_phot - z_spec) (anche minore per le LRG)minore per le LRG)

Page 20: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Aspetti TecniciAspetti Tecnici

Il mio lavoro si è svolto nell’ambito dei progetti VONEURAL e PON-SCOPE, in Il mio lavoro si è svolto nell’ambito dei progetti VONEURAL e PON-SCOPE, in particolare:particolare:

contributo alla fase progettualecontributo alla fase progettuale

modifiche al codice delle reti MLP, inizialmente sviluppato da C. Donalek, modifiche al codice delle reti MLP, inizialmente sviluppato da C. Donalek, per adattarlo alle nuove esigenze del progettoper adattarlo alle nuove esigenze del progetto

test e debug del codice delle reti MLPtest e debug del codice delle reti MLP

test e debug dell’intera pipeline del software prodotto: prima in versione da test e debug dell’intera pipeline del software prodotto: prima in versione da shell, poi in versione provvisoria XML e in versione definitiva (AstroGRID shell, poi in versione provvisoria XML e in versione definitiva (AstroGRID Compliant)Compliant)

creazione delle librerie di funzioni in linguaggio C per implementare le creazione delle librerie di funzioni in linguaggio C per implementare le matrici di confusione nella prossima release del softwarematrici di confusione nella prossima release del software

Implementazione delle procedure per il GRIDImplementazione delle procedure per il GRID

Page 21: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

I parametri SDSS I parametri SDSS Parametri Usati:Parametri Usati:1.1. petroR50_upetroR50_u2.2. petroR50_gpetroR50_g3.3. petroR50_rpetroR50_r4.4. petroR50_ipetroR50_i5.5. petroR50_zpetroR50_z6.6. concentration_index_rconcentration_index_r7.7. z_phot_corrz_phot_corr8.8. fibermag_rfibermag_r9.9. (u – g) dered(u – g) dered10.10. (g – r) dered(g – r) dered11.11. (r – i) dered(r – i) dered12.12. (i – z) dered(i – z) dered13.13. dered_rdered_r

TargetTarget1.1. AGN 1, Misto 0AGN 1, Misto 02.2. Tipo1 1, Tipo2 0Tipo1 1, Tipo2 03.3. Seyfert 1, LINER 0Seyfert 1, LINER 0

Raggi che contiengono il 50% del flusso petrosiano.Raggi che contiengono il 50% del flusso petrosiano.

Il flusso petrosiano utilizzato dalla SDSS è definito come:Il flusso petrosiano utilizzato dalla SDSS è definito come:1.25 2 2 2]

0.8

2

2 ( ) / [ (1.25 0.8 )( )

2 ( ) / ( )

r

rP r

o

dr r I r rr

dr r I r r

Flusso contenuto in 3” di diametro d’apertura.Flusso contenuto in 3” di diametro d’apertura.

Colori corretti per arrossamentoColori corretti per arrossamento

Magnitudine in banda r corretta per arrossamentoMagnitudine in banda r corretta per arrossamento

Page 22: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 1 con MLPApplicazione 1 con MLP

Le reti sono state addestrate con un target vector pari a 1 per gli oggetti Le reti sono state addestrate con un target vector pari a 1 per gli oggetti ritenuti sicuri AGN, ovvero gli oggetti superiori alla riga di Kewley e 0 tutti ritenuti sicuri AGN, ovvero gli oggetti superiori alla riga di Kewley e 0 tutti quelli al di sotto di questa linea.quelli al di sotto di questa linea.Il miglior risultato ottenuto è stato:Il miglior risultato ottenuto è stato:

Efficienza totale: e = 75.99%Efficienza totale: e = 75.99%

Efficienza agn: eEfficienza agn: eagnagn = 71.38% = 71.38%

Completezza agn: cCompletezza agn: cagn agn = 55.64%= 55.64%

Completezza misti: cCompletezza misti: cmisti misti = 87.44%= 87.44%

1(net)1(net) 0(net)0(net)

1(known)1(known) 34023402 27122712

0(known)0(known) 13641364 94999499

Il 12.6% degli oggetti che spettroscopicamente non sono catalogati con Il 12.6% degli oggetti che spettroscopicamente non sono catalogati con certezza come AGN sono falsi positivi.certezza come AGN sono falsi positivi.

La percentuale falsi positivi che secono la base di conoscenza sono sicuramente La percentuale falsi positivi che secono la base di conoscenza sono sicuramente non AGN è 0.89% non AGN è 0.89%

La percentuale di non AGN sicuri che risultano falsi positivi è 0.82%La percentuale di non AGN sicuri che risultano falsi positivi è 0.82%

1(net)1(net) 0(net)0(net)

1(known)1(known) aa bb

0(known)0(known) cc dd agn

a dea b c d

ae

a c

agn

misti

ac

a bc

cc d

Page 23: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 1 con MLPApplicazione 1 con MLP

Rapporto tra AGN Correttamente Valutati e falsi positivi, prima metà del Rapporto tra AGN Correttamente Valutati e falsi positivi, prima metà del dataset, seconda metà e dataset totale. Si osserva che c’è un massimo intorno dataset, seconda metà e dataset totale. Si osserva che c’è un massimo intorno ad una soglia di 0.837, con questa soglia ead una soglia di 0.837, con questa soglia eAGNAGN = 89.14% e la matrice di = 89.14% e la matrice di

confusione diviene:confusione diviene:1(net)1(net) 0(net)0(net)

1(known)1(known) 558558 55565556

0(known)0(known) 6868 1079510795

a

c

a

c

a

c

Page 24: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 1 con SVMApplicazione 1 con SVMEfficienza Totale del Miglior Risultato: 75.76%Efficienza Totale del Miglior Risultato: 75.76%

PON-SCOPE GRID Infrastructure (110 nodes)PON-SCOPE GRID Infrastructure (110 nodes)

lg2(gamma)

lg2(C)

Page 25: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 2 con MLPApplicazione 2 con MLP

Gli esperimenti sono stati effettuati selezionando soltanto gli Gli esperimenti sono stati effettuati selezionando soltanto gli oggetti presenti nel catalogo di G. Sorrentino et al. (2006) (z oggetti presenti nel catalogo di G. Sorrentino et al. (2006) (z compreso tra 0.05 e 0.095) che venivano indicati come Tipo 1 e compreso tra 0.05 e 0.095) che venivano indicati come Tipo 1 e Tipo 2. Si sono selezionati solo quelli sicuramente AGN.Tipo 2. Si sono selezionati solo quelli sicuramente AGN.Il dataset si componeva di 1570 oggetti: si è indicato con 1 gli Il dataset si componeva di 1570 oggetti: si è indicato con 1 gli oggetti di Tipo 1 e con 0 gli oggetti di Tipo 2.oggetti di Tipo 1 e con 0 gli oggetti di Tipo 2.Il miglior risultato ottenuto è stato:Il miglior risultato ottenuto è stato:

Efficienza totale e = 99.4%Efficienza totale e = 99.4%

Efficienza tipo 1 eEfficienza tipo 1 etipo 1tipo 1 = 98.4% = 98.4%

Efficienza tipo 2 eEfficienza tipo 2 etipo 2 tipo 2 = 100%= 100%

Completezza tipo 1: cCompletezza tipo 1: ctipo 1 tipo 1 = 100%= 100%

Completezza tipo 2: cCompletezza tipo 2: ctipo 2tipo 2 = 98.9% = 98.9%

1(net)1(net) 0(net)0(net)

1(known)1(known) 126126 00

0(known)0(known) 22 186186

Page 26: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 2 con SVMApplicazione 2 con SVMEfficienza Totale del Miglior Risultato: 81.5%Efficienza Totale del Miglior Risultato: 81.5%

PON-SCOPE GRID Infrastructure (110 nodes)PON-SCOPE GRID Infrastructure (110 nodes)

lg2(gamma)

lg2(C)

Page 27: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 3 con MLPApplicazione 3 con MLP

1(net)1(net) 0(net)0(net)

1(known)1(known) 10011001 896896

0(known)0(known) 338338 38413841

Il dataset utilizzato è stato costruito selezionando tutti gli oggetti Il dataset utilizzato è stato costruito selezionando tutti gli oggetti divisi in Seyfert e LINER al di sopra della linea di Kewley. Il divisi in Seyfert e LINER al di sopra della linea di Kewley. Il numero di oggetti presenti nel dataset è pari a 30380. Sono stati numero di oggetti presenti nel dataset è pari a 30380. Sono stati indicati gli oggetti di tipo Seyfert con 1 e quelli di tipo LINER con indicati gli oggetti di tipo Seyfert con 1 e quelli di tipo LINER con 0.0.

Il miglior risultato ottenuto è statoIl miglior risultato ottenuto è stato::Efficienza totale: e = 79.69%Efficienza totale: e = 79.69%

Efficienza Seyfert: cEfficienza Seyfert: cseysey = 74.76% = 74.76%

Efficienza LINER : cEfficienza LINER : cLINLIN = 81.09% = 81.09%

Completezza Seyfert: cCompletezza Seyfert: cseysey = 52.77% = 52.77%

Completezza LINER : cCompletezza LINER : cLINLIN = 91.69% = 91.69%

Page 28: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 3 con SVMApplicazione 3 con SVMEfficienza Totale del Miglior Risultato: 78.18%Efficienza Totale del Miglior Risultato: 78.18%

PON-SCOPE GRID Infrastructure (110 nodes)PON-SCOPE GRID Infrastructure (110 nodes)

lg2(gamma)

lg2(C)

Page 29: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

Applicazione 3 con MLPApplicazione 3 con MLPLa separazione tra LINER e Seyfert non è efficiente come nei La separazione tra LINER e Seyfert non è efficiente come nei casi precedenti. Questo probabilmente dipende da una casi precedenti. Questo probabilmente dipende da una differenza tra le due categorie non particolarmente marcata. Si differenza tra le due categorie non particolarmente marcata. Si può osservare che la separazione nei parametri spettroscopici può osservare che la separazione nei parametri spettroscopici avviene molto al di sopra della riga di Kewley.avviene molto al di sopra della riga di Kewley.

Page 30: Ricerca di Nuclei Galattici Attivi in Survey Fotometriche Multibanda Relatori:Candidato: Ch.mo Prof. Giuseppe LongoStefano Cavuoti Dott. Maurizio PaolilloMatricola.

ConclusioniConclusioniL’obiettivo principale di questa tesi è stato raggiunto ottenendo una rete L’obiettivo principale di questa tesi è stato raggiunto ottenendo una rete neurale in grado di selezionare, su base puramente fotometrica, forti neurale in grado di selezionare, su base puramente fotometrica, forti candidati AGN.candidati AGN.

Per quanto concerne la separazione tra oggetti di Tipo 1 e Tipo 2 si sono Per quanto concerne la separazione tra oggetti di Tipo 1 e Tipo 2 si sono ottenuti ottimi risultati pur essendo pochi i dati in nostro possesso.ottenuti ottimi risultati pur essendo pochi i dati in nostro possesso.

La separazione tra LINER e Seyfert invece non è netta e i risultati conseguiti La separazione tra LINER e Seyfert invece non è netta e i risultati conseguiti non ci permettono di dire molto. Ciò probabilmente dipende da una non ci permettono di dire molto. Ciò probabilmente dipende da una differenza tra le due categorie non fortemente delineata.differenza tra le due categorie non fortemente delineata.

Va sottolineato che l’aspetto principale di questo lavoro, Va sottolineato che l’aspetto principale di questo lavoro, prima ancora che nei risultati, risiede nella metodologia prima ancora che nei risultati, risiede nella metodologia adottata, che risulta assolutamente innovativa rispetto a adottata, che risulta assolutamente innovativa rispetto a quanto è sinora apparso in letteratura.quanto è sinora apparso in letteratura.