D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

64
VERSO LA MEDICINA PERSONALIZZATA IN FRIULI VENEZIA GIULIA: RISULTATI ED ESPERIENZE DEL PROGETTO D.NAMICA

description

Publbicazione finale dei risultati del progetto D.NAMICA

Transcript of D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

Page 1: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

Verso la medicina personalizzata in Friuli Venezia Giulia: risultati ed esperienze del proGetto D.NAMICA

Page 2: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

© 2014. Friuli InnovazioneParco Scientifico e Tecnologico Luigi Danieli di Udinevia Jacopo Linussio 51, 33100 Udine

Impaginazione e stampa: Divulgando Srl, Trieste - www.divulgando.eu

Finito di stampare nel mese di giugno 2014.

Page 3: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

1

Verso la medicina personalizzata in Friuli Venezia Giulia: risultati ed esperienze del proGetto D.NAMICA

InsIel Mercato

AziendA OspedAlierO – UniversitAriA OspedAli riUniti

istitUtO di GenOmicA ApplicAtA

iGA technOlOGy services

nUvOn itAliA

FriUli innOvAziOne

FOndAziOne itAliAnA FeGAtO OnlUs

Università deGli stUdi di Udine

scUOlA internAziOnAle sUperiOre di stUdi AvAnzAti (sissA)

Page 4: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

2

Page 5: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

3

PREFAZIONE p. 5

PARTNERInsiel Mercato, Azienda Ospedaliero – Universitaria Ospedali Riuniti, Istituto di Genomica Applicata, IGA Technology Services, Nuvon Italia, Friuli Innovazione, Fondazione Italiana Fegato ONLUS, Università degli Studi di Udine, Scuola Internazionale Superiore di Studi Avanzati (SISSA) p. 7

CONTRIUBUTIMedicina personalizzata: dalla ricerca alla clinicaLorenzo Giollo p. 13

nextGen-seq per ricerca e diagnostica clinica – principi ed applicazioni en route verso la Medicina Personalizzata Slobodanka Radovic, Alessandro Spadotto, Eleonora Di Centa, Vittorio Zamboni, Federica Cattonaro, Michele Morgante p. 21

sistemi di integrazione e per la raccolta dei dati sanitari: nuove frontiere per la connettività in ambito clinico e per l’integrazione della componente genomicaMichele De Monte p. 29

esoma e cardiomiopatia geneticamente determinata: esperienza del registro cardiomiopatie di triesteFabrizio Pirozzi p. 35

Microrna come marcatori nel carcinoma epatico: possibili applicazioni in campo oncologicoDevis Pascut, Raffaella Calligaris, Helena Krmac, Nicolò Mezzina, Riccardo Patti, Luisa Petraccia, Sara Finaurini, Saveria Lory Crocè, Stefano Gustincich, Claudio Tiribelli p. 39

Atrofia muscolare spinale: eterogeneità genetica e medicina personalizzata Giorgia Dubsky de Wittenau, Slobodanka Radovic, Federica Cesca, Alessandra Poz, Incoronata Renata Lonigro p. 45

“Blood transcriptomics”: la trascrittomica da sangue per l’identificazione di biomarcatori molecolari di malattia Raffaella Calligaris, Mihaela Banica, Sara Finaurini, Paola Roncaglia, Christina Vlachouli, Helena Krmac, Maria Bertuzzi, Lucia Antonutti, Tatiana Cattaruzza, Alberto Cucca, Devis Pascut, Saveria Lory Crocè, Claudio Tiribelli, Gilberto Pizzolato, Stefano Gustincich p. 53

INDICE

Page 6: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

4

Page 7: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

5

PREFAZIONEI farmaci e i trattamenti medici che utilizziamo normalmente sono testati e realizzati per un ampio gruppo di persone. Gli individui non sono, però, così uguali tra loro. A dircelo è anche la genetica: all’interno del nostro DNA, infatti, 103.480.000.000 possibili combinazioni garantiscono la nostra univocità e influenzano la nostra salute. Condizionano, ad esempio, la predisposizione a una determinata patologia, l’efficace risposta a una terapia e anche l’insensibilità a un certo farmaco. Per questo, a livello internazionale, si stanno studiando diagnosi e terapie tagliate su misura per un singolo individuo. È la cosiddetta medicina personalizzata che propone un trattamento più appropriato: alla persona giusta, al momento giusto e nei tempi più opportuni. Questo settore emergente mira alla creazione di un trattamento individualizzato, basato sull’unione delle caratteristiche cliniche e genetiche del singolo. Una delle sfide attuali per guadagnare una medicina personalizzata assimilabile alla pratica medica è quella di creare strutture, strumenti di integrazione di dati genetici e clinici. Raccogliere queste informazioni, e soprattutto renderle disponibili a medici e ricercatori, richiede innanzitutto una ricerca multidisciplinare, che sappia mettere in rete e far dialogare realtà molto diverse tra loro.Avviato nel 2012 in Friuli Venezia Giulia, in 30 mesi di attività il progetto D.NAMICA si è occupato di realizzare un prototipo di piattaforma per la medicina molecolare e personalizzata al fine di integrare i classici dati clinici con le informazioni provenienti dalla genetica. Il progetto, cofinanziato dal POR FESR 2007 - 2013 Obiettivo Competitività regionale e Occupazione del Friuli Venezia Giulia, ha coinvolto ricercatori, medici ed esperti di informatica.L’Azienda Ospedaliero-Universitaria di Trieste, la scuola Internazionale superiore di studi avanzati (SISSA) di Trieste, l’Università degli studi di Udine, la Fondazione italiana Fegato, l’istituto di Genomica Applicata e iGA technology services hanno collaborato assieme nei tre progetti pilota avviati. Le sperimentazioni si sono svolte nell’ambito di malattie con una chiara componente genetica, quali la cardiomiopatia dilatativa in ambito cardiovascolare, il tumore al fegato in campo oncologico e l’atrofia muscolare spinale (SMA) per quanto riguarda le malattie neurodegenerative. La prima fase del progetto è stata dedicata alla selezione e raccolta del materiale genetico; successivamente, previo ottenimento del consenso informato, il materiale è stato processato in un’analisi più mirata. A questa fase è seguita l’integrazione dei dati clinici e genetici all’interno della piattaforma digitale, a cura di due aziende regionali che operano nel campo delle soluzioni informatiche per il settore sanitario: nuvon Italia e Insiel Mercato. A supporto della gestione e della promozione del progetto ha operato il centro di ricerca e trasferimento tecnologico Friuli Innovazione.

Page 8: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

6

Page 9: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

7

PARTNER

INsIEl MERCATOtrieste

Insiel Mercato sviluppa soluzioni di e-health e di e-government che permettano agli enti della Pubblica Amministrazione e della Sanità di offrire i migliori servizi alle comunità in cui operano, con l’obiettivo di rendere i cittadini protagonisti nell’esercizio dei propri diritti.Con oltre 1000 clienti e più di 200 addetti,Insiel Mercato è una società di riferimento del settore IT in Italia e leading company della Business Unit “Soluzioni integrate di e-Health & e-Government” di TBS Group dove coordina le attività IT assieme alle controllate Caribel di Pisa, Erre Effe di Arezzo e PCS di Klagenfurt (A).Insiel Mercato conta oltre 1000 utenti tra Regioni, Province, Comuni, Aziende sanitarie, Aziende Ospedaliere ed altri enti della Pubblica Amministrazione. In dettaglio: 603 Comuni, 16 tra Province e Enti Provinciali, 33 tra Regioni e Enti Regionali, 78 tra Comunità Montane, Consorzi e Unioni di Comuni, 216 tra Aziende Sanitarie, Ospedaliere e altre strutture sanitarie, 114 tra altri enti pubblici e società.All’interno del progetto D.NAMICA Insiel Mercato (capofila) si è occupato del coordinamento

delle attività dei 9 partner coinvolti e dell’implementazione della piattaforma informatica.

AZIENdA OsPEdAlIERO UNIvERsITARIA OsPEdAlI RIUNITItrieste

In data 5 marzo 2004, con decreto del Presidente della Giunta Regionale, è stata costituita l’Azienda Ospedaliero-Universitaria “Ospedali Riuniti” di Trieste, la cui organizzazione deve svilupparsi sulla base di logiche dipartimentali che consentano l’integrazione tra attività assistenziali, didattiche e di ricerca presupposto della costituzione dell’Azienda Integrata Ospedaliero-Universitaria. È frutto dell’integrazione tra la preesistente Azienda Ospedaliera “Ospedali Riuniti” e la Facoltà di Medicina e Chirurgia dell’Università degli Studi di Trieste. All’interno del progetto D.NAMICA Ospedali Riuniti di Trieste ha diretto il progetto pilota sulla cardiomiopatia dilatativa.

Page 10: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

8

IsTITUTO dI GENOMICA APPlICATAudine

IGA è un centro internazionale di ricerca genetica sugli organismi viventi, nato come spin-off dell’Università di Udine nel 2006. IGA è un istituto no-profit insediato presso il Parco Scientifico e Tecnologico ‘Luigi Danieli’ di Udine.Lo staff è composto da 25 ricercatori con competenze di genetica, genomica strutturale e funzionale, biologia, biochimica, matematica applicata ai sistemi biologici, informatica.IGA è il primo centro di sequenziamento in Italia e si colloca tra i primi in Europa. Tra le sue ‘core facilities’ figurano un centro di sequenziamento di DNA, che utilizza sia macchine di sequenziamento tradizionale Sanger, che macchine di seconda generazione Illumina e un centro di centro di biologia computazionale con macchine per il calcolo parallelo e competenze per lo sviluppo di LIMS (Laboratory Information Management Systems), DBMS (DataBase Management Systems), algoritmi e software per l’analisi strutturale e funzionale di dati di sequenziamento. IGA svolge ricerche di genomica strutturale e funzionale in specie vegetali come vite, frumento, pioppo da biomassa, caffé, olivo, Citrus, specie animali e ittiche. I progetti sono finanziati da UE, Governo Italiano, Amministrazioni regionali, Istituti di ricerca, compagnie private. L’istituto ha al suo attivo il sequenziamento del genoma della vite in collaborazione con Genoscope di Parigi (completato nel 2007) e il sequenziamento del genoma del pesco in collaborazione con il Joint Genome Institute del US Department of Energy, USA (completato nel 2009).IGA collabora attualmente con una trentina di Università e Istituti di Ricerca europei e con i principali centri di ricerca regionali (SISSA, Università di Udine e Trieste, Area Science Park).All’interno del progetto D.NAMICA l’Istituto di Genomica Applicata, insieme a IGA Technology Services, ha realizzato le procedure per il sequenziamento e analisi dei campioni provenienti

dai progetti pilota su cardiomiopatia dilatativa e atrofia muscolare spinale (SMA).

IGA TEChNOlOGy sERvICEsudine

IGA Technology Services s.r.l. è una società strumentale di IGA, costituita nel settembre 2009, avente lo scopo di contribuire allo sviluppo della ricerca scientifica nel campo della genomica, ricavando per lo più dalla prestazione a terzi di servizi a pagamento i mezzi finanziari necessari per l’incremento della ricerca scientifica IGA. Svolge attività di servizi a pagamento nel settore della biologia molecolare, in particolare del sequenziamento e risequenziamento di DNA. È insediata presso il Parco Scientifico e Tecnologico ‘Luigi Danieli’ dove condivide con IGA parte degli spazi di laboratorio e parte delle attrezzature.Lo staff è al momento di 12 persone.I servizi che l’azienda offre sono: sequenziamento Sanger su piattaforma ABI 3730xl, sequenziamento ‘full service’ su piattaforma Illumina HiSeq2000/2500 e MiSeq. L’Azienda è Service Provider Certificato Illumina, servizi di analisi dati NGS.

Page 11: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

9

All’interno del progetto D.NAMICA IGA Technology Services, insieme a IGA, ha realizzato le procedure per il sequenziamento e analisi dei campioni provenienti dai progetti pilota su cardiomiopatia dilatativa e atrofia muscolare spinale (SMA).

NUvON ITAlIAtrieste

Nuvon Italia S.r.l. è la struttura di R&D di Nuvon Inc., società che offre al mercato helthcare degli USA soluzioni di connettività certificata e di integrazione di dati clinici in ambito ospedaliero e medico. Nuvon Italia comprende un gruppo di appassionati dell’ R&D, con solide competenze scientifiche e capacità di portare a mercato le sfide raccolte nel settore IT.Fondata nel 2006, Nuvon Italia ha contribuito ad ideare e brevettare una nuova filosofia per gestire una sicura raccolta, trasferimento e consegna dei dati. La più efficace implementazione della “Vector Event Grid Architecture” (VEGA™) è una piattaforma di integrazione capace di far dialogare dispositivi medici eterogenei e CIS, di automatizzare i workflow catturando i dati clinici dei pazienti per consegnarli in un formato omogeneo e normalizzato ai sistemi EMR. Sin dal 2010 la piattaforma VEGA è “FDA approved” ed è live in numerose reti di ospedali e strutture di cura.All’interno del progetto D.NAMICA l’intervento di Nuvon Italia ha riguardato l’acquisizione e il trasferimento sicuro dei dati.

FRIUlI INNOvAZIONEudine

Friuli Innovazione nasce nel 1999 per favorire la collaborazione tra l’Università di Udine e il sistema economico friulano mediante lo scambio di conoscenze tra ricercatori e imprese e l’utilizzo industriale dei risultati scientifici e tecnologici sviluppati all’interno dell’Ateneo.Nel 2004 la Regione Friuli Venezia Giulia affida a Friuli Innovazione l’avvio e la gestione del Parco Scientifico e Tecnologico Luigi Danieli di Udine, all’interno del quale si insediano laboratori di R&D di aziende locali, laboratori misti università-impresa, spin-off della ricerca, centri di certificazione e servizio.Oltre 80.000 mq di estensione, 60.000 mq di spazio verde, 6.400 mq di superficie coperta, a pochi minuti dalla rete autostradale europea e accessibile da più aeroporti internazionali (Trieste, Venezia, Lubiana, Klagenfurt). Uffici e laboratori immersi nella natura, architetture in equilibrio con le idee e con l’ambiente, sale riunioni e convegni, luoghi dedicati ad attività formative e culturali.Le attività di Friuli Innovazione, che offre una proposta integrata di servizi per le imprese, la ricerca e le nuove idee di business, sono orientate verso alcuni dei principali settori strategici

Page 12: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

10

per l’economia e il sistema della ricerca regionale (extended-ICT, Metallurgia e Tecnologia delle Superfici e dei Materiali Avanzati, Energia e Ambiente, Biotecnologie, Legno). La mission è trasformare le idee in imprese e la ricerca in prodotti, attraverso la nascita di imprese innovative sul territorio.All’interno del progetto D.NAMICA Friuli Innovazione ha curato la comunicazione e la gestione progettuale.

FONdAZIONE ITAlIANA FEGATO ONlUstrieste

La Fondazione Italiana Fegato (FIF) è una struttura che mette insieme un’attività di ricerca di base molecolare, svolta presso il Centro Studi Fegato (CSF),con una attività clinica che si svolge nel Centro Clinico Studi Fegato (CCSF). Questo connubio assai poco frequente, se non unico, nella realtà italiana, permette di individuare nella FIF un esempio operante di epatologia molecolare. Il Centro dispone di competenze nell’ambito delle tecnologie avanzate per lo studio di aspetti fisiologici e patologici del fegato. In particolare la FIF è attiva su diverse linee di ricerca:• studio di meccanismi molecolari del trasporto epatico di bilirubina e di altri composti

organici correlati con la fisiopatologia degli itteri;• studio dei danni neurologici causati dalla bilirubina;• studio dell’espressione di diverse proteine correlate con patologie epatiche e implicate nel

trasporto di farmaci;• diagnosi molecolare precoce del carcinoma primitivo del fegato;• medicina molecolare applicata al carcinoma epatico con particolare interesse verso la

gene therapy e le cancer stem cells.All’interno del progetto D.NAMICA Fondazione Italiana Fegato ha gestito il progetto pilota sul tumore al fegato.

UNIvERsITà dEGlI sTUdI dI UdINEudine

Il gruppo di Neurogenetica del Dipartimento di Scienze Mediche e Biologiche dell’Università di Udine si occupa di ricerca nell’ambito di patologie neurodegenerative ed ereditarie dell’uomo. Ne sono esempio la malattia di Huntington, dovuta alla compromissione di alcune aree del sistema nervoso centrale e l’atrofia muscolare spinale, degenerativa del secondo neurone di moto. La ricerca nell’ambito di queste patologie si avvale del contatto diretto con il paziente e della collaborazione e del sostegno, anche finanziario, di associazioni di pazienti come la UILDM (Unione Italiana Lotta alla Distrofia Muscolare) sezione di Udine e di associazioni di medici come la SNO (Società di Neurologi, Neurochirurghi e Neuroradiologi Ospedalieri). Il laboratorio

Page 13: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

11

di Neurogenetica è stato accreditato nel 2010 dalla Joint Commission International (NC 1179.3), ha sviluppato un servizio di diagnosi molecolare unico nel Triveneto ed innovativo in diverse metodiche di biologia molecolare impiegate. Per queste sue caratteristiche il laboratorio riceve e soddisfa richieste diagnostiche da diverse parti d’Italia. La ricerca condotta è di tipo traslazionale e mira ad attuare una medicina di tipo personalizzato in quanto da un lato implementa le informazioni molecolari necessarie ad un migliore inquadramento diagnostico e prognostico del paziente e dei familiari a rischio riproduttivo, dall’altro applica le metodiche più innovative di sequenziamento genico, in collaborazione con i partecipanti al progetto D.NAMICA, per la costruzione di una banca dati genetica utile in futuro ad un approccio terapeutico di tipo personalizzato.All’interno del progetto D.NAMICA Università degli Studi di Udine ha gestito il progetto pilota

sull’Atrofia Muscolare Spinale (SMA).

sCUOlA INTERNAZIONAlE sUPERIORE dI sTUdI AvANZATI (sIssA)trieste

La Scuola Internazionale Superiore di Studi Avanzati (SISSA), fondata nel 1978, prima istituzione in Italia a promuovere corsi post-laurea per il conseguimento del titolo di dottorato di ricerca o PhD, è un centro di eccellenza nel panorama universitario italiano e mondiale. Costituita da circa 65 docenti, 100 post doc e 245 studenti di PhD, ha sede a Trieste, in un campus di oltre 100.000 metri quadrati con una splendida vista sul Golfo di Trieste.Nata come scuola per l’alta formazione e la ricerca teorica in matematica e fisica, negli anni Novanta la SISSA ha allargato i propri interessi verso nuove tematiche d’avanguardia, come le neuroscienze cognitive e la neurobiologia, e oggi i suoi corsi di PhD offrono un percorso post-laurea originale e innovativo e rappresentano un modello di riferimento nel panorama scientifico internazionale, paragonabile a quello di pochi altri istituti al mondo.La SISSA inoltre si caratterizza per una produzione scientifica ampia, interdisciplinare e di altissimo livello. Tutti i lavori scientifici prodotti dai ricercatori della SISSA vengono pubblicati su autorevoli riviste internazionali ad alto impact factor, in molti casi sulle riviste scientifiche più prestigiose al mondo quali Nature e Science. Finora sono stati oltre 1000 gli studenti che alla SISSA hanno iniziato la propria carriera nel mondo della ricerca in matematica, fisica e neuroscienze.All’interno del progetto D.NAMICA SISSA ha gestito l’analisi dei profili di espressione dei

microRNA nel sangue dei pazienti all’interno del progetto pilota sul tumore al fegato.

Page 14: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

12

IntroduzIone

Page 15: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

13

MedIcIna personalIzzata: dalla rIcerca alla clInIca

lorenzo Giollo

Project manager progetto D.NAMICA

Negli ultimi anni si è assistito a una vera e propria rivoluzione nelle conoscenze molecolari che sta producendo significativi effetti in tutte le specialità della medicina. Le responsabilità di una simile rivoluzione è legata alla conclusione del Progetto Genoma Umano, che ha permesso la decodifica della composizione genetica delle cellule umane, svelando un numero di geni di poco superiore a quello di organismi molto meno complessi, come alcuni vermi. È anche emersa la complessità di un’organizzazione delle informazioni genetiche che sono per una bassa percentuale codificanti proteine e per la maggior parte svolgono un ruolo non codificante, ma solo di regolazione e controllo insieme alle informazioni provenienti dall’ambiente interno ed esterno. Quale sia il ruolo della genetica nella salute delle persone e sulla predisposizione di queste a sviluppare malattie comuni, è oggi meno meccanicistico di quanto immaginato. Un ulteriore progresso nelle biotecnologie e nanotecnologie si riscontra oggi nella disponibilità di tecnologie che permettono di sequenziare il genoma umano con metodi sempre più affidabili, sempre più veloci e sempre meno costosi. La riduzione dei costi1 è ben rappresentato nelle figure presenti nelle successive pagine.

Insieme al sequenziamento del genoma umano si è aperta la strada ad una nuova era tecnologica, riconducibile alle tecnologie “-omiche”: sono tecnologie integrate che superano i modelli che studiano una struttura alla volta (un gene, una proteina) e si riferiscono alla analisi della dinamica delle interazioni complesse all’interno di un sistema biologico. Sono emerse quindi nuove discipline -omiche (genomica, trascrittomica, proteomica, metabolomica, ecc.), ciascuna delle quali si avvale di tecniche, strumenti e software particolari, che hanno permesso la rapida espansione delle conoscenze sul funzionamento non più del singolo gene, ma delle complesse interazioni che concorrono alla determinazione di un preciso percorso di interesse medico. È oggi possibile ottenere, in tempi brevi, grandi quantità di dati che, interpretati con l’ausilio della bioinformatica, permettono di ridisegnare il modo di utilizzare le risorse genetiche e di poter sviluppare una terapia di precisione: la nuova era della genomica offre un universo di opportunità per identificare polimorfismi dei geni, cambiamenti genetici che sono responsabili delle malattie e soprattutto indica un percorso per la comprensione di come tali cambiamenti determinino le malattie. Ecco quindi emergere le nuove possibilità per la clinica di utilizzare le conoscenze della genetica e della genomica per la diagnosi e poi per la terapia dei pazienti, per giungere alla rivoluzione della medicina personalizzata: la conoscenza della base genetica della malattia sta disegnando una nuova era anche nello sviluppo di farmaci2 sempre più mirati, mentre il profilo genetico dei pazienti aiuterà la definizione del

1. Oggi è possibile sequenziare l’intero genoma (whole genome sequencing) a costi contenuti oppure sequenziare le porzioni codificanti (exome sequencing) a prezzi simili a quelli di una TAC. 2. Già dal 2001, le Autorità Regolatorie raccomandano la presentazione di dati di tossicogenomica, farmacogenomica e metabolomica, a supporto delle informazioni sulla sicurezza delle nuove molecole.

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 13-19

Page 16: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

14

Fig. 1. Costo del sequenziamento per genoma – fonte National Human Genome Research Institute (NHGRI)3.

rischio clinico individuale e la risposta a farmaci specifici. Nella determinazione predittiva dello stato di salute, l’enorme mole dei dati molecolari -omici, accanto ai dati clinici e di imaging è fruibile nella sua complessità dal medico solo grazie all’uso di grandi potenze di calcolo e DSS (Decision Support System) propri della bioinformatica.

Oggi si riscontra la tendenza alla medicina personalizzata, cioè la diagnosi e le terapie tagliate su misura per un singolo individuo, una medicina più precisa per la diagnosi, il trattamento e la prevenzione delle malattie. Come descritto in precedenza, la medicina personalizzata è la capacità di determinare le caratteristiche molecolari uniche di un individuo e di usare i caratteri genetici distintivi per ottenere una diagnosi più precisa e mirata della malattia e di scegliere quindi la terapia che aumenti le possibilità di guarigione riducendo al contempo eventuali effetti collaterali negativi.

Anche la possibilità di predire la suscettibilità individuale a sviluppare una patologia è un ulteriore aspetto significativo della medicina molecolare, che quindi potrà provare a descrivere i passi da seguire per aiutare gli individui a ridurre o evitare le possibilità di sviluppare la malattia, con possibili contributi da parte delle tecnologie ICT a supporto dei cittadini/pazienti.

Le tecnologie -omiche si presentano pertanto come un settore estremamente complesso

3. Ciascun grafico, per meglio illustrare la dinamica di riduzione dei costi nel sequenziamento del DNA, mostra a comparazione una curva ipotetica basata sulla legge di Moore (che descrive il trend di lungo termine nell’industria hardware dei computer “Le prestazioni dei processori, e il numero di transistor ad esso relativo, raddoppiano ogni 18 mesi”). I miglioramenti tecnologici che seguono l’andamento della legge di Moore vengono considerati come eccezionali e quindi sono una perfetta cartina di tornasole.Si noti in entrambi grafici che viene usata una scala logaritmica sull’asse delle ordinate e l’improvvisa variazione dal 2008, periodo nel quale i centri per il sequenziamento sono passati dal metodo Sanger ai metodi con piattaforme next-generation.

Page 17: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

15

e multidisciplinare: medici, biologi molecolari, biotecnologi, biochimici, bioinformatici, chimici, devono essere continuamente aggiornati e disporre di strumenti anch’essi aggiornati ed efficienti.

L’evoluzione verso l’utilizzo integrato delle informazioni provenienti da dati originati con diverse tecnologie fornirà gli strumenti per una visione più ampia e al tempo stesso più precisa del funzionamento delle complesse interazioni molecolari dei sistemi biologici.

È in questo contesto che bisogna considerare l’ospedale scientifico il futuro della medicina, non solo come luogo di risoluzione e cura delle patologie acute e supporto alle patologie croniche, ma soprattutto come motore di studio, di ricerca, di innovazione da portare al letto dell’ammalato e, perché no, di economia con positive ricadute sul territorio.

L’ospedale di Cattinara, uno dei partner del progetto D.NAMICA, ha avuto il pregio di essere il primo ospedale tecnologico in Italia, è stato cioè portatore di una rivoluzione della pratica medica che integrava totalmente la tecnologia diagnostica a un livello mai raggiunto prima. Ora una nuova sfida attende questa struttura, che è inserita in un contesto di istituzioni di ricerca raro in Italia4 , la sfida di essere promotore di innovazione scientifica e in particolare di agganciare la competizione internazionale. La massa critica di ricercatori destinati all’utilizzo ed allo sviluppo delle tecnologie -omiche in Italia deve essere significativamente aumentata in modo da riportare il nostro Paese a livelli di convergenza, se non con gli USA e altre potenze asiatiche, almeno con altri Paesi all’avanguardia nell’UE. Pur nella consapevolezza che non esistono modelli che possano essere considerati migliori o peggiori, ma modelli che, opportunamente integrati, possano

4. In Friuli Venezia Giulia, si pensi, ad esempio, alla possibilità di mettere a sistema le competenze delle numerose istituzioni di ricerca presenti nella sola Provincia di Trieste, a pochi chilometri da Cattinara, e ad esempio, alle numerose applicazioni delle nanotecnologie in medicina: dalla diagnosi, alla somministrazione dei farmaci, all’ingegneria tissutale.

Fig. 2. Costo del sequenziamento per megabase – fonte National Human Genome Research Institute (NHGRI).

Page 18: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

16

essere in grado di fornire soluzioni efficaci e, allo stesso tempo, ampiamente condivisibili, è indispensabile procedere nella direzione intrapresa già decenni fa, potenziando le caratteristiche di specialità dell’ospedale, aumentando le interazioni con le altre istituzioni di ricerca, generando circoli virtuosi con il mondo imprenditoriale, sfruttando le capacità finanziarie che già sono presenti sul territorio, indicando a queste ultime le notevoli opportunità di sviluppo nel contesto della medicina personalizzata e infine sfruttando le possibilità di rendere l’ospedale di Cattinara un ospedale di secondo livello transfrontaliero di riferimento.

I nuovi approcci metodologici porteranno ad un continuo aumento della disponibilità di dati che dovranno essere supportati dalle analisi bioinformatiche. Entrando un po’ più nello specifico e relativamente agli aspetti funzionali del progetto D.NAMICA, la piattaforma per la medicina molecolare e personalizzata si concretizza in una cartella clinica elettronica (CCE) per la ricerca che è realizzata coerentemente con gli standard nazionali e internazionali per l’interoperabilità dei sistemi5 . I seguenti punti fondamentali indicano le finalità e i requisiti della piattaforma in generale, che svolgerà una serie di funzioni sia stand-alone che integrate, in un’ottica di una futura implementazione presso le aziende ospedaliere, con gli altri tools informatici, come ad esempio l’anagrafe pazienti, il repository eventi e referti (base dati clinica), il middleware di integrazione tra le applicazioni interne all’ente sanitario, gli applicativi delle attività ambulatoriali, i moduli per la gestione del consenso al trattamento dei dati e consenso informato, ecc. Pertanto la piattaforma dovrà:

• prevedere, per ragioni di ricerca e di natura legale, un sistema di archiviazione e conservazione dei dati clinici e genetici;

• prevedere una modularità per l’integrazione con moduli afferenti le diverse specialità mediche, superando le tre sperimentazioni pilota del progetto D.NAMICA;

• costituire una fonte di dati per supportare la pianificazione e la valutazione delle cure e delle attività assistenziali nonché per ricerche cliniche e studi scientifici;

• essere lo strumento di comunicazione volto a facilitare l’integrazione operativa tra i medici e le diverse professionalità che erogano le cure, per garantire continuità assistenziale;

• offrire uno strumento e una base per le attività di formazione e poi di aggiornamento degli operatori sanitari, in ottica multiprofessionale;

• garantire la tracciabilità delle attività svolte per permettere di recuperare le informazioni relative alla cronologia, ai responsabili, alle modalità di esecuzione, ovvero costituire l’evidenza documentale della appropriatezza delle cure erogate rispetto agli standard in maniera da supportare la protezione legale degli interessi di tutti gli attori coinvolti, dai pazienti ai medici e all’azienda ospedaliera/sanitaria;

• includere specifiche politiche di riservatezza e protezione dei dati (privacy) e le conseguenti regole di accessibilità, garantendo l’accesso ai dati del singolo paziente esclusivamente agli operatori autorizzati;

5. Standard di riferimento europeo CEN EN 12967 “HISA” (Health Informatics Service Architecture) architettura integrata basata su un middleware di servizi informativi indipendenti da applicazioni o tecnologie proprietarie (es. RIM, EN13606, HL7, ecc.). Il riferimento per la definizione delle funzionalità della CCE è l’Electronic Health Record System (HL7 EHR TC). Standard semantici: Eurorec e componenti di semantica clinica come ad esempio SNOMED CT. Standard sintattici: HL7 e DICOM (Digital Imaging and COmmunications in Medicine) queest’ultimo per i criteri per la comunicazione, la visualizzazione, l’archiviazione e la stampa di informazioni ed immagini di tipo biomedico. Infine Standard CCOW per il context management.

Page 19: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

17

• prevedere meccanismi per la protezione logica del sistema e dei dati in esso conservati, meccanismi per il controllo degli accessi e per l’autenticazione, meccanismi per la protezione fisica dei dati (sicurezza) per garantire la business continuity e soluzioni di disaster recovery;

• integrarsi con le diverse componenti/sistemi del Sistema Informativo Ospedaliero, ovvero realizzata su un’unica piattaforma tecnologica ed estesa a livello dell’ente sanitario6.

Infine, in considerazione delle recenti novità in materia di mobilità europea dei pazienti7 , che costituisce una ulteriore motivazione al sostegno dell’eccellenza dell’ospedale scientifico di secondo livello transfrontaliero, e dell’obbligo di adozione del Fascicolo Sanitario Elettronico (FSE), è auspicabile prevedere l’integrazione della piattaforma per la medicina molecolare e personalizzata con il FSE8 . Infatti il Ministero della Salute ha recentemente (31 marzo 2014) reso disponibili le linee guida per la presentazione di appositi piani di progetto regionali per la realizzazione del FSE, che dovranno essere presentati entro il 30 giugno 2014, mentre è già stabilito il termine per l’attivazione del FSE presso le Regioni e le Province Autonome al 30 giugno 20159 . Il FSE conterrà le seguenti informazioni:

1. Documenti sanitari e socio-sanitari: (referti di laboratorio, radiologia, specialistici, pronto soccorso, cartelle cliniche, piani terapeutici, certificati, etc.);

2. Profilo Sanitario Sintetico: documento informatico sanitario che riassume la storia clinica del paziente e la sua situazione corrente a garanzia della continuità assistenziale;

3. Quaderno personale del cittadino: dove questi avrà la possibilità di annotare informazioni aggiuntive.

L’obiettivo del FSE è fornire ai medici, e più in generale ai clinici, una visione globale e unificata dello stato di salute dei singoli cittadini, è il punto di aggregazione e di condivisione delle informazioni e dei documenti clinici afferenti al cittadino, generati dai vari attori del sistema sanitario. Contiene eventi sanitari e documenti di sintesi, organizzati secondo una struttura gerarchica paziente-centrica, che permette la navigazione fra i documenti clinici in modalità differenti a seconda del tipo di indagine. Il FSE costituisce quindi una opportunità in più per garantire le migliori e più adeguate cure per i pazienti, soprattutto se verrà integrato con tutte le informazioni della medicina personalizzata.

6. Anche se la soluzione complessiva può essere fisicamente composta da differenti applicativi, questi dovranno necessariamente essere integrati in modo armonico a livello di logica applicativa e di flusso di dati nonché, possibilmente, di interfaccia.7. Direttiva 2011/24/UE del Parlamento europeo e del Consiglio, del 9 marzo 2011, concernente l’applicazione dei diritti dei pazienti relativi all’assistenza sanitaria transfrontaliera. La Direttiva è stata recepita in Italia con il D.Lgs 4 marzo 2014, n. 38, formalizzando il diritto per i cittadini europei di recarsi in uno Stato membro diverso da quello di appartenenza per curarsi ed ottenere, al proprio rientro, il rimborso delle spese sostenute.8. È bene osservare che sono già state avviate sperimentazioni su scala europea per il FSE europeo (patient summary) e della prescrizione elettronica allo scopo di assicurare l’interoperabilità delle soluzioni adottate dagli Stati Membri: è opportuno ricordare il progetto epSOS (Smart Open Services for European Patients).9. D.L. 21 giugno 2013, n. 69, recante “Disposizioni urgenti per il rilancio dell’economia” (convertito, con modificazioni, dalla L. 9 agosto 2013, n.98).

Page 20: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

18

Fig. 3. In figura sono riportate le principali tipologie di informazioni che il Fascicolo Sanitario Elettronico raccoglie e rende disponibili al medico e al paziente – fonte Ministero della Salute.

cOnclUsiOni

La medicina e le scienze della vita sono generatori di innovazioni straordinarie che hanno oggettivamente portato a un notevole allungamento della vita media. Una conseguenza di tale inestimabile conquista è lo spostamento del peso relativo della spesa sanitaria finalizzata principalmente alla prevenzione e cura delle malattie croniche che possono essere controllate e possono essere oggetto di assistenza, purtroppo raramente possono essere curate. Oltre ad avere un alto tasso di mortalità, le malattie croniche possono anche essere particolarmente invalidanti, causare un significativo peggioramento della qualità di vita del malato e un aumento delle spese sanitarie.

I progressi della ricerca e della medicina, che finora ha concentrato gli sforzi nell’affrontare le malattie acute, nonché le migliori condizioni di vita, hanno permesso, almeno nei paesi economicamente più avanzati, di risolvere positivamente molte patologie e di più che raddoppiare l’aspettativa di vita alla nascita. La caduta della natalità e della fecondità, la durata della vita e l’invecchiamento della popolazione costituiscono importanti trasformazioni demografiche. I successi nella riduzione dei decessi dovuti a malattie acute nell’ultimo mezzo secolo ha spostato perciò l’equilibrio e l’attenzione sulle malattie croniche. Possibili soluzioni possono sorgere grazie alla medicina personalizzata e alle tecnologie –omiche, inclusa la nutrigenomica, alla medicina rigenerativa (disciplina assolutamente innovativa, che si propone di creare tessuti vivi e funzionali per riparare o rimpiazzare organi o tessuti danneggiati a causa dell’età, della malattia o di difetti congeniti, con l’intento di restituire l’integrità strutturale e funzionale dell’organo sano) e infine per via non medica, grazie a una riorganizzazione dei sistemi sanitari supportati da tecnologie dell’informazione e delle comunicazioni10.

Una maggiore quantità di vita genera pertanto la domanda di una maggiore qualità della vita, agendo come moltiplicatore delle necessità innovative nel settore della salute.

10. Si pensi alle possibilità offerte dalle tecnologie “tele” che aiutano il monitoraggio e l’assistenza a casa dei pazienti, o a piattaforme c.d. social che favoriscano l’empowerment del paziente.

Page 21: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

19

Dall’altro lato, il contenimento dei costi in sanità, incentiva la ricerca di soluzioni che garantiscano prestazioni uguali o superiori a parità di risorse impiegate.

Le tecnologie dell’informazione, le scienze della vita e la medicina costituiscono un pilastro fondamentale dell’economia basata sulla conoscenza, con la creazione di nuove opportunità per la nostra società e la nostra economia.

La sinergia di tutte le componenti, infatti, permette di sfruttare tutte le potenzialità della sanità realizzando un ventaglio di servizi in grado di incidere in maniera significativa sull’efficacia dell’assistenza in termini di appropriatezza clinica ed organizzativa oltre che sull’efficienza dei processi.

L’insieme di questi fattori si dimostra estremamente favorevole al sorgere di nuove imprese, specialmente nel settore delle Scienze della Vita. Duole però rilevare che in Italia l’idea che la medicina o quanto connesso con la salute dei cittadini sia un generatore di sviluppo e di ricchezza, è sempre stata avversata, per l’impossibilità di associare culturalmente alle malattie opportunità economiche e di crescita industriale. Va però considerato che le proposte innovative della medicina vengono accettate con maggiore disponibilità da parte del pubblico proprio in ragione dell’atteso miglioramento, grazie alla personalizzazione della cura, della speranza di vita e della qualità della vita. Se non saremo in grado di supportare la ricerca di base, la ricerca traslazionale e quella applicata, se non forniremo opportune misure di sostegno, non necessariamente economiche, a quelle imprese fortemente innovative o, peggio, se non saremo nemmeno in grado di sfruttare appieno le opportunità offerte dal presente, come le strutture e le istituzioni di ricerca già esistenti, dovremo necessariamente scegliere un futuro in cui le opzioni saranno o un drastico ridimensionamento dei parametri sino a qui migliorati, oppure la necessità di divenire importatori netti di beni e servizi ad altissimo contenuto tecnologico e innovativo. Il cambiamento è inevitabile perché intrinseco alla vita. Sta ai singoli attori saper cogliere le opportunità.

Page 22: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

20

Page 23: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

21

nextGen-seq per rIcerca e dIaGnostIca clInIca – prIncIpI

ed applIcazIonI en route verso la MedIcIna personalIzzata

slobodanka radovic1, alessandro spadotto1, eleonora Di centa1, vittorio zamboni2, Federica cattonaro2, michele morgante2,3

1 IGA Technology Services, Udine.2 Istituto di Genomica Applicata, Udine.

3 Dipartimento di Scienze Agrarie ed Ambientali, Università degli Studi di Udine, Udine.

abstract — La decodifica del DNA è essenziale in tutti i rami di ricerca biologica. Il sequenziamento di nuova generazione (NGS) fornisce sia dati quantitativi che qualitativi. Questa combinazione di informazioni ha consentito l’ingresso della tecnologia NGS nel campo delle analisi genetiche complesse, le quali prima erano tecnicamente troppo difficili o troppo costose.Di conseguenza, la tecnologia NGS ha avuto un vasto e fondamentale impatto anche nella ricerca biomedica.Il presente articolo presenta i principi che sono alla base delle tecnologie NGS, incluso il sequenziamento e la bioinformatica, entrambi di importanza cruciale per ottenere risultati validi e per l’interpretazione dei dati NGS.Inoltre, viene presentata la possibile applicazione di questa potente tecnologia per offrire diagnosi genetiche complesse, aprendo la strada al mondo della medicina personalizzata con un approccio più globale.

_____________________________________________________________________

seqUenziAmentO del dnA

Il sequenziamento del DNA è la determinazione dell’ordine dei quattro nucleotidi (adenina, citosina, guanina e timina), unità di base nella catena dell’acido nucleico, che contiene tutte le informazioni genetiche ereditarie e sta alla base dello sviluppo di tutti gli organismi viventi. Determinare la sequenza del DNA diventa, dunque, fondamentale per la comprensione del ruolo delle varie parti del genoma umano. Il DNA, inoltre, sta alla base di tutti gli aspetti della salute umana, sia per ciò che riguarda lo stato di salute e benessere dell’organismo, sia per ciò che riguarda le sue patologie.Per questo motivo la conoscenza della sequenza del DNA permette di identificare le eventuali differenze genetiche tra persone affette da patologie e persone sane. L’individuazione di queste divergenze può essere utile non solo per diagnosticare una malattia prima dell’insorgenza, e pertanto prevenirla dove possibile, ma anche per ideare strategie per una cura definitiva. L’uso dell’informazione genetica gioca un ruolo importante nella genetica personalizzata e in alcuni aspetti della medicina personalizzata.Nella medicina personalizzata, infatti, le conoscenze derivanti dal sequenziamento del genoma di ciascun individuo si applicano alla salute e al benessere individuale,

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 21-26

Page 24: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

22

individuando subpopolazioni che meglio reagiscono ad un particolare principio attivo.L’obiettivo finale è di creare farmaci “su misura” per meglio incontrare le diverse esigenze dei pazienti.Negli ultimi dieci anni, l’uso del sequenziamento è cresciuto esponenzialmente, e la possibilità di accedere alla sequenza si è estesa a tutti i laboratori clinici e centri di ricerca del mondo.La prima grande iniziativa riguardante il sequenziamento del DNA fu il Progetto di Sequenziamento del Genoma Umano, della durata complessiva di 13 anni e del costo di 3 miliardi di dollari, completato nel 2003. Il Progetto di Sequenziamento del Genoma Umano è stato portato a termine con il sequenziamento di prima generazione, conosciuto anche come sequenziamento Sanger. Il sequenziamento Sanger, ideato nel 1975 da Edward Sanger, è stato considerato come tecnologia principale di sequenziamento per il ventennio seguente (Sanger et al., 1977).La crescente domanda di metodi più economici e veloci ha portato poi allo sviluppo dei metodi di sequenziamento di seconda generazione, meglio conosciuti come Next-Generation Sequencing (NGS). Le piattaforme NGS hanno fatto la loro comparsa nel 2008, consentendo di sequenziare all’unisono milioni di frammenti di DNA da un singolo campione ottenendo velocità e volumi di produzione elevati. Ciò ha reso possibile il completamento del sequenziamento in alcune settimane di analisi (procedimento che, con il metodo Sanger, sarebbe durato anni). Il crescente numero di basi ottenute per ciascuna corsa NGS ha visto anche l’abbassamento del costo di sequenziamento per singola base. Questo, al giorno d’oggi, consente di sequenziare un intero genoma umano in meno di un giorno per 1000 dollari.Il sequenziamento del genoma umano con la tecnologia NGS sta facilitando l’individuazione di geni ed elementi regolatori associati alle patologie, ampliando gli studi genetici in grado di portare enormi vantaggi nel campo della medicina personalizzata.

riseqUenziAmentO delle reGiOni di interesse

Il sequenziamento del genoma intero fornisce informazioni sulla sequenza completa del DNA di un individuo. Il volume dei dati generati con questo approccio rende la loro analisi particolarmente complicata, richiedendo inoltre un notevole consumo di risorse computazionali.Com’è noto, per varie patologie la regione genomica di interesse è già conosciuta, ed in questo caso l’informazione proveniente dal genoma intero è superflua. Il sequenziamento delle regioni di interesse è meno costoso, consente di ottenere coperture più elevate, abbattendo costi e tempi di sequenziamento (Xuan et al., 2012).Considerato questo, il sequenziamento delle regioni di interesse offre un’alternativa estremamente flessibile ed economica al sequenziamento dell’intero genoma.Riducendo la dimensione del target e concentrandosi sulle regioni in cui è più probabile trovare i dati rilevanti, si ottiene un aumento della sensibilità grazie all’incremento delle coperture e, di conseguenza, una maggiore possibilità di effettuare nuove scoperte, identificando mutazioni che causano le malattie utili per la diagnosi e la prognosi delle condizioni patologiche.

Page 25: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

23

seqUenziAmentO dell’esOmA

Il genoma umano è costituito da 3 miliardi di nucleotidi o “lettere”. Solo una piccola percentuale – 1,5% - di queste lettere è effettivamente tradotta in proteine, le molecole funzionali negli esseri viventi. Ciò che è rilevante di questa piccola frazione, è che essa include 85% delle mutazioni che causano malattie. L’esoma è costituito da tutti gli esoni del genoma, che sono, appunto, le porzioni codificanti dei geni. Il termine esone deriva da “regione espressa” (o ‘exon’, Expressed regiON), poiché sono queste le regioni che vengono tradotte, o espresse come proteine.Il sequenziamento dell’intero genoma produce indiscutibilmente una quantità di dati che non si può ottenere con il sequenziamento degli esomi, incluse anche le basi non codificanti e le informazioni strutturali e di fase dell’aplotipo. Quello di cui siamo ancora all’oscuro è la funzione della maggior parte della sequenza e l’impatto funzionale del cambiamento dei nucleotidi. Le implicazioni delle mutazioni missenso in un gene codificante per una proteina, infatti, sono più facili da comprendere. In altre parole: l’esoma, al momento, è la parte del genoma che sappiamo interpretare.Il sequenziamento dell’esoma offre una panoramica del genoma che gli studi di larga scala sulle varianti comuni, come gli Studi di Associazione Genome-Wide (GWAS), non riescono a fornire. I I GWAS possono solo identificare una variazione nel DNA comune nella popolazione, in almeno 1% delle persone. Il sequenziamento ci consente di leggere non solo le basi delle quali è già nota la variazione , ma ogni singola base o “lettera” nella catena del DNA. Perciò è in grado di rivelare le mutazioni rare che i GWAS non riuscirebbero a scoprire.Il sequenziamento dell’esoma è una buona scelta per gli scienziati che al giorno d’oggi stanno cercando mutazioni rare, specialmente se questa informazione viene integrata a studi sulle varianti comuni come i GWAS.Il sequenziamento dell’esoma è stato largamente usato negli ultimi anni per la scoperta dei geni. Prima del 2010 sono stati pubblicati solo alcuni articoli su questo tema, mentre attualmente se ne trovano oltre 3000 su PubMed. Analizzando l’esoma di un individuo, è possibile identificare le varianti genetiche note che possono portare ad un fenotipo patologico. In aggiunta, analizzando gli esomi di molti pazienti, si possono trovare le varianti rare, ed in seguito possono essere completate le analisi sulle conseguenze funzionali delle mutazioni; risulta così facilitata l’individuazione delle mutazioni causali delle malattie, ove non sia stata ancora identificata la causa genetica. Grazie agli approcci sperimentali ed analitici sul sequenziamento dell’esoma è disponibile un vasta ed arricchita base di informazioni che ha consentito la scoperta di più di 100 nuovi geni in grado di spiegare malattie mendeliane ancora irrisolte (Bamshad et al., 2011). Oltre a questo, il sequenziamento dell’esoma può essere usato per meglio comprendere l’ereditabilità nelle malattie complesse e i tratti collegati allo stato di buona salute dell’essere umano (Bamshad et al., 2011).

pAnnelli Genetici

Le regioni di interesse, o ‘target’, si possono ridurre ulteriormente. In questo modo le analisi si possono mirare a centinaia di regioni genomiche, punti cruciali per quanto riguarda le mutazioni che causano malattie. Si vanno così a costituire i cosiddetti ‘pannelli’ genetici, al momento molto utilizzati. Questi pannelli consentono di sequenziare ed analizzare solo le regioni del genoma desiderate, eliminando tutto il resto e quindi risparmiando su costi e tempo. I pannelli di risequenziamento delle regioni target possono essere sviluppati da ricercatori o da clinici per includere specifiche regioni genomiche di loro interesse (pannelli personalizzati o ‘custom’). Oltre a questo, pannelli che mirano a regioni target

Page 26: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

24

di interesse comune possono essere ideati per uso clinico; questi includono pannelli che consentono di analizzare regioni soggette a mutazioni che causano cancro, cardiomiopatie o autismo. Il risequenziamento delle regioni target può favorire – sia per un singolo gene analizzato che per un intero pannello di regioni genomiche – la rapida diagnosi di svariate patologie genetiche. Tali risultati possono diventare un supporto decisionale riguardo le terapie da effettuare sui pazienti, inclusi diversi tipi di tumori, per i quali il trattamento può diventare specifico e variare a seconda del tipo di cancro (Rehm et al., 2013).

riseqUenziAmentO delle reGiOni di interesse – PreParazIone Del caMPIone

Il risequenziamento delle regioni di interesse annovera diversi metodi di preparazione del campione per produrre delle librerie che rappresentino tali regioni. Durante la procedura di arricchimento, le regioni genomiche di interesse sono catturate in maniera selettiva prima di essere sequenziate, a partire da un campione di DNA genomico totale. Da più di 20 anni, la PCR è una delle tecniche di preparazione più usate nella fase di pre-sequenziamento. Il principio è semplice: si disegnano delle sequenze che fiancheggiano le regioni di interesse, e tramite la PCR si amplificano queste regioni. Questo principio è usato per il sequenziamento Sanger ed è compatibile con le piattaforme NGS. La differenza sta nel numero di sequenze processabili per singola corsa: una singola sequenza di un campione per singola reazione nel caso del sequenziamento Sanger, oppure, tante di sequenze provenienti da altrettanti campioni. Ogni regione di interesse viene amplificata separatamente ed in seguito i campioni sono bilanciati in modo equimolare prima delle costruzione della library. In alternativa, può essere eseguita una PCR che elimina lo step di bilanciamento equimolare tra i campioni, e ciò ha un notevole effetto sull’uniformità delle sequenze. Questo sistema di arricchimento è estremamente flessibile, ed è in grado di coprire da 600 bp fino a 500 Kb di sequenze totali. Una delle difficoltà degli approcci che prevedono l’uso della PCR sono gli SNP nelle regioni dove il primer si lega al DNA, e in questo caso uno dei due alleli può essere nettamente favorito nell’amplificazione. Tali problemi possono essere superati ottimizzando il disegno dei primer, con ampliconi che si sovrappongono, o usando una combinazione di PCR lunghe e corte. Purtroppo, anche con la pipeline di PCR più efficiente ed automatica, non è possibile arricchire regioni genomiche di diverse megabasi (Mbp), principalmente per l’alto costo dei primer e dei reagenti. Per questo motivo, per un set di regioni target molto grande (come 30 Mbp di esoma umano), viene usato un approccio di arricchimento tramite cattura selettiva delle regioni di interesse. Al momento, la maggior parte degli utenti si avvale di questi metodi di cattura, che consentono di spaziare molto nella dimensione delle regioni target. Il principio della selezione diretta è il seguente: dopo la frammentazione del genoma i frammenti di interesse vengono catturati ibridando il campione con sonde specifiche, che vengono poi separate dal resto del DNA. La separazione viene effettuata tramite l’interazione delle sonde con un determinato substrato (tramite interazione di tipo magnetico o con interazione antigene-anticorpo) . Gli ibridi non specifici sono rimossi tramite lavaggio, e il DNA di interesse viene eluito ed usato nella preparazione di una library di sequenziamento standard. Il difetto più comune di questo sistema è la perdita di uniformità e specificità delle sequenze ottenute, poiché l’efficienza può variare da sonda a sonda.

Page 27: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

25

nGs wOrkFlOw

Lo schema organizzativo della piattaforma NGS può essere diviso in due macro-categorie, una afferente alla biologia, e uno alla bioinformatica. Per quanto riguarda la parte biologica, il genoma viene sequenziato, assegnando a ciascun nucleotide la sua lettera iniziale, ottenendo quindi delle stringhe di caratteri. Nella parte bioinformatica, queste sequenze vengono analizzate, per essere unite, dove possibile, oppure scartate o corrette in caso di errori, in modo da fornire all’utilizzatore dei risultati validi, con la minor quantità possibile di dati superflui.

analIsI DeI DatI

Produrre dati di NGS è molto più facile che comprenderli. Una volta prodotte le sequenze, ci si trova ad avere a che fare con una mole di dati enorme. Sono necessari diversi livelli di analisi per convertire i dati grezzi in risultati biologici significativi. Una pipeline generale per analizzare i dati NGS include un pre-processamento dei dati per rimuovere le sequenze degli adattatori (usati nella costruzione della library) e le sequenze di bassa qualità; si procede quindi con l’allineamento delle sequenze su un genoma di riferimento, o un allineamento de novo. Le analisi a valle sono molteplici, e tra queste vi sono l’individuazione delle varianti genetiche tramite chiamata di SNP o indels (inserzione/delezione di basi), l’individuazione di nuovi geni o nuovi elementi regolatori, e la valutazione del livello di espressione dei trascritti. Le analisi possono anche includere l’identificazione di eventi di mutazioni sia germinali che somatici, che possono contribuire alla diagnosi di malattie o di alterazioni genetiche. Esistono svariati algoritmi e software in grado di eseguire le analisi bioinformatiche necessarie per analizzare correttamente i dati di sequenziamento (Gogol-Döring e Chen, 2012).Per distinguere le varianti associate alla patologia di interesse da tutte le altre mutazioni individuate dai dati NGS, occorrono ulteriori analisi statistiche e bioinformatiche. Risultano, perciò, di estrema importanza la visualizzazione delle varianti, la loro caratterizzazione funzionale e l’assegnazione di una priorità che consenta di svelare l’associazione tra i marcatori genetici e le patologie/tratti fenotipici.In altre parole, una volta identificate le potenziali differenze tra il genoma in corso di studio e quello di riferimento, il passaggio successivo è quello di determinare quali di queste variazioni sono dovute agli errori di sequenziamento e quali, invece, stanno alla base del fenotipo/malattia sotto esame. Bisogna identificare tra centinaia di migliaia di varianti, quelle che sono coinvolte nella condizione patologica, eliminando tutte quelle che, secondo euristiche o studi pregressi, non sono collegate alla malattia/condizione in esame, riducendo quindi la quantità di materiale da analizzare. Il metodo prevede di rimuovere le variazioni che seguono modelli relativi ad altri fenomeni, e annotare e identificare quelle che hanno un riscontro col caso specifico in esame. La strategia per dare la priorità alle varianti prevede che le mutazioni patogenetiche abbiano determinate caratteristiche: i) Segregazione con il fenotipo - nei pedigree dominanti con penetranza completa, ad esempio, tutti gli individui affetti devono portare la mutazione causale, mentre nessuno dei sani deve averla; ii) Rarità – tutte le mutazioni devono essere abbastanza rare (< 1%); iii) Impatto sulla proteina – è atteso che la maggior parte (o quasi) delle varianti causali abbia un impatto sui geni, e che quindi la maggioranza delle mutazioni vadano ad alterare la sequenza proteica (66%), il frame di lettura (13.5%), lo splicing (4.3%), o la lunghezza (6.8%); iv) Espressione nel tessuto di interesse - i geni in cui sono presenti mutazioni patogenetiche hanno la tendenza ad essere altamente espressi nei tessuti connessi con la malattia, ad esempio studi recenti sul sequenziamento dell’RNA della retina umana riportano che circa 97% dei geni in RetNet (un database dei geni coinvolti nelle patologie della retina) siano, per il 50%, altamente espressi nella

Page 28: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

26

retina. Com’è ovvio, ci sono diverse eccezioni per le regole sopraccitate. È da escludere un approccio che scarta le varianti che non segregano perfettamente o che appaiono sinonime. Ci sono, invece, degli algoritmi che prioritizzano le varianti basandosi sulla segregazione, rarità, annotazione funzionale ed espressione. Applicando questi criteri sui dati dell’esoma si può ridurre una lista iniziale di 100.000 varianti, arrivando ad una decina di mutazioni probabilmente patogeniche.

cOnclUsiOni e prOspettive

Ci sono continuamente innovazioni che emergono nella ricerca genomica, la tecnologia NGS sta diventando uno strumento sempre più potente, ed ora i ricercatori sono in grado di studiare simultaneamente migliaia di varianti potenzialmente patogenetiche in un singolo individuo. Man mano che i costi scendono e le capacità informatiche aumentano, le tecnologie NGS saranno sempre più accessibili anche per applicazioni in ricerca clinica, e saranno di supporto alla comprensione di patologie molto complesse, come il cancro. Sarà comunque neccessario sequenziare centinaia di migliaia di persone, se non milioni, per capire fino in fondo l’influenza dei geni sulle malattie, e consentire lo sviluppo di farmaci piu’ efficienti, disegnati su misura per ciascun paziente. Infine, per consentire il progresso nella genomica clinica, le instituzioni dovranno trovare un modo veloce e interattivo per condividere i dati. Le pubblicazioni richiedono troppo tempo e molte varianti raccolte non vengono mai pubblicate. Dobbiamo trovare un modo efficace per dare ai ricercatori un accesso veloce non solo ai dati presenti nella letteratura, ma anche a tutti gli altri dati prodotti, consentendo così il rapido sviluppo della medicina personalizzata.

BiBliOGrAFiA

Sanger F, Nicklen S, Coulson AR (1977) DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci USA 74:5463–7

Xuan J, Yu Y, Qing T et al. (2013) Next-generation sequencing in the clinic: promises and challenges. cancer lett 340(2):284-95

Rehm HL (2013) Disease-targeted sequencing: a cornerstone in the clinic. nat rev Genet 14:295–300

Gogol-Döring A, Chen W (2012) An overview of the analysis of next generation sequencing data. Methods Mol Biol 802:249–57

Bamshad MB, Ng SB, Bigham AW, Tabor HK, Emond MJ, Nickerson AD, Jay Shendure J (2011) Exome sequencing as a tool for Mendelian disease gene discovery. nat rev Genet 12: 745-755

Page 29: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

27

Page 30: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

28

Page 31: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

29

sIsteMI dI InteGrazIonee per la raccolta deI datI sanItarI: nuove frontIere per la connettIvItà In

aMbIto clInIco e per l’InteGrazIone della coMponente GenoMIca

michele de monte

Project manager Nuvon Italia, Trieste.

abstract — Dalla trasmissione di stringhe di dati alfanumerici, al tracciamento degli eventi, alla messa a disposizione di immagini e tracciati grafici: come sta evolvendo la domanda di servizi di connettività e integrazione in ambito clinico dal punto di vista di un operatore attivo nel mercato nord-americano, mercato pioniere che ha visto nascere la domanda per questo tipo di servizi, anche alla luce della sempre più diffusa disponibilità di dati di altra natura come quelli genomici per l’approccio alle patologie.

_____________________________________________________________________

La salute e la cura del paziente sono le attività “core” delle strutture sanitarie: in questo contesto le tecnologie informatiche sono diventate particolarmente interessanti nel momento in cui, da un lato, hanno facilitato gli sforzi del personale addetto alle cure e, dall’altro, hanno permesso di comunicare al paziente una sensazione di fiducia nella struttura che li stava curando. In un contesto eterogeneo, dove le informazioni possono provenire da fonti diverse, da dispositivi recenti o datati, da interfacce con protocolli proprietari o standard, in tempo reale o cadenzate, si è sentito il bisogno di facilitare la raccolta dei dati passando da un sistema prevalentemente cartaceo, spesso però ancora in uso in molti centri, a un sistema informatizzato, più completo, flessibile e in grado di assicurare il tracciamento degli eventi, degli interventi e dei trattamenti codificati [1].Una delle soluzioni in grado di contribuire ad assicurare una risposta su questo fronte era legata all’utilizzo di infrastrutture informatiche, veri e propri “middleware”, in grado di acquisire i dati direttamente dai dispositivi medici inviandoli ai Sistemi Informativi Sanitari (SIS) che nel frattempo stavano cominciando a diffondersi. Tali sistemi erano in grado di ricevere un numero crescente di informazioni a completamento di quanto inserito direttamente da operatori, infermieri e medici.In questa prima fase, i “middleware” di raccolta e integrazione dei dati hanno prestato maggior interesse a caratteristiche come la facilità d’uso, il riconoscimento automatico dei dispositivi collegati, la flessibilità d’impiego, l’alleggerimento del lavoro del personale medico e infermieristico per liberare risorse a vantaggio della cura del paziente. Sulla base delle caratteristiche della strumentazione presente negli ospedali, tali soluzioni dovevano garantire la compatibilità con il ventaglio di dispositivi medici presenti che molto spesso erano basati su sistemi anche proprietari di comunicazione o su protocolli non sempre aggiornati. Sulla base, poi, delle conoscenze tecniche degli operatori, il riconoscimento del

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 29-33

Page 32: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

30

dispositivo collegato doveva essere il più possibile automatico: a un infermiere non si poteva richiedere la competenza informatica di uno specialista, né si poteva portare un informatico in sala operatoria per interventi in caso di necessità. Il “core” della prima fase è stato, quindi, quello di mettere a disposizione una connettività capillare, tracciata, compatibile, efficace e semplice da utilizzare per la raccolta e la trasmissione di stringhe di dati alfa-numerici e per il tracciamento degli eventi riconducibili alla cura della salute del paziente.

Fig. 1. Esempio di stringhe di dati in formato standard HL7 [2].

La progressiva diffusione dei SIS e delle Cartelle Cliniche Elettroniche (EMR), nonché il miglioramento delle caratteristiche tecniche della strumentazione clinica hanno portato ad una progressiva estensione delle richieste da parte degli operatori.In primo luogo è emersa l’esigenza di trasmissione di dati non solo in formato alfa-numerico, ma anche in formato diverso, come immagini, forme d’onda o file. Nel primo caso si tratta di mettere a disposizione immagini in alta definizione come fotografie, immagini radiografiche ed ecografiche, per consentire anche a distanza una visualizzazione e un’analisi delle stesse soprattutto a distanza di tempo (tenendo ben fermi i vincoli sulle condizioni di visualizzazione spesso necessari per una corretta interpretazione del contenuto). Sempre più sono, infatti, i casi in cui oltre al supporto di referti e descrizioni, sono necessarie delle verifiche visive se non per l’effettuazione di una diagnosi sicuramente per la valutazione di esigenze di approfondimento.

Fig. 2. Esempio di immagine ecografica [3].

Page 33: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

31

Nel secondo caso si tratta di riuscire a trasferire come tali le forme d’onda che spesso vengono presentate da vari dispositivi come monitor, macchine di anestesia, ventilatori, come forma di rappresentazione nativa e non come ricostruzione a partire da un campionamento di quanto presentato sui display degli strumenti diagnostici.Tale esigenza è legata all’immediatezza che la visione di un tracciato ha nell’evidenziare agli addetti ai lavori situazioni critiche che richiedano una maggior attenzione nella trattazione.

Fig. 3. Esempi di dispositivi con forme d’onda.

Nel terzo caso si tratta, infine, di trasferire documenti di varia natura, dimensione e contenuto che possono contenere analisi e/o referti precedentemente effettuati, ma che contengono più spesso informazioni grezze/elaborate di nuovi tipi di indagine. All’interno di queste rientrano anche quelle sul profilo genomico del paziente. Questo tipo di dati, che si sta gradualmente diffondendo in ambito medico soprattutto per la cura di alcune patologie, vede la necessità di trasferire e archiviare informazioni contenute all’interno di file che rappresentano il risultato di alcune analisi svolte sul sequenziamento delle basi e/o sul genoma. Al momento attuale dello studio, sono presenti differenti metodi per evidenziare eventuali problemi a livello genomico: tutti però presentano i risultati all’interno di file e/o di immagini di sintesi che tendono a rappresentare in modo differente i risultati in funzione della patologia. Dal punto di vista della capacità di acquisizione del dato, nell’ambito delle strutture più avanzate è ormai scontata la possibiltà di utilizzo della soluzione di integrazione sia in modalità wired che wireless. L’interesse per la modalità di funzionamento wireless si è attualmente spostato, da un lato, sulla capacità di acquisire il dato in assenza di connessione per renderlo successivamente disponibile non appena questa si ristabilisca; dall’altro è focalizzato sulla durata della batteria che è direttamente connessa non solo al tipo di batteria utilizzata, ma anche al modo in cui la si utilizza. Nel primo caso la risposta può prevedere l’introduzione di una memoria per i dati nei dispositivi d’interfaccia: ciò comporta anche la necessità di sviluppare differenti logiche di trasmissione e aggiornamento dei dati non appena si ristabilisca la connessione, meglio ancora se in modo configurabile per soddisfare le esigenze del cliente.Nel secondo caso si può fare ricorso, invece, a una ottimizzazione del funzionamento di basso livello dei dispositivi caratterizzata dall’attivazione solo al bisogno delle diverse funzionalità hardware, nonché alla diffusione di protocolli di comunicazione a basso consumo (BT4 Low Energy) in grado di abbattere drasticamente il consumo del dispositivo. Il mantenimento della comunicazione attiva continua a rappresentare l’elemento di maggior consumo per questo tipo di unità.Ulteriore elemento di sviluppo della domanda di servizi di integrazione in ambito sanitario

Page 34: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

32

è rappresentato dalla crescita della dimensione multipiattaforma dell’accesso alle informazioni. Terminali fissi e mobili, tablet e smartphone, monitor e televisori consentono un ventaglio di opzioni che allargano la possibilità di accesso e di consultazione dei dati anche a distanza. Ecco che la possibilità di permettere un accesso non vincolato a terminali proprietari o a postazioni fisse, ma anche a dispositivi di larga diffusione utilizzando protocolli standard

Fig. 4. Esempio di informazione da rielaborazione di analisi di espressione genica – Heat map [4].

Page 35: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

33

nativi per le differenti piattaforme può rappresentare un elemento per ampliare di molto l’operatività del personale medico e infermieristico, ma anche la capacità di analisi di eventuali malfunzionamenti da parte del personale tecnico e di supporto.

Fig. 5. Esempio di utilizzo multipiattaforma dei dati raccolti da dispositivi medici.

Tornando al tema dell’integrazione tra dati clinici e genomici (cuore del programma di ricerca D.NAMICA), l’interesse in questa fase di utilizzo del dato genomico è ancora orientato a un efficace trasferimento/archiviazione del dato assieme agli altri dati disponibili, e a un successivo facile recupero di tali informazioni per facilitare un confronto nel tempo dei trend di evoluzione della patologia in funzione anche di eventuali terapie. L’interesse nel futuro potrebbe invece crescere verso la capacità di definire in modo estensivo delle sintesi pre-calcolate per risultati di diversa provenienza (clinica, anamnesica, genomica) estesa a un numero elevato di patologie e che siano in grado di riassumere in un diagramma o in uno score lo stato di evoluzione di una patologia o il livello di rischio allo stato presente. Una soluzione in grado di integrare dati di tipo differente (clinici, genomici, anamnesici) all’interno di un unico contenitore potrebbe favorire il superamento della diversità di forma del dato e aprire ai grandi numeri l’impiego di strumenti più efficenti che, a loro volta, potrebbero ulteriormente affinarsi grazie alla verifica legata al loro sistematico utilizzo.Tali indicatori pre-calcolati potrebbero, infine, essere validati e/o affinati sulla base di un confronto diretto tra medico e pazinete in sede di visita periodica.

BiBliOGrAFiA

1. Neto E., De Monte M., 2010, VEGA™ System: Point of care ... Anywhere, Atti del Workshop Nazionale “Standard Informatici per Dati e Immagini Mediche e Interoperabilità dei Sistemi Informativi Sanitari”, Lucca, 11 Dicembre 2010.

immAGini

2. AA.VV., 2012, IDM-MG 3000 user manual, Nuvon, Inc.

3. Mazzaferro S., 2011, http://www.docvadis.it/ecografia-messina-domicilio/page/ecografia_internistica/ecografia_del_fegato_e_delle_vie_biliari/ecografia_del_fegato_e_delle_vie_biliari.html

4. 2014, Esempio di heat map di espressione genica, per gentile concessione di SISSA – Lab. Prof. Gustincich

Page 36: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

34

Page 37: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

35

esoMa e cardIoMIopatIa GenetIcaMente deterMInata:

esperIenza del reGIstro cardIoMIopatIe dI trIeste

Fabrizio Pirozzi

Azienda Ospedaliero-Universitaria Ospedali Riuniti di Trieste, Struttura Complessa Universitaria di Cardiologia, Trieste.

abstract — Negli ultimi anni lo sviluppo di tecniche di biologia molecolare ha permesso di chiarire il ruolo fondamentale dei fattori genetici nelle malattie del muscolo cardiaco. Le cardiomiopatie familiari sono dovute a mutazioni geniche che solo nel 30% dei casi vengono riconosciute dall’analisi molecolare. La relazione tra genotipo e fenotipo è molto complessa e spesso non prevedibile: mutazioni dello stesso gene possono causare diverse patologie, caratterizzando una significativa eterogeneità fenotipica. Studiare la storia naturale e l’ereditarietà è fondamentale per identificare precocemente e trattare in modo più efficace i soggetti affetti da queste malattie. Capire le basi genetiche delle cardiomiopatie potrebbe portare a un progresso nelle nostre conoscenze sui meccanismi di queste malattie, a una diagnosi precoce e a un miglioramento nel trattamento e nella prevenzione.

_____________________________________________________________________

intrOdUziOne

Le Cardiomiopatie sono definite come disordini del miocardio nei quali il muscolo cardiaco è strutturalmente e funzionalmente anormale, in assenza di malattia coronarica, ipertensione arteriosa, patologie valvolari o cardiopatie congenite, sufficienti a giustificare il grado di patologia miocardica osservata [1]. Negli ultimi anni lo sviluppo di tecniche di biologia molecolare ha permesso di chiarire il ruolo fondamentale dei fattori genetici nelle malattie del muscolo cardiaco. Studiare la storia naturale e l’ereditarietà è fondamentale per identificare precocemente e trattare in modo più efficace i soggetti affetti da queste malattie. Capire le basi genetiche delle cardiomiopatie potrebbe portare a un progresso nelle nostre conoscenze sui meccanismi di queste malattie, a una diagnosi precoce e a un miglioramento nel trattamento e nella prevenzione.L’inquadramento clinico, la gestione ed il follow-up dei Pazienti con Cardiomiopatie osservati presso la S.C. Cardiologia dell’Azienda Ospedaliero-Universitaria di Trieste viene eseguito in maniera sistematica da oltre 30 anni. I dati clinici e strumentali raccolti sui Pazienti prospetticamente seguiti alimentano il Registro delle Malattie del Muscolo Cardiaco di Trieste.I familiari di 1° grado dei pazienti affetti da malattia del miocardio vengono sottoposti alla valutazione clinico-strumentale basale e quindi, qualora non presentino segni di malattia, inseriti in un programma di follow-up periodico con scadenza variabile a seconda del tipo

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 35-37

Page 38: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

36

di cardiomiopatia (per le cardiomiopatie ipertrofiche e del ventricolo destro: controllo annuale dal 13° fino al 18° anno di età, indi controlli ogni 3 anni; per le cardiomiopatie dilatative: controlli ogni 3 anni dal 18° fino al 50° anno di età).Le cardiomiopatie familiari sono dovute a mutazioni geniche che solo nel 30% dei casi vengono riconosciute dall’analisi molecolare. La relazione tra genotipo e fenotipo è molto complessa e spesso non prevedibile: mutazioni dello stesso gene possono causare diverse patologie, caratterizzando una significativa eterogeneità fenotipica.Una completa caratterizzazione genotipica di questi malati permetterebbe una accurata conoscenza della patologia finalizzata ad una diagnosi precoce e ad un miglior trattamento. Innovative tecnologie di sequenziamento genico (“exome sequencing”) garantiscono un’efficiente ed accurata analisi delle regioni codificanti nell’intero genoma. Questo nuovo approccio al sequenziamento genico permetterà il riconoscimento di nuove mutazioni al fine di caratterizzare al meglio la patologia e la relazione genotipo/fenotipo.

Attività All’internO del prOGettO d.nAmicA

All’interno del progetto D.NAMICA il gruppo AOUTS, e più nello specifico la Struttura Complessa Universitaria di Cardiologia, ha concentrato la propria ricerca nello studio della genetica della cardiomiopatie ad impronta ereditaria familiare. Probandi e familiari (distribuiti su tutto il territorio nazionale) appartenenti a 16 famiglie con Cardiomiopatia Dilatativa Familiare (DCM) o Displasia Aritmogena del Ventricolo Destro (ARVD), con peculiarità fenotipiche e di ereditarietà tali da rendere l’analisi genomica efficace, sono stati selezionati tra i pazienti appartenenti al registro Cardiomiopatie di Trieste. Per ciascun paziente è disponibile una accurata raccolta di dati anamnestici, valutazione clinica, esami bioumorali e strumentali di primo e secondo livello, sia storici che del follow-up successivo all’arruolamento. Da ogni paziente è stato estratto, con appositi kit commerciali, il DNA genomico dai prelievi ematici.A livello laboratoristico è stato effettuato un set up di preparazione e di confezionamento dei campioni biologici di un sottogruppo selezionato di pazienti (n° 40), al fine di ottimizzare l’analisi genomica tramite whole exome sequencing. Un’accurata ricerca in letteratura ha permesso di individuare geni e mutazioni note, maggiormente connesse a malattie primitive del muscolo cardiaco. In collaborazione con i partner IGA e IGA technology services è stata effettuata l’analisi genetica dei pazienti mediante studio exome sequencing al fine di individuare nuove mutazioni in geni correlati a cardiomiopatie o nuovi geni causali ancora non descritti.

risUltAti e discUssiOne

Nelle famiglie studiate sono emerse peculiarità genetiche di estremo interesse. È stata studiata una famiglia di pazienti con cardiomiopatia dilatativa ad espressione clinica eterogenea ed è emerso come sia presente in due pazienti malati ed in due pazienti sani, appartenenti alla stessa famiglia, una mutazione in eterozigosi a carico del gene della desmoplachina. Non sono state trovate altre mutazioni nonostante la penetranza e l’espressività clinica siano molto varie. Questo è probabilmente giustificato dalla presenza di possibili geni modificatori ancora non noti, o a variazioni geniche a carico di DNA non esomico che probabilmente caratterizzano un diverso fenotipoLa seconda famiglia presentava il probando malato di cardiomiopatia dilatativa e il figlio con la stessa cardiomiopatia ma associata a disturbi sistemici autoimmuni e una conclamata miopatia prossimale. Sia nel padre che nel figlio è stata identificata una mutazione a

Page 39: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

37

carico del gene della vinculina e sorprendentemente è stata osservata una mutazione a carico del gene SNTA1 nel figlio con miopatia. Questo gene è già caratterizzato in patologie ereditarie aritmiche come la Sindrome del QT lungo, ma per quanto noto in letteratura, non ha correlazioni con disturbi miopatici.Discrepanze tra genotipo e fenotipo sono emerse in un’altra famiglia caratterizzata da una ancora più netta eterogeneità clinica, comprendente anche cardiopatie non tipicamente ereditarie come la cardiopatia da stress e la cardiopatia postmiocarditica: in questo contesto è stata identificata una mutazione a carico del gene Titina altamente suggestiva di patogenicità (gene già noto come più frequentemente correlato a cardiomiopatia dilatativa familiare) che segrega con tutti casi di cardiomiopatia della famiglia in questione, siano essidilatativi, valvolari congeniti, o da stress o postmiocarditici appunto.La nostra solo parziale conoscenza della complessità genetica emerge ancora più evidentemente nei molti casi in cui, pur in presenza di una evidente familiarità e di un aggressivo fenotipo clinico, caratterizzato da morte improvvisa aritmica o scompenso cardiaco in età giovanile, l’analisi dell’esoma non ha individuato mutazioni a carico dei geni noti già descritti.Si tratta di deficit di accuratezza della metodica di exome sequencing o ci troviamo di fronte ad un nuovo gene responsabile ancora non descritto, o forse ad un caso di complesse iterazioni tra diversi polimorfismi a carico di geni noti?Lo stato attuale delle conoscenza non permette di rispondere a queste domande.

reFerenze

1. Position Statement dell’European Society of Cardiology. European Heart Journal 2008; 29: 270–276.

Page 40: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

38

Page 41: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

39

Microrna coMe MarcatorI nel carcInoMa epatIco: possIbIlI applIcazIonI In caMpo oncoloGIco

Devis Pascut1, raffaella calligaris3, helena krmac3, nicolò Mezzina2, riccardo Patti2, luisa Petraccia2, sara Finaurini3, saveria lory crocè2,

stefano Gustincich3, claudio tiribelli1

1 Fondazione Italiana Fegato, Area Science Park, Basovizza, Trieste.2 Azienda Ospedaliero-Universitaria Ospedali Riuniti di Trieste, Clinica Patologie del Fegato, Trieste.3 Scuola Internazionale Superiore di Studi Avanzati (SISSA), Laboratorio di Genomica Funzionale, Trieste.

abstract — L’epatocarcinoma è la neoplasia maligna epatica primitiva più diffusa, collocandosi al sesto posto tra i tumori più frequenti al mondo e al secondo per la mortalità raggiungendo i circa 745.000 decessi all’anno su base mondiale. In Italia le morti annue sono di poco superiori alle 9.000 unità. I maggiori fattori di rischio per l’epatocarcinoma comprendono infezioni da HBV/HCV e epatopatia alcolica, in aumento sono i casi su epatopatia steatosica non alcolica (NAFLD). L’elevato tasso di mortalità è spesso spiegato da una tardiva diagnosi e dalla difficoltà nel prevedere tempestivamente l’andamento della malattia. Un aiuto potrebbe venire dalle recenti scoperte nel campo della biologia molecolare. I microRNA (miRNA) sono piccoli RNA non codificanti presenti nei fluidi corporei ed una loro variazione potrebbe essere indice di uno stato patologico in evoluzione. Il presente studio analizza i profili di espressione dei miRNA circolanti in pazienti con epatocarcinoma al fine di attribuirvi una significatività nel monitoraggio della malattia a seguito della terapia.

_____________________________________________________________________

intrOdUziOne

L’epatocarcinoma è la neoplasia maligna epatica primitiva più diffusa, collocandosi al sesto posto tra i tumori più frequenti al mondo e al secondo per la mortalità raggiungendo i circa 745.000 decessi all’anno su base mondiale. Recentemente le stime della World Health Organization hanno previsto un aumento sia dell’incidenza che della mortalità per questa patologia per i prossimi 15 anni. I maggiori fattori di rischio per l’epatocarcinoma comprendono infezioni da HBV/HCV e epatopatia alcolica, in aumento sono i casi su epatopatia steatosica non alcolica (NAFLD) [1]. L’elevato tasso di mortalità è spesso spiegato da una tardiva diagnosi e dalla difficoltà nel prevedere tempestivamente l’andamento della malattia.Attualmente le linee guida seguite per il trattamento dell’epatocarcinoma sono fornite dal Barcelona-Clínic Liver Cancer (BCLC) staging system, che suggerisce il trattamento più appropriato per i diversi tipi della patologia classificati in base al numero e dimensione di noduli tumorali presenti, funzionalità del fegato, presenza o meno di invasione vascolare ed ipertensione portale [2,3]. Da un certo punto di vista questa potrebbe essere considerata

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 39-43

Page 42: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

40

una visione semplicistica di un quadro clinico che nella realtà è molto più complesso e che rispecchia la diversità molecolare che interessa il carcinoma epatico. La suddivisione in sottogruppi, la categorizzazione di un gruppo di pazienti in possibili responders o non responders verso un particolare tipo di terapia potrebbe incrementare l’aspettativa di vita per alcuni soggetti affetti da tale malattia. Sono già stati proposti dei modelli di classificazione dell’epatocarcinoma in base all’espressione alterata di geni nel campione tissutale [4]. Questo modello è applicabile soltanto previa biopsia. La presenza di bio-marcatori nei fluidi corporei che rispecchiano lo stato patologico dell’organo interessato, permetterebbe la sostituzione di indagini invasive con un semplice prelievo di sangue.Attualmente uno dei marcatori ematici più utilizzati in questa patologia è l’alfa-fetoproteina che tuttavia possiede una bassa specificità e sensibilità che di fatto la rendono un debole bio-marcatore diagnostico e prognostico [5]. Le recenti scoperte riguardo i microRNA hanno suggerito il possibile utilizzo di questi RNA come bio-marcatori.I microRNA (miRNA) sono piccoli RNA non codificanti responsabili della regolazione dell’espressione genica post-trascrizionale presenti in tutti gli organismi viventi [6]. Essi non solo svolgono un ruolo fondamentale all’interno delle cellule ma possono essere rilevabili in tutti i fluidi corporei ed una loro variazione potrebbe essere indice di uno stato patologico in evoluzione. Da qui l’idea di utilizzare queste molecole come bio-marcatori nel carcinoma epatocellulare.Il presente studio analizza i profili di espressione dei miRNA circolanti in pazienti con epatocarcinoma al fine di attribuirvi una significatività nel monitoraggio della malattia a seguito della terapia. Al fine di correlare l’espressione dei miRNA circolanti con le caratteristiche cliniche del soggetto verrà creato un database che raccolga tutti i dati clinici significativi per la valutazione della patologia. Verranno inclusi studi retrospettivi su una coorte di 130 soggetti con HCC afferiti presso la Clinica Patologie del Fegato dell’Ospedale di Cattinara (TS) nel corso degli anni.

MaterIalI e MetoDI

casisticaPer un primo studio pilota di messa a punto della metodica di estrazione di miRNA e delle tecniche di analisi è stata selezionata una piccola coorte di 12 pazienti seguiti dalla Clinica Patologie del Fegato dell’Azienda Ospedaliero-Universitaria “Ospedali Riuniti di Trieste”. I criteri di arruolamento nello studio sono stati:• Nodulo/i HCC di nuovo riscontro nel periodo gennaio 2013 - febbraio 2014• Pazienti mai trattati per HCC con nessun tipo di terapia• Trattamento previsto nell’immediato o decisione di non trattamento• Firma del consenso informato per lo studio in questione

I pazienti sono stati seguiti prima, durante e dopo il trattamento, monitorandone i parametri clinici di interesse più rilevante e rientranti negli score CHILD, BCLC e CLIP (Tabella 1). Dei 12 pazienti, 10 erano di sesso maschile (83,3 %) e 2 di sesso femminile (16,6%), con un rapporto M:F di 5:1. L’età media dei pazienti al momento dell’arruolamento è risultata essere complessivamente di 68 anni (±8). La casistica comprende 7 soggetti con eziologia alcol-dismetabolica e 4 con infezione da HCV, 1 con steatosi epatica non alcolica (NAFLD, Non Alcoholic Fatty Liver Disease).Per ogni paziente incluso nello studio, sono stati effettuati prelievi di sangue totale e siero prima del trattamento (T0), ad un mese (T1) e a sei mesi (T6). Il sangue totale è stato raccolto in PAXgene Blood RNA Tube (Preanalytix®, Quiagen and Becton Dickinson, Hombrechtikon, Switzerland). È stato inoltre realizzato un registro informatico dove sono stati raccolti dati anagrafici del paziente e tutte le informazioni cliniche necessarie allo studio.

Page 43: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

41

estrazione acidi nucleici ed analisiPer l’estrazione dei microRNA da siero è stato usato il miRCURY™ RNA Isolation Kit per fluidi biologici della Exiqon Inc. (Woburn, MA United States) seguendo il protocollo fornito dal produttore. Per eseguire l’estrazione dell’RNA totale dai campioni in provetta PAXgene è stato usato il MagMAX™ for Stabilized Blood Tubes RNA Isolation Kit (Life Technologies™, Carlsbad, CA, USA) seguendo il protocollo fornito dal produttore. Le analisi quantitative e qualitative dell’RNA sono state effettuate tramite NanoDrop 3300 (Thermo Scientific, Waltham, USA) e tramite elettroforesi su gel, utilizzando il kit Agilent RNA 6000 Pico per l’RNA totale ed il kit Agilent Small RNA per i miRNA su Agilent 2100 Bioanalyzer (Agilent Tecnologies, Santa Clara, California). L’analisi di espressione dei miRNA circolanti è stata effettuata tramite array GeneChip®

miRNA 3.0 Array della Affymetrix (Santa Clara, United States).Il chip contiene sonde per 1733 miRNA maturi e 1674 precursori, sono inoltre presenti 2216 sonde per scaRNA e snoRNA. I dati sono stati elaborati tramite il software Expression Console™ 1.3.1.187 (Affymetrix, Santa Clara, United States).

risUltAti e discUssiOne

Dalle prime analisi sono emerse variazioni dei profili di miRNA a seguito della terapia. La maggior parte dei miRNA che presentano un profilo di espressione alterata miRNA sono stati recentemente identificati e per la prima volta la loro variazione viene riportata anche in epatocarcinoma. Ciò fa si che i loro bersagli molecolari non siano ancora stati identificati, quindi non è ancora noto il loro ruolo nella patologia. Tuttavia questa mancanza di informazioni fornisce ulteriori spunti per il proseguo dello studio verso una caratterizzazione molecolare di quei miRNA che dalle nostre analisi risulteranno più interessanti.Il confronto tra i profili di espressione dei miRNA in sangue e siero ha messo in evidenza come l’informazione ottenuta dai due sia completamente diversa. Molto più significativa ed interessante è quella derivata dal siero, che seppur meno ricco in varietà e quantità di miRNA ha senza dubbio fornito i risultati più importanti. La Figura 1 riporta un esempio di due heat map ottenute dal confronto del profili di espressione di miRNA in sangue totale ed in siero. Si nota come in siero (Fig. 1 B) si siano ottenute le maggiori diversità nell’espressione dei miRNA circolanti prima e post terapia. La quasi totalità dei miRNA differentemente espressi nel siero presenta una diminuzione dell’espressione post terapia, di questi solo il 31% risulta esser caratterizzato per quanto riguarda la funzione. Tra questi ricordiamo i miRNA hsa-mir-423-5p, hsa-mir-107, hsa-mir-326, hsa-mir-149, la cui aumentata espressione è già stata riportata in HCC ed è stato evidenziato un loro ruolo nella proliferazione cellulare, vascolarizzazione, regolazione dell’apoptosi, tutti processi fondamentali di importanza per le cellule tumorali. I risultati ottenuti aprono la strada verso l’utilizzo di campioni di sieroteche ospedaliere per successive analisi di questo tipo al fine di validare i nostri risultati con una più ampia casistica, magari coinvolgendo centri ospedalieri di paesi in cui l’epatocarcinoma è molto più frequente che in Italia. A completamento dello studio verranno anche valutate le correlazioni con i miRNA circolanti e le caratteristiche tumorali (dimensioni, velocità di crescita, presenza di multifocalità, presenza di invasione vascolare etc..), la risposta alla terapia e la sopravvivenza.Questo studio si inserisce nel contesto di una cartella clinica elettronica che raccogli non solo i dati clinici dei pazienti ma anche quelli derivati da analisi molecolari al fine di implementare le informazioni a disposizione del personale medico. L’importanza di arricchire le cartelle cliniche con dei dati –omici di nuova generazione risiede nella maggiore completezza dell’informazione disponibile che potrebbe indirizzare il paziente verso una

Page 44: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

42

più adeguata scelta terapeutica in base alle caratteristiche molecolari della patologia in esame. È questo il punto di partenza per l’ingresso della medicina personalizzata nella pratica medica corrente.

Tabella 1. Dati clinici al T0 della coorte di pazienti appartenenti allo studio pilota.

reFerenze

1. El-Serag HB, Rudolph KL (2007) Hepatocellular carcinoma: epidemiology and molecular carcinogenesis. Gastroenterology 132: 2557-2576. S0016-5085(07)00799-8 [pii];10.1053/j.gastro.2007.04.061 [doi].

2. Bruix J, Sherman M, Llovet JM, Beaugrand M, Lencioni R et al. (2001) Clinical management of hepatocellular carcinoma. Conclusions of the Barcelona-2000 EASL conference. European Association for the Study of the Liver. J Hepatol 35: 421-430.

3. Llovet JM, Bru C, Bruix J (1999) Prognosis of hepatocellular carcinoma: the BCLC staging classification. Semin Liver Dis 19: 329-338. 10.1055/s-2007-1007122 [doi].

4. Toffanin S, Hoshida Y, Lachenmayer A, Villanueva A, Cabellos L et al. (2011) MicroRNA-based classification of hepatocellular carcinoma and oncogenic role of miR-517a. Gastroenterology 140: 1618-1628. S0016-5085(11)00146-6 [pii];10.1053/j.gastro.2011.02.009 [doi].

5. Huo TI, Huang YH, Lui WY, Wu JC, Lee PC et al. (2004) Selective prognostic impact of serum alpha-fetoprotein level in patients with hepatocellular carcinoma: analysis of 543 patients in a single center. Oncol Rep 11: 543-550.

6. Bartel DP (2004) MicroRNAs: genomics, biogenesis, mechanism, and function. Cell 116: 281-297. S0092867404000455 [pii].

ID paziente eziologia aFP CHILD CLIP BCLC

176 Alcool/dism 4,6 A5 0 a

189 Alcool/dism 1,9 A5 1 B

195 Alcool/dism 45,1 A6 0 a

196 Alcool/dism 16,8 A6 0 a

198 Alcool/dism nd B8 nd nd

200 HCV 51,6 A5 0 a

171 Alcool/dism 3,7 B9 2 B

187 Alcool/dism 8,2 A6 nd B

170 HCV 8,2 A5 0 a

175 HCV 41,3 A6 1 B

181 HCV 7,5 A5 0 a

197 nafld 5,2 A5 nd nd

Page 45: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

43

Fig. 1. Esempio di Heat map di clustering gerarchico di campioni di sangue (A) e siero (B) prelevato da 4 soggetti con HCC prima (colonne in arancio) e ad un mese post terapia (colonne in verde). Le righe rappresentano i diversi miRNA ed altri small RNA. I livelli di espressione aumentati o diminuiti sono rappresentati rispettivamente in rosso o in verde.

Page 46: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

44

Page 47: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

45

atrofIa Muscolare spInale: eteroGeneItà GenetIca

e MedIcIna personalIzzata cOstrUire UnA BAncA dAti di vAriAnti Genetiche per lA

teraPIa persOnAlizzAtA dell’AtrOFiA mUscOlAre spinAle

Giorgia dubsky de wittenau1, slobodanka radovic2, Federica cesca1, alessandra Poz1, incoronata renata lonigro1,3

1 Dipartimento di Scienze Mediche e Biologiche, Università degli studi di Udine, Udine.2 Istituto di Genomica Applicata Technology Services, Udine.

3 SOC Istituto di Patologia Clinica, Azienda Ospedaliera Universitaria di Udine, Udine.

abstract — L’eterogeneità genetica degli individui, emersa dalla ricerca degli ultimi anni, pone l’esigenza non più procrastinabile di attuare un tipo di medicina personalizzata. La gravità maggiore o minore dei sintomi in una patologia è spesso associata a specifiche varianti genetiche che un soggetto malato detiene nel proprio DNA. Inoltre, fatto ancora più importante, la risposta dei pazienti a trattamenti di tipo farmacologico è spesso influenzata da specifiche varianti genetiche. Nei pazienti affetti da atrofia muscolare spinale (SMA) la patologia si sviluppa a causa dell’assenza di geni SMN1, mentre i geni SMN2 risultano ad oggi il principale target di strategie terapeutiche. Il progetto attuato presso l’Università di Udine si propone di costruire una banca dati di sequenza dei geni SMN2 di pazienti affetti da SMA allo scopo duplice di: i. individuare eventuali varianti alleliche che si associno a fenotipi patologici più o meno gravi; ii. fornire una banca dati di polimorfismi a singoli nucleotide (SNPs) per attuare studi di farmaco-genetica e per lo sviluppo di terapie di tipo personalizzato.

_____________________________________________________________________

intrOdUziOne

L’enorme progresso scientifico e tecnologico che negli ultimi anni ha accompagnato il sequenziamento del DNA e l’accumulo di conoscenze del genoma umano ha permesso di stabilire che gli esseri umani sono geneticamente identici per il 99,9% del loro genoma.Lo 0,1% residuo di diversità genetica è responsabile di tutte le differenze fenotipiche normali e patologiche degli esseri umani. Acquisire questa informazione ha rivoluzionato l’approccio scientifico dei ricercatori in campo medico che si occupano di svelare i meccanismi molecolari che sottendono ad uno stato di malattia e di ricercare strategie terapeutiche efficaci. È alla luce di queste premesse che prende vita il progetto di ricerca che si sta attuando presso l’Università di Udine nel laboratorio di Neurogenetica del Dipartimento di Scienze Mediche e Biologiche. È un progetto di ricerca traslazionale che si propone di rendere attuabile una medicina di tipo personalizzato.Si parla di ricerca traslazionale quando la ricerca pre-clinica riesce a produrre risultati

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 45-50

Page 48: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

46

rapidamente trasferibili all’attività clinica; la ricerca traslazionale, in altre parole, rappresenta l’integrazione tra l’attività di ricerca sperimentale e la pratica clinica dei medici chiamati alla gestione degli ammalati.

i protagonisti del progettoI protagonisti del progetto sono soggetti affetti da atrofia muscolare spinale (SMA), una patologia neuromuscolare ereditaria a trasmissione recessiva che colpisce in media 1/6000 – 1/8000 nuovi nati. La SMA è una patologia che si manifesta, sin dalla prima infanzia, con diverso grado di severità tra i soggetti colpiti ma è sempre e comunque fortemente invalidante quando non addirittura ad esito fatale per i piccoli affetti dalla forma più grave della malattia, la SMA di tipo I (Munsat and Davies, 1992; Zerres and Rudnick-Schöneborn, 1995).La causa della malattia è una mutazione genetica nota già dal 1995 (Lefebvre et al., 1995) e riguarda la perdita di funzionalità di entrambe le copie del gene SMN1 dell’individuo, sia la copia ereditata dalla madre che quella ereditata dal padre. La conseguenza della perdita di funzionalità dei geni SMN1 è la drastica riduzione di proteina SMN, la proteina di sopravvivenza dei motoneuroni, con una conseguente e progressiva perdita di motoneuroni alfa del midollo spinale. L’innervazione della muscolatura del tronco e degli arti dei piccoli affetti è sempre più deficitaria compromettendo non solo la deambulazione autonoma ma anche funzioni vitali, in un quadro di progressione temporale e gravità variabili.Un soggetto affetto da SMA può nascere quindi quando entrambi i genitori sono portatori sani di mutazione del gene SMN1, spesso ignari della loro condizione e del rischio riproduttivo della coppia (Fig.1). Le tecnologie oggi a disposizione consentono non solo la diagnosi molecolare di affetto ma anche l’identificazione, nella maggior parte dei casi, dei portatori di mutazione che risultano essere molto frequenti nella popolazione generale mondiale (circa 1/30 – 1/60 individui) (Feldkötter et al., 2002; Passon et al. 2009; Passon et al. 2010).

approcci terapeutici per la sMaLe tecnologie a disposizione, per quanto in rapido sviluppo e molto promettenti nella fase di sperimentazione pre-clinica, ossia su modelli animali della malattia, non riescono ancora a tracciare una via terapeutica efficace per questa grave malattia. Le numerose strategie terapeutiche che gli sperimentatori hanno messo in atto, da quelle farmacologiche alla terapia genica, mirano comunque a restituire ai soggetti affetti da SMA la proteina di sopravvivenza dei motoneuroni che negli affetti è presente in quantità insufficiente a garantire lo stato di salute.La proteina SMN residua, fondamentale per la sopravvivenza dei soggetti stessi colpiti dalla malattia, non è un residuo di produzione dei geni SMN1 mutati ma è prodotta con minore efficienza da un gene gemello di SMN1, indicato come gene SMN2 (Fig. 2). SMN2 è sempre presente nel genoma degli affetti da SMA e può esistere in un numero di copie multiple attenuando la gravità del fenotipo patologico grazie all’effetto additivo della quantità di proteina SMN che ciascuna copia genica SMN2 produce. È al gene SMN2 che si rivolge la gran parte dei tentativi terapeutici messi in campo per la SMA. L’intento è quello di stimolare questo gene a produrre quantità significativamente maggiori di proteina SMN in modo da compensare l’assenza funzionale del gene SMN1.

differenze funzionali dei geni smn2 Il gene SMN2 quindi è ad oggi protagonista indiscusso di gran parte degli approcci terapeutici messi in atto dai ricercatori, tuttavia, sia dati indiretti di letteratura sia dati prodotti nel laboratorio di Neurogenetica presso cui si svolge il progetto di ricerca traslazionale sulla SMA, dimostrano che le varie copie di geni SMN2 spesso non sono egualmente efficienti

Page 49: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

47

nel guidare la produzione di proteina SMN. Una ragione di questa diversità funzionale dei geni SMN2 può senza dubbio risiedere in varianti di sequenza del DNA di questi geni. A sostegno di questa ipotesi interviene immediatamente l’osservazione che è proprio la sostituzione di una singola base del DNA (citosina in timina) alla posizione +6 dell’esone n.7 dei geni SMN1 ed SMN2 a rendere ragione della grande differenza funzionale esistente tra i due: una sola copia di SMN1 determina uno stato di salute mentre 4-5 copie di SMN2 non sono in grado di farlo. Altri e sporadici report di letteratura identificano copie geniche SMN2 più efficienti di altre, sempre sulla base di cambiamenti di singole basi del DNA (Prior et al 2009).Una ipotesi di studio da cui muove questo progetto di ricerca è che la diversità funzionale dei geni SMN2 possa risultare poi anche in una diversa efficienza di risposta alle strategie di stimolazione terapeutica messe in campo dai ricercatori.

Fig. 1. Ereditarietà della SMA: una coppia di portatori di mutazione del gene SMN1 ha un rischio pari a ¼ di generare un figlio affetto da SMA. Un figlio sano di una coppia di portatori di mutazione ha un rischio pari a 2/3 di portare a sua volta la mutazione.

Fig. 2. I geni SMN1 ed SMN2: Il gene SMN1 è completamente non funzionante negli affetti da SMA. Circa il 90% di RNA messaggero per la proteina SMN completa è prodotto dal gene SMN1 mentre solo il 10% è prodotto dal gene SMN2.

Page 50: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

48

OBiettivO del prOGettO

Da quanto sopra esposto, è nostra convinzione che, una terapia della SMA rivolta alla stimolazione dei geni SMN2, perché risulti efficace non possa prescindere dal conoscere le specifiche varianti genetiche SMN2 di ciascun paziente e quindi, non possa prescindere dal personalizzare lo strumento terapeutico a queste varianti. Quanto appena detto significa mettere in campo sperimentazioni di farmacogenetica con i pazienti ed attuare una medicina molecolare e personalizzata a quello che è il background genetico specifico del paziente. Un primo passo per raggiungere questo obiettivo è quello di costruire una banca dati di sequenza dei geni SMN2 in una coorte adeguata di pazienti affetti da SMA, allo scopo di identificare e catalogare varianti geniche SMN2. Una tale banca dati permetterà di stratificare i pazienti SMA non solo sulla base del numero di copie SMN2 che sono presenti nel loro genoma ma anche sulla base delle specifiche varianti geniche SMN2 che posseggono e del livello di gravità del fenotipo patologico. Questa stratificazione dei pazienti è prerequisito necessario alla conduzione successiva di studi di farmacogenetica e di sperimentazione terapeutica.

prOcedUre e risUltAti

Allo scopo di costruire una banca dati di varianti genetiche SMN2, sono stati reclutati ad oggi 22 individui, 18 affetti da atrofia muscolare spinale, che nel genoma presentano quindi solo copie geniche SMN2 e 4 soggetti sani, genitori di affetti, che nel genoma presentano quindi sia copie geniche SMN2 che SMN1. Questi ultimi sono stati reclutati nella coorte per chiarire l’ereditarietà della patologia in 2 casi particolari, successivamente riportati.Dopo aver raccolto l’autorizzazione alla ricerca (consenso informato) dei pazienti partecipanti allo studio è stato prelevato un campione di sangue dal quale è stato estratto il DNA e selezionate, dall’intero genoma di ogni individuo, le porzioni d’interesse di questo progetto, ossia i geni SMN. Precisamente, per ogni campione di DNA è stata attuata una strategia di long-range PCR che amplifica un totale di 30000 basi di DNA nell’intorno dei geni SMN suddividendole in 3 frammenti parzialmente sovrapposti e grandi rispettivamente circa 16.000, 5.000 e 11.000 paia di basi. Per ogni soggetto è stata costruita quindi una library gene-specifica con metodologia Nextera (Marine et al., 2011). Le libreries totali dei 22 soggetti in analisi sono state riunite in rapporti equimolari, sequenziate con MiSeq (Illumina) e le sequenze sottoposte ad analisi bioinformatica presso i laboratori dei partner di progetto IGA ed IGA TS.Le reads restituite dal sequenziamento vengono allineate contro la sequenza dell’intero cromosoma 5 umano esistente in banche dati, esclusa la sequenza di SMN1 in modo da identificare, come obiettivo di progetto, le varianti di sequenza (SNP e indel) dei geni SMN2 degli individui in analisi. Il confronto con banche dati di riferimento come dbsnp137 e 1000 genomi consente di identificare ed annotare le varianti di sequenza genica SMN2. I risultati ad oggi ottenuti hanno dimostrato l’assoluta riproducibilità del metodo di sequenziamento di nuova generazione adoperato in questo progetto infatti, il DNA di due distinti soggetti è stato sottoposto a due procedure indipendenti di costruzione di libreries gene-specifiche e sequenziamento del DNA e, in entrambi i casi l’analisi delle repliche ha identificato uno stesso numero e tipologia di SNPs e indels. Inoltre, nei 22 soggetti analizzati sono stati identificati 103 SNPs totali di cui 21 mai descritti in precedenza (Fig.3) e la maggior parte di questi sono stati validati con una metodica qualitativa e quantitativa di Single Base Extension (SBE) messa a punto nell’ambito del progetto.

Page 51: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

49

L’analisi del pattern di sequenza dei geni SMN trasmessi da genitori sani a figli affetti ha permesso di chiarire due casi peculiari ed interessanti: i. in un caso la comparsa di una delezione ex novo del gene SMN1 paterno; ii. nell’altro caso l’assoluta identità di numero e di sequenza dei geni SMN2 di due fratelli, entrambi privi di geni SMN1 ma fenotipicamente discordanti (uno affetto e l’altro sano). Quest’ultimo caso suggerisce che la spiegazione della discordanza fenotipica dei due fratelli debba essere ricercata probabilmente in altri loci genici, diversi da SMN.Infine, due delle varianti identificate cadono in sequenze esoniche dei geni SMN2, sono varianti conservative e già riportate in banche dati ma per la loro peculiare distanza dai punti di giunzione esone-introne, potrebbero avere una potenziale influenza sullo splicing del trascritto primario del gene e quindi sulla proteina SMN che ne deriva. L’eventuale estrapolazione delle varianti alleliche SMN2 funzionalmente diverse riguardo alla produzione di proteine SMN potrà avvantaggiarsi in futuro sia di studi di associazione genotipo-fenotipo sia di studi di espressione genica sull’RNA dei pazienti già reclutati.Attualmente la coorte di soggetti analizzati è stata ampliata con i DNA di circa 100 soggetti SMA appartenenti alla coorte spagnola di affetti e gentilmente forniti per la realizzazione dello studio dal Dr. Eduardo Tizzano, Pediatra del Saint Pau Hospital di Barcellona.

Fig.3 Rappresentazione schematica del gene SMN2: le barre verticali rappresentano gli esoni, ossia le porzioni codificanti del gene. La posizione ed il numero degli SNPs (varianti di basi del DNA) ed indels (piccole inserzioni/delezioni) identificati sono stati indicati. In nero ed in alto il totale delle varianti; in verde ed in basso le nuove identificazioni.

Page 52: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

50

BiBliOGrAFiA

Feldkötter M, Schwarzer V, Wirth R, Wienker TF, Wirth B. Quantitative analyses of SMN1 and SMN2 based on real-time lightCycler PCR: fast and highly reliable carrier testing and prediction of severity of spinal muscular atrophy. Am J Hum Genet. 2002 Feb;70(2):358-68. Epub 2001 Dec 21.

Lefebvre S, Bürglen L, Reboullet S, Clermont O, Burlet P, Viollet L, Benichou B, Cruaud C, Millasseau P, Zeviani M, et al. Identification and characterization of a spinal muscular atrophy-determining gene. Cell. 1995 Jan 13;80(1):155-65.

Marine R, Polson SW, Ravel J, Hatfull G, Russell D, Sullivan M, Syed F, Dumas M, Wommack KE. Evaluation of a transposase protocol for rapid generation of shotgun high-throughput sequencing libraries from nanogram quantities of DNA. Appl Environ Microbiol. 2011 Nov;77(22):8071-9.

Munsat TL, Davies KE. International SMA consortium meeting. (26-28 June 1992, Bonn, Germany). Neuromuscul Disord. 1992;2(5-6):423-8.

Passon N, Pozzo F, Molinis C, Bregant E, Gellera C, Damante G, Lonigro RI. A simple multiplex real-time PCR methodology for the SMN1 gene copy number quantification.Genet Test Mol Biomarkers. 2009 Feb;13(1):37-42.

Passon N, Dubsky de Wittenau G, Jurman I, Radovic S, Bregant E, Molinis C, Damante G, Lonigro IR. Quick MLPA test for quantification of SMN1 and SMN2 copy numbers. Mol Cell Probes. 2010 Oct;24(5):310-4.

Prior TW, Krainer AR, Hua Y, Swoboda KJ, Snyder PC, Bridgeman SJ, Burghes AH, Kissel JT. A positive modifier of spinal muscular atrophy in the SMN2 gene Am J Hum Genet. 2009 Sep;85(3):408-13.

Zerres K, Rudnik-Schöneborn S. Natural history in proximal spinal muscular atrophy. Clinical analysis of 445 patients and suggestions for a modification of existing classifications. Arch Neurol. 1995 May;52(5):518-23.

Page 53: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata
Page 54: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

52

Page 55: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

53

“blood transcrIptoMIcs”: la trascrIttoMIca da sanGue per l’IdentIfIcazIone dI bIoMarcatorI

MolecolarI dI MalattIa raffaella calligaris1, mihaela Banica2, sara Finaurini1, paola roncaglia1, christina vlachouli1, helena krmac1, Maria Bertuzzi1, lucia antonutti2,

tatiana cattaruzza2, alberto cucca2, Devis Pascut4, saveria lory crocè3, claudio tiribelli4, Gilberto pizzolato2, stefano Gustincich1

1 Scuola Internazionale Superiore di Studi Avanzati (SISSA), Laboratorio di Neurogenomica funzionale, Trieste.

2 Azienda Ospedaliero-Universitaria Ospedali Riuniti di Trieste, Clinica Neurologica, Trieste.3 Azienda Ospedaliero-Universitaria Ospedali Riuniti di Trieste, Clinica Patologie del Fegato, Trieste.

4 Fondazione Italiana Fegato, Trieste.

abstract — La “Blood Transcriptomics” è l’analisi del profilo di espressione genica (trascrittomica) delle cellule del sangue mediante la tecnologia di microarray. Rappresenta un approccio altamente innovativo per identificare “gene signatures” (firme molecolari di espressione genica) che possano rappresentare dei biomarcatori (indicatori biologici) la cui espressione rifletta in modo oggettivo eventi fisiologici e patologici del corpo umano. Pur essendo in fase sperimentale, l’applicazione di “gene signatures” sta contribuendo in maniera rilevante a una migliore diagnosi e classificazione sia delle malattie oncologiche che di quelle neurodegenerative.Il progetto, oggetto della relazione, riguarda l’analisi dell’espressione del profilo genico di campioni di sangue periferico di pazienti affetti dalla malattia di Parkinson. I risultati descrivono la messa a punto di un protocollo di raccolta di dati clinici e campioni biologici dei pazienti e la successiva ottimizzazione della tecnologia di analisi di espressione genica mediante la piattaforma Affymetrix. Questo studio rappresenta la prima fase di un progetto che si propone una migliore comprensione e definizione dei meccanismi molecolari alla base della malattia di Parkinson e la messa a punto di un kit diagnostico.

_____________________________________________________________________

intrOdUziOne

Le nuove strategie per lo sviluppo della medicina personalizzata necessitano di un sistema di monitoraggio molecolare non invasivo capace di integrare fattori quali l’età, il sesso, la genetica, la comorbidità e l’ambiente. La “Blood Transcriptomics” è l’analisi del profilo di espressione genica (trascrittomica) delle cellule del sangue mediante la tecnologia di microarray. Valutando contemporaneamente il valore di espressione di migliaia di geni, questa tecnologia permette una visione globale dello stato del sistema biologico preso in esame e rappresenta uno strumento di notevoli potenzialità negli studi di medicina traslazionale mirati al trasferimento delle conoscenze scientifiche e metodologiche acquisite dalla ricerca biomedica alla clinica.

verso la medicina personalizzata in Friuli venezia Giulia: risultati ed esperienze del progetto d.nAmicA pp. 53-60

Page 56: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

54

La gran parte degli studi di trascrittomica in medicina si basa sull’analisi di biopsie tessutali. Questo però non è fattibile nel caso di malattie i cui gli organi bersaglio non siano di facile accesso come ad es. nel caso di malattie neurodegenerative, polmonari, cardiovascolari, etc. Il campione di sangue è facilmente prelevabile in modo clinicamente non invasivo ed è ampiamente utilizzato nella routine clinica. Vari studi hanno dimostrato che il profilo d’espressione nel sangue possa riflettere gli eventi degli organi bersaglio della malattia. In questo contesto, la “Blood Transcriptomics”, è stata recentemente proposta come approccio altamente innovativo per identificare “gene signatures” che possano rappresentare dei biomarcatori (indicatori biologici) la cui espressione rifletta in modo oggettivo eventi fisiologici e patologici del corpo umano (Fahn H and Hedge PS, 2005). Pur essendo in fase sperimentale, l’applicazione di gene signatures sta contribuendo in maniera rilevante ad una migliore diagnosi, classificazione delle malattie, prognosi e nonchè ad un approccio terapeutico personalizzzato al paziente (Scherzer CR, 2009).

razIonale

L’espressione del profilo genico di campioni di sangue è un approcio innovativo per la scoperta di gene signatures/biomarkers in particolar modo nel caso di malattie neurodegenerative croniche come la malattia di Parkinson (PD) dove l’organo bersaglio della malattia (i neuroni della Substantia Nigra) è in un sito non accessibile per lo studio diretto in vivo.La malattia di PD è una malattia neurodegenerativa frequente e invalidante, per la quale esiste solamente la terapia sintomatica. È la seconda malattia neurodegenerativa più diffusa con circa 200.000 malati in Italia e 10.000 nuovi casi l’anno. È particolarmente diffusa in Friuli Venezia Giulia vista l’alta età media della popolazione. Sebbene l’eziologia della malattia non sia ancora del tutto chiara e studi su geni mutati nei casi familiari abbiano contributo in maniera importante alle nostre conoscenze attuali (Klein C and Schlossmacher MG, 2006), il PD è una malattia complessa dove sia fattori genetici che ambientali contribuiscono alla sua insorgenza in modo non ancora chiaro (Bain PG, 2009). Si manifesta con quattro sintomi caratteristici: tremore, rigidità, bradicinesia e instabilità posturale. Viene generalmente diagnosticata sulla base del rilievo di due dei quattro sintomi cardine e sulla risposta al trattamento farmacologico. La malattia presenta una lunga fase presintomatica in cui avviene la maggiore perdita dei neuroni dopaminergici della Substantia Nigra. La diagnosi, essendo basata sul riconoscimento dei sintomi motori, è spesso poco tempestiva e presenta sensibili percentuali di errore. Sintomi di tipo diverso possono precedere di dieci anni la comparsa dei disturbi motori rendendo estremamente difficile il riconoscimento precoce della malattia (Tolosa E et al., 2009). L’identificazione di biomarcatori della malattia potrebbe rivelarsi di notevole importanza per la diagnosi in pazienti presintomatici e per il monitoraggio degli effetti di nuovi trattamenti terapeutici. Questa necessità risulta particolarmente urgente considerando il progressivo invecchiamento della popolazione mondiale e dal fatto che le malattie croniche non contagiose, come il Parkinson, rappresentino un peso maggiore in termini di costi economici e sociali.

OBiettivi

Obiettivo principale di questo studio è stato quello di identificare, disegnare ed ottimizzare un protocollo di studio standardizzato per l’analisi dell’espressione genica da sangue, utilizzando la tecnologia dei microarray. In particolare si sono ricercati potenziali

Page 57: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

55

biomarcatori genomici quali trascritti candidati per la comprensione della patogenesi molecolare della malattia di Parkinson in campioni di sangue periferico di pazienti affetti dalla patologia. Lo studio è stato strutturato in modo tale da potere essere applicato in futuro anche ad altre malattie multifattoriali e complesse (e.g. malattia di Alzheimer, malattie polmonari, malattie cardiovascolari, etc.) e per essere utilizzato da altri centri scientifico-clinici per contribuire a definire una terapia di prevenzione o per la valutazione degli effetti dei farmaci durante i trials clinici.

risUltAti

L’ obiettivo è stato raggiunto mediante lo sviluppo delle seguenti fasi.

1. definizione delle caratteristiche cliniche dei soggetti per un arruolamento selettivo nello studio. In questo studio si è posto particolare attenzione a comporre un adeguato disegno clinico-sperimentale e all’arruolamento di pazienti con caratteristiche ben definite e omogenee. I malati erano agli stadi iniziali della malattia e senza alcuna terapia farmacologica in atto (pazienti de novo). La visita neurologica specialistica ha esaminato le disfunzioni motorie utilizzando le scale di valutazione UPDRS−III and Hohen and Yahr scale e lo stato cognitivo basandosi sul Mini Mental State Examination secondo le guide internazionali per la diagnosi di PD (Reichmann H, 2010). Lo stato funzionale presinaptico delle terminazioni nervose nigro-striatali è stato visualizzato mediante tecniche di imaging (CT/MRI and 123I−DaTSCAN SPECT) evidenziando il processo degenerativo in atto dei neuroni dopaminergici. A seguito di visita neurologica, i dati anamnestici, famigliari e clinici sono stati raccolti in un database interno presso il dipartimento di Neurologia dell’ospedale di Cattinara.I volontari sono stati scelti di età e sesso in modo da comporre un gruppo omogeneo per un corretto paragone dei dati nelle analisi successive. Ai pazienti e controlli è stato raccolto un campione di sangue per le analisi sperimentali genomiche. La raccolta dei dati clinici e dei campioni biologici dei soggetti partecipanti allo studio è avvenuta a seguito del consenso informato dei volontari.È stato cosi definito un protocollo di DAY HOSPITAL specifico per la raccolta di dati clinici e di neuroimaging e allo stesso tempo di campioni biologici.

2. modalità di prelievo, raccolta, spedizione e conservazione del campione di sangue.Il campione di sangue è stato raccolto a digiuno del paziente, in una fascia oraria compresa tra le 8.00 e le 10.00 di mattina, nei tubi collettori PAXgene Blood RNA tubes (Preanalytix®, Qiagen & Becton Dickinson, Hombrechtikon, Switzerland) seguendo le indicazioni suggerite dal produttore. Si raccolgono 2.5 ml di campione di sangue per ciascun tubo collettore. Il campione è stato codificato mediante indicazioni anonime ma necessarie all’identificazione univoca del paziente per garantire la tutela della privacy. Il campione è stato consegnato al laboratorio di Neurogenomica Funzionale presso la SISSA. I campioni sono stati mantenuti a temperatura ambiente per almeno 2h, quindi raffreddati a +4°C e congelati -20°C nell’arco della giornata. I campioni sono stati conservati a -80°C sino al processamento per l’estrazione dell’RNA.

3. estrazione e valutazione della quantità e della qualità di rnA dal campione di sangue e conservazione in una biobanca.Il campione è stato scongelato a temperatura ambiente e l’RNA totale è stato estratto utilizzando i reagenti PAXgene™ Blood RNA kit (Qiagen, GmBH, Germany). Una modifica del protocollo di estrazione, secondo le indicazioni riportate da Fan H and Hegde PS

Page 58: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

56

(2005), è stata apportata per la purificazione in contemporanea dei microRNA. La quantità dell’RNA è stata valutata misurando la concentrazione allo spettrofotometro NanoDrop (NanoDrop Technologies), mentre la qualità e l’integrità del campione è stata definta mediante l’uso del 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA). Si sono definiti i seguenti parametri di qualità per l’utilizzo di RNA: RNA integrity number (RIN) ≥ 8, A260/280=1.9−2.0. Il campione estratto è stato conservato -80°C per usi futuri e per costituire una biobanca. Esperimenti mirati a verificare a) la riproducibilità e robustezza del protocollo, b) l’assenza di variabilità del campione di RNA estratto da campioni appena prelavati o congelati e c) la variabilità intra- e inter-individuale sono stati realizzati; si confermano i criteri richiesti come descritto da Fan H et Hegde PS (2005) e Wang J et al. (2004).

In breve, è stato raccolto il campione di sangue in sei PAXgene Blood RNA tubes per ogni singolo donatore sano. L’estrazione dell’RNA è stata effettuata a gruppi di 2 campioni per volta subito dopo il breve periodo di conservazione a +4°C, dopo il congelamento a -20°C e dopo il periodo di conservazione a -80°C. I campioni sono stati processati e valutati come descritto qui sopra. Tipicamente la resa di RNA è stata di 3-7 mg /2.5 ml di campione di sangue e questo variava a seconda del donatore e tra i campioni dello stesso donatore. Nella Figura 1 si visualizza un immagine rappresentativa dell’aspetto e della qualità del campione di RNA che si ottiene seguendo la procedura descritta. I dati visualizzati nel grafico di degradazione dell’RNA (Figura 2) evidenziano l’alta qualità del target di ibridizzazione preparato da campioni amplificati secondo il protocollo NuGEN (vedi descrizione nel paragrafo successivo) dopo ibridizzazione sui microarray HG−U133A 2.0 (Affymetrix).

4. definizione di un protocollo standardizzato per la preparazione del target da analizzare sui microarray in ordine di ottenere profili di espressione genica accurati e riproducibili da campioni di sangue.L’analsi di espressione genica di campioni di RNA isolati da sangue periferico totale richiede la minimizzazione di artefatti causati dall’abbondanza dei trascitti delle globine a discapito dell’etergogenità di trascritti presenti nell’RNA totale. Inoltre, è consigliabile utilizzare un protocollo semplice che richieda una quantità mininima di materiale iniziale. Si sono confrontati 3 diversi protocolli per la preparazione dei target di ibridizzazione per le analisi sui microarray di campioni di sangue estratti dai PAXgene Blood RNA tubes. I campioni di RNA di un singolo donatore sono stati suddivisi in 3 gruppi, ogni gruppo comprendeva 2 campioni, e sono stati processati come descritto qui di seguito. La quantità di RNA totale utilizzata è stata definita in base al protocollo utilizzato.Metodo 1: Affymetrix one−cycle cDNAsynthesis/Affymetrix IVT (Affymetrix). Questo metodo richiede procedure standard di laboratorio per l’amplificazione e la marcatura del RNA totale. La sintesi del target è stata eseguita secondo le indicazioni riportate nel Affymetrix GeneChip Expression Analysis Technical Manual, rev. 5 apportando leggere modifiche. Si sono utilizzati 5 microg. di RNA totale come input, l’mRNA è stato amplificato e marcato in 2 stadi. Nel primo stadio, l’mRNA è convertito in cDNA a doppio-filamento, purificato mediante estrazione fenolo-cloroformio-isoamilalcool e precipitato con etanolo. In un secondo stadio, il cRNA è amplificato e biotinilato (target) mediante trascrizione in vitro (IVT). I nucleotidi non incorporati sono rimossi mediante purificazione in colonna ed il target marcato è eluito in acqua utilizzando RNeasy Mini kit (Qiagen).Metodo 2: Illumina probe synthesis protocol (Ambion). Questo protocollo assicura risultati sensibili e riproducibili utilizzando un singolo giro di polimerizzazione con l’enzima T7 ed utilizzando 500 ng di RNA totale. Il protocollo di marcatura del campione è secondo il protocollo Eberwine e si utilizza il kit TotalPrep RNA Amplification Illumina.Metodo 3: Ovationtm Whole Blood Solution (NuGEN). Il metodo Ovationtm Whole Blood Solution (NuGEN Technologies, Inc ,San Carlos, CA, USA) comprende l’utilizzo di 3

Page 59: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

57

prodotti: Ovationtm RNA Amplification System V2, Ovationtm WB Reagent e FL−Ovationtm cDNA Biotin Module V2. I target di cDNA biotinilato sono preparati secondo le indicazioni del produttore. Il cDNA a doppio-filamento è sintetizzato a partire da 50 ng di RNA totale, segue l’amplificazione lineare e isotermale (SPIA Amplificationtm) per produrre un cDNA a singolo-filamento (target). Il target frammentato e marcato è purificato ed eluito in acqua utilizzando RNeasy Mini kit (Qiagen).I targets preparati con i 3 metodi, descritti qui sopra, sono stati ibridizzati (45°C for

Fig. 1. Immagine rappresentativa di un campione di RNA totale isolato da campione di sangue periferico e processato per la preparazione del target per le analisi di espressione genica. Nell’ immagine del gel si visualizza: il peso molecolare di riferimento (L), RNA totale commerciale della CLONTECH con RIN=8, come campione di riferimento (1), RNA totale con RIN=8.8 purificato secondo il protocollo descritto nello studio (2), amplificazione e purificazione del cDNA (3), frammentazione e marcatura del cDNA (4). I rispettivi elettroferogrammi sono riportati nella figura. Il valore d’integrità dell’RNA è indicato come RNA Integrity Number (RIN). La posizione del rRNA 18S and 28S sono indicate dalle frecce nere.

Fig. 2. Grafico di degradazione dell’RNA dei campioni amplificati dopo ibridizzazione sui microarry HG-U133A 2.0.Le intensità del signale di ogni probe sets dal 5’ al 3’ sono rappresentate per tutti i probe sets presenti su ogni microarray. L’andamento delle linee è indicativo di eventuali variazioni al 3’ di ogni metodo di preparazione. Le linee sono leggermente spostate e ridotte per minimizzare la sovrapposizione.

Page 60: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

58

16−18hrs) sui microarray HG−U133A 2.0 (Affymetrix, Santa Clara, CA) seguendo le istruzioni del produttore. I microarray vengono poi sottoposti a lavaggio, colorazione e scansione; l’intensità è acquisita mediante HP Gene Array Scanner (Affymetrix). La quantità di detection calls (Presenti, Marginali or Assenti), ossia di sonde corrispondenti a trascritti, presenti sul Affymetrix, vengono calcolate utilizzando l’algoritmo Affymetrix MAS5. Ogni metodo di amplificazione è stato testato in duplicato.

Il diagramma di Venn (Figura 3) evidenzia la sovrapposizione dei probe sets Affymetrix con detection call di “Presente” secondo i 3 metodi di amplificazione. I dati si riferiscono ad un unico replicato e sono una buona rappresentazione dei 2 replicati. Si sono identificati 3553 probe sets Presenti utilizzando in modo riproducibile il metodo NuGEN (Ovationtm Whole Blood Solution). Si conclude quindi che sebbene il protocollo NuGEN richieda la quantità minore di RNA totale, questi identifica una significativa quantità di trascritti rispetto gli altri 2 metodi presi in considerazione (~29% e 37% rispettivamente con il protocollo Illumina e Affymetrix). Il protocollo NuGEN è stato quindi scelto come protocollo di riferimento.

5. confronto dei dati ottenuti comparati con quelli di letteratura.Recentemente uno studio ha analizzato il profilo di espressione genica di campioni di sangue da malati di Parkinson (Scherzer CR et al., 2007). Per valutare le differenze tra i dati di questo studio pubblicato (dati disponibili in GEO, Scherzer’s data) ed i dati prodotti con il protocollo definito in questo progetto, si sono confrontati i “detection calls” e le intensità tra i campioni di controllo. Si è deciso di paragonare tra loro i campioni di controllo per evitare possibili differenze dovute a diverso stadio di malattia o terapia in atto. Entrambi i set sono bilanciati per quanto riguarda il sesso ed età dei partecipanti allo studio. Le analisi di intensità delle sonde hanno evidenziano che i dati del nostro studio sono più omogenei e con una maggiore intensità (Figura 4.A). Questo è importante per 2 motivi: 1) dati di espressione di probes a bassa-intensità sono da considerarsi di minore affidabilità poichè la variabilità tecnica può avere notevole peso nella loro determinazione; 2) un range ampio di intensità di espressione indica che lievi differenze nella espressione genica possano essere facilmente osservate

Fig. 3. Venn diagram dei probe sets identificati come Present calls nei 3 metodi di amplificazione utilizzati (Affymetrix vs Illumina vs NuGEN). Il protocollo NuGEN ha dimostrato le migliori performance ed è stato scelto per lo studio.

Page 61: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

59

con il nostro protocollo. La maggior sensitività del nostro protocollo è anche evidenziata dalle analisi di presenza delle “probe detection calls”, ossia una misura di quanto un trascritto sia veramente presente (Presente) o no (Assente). I dati dei campioni analizzati in questo studio presentano circa il 70% di probes come Presenti sui microarray rispetto al 26% dei dati del lavoro già pubblicato (Figure 4.B). Si conclude che l’informazione trascrittomica ottenuta con il protocollo messo a punto è decisamente superiore (di quasi 3 volte maggiore) a quanto già pubblicato.

Fig. 4. Qualità del protocollo messo a punto in questo progetto comparato con la letteratura. A. Box plots delle intensità (prima della normalizzazione a sinistra e dopo la normalizzazione a destra) dei probes dei microarray dei campioni di soggetti sani di controllo dello studio di Scherzer CR et al. (2007) rispetto ai nostri. B. Venn diagram dei probe sets identificati come present calls nei 2 data sets.

Le intensità dei probe sono indicate sulla sinistra di ogni pannello, scala log2. I dati di Scherzer CR et al. (2007) sono stati scaricati da GeneExpression Omnibus (GEO) (http://www.ncbi.nlm.nih.gov /geo/). Dopo l’ibridizzazione, i valori di intensità sono stati computati utilizzano Affymetrix GeneChip Operating Software (GCOS). Le analisi di espressione genica sono state eseguite utilizzano i pacchetti software di BioConductor (http://www.bioconductor.org/).

cOnclUsiOni

Possiamo riassumere i principali risultati di questo lavoro sperimentale nei punti che seguono.

1. È stato definito un protocollo per arruolare pazienti e raccogliere in modo oggettivo dati

clinici, di neuroimaging e campioni biologici in un regime da Day Hospital.2. È stato definito un protocollo e metodologie atte ad essere utilizzate per creare una

applicazione web per il salvataggio elettronico di dati clinici e genomici e per facilitarne l’integrazione.

3. Sono state ottimizzate e standardizzate le procedure per la raccolta, spedizione e processamento di campioni di sangue e di purificazione di RNA totale e microRNA.

4. È stata costituita una biobanca di campioni di sangue di RNA totale e di microRNA da campioni di pazienti malati di PD.

Page 62: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

60

5. È stata definita una flow chart di metodologia e di analisi di espressione genica utilizzando la piattaforma Affymetrix.

6. È stato dimostrato che la flow chart proposta permette di ottenere livelli di informazione di trascrittomica superiori a quanto già pubblicato anticipando metodologie utili per l’identificazione di “gene signatures” che definiscano la malattia di PD o che identifichino una espressione genica dipendente da trattamento farmacologico.

Questi risultati sono importanti per lo sviluppo di una medicina personalizzata per le malattie neurodegenerative.

reFerenze

Bain PG. 2009. Changing concepts in Parkinson disease: moving beyond the decade of the brain. Neurology. 72(6):579.

Fan H and Hegde PS. 2005. The transcriptome in blood: challenges and solutions for robust expression profiling. Curr. Mol. Med, 5, 3-10.

Klein C, Schlossmacher MG. 2006. The genetics of Parkinson disease: Implications for neurological care. Nat Clin Pract Neurol. 2(3):136-46.

Reichmann H. 2010. Clinical criteria for the diagnosis of Parkinson’s disease. Neurodegener Dis. 7(5):284-90.

Scherzer CR, Eklund, AC, Morse LJ, Liao Z, et al.. 2007. Molecular markers of early Parkinson’s disease based on gene expression in blood. Proc. Natl. Acad. Sci. U.S.A, 104, 955-960.

Scherzer CR. 2009. Chipping away at diagnostics for neurodegenerative diseases. Neurobiol Dis. 35(2):148-56.

Sharma S, Moon CS, Khogali A, Haidous A, et al.. 2013. Biomarkers in Parkinson’s disease (recent update). Neurochem. Int. 63 (3):201-29.

Tolosa E, Gaig C, Santamaría J, Compta Y. 2009. Diagnosis and the premotor phase of Parkinson disease. Neurology 17; 72.

Wang J, Robinson JF, Khan HM, Carter DE, et al.. 2004. Optimizing RNA extraction yield from whole blood for microarray gene expression analysis. Clin Biochem. 37, 741−744.

Page 63: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata
Page 64: D.NAMICA - Piattaforma per la medicina molecolare e personalizzata

ww

w.dnam

ica.it