Alla ricerca di segni di pressione selettiva in Homo Sapiens

Post on 23-Feb-2016

58 views 0 download

description

Alla ricerca di segni di pressione selettiva in Homo Sapiens. Sergio Cocozza Dipartimento di Biologia e Patologia Cellulare e Molecolare Università “Federico II” Napoli. Gruppo Interdipartimentale Bioinformatica e Biologia Computazionale. “Niente in Biologia è di senso - PowerPoint PPT Presentation

Transcript of Alla ricerca di segni di pressione selettiva in Homo Sapiens

Alla ricerca di segni di pressione selettiva in Homo Sapiens

Sergio CocozzaDipartimento di Biologia e Patologia Cellulare e Molecolare

Università “Federico II”

Napoli

Gruppo Interdipartimentale Bioinformatica e Biologia Computazionale

“Niente in Biologia è di senso se non alla luce dell’Evoluzione”

Theodosius Dobzhansky (1900-1975)

“Niente in Biologia è di senso se non alla luce dell’Evoluzione”

Theodosius Dobzhansky (1900-1975)

ed in Medicina

Se vuole guarire deve smettere di fumare. Il fumo fa venire il

cancro... fa male alla circolazione ... ecc ecc

Un problema “pratico”

Se vuole guarire deve smettere di fumare. Il fumo fa venire il

cancro... fa male alla circolazione ... ecc ecc

Sciocchezze !Mio nonno è morto a

100 anni fumando sigari toscani !

Un problema “pratico”

gene b

gene d

ambiente y

ambiente x

gene a

gene c

100

90

80

70

60

50

40

30

20

10

0

100

90

80

70

60

50

40

30

20

10

0

Malattie Multifattoriali

gene b

gene d

ambiente y

ambiente x

gene a

gene c

100

90

80

70

60

50

40

30

20

10

0

100

90

80

70

60

50

40

30

20

10

0

?

Varianti rare e varianti frequenti: chi è il colpevole ?

Teorie a confronto

Alta penetranza (monogenia)

Bassa penetranza (poligenia)Bassa penetranza

La maggior parte delle mutazioni che causano malattie complesse sono avvenute recentemente, dopo la divergenza delle popolazioni. La conseguenza è l’attesa di una forte eterogeneità nei geni di suscettibilità per le malattie complesse

Common Disease/Rare Allele (CD/RA)

Varianti alleliche esistenti prima della dispersione degli umani sulla terra o varianti alleliche sottoposte a pressione selettiva rappresentano una proporzione significativa degli alleli di suscettibilità per le malattie complesse. La conseguenza è l’attesa di una minore eterogeneità nei geni di suscettibilità per le malattie complesse

Common Disease/Common Variant (CD/CV)

Pressione selettiva: adattamento e malattia ?

Ambiente

Genoma

?

Adattamento Malattia

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Genotipo “frugale”Accumula peggio i grassi

Accumula meglio i grassi

Evolution in Healthand

Medicine

Sackler Colloquium

PNAS January 26, 2010; 107

Strumenti per lo studio della pressione selettiva

Grado di differenziazione genetica delle popolazioni umane (Fst)

Omozigosità estesa degli aplotipi (iHS)

Normale grado di differenziazione delle popolazioni (deriva genica)

Più alto grado di differenziazione delle popolazioni

Più basso grado di differenziazione delle popolazioni

Fst

FST misura le differenze nelle frequenze alleliche tra popolazioni diverse. E' un valore che varia da 0 = nessuna differenza a 1 = massima differenza. E' considerata una delle possibili misure di pressione selettiva

iHS

Haplotype A

Haplotype B

Haplotype C

Haplotype D

Recent Positive Selection

iHS

Since in neutral models, low frequency alleles are generally younger and are associated with longer haplotypes than higher frequency alleles, we adjust the unstandardized iHS to obtain our final statistic which has mean 0 and variance 1 regardless of allele frequency at the core SNP:

The test begins with the EHH (extended haplotype homozygosity) statistic proposed by Sabeti et al.. The EHH measures the decay of identity, as a function of distance, of haplotypes that carry a specified “core” allele at one end. For each allele, haplotype homozygosity starts at 1, and decays to 0 with increasing distance from the core sitein plots of EHH versus distance, the area under the EHH curve will usually be much greater for a selected allele than for a neutral allele. This integrated EHH (iHH) (summed over both directions away from the core SNP) will be denoted iHHA or iHHD, depending on whether it is computed with respect to the ancestral or derived core allele. When the rate of EHH decay is similar on the ancestral and derived alleles, iHHA/iHHD ≈ 1, and hence the unstandardized iHS is ≈ 0

Scopi del progetto

Cercare segni di pressione selettiva nella specie Homo Sapiens e possibili collegamenti con le patologie umane Studio n.1 : Ricerca genome-wide di geni con segni

di pressione selettiva e loro caratterizzazione Studio n.2 : Ricerca genome-wide di geni candidati

ad essere sotto una specifica pressione selettiva (legata alla latitudine) e loro caratterizzazione

Scopi del progetto

Cercare segni di pressione selettiva nella specie Homo Sapiens e possibili collegamenti con le patologie umane Studio n.1 : Ricerca genome-wide di geni con segni

di pressione selettiva e loro caratterizzazione Studio n.2 : Ricerca genome-wide di geni candidati

ad essere sotto una specifica pressione selettiva (legata alla latitudine) e loro caratterizzazione

Nature 449:851 (2007)

Frequenze alleliche di circa 4,000,000 SNP di circa 500 individui da tre differenti gruppi etnici[HapMap Public Release #27 (merged II+III)]

Studio n.1 Data set

Metodi Dati addizionali sulle SNP (posizione fisica, associazione SNP-

gene furono ottenuti da dbSNP (build 129) I dati di HAPMAP e dbSNP furono fusi in un database locale

MySQL attraverso un set di script Perl Furono escluse dall'analisi SNP che fossero risultate non

campionate o non polimorfiche in tutte le tre popolazioni. Furono inoltre escluse le SNP con una frequenza dell'allele minore < 5% in tutti le tre popolazioni. Dopo tale selezione il campione conteneva 2.125.440 SNP

Il calcolo dell'Fst fu effettuato con uno script utilizzando la formula di Wright (con correzione di Weir per la numerosità)

Per assegnare un valore di Fst ad un determinato gene fu usato il massimo valore trovato tra le SNP associate a quel gene

Distribuzione dei valori di Fst da noi calcolati lungo i cromosomi

Autocorrelazione

L'autocorrelazione è stata calcolata per ogni cromosoma, per ogni coppia di SNP separate da un fissato numero di SNP intermedie. La linea nera mostra il valore medio (+ 2 SE) delle correlazioni sugli autosomi. La linea rossa mostra le correlazioni delle SNP sul cromosoma X

Risultato:

Il segnale non è distribuito in maniera randomiana.

Ljung-Box test p < 10 - 16

Distribuzione Fst tra i cromosomi

Risultato

I valori di Fst sono distribuiti differentemente tra gli

autosomi e gli eterocromosomi (p < 10-16)

Per ogni cromosoma è mostrato il box-plot dei valori di Fst. Il rettangolo è delimitato dal primo e dal terzo quartile e diviso al suo interno dalla mediana. I segmenti (i "baffi") sono delimitati dal minimo e dal massimo dei valori. Gli estremi dell'incisura rappresentano il 95% di intervallo di confidenza della mediana.

Commento

La differenza tra eterocromosomi e autosomi potrebbe essere dovuta a: Campione effettivo di popolazione più piccolo (¾

per X e ¼ per Y rispetto agli autosomi) Diversa frequenza di ricombinazione Diversa pressione selettiva tra maschi e femmine

Comparazione con altre misure di pressione selettiva: Dn/Ds ratio

Esistono altri metodi per studiare la pressione selettiva

Alcuni di essi si basano sull'analisi comparativa di differenti specie (misura interspecie)

Il metodo Dn/Ds valuta il rapporto tra mutazioni sinonime e non sinonime

Un rapporto alto indica selezione positiva

Variabilità intraspecie (Fst) vs Variabilità interspecie (Dn/Ds)

Risultato

I geni con segni di pressione selettiva

interspecie (Dn/Ds > 1) mostrano un valori medi di Fst significativamente

più bassi (p < 0.001)

I geni sono stati raggruppati in accordo con l'evidenza di selezione positiva nell'analisi di 6 specie di mammifero (Kosiol et al. 2008 Plos Genetics). Le barre verticali rappresentano il 95% di intervallo di confidenza)

Gene Set Enrichment Analysis GSEA

L'idea chiave di GSEA è quella di valutare l'arrichhimento di una lista di geni non attraverso la valutazione di singoli geni outliers ma attraverso quella di set di geni funzionalmente collegati

Dal punto di vista statistico GSEA limita i danni della correzione da test multiplo

GSEA è usata comunemente nell'analisi di array. Per la prima volta ne abbiamo proposto un uso per l'analisi della funzione dei geni in base al loro valore di Fst

Pathways (KEGG ) arricchite per geni con valori di Fst statisticamente diversi dalla

mediaPathways arricchite per geni con alto FST Axon guidance (FDR<0.001) Focal adhesion (FDR 0.008) ECM receptor interaction (FDR 0.009) Regulation of actin cytoskeleton (FDR 0.010) Adherens junction (FDR 0.010) Calcium signaling pathway (FDR 0.010)Pathways arricchite per geni con basso FST Antigen processing and presentation (FDR

0.001)

Fst e malattie complesse

RisultatoI geni che sono stati

associati in precedenti studi con malattie

complesse mostravano mediamente un valore

di Fst più alto dei restanti

(p < 0.001, empirical p 0.0005).

Geni trovati positivamente associati con malattie complesse in accordo col Genetic Association Database, furono paragonati ai restanti. Le barre verticali rappresentano il 95% di intervallo di confidenza.

Fst per classi di malattie

Scopi del progetto

Cercare segni di pressione selettiva nella specie Homo Sapiens e possibili collegamenti con le patologie umane Studio n.1 : Ricerca genome-wide di geni con segni

di pressione selettiva e loro caratterizzazione Studio n.2 : Ricerca genome-wide di geni candidati

ad essere sotto una specifica pressione selettiva (legata alla latitudine) e loro caratterizzazione

Perchè latitudine: Out of Africa

Effetti legati alla latitudine

Esposizione ai raggi solari (quantità e ritmo)

Clima e temperatura Risorse alimentari

Colore della pelle Statura, dimensioni e

forma del corpo Alcune caratteristiche

dello splancnocranio (ad esempio larghezza delle narici)

Cosa cambia Adattamenti noti

Sole, vitamina D, rachitismo

Vitamina D

Il colore della pelle

Principali malattie umane riportate in letteratura come legate alla latitudine

Cancro (296) Ipertensione (50) Malattie del SNC (Parkinson, Alzheimer,

Schizofrenia, Sclerosi multipla) (164) Diabete tipo 1 (60)

Prevalenza cancro

Ranges for TuttibutskinMeanM e a n s

2 1 5 to 3 5 8 (4 4 )1 6 0 to 2 1 5 (4 0 )1 2 3 to 1 6 0 (3 9 )7 6 to 1 2 3 (4 7 )

C o p y rig h t re s tric tio n s m a y a p p ly.

K in n e y, D . K . e t a l. S c h izo p h r B u ll 2 0 0 9 3 5 :5 8 2-59 5; d o i:1 0 .1 093 /sch bul/s bp 023

Schizophrenia Prevalence and Latitude by Continent and Infant M ortality

Frequenze alleliche di 660.918 SNP di 1043 individui da 52 differenti gruppi etnici[HGDP-CEPH HUMAN GENOME DIVERSITY PANEL]

Studio n.2 Data set

Costruzione di una lista di geni con alto Fst e con alta correlazione con la latitudine

Fst

Alto

Basso

Correlazione con latitudine

Alta

Bassa

Latitude Related Genes

(LRG)

10% 10%

Lista arricchita per geni sotto probabile pressione selettiva (alto Fst) latitudine dipendente (alta correlazione)

Risultati: Localizzazione tissutale

Tissue Genes LRG count (%)

p-value*

Brain 683 (56.6%) 3E-18Amygdala 112 (9.3%) 8E-6Thalamus 76 (6.3%) 1.4E-4

Latitude Related Genes

(LRG)

Risultati: classi funzionali (Gene Ontology)

Name Sub Ontology

Marginal mean (Min-

Max)

Genes LRG

count

Total Count

Synapse (GO:0045202)

CC 0.998 (0.980 - 1)

60 351

Neuropetide signaling pathway (GO:0007218)

BP 0.793 (0.764 – 0.828)

13 86

Cell morphogenesis (GO:0000902)

BP 0.734 (0.680 – 0.789)

58 420

Latitude Related Genes

(LRG)

Confronto con patologie del SNC con frequenza latitudine dipendente

Latitude Related Genes

(LRG)

Parkinson

genes

Alzheimer

genes

Schizophreniagenes

Multiple sclerosi

sgenes

Malattie del SNC

Disease Overlap with genes LRG

Total count P-value Adjusted p-value

Schizophrenia 85 885 4E-6 1.6E-5

Parkinson's disease

40 490 0.021 0.084

Multiple sclerosis 16 178 0.058 0.232

Alzheimer's disease

45 618 0.075 0.3

Latitude Related Genes(LRG)

Schizophreniagenes

Schizofrenia Serio disordine mentale

caratterizzato da deliri, allucinazioni, disordine del pensiero, affettività inappropriata o appiattita, anedonia (incapacità a provare piacere) e ritiro sociale

Malattia multifattoriale ed eterogenea

Prevalenza 0.5-1% della popolazione mondiale

John Forbes Nash Premio Nobel Economia 1994 e schizofrenico

Componente ereditaria della schizofrenia

Dimensioni dei ventricoli

C o u rte sy D .R . W e in b e rg e r, N IM H , S t. E l iza b e th ’s H o sp i ta l , W a sh in g to n , D .C .

Dimensione ippocampo ed amigdala

Ippocampo ed amigdala sono più piccoli nei pazientiI corpi cellulari dell'ippocampo sembrano disorganizzati

Controllo Paziente

Perchè potrebbe esistere un adattamento evolutivo che coinvolge il rischio di sviluppare una malattia

come la schizofrenia ?

?

Perchè potrebbe esistere un adattamento evolutivo che coinvolge il rischio di sviluppare una malattia

come la schizofrenia ?

Vitamina D

La vitamina D influenza lo sviluppo del cervello

Costruzione di una lista di geni correlati alla vitamina D

Vitamin Drelated genes

(943)

Microarray data: Genes

differentially

expressed in SCC25

cells treated

with 1,25(OH)2

D3

Vitamin D (calciferol) metabolism

” Reactome (REACT_1

3523.2)

Biocarta's pathway

“Control of the

expression by vitamin D receptor”

I geni correlati alla latitudine sono arricchiti per geni della pathway

della vitamina D

Vitamin Drelated genes

(943)

Latitude Related Genes

(LRG)

97 geni p = 3.5 x 10-8

Questo dato suggerirebbe, per la prima volta, la presenza di fenomeni di adattamento alla carenza di vitamina D non collegati alla classica variazione della pigmentazione cutanea

Uno dei nove:SMARCA2

SMARCA2

Cosa fa SMARCA2 ? E' una della ATPasi del complesso SWI/SNF

Regolazione ciclo cellulare Differenziazione Regolazione della trascrizione Cancro Immunità

Il complesso SWI/SNF nei mammiferi si presenta come una serie di possibili differenti assemblaggi composti da subunità alternative

In particolare i complessi possono contenere una delle due forme di ATPasi: Brahma (BRM/SMARCA2) o Brahma- related gene (BRG1)

Che c'entra il complesso SWI/SNF con la Vitamina D ?

Il complesso SWI/SNF si complessa a sua volta con subunità legate alla duplicazione del DNA (TopoII, CAF-1p150) e fattori di elongazione ((FACTP140) per formare un complesso chiamato WINAC

WINAC ed il recettore della vitamina D sono trasportati verso i promotori regolati (sia negativamente che positivamente) in assenza di ligando. WINAC riarrangia i nucleosomi facilitando l'accesso a complessi di coregolazione (attivati dal ligando) per un ulteriore controllo della trascrizione

Che c'entra SMARCA2 con la schizofrenia ?

Il polimorfismo rs3793490 di SMARCA2 (che è lo stesso polimorfismo che noi troviamo correlato alla latitudine) modifica il rischio di schizofrenia

In particolare l'allele T aumenta il rischio di sviluppare la malattia (Odds ratio (95% CI) = 1.25 (1.14-1.38))

Allele che aumenta il rischio di schizofrenia

SMARCA2 rs3793490

Individui che veicolano l'allele T di rs3793490 mostrano livelli di mRNA di SMARCA2 ridotti

Human Molecular Genetics, 2009, Vol. 18, No. 13

La diminuzione di SMARCA2 ha differenti effetti in differenti tessuti

Diminuzionedi

SMARCA2

Cellule silenziateAccellerata “rate” di mineralizzazioneMaggiore espressione di marker osteogeniciAnimali knock-outDimensione del corpo maggiore (14% del normale)Aumento spoporzionato delle ossa e dei muscoli

PazientiRidotta espressione dimostrata in corteccia prefontale di pazienti schizofreniciAnimali knock-outRidotta interazione sociale e presenza di “prepulse inhibition”FarmacologiaFarmaci che determinano psicosi abbassano SMARCA2Farmaci antipsicotici aumentano SMARCA2

Modello

Variante Gfa più SMARCA2

Variante Tfa meno SMARCA2

Variante Tfa meno SMARCA2resiste meglio al rachitismo

Variante Tfa meno SMARCA2aumentato rischio schizofrenia

Antonella Monticelli

Michele Pinelli

Roberto Amato

Rino Miele

Gruppo Interdipartimentale Bioinformatica e Biologia Computazionale

Un altro aspetto curioso della teoria dell'evoluzione è che tutti pensano di capirla!

(Jacques Monod)

…. persino i genetisti

(anonimo)

The end