F00a-individualità genetica

16
INDIVIDUALITA’ GENETICA Il genoma non è legato al numero di nucleotidi: molti organismi hanno quantità di DNA maggiore dell’uomo, quindi non è la quantità di DNA che definisce il grado di complessità dell’essere vivente. Però c’è una relazione tra complessità del genoma e complessità dell’individuo. 1° livello di complessità: sequenza del genoma (codice genetico) GENOMA MITOCONDRIALE. Il sistema di controllo di trascrizione per rRNA e tRNA, e proteine, è differente: ad esempio l’rRNA è trascritto ad altissimo livello ed è ubiquitario. Inoltre rRNA e tRNA sono trascritti in coppia (infatti per creare una proteina ho bisogno di entrambi). Per quanto riguarda il genoma mitocondriale, i 13 polipeptidi non riescono da soli a formare il mitocondrio, infatti sono anche necessari geni di origine nucleare. Il genoma mitocondriale, essendo il mitocondrio situato nel citoplasma, è solo materno (lo spermatozoo è solo nucleo, contenente protammine e istoni modificati necessari per l’onda di demetilazione gametica). Inoltre il genoma mitocondriale non va incontro a ricombinazione genetica, e quindi la trasmissione è diretta. Fenomeno dell’ETEROPLASMIA DEL GENOMA MITOCONDRIALE: il genoma non è unico, ci sono più genomi mitocondriali con differenti polimorfismi. GENOMA NUCLEARE. Con il Progetto Genoma Umano furono identificati 36000 geni, ma attualmente (post-genomica) se ne conoscono 100000. Il DNA extragenico, originariamente chiamato junk-DNA, è utile per la regolazione della espressione genica. Il fatto che esistano frammenti genici conferma l’ipotesi dell’evoluzione del genoma: l’uomo moderno è il risultato di molte mutazioni. 2° livello di complessità: interazione tra DNA e proteine istoniche (codice istonico) I cromosomi sono forme cristallizzate di DNA, quindi il DNA è complessato con proteine in modo pianificato.

Transcript of F00a-individualità genetica

Page 1: F00a-individualità genetica

INDIVIDUALITA’ GENETICA Il genoma non è legato al numero di nucleotidi: molti organismi hanno quantità di DNA maggiore dell’uomo, quindi non è la quantità di DNA che definisce il grado di complessità dell’essere vivente. Però c’è una relazione tra complessità del genoma e complessità dell’individuo.

1° livello di complessità: sequenza del genoma (codice genetico)

GENOMA MITOCONDRIALE. Il sistema di controllo di trascrizione per rRNA e tRNA, e proteine, è differente: ad esempio l’rRNA è trascritto ad altissimo livello ed è ubiquitario. Inoltre rRNA e tRNA sono trascritti in coppia (infatti per creare una proteina ho bisogno di entrambi). Per quanto riguarda il genoma mitocondriale, i 13 polipeptidi non riescono da soli a formare il mitocondrio, infatti sono anche necessari geni di origine nucleare. Il genoma mitocondriale, essendo il mitocondrio situato nel citoplasma, è solo materno (lo spermatozoo è solo nucleo, contenente protammine e istoni modificati necessari per l’onda di demetilazione gametica). Inoltre il genoma mitocondriale non va incontro a ricombinazione genetica, e quindi la trasmissione è diretta. Fenomeno dell’ETEROPLASMIA DEL GENOMA MITOCONDRIALE: il genoma non è unico, ci sono più genomi mitocondriali con differenti polimorfismi. GENOMA NUCLEARE. Con il Progetto Genoma Umano furono identificati 36000 geni, ma attualmente (post-genomica) se ne conoscono 100000. Il DNA extragenico, originariamente chiamato junk-DNA, è utile per la regolazione della espressione genica. Il fatto che esistano frammenti genici conferma l’ipotesi dell’evoluzione del genoma: l’uomo moderno è il risultato di molte mutazioni.

2° livello di complessità: interazione tra DNA e proteine istoniche (codice istonico)

I cromosomi sono forme cristallizzate di DNA, quindi il DNA è complessato con proteine in modo pianificato.

Page 2: F00a-individualità genetica

Il DNA funziona solo se associato a proteine, e l’avvolgimento è ultraspecifico: le proteine (istoni) legano sequenze specifiche di DNA. Gli istoni regolano l’espressione del DNA: esiste un codice istonico oltre al codice genetico. Le interazioni tra DNA ed istoni prescindono dall’attivazione dei fattori di trascrizione.

3° livello di complessità: organizzazione della cromatina nel nucleo

La cromatina ha collocazione precisa all’interno del nucleo. I pori nucleari permettono il passaggio attivo di sostanze, e lo scambio tra interno ed esterno. La cromatina interagisce con la matrice nucleare tramite il junk-DNA. Quindi il junk-DNA legandosi alla matrice nucleare permette di avere eucromatina o eterocromatina. Le regioni legate alla matrice non sono accessibili (eterocromatina), mentre le regioni non legate alla matrice sono accessibili (eucromatina). Alterando questo meccanismo non altero un singolo gene, ma circa 150000, e quindi mutazioni knock-out a questo livello (legame matrice nucleare-junkDNA) causano la morte dell’embrione allo stadio di morula.

La cromatina è una struttura a minor dispendio di energia (maggiore stabilità). E’ inoltre una struttura dinamica, in relazione ai comandi che giungono alla cellula (è dinamica, ma per cambiarla serve energia e comandi cellulari). Immaginando il nucleo come una sfera, la cromatina non cade come precipitato, ma si trova sospesa (la matrice funziona da zattera).

Page 3: F00a-individualità genetica

4° livello di complessità: formazione del cromosoma

Durante la replicazione si ha il superavvolgimento della cromatina, che rende inaccessibile la regione di DNA. La nostra variabilità genetica dipende da differenze morfologiche (bianco, nero,…) e funzionali (interazione personale con l’ambiente).

VARIABILITA’ GENETICA

Progetto Genoma Umano ha individuato 3.076.663.000 nucleotidi appartenenti al genoma. Esistono differenti livelli di variazione tra i vari genomi: 1) SNP (single nucleotide polimorfism). Singoli cambiamenti di nucleotide.

2) SSR (short sequencerepeats). Sequenze brevi (2-3 bp) ripetute, più o meno volte. 3) CNV (copy numbervariations). Sequenze molto lunghe (1000 bp) e ripetute più volte. Questi tre tipi di polimorfismi si utilizzano per tracciare i moti migratori degli uomini primitivi.

Page 4: F00a-individualità genetica

L’idea errata era concepire polimorfismo e mutazione come eventi distinti solo in base alla prevalenza sulla popolazione. Il polimorfismo era una variabilità con incidenza maggiore all’1% della popolazione, mentre la mutazione aveva incidenza minore dell’1%. In realtà, sono tutte mutazioni, ma la differenza tra sano e malato è dovuta al ruolo che il polimorfismo gioca in relazione con l’ambiente. I disordini genetici sono il prezzo da pagare per il potenziale evolutivo/adattativo. Il primo polimorfismo ad essere identificato fu quello dei gruppi sanguigni. Questo ragionamento può essere riprodotto anche per le razze: il concetto di razza è socio-politico, non genetico. Infatti all’interno di più razze si trovano gli stessi polimorfismi. Prima si riteneva che le mutazioni “senso” non fossero precisa causa di malattia, mentre oggi si conosce la relazione con la predisposizione a determinate malattie. Altri polimorfismi invece sono neutri, quindi non correlati a patologie. Il polimorfismo può causare malattia in relazione all’ambiente in cui vive il soggetto. Possono essere gain-of-function o loss-os-function, permettendo o impedendo all’individuo di sopravvivere. Quindi i polimorfismi si classificano in: - polimorfismi patogenici - polimorfismi predisponenti - polimorfismi neutri FIBROSI CISTICA. Malattia autosomica recessiva, la più frequente malattia ereditaria in Europa (30% di portatori sani). In alcune aree della Danimarca, oltre l’80% della popolazione ha una mutazione ΔF508 (che causa una mancata funzionalità di un canale di membrana). ANEMIA FALCIFORME. In determinate regioni geografiche ho mutazioni del gene della β-globina che in omozigosi causa la β-talassemia. In alcune regioni a questa mutazione se ne aggiunge un’altra, quella della permanenza dell’emoglobina fetale. Quindi le due mutazioni prese singolarmente causano una malattia grave, mentre prese contemporaneamente causano una malattia lieve.

Quindi, per concludere: i polimorfismi sono mutazioni; il problema è l’interazione con l’ambiente (devo vedere se sono vantaggiosi o svantaggiosi). Le mutazioni non hanno valore di per sé, ma acquisiscono valore in relazione all’ambiente in cui vivo.

Page 5: F00a-individualità genetica

BASI FUNZIONALI DEI POLIMORFISMI GENETICI

TRASCRIZIONE

Per la RNApol2 si parla di rate-limiting: il promotore è regolato dagli UCE (upstreamcontolling regione). Mentre per la RNApol3 (promotore interno) non deve esserci rate-limiting poiché i tRNA devono essere prodotti sempre in eccesso. Le mutazioni possono interessare: sequenze codificanti, elementi regolatori a monte e a valle.

Page 6: F00a-individualità genetica

Il promotore è il TATAbox, ma la sua attività è modificata da elementi a monte e a valle. Ad esempio, per il promotore del gene dell’insulina, il TATAbox ha molti fattori regolativi a funzione specifica (fino a -350 bp). PDX1 è importante per la tessuto-specificità dell’espressione genica. LCR (locus controllingregion): regioni cromosomiche che permettono l’espressione coordinata di parti cromosomiche differenti in tempo differente. I diversi UCE vengono attivati da un unico LCR in tempi diversi, per avere catene globiniche diverse.

Page 7: F00a-individualità genetica

Le LCR furono scoperte tramite trattamento con esonucleasi (DNasi1): le LCR sono regioni ipersensibili alla degradazione poiché meno legate a proteine (legame debole tra cromatina e proteine). Quindi le LCR sono dei promotori che controllano l’intero locus genico (economia genica). Le LCR creano complessi trascrizionali che uniscono la regione LCR con la regione specifica (UCE) del promotore del gene che si intende trascrivere. Quindi nelle diverse fasi dell’embriogenesi si ha una diversa espressione delle catene del cluster β delle globine.

TRADUZIONE Il numero di triplette (e di tRNA corrispondenti) è maggiore di quello degli aminoacidi, e servono a prendere e trasportare l’aminoacido sulla catena proteica nascente. Il codice si dice quindi degenerato: le mutazioni del terzo nucleotide di una tripletta sono nulle, cioè sono polimorfismi neutri che non modificano la sequenza (e la funzione) della proteina. Però ogni tripletta ha una efficienza caratteristica: vi sono codoni ad alta efficienza e codoni a bassa efficienza. Ad esempio, per la serina, UCC ha maggiore efficienza (maggiore velocità di trasporto dell’aminoacido) rispetto a UCG. Quindi nel totale, la velocità di sintesi proteica può cambiare, sebbene la sequenza sia la stessa. Allora alcuni polimorfismi apparentemente neutri determinano una velocizzazione o rallentamento della codifica. La cinetica dei vari tRNA è differente nelle diverse specie, e viene detta “codonusage”. In questo modo si generano diverse funzioni delle proteine tra diversi individui, e ciò contribuisce alla variabilità genetica individuale.

POLIMORFISMI GENETICI

Sequenza di segnale: sequenza che permette una determinata funzione sul DNA (se la sequenza di segnale è alterata, la funzione si perde; effetto tutto-o-nulla) (pista di atterraggio) Sequenza di consenso: non direttamente coinvolta con il segnale, ma permette di riconoscerlo (sono meno specifiche e più variabili) (luci che permettono di vedere la pista) Ho bisogno sia della sequenza segnale, ma ho anche bisogno che questa sequenza sia segnalata. Le sequenze di segnale e di consenso possono regolare la velocità di produzione di una proteina e la mutazione di quella proteina (senza seq consenso, si può avere frameshift e cambiare proteina). Ad esempio, AUG è una sequenza di segnale (inizio traduzione) ma ha bisogno di una sequenza di consenso. Comunque possono esistere altri siti di inizio, differenti da AUG. Se nelle vicinanze di una sequenza di consenso ho un altro AUG, posso avere uno slittamento del modulo di lettura: ciò può causare patologie, ma è anche importante per le molecole che hanno

Page 8: F00a-individualità genetica

valenza sia di membrana che di secrezione (differenti AUG codificano differenti siti di inizio, incorporando o tralasciando aminoacidi particolari).

Kozak (sequenza di consenso negli eucarioti, sito di aggancio dei ribosomi all’mRNA) ha scoperto che ci sono sequenze più o meno costanti: AUG è sempre presente, purina a -3, pirimidina a -2, pirimidina a -1, purina a +4. Quindi spesso la sequenza segnale-consenso è ACC-AUG-G. Normalmente: mRNA passa nel ribosoma (scanning) Alterazione: perdo efficienza di traduzione (leaking)

Page 9: F00a-individualità genetica

MATURAZIONE DELL’mRNA SPLICING. La sequenza consensus di splicing è abbastanza variabile; generalmente il sito donatore è AG|(GT), il sito accettore è (AG)|GA. [tra parentesi la porzione intronica] La variabilità delle sequenze vicino ai siti di taglio causa variabilità dell’efficienza di traduzione.

Le sequenze consensus permettono l’aggancio di fattori proteici per il rimodellamento della cromatina, e avvicinamento delle regioni esoniche. Inoltre le sequenze consensus determinano l’efficienza di legame tra le proteine di splicing e la sequenza segnale di splicing. Mutazioni causano o perdita dello splicing o variazioni dell’efficienza, generando diversa quantità di proteina.

Page 10: F00a-individualità genetica

Meccanismi di splicing alternativo

SPLICING ALTERNATIVO. Proteine differenti a partire dallo stesso gene. Sebbene possano esserci mutazioni geniche che causano malattia, l’espressività varia in base al luogo in cui si ha la mutazione, e dalla funzione di quell’aminoacido nella proteina dell’esone mutato. Il numero di geni è aumentato sia per scelta di differente sito di terminazione, sia per differente promotore. Spesso lo splicing alternativo (promoters alternativi) è usato per dare tessuto-specificità alla proteina. Nei tumori, gli splicing alternativi regolano trascritti che aiutano e permettono l’esistenza del tumore stesso.

Page 11: F00a-individualità genetica

Oltre che a livello del promotore (la proteina inizia tardivamente), si può avere splicing alternativo tramite siti alternativi di poliadenilazione (la proteina termina precocemente). A livello della regione di terminazione (terminator), si hanno numerose sequenze consensus; il sito di poliA è uno degli elementi del terminator (non l’unico), poichè è associato a elementi che permettono il mantenimento del poliA. Normalmente, il poliA rappresenta una protezione nei confronti delle esonucleasi 3’ (il cap protegge dalle esonucleasi 5’) e inoltre permette il riconoscimento per il passaggio attraverso il poro nucleare. In caso di mutazione, si ha un passaggio rallentato dal nucleo al citoplasma, e l’mRNA viene distrutto nel citoplasma; quindi questo meccanismo permette di eliminare gli mRNA immaturi o anomali. La stabilizzazione dell’mRNA è data da altre sequenze in 3’-UTR e 5’-UTR, che fungono da siti di aggancio per le endonucleasi. Ciò è funzionale, poichè alcuni mRNA devono avere emivita brevissima, e quindi essere distrutti prontamente dalle endonucleasi. Ad esempio, c-myc è un fattore trascrizionale oncogeno a breve emivita (3 min); se mutato, l’emivita aumenta e diventa oncogeno (l’aumento della attività di c-myc causa maggiore progressione della cellula verso la divisione cellulare, senza la possibilità di riparare eventuali lesioni al genoma); se non regolato, viene prodotto in continuazione ed è cancerogeno. Nel linfoma di Burkitt (associato a infezione con EBV), ho la traslocazione 8-14 del c-myc, che trasloca vicino all’enhancer per la trascrizione della catena pesante variabile delle Ig. Quindi c-myc si trova sotto il controllo di un promotore forte, e viene iperespresso, perdendo il controllo originario sulla produzione. Gene piccolo (< 10.000 kb): molte sequenze codificanti; sono geni per proteine semplici con funzioni uniche, che non necessitano di grande regolazione. Gene grande (> 100.000 kb): poche sequenze codificanti; sono geni per proteine complesse, e tramite lo splicing alternativo ho trascritti e tradotti differenti (funzioni differenti). Il controllo post-traduzionale è specie-specifico, e identifica più modi per utilizzare la stessa proteina. RNA-EDITING. La specificità tissutale può venire modificata per mezzo di editing dell’mRNA (modifiche a carico di un solo nucleotide). Il gene per apoB è unico; nel fegato, la proteina apoB viene espressa interamente (100 kDa), mentre nell’intestino viene troncata (48 kDa). Siccome la porzione che lega il recettore per le LDL è stata troncata, apoB48 non è in grado di legarsi al recettore (apoB48, nei chilomicroni, lega il colesterolo ma non LDL-receptor), e quindi svolge solo funzioni di trasporto.

Editing di ApoB

Page 12: F00a-individualità genetica

MODIFICAZIONI POST-TRADUZIONALI. 1) CLIVAGGIO. Per lo splicing, da un’unica sequenza di DNA (unica sequenza di RNA immaturi) posso avere differenti mRNA maturi, e quindi differenti proteine. Per le modificazioni post-traduzionali, da un’unica proteina precursore posso generare differenti proteine. La pro-proteina dell’insulina possiede siti di aggancio per endoproteasi che determinano escissioni di tratti proteici, con la sintesi delle catene alfa e beta e del peptide di connessione.

2) MODIFICHE AMINOACIDICHE

Queste modifiche aminoacidiche sono anche responsabili della variabilità individuale nella risposta ad una terapia, poichè possono modificare l’attività di specifici farmaci. Ad esempio, in caso di un enzima che inattiva un farmaco chemioterapico, si possono avere: - nel 30% della popolazione, con genotipo omozigote, l’enzima inattiva il farmaco => terapia inutile - nel 70% della popolazione, con genotipo eterozigote, l’enzima è poco espresso => terapia utile

Page 13: F00a-individualità genetica

POLIMORFISMI GENETICI: EFFETTI FUNZIONALI SULLA PROTEINA

I polimorfismi sono fattori di rischio per l’aterosclerosi; inoltre, in molte malattie infettive si hanno manifestazioni differenti tra gemelli monozigoti, dovute all’interazione tra fattori ambientali e fattori genetici. Il corredo genetico individuale influenza lo sviluppo della malattia.

Relazione tra locus HLA e variabilità ambientale.

Relazione tra locus non-HLA e variabilità ambientale.

Grazie a polimorfismi, alcuni individui sono resistenti a malattie teoricamente mortali; ad esempio, malaria e talassemie hanno la stessa distribuzione geografica, perchè le anomalie sull’emoglobina impediscono al plasmodio della malaria di sopravvivere. Il virus dell’HIV usa come recettore il CD4 e come corecettore il CCR5 (HIV M-tropic) o il CXCR4 (HIV T-tropic). Alcune popolazioni hanno mutazioni nel CCR5, e quindi il virus dell’HIV non riesce a penetrare nelle cellule. Il pz ha il contagio, ma non l’infezione, perchè il virus non penetra. Il ΔCCR5 è dovuto ad una delezione; in questo caso la malattia è ambientale, ma i fattori genetici impediscono l’evoluzione.

Page 14: F00a-individualità genetica

PREDISPOSIZIONE E RESISTENZA 1) cancro al polmone da fumo. Per metabolizzare i tossici del fumo, ho due meccanismi: attivazione del cancerogeno contenuto nella sigaretta; escrezione del cancerogeno (siccome l’escrezione è renale, posso eliminare il cancerogeno solo dopo averlo reso idrosolubile a livello epatico). Queste due attività sono svolte da sistemi enzimatici differenti; se fumo e ho un basso livello di attivazione del cancerogeno e un alto livello di escrezione, ho un rischio minore di sviluppare cancro polmonare. 2) cancro alla vescica da fumo. Il cancerogeno reso idrosolubile a livello epatico e filtrato a livello renale, arriva in vescica. La vescica riconosce il gruppo idrossile (idrosolubile) legato al cancerogeno e lo rimuove, rendendo di nuovo il cancerogeno non idrosolubile; quindi la molecola ristagnerà in vescica e indurrà una trasformazione neoplastica.

MECCANISMI GENERALI DI MUTAZIONE: 1) ERRORI DI REPLICAZIONE. Epidemiologicamente, da padre anziano si generano malattie da singolo gene, mentre da madre anziana si generano malattie da non disgiunzione. Gli errori di replicazione nelle cellule staminali vengono mantenute per tutta la vita, e il numero di mutazioni aumenta con l’aumentare delle mitosi. 2) INTERAZIONE CON MUTAGENO. Un mutageno è una sostanza capace di legare il DNA e di non essere riconosciuta dai sistemi di riparazione del DNA (proof-reading). I mutageni più comuni sono le radiazioni ionizzanti.

Page 15: F00a-individualità genetica

CLASSIFICAZIONE DELLE MALATTIE GENETICHE - MALATTIE DA SINGOLO GENE. Ottima corrispondenza genotipo-fenotipo (la malattia è dovuta alla mutazione di un singolo gene). La maggior parte si manifesta in età pediatrica. sono relativamente rare sono determinate da mutazioni in geni specifici le mutazioni sono presenti in una o entrambe le copie del gene le mutazioni sono sufficienti a causare effetti fenotipici - MALATTIE CROMOSOMICHE. Poligeniche, ma la disregolazione avviene su un solo cromosoma, tranne per le trisomie; manca il meccanismo delle LCR, e ciò causa la manifestazione clinica. ereditarietà digenica: alleli malattia, che causano il fenotipo alterato, si trovano in due loci differenti, e sono entrambi necessari per il fenotipo malato (retinite pigmentosa) ereditarietà trigenica: tre alleli malattia in due differenti loci (Bardet-Birdl) ereditarietà oligogenica: più alleli malattia in almeno tre differenti loci (diabete mellito) Il diabete oggi è frequente perchè nel medioevo permetteva la sopravvivenza nei periodi di carestia.

- MALATTIE MULTIFATTORIALI. Hanno bassa incidenza pediatrica, ma alta incidenza geriatrica, e dipendono sia da fattori genetici che da fattori ambientali. Anche le malattie infettive sono multifattoriali (la genetica influisce sulla predisposizione). Esempi sono: asma, diabete, ipertensione, malattie cardiovascolari, tumori. Esiste un’aggregazione familiare ma non segue il caratteristico pattern di segregazione delle malattie da singolo gene. Nei caratteri complessi l’effetto di ciascun gene contribuisce in varia misura al fenotipo. Da un punto di vista epidemiologico, il maggior contributo è dato da alleli ad alta frequenza ma bassa penetranza: - ApoE4 e malattia di Alzheimer. ApoE4 ha incidenza di 1-2% nella popolazione italiana, e del 10% sulla popolazione del nord Europa, in quanto funzionava da fattore protettivo contro l’eccesso alimentare locale. In caso di omozigosi di ApoE4, si ha una elevata probabilità di sviluppare la malattia di Alzheimer; invece, la presenza di ApoE2 rappresenta un fattore di protezione contro la malattia di Alzheimer (è posseduto dagli ultracentenari) - fattore V di Leiden e trombosi venosa - CCR5 e resistenza ad HIV

Page 16: F00a-individualità genetica

Valori fisiologici determinati geneticamente.

Le malattie multifattoriali sono dovute anche a varianti geniche frequenti, ciascuna delle quali non è nè necessaria nè sufficiente per produrre effetti significativi sul fenotipo. Si verifica il cosiddetto “effetto soglia”: ho l’espressione di un fenotipo solo se sorpasso la soglia di suscettibilità; quindi l’effetto di un fenotipo dipende dall’effetto additivo sulla suscettibilità dato da ciascun specifico fattore e dall’interazione tra fattori genetici ed ambientali.

Ciascuno ha il proprio genoma unico, ma nel corso della vita si hanno evoluzioni nello stile di vita e nell’aspetto fisico. L’uomo è diverso nei vari periodi della sua vita, e un unico genoma è responsabile di tutto ciò. Quindi si ha l’individualità dell’uomo rispetto al genere umano, che si somma alle modifiche dell’uomo nel corso della sua vita.

RIASSUNTO DEI FATTORI CHE INFLUISCONO SULL’INDIVIDUALITÀ GENETICA