By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

25
By NA Il genoma umano LEZIONE 6

Transcript of By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

Page 1: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Il genoma umano LEZIONE 6

Page 2: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

~30%~30% ~70%~70%

~10%~10% ~90%~90%~80%~80% ~20%~20%

Genoma Umano

Page 3: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Il DNA mitocondriale 0.0005% del genoma umano

- doppio filamento a diversa composizione:

filamento heavy (H) e light (L)

- eredita’ matroclina

- contiene 37 geni, 28 su filamento H e 9 su filamento L

- dei 37 geni, 24 codificano per prodotti maturi ad RNA e 13 per polipeptidi dei complessi multimerici del mitocondrio (concetto di semiautonomia)

- i geni sono estremamente compatti: privi di introni sovrapposti parzialmente (subunita’ 6 e 8 dell’ATPasi) trascritti privi di codoni di stop

Page 4: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Il DNA NUCLEARE

Si distingue in:

DNA codificante (3%)

DNA non codificante (97%)

Page 5: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

- di solito in unica copia

- possono appartenere a famiglie geniche originatesi per duplicazione. In questo caso possono mantenere funzioni correlate e possono mappare nella stessa regione genomica

Il DNA codificante (per RNA e proteine)

- Numero di geni stimato nel genoma umano (30000), stimato utilizzando il sequenziamento genomico e CpG

- Utilizzando sonde per CpG (56% dei geni umani hanno nei loro promotori questi elementi di sequenza) si e’ visto una differenziale densita’ genica sui cromosomi:

a. cromosoma 19 ricco in genib. cromosomi 4 e 18 poveri in geni

Page 6: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

GENI CHE CODIFICANO ORGANIZZAZIONE ESEMPI

Stesso prodotto Spesso raggruppati geni per tRNA, istoni ...

Isoforme proteiche oisoenzimi tessuto-specifici

Talvolta raggruppatitalvolta non sintenici

amilasi pancreatica e salivare

a-actina epatica e cardiaca

Isoenzimi specifici per differenti comparti cellulari

Di solito non sintenici Aldeide deidrogenasi citoplasmatica e mitocondriale(chr9q e chr12q)

Enzimi della stessa via metabolica

Di solito non sintenici

Subunita’ della stessa molecola

Di solito non sintenici Ferritina: cat pesante chr11q cat leggera chr22q

Ligando e recettore Di solito non sintenici

Il DNA codificante

Page 7: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Geni dentro i geni

Geni all’interno di altri geni sono descritti per i genomi diorganismi semplici e nei mitocondri

Nei mammiferi sono descritti geni contenuti nei grandi introni di alcuni geni.A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il filamento opposto al gene “canonico”

NF1: introne 27 (40Kb) contiene tre piccoli geni (2 esoni) che vengono trascritti dal filamento opposto

Fattore VIII della coagulazione F8C: introne 22 contiene due geni che utilizzano la stessa isola CpG nelle due direzioni. Il gen F8A viene trascritto utilizzando il filamento opposto al F8C, mentre F8B non solova nella stessa direzione, ma sintetizza un corto mRNA che ha un esone nuovo + gli esoni dal 23 al 26 di F8C.

RB1: introne 17 (72Kb) contiene il gene per il recettore della proteina G, che viene trascritto in senso opposto

Page 8: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Geni dentro i geni

NF1

5’ 3’esone 26 esone 27Introne 26

Filamento di senso

Filamento antisenso 3’ 5’

OGMP2.2KB

EVI2B10 KB

EVI2A 4 KB

F8

F8B

1 22 23 26

F8C

F8A

CpG

Page 9: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

40% del genoma e’ composto da gruppi di sequenze non alleliche che mappano percio’ in locus diversi, ma sono strettamente correlate, sono presenti cioe’ sequenze con un numero di copie multiple.

Famiglie multigeniche

Tradizionalmente sulla base della cinetica di riassociazione il genoma umano e’ suddiviso in: DNA a singola copia o con un numero di copie molto basso DNA moderatamente ripetitivo DNA altamente ripetuto

Page 10: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

La definizione di famiglia e’ operativa, e’ indipendente dalla natura delle sequenze

Due sequenze vengono definite come appartenenti alla stessa famiglia quando presentano omologia di sequenza anche in una regione ristretta della sequenza

Famiglie multigeniche: DNA ripetuto che contiene geni funzionali

Famiglie di sequenze di DNA non genico

Famiglie multigeniche

Page 11: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Famiglie multigeniche

Famiglie multigeniche: DNA ripetuto che contiene geni funzionali

Le famiglie presentano variabilita’ nell’omologia con la sequenza di riferimento e nel grado con cui le sequenze conservate definiscono la famiglia. Ne deriva che l’appartenenza ad una famiglia e’ data non solo dall’omologia complessiva, ma dal presentare un dominio condiviso o organizzazione simile. Si possono presentare raggruppati o distribuiti nel genoma. Alcuni membri possono essere non funzionali:

pseudogeni

Page 12: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Copie non funzionali del DNA genomico di un gene. Contengono esoni, introni e spesso le sequenze fiancheggianti. Data la loro somiglianza nell’organizzazione genomica, la loro natura non funzionale puo’ essere riconosciuta, a livello di sequenza, dalla presenza di codoni di stop nella regione corrispondente alla porzione codificante del gene funzionale o dalla presenza di un’elevato numero di mutazioni ognuna della quali originerebbe una molecola mutante. Sono comuni nelle famiglie di geni raggruppati

Talvolta possono venir espressi a livello di RNA o addirittura come polipeptide, che non viene utilizzato nella molecola funzionale:gene della globina-, sicuramente viene espresso, ma non se ne riscontra la presenza nell’emoglobina funzionale

Pseudogeni I Pseudogeni non processati: convenzionali ed espressi

Page 13: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Pseudogeni processati : sono copie non funzionali degli esoni di un gene espresso e si ritrovano nelle famiglie dei geni interspersi. La loro origine sembrerebbe dovuta all’integrazione di una sequenza di DNA originatesi per azione di una trascrittasi inversa.

se sono copie di trascritti dalla RNApolimerasi II di solito non sono espressi perche’ privi del promotore. Possono venir espressi se integrati vicino ad un promotore, in questo caso l’espressione potrebbe non essere nello spazio e nel tempo quella originaria (espressione selettiva in un tessuto specifico e/o in uno specifico momento nello sviluppo: geni espressi nel testicolo, SRY)

se sono copie di trascritti dalla RNApolimerasi III possono avere al loro interno il promotore ed essere espressi. Possono raggiungere un elevato numero di copie(sequenze Alu)

Pseudogeni II

Page 14: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

I cluster globinici

Le LCR si trovano a monte dei raggruppamenti e la loro funzione sarebbe quella di organizzare il raggruppamento in un dominio di cromatina attiva, agendo come enhancer.

La cromatina attiva si presenta sensibile alla Dnasi I e grazie a questa caratteristica sono state identificate le LCR per i due aggruppameni globinici. E’ stato anche possibile riconoscere che questa ipersensibilita’ e’ modulata nei diversi stadi di sviluppo

globina

HS-40 21 2 1 2 1

HS-4 HS-3 HS-2 G A

globina

Page 15: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Controllo dei cluster globiniciGli enhancer sono brevi sequenze che agiscono in cis. Nel caso dei geni globinici sono costituiti da sequenze di riconoscimento per fattori di trascrizione eritroido- -specifici. Si ritiene che l’alternanza delle emoglobine sia legata oltre che a fenomeni di competizione dei geni per interagire con le LCR , anche all’intervento di silenziatori gene-specifici, modulati durante lo sviluppo.

G A

G A

G A

DNA nell’embrione

DNA nel feto

DNA nell’adulto

Page 16: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Struttura del DNA codificante

relazione inversa tra lunghezza del gene e percentuale del contenuto esonico

Page 17: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Gli introniGli introni

Entita’ eterogenee con differenti capacita’ funzionali. Sono coinvolti nello splicing con modalita’ differenti e pertanto classificabili in gruppi. La posizione all’interno delle sequenze codificanti (fase intronica) ne permette un’ulteriore suddivisione in tipi:

Introni ancestrali: presenti nei geni dei tRNA e dei r RNA degli archeobatteri.

Introni di gruppo I e II:presenti nel genoma degli eubatteri e degli eucarioti

Introni “spliceosomici”:introni convenzionali presenti nel genoma degli eucarioti

Page 18: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

esone1GU------------A-----AG esone2 GU--------AG esone3

Taglio in

GU-----------------AG GU--------AG EliminatoEliminato

esone1 esone2 esone3

Splicing

esone1 esone2 esone3RNA maturo

esone1 GU------------A-----AG esone2 GT--------AG esone3

esone1 esone2

CA

snRNP U1

snRNP U2

Gli introniGli introni

Page 19: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Fase degli introni: posizione in cui l’introne interrompe una sequenza di DNA codificante (non si definisce la fase quando l’introne interrompe una sequenza non tradotta).. Esistono tre tipi: fase 0, fase 1, fase2

Gli introniGli introni

Fase 0: interrompono la sequenza codificante fra due codoni adiacenti, sono i piu’ numerosi e potrebbero rappresentare la situazione ancestrale

Fase 1: interrompono la sequenza codificante fra la prima e la seconda base

Fase 2: interrompono la sequenza codificante fra la seconda e la terza base

Page 20: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

Fase degli introni: posizione in cui l’introne interrompe una sequenza di DNA codificante (non si definisce la fase quando l’introne interrompe una sequenza non tradotta). Esistono tre tipi: fase 0, fase 1, fase2

------ GGC AG

5’ UTS Val Gly Ar 2 2 g Leu Arg 0 0 Leu His 3’UTS

HBBHBB G CTG ------ AGG CCC ------ CAC TAA

1 29 30 31 104 105 146

Fase 2 Fase 0

ATGGTG

gt--------aggt--------ag ATG -------------------------- CAG GG TG ------------------------ AACTAG INS

5’UTS

3’UTS

1 80 81 110

V 1 1 al

Fase 1

Gli introniGli introni

Page 21: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

DNA RIPETUTO IN TANDEM: i blocchi possono mappare su piu’ cromosomi a seconda delle dimensioni medie delle unita si suddivide in:

DNA satellite DNA minisatellite DNA microsatellite

DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA.

Famiglie di DNA ripetuto non genico

Page 22: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA.

SINE (Short Interspersed Nuclear Elements). Nell’uomo e negli altri primatila famiglia piu’ rappresentativa e’ costituita dalle Alu

LINE (Long Interspersed Nuclear Elements). Sono condivisi anche da altri mammiferi

DNA ripetuto intersperso

Page 23: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

ELEMENTI TRASPONIBILI

TRAMITE RNA (comune)

TRAMITE DNA (rara)

Incapace dicodificare latrascrittasi inversa

Famiglia non virale

Retropseudogeni(pseudogeni processati)

FAMIGLIA Alu

Capace dicodificare latrascrittasi inversa

TRASPOSONI

Famiglia virale

Posseggono le LTR ecaratteristiche dei retrovirus

Privi delle LTR e di altrecaratteristiche dei retrovirus

Retrovirus endogeni e elementisimil-retrovirali

Retrotrasposoni

FAMIGLIA HERV/RTLVFAMIGLIA THE-1

FAMIGLIA LINE-1(Kpn)

Classificazione elementi trasponibili nell’uomo

Page 24: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

I membri delle famiglie di ripetizioni intersperse sono considerati elementi trasponibili

ELEMENTI TRASPONIBILI: segmenti di DNA in grado di muoversi nel genoma. Gli elementi trasponibili umani sono di regola retrotrasposoni. La sequenza trasposta si trova ,dopo la duplicazione, ad essere fiancheggiata da corte unita’ ripetute

AAAANAAAANnn

TTTTNTTTTNnn

5’5’ 3’3’

3’3’5’5’TTTTT TTTTTTTTTT TTTTTnn

AAAANAAAANnn AAAAAAAAAA

Elementi trasponibili

Page 25: By NA Il genoma umano LEZIONE 6. By NA ~30% ~70% ~10% ~90% ~80% ~20% Genoma Umano.

By NA

SINE di mammifero con elevato numero di copie, famiglie Alu nell’uomo e B1 nel topo Derivano da geni trascritti dalla RNA polimerasi III utilizzando un promotore interno.Le Alu si trovano circa ogni 4 kb , la sequenza completa e’ lunga 280pb, fiancheggiata da corte unita’ (6-18pb) ripetute dirette, e’ un dimero ripetuto in tandem le cui unita’

presentano entrambe sequenza (An)/ (Tn), uno dei monomeri e’ deleto di 32pb.

Sono presenti nel genoma anche come monomeri interi o tronchi. Sarebbero pseudogeniprocessati del gene dell’RNA 7SL

FAMIGLIA Alu

A BRNA7SL+1 +10 +52

Promotore bipartito

mRNA7SLdelezione

delezione 32pb

AAAAATTTTT

AAAAATTTTT

AAAAATTTTT

AAAAATTTTT

AAAAATTTTT5’ 3’130 160

Elementi trasponibili tramite RNA