ca 1013 cellule/individuo.Ciascuna con un genoma nuclearee molti genomi mitocondriali.
Il genoma nucleare è composto da ca 4x109 coppie di basi,suddivise in 23 coppie di molecole lineari: i cromosomi. Il più piccolo contiene ca. 50.000.000 di nucleotidi,il più grande ca. 250.000.000.
Il Genoma Umano
La Biologia Moderna Progetti Genoma: Perchè?
La determinazione e la conoscenza dell’intera sequenza genomica sembrano essere la condizione necessaria per comprendere la completa biologia di un determinato organismo
In che modo?
Sequenziamento del DNA significa determinazione della sequenza lineare delle basi che lo compongono, cioè A, T, C e G.
Il DNA umano è composto da 3.12 miliardi di paia di basi
Un requisito essenziale alla comprensione della biologia completa di un organismo è la determinazione della sequenza del suo intero genoma
“A prerequisite to understanding the complete biology of an organism is the determination of its entire genome sequence” Fleischmann et al. 1995
La Biologia Moderna: i Progetti Genoma
2000-2001Il Genoma Umano completamente sequenziato e assemblato
1953 James Watson e Francis Crick determinano la struttura del DNA (La doppia elica)
1977 Gli scienziati americani Allan Maxam and Walter Gilbert e l'inglese Frederick Sanger mettono a punto 2 diversi metodi per sequenziare il DNA, cioè per "leggere" la successione di basi nucleotidiche che lo compongono. Il metodo di Sanger, oggi automatizzato, è quello tuttora utilizzato.
1985 Lo scienziato americano Kary Mullis inventa la PCR, una tecnica che permette di moltiplicare artificialmente il DNA, anche se presente in quantità minima.
1986Il premio Nobel Renato Dulbecco e Leroy Hood lanciano l'idea di sequenziare l'intero genoma Umano.
1990 Negli Stati Uniti nasce ufficialmente lo Human Genome Project (HGP), sotto la guida di James Watson. Negli anni successivi Regno Unito, Giappone, Francia, Germania, Cina si uniscono al progetto formando un consorzio pubblico internazionale. In Italia il progetto genoma nasce nel 1987 ma si interrompe nel 1995.
1992 Craig Venter lascia l'NIH e il progetto pubblico. Fonderà una compagnia privata, la Celera Genomics, portando avanti un progetto genoma parallelo.
1993 Francis Collins e John Sulston diventano direttori rispettivamente del National Human Genome Research Center negli USA e del Sanger Center in Inghilterra, i 2 principali centri coinvolti nel HGP.
LE TAPPE DEL PROGETTO GENOMA
1999 (Dicembre) Pubblicata su Nature la sequenza completa del cromosoma 22.
2000 (Maggio) pubblicata su Nature la sequenza completa del cromosoma 21.
2000 (Giugno) Francis Collins e Craig Venter annunciano congiuntamente di aver completato la "bozza" del genoma Umano.
2001 La bozza completa del genoma umano (che gli inglesi chiamano working draft) è pubblicata su Nature (quella del consorzio pubblico) e su Science (quella della Celera).
Celera Genomics (Applera, Applied Biosystems)
Istituzioni pubbliche in:USA,UK,ChinaFranciaGermania
Dimensioni del Genoma in Megabasi
Procarioti Mycoplasma genitalium 0.58Haemophilus influenzae 1.83Escherichia coli 4.7
Eucarioti Saccharomyces cerevisiae 13.5Caenorabditis elegans 100Drosophila melanogaster 165Homo sapiens 3300
Il genoma di un virus è composto da poche migliaia di bp
Genoma Umano>3.000.000.000
Geni e sequenze associate circa 900.000.000
DNA extragenico circa 2.100.000.000
Codificante90 .000.000
Non codificante810.000.000
DNA ripetitivo420.000.000
DNA unico e a basso numero
di copie1.680.000.000
PseudogeniIntroni
Regioni dicontrollo
Ripetuto in tandem
Satellite
Minisatelliti Microsatelliti
Disperso
SINE LINE
Retroposoni
Il DNA spazzatura è veramente tale?
• 1-Geni
• 2-pseudogeni
• 3-ripetizioni
• 4-minisatelliti
• 5-significato ignoto
GENI E SEQUENZE CORRELATE
-DNA codificante-DNA non codificante
Funzione dei geni negli eucarioti superiori
•Geni che codificano per prodotti proteici;
•Geni che codificano per RNA non codificanti (RNA-genes).
I geni possono essere classificati, oltre che per la
funzione, anche per la rappresentatività e per
l’organizzazione
•Geni singoli•Geni ripetuti•Geni appartenenti a famiglie
•Geni in clusters•Geni interspersi nel genoma
• CONVENZIONALI: gene inattivato a causa di una o più mutazioni
• MATURATI: anomala espressione genica
PSEUDOGENI: copia non funzionante di un gene
Il genoma nucleare contiene una grande quantità di sequenze ripetute che sono in gran parte inattive da un
punto di vista trascrizionale
A. DNA RIPETUTO IN TANDEM
B: DNA RIPETTUTO INTERSPERSO
DNA RIPETUTO
Classi principali del DNA ripetuto in tandem
Il DNA satellite è lungo e ripetitivo (riptetizioni di 171 nucletidi) e costitutisce la massa principale dell’eterocromatina. E’ il cosiddetto DNA alfoide o satellite a, 3-5% ogni cromosoma. Funzione poco chiara, probabilmente svolgono un ruolo strutturale.Satellite 2 e 3 contengono schiere di sequenze che si basano sulla ripetizione in tandem ATTCC
Il DNA minisatellite è ipervariabile ed è altamente polimorfico. Sono più di 1000 scheramenti (100-20.000 bp) di corte unità ripetute in tandem. La sequenza centrale è GGGCAGGAXGImportante da punto di vista diagnostico: zona del DNA fingerprint.Un minisatellite particolare è costituito dall’unità ripetuta TTAGGG (10-15 kb), localizzato nei telomeri. Ha funzione protettiva dei cromosomi.
Il DNA microsatellite contine sequenze di 1-4 nucletidi ripetuti in tutto il genoma. Le più comuni sono le dinucletidiche CA (0.5% del genoma; anche questo è altamente polimorfico.
Organizzazione dei DNA satelliti nei centromeri
DNA RIPETUTO INTERSPERSOViene suddiviso in due principali famiglie:
•Short Interspersed Nucleotide Elements;
•Long Interspersed Nucleotide Elements
Classe Famiglia Dimensioni unitàripetuta
N° copie % Genoma
SINE Alu
MIR
0,3 kb lunghezzacompletaDimensionemedia 0,13 kb
1.200.000 ca
450.000 ca
10,7% ca
2,5% ca
LINE LINE-1 (Kpn)
LINE -2
6,1 kb lunghezzacompleta, ma ledimensioni mediesono 0,8 kbDimensionemedia 0,25 kb
2600.000 ca
370.000
17,3%
3,3%
LTR ERV Dimensionemedia 1,3 kb
240.000 4,7%
Trasposoni aDNA
MER-1 (Charlie) Dimensionemedia 0,25 kb ca
213.000 1,4%
Il DNA mitocondriale 0.0005% del genoma umano
- doppio filamento a diversa composizione:
filamento heavy (H) e light (L)
- eredita’ matroclina
- contiene 37 geni, 28 su filamento H e 9 su filamento L
- dei 37 geni, 24 codificano per prodotti maturi ad RNA e 13 per polipeptidi dei complessi multimerici del mitocondrio (concetto di semiautonomia)
- i geni sono estremamente compatti: privi di introni
sovrapposti parzialmente (subunita’ 6 e 8 dell’ATPasi)
trascritti privi di codoni di stop
globin
Exon 2Exon 1 Exon 3
5’ flanking 3’ flanking
(chromosome 11)
*5.000
*20
6*104 bp
3.2*109 bp
*103
3*103 bp
ATTGCCATGTCGATAATTGGACTATTTGGA 30 bp
Myoglobin globin
aa aa aa aa aa aa aa aa aa aa
DNA:
Protein:
1
2 3
4 56 7
8 9X
Y151413121011
2120191817
1622
279251
221197 198
176 163 148 140 143 148 142118 107 100
10488 86
72 66 45 48
163
51
mitochondria
.016
Top Related