Struttura dei genomi delle piante - distagenomics.unibo.it · • L’obiettivo è sostituire con...

18
Struttura dei genomi delle piante Genomi sequenziati Caratteristiche dei genomi delle piante Classi di geni e funzioni Trasposoni e dimensioni dei genomi Sintenia e colinearità Livelli di organizzazione entro i genomi: antiche duplicazioni e paleogenomica Da uno a mille genomi per specie

Transcript of Struttura dei genomi delle piante - distagenomics.unibo.it · • L’obiettivo è sostituire con...

Struttura dei genomi delle piante

• Genomi sequenziati• Caratteristiche dei genomi delle piante• Classi di geni e funzioni • Trasposoni e dimensioni dei genomi• Sintenia e colinearità• Livelli di organizzazione entro i genomi: antiche

duplicazioni e paleogenomica• Da uno a mille genomi per specie

Piante a genoma sequenziatoDa: Plant Genome DataBase (http://www.plantgdb.org/prj/GenomeBrowser/)

+ Cetriolo (2009), Melo (Ottobre 2010), Patata, Pomodoro, Caffè, Cacao, etc.

Specie Genoma (Mb)

Geni (n.)

Arabidopsis thaliana 125 25500Oryza sativa 430 30-60000

Saccharomyces cerevisiae 12.1 5800Caenorhabditis elegans 97 19000Drosophila melanogaster 180 13600Fugu rubripes 400 31000Mus musculus 3000 30000Homo sapiens 3200 30-40000

Escherichia coli 4.64 4400

Dimensioni del genoma e numero di geni

Genomi delle piante a confronto

Da: Velasco et al. 2010 The genome of the domesticated apple. Nature Genetics

Table I. DNA content and genome size of different members of family Poaceae

PlantChromosome

No.Genome

Size DNA Content 2Cn Mb pg

Rice 12 415 0.9

Sorgo 10 750 1.6

Pennisetum americanum 7 2,410 4.8Maize 10 2,500 5.6Barley 7 5,000 10.1Aegilops tauschii 7 4,000 10.3Triticum monococcum 7 5,750 11.9Wheat 21 16,000 33.1

Da: D. Sandhu and K.S. Gill, Gene-containing regions of wheat and the other grass genomes. Plant Physiol. 128 (2002), pp. 803–811.

Confronto tra le dimensioni del genoma di alcune specie di cereali

Esempio di 50 kb di sequenza genomica in uomo, lievito, Drosophila, mais e Escherichia coli, perillustrare la diversa densità genica e la distribuzione delle sequenze ripetute. Le 5 sequenze non sonotra loro omologhe. (Figura 17.22, pag 805, Barcaccia Falcinelli Vol. III)

Confronto tra organizzazione di genomi

A: Densità dei geni: varia tra 1 e 38 geni per 100 kb.

B: Coincidenza tra geni e EST presenti in database. Varia tra 1 e 200 coincidenze per 100 kb.

C: Densità di elementi transposibili: varia tra 1 e 33 per 100 kb.

D: Porzioni ad elevata omologia con sequenze mitocondriali e/o cloroplastiche.

E: Geni per RNA non codificanti (tRNA, snRNA ed altri).

Telomeri e centromero non in scala.

Da: Analysis of the genome sequence of the flowering plant Arabidopsis thaliana, Nature (2000) 408:797-815.

ABCDE

Cromosoma 1 di Arabidopsis

Distribuzione di geni ed altre strutture sui cromosomi

• È stato sperimentalmente verificato che le differenze nelledimensioni del corredo aploide dei genomi tra le specie di cerealicoltivati sono principalmente dovute al livello di duplicazione disequenze trasponibili

• Ca. l’80% del genoma di mais è costituito da elementi trasponibili(il 50% del genoma costituito da retrotrasposoni), contro ca. il 25%di riso ed il 10% del genoma di Arabidopsis.

• Molti trasposoni si concentrano nelle zone centromeriche.

• I retrotrasposoni tendono a proliferare in zone intergeniche.

Dimensioni dei genomi e DNA ripetuto

Distribuzione di elementi trasponibili nel cromosoma 1 di Arabidopsis

Cromosoma 1 di Arabidopsis

(Trasposoni a DNA)(Retrotrasposoni)

Densità di elementi

trasponibili

Rappresentazione schematica di cromosoma di frumento che illustra la distribuzione dei geni nei genomi dei cereali. Gli ingrandimenti a destra sono esempi di regioni povere di gene (sopra) e ricche di geni (sotto).

Sandhu and Gill. Gene-containing regions of wheat and the other grass genomes. Plant Physiol. 128 (2002), pp. 803–811.

Regioni ricche e povere di geni e ‘Gene islands’

Sintenia (definizioni)Sintenia (inglese: synteny): originariamente indicava la situazione in cui due geni sitrovano sullo stesso cromosoma (senza implicazioni di linkage). Attualmente, indicala situazione in cui, tra specie diverse filogeneticamente imparentate, è possibileidentificare regioni cromosomiche che derivano dal medesimo cromosoma ancestralee mantengono similarità nel contenuto di geni e/o marcatori. Si può riconosceresintenia anche tra cromosomi (o porzioni di cromosomi) all’interno dello stessogenoma (= stessa specie) laddove il genoma abbia subito fenomeni di duplicazioni.

Colinearità (inglese: collinearity): mantenimento dell’ordine genico all’interno dicromosomi o porzioni di cromosomi sintenici.

Ortologhi (inglese: orthologous genes or orthologs): geni o loci di specie diverse chesi sono originati da un antenato comune.

Paraloghi (inglese: paralogous genes or paralogs): geni o loci all’interno della stessaspecie e che si sono originati da un antenato comune.

Omologhi (Inglese.: homologous genes or homologues): geni di simile funzione edoriginati da un antenato comune.

Omeologhi (inglese: homoeologous genes or homoeologs): geni o cromosomi digenomi diversi in specie poliploidi che si sono originati da un antenato comune.

Sintenia e colinearità

Mod. da Keller and Feuillet. 2000. Colinearity and gene density in grass genomes. Trends Plant Sci. 5:246-251.

X, Y, Z = specie diverse

A, B, C, D, E = loci (o marcatori)

Sintenia Colinearità Microcolinearità(livello di conservazione nell’ordine in segmenti cromosomici circa <50 kb)

Geni

Altri livelli di organizzazionedei genomi

• Nella maggior parte dei genomi degli eucarioti si possono riconoscere, tramiteanalisi comparativa di sequenze entro genoma, delle relazioni di omologia traregioni cromosomiche. Sono le vestigia di antiche duplicazioni del genoma aseguito di eventi di poliploidizzazione.

• Molte specie vegetali mostrano eventi multipli di duplicazione.

• Si ritiene che tutti i genomi delle attuali dicotiledoni siano almeno esaploidi.

• Anche Arabidopsis, ritenuta a lungo possedere un semplice genoma diploide, haun genoma altamente complesso.

• Caso del mais (duplicazione recentissima – 10 milioni anni fa – e profondoriarrangiamento).

• Caso del melo (duplicazione relativamente recente – 50 milioni anni fa – conparziale riarrangiamento).

• Caso della vite (assenza di duplicazioni recenti – in evidenza l’antica naturaesaploide di tutte le dicotiledoni).

Antiche e recenti duplicazioni dell’intero genoma nelle piante

Gli eventi di duplicazione dell’intero genoma sono comuni nella storia evolutiva delle angiosperme

Adams and Wendel, 2005, Polyploidy and genome evolution in plants. Current Opinion in Plant Biology 8:135–141

Filogenesi dei frumenti

Da: Barcaccia e Falcinelli, pag. 264, vol. I.

Riduzione di colinearità per duplicazione del genoma

•Il raddoppiamento del genoma causato da eventi di duplicazione genomica (es. allopoliploidizzazione) produce ridondanza genica funzionale all’interno della stessa specie.

•una delle copie di ciascuna coppia di geni omeologhi si svincola dalla pressione selettiva e può i) evolvere nuove funzioni o profilo di espressione, diventare vantaggiosa e quindi essere mantenuta, oppure ii) (più spesso) essere eliminata a seguito di riduzione in pseudogene

•come conseguenza, nei cromosomi omeologi si osserva perdita differenziale di geni e si arriva alla graduale scomparsa di colinearità tra cromosomi.

Adams and Wendel, 2005, Polyploidy and genome evolution in plants. Current Opinion in Plant Biology 8:135–141

Genotyping-by-sequencing• Le tecnologie di next generation sequencing sono in via di applicazione anche

direttamente alla popolazioni sperimentali di incrocio• L’obiettivo è sostituire con il sequenziamento diretto, a medio-bassa copertura, il

lavoro di genotipizzazione normalmente svolto con marcatori SSR, SNP, ecc.• E’ reso possibile dall’elevato volume di dati prodotti dalle nuove tecnologie. • I vantaggi sono molteplici: perfetta definizione del numero e della posizione dei

crossing-over, indipendenza da bias introdotti dall’utilizzo di marcatori sviluppati in determinati background genetici, possibilità di identificare riarrangiamenti cromosomici di medie dimensioni.

• E’ già in via di utilizzo nei grandi centri di genomica per studi in Arabidopsis, mais e riso.