UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si...

84
1 UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA Corso di Laurea in Scienze e Tecnologie Agrarie Tesi di laurea: Sequenze ripetute nel genoma di girasole: trasposoni e LINE (Long Interspersed Elements) Relatore: Prof. Andrea Cavallini Correlatore: Dott.ssa Laura Pistelli Candidato: Andrea Donati Anno Accademico 2006/2007

Transcript of UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si...

Page 1: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

1

UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA

Corso di Laurea in Scienze e Tecnologie Agrarie

Tesi di laurea:

Sequenze ripetute nel genoma di girasole: trasposoni e LINE (Long Interspersed Elements)

Relatore: Prof. Andrea Cavallini Correlatore: Dott.ssa Laura Pistelli

Candidato: Andrea Donati

Anno Accademico 2006/2007

Page 2: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

2

Indice

Riassunto....................................................................................................................pag. 5

Introduzione...............................................................................................................pag. 6

1. La struttura del genoma eucariotico..........................................................pag. 6

1.1. Gli elementi trasponib............................................................................pag. 5

1.1.1. La classificazione degli elementi trasponibili.........................................pag. 8

1.1.2. Gli elementi di classe I...........................................................................pag. 9

1.1.3. Elementi di classe II: i trasposoni a DNA...........................................pag. 14

2. La regolazione della trasposizione...........................................................pag. 18

2.1 La metilazione del DNA.............................................................................pag. 18

2.2 L’RNA interference.....................................................................................pag. 18

2.3 Attivazione della trascrizione dovuta a stress biotici e abiotici.................pag. 20

2.4 Regolazione self ed il modello a “bambole russe”....................................pag. 20

3. Il girasole come sistema modello per lo studio della composizione del

genoma.......................................................................................................pag. 22

3.1. Le Asteraceae............................................................................................pag. 23

3.2. Il girasole...................................................................................................pag. 24

3.3. Il frutto.......................................................................................................pag. 25

3.4. Origine del girasole...................................................................................pag. 26

3.5. La libreria di DNA.....................................................................................pag. 27

Scopo della tesi.........................................................................................................pag. 28

Materiali e metodi....................................................................................................pag. 29

5.1. Il materiale vegetale...................................................................................pag. 29

5.2. Analisi di sequenze....................................................................................pag. 29

5.3. Analisi del DNA genomico.......................................................................pag. 30

5.3.1. Isolamento del DNA genomico........................................................pag. 30

5.3.2. Purificazione del DNA con RNAsi..................................................pag. 31

5.3.3. Quantizzazione del DNA estratto.....................................................pag. 32

Page 3: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

3

5.3.4. Amplificazione mediante PCR delle sequenze ripetute da

analizzare..........................................................................................................pag. 34

5.5. Slot Blot......................................................................................................pag 36

5.5.1. Trasferimento del DNA su membrana..............................................pag. 36

5.5.2. Ibridazione con sonde marcate.........................................................pag. 37

5.5.3. Lavaggi delle membrane..................................................................pag. 37

5.5.4. Rivelazione del segnale di ibridazione (Detection)..........................pag. 38

5.6. Analisi dell’RNA.......................................................................................pag. 40

5.6.1. Isolamento di RNA dai tessuti..........................................................pag. 40

5.6.2. Rimozione del DNA.........................................................................pag. 41

5.7. Valutazione dell’espressione mediante RT-PCR.......................................pag. 42

5.7.1. Retrotrascrizione dell’RNA..............................................................pag. 42

5.7.2. Amplificazione del cDNA................................................................pag. 43

Risultati e discussione...............................................................................................pag. 45

6.1. Analisi delle sequenze...............................................................................pag. 45

6.2. Il trasposone HAG003H10........................................................................pag. 46

6.3. Il trasposone HAG003I05.........................................................................pag. 52

6.4. Il LINE HAG004M10................................................................................pag. 57

6.5. Numero di copie delle sequenze studiate nel genoma di girasole e di altre

specie del genere Helianthus......................................................................pag. 61

6.6. Espressione delle sequenze studiate..........................................................pag. 63

Conclusioni...................................................................................................................pag. 67

Bibliografia...................................................................................................................pag. 69

Ringraziamenti..............................................................................................................pag. 84

Page 4: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

4

Portami tu la pianta che conduce

dove sorgono bionde trasparenze

e vapora la vita quale essenza;

portami il girasole impazzito di luce.

(Eugenio Montale, Ossi di Seppia)

Page 5: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

5

Riassunto

La conoscenza della composizione della componente ripetitiva del genoma ha

una duplice importanza sia dal punto di vista teorico che applicativo, per migliorare le

strategie nella mappatura del genoma e al fine di scoprire nuovi markers molecolari.

Inoltre, una conoscenza accurata del genoma è indispensabile per iniziare un processo di

sequenziamento rivolto sia alle ESTs (Expressed Sequence Tags) che alle regioni

genomiche.

Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante

Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare

riferimento al girasole.

Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo in esame

alcune famiglie di DNA ripetitivo che di solito nelle piante sono poco rappresentate e che

risultano quindi poco studiate; in particolar modo mi sono soffermato su due tipologie di

elementi trasponibili: i trasposoni e i LINEs.

I trasposoni sono elementi trasponibili di classe II e si spostano nel genoma

attraverso un intermedio a DNA secondo un modello conservativo “cut & paste” (“taglia

e incolla”) grazie all’attività dell’enzima trasposasi da essi codificato, che riconosce

univocamente brevi sequenze TIR (Terminal Inverted Repeats).

I cosiddetti LINEs (Long INterspersed Elements), invece, sono elementi di

classe I, che si spostano mediante retrotrascrizione di un intermedio di RNA utilizzando

enzimi codificati dall’elemento; sono ritenuti il più antico gruppo di retrotrasposoni.

Nel corso della tesi sono state identificate, analizzando una library di piccoli

inserti di DNA genomico di girasole, tre sequenze, corrispondenti a due trasposoni e ad

un LINE. Queste sequenze sono state analizzate in riferimento a sequenze similari di

altre specie vegetali ed è stato valutato il numero di copie in girasole ed in altre specie

del genere Helianthus. É stata studiata, infine, l’espressione di queste sequenze mediante

RT-PCR: sia i trasposoni che il LINE sono risultate espresse costitutivamente, sia in

tessuti adulti (foglie) che in tessuti embrionali.

Page 6: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

6

INTRODUZIONE

1. LA STRUTTURA DEL GENOMA EUCARIOTICO

Ogni organismo vivente possiede un genoma contenente le informazioni

biologiche necessarie alla costruzione ed al mantenimento dell’organismo stesso. Il

genoma rappresenta l’intero contenuto di DNA della cellula che, nelle piante, oltre al

DNA nucleare e mitocondriale, comprende anche quello dei cloroplasti.

Tutti i genomi eucariotici nucleari sono divisi in molecole lineari di DNA

detti cromosomi. All’interno di ciascun cromosoma si trovano unità discrete di DNA

soggette a trascrizione, dette geni. Bisogna tuttavia notare come in molte specie,

soprattutto appartenenti al regno vegetale, la maggior parte del genoma non sia costituito

non da DNA genico, ma da DNA apparentemente non codificante e altamente o

mediamente ripetuto.

Nonostante le strutture fisiche di base di tutti i genomi nucleari eucariotici

siano simili, la dimensione del genoma presenta un alto grado di variabilità. La

correlazione tra complessità dell’organismo e dimensioni del genoma non ha un

andamento lineare: tale mancanza di una precisa correlazione tra queste due variabili

viene definita come ‘paradosso del valore C’ (Thomas 1971) e proprio sequenze non

alleliche di DNA ripetitivo strettamente correlate sono responsabili di questo fenomeno.

Studi sulle cinetiche di riassociazione hanno portato alla suddivisione del

genoma di un eucariote in tre grandi classi di sequenze:

• DNA in singola copia o in numero molto basso di copie;

• DNA mediamente ripetuto (sequenze ripetute 102-104 volte entro il genoma);

• DNA altamente ripetuto (sequenze ripetute 104-106 volte entro il genoma).

A loro volta, le sequenze di DNA ripetuto possono avere due differenti tipi di

organizzazione:

- DNA ripetuto in tandem, costituito da blocchi di sequenze che si ripetono

una dietro l’altra (Singer 1982) e che generalmente sono localizzate a livello dei telomeri

Page 7: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

7

(Vershinin et al. 1995; Ohmido et al. 1997) od in prossimità del centromero (Thompson

et al. 1996).

Il DNA altamente ripetuto in tandem può a sua volta essere diviso in due

classi che si differenziano per le dimensioni sia della singola unità ripetuta, sia del blocco

formato dalle stesse unità ripetute. Il DNA ripetuto in tandem sembra non essere

trascritto e costituisce la maggior parte delle regioni eterocromatiche del genoma. Sono

sequenze ripetute in tandem i minisatelliti, unità di 9-100 bp ripetute a formare blocchi

lunghi fino ad alcune Kbp, con localizzazione prevalentemente subtelomerica; e i

microsatelliti, unità molto piccole di 1-4 bp che spesso costituiscono blocchi inferiori a

150 bp, generalmente distribuiti su tutto il genoma.

- DNA ripetitivo non raggruppato o intersperso: famiglie di DNA costituite da

sequenze probabilmente di origine virale integratesi nel genoma ospite (Boeke e Corces

1989; Doolittle et al. 1989; Bennetzen 1993). Tali sequenze sono assai eterogenee nella

forma e nella struttura, e comune è soltanto la loro capacità di spostarsi all’interno del

genoma. Questi elementi mobili vengono comunemente definiti ‘elementi trasponibili’.

1.1 GLI ELEMENTI TRASPONIBILI

Gli elementi trasponibili sono porzioni di DNA presenti in tutti i genomi, in

grado di cambiare la loro posizione all’interno del genoma e/o aumentare il loro numero

di copie, indipendentemente dalla moltiplicazione cellulare. Gli elementi trasponibili

sono dunque elementi mobili endogeni, con un’ampia varietà strutturale e in grado di

muoversi attraverso molteplici meccanismi di trasposizione. Le conseguenze delle

modifiche genomiche attuate dai suddetti elementi possono essere notevoli all’interno di

una specie, poiché la loro attività (taglio, trasposizione, inserzione, rottura cromosomica,

amplificazione, ricombinazione) può seriamente alterare la struttura dei vari geni.

Per tali ragioni, la comprensione del genoma e della sua evoluzione non può

prescindere dallo studio degli elementi mobili e dalla regolazione della loro attività.

Dopo essere stati scoperti per la prima volta nel genoma di piante di Zea mays

(Mc Clintock 1946), gli elementi trasponibili sono stati individuati nel tempo in tutti gli

eucarioti e sono stati oggetto di studio in numerose piante. In alcune piante, infatti, gli

elementi trasponibili rappresentano una porzione preponderante del genoma nucleare,

con percentuali anche superiori al 50% (es. in molte triticacee come Hordeum è stata

riscontrata una percentuale dell’85 %; SanMiguel e Bennetzen 1998). Esistono molte

Page 8: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

8

categorie di elementi trasponibili, tutte presenti nelle piante, e verranno descritte nei

prossimi paragrafi.

Gli elementi trasponibili sono stati definiti DNA “egoista” o “parassita”

(Orgel e Crick 1980) per la loro capacità di “colonizzare” il genoma, aumentando il loro

numero di copie, utilizzando gli strumenti metabolici dell’ospite; gli organismi superiori

hanno di contro evoluto dei sistemi di regolazione e controllo (es. metilazione del DNA)

che mirano a limitarne l’espansione.

Recentemente il ruolo degli elementi trasponibili è stato notevolmente

rivalutato, poiché si ipotizza possano aver contribuito al rimodellamento del genoma e

alla formazione di nuovi geni. Oggi si tende anche a definire gli elementi trasponibili

come partners “simbiontici” dell’ospite, la cui attività ha conseguenze neutre, favorevoli

o dannose nei confronti del genoma ospite; per tali ragioni gli elementi trasponibili sono

stati anche definiti i “Dr. Jekyll e Mr. Hyde” del genoma (Kemken e Windhofer 2001).

1.1.1 La classificazione degli elementi trasponibili

Gli elementi trasponibili possono essere autonomi o non autonomi: quelli

autonomi possiedono sequenze codificanti per i prodotti necessari alla trasposizione,

dette ORF (Open Reading Frames).

Gli elementi trasponibili non autonomi derivano probabilmente da elementi

autonomi che a causa di una delezione nei segmenti interni hanno perso l’abilità di

trasporsi pur contenendo sequenze cis per la trasposizione. Per svolgere la trasposizione

gli elementi non autonomi si avvalgono degli enzimi codificati in trans da elementi

autonomi e per tali motivi sono stati anche definiti “parassiti di parassiti” (Sabot et al.

2006). I trasposoni si suddividono in due classi specifiche, a seconda del tipo di

intermedio utilizzato nella trasposizione: Classe I e Classe II.

Page 9: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

9

1.1.2. Elementi di classe I

Gli elementi trasponibili appartenenti alla classe I utilizzano un intermedio a

RNA durante la trasposizione. L’RNA intermedio processato durante la trasposizione è

retrotrascritto in DNA grazie ad una trascrittasi inversa.

I retrotrasposoni

I retrotrasposoni vengono suddivisi in due grandi gruppi a seconda della

presenza o meno di lunghe sequenze che fiancheggiano ad entrambe le estremità

l’elemento stesso, dette LTR (Long Terminal Repeats). A loro volta, i retrotrasposoni con

LTR, a seconda della disposizione genica, si suddividono in due categorie principali,

dette Ty1-copia e Ty3-gypsy. L’organizzazione strutturale di questo gruppo di elementi

autonomi parte dallo stretto legame con le proprie sequenze ripetute terminali; nel

dominio interno, tra le LTR, ci sono i siti primari entro cui avviene la retrotrascrizione:

rispettivamente PBS e PPT. Il dominio interno contiene anche delle sequenze codificanti

le proteine necessarie per la retrotrascrizione. Di solito, i geni codificanti le proteine Gag

ed Env (spesso assente) costituiscono ORF distinti dal gene Pol, altre volte formano un

unico ORF.

I domini individuabili nella parte codificante sono: GAG, codificante le

proteine del capside; AP, per una aspartico-proteasi; RT-RNaseH, codificante una

proteina con duplice funzione di trascrittasi inversa (RT) e di ribonucleasi (RNaseH); IN,

per una integrasi.

L’ordine e l’omologia di sequenza della parte codificante definiscono le

maggiori classi in cui sono suddivisi i retrotrasposoni (Xiong e Eickbush, 1990). Le

principali classi sono, come dicevamo, i gypsy e i copia, i quali differiscono per la

posizione del gene dell’integrasi rispetto a quello dell’RT-RNaseH. Inoltre nelle piante,

la maggior parte dei gypsy (figura 1) (Vicient et al., 2001a) e dei copia (figura 2) (Laten

et al., 2005) contiene un terzo ORF che codifica per un polipeptide forse una

reminiscenza retrovirale, che codificherebbe proteine dell’involucro (“envelope”) virale e

che potrebbe consentire la trasmissione dell’elemento da cellula a cellula.

Fig. 1 – La struttura del retrotrasposone Ty1-copia

Page 10: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

10

Fig. 2 – La struttura del retrotrasposone Ty3-gypsy

Il “ciclo vitale” dei retrotrasposoni

Un retrotransposone integrato nel DNA genomico viene trascritto e l’mRNA

processato e tradotto utilizzando gli enzimi e le strutture della cellula ospite. Nel

citoplasma i trascritti maturi vengono tradotti generalmente come due “open reading

frames” corrispondenti alle proteine Gag e Pol.

Per quanto riguarda gli elementi non autonomi, essi sono parzialmente o

completamente privi di ORF quindi non sono in grado di replicarsi autonomamente, ma,

se trascritti, possono utilizzare proteine Gag e Pol eterologhe, cioè prodotte da altri

elementi. La retrotrascrizione richiede il riconoscimento da parte di una trascrittasi

inversa (omologa od eterologa) che, utilizzando inneschi omologhi al PBS e al PPT, retro

trascrive l’RNA a cDNA a doppio filamento. Il successivo inserimento dell’elemento nel

nucleo e poi nel genoma avviene grazie a un’integrasi, che riconosce le LTR

dell’elemento.

Fig. 3 – Il “ciclo vitale” dei retrotrasposoni.

Page 11: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

11

I LINEs

Altri retrotrasposoni sono i cosiddetti LINEs (Long INterspersed Elements),

privi di LTR. Sono ritenuti il più antico gruppo di retrotrasposoni; nei mammiferi sono

molto diffusi (nel genoma umano, per esempio, si arriva a 850.000 LINEs, che

costituiscono ben il 21% dell’intero genoma). I retrotrasposoni con LTR si sarebbero

originati dopo, in seguito all’acquisizione delle LTR da parte dell’elemento ancestrale.

Essendo privi di LTR, i LINEs hanno un meccanismo di replicazione leggermente

differente.

I LINEs (figura 4) sono tipicamente composti da due ORF, ORF1 e ORF2,

entrambi codificanti le proteine indispensabili per il meccanismo di retrotrasposizione

(Feng et al., 1996; Moran et al., 1996). La proteina ORF1 ha la caratteristica di legarsi

agli acidi nucleici e si lega specificatamente al suo stesso RNA (Hohjoh and Singer, 1996;

Kolosha and Martin, 1997) inoltre, la ORF1 può formare con altre copie di sé stessa una

struttura multipla (Hohjoh e Singer, 1996; Martin et al., 2003). Questa caratteristica è

simile a quella delle proteine dei geni gag dei retrovirus, il che suggerisce che l’ORF1

formi un intermedio ribonucleoproteico (RNP) con l’RNA del LINE.

Fig. 4 – La struttura di un LINE

Per quanto riguarda il meccanismo di trasposizione, i LINEs utilizzano lo

stesso sistema di tutti i retrotrasposoni, del tipo “copy and paste” (copia e incolla), in cui

l’ RNA trascritto dell’ elemento viene retrotrascritto ed integrato in un altro sito del

genoma. In questo sistema agisce la proteina ORF2, che consta di un dominio per un’

endonucleasi (EN) e di un dominio per la retrotrascrittasi (RT). Anche la proteina ORF1

potrebbe avere un ruolo nella trasposizione, ma questa funzione è ancora oggetto di

studio e di dibattito.

Durante la retrotrasposizione, le proteine codificate sono trasferite

sull’mRNA maturo del LINE e formano con questo il complesso intermedio

ribonucleoproteico. Il complesso RNP si muove fino a un sito bersaglio su un

cromosoma dell’ospite; a questo punto si attiva l’ endonucleasi che taglia il DNA

dell’ospite.

Page 12: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

12

Adesso la RT può agire retrotrascrivendo l’mRNA del LINE in DNA; il

primer utilizzato corrisponde alla sequenza in 3′ generata dal taglio (Luan et al., 1993;

Cost et al., 2002). Questa reazione è chiamata “target-primed-reverse transcription”

(TPRT). L’RNAsi elimina lo stampo di mRNA.

Dopo la TPRT, la sequenza di DNA neoformata viene integrata nel genoma

dell’ospite; il meccanismo d’integrazione non è ancora stato definito con precisione, ma

dovrebbe intervenire l’integrasi prodotta dal LINE.

I LINE sono classificati in più di 10 famiglie (detti “clade”) basandosi

sull’analisi filogenetica dei domini RT dei LINE (Malik et al., 1999).

I LINE possono essere inoltre suddivisi in due gruppi, quelli cosiddetti

“severi” e quelli “rilassati”. La differenza sta nel riconoscimento da parte del complesso

enzimatico del LINE della coda in 3′ (Okada et al., 1997). Il complesso enzimatico del

tipo “severo” riconosce solo e soltanto la propria estremità di mRNA in 3’.

Nel tipo “rilassato”, invece, durante la retro trasposizione, il complesso

enzimatico è aspecifico, può legarsi anche ad elementi eterologhi (Moran et al., 1996;

Kajikawa and Okada, 2002). Dati sperimentali sul baco da seta (Osanai et al., 2004; Luan

ed Eickbush, 1995) indicano che molte famiglie di LINE sono del tipo “severo”.

Nell’uomo, l’unico esempio noto di tipo “rilassato” è la famiglia L1 (Moran et al., 1996).

I SINEs

I SINEs (Short INterspersed Elements) sono piccoli retrotrasposoni che non

esprimono alcuna funzione di trasposizione attiva. Sono caratterizzati da un promotore

per la polimerasi III al 5' e la coda al 3' (figura 5) mostra una significativa omologia con

quella dei LINEs presenti nello stesso genoma (Feschotte et al, 2002). Tutti i SINEs noti

derivano dai prodotti dell’RNA polimerasi III che sembrano aver evoluto la capacità di

replicarsi ed essere integrati per mezzo delle proteine espresse dai LINEs. A questo

proposito i SINEs sono simili agli pseudogeni, le molecole di mRNA prive di introni che

sono occasionalmente retrotrascritte ed inserite nel genoma eucariotico.

In effetti, le similitudini nelle dimensioni del DNA fiancheggiante, la

presenza di code di poli-A integrate e la proporzionalità diretta con la frequenza dei

LINEs e degli pseudogeni suggeriscono che i SINEs possono usare le funzioni

Page 13: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

13

specificate dai LINEs (Kumar e Bennetzen, 1999), incorporando il loro RNA nelle

particelle citoplasmatiche dei LINEs (Grandbastien, 1999)

Fig. 5 – La struttura di un SINE

Contrariamente a quanto accade negli animali però, dove i SINEs sono

relativamente frequenti, nelle piante la loro presenza sembra essere ben poco rilevante

(Bennetzen, 1993; Grandbastien, 1992).

I TRIMs

I TRIMs (Terminal repeat Retrotrasposons In Miniature) sono un nuovo

gruppo di retrotrasposoni recentemente individuato (Witte 2001). I TRIMs presentano

corte sequenze di circa 500 bp e regioni LTR chiamate TDR (Terminal Direct Repeats) e

senza i geni propri dei retrotrasposoni completi.

La prova che un tempo i TRIM fossero elementi mobili con un genoma

autonomo è suggerita dal fatto che possono trasporsi, se, una volta trascritti, trovano

disponibili nel citoplasma gli enzimi adeguati.

I LARDs

I LARD (LArge Retrotrasposons Derivatives) sono stati individuati per la

prima volta in orzo (Kalendar et al., 2003); hanno la particolarità di non presentare ORF

ma possiedono ampie regioni LTR (di circa 4,5 kb). Come gli altri elementi non

autonomi, hanno bisogno di proteine eterologhe per trasporsi.

Gli elementi “Morgane”

Gli elementi Morgane sono simili a retrotrasposoni con LTR, ma presentano

una estesa delezione dei domini centrali con rimozione del gene Gag; inoltre, il gene Pol

si presenta altamente degenerato nella sequenza (Sabot et al., 2006).

Page 14: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

14

Fig. 6 – La struttura degli elementi TRIM, LARD e Morgane a confronto con un elemento autonomo.

1.1.3. Elementi di classe II: i trasposoni a DNA

Gli elementi trasponibili di classe II traspongono attraverso un intermedio a

DNA secondo un modello conservativo “cut & paste” (“taglia e incolla”). La sequenza di

DNA dell’elemento mobile si muove da un sito “donatore” ad un altro locus genomico,

definito sito “accettore”; questo è possibile grazie all’attività dell’enzima trasposasi

capace di riconoscere univocamente brevi sequenze TIR (Terminal Inverted Repeats) .

L’enzima è codificato dall’elemento stesso (Figura 6). Come per gli elementi

di classe I si definiscono ‘elementi autonomi’ soltanto quegli elementi che contengono la

sequenza codificante per la trasposasi completa; gli ‘elementi non autonomi’ la

contengono solo in parte o riarrangiata. Sia le TIRs che la presenza di motivi conservati

all’interno del gene per la trasposasi giocano un ruolo assai importante per classificare i

trasposoni di classe II in sette differenti superfamiglie (Robertson 2002).

Page 15: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

15

Fig. 7 - Struttura degli elementi di classe II.

Figura 8 - Modello di trasposizione "cut & paste" degli elementi di classe II.

Un tipico elemento mobile autonomo della Classe II è costituito da due TIRs

(Terminal Inverted Repeats), lunghe da 11 bp a qualche centinaio di nucleotidi (nella

classe Mutator) e da ORF interni codificanti una specifica trasposasi (Figura 7). Gli

elementi non autonomi che difettano per la trasposasi possono mobilizzarsi in trans

solamente se possiedono TIRs riconoscibili e non difettose. Questi elementi difettivi si

originano probabilmente da una riparazione incompleta del doppio filamento dopo il

taglio effettuato da elementi autonomi (Plasterk, 1991).

Alla classe II appartengono 7 superfamiglie di trasposoni: gli elementi Ac/Ds,

Spm/dspm, CACTA, il sistema Mutator (MuDR) del mais, gli elementi Tam del genoma

della bocca di leone, gli elementi Mutator-like (MULE) e i MITEs.

Page 16: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

16

Oltre a questi, recentemente sono stati scoperti gli elementi FoldBack, che

presentano un meccanismo di trasposizione ancora non del tutto chiaro (è stato proposto

un modello di trasposizione con un intermedio a RNA) ed è stato ipotizzato possano

essere lunghi MITE derivati da varie tipologie di elementi di classe II.

Gli elementi Mutator–like (MULE) sono elementi mobili in grado di catturare

sequenze geniche tramite un meccanismo ancora da dimostrare e sono stati scoperti nel

genoma di Zea mays (Talbert e Chandler, 1988) e Arabidopsis thaliana (Yu et al., 2000)

e sono caratterizzati dall’avere lunghe TIR. Nel genoma di Oryza sativa questi elementi

sono presenti in grande quantità e contengono spesso al loro interno frammenti genici:

questi complessi di sequenze vengono definiti “Pack-MULE” (Jiang et al., 2004).

Recentemente sono stati scoperti elementi della classe II con un meccanismo

di trasposizione “rolling-circle” simile a quello di alcuni elementi batterici (Kapitonov e

Jurka, 2001). Appartengono a questa classe anche i MITE (Miniature Inverted-repeat

Transposable Element), elementi di piccole dimensioni (di solito intorno a 500 bp), non

autonomi; sono presenti in elevato numero di copie e sono caratterizzati dalla preferenza

d’inserzione all’interno di regioni eucromatiche, in siti bersaglio specifici (Casacuberta et

al., 1998). Sono stati identificati in mais e in altre specie (Bureau e Wessler, 1992, 1994a,

1994b; Pozueta-Romero et al., 1996).

I MITEs sono abbondanti in genomi animali, per esempio in Caenorhabditis

elegans (Oosumi et al., 1995a, 1995b; Surzycki e Belknap, 2000), nella zanzara (Tu,

1997, 2001; Feschotte e Mouchès, 2000), nei pesci (Izsvák et al., 1999) e nell’uomo

(Morgan, 1995; Smith e Riggs, 1996).

I trasposoni sono in genere molto lunghi (da 8 kb a 23 kb, Chopra et al. 1999)

ma il loro numero di copie all’interno del genoma è generalmente basso rispetto a quello

dei retrotrasposoni (Capy et al., 1998). Questa situazione è dovuta al fatto che

l’incremento del numero di copie dei trasposoni può avvenire solamente se la

trasposizione avviene in fase S (sintesi del DNA) del ciclo cellulare, e se il sito accettore

è localizzato a valle della forca di replicazione. Durante la fase S, la riparazione del

doppio filamento “tagliato” nel sito donatore viene realizzata dalla ricombinazione

omologa dei cromatidi fratelli appena sintetizzati. Il trasposone duplica così le sue copie

(Figura 9)

Page 17: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

17

Figura 9 - Modello di trasposizione degli elementi di classe II durante la replicazione del DNA nella fase S del

ciclo cellulare. La rottura causata dalla trasposizione è riparata da una ricombinazione omologa con il

cromatidio fratello.

Page 18: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

18

2. LA REGOLAZIONE DELLA TRASPOSIZIONE

L’espressione dei trasposoni e la frequenza della loro trasposizione nei

genomi delle piante e degli altri organismi eucariotici sono regolate da una serie di

meccanismi di controllo, evolutisi per minimizzare il possibile effetto deleterio del loro

spostamento e della loro moltiplicazione nel genoma dell’ospite.

2.1 La metilazione del DNA

Uno dei più importanti meccanismi di regolazione/repressione da parte del

genoma ospite nei confronti degli elementi trasponibili è dato dalla metilazione del DNA.

La metilazione del DNA è associata generalmente alla formazione di cromatina

condensata (eterocromatina), in cui l’attività di trascrizione è repressa. E’ stato osservato

in Arabidopsis che decrementi o azzeramenti dei livelli di metilazione delle sequenze dei

trasposoni portano a riattivazione di elementi mobili (Okamoto e Hirochika, 2001).

Ad esempio, elementi Ac/Ds metilati non sono trascritti e non potendo

produrre la Ac-trasposasi risultano inabili alla trasposizione (Ros e Kunze, 2001).

Nelle piante, le analisi sul DNA ripetitivo hanno dimostrato che, di solito,

sono le citosine ad essere metilate nelle sequenze 5’—CG—3’ e 5’—CNG—3’. DNA

metilato è stato localizzato sia a fianco di determinati geni, sia nei pressi di

retrotrasposoni. Non è chiaro se sia la metilazione stessa ad inattivare il retrotrasposone

coinvolto, o sia la metilazione costituisca solo un effetto secondario (finalizzato al

mantenimento) dell’inattivazione, causata principalmente da un cambio di struttura della

cromatina. Non è ancora del tutto chiaro come i trasposoni siano riconosciuti e metilati in

modo da mantenerli in uno stato silente. In alcuni casi l’inattivazione epigenetica di un

elemento mobile è legata all’inserzione in siti localizzati all’interno o vicino a blocchi di

DNA già eterocromatico

2.2. L’RNA interference

Recentemente è stato dimostrato un nuovo meccanismo di silenziamento

genico, mediato da RNA a doppio filamento. In diversi organismi è stato osservato che

l’RNA a doppio filamento (dsRNA) è in grado di indurre silenziamento genico sequenza-

Page 19: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

19

specifico. Nelle piante in cui si osserva il fenomeno dell’RNAi, si trovano piccole

sequenze di RNA chiamate “small interfering RNAs” (siRNA). Si è scoperto che a

generare questi siRNA è un enzima ribonucleasico della superfamiglia delle RNAsi III,

chiamato Dicer.

Il modello funzionale dell’RNAi consta di due fasi fondamentali: quella di

“iniziazione” e quella “effettrice”. In sistemi sperimentali, si è osservato che, nella fase

iniziale, i dsRNA immessi nella cellula (in maniera diretta, attraverso transgenosi o virus)

vengono “digeriti” in corte molecole di dsRNA chiamate siRNA (small interfering

RNAs), lunghe da 21 a 23 pb. Gli siRNA vengono prodotti dall’enzima Dicer, il quale

taglia i dsRNA attraverso una reazione ATP-dipendente. Successive rielaborazioni

degradano i siRNA a duplex di 19-21 bp con un prolungamento di due nucleotidi al 3’.

Nella fase effettrice, i duplex siRNA si legano ad un complesso nucleasico e

formano quello che viene chiamato “RNA-induced silencing complex” (RISC). Dopo

tale legame, i siRNA vanno incontro ad una denaturazione a singolo filamento (reazione

ATP-dipendente), necessaria per l’attivazione del complesso RISC. Inoltre, è necessaria

una fosforilazione al 5’ del siRNA duplex perché esso possa incorporarsi nel RISC

(Nykanen et al., 2001); questa modificazione viene svolta da una chinasi endogena

(Schwarz et al., 2002). Il complesso così attivato, usando come stampo il singolo

filamento incorporato, va a tagliare filamenti di mRNA complementari allo stesso. Il

taglio avviene a circa 12 nucleotidi dal 3’ del siRNA antisenso. Analisi biochimiche

(Hutvagner et al., 2002) indicano che l’RNAsi presente nel complesso RISC è diversa da

Dicer. Questo processo ha generato un interesse enorme nella comunità scientifica; è

importante notare che la RNAi può spiegare l’esistenza e il significato funzionale di

molte sequenze sconosciute accumulate nei database biologici (Sugimoto et al., 2004).

Page 20: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

20

Figura 10 - Esemplificazione schematica del meccanismo dell’RNAi mediato da siRNA

2.3 Attivazione della trascrizione dovuta a stress biotici e abiotici

Molti trasposoni vengono attivati e trascritti in seguito a vari stress di tipo

abiotico, attraverso effettori come il metil-jasmonato e l’acido salicilico (Kumar e

Bennetzen, 1999). Analogamente, alcuni stress di tipo biotico come l’inoculazione di

estratti fungali di Trichoderma viridae, di patogeni virali, batterici e micotici aumentano

il livello di trascrizione dei trasposoni.

2.4 Regolazione self ed il modello a “bambole russe”

Le cellule della pianta ospite (e a volte i trasposoni stessi) hanno evoluto

particolari meccanismi finalizzati a minimizzare il possibile effetto negativo degli

elementi trasponibili. Alcuni retrotrasposoni possono inattivare altri elementi mobili

inserendosi nella loro struttura (come succede nei cereali nelle regioni intergeniche), con

un meccanismo di controllo detto “self”, cioè una auto-regolazione della loro

popolazione nel genoma. I retrotrasposoni si innestano spesso l’uno dentro l’altro come

“bambole russe” (Suoniemi et al., 1996; Chantret et al., 2004; Jiang e Wessler, 2001), in

Page 21: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

21

modo che solamente l’ultimo elemento innestato presenta una struttura intatta e può

essere attivo (figura 11).

Figura 11 - Il modello a “bambole russe” ipotizzato per il meccanismo self di controllo

dei retrotrasposoni.

Avviene dunque una sorta di competizione per le risorse del genoma ospite, e

l’ospite stesso trae beneficio da queste interazioni, quando non causano mutazioni; si

attiva in definitiva una selezione naturale che premia gli elementi con maggiore

specificità d’inserzione. La stretta interazione DNA ospite/parassita porta il parassita a

mitigare i propri effetti per non diminuire considerevolmente il vantaggio genetico, la

“fitness” dell’ospite; dal canto suo l’ospite sviluppa processi difensivi/minimizzanti in

grado di contrastare il parassita, per esempio attraverso la metilazione del DNA o la

RNAi.

Page 22: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

22

3. IL GIRASOLE COME SISTEMA MODELLO PER LO

STUDIO DELLA COMPOSIZIONE DEL GENOMA

Molti interrogativi rimangono irrisolti sulla distribuzione delle sequenze

ripetitive e sulla generale organizzazione del genoma vegetale in altre specie, per

esempio nella famiglia delle Asteraceae, che è molto estesa e diversificata ed include

anche numerose specie economicamente importanti come il girasole.

3.1 Le Asteraceae

L’ordine delle Asterales, con circa 1000 generi e 19000 specie, diffuse sotto

tutte le latitudini, rappresenta uno dei gruppi più ricchi di forme delle Angiospermae. Si

tratta di un gruppo assai eterogeneo per quello che riguarda la morfologia del sistema

vegetativo, in considerazione del fatto che questa famiglia ha rappresentanti in quasi tutti

i tipi di ambienti; si va, infatti, da piante con habitus erbaceo o legnoso solo alla base,

nella regione mediterranea, a specie con struttura decisamente arborescente o succulenta,

nelle zone tropicali; d'altro canto tutto l'ordine delle Asterales appare estremamente

omogeneo nella morfologia dell'infiorescenza che è sempre rappresentata dal capolino,

struttura altamente differenziata con funzione vessillare, formata da un ricettacolo basale

sul quale si inseriscono i fiori, circondata da foglie involucrali sterili dette squame. La

caratteristica principale delle Asteraceae risiede nei capolini con soli fiori tubulosi o con

fiori tubulosi al centro (disco) e ligulati alla periferia (raggi); questi ultimi sono

generalmente unisessuali o sterili. L'impollinazione è di norma entomogama e ciò spiega

la presenza del capolino. Infatti, anche la visita di un solo pronubo garantisce alla pianta

la fecondazione di tutti i fiori che compongono l'infiorescenza.

Le Asteraceae sono una famiglia di grande importanza dal punto di vista

economico. Essa include, infatti, alcune piante coltivate a scopo alimentare o

ornamentale. Tra le prime si ricordano soprattutto il carciofo (Cynara scolymus), di cui si

utilizzano soprattutto le brattee involucrali e il ricettacolo, e il girasole (Helianthus

annuus), coltivato per i semi oleaginosi. Tra le specie ornamentali vi sono varie specie di

Senecio, Aster, Zinnia, Dahlia, Ageratum, Chrysanthemum, Argyranthemum, Gerbera,

Tagetes, Calendula, ecc., da cui sono originate per selezione artificiale numerose cultivar.

Tra le specie officinali si citano Achillea millefolium, Artemisia vulgaris,

Matricaria chamomilla, Centaurea cyanus, e molte altre specie di uso anche solamente

Page 23: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

23

locale. Nella regione mediterranea le Asteraceae sono numerosissime e si rinvengono

praticamente in ogni tipo di ambiente, dai boschi (Doronicum orientale), alle praterie

steppiche (Carlina corymbosa), alla vegetazione altomontana (Anthemis aetnensis), alle

zone salmastre litoranee (Inula crithmoides), agli ambienti antropogeni (Conyza

bonariensis).

3.2 Il girasole

Fig. 12 - Il girasole

Il girasole (Helianthus annuus) è una pianta di origine americana: Perù

secondo alcuni studiosi, Messico secondo altri. E' stata introdotta in Europa nei primi

decenni del ‘500 (soprattutto come pianta ornamentale), assumendo tuttavia una certa

importanza come pianta oleifera soltanto nel ‘700. Dalla seconda metà dell' 800 ha avuto

una notevole diffusione specialmente in Russia. Oggi è largamente coltivata a livello

mondiale, tanto che attualmente si trova al secondo posto, dopo la soia, tra le piante

produttrici di olio. In Italia è presente soprattutto nell'Italia centrale. Le attuali varietà

selezionate danno acheni contenenti anche più del 45% di olio. Le forme coltivate si

suddividono in due gruppi: uno idoneo per la produzione di semi e per foraggio,

comprendente piante monocefaloiche e con acheni grandi, e uno per la produzione di

fiori ornamentali, caratterizzato da piante ramificate e policefale.

Page 24: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

24

Il girasole è una pianta erbacea annuale, caratterizzata da un notevole

sviluppo dei suoi organi, sia per quanto riguarda la lunghezza dello stelo che la larghezza

dell’infiorescenza. Il fusto si presenta eretto, tendenzialmente cilindrico, robusto, rugoso,

ispido e ripieno all’interno di midollo. Le specie da olio hanno in genere un’altezza

compresa tra 0,6 e 2,2 metri. Il fusto è eretto solo a maturazione e si piega nella parte

terminale per il peso della calatide.

Le foglie (presenti in numero variabile tra 12 e 40) sono alterne, grandi,

semplici, lungamente picciolate, cordate od ovate, acute, dentate.

L’infiorescenza terminale del girasole si presenta come capolino ed è detta

“calatide”. L’infiorescenza è costituita da un ricettacolo discoidale piatto circondato da

una doppia o plurima serie di brattee. I fiori si suddividono in due gruppi: i fiori periferici

sterili, forniti di un vistoso petalo giallo e i fiori interni fertili. L'ovario (organo

riproduttore femminile) si allunga in uno stilo che si suddivide in due stimmi. Gli stami

(organi riproduttori maschili) sono 5 ed hanno le antere fuse in una sorta di tubo che

racchiude lo stilo. La sistemazione dei fiori (detti “flosculi”) all'interno del disco avviene

secondo la sezione aurea, ottenendo uno schema a spirali in cui il numero di spirali orarie

e di quelle antiorarie sono successivi numeri di Fibonacci. Di solito ci sono 34 spirali in

un senso e 55 nell'altro; in girasoli molto grandi si possono trovare 89 spirali in un senso

e 144 nell'altro (Figura 13)

Fig. 13 - Le spirali orarie e antiorarie sono successivi numeri di Fibonacci.

Nelle varietà coltivate le calatidi hanno un diametro di 15-50 cm e sono

formate da 700-3.000 fiori (nelle varietà da olio). L’impollinazione è entomofila.

Page 25: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

25

3.3. Il frutto

Il frutto del girasole è un achenio (frutto secco indeiscente) di forma allungata,

costituito da un pericarpo duro e fibroso aderente al seme, di colore variabile dal bianco

al nero, molto spesso grigio scuro, con striature più o meno chiare a seconda della varietà

(figura 14).

L’apparato radicale è fascicolato e molto sviluppato, soprattutto nei primi 40

cm di terreno. Il contenuto medio di materia grassa nei semi è del 48 % s.s., con punte

che possono raggiungere il 55 % s.s.

Fig. 14: Acheni di girasole

La raccolta viene fatta quando gli acheni, il cui contenuto in acqua è inferiore

al 10%, si staccano facilmente dalla calatide; ciò avviene circa 15-20 giorni dopo la

maturazione. La maturazione completa viene raggiunta quando la calatide e le foglie si

presentano secche e gli steli sono di color bruno. In Italia il girasole viene raccolto dalla

metà di agosto (nelle zone più calde) alla metà di settembre, utilizzando le

mietitrebbiatrici da frumento adattate o con testata da mais dotata di spartitore per ogni

fila. L’olio di girasole è solitamente meno salutare per l'apparato cardiocircolatorio

rispetto a quello d'oliva. A tutt'oggi sono però disponibili varietà ad alto tenore di acido

oleico che non si discostano troppo dalla composizione dell'olio di oliva. Dai semi di

girasole si può estrarre anche olio per motori, usato per produrre biodiesel.

I residui della spremitura sono impiegati come mangime per il bestiame. I

semi di girasole vengono anche venduti come snack (tostati). Sono impiegati inoltre

come mangime per uccelli e roditori. Infine, il girasole è largamente impiegato come

pianta ornamentale.

Page 26: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

26

Recentemente sono state selezionate alcune varietà di girasole con il capolino

rivolto verso il basso. Queste varietà sono meno ricercate dai giardinieri come piante

ornamentali, ma preferite dai coltivatori in quanto riducono il danno provocato da uccelli

e da alcune malattie delle piante. Esistono anche varietà transgeniche di girasole, più

resistenti ad alcune malattie. I girasoli producono del lattice, oggetto di esperimenti volti

a utilizzarli come fonti alternative di gomma ipoallergenica.

3.4. Origine del girasole

Il girasole appartiene al genere Helianthus, originatosi tra i 4.75 ed i 22.7

milioni di anni fa, secondo quanto stimato dall’analisi del cpDNA (Schilling, 1997).

Nella loro classificazione, basata sull’analisi morfologica e della inter-incrociabilità,

(Heiser et al. 1969) hanno individuato 67 specie, annuali o perenni, di cui 50 native del

Nord America e 17 del Sud America.

Basandosi sulla sua distribuzione geografica, il genere Helianthus dovrebbe

essersi originato in Messico, con successiva migrazione in Nord America (Schilling et al.,

1998). L’origine del girasole coltivato è da ricercarsi nelle regioni orientali del Nord

America (Harter et al., 2004). Diverse specie di Helianthus sono note avere origine da

ibridazioni interspecifiche (Rieseberg, 1995). Schilling ed Heiser (1981) e Rogers et al.

(1982) hanno escluso dal genere Helianthus le specie sudamericane e suddiviso il genere

in quattro sezioni: la sezione Annui (comprendente solo le specie annuali e diploidi), la

sezione Agrestes (comprendente solo H. agrestis), la sezione Ciliares divisa in due serie

Ciliares e Pumili (comprendenti 6 specie perenni) e la sezione Atrorubentes divisa in 5

serie, Angustifolii, Atrorubentes, Divaricati, Gigantei, e Microcephali, comprendenti ben

30 specie perenni e una annuale (H. porteri).

Nell’ultima decade, gli studi di biologia molecolare ha chiarito molto le

relazioni interne tra le varie specie del genere Helianthus. L’analisi RFLP del DNA

cloroplastico ha evidenziato quattro sezioni. La prima include H. agrestis, la seconda

include H. porteri; una terza sezione, chiamata Helianthus, include tutte le altre annuali

mentre la quarta include tutte le perenni (Schilling, 1997).

Queste ultime due sezioni, probabilmente, avranno bisogno di una successiva

valutazione perchè la loro differenziazione è relativamente recente (Schilling, 2001).

Gli studi sistematici e filogenetici basati sullo spaziatore ribosomale trascritto

dividono la sezione Helianthus in tre gruppi, di cui uno include H. annuus, il secondo H.

Page 27: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

27

petiolaris, H. neglectus e H. niveus e il terzo H. praecox e H. debilis (Schilling et al.,

1998).

3.5. La libreria di DNA

La conoscenza della composizione della componente ripetitiva del genoma ha

una duplice importanza sia dal punto di vista teorico che applicativo, per migliorare le

strategie nella mappatura del genoma e al fine di scoprire nuovi markers molecolari.

Inoltre, una conoscenza accurata del genoma è indispensabile per iniziare un processo di

sequenziamento rivolto sia alle ESTs (Expressed Sequence Tags) che alle regioni

genomiche.

Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante

Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare

riferimento al girasole.

Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo in esame

alcune famiglie di DNA ripetitivo che di solito nelle piante sono poco rappresentate e che

risultano quindi poco studiate; in particolar modo mi sono soffermato su due tipologie di

elementi trasponibili: i trasposoni e i LINEs.

I trasposoni sono elementi trasponibili di classe II e si spostano nel genoma

attraverso un intermedio a DNA secondo un modello conservativo “cut & paste” (“taglia

e incolla”) grazie all’attività dell’enzima trasposasi da essi codificato, che riconosce

univocamente brevi sequenze TIR (Terminal Inverted Repeats).

I cosiddetti LINEs (Long INterspersed Elements), invece, sono elementi di

classe I, che si spostano mediante retrotrascrizione di un intermedio di RNA utilizzando

enzimi codificati dall’elemento; sono ritenuti il più antico gruppo di retrotrasposoni.

Nel corso della tesi sono state identificate, analizzando una library di piccoli

inserti di DNA genomico di girasole, tre sequenze, corrispondenti a due trasposoni e ad

un LINE. Queste sequenze sono state analizzate in riferimento a sequenze similari di

altre specie vegetali ed è stato valutato il numero di copie in girasole ed in altre specie

del genere Helianthus. Si è infine studiata l’espressione di queste sequenze mediante RT-

PCR: sia i trasposoni che il LINE sono risultate espresse costitutivamente, sia in tessuti

adulti (foglie) che in tessuti embrionali.

Page 28: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

28

SCOPO DELLA TESI

La conoscenza della composizione del genoma, specialmente della

componente ripetitiva, ha una duplice importanza sia dal punto di vista teorico che

applicativo, per migliorare le strategie nella mappatura del genoma e al fine di scoprire

nuovi markers molecolari. In ogni caso una conoscenza accurata del genoma è

indispensabile per iniziare un processo di sequenziamento rivolto sia alle ESTs

(Expressed Sequence Tags) che alle regioni genomiche.

Le piante superiori presentano notevoli differenze nella composizione del

genoma rispetto agli animali. Se in entrambi i casi le sequenze ripetute rappresentano una

porzione significativa del genoma, che è tanto maggiore quanto più il genoma è grande,

le famiglie di sequenze ripetute sono comunque diversamente rappresentate. Nelle piante,

sono frequenti soprattutto i retrotrasposoni con LTR (gypsy, copia, LARD e altri) e in

alcuni casi i MITE (Wicker et al., 2007).

Negli animali i retrotrasposoni più frequenti sono quelli senza LTR, cioè i

LINE e i SINE. Tuttavia, membri di ciascuna famiglia di sequenze ripetute sono stati

riscontrati in tutte le specie, sia animali che vegetali, anche se con frequenze diverse. La

frequenza con cui compaiono le diverse famiglie di DNA ripetuto può perfino

caratterizzare la specie: per esempio, il recente sequenziamento del genoma della vite ha

evidenziato come, a differenza di altre piante, i retrotrasposoni di tipo copia siano più

rappresentati di quelli di tipo gypsy; e che una classe di retrotrasposoni, i pararetrovirus,

rappresentano una porzione significativa del genoma (Gregor, 2004).

Parlando di specie vegetali, sono state riscontrate differenze nella componente

ripetitiva dei genomi vegetali finora sequenziati: Arabidopsis, riso, pioppo e vite (The

Arabidopsis Genome Initiative, 2000; Goff et al., 2002; Tuskan et al., 2006; The French-

Italian Public Consortium For Grape Genome Characterization, 2007) ma si tratta di

genomi abbastanza piccoli. Qualche dato è reperibile per genomi medio grandi come

quello del mais, del frumento e del cotone (Meyers et al., 2001; Hawkins et al., 2006;

Vitte e Bennetzen, 2006), che mostrano le differenze dell’evoluzione di questi genomi.

Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante

Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare

riguardo al girasole. Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo

in esame alcune famiglie di DNA ripetuto che di solito nelle piante sono poco

rappresentative e che risultano quindi poco studiate

Page 29: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

29

MATERIALI E METODI

5.1 Il materiale vegetale

Le analisi sono state condotte su DNA isolato da foglie prelevate da piante

di Helianthus annuus, linea pura HCM del Dipartimento di Biologia delle Piante Agrarie,

e di Helianthus argophyllus, H. debilis, H. petiolaris, H. ciliaris, H. pumilus, H.

atrorubens, H. giganteus, H. simulans, H. tuberosus (tutti provenienti dal NCRPIS-

USDA, USA). Gli RNA sono stati isolati da foglie ed embrioni (a 28 giorni

dall’impollinazione) della linea HCM di H. annuus.

5.2 Analisi di sequenze.

Le sequenze in esame sono state sottoposte ad analisi bioinformatica mediante

comparazione BLASTN e BLASTX contro il database di sequenze nucleotidiche e

proteiche della GenBank (http://www.ncbi.nlm.nih.gov/blast/Blast.cgi). Un valore di E di

almeno 10-5 nel BLAST è stato considerato significativo per la classificazione delle

sequenze.

Multiallineamenti delle sequenze in esame sono stati realizzati utilizzando il

software CLUSTALW (http://align.genome.jp/).

Le relazioni fra le diverse sequenze nucleotidiche appartenenti ai tre tipi

studiati sono state valutate con il metodo del Neighbour-Joining (NJ), che usa l’algoritmo

di distanza di Kimura, utilizzando il pacchetto software PHYLIP (versione 3.572)

(Felsenstein, 1989). Sono state preparate 100 versioni del multiallineamento reale delle

sequenze, con il programma SEQBOOT; successivamente, sono stati generati alberi

filogenetici usando i programmi DNADIST e NEIGHBOR, usando le opzioni standard.

Un albero di consenso è stato ottenuto per ciascun tipo di sequenza

utilizzando il programma CONSENSE. La visualizzazione degli alberi filogenetici è stata

ottenuta con il programma TreeView.

Sono stati utilizzati utilizzati anche i programmi: “espasy”

(http://www.expasy.ch/tools/dna.html) per la traduzione dei nucleotidi e “reverse

Page 30: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

30

complement” (http://www.bioinformatics.org/sms/rev_comp.html) per le sequenze

ribaltate.

5.3. Analisi del DNA genomico

5.3.1 Isolamento del DNA genomico

Il DNA è stato estratto da piccole quantità di tessuto vegetale utilizzando il

metodo di Doyle & Doyle (1987).

Il materiale vegetale è stato triturato in un mortaio sterile, precedentemente

refrigerato con azoto liquido, fino ad ottenere una polvere finissima.

Si è aggiunto il tampone di estrazione, scaldato a 60 °C, nella misura di circa

3 ml per grammo di tessuto vegetale; il materiale è stato posto in bagno caldo a 60 °C per

20-30 minuti in una eppendorf. Finita l'incubazione in bagno caldo si è operata una

estrazione con un uguale volume di cloroformio/alcool-isoamilico (24:1), agitando la

eppendorf fino ad ottenere un’unica fase, dopodiché i campioni sono stati centrifugati per

15 minuti a 9.000 rpm ed a 4 °C in rotore Kontron A8.24. La fase acquosa è stata

recuperata con una pipetta Pasteur sterile e trasferita in un’altra eppendorf.

Gli acidi nucleici sono stati fatti precipitare aggiungendo 2/3 di volume di

isopropanolo freddo (-20 °C) per 30-60 minuti a temperatura ambiente, e quindi

centrifugati a 8000 rpm per 15 minuti a 4 °C. Il pellet risultante è stato lavato con etanolo

al 70 %.

Si è provveduto poi ad eliminare l’etanolo, ad asciugare bene il pellet, ed a

solubilizzarlo in un minimo volume di TE pH 8.

Page 31: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

31

Soluzioni utilizzate:

Tampone di estrazione

CTAB 3 %

NaCl 20mM pH8

Tris-HCl 100mM pH 8

CTAB 3 % (p/v)

2-Mercaptoetanolo 0.2 % (p/v)

Cloroformio/alcool-isoamilico

(24:1 v/v)

Il 2-mercaptoetanolo viene aggiunto al

momento dell'estrazione.

Si satura con un volume di Tris-HCl 100

mM pH 8.

TE pH 8

Tris-HCl 10 mM pH 8

Na2EDTA 1 mM pH 8.

5.3.2. Purificazione del DNA con RNAsi

Ai campioni è stata aggiunta RNAsi nella misura di 100 µg per ml, dopodichè

sono stati messi a 37 °C in leggera agitazione per circa 60 minuti. Successivamente è

stata effettuata una estrazione con un ugual volume di cloroformio-alcool isoamilico

(24:1 v/v). I campioni sono stati centrifugati a 7.000 rpm per 15 minuti a 4 °C.

Al termine è stata recuperata la fase acquosa alla quale sono stati aggiunti

1/10 di volume di NaCl saturo e 2 volumi di etanolo assoluto freddo (-20 °C); il tutto è

stato miscelato delicatamente per inversione e lasciato a precipitare per almeno 2 ore a –

20 °C. Successivamente si è provveduto a centrifugare il campione a 7.000 rpm per 20

minuti a 4 °C. Il pellet di DNA è stato lavato con etanolo al 70 % e solubilizzato in un

minimo volume di acqua sterile.

Page 32: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

32

Soluzioni utilizzate:

RNAsi A (10 mg/ml)

10 mg sciolti in 1 ml di 10 mM Tris-HCl, pH 7,5 e

15 mM NaCl, si bolle per 5 minuti e si lascia

raffreddare a temperatura ambiente. Si conserva a

–20 °C.

5.3.3. Quantizzazione del DNA estratto

I campioni ottenuti sono stati valutati, sia dal punto di vista della qualità che

dal punto di vista della concentrazione, tramite elettroforesi su gel di agarosio colorato

con Bromuro di Etidio.

E’ stato preparato un gel sciogliendo polvere di agarosio in acqua distillata

(1% p/v); alla miscela è stato poi aggiunto TAE alla concentrazione finale di 1x e

Bromuro di Etidio alla concentrazione finale di 1 µg/ml.

Nelle tasche del gel sono stati caricati 2 µl di ogni DNA estratto, ad ognuno

dei quali sono stati aggiunti 2 µl del tampone di caricamento.

Assieme ai DNA estratti sono state caricate quantità scalari di DNA marker λ

a concentrazione nota.

La corsa è stata effettuata a 50 volts per circa 15 minuti, sufficienti per far

entrare appena i DNA in esame nel gel di agarosio.

Alla fine della corsa il gel è stato visualizzato su un transilluminatore a raggi

UV (302 nm) ed è stata comparata l’intensità delle bande date dai campioni con quella

dei marker a concentrazione nota: in base a tale paragone, abbiamo potuto stabilire la

concentrazione dei campioni.

I DNA estratti sono stati infine diluiti con acqua sterile in modo da ottenere

per tutti i campioni concentrazioni finali simili.

Page 33: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

33

Soluzioni utilizzate:

TAE 10x

Tampone di caricamento

Tris-acetato

Na2EDTA pH 8

Saccarosio

Na2EDTA pH 8

Orange G

0,4 M

0,01 M

60 % massa/vol

25 mM

0,1 %massa/vol

5.3.4. Amplificazione mediante PCR delle sequenze ripetute da analizzare

La tecnica della PCR è stata utilizzata per amplificare sequenze di DNA

appartenenti alle diverse sequenze ripetute in esame.

I primer utilizzati sono stati progettati utilizzando il programma OLIGO.

Primer del trasposone HAG003H10R

3H10F1: 5’- ATG-CTA-GGT-AGT-TTA-GAT-TGT-ATG- 3’

3H10R1: 5’- ATG-CTC-GCT-CGA-CGT-CTT-T- 3’

Primer del trasposone HAG003I05F

3I053I05F1: 5’ -ATG-TGG-TGT-GTG-CTT-CAA-GTA-A- 3’

3I05R1: 5’ -TGA-AGA-ACA-AGC-ACA-AAT-TCA-AA- 3’

Primer del LINE HAG00 HAG004M10F

4M10F1: 5’-AAT-GCG-AGG-CTA-GAG-GAA-TGG-AG- 3’

4M10R1: 5’ -ATC-CAC-CCC-AAC-ATT-CTC-ATC-TC- 3’

La reazione di PCR è consistita in 35 cicli preceduti da una fase di

denaturazione del DNA a 94°C della durata di 4 minuti, e seguiti da una fase di 7 minuti

a 72°C. Ogni ciclo, a sua volta, era costituito da tre passaggi: denaturazione del DNA a

94°C per 30 secondi, appaiamento dei primer a 55°C per 30 secondi, polimerizzazione

del DNA a 72°C per 30 secondi.

Page 34: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

34

Mix di reazione:

Volumi (µl)

DNA genomico (100 ng/µl) 1.0

Taq polimerasi Mg free Buffer (10x) 2.5

MgCl2 (25 mM) 1.5

Mix nucleotidica (ogni dNTP

concentrato 2.5 mM) 2.0

Primer forward (100 µM) 0.5

Primer reverse (100 µM) 0.5

Taq polimerasi (Promega, 5U/µl) 0.25

H2O sterile 16.75

TOTALE 25 µl

5.3.4. Marcatura non radiattiva del DNA: preparazione delle sonde

Le sonde a DNA, necessarie per determinare il numero di copie di sequenze

appartenenti a retrotrasposoni sul genoma di Helianthus Anuus, sono state ottenute

mediante PCR adoperando come primers due oligonucleotidi universali complementari a

specifiche sequenze del vettore pGEM-T-easy Vector System (Promega):

Primer Reverse: Sp6 5’-TAATACGACTCACTATAGGG-3’

Primer Forward: T7 5’-ATTCTATAGTGTCACCTAAAT-3’

Come stampo è stato utilizzato 5 ng di DNA plasmidico ottenuto da un clone

positivo salvato a –80°C purificato mediante mini-preparzione con “High Pure Plasmid

Isolation Kit” della Roche (vedi: Clonaggio dei prodotti PCR).

Page 35: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

35

Miscela di reazione per amplificazione PCR:

REAGENTI Volumi (µl)

DNA plasmidico trasformato (5 ng) 1 .0

Taq polimerasi Mg free Buffer (10x) 2.50

MgCl2 (25 mM) 2.50

Mix nucleotidica con uridina marcata con

digossigenina (Roche)

2.50

Primer Sp6 (1 µg/µl) 0.25

Primer T7 (1 µg/µl) 0.25

Taq polimerasi (Promega, 5U/µl) 0.25

H2O distillata sterile 16.75

25.00 µl

Nota: La miscela di deossi-nucleotidi contenente uridina marcata è così composta (per 25 µl): 5 µl

ATP(10mM), 5 µl CTP(10mM), 5 µl GTP(10mM), 4,75 µl TTP (10mM) 2.5 µl UTP-DIG (Roche)

(1mM), 2.75 µl H2O.

Ogni reazione di PCR consisteva di 30 cicli preceduti da una fase di

denaturazione del DNA a 94°C della durata di 4 minuti, seguiti alla fine da una fase di 7

minuti a 72°C.

Ogni ciclo, a sua volta, è stato composto da tre passaggi fondamentali: un

primo passaggio di denaturazione della doppia elica a 94°C della durata di 30 secondi; un

secondo di appaiamento degli oligonucleotidi a 55°C per 30 secondi; ed infine un terzo di

polimerizzazione del DNA della durata di 1 minuto e 30 secondi a 72°C.

Al termine della reazione, i campioni sono stati valutati tramite elettroforesi su

gel di agarosio servendosi di markers a DNA per la stima sia del peso molecolare

dell’amplificato ottenuto, sia della sua concentrazione.

Page 36: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

36

5.5. Slot Blot

E’ la tecnica che abbiamo utilizzato per valutare il numero di copie di ogni

famiglia di retrotrasposoni nel genoma di Heliantus Annuus.

Previa costruzione delle sonde a DNA (vedi paragrafo precedente), la tecnica

dello Slot Blot consta di quattro passaggi fondamentali:

Trasferimento su membrana del DNA genomico di olivo e dei prodotti di PCR

non marcata corrispondenti alle sequenze da valutare;

• Ibridazione del DNA gnomico e di ciascun prodotto di PCR con le rispettive

sonde specifiche marcate;

• Lavaggio della membrana al fine di togliere l’eccesso di sonda;

• Rivelazione del segnale di ibridazione (Detection).

5.5.1 Trasferimento del DNA su membrana

E’ stata preparata una serie di diluizioni scalari di DNA genomico di

Heliantus Annuus e di prodotti di PCR (non marcata) corrispondenti alle sequenze da

valutare.

Ad ognuna di queste diluizioni è stato aggiunto un uguale volume di NaOH

0.8 M, dopodichè i campioni sono stati incubati a 37°C per 15 minuti al fine di denaturare

il DNA.

Successivamente, ognuna di queste soluzioni è stata caricata su una membrana

di nylon (Roche) carica positivamente precedentemente inumidita con SSC 2x. Per questa

operazione sono stati necessari un apparecchio Biodot (BioRad) ed una pompa a vuoto,

usata per accelerare il trasferimento stesso. Per il DNA genomico soni stati caricati 2000,

1000, 500,250, 125, 62, 31, 15 ng; per ciascuna sequenza sono stati caricati 20, 10, 5, 2.5,

1.25, 0.62, 0.31, 0.15 ng di prodotto di PCR.

Page 37: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

37

5.5.2 Ibridazione con sonde marcate

Le membrane sono state poste in tubi TECHNE e incubate con un adeguato

volume di soluzione di pre-ibridazione (20ml per 100cm2) in ibridizzatore TECHNE

Hybridiser HB-1D a 65°C per 2 ore. Prima dell’ibridazione, 70 ng di sonda marcata sono

stati denaturati a 100°C per 15 minuti e trasferiti in ghiaccio, la soluzione di ibridazione

(7-10 ml) si ottiene diluendo la sonda nella soluzione di preibridazione.

Le soluzioni di ibridazione contenenti le sonde marcate possono essere

recuperate, conservate a -20°C e riutilizzate previa bollitura per 10 minuti. Rimossa la

soluzione di preibridazione la membrana è stata incubata nella soluzione di ibridazione

per circa 12 ore a 65°C.

Soluzioni utilizzate:

Soluzione di

preibridazione

SSC

Sodio Dodecil Solfato

(SDS)

N-Laurilsarcosinato (SLS)

Blocking reagent (Roche)

5x

0,02%

0,1%

1 %

5.5.3. Lavaggi delle membrane

Una volta finita l’ibridazione, le membrane sono sottoposte a quattro lavaggi

con diverso potere stringente al fine di eliminare l’eccesso di sonda.

Queste le condizioni dei lavaggi:

1) SSC 2.0x + 0.1% SDS 15 minuti a T° ambiente

2) SSC 2.0x + 0.1% SDS 15 minuti a T° ambiente

3) SSC 1.0x + 0.1% SDS 30 minuti a 65°C

4) SSC 0,3x + 0.1% SDS 30 minuti a 65°C

Page 38: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

38

5.5.4 Rivelazione del segnale di ibridazione (Detection)

La detection con chemioluminescenza è stata effettuata utilizzando il “Dig

Luminescent Detection Kit” (Roche). La membrana è stata lavata con Buffer 1 per 1

minuto e tenuta in lenta agitazione in Buffer 2 per 30 minuti. Successivamente, la

membrana è stata incubata per 30 minuti in agitazione con l’anticorpo legato alla fosfatasi

alcalina, diluito 1:10000 in Buffer 2.

Sono stati effettuati due lavaggi di 15 minuti in Buffer 1 addizionato con

tween 20 allo 0.3% e quindi equilibrata la membrana in Buffer 3 per 1 minuto.

In camera oscura la membrana, adagiata su una pellicola trasparente, è stata

cosparsa di una soluzione di Lumigen CSPD diluito 1:100 in Buffer 3 (circa 0.5 ml per

membrana di 100 cm2). Dopo essere stata sigillata in busta trasparente, avvolta in

stagnola per proteggere il Lumigen dalla luce, la membrana è stata incubata per 5 minuti a

temperatura ambiente ed in seguito per 15 minuti a 37°C. Infine la membrana è stata

messa a contatto con una lastra autoradiografica (Amersham MP). L’esposizione si è

prolungata per 15 minuti.

Al termine dell’esposizione, la lastra è stata sviluppata e fissata con le

soluzioni Kodak seguendo le istruzioni fornite dalla ditta.

Soluzioni utilizzate:

Blocking stock

solution

Blocking

reagent (Roche)

10 % (w/v)

Sciogliere il Blocking reagent in Buffer 1 a

60°C. Autoclavare e conservare a -20°C.

Buffer 1 NaCl

Acido maleico

0,15 M

0,1 M

Portare a pH 7,5 con NaOH ed autoclavare.

Buffer 2 Blocking stock solution diluita 1:10 in Buffer

1. Autoclavare.

Buffer 3 Tris-HCl

NaCl

100mM pH 9,5

100 mM

Page 39: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

39

Sono state preparate diluzioni seriali di DNA genomico delle diverse specie

da 50 a 25,600 genomi (da 50*3,3pg a 25.600*3,3pg). I prodotti di PCR corrispondenti

alle tre sequenze in analisi sono stati solubilizzati in acqua sterile distillata con NaOH ad

una concentrazione finale di 0,4 M in una serie di diluizioni partendo da 7.35.106 a

3.76.109 copie e trasferite sulle stesse membrane.

I Dot blot così ottenuti sono stati ibridati con le sonde precedentemente

marcate con digossigenina; la concentrazione della sonda era 10 ng/ml di soluzione di

ibridazione.

Dopo un’incubazione di una notte a 65°C, le membrane sono state lavate in

tampone SSC ad alta stringenza, secondo la metodica descritta da Santini et al. (2002). Il

rilevamento della digossigenina è stato realizzato mediante un saggio ELISA con

l’utilizzo della fosfatasi alcalina, seguendo il protocollo della Roche. L’intensità della

colorazione (e quindi dell’ibridazione) è stata quantificata su fotografie digitali delle

membrane utilizzando il software Quantity-One (BioRad).

La stima del numero di copie per pg di DNA è stata realizzata comparando

l’ibridazione della sonda con il DNA genomico con quella con la stessa sequenza

caricata sulla membrana (Santini et al., 2002).

Per il calcolo del numero di copie di ciascuna sequenza analizzata, per prima

cosa sono stati confrontati tra loro i segnali di ibridazione procurati dalla sonda sul DNA

genomico e sul prodotto di PCR (identico alla sonda ma ottenuto con una mix di

nucleotidi non marcata). Segnali uguali corrispondono ad un medesimo numero di copie

della sequenza caricato sulla membrana.

Sapendo che 1 pg di prod. PCR = 0,965*109 pb, e conoscendo la lunghezza

e la quantità in ng dei prodotti di PCR caricati sulla membrana, si può risalire all’esatto

numero di copie caricato in ciascun pozzetto dell’apparato di Slot Blot:

Ad es. 625 pg (0,62 ng) * 0,965*109 pb = 603.1*109 bp numero totale di pb

caricate nel pozzetto di 62 ng.

603.1 109 bp / 587 bp = 1,027*109 copie caricate nel pozzetto corrispondente a 0,62 ng di

una sequenza lunga 587 pb presa come esempio.

Se ad esempio il segnale di ibridazione rilevato sul prodotto di PCR

corrispondente a 0,62 ng fosse identico a quello trovato nel pozzetto in cui sono stati

Page 40: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

40

caricati 125 ng di DNA genomico, sapendo che il contenuto 1 C del DNA corrisponde a

2,2 pg, calcolando il numero di genomi caricati in quel pozzetto, si può risalire al numero

di copie della sequenza per genoma:

125 *103 pg (125 ng)/ 2,2 pg = 56818 genomi

Quindi 1,027*109 copie / 56818 genomi= 1,8*104 copie per genoma della

sequenza di 587 pb presa come esempio.

5.6. Analisi dell’RNA

5.6.1. Isolamento di RNA dai tessuti

L’RNA totale è stato isolato da foglie ed embrioni di girasole.

Soluzioni necessarie per l’isolamento:

o soluzione MES/EDTA 5x: 1,95g di MES e 3,72g di EDTA in 90ml di acqua DEPC

(pH

o finale = 7.0, volume finale = 100ml)

o fenolo (tris saturato)

o cloroformio/IAA (24:1)

o etanolo al 100%

o etanolo al 70%

o acido acetico 1M: acqua e acido acetico glaciale in proporzioni 943:57;

o si tratta poi con acqua DEPC

o buffer di estrazione: guanidina-HCl 8M, MES 20mM, EDTA 20mM, 2-

mercaptoeta-nolo 50 mM fenolo/cloroformio-IAA (per sciacquare il mortaio e

recuperare)

Il materiale vegetale è stato posto in mortai sterili refrigerati in precedenza

con l’ausilio di azoto liquido, e pestato fino ad ottenere una polvere finissima. Il tampone

di estrazione, dopo il riscaldamento a 60°C, è stato aggiunto nella misura di 3 ml per

grammo di tessuto vegetale ed il materiale è stato posto in bagno caldo (60°C) per 20

minuti. L’isolamento dell’RNA è stato operato aggiungendo un pari volume di

Page 41: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

41

fenolo/cloroformio-alcool isoamilico (24:1 v/v) ed agitando per mescolare le due fasi; i

campioni sono stati poi centrifugati per 15 minuti a 9.000 rpm e 4°C in rotore Kontron

A8.24. Dopo il recupero della fase acquosa, agli acidi nucleici sono stati aggiunti 0,2

volumi di acido acetico 1M e 0,7 volumi di etanolo al 70%. L’RNA è stato fatto

precipitare a -80°C per 60 minuti. Le provette sono poi state centrifugate per 30 minuti a

9.000 rpm, a 4°C, ed il pellet ottenuto è stato lavato con etanolo al 70% e acetato di sodio

3M. Al termine dei lavaggi il pellet è stato nuovamente sospeso in acqua DEPC (in un

bagno a 65°C).

Volumi stabiliti delle soluzioni contenenti l’RNA estratto dai tessuti sono stati

caricati su un gel denaturante per RNA e sottoposti a corsa elettroforetica per una verifica

della qualità.

Preparazione di un gel denaturante per RNA:

-1% di Agarosio;

- MOPS 1x ( da 10x ), che è il tampone di corsa;

- 6% finale di Formaldeide ( da soluzione al 37% );

- H2O DEPC fino al volume finale.

L’agarosio (0.35g) posto in una beuta insieme all’acqua è stato scaldato. Alla

miscela sono stati aggiunti Formaldeide (concentrazione finale 6%) e MOPS

(concentrazione finale 1x) e il tutto è stato agitato. Il volume del gel era di 35 ml. Il gel è

stato colorato con Bromuro di Etidio e visualizzato su un trans illuminatore UV come

descritto precedentemente. La qualità dell’RNA estratto è stata valutata in base alla

visualizzazione di due bande distinte di RNA ribosomale, nella proporzione attesa.

La concentrazione dell’RNA è stata stimata allo spettrofotometro. La lettura

dell’assorbanza dei diversi campioni è stata effettuata a 258nm e 320nm.

5.6.2. Rimozione del DNA

Poiché le soluzioni di RNA, dopo l’isolamento, contengono tracce di DNA è

stato necessario effettuare un trattamento con DNAsi (DNAsi I Roche) per rimuovere il

DNA.

Page 42: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

42

Miscela di reazione:

Stampo variabile in base alla concentrazione dei campioni

Buffer 5µl

RNAsi inibitore 0.5µl

DNAsi 5µl

H2O DEPC fino a volume

I campioni (50 µl) sono stati incubati per 20 minuti in un bagno termostatato a

37°C. In seguito il volume è stato portato a 100µl con H2O DEPC ed è stata eseguita

l’estrazione con 1 volume di fenolo/cloroformio. Le soluzioni nelle provette sono state

centrifugate a 13.000 rpm a 4°C per 35 minuti ed il sovranatante è stato recuperato. Sono

stati aggiunti 2.5 volumi di etanolo assoluto ed 0.1 volumi di acetato di sodio. L’acido

nucleico è stato fatto precipitare per 60 minuti. Centrifugati e sottoposti a successivo

lavaggio, i pellet sono stati infine solubilizzati. È stato prelevato 1µl di soluzione da ogni

campione (diluito in 100µl di H2O DEPC) per la lettura della concentrazione allo

spettrofotometro.

5.7. Valutazione dell’espressione mediante RT-PCR

5.7.1. Retrotrascrizione dell’RNA.

Gli RNA messaggeri sono stati retrotrascritti in vitro a cDNA, utilizzando

come innesco un primer oligo-dT.

Miscela di reazione:

Stampo 3 µl

Primer oligo-dT 50 µM 1 µl

Mix dNTP 10 µM 1 µl

H2O DEPC fino a volume

Buffer 5x 4 µl

DTT 0.1M 1 µl

Enzima retrotrascrittasi 1 µl

Page 43: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

43

La soluzione (13µl) di stampo, primer, mix e H2O DEPC è stata incubata a

65°C per 5 minuti e in seguito centrifugata. La provetta è stata poi posta in ghiaccio per 1

minuto. Alla soluzione, agitata e centrifugata nuovamente, sono stati aggiunti 4µl di

buffer 5x, 1µl di DTT 0.1M, 1µl di H2O DEPC (al posto dell’RNAsi-inibitore) e 1µl di

enzima RT (retrotrascrittasi SuperScript III). I campioni sono stati incubati a 25°C per 5

minuti e in seguito posti in un bagno termostatato a 50°C per 60 minuti. L’ultimo

passaggio è stato il riscaldamento a 70°C per 15 minuti per degradare l’enzima.

5.7.2. Amplificazione del cDNA

Il cDNA è stato sottoposto ad amplificazione con la PCR, utilizzando primer

specifici per le tre sequenze in esame, per osservare se le tre sequenze risultavano o meno

espresse.

I primer sono stati progettati utilizzando il software OLIGO. Per questi

esperimenti abbiamo progettato due tipi di primer: i primer più esterni da “prima” PCR e

quelli più interni da “seconda” PCR, che possono essere utilizzati sia direttamente per

amplificare il retrotrascritto che per fungere da primer nested utilizzando come stampo il

prodotto di PCR della prima coppia.

Primer del trasposone HAG003H10R:

3H10F1: 5’- ATG-CTA-GGT-AGT-TTA-GAT-TGT-ATG- 3’

3H10R1: 5’- ATG-CTC-GCT-CGA-CGT-CTT-T- 3’

3H10F2: 5’- AGA-TCT-TTG-GAT-ATG-GCA-TG- 3’

3H10R2: 5’- CAT-GTT-ATG-GAG-GAT-GAT-ACA- 3’

3H10R3: 5’- TAC-CTT-CAT-CTT-CCA-AAA-TCA-T- 3’

Primer del trasposone HAG003I05F:

3I05F1: 5’ -ATG-TGG-TGT-GTG-CTT-CAA-GTA-A- 3’

3I05F2: 5’ -GGC-TGG-TGA-TGC-ACG-TTG-G- 3’

3I05R1: 5’ -TGA-AGA-ACA-AGC-ACA-AAT-TCA-AA- 3’

3I05R2: 5’ -ACT-CCA-TTG-CAT-TAA-GGA-TGT- 3’

Page 44: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

44

Primer del LINE HAG00 HAG004M10F;

4M10F1: 5’-AAT-GCG-AGG-CTA-GAG-GAA-TGG-AG- 3’

4M10F2: 5’ -CAG-GTT-GGC-TGG-TGT-AAG-TGG-AG- 3’

4M10R1: 5’ -ATC-CAC-CCC-AAC-ATT-CTC-ATC-TC- 3’

4M10R2: 5’ -TCT-TCA-CAT-GCC-CAA-ACC-ATC-T- 3’

Le reazioni di PCR sono consistite in 35 cicli preceduti da una fase di

denaturazione del DNA a 94°C della durata di 4 minuti, e seguiti da una fase di 7 minuti

a 72°C. Ogni ciclo, a sua volta, era costituito da tre passaggi fondamentali: denaturazione

del DNA a 94°C per 30 secondi, appaiamento dei primer a 55°C per 30 secondi,

polimerizzazione del DNA a 72°C per 30 secondi.

Mix di reazione:

Volumi

(µl)

DNA genomico (100 ng/µl) 1.0

Taq polimerasi Mg free Buffer (10x) 2.5

MgCl2 (25 mM) 1.5

Mix nucleotidica (ogni dNTP concentrato 2.5

mM) 2.0

Primer forward (100 µM) 0.5

Primer reverse (100 µM) 0.5

Taq polimerasi (Promega, 5U/µl) 0.25

H2O sterile 16.75

TOTALE 25 µl

I campioni sono stati separati mediante corsa elettroforetica su gel di 50 ml

preparato sciogliendo l’agarosio (1% p/v) in acqua distillata; alla miscela è stato aggiunto

TAE alla concentrazione finale di 1x. Oltre ai campioni è stato caricato su gel anche un

marcatore di dei pesi molecolari (Marker X, Roche).

Prima del caricamento, ad ogni campione è stato aggiunto 1/10 di volume di una

soluzione formata per il 50% Bromuro di Etidio 1µg/µl e per il 50% da Orange-G e

Page 45: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

45

saccarosio al 60% (tampone di caricamento). La corsa elettroforetica è stata effettuata a

40 V, per circa 1 ora a temperatura ambiente.

RISULTATI E DISCUSSIONE

Il genoma di girasole è stato sottoposto recentemente ad un’analisi mediante

la costruzione e il sequenziamento completo di una library casuale di piccoli inserti

(1000-2000 bp) che ha prodotto un database di 1638 sequenze per un totale di 954517 bp,

corrispondenti allo 0.03% del genoma del girasole (Cavallini et al. in corso di stampa).

Con la collaborazione dell’Istituto di Genomica Applicata (IGA) di Udine, tutte le

sequenze sono state sottoposte ad un’analisi con BLASTX e BLASTN sul database della

GenBank (http://www.ncbi.nlm.nih.gov/blast/Blast.cgi). Il valore di soglia scelto per il

BLAST è stato 10-5. Il 30% circa delle sequenze ha presentato similarità con elementi

trasponibili, la maggioranza dei quali sono rappresentati da retrotransposoni di classe I.

Fra gli elementi di classe I, quelli non–LTR come i LINEs sono risultati rari,

rappresentando solo lo 0.4 % di tutte le sequenze. Gli elementi di classe II, come i

trasposoni a DNA, sono risultati anch’essi rari e rappresentano lo 0.7 % delle sequenze.

6.1. Analisi delle sequenze

Nella prima parte della ricerca ho analizzato la library allo scopo di trovare

sequenze con elevata similarità con LINEs e con trasposoni di classe II. Di sette

sequenze corrispondenti a putativi LINEs ne è stata scelta una, la HAG004M10, che

mostra similarità con sequenze codificanti retrotrascrittasi di retrotrasposoni non-LTR.

Delle 12 sequenze corrispondenti a trasposoni a DNA, 8 erano del tipo Tc1/Mariner, una

del tipo Mutator, due del tipo hAT e una di tipo sconosciuto.

Per le successive analisi si sono scelte le sequenze HAG003H10, che codifica

una proteina con elevata similarità alla trasposasi di un trasposone di tipo Mariner, e

HAG003I05, che codifica una proteina con elevata similarità alla trasposasi di un

trasposone di tipo hAT.

Le sequenze da noi scelte sono state sottoposte ad un analisi informatica con i

programmi BLASTN e BLASTX (http://www.ncbi.nlm.nih.gov/blast). Le sequenze sono

state confermate come altamente omologhe a trasposoni le prime due e ad un LINE la

Page 46: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

46

terza. Al fine di identificare a livello nucleotidico i domini emersi a livello

amminoacidico con l’analisi BLASTX è stato necessario tradurre la sequenza ed

individuarne il frame esatto.

6.2. Il trasposone HAG003H10

La sequenza HAG003H10 è qui sotto riportata:

ATTTGCCGCTTTATCTTCGTATGTTACGTTACCTGGTTGGGGGGTCATCATCATCATAATATGTTACGACCGCTCTACC

TTCATCCTCCAAAATCATGTTGTGAAGAATGATACATGTGTACATCACGTTTCCAATTTGATCCTTGTCCCATAGTCGA

CAAGGCATTGCCAATATTCTCCACCTTTTCTTCAAAACACCGAATGCTCGCTCGACGTCTTTACGTGCAGCCATTTGGA

CCCTGTTAAACTTTAATCTCTTTGGATCTGAGGTACCGTGTCTTGTGAACAATTTTACGAAAACCCCCCACTCTAGGTA

AATCCCATCAACTAGGTAGTACCCGTGCATGTACTCAATCCCGTTTACAAAGAAAGTTCCTTTGGGTTCTATACCATTT

ACCCGATCATTGAAAAGAGGCGAGTGGTTTATGATGGTAATATCATTATGTGAACCTGGCATACCGAAGAACGCATGCC

ATATCCAAAGATCTTGGGACACAACCGCTTCAAGCATGATGGTTGGCACCCCGTGAAATCCACTAGTGTGAGCGCCTTG

CCATTGGGTAGGACAAAGTTCCCAGGGCCATTTCATACAATCTAAACTACCTAGCATCCCGGGT

La sequenza HAG003H10 (la “query” dell’analisi BLAST) è stata ribaltata

poiché nell’allineamento si presentava in modo decrescente mentre la sequenza

corrispondente trovata dal programma (il “subject”) era crescente. Il ribaltamento è stato

quindi indispensabile per i successivi utilizzi informatici.

La sequenza HAG003H10 ribaltata e la sua ipotetica traduzione (ottenuta con

il software “Translate Tool” utilizzabile in rete presso il server Expasy) sono riportate qui

sotto:

acccgggatgctaggtagtttagattgtatgaaatggccctgggaactttgtcctacccaa

P G M L G S L D C M K W P W E L C P T Q

tggcaaggcgctcacactagtggatttcacggggtgccaaccatcatgcttgaagcggtt

W Q G A H T S G F H G V P T I M L E A V

gtgtcccaagatctttggatatggcatgcgttcttcggtatgccaggttcacataatgat

V S Q D L W I W H A F F G M P G S H N D

attaccatcataaaccactcgcctcttttcaatgatcgggtaaatggtatagaacccaaa

I T I I N H S P L F N D R V N G I E P K

ggaactttctttgtaaacgggattgagtacatgcacgggtactacctagttgatgggatt

G T F F V N G I E Y M H G Y Y L V D G I

tacctagagtggggggttttcgtaaaattgttcacaagacacggtacctcagatccaaag

Y L E W G V F V K L F T R H G T S D P K

agattaaagtttaacagggtccaaatggctgcacgtaaagacgtcgagcgagcattcggt

R L K F N R V Q M A A R K D V E R A F G

gttttgaagaaaaggtggagaatattggcaatgccttgtcgactatgggacaaggatcaa

V L K K R W R I L A M P C R L W D K D Q

attggaaacgtgatgtacacatgtatcattcttcacaacatgattttggaggatgaaggt

I G N V M Y T C I I L H N M I L E D E G

agagcggtcgtaacatattatgatgatgatgaccccccaaccaggtaacgtaacatacga

R A V V T Y Y D D D D P P T R - R N I R

agataaagcggcaaat

R - S G K

Page 47: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

47

Si può osservare come quasi tutta la sequenza sembri in grado di codificare

una proteina, in assenza di mutazioni che abbiano introdotto codoni di stop nel frame di

lettura.

L’analisi BLAST ha consentito di individuare un certo numero di sequenze

corrispondenti alla nostra in specie diverse dal girasole. L’elenco delle sequenze risultate

più simili, con l’indicazione dello score di similarità (probabilità che la sequenza

richiesta sia diversa da quella trovata) è riportata nella tabella sottostante; per ciascuna

sequenza è anche riportato l’allineamento delle proteine putativamente codificate, come

ottenuto dall’analisi BLAST.

Sequenza Specie Score

gb|ABA93883.1| Oryza sativa Expect = 2e-57

gb|ABR18486.1| Triticum turgidum Expect = 7e-53

gb|ABD64939.1| Brassica oleracea Expect = 2e-52

820762AT3G15310 Arabidopsis thaliana Expect = 2e-51

gb|ABD32665.1| Medicago truncatula Expect = 3e-47

gb|ABJ96375.1| Prunus persica Expect = 7e-45

>gb|ABA93883.1| transposon protein, putative, Pong sub-class, expressed >

[Oryza

sativa (japonica cultivar-group)]

Length=448

Score = 225 bits (573), Expect = 2e-57

Identities = 107/179 (59%), Positives = 126/179 (70%), Gaps = 2/179 (1%)

Frame = -2

Query 616 PGMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHND 437

PGMLGSLDCM W W+ CP W+G T G +GVPTIMLEAV S DLW WHAFFG GS+ND

Sbjct 202 PGMLGSLDCMHWEWQNCPVAWKGQFTRGDYGVPTIMLEAVASADLWFWHAFFGAAGSNND 261

Query 436 ITIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPK 257

I +++ SPLF + G P F VNG EY GYYL D IY EW F K TR SD

Sbjct 262 INVLDQSPLFTAVLQGRAPSVQFTVNGTEYNMGYYLADNIYPEWAAFAKSITR-PQSDKA 320

Query 256 RLKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDE 80

+L R Q +ARKDVERAFGVL+KRW I+ P RLW++D++ ++MY CIILHNMI+EDE

Sbjct 321 KLYAQR-QESARKDVERAFGVLQKRWAIIRHPARLWERDELADIMYACIILHNMIVEDE 378

Page 48: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

48

>gb|ABR18486.1| putative protein [Triticum turgidum]

Length=348

Score = 209 bits (533), Expect = 7e-53

Identities = 102/182 (56%), Positives = 124/182 (68%), Gaps = 2/182 (1%)

Frame = -2

Query 616 PGMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHND 437

PGMLGSLDCM W W+ CP W+G T G+ G P+++LEAV SQDL IWHA+FG+ GS+ND

Sbjct 106 PGMLGSLDCMHWRWKKCPIAWKGQFTRGYKGWPSLILEAVASQDLRIWHAYFGIAGSNND 165

Query 436 ITIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPK 257

I ++N SPLF ++ G P+ FFVN EY HGYYLVDGIY EW FVK + T K

Sbjct 166 INVLNQSPLFIKQLKGQAPRANFFVNDKEYQHGYYLVDGIYPEWAAFVKTISMPQTE--K 223

Query 256 RLKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDEG 77

F Q ARKDVERAFGVL+ R+ IL RL+D+ I VM CIILHNM++ED+

Sbjct 224 HKLFAAHQKGARKDVERAFGVLQGRFSILRRLARLYDRGDIQKVMIACIILHNMVVEDKK 283

Query 76 RA 71

A

Sbjct 284 EA 285

>gb|ABD64939.1| hypothetical protein 24.t00017 >[Brassica oleracea]

Length=442

Score = 208 bits (530), Expect = 2e-52

Identities = 99/179 (55%), Positives = 125/179 (69%), Gaps = 3/179 (1%)

Frame = -2

Query 616 PGMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHND 437

PGM+GS+DCM W W+ CPT W+G +T G G PTI+LEAV S DLWIWHAFFG PG+ ND

Sbjct 194 PGMVGSIDCMHWEWKNCPTAWKGQYTRGL-GKPTIVLEAVASYDLWIWHAFFGPPGTLND 252

Query 436 ITIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPK 257

I +++ SP+F+D +NG P+ T+ VNG EY YYL DGIY +W F++ PK

Sbjct 253 INVLDRSPVFDDIINGQAPQVTYSVNGREYHLAYYLTDGIYPKWATFIQSIPL--PQGPK 310

Query 256 RLKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDE 80

+ F + Q A RKDVERAFGVL+ R+ I+ P WDK +IG +M CIILHNMI+EDE

Sbjct 311 AVLFAQRQEAVRKDVERAFGVLQARFAIVKNPALFWDKVKIGKIMRACIILHNMIVEDE

369

GENE ID: 820762 AT3G15310 | protein coding >[Arabidopsis thaliana]

(10 or fewer PubMed links)

Score = 204 bits (520), Expect = 2e-51

Identities = 98/179 (54%), Positives = 123/179 (68%), Gaps = 3/179 (1%)

Frame = -2

Query 616 PGMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHND 437

PGM+GSLDCM W W+ CPT W+G +T G G PTI+LEA+ SQDLWIWH FFG PG+ ND

Sbjct 186 PGMIGSLDCMHWEWKNCPTAWKGQYTRG-SGKPTIVLEAIASQDLWIWHVFFGPPGTLND 244

Query 436 ITIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPK 257

I I++ SP+F+D + G P + VNG EY YYL DGIY +W F++ + K

Sbjct 245 INILDRSPIFDDILQGRAPNVKYKVNGREYHLAYYLTDGIYPKWATFIQSIRL--PQNRK 302

Query 256 RLKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDE 80

F Q A RKDVERAFGVL+ R+ I+ P +WDK++IGN+M CIILHNMI+EDE

Sbjct 303 ATLFATHQEADRKDVERAFGVLQARFHIIKNPALVWDKEKIGNIMKACIILHNMIVEDE 361

Page 49: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

49

>gb|ABD32665.1| putative protein [Medicago truncatula]

Length=426

Score = 191 bits (484), Expect = 3e-47

Identities = 92/178 (51%), Positives = 120/178 (67%), Gaps = 2/178 (1%)

Frame = -2

Query 613 GMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHNDI 434

GM+GS+DCM W W+ CP W+G T G G T++LEA S DLWIWHAFFG PG+ NDI

Sbjct 182 GMIGSIDCMHWEWKNCPKAWEGQFTRGDKGTTTVILEADASHDLWIWHAFFGCPGTLNDI 241

Query 433 TIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPKR 254

+++ SP+F+D G P+ +FVN Y YYL DGIY + FVK R S+P +

Sbjct 242 NVLDRSPVFDDVEQGKTPRVNYFVNQRPYNMTYYLADGIYPSYPTFVKSI-RLPQSEPDK 300

Query 253 LKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDE 80

L F + Q + RKD+ERAFGVL+ R++I+ P RLWD +G +M +CIILHNMI+EDE

Sbjct 301 L-FAKHQESCRKDIERAFGVLQARFKIIREPARLWDIADLGIIMRSCIILHNMIVEDE 357

>gb|ABJ96375.1| hypothetical protein [Prunus persica] Length=458

Score = 183 bits (464), Expect = 7e-45

Identities = 88/179 (49%), Positives = 116/179 (64%), Gaps = 3/179 (1%)

Frame = -2

Query 616 PGMLGSLDCMKWPWELCPTQWQGAHTSGFHGVPTIMLEAVVSQDLWIWHAFFGMPGSHND 437

PGM+GS+DCM W W+ CPT WQG + + G +I+LEAV D W+WHAFFG+ GS ND

Sbjct 199 PGMIGSIDCMHWQWKNCPTAWQGDYGNR-KGQKSIILEAVACFDTWVWHAFFGVAGSQND 257

Query 436 ITIINHSPLFNDRVNGIEPKGTFFVNGIEYMHGYYLVDGIYLEWGVFVKLFTRHGTSDPK 257

+ ++ SP+FND + G P T+ +N Y GYYL DGIY W FVK H S +

Sbjct 258 LNVLGQSPVFNDVLRGEAPNITYEINNTIYQTGYYLADGIYPRWTTFVKTIP-HPRSHKE 316

Query 256 RLKFNRVQMAARKDVERAFGVLKKRWRILAMPCRLWDKDQIGNVMYTCIILHNMILEDE 80

+ F Q RKDVER FG+L+ RW I+ RL+D++ + ++M TCIILHNMI+EDE

Sbjct 317 KF-FACYQEGYRKDVERCFGILQARWAIIRGAARLFDEEVLRSIMMTCIILHNMIVEDE 374

Per stabilire i rapporti filogenetici fra le varie sequenze corrispondenti al

trasposone HAG003H10 abbiamo eseguito un multiallineamento a livello nucleotidico

con sequenze omologhe alla nostra appartenenti ad altre specie, riportato qui sotto (gli

asterischi neri rappresentano un’omologia di sequenza completa, mentre quelli rossi

indicano che uno stesso nucleotide è presente in almeno della metà delle sequenze; le

sequenze evidenziate in giallo o in azzurro rappresentano i primer progettati per le

successive analisi):

Oryza sativa GGTTCCCTGGCATGTTGGGTAGTCTTGACTGCATGCATTGGGAGTGGCAA

Triticum turgidum GGTTTCCTGGCATGTTAGGAAGCCTGGATTGTATGCATTGGCGTTGGAAA

Medicago truncatula GGTTCCTAGGGATGATCGGGAGTATTGACTGCATGCACTGGGAGTGGAAA

Arabidopsis thaliana GATTTCCCGGGATGATAGGAAGTCTCGATTGTATGCATTGGGAGTGGAAG

Brassica spp. GATTTCCTGGGATGGTAGGAAGCATCGATTGTATGCATTGGGAGTGGAAG

H.annuus HAG003H10 ----ACCCGGGATGCTAGGTAGTTTAGATTGTATGAAATGGCCCTGGGAA

Prunus persica GATTCCCTGGCATGATTGGTAGTATTGACTGCATGCACTGGCAGTGGAAA

********* ********** ********* * **** *** **

Page 50: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

50

Oryza sativa AATTGCCCGGTTGCATGGAAGGGACAATTCACACGTGGTGATTATGGTGT

Triticum turgidum AAATGTCCTATTGCATGGAAGGGCCAATTTACTCGTGGCTATAAAGGGTG

Medicago truncatula AATTGTCCTAAAGCATGGGAAGGTCAATTCACCAGGGGGGATAAGGGAAC

Arabidopsis thaliana AATTGCCCTACCGCTTGGAAAGGCCAGTATACACGTGG---CTCTGGAAA

Brassica spp. AATTGTCCCACCGCTTGGAAAGGGCAATATACTCGGGG---TTTGGGTAA

H.annuus HAG003H10 CTTTGTCCTACCCAATGGCAAGGCGCTCACACTAGTGGATTTCACGGGGT

Prunus persica AATTGTCCAACTGCTTGGCAAGGGGACTACGGAAATAG---AAAAGGGCA

********** ********** * **

Oryza sativa ACCCACTATCATGCTTGAAGCAGTTGCATCTGCTGACCTATGGTTTTGGC

Triticum turgidum GCCTAGTCTTATTCTGGAAGCAGTTGCTTCGCAAGATCTCCGGATATGGC

Medicago truncatula CACCACAGTTATTCTTGAAGCAGATGCATCTCATGATCTATGGATCTGGC

Arabidopsis thaliana ACCAACCATCGTTTTAGAGGCGATCGCATCACAAGATCTCTGGATTTGGC

Brassica spp. ACCAACAATTGTTTTAGAGGCGGTTGCTTCATATGATCTCTGGATATGGC

H.annuus HAG003H10 GCCAACCATCATGCTTGAAGCGGTTGTGTCCCAAGATCTTTGGATATGGC

Prunus persica GAAAAGTATCATCCTGGAAGCAGTTGCTTGTTTTGATACATGGGTTTGGC

* * * * ** ** * ** ******** **********

Oryza sativa ATGCATTTTTCGGTGCTGCTGGTTCAAACAATGATATCAATGTGTTGGAT

Triticum turgidum ATGCCTACTTTGGTATTGCTGGGTCAAACAATGACATCAATGTGCTAAAT

Medicago truncatula ATGCCTTTTTTGGATGTCCGGGAACGTTGAACGATATAAACGTTCTAGAC

Arabidopsis thaliana ACGTATTTTTTGGACCTCCAGGTACCTTAAACGATATAAATATTCTTGAT

Brassica spp. ATGCATTTTTTGGACCTCCAGGTACCTTAAATGATATCAATGTTCTTGAT

H.annuus HAG003H10 ATGCGTTCTTCGGTATGCCAGGTTCACATAATGATATTACCATCATAAAC

Prunus persica ACGCCTTCTTCGGAGTTGCCGGATCTCAAAACGATTTGAATGTCCTAGGT

**** * ** ** * ** * ** ** * * * *

Oryza sativa CAGTCACCATTGTTTACTGCAGTGCTACAAGGAAGAGCTCCTAGTGTTCA

Triticum turgidum CAATCGCCATTGTTTATCAAGCAACTGAAAGGCCAAGCTCCTCGAGCGAA

Medicago truncatula CGGTCACCAGTGTTCGATGATGTGGAACAGGGAAAGACTCCAAGGGTGAA

Arabidopsis thaliana CGATCACCAATTTTTGATGATATATTACAAGGTCGAGCCCCAAATGTGAA

Brassica spp. CGCTCACCTGTTTTTGATGACATAATAAATGGTCAAGCTCCGCAAGTCAC

H.annuus HAG003H10 CACTCGCCTCTTTTCAATGATCGGGTAAATGGTATAGAACCCAAAGGAAC

Prunus persica CAATCCCCGGTGTTCAATGATGTTTTGAGAGGTGAAGCCCCAAATATCAC

* ** ** * ** ** **

Oryza sativa ATTTACTGTCAATGGGACAGAATAT-AACATGGGATACTATTTAGCTGAT

Triticum turgidum CTTTTTTGTAAATGACAAGGAATATCAACATGGT-TATTACCTTGTAGAT

Medicago truncatula TTACTTTGTGAATCAACGTCCCTAT-AATATGACATACTATCTAGCTGAT

Arabidopsis thaliana GTACAAAGTCAATGGACGAGAGTAT-CATTTAGCTTACTATCTCACAGAT

Brassica spp. ATACTCTGTCAACGGAAGAGAGTAT-CATTTGGCTTACTATCTAACTGAT

H.annuus HAG003H10 TTTCTTTGTAAACGGGATTGAGTACATGCACGGG-TACTACCTAGTTGAT

Prunus persica ATATGAAATTAACAATACCATCTAC-CAGACCGGGTATTATCTAGCTGAT

* * ** ** ** ** * ***

Oryza sativa AATATTTATCCAGAGTGGGCTGCATTTGCCAAATCAATTACTA-------

Triticum turgidum GGGATATACCCAGAATGGGCAGCTTTTGTGAAGACAATATCAA-------

Medicago truncatula GGTATCTACCCTTCTTACCCAACTTTCGTCAAATCAATTAGGC-------

Arabidopsis thaliana GGTATTTATCCAAAATGGGCGACTTTTATCCAATCTATTCGAC-------

Brassica spp. GGTATCTATCCGAAATGGGCAACTTTTATCCAATCAATTCCAT-------

H.annuus HAG003H10 GGGATTTACCTAGAGTGGGGGGTTTTCGTAAAATTGTTCACAAGACACGG

Prunus persica GGCATATACCCGAGGTGGACAACATTTGTGAAAACAATTCCAC-------

** ** * * ** * *

Oryza sativa GACCTCAAAGTGACAAGGCTAAATTGTATGCACAACGCCAAGAATCAGCA

Triticum turgidum TGCCACAAACAGAGAAGCACAAGTTGTTTGCTGCACATCAGAAAGGGGCA

Medicago truncatula TTCCTCAAAGTGAACCCGATAAGTTATTTGCAAAACATCAAGAGAGCTGT

Arabidopsis thaliana TACCACAAAATCGGAAAGCCACTTTATTTGCAACACATCAAGAAGCGGAC

Brassica spp. TACCACAAGGCCCAAAAGCGGTTTTATTTGCTCAACGTCAAGAAGCTGTC

H.annuus HAG003H10 TACCTCAGATCCAAAGAGATTAAAGTTTAACAGGGT-CCAAATGGCTGCA

Prunus persica ATCCCCGATCCCATAAGGAAAAATTTTTTGCTTGCTATCAAGAGGGGTAC

** * * * ** ***

Page 51: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

51

Oryza sativa AGGAAAGATGTGGAACGAGCATTTGGGGTTTTGCAAAAACGTTGGGCCAT

Triticum turgidum AGGAAGGATGTGGAACGTGCTTTTGGTGTTTTGCAGGGTCGATTCTCTAT

Medicago truncatula CGGAAGGACATCGAACGTGCTTTTGGTGTGCTTCAAGCTCGATTTAAAAT

Arabidopsis thaliana CGTAAAGATGTCGAACGTGCATTTGGAGTATTGCAAGCTCGCTTTCACAT

Brassica spp. CGAAAAGATGTCGAGCGTGCTTTTGGAGTCCTGCAAGCCCGTTTTGCCAT

H.annuus HAG003H10 CGTAAAGACGTCGAGCGAGCATTCGGTGTTTTGAAGAAAAGGTGGAGAAT

Prunus persica AGAAAAGATGTTGAGAGGTGCTTTGGTATCCTTCAAGCTCGGTGGGCTAT

*********************** ****** * * * * **

Oryza sativa AATTCGCCACCCAGCACGGCTTTGGGAAAGGGATGAACTAGCTGATATCA

Triticum turgidum CTTGCGTCGTCTTGCACGTTTGTATGACCGGGGTGATATCCAGAAGGTCA

Medicago truncatula CATCCGTGAACCAGCTCGCTTGTGGGACATAGCTGATTTGGGTATAATCA

Arabidopsis thaliana TATTAAAAATCCAGCTCTTGTTTGGGATAAGGAAAAAATTGGAAATATTA

Brassica spp. TGTTAAAAATCCGGCACTTTTTTGGGATAAAGTCAAAATTGGGAAGATTA

H.annuus HAG003H10 ATTGGCAATGCCTTGTCGACTATGGGACAAGGATCAAATTGGAAACGTGA

Prunus persica TATCAGGGGCGCGGCACGTCTATTTGACGAGGAGGTGCTTAGGAGTATAA

* * * * ** * * * *

Oryza sativa TGTATGCATGTATTATTTTGCACAACATGATAGTTGAGGATGAGAGAGA-

Triticum turgidum TGATAGCTTGCATCATTCTTCACAATATGGTAGTCGAGGATAAAAAAGAA

Medicago truncatula TGAGGTCATGCATCATATTACATAATATGATTGTTGAGGATGAACGAGAT

Arabidopsis thaliana TGAAAGCATGTATCATACTGCACAATATGATAGTCGAAGACGAACGAGAT

Brassica spp. TGAGAGCTTGTATCATACTCCATAATATGATAGTAGAAGACGAACGAGAT

H.annuus HAG003H10 TGTACACATGTATCATTCTTCACAACATGATTTTGGAGGATGAAGGTAGA

Prunus persica TGATGACTTGTATCATCCTCCATAACATGATTGTGGAAGATGAATATGAT

**** ***************************** ********* *

Oryza sativa -CG-ATTA---------TGACATAC--CTGATGACAACACATATGAGCAA

Triticum turgidum GCG-GCGG--------CTAATATTC--TTGATTTGAACAAGGA--GGCGG

Medicago truncatula ACATATGC--------TCAACGTTGGACCGATTTTGAGCAATCTGAGGGA

Arabidopsis thaliana GGGTACAACATTCAGTTTGATGTTTCAGAATTCCTACAAGTTGAAGGAAA

Brassica spp. GGATACA---CTTTGTTTGACGGTTCAGAGTTCCAAGAAGCTGAAGACAA

H.annuus HAG003H10 GCGGTCGTAACATATTATGATGATGATGACCCCCCAACCAGGTAACGTAA

Prunus persica TACGATGCTGATGACGTGTATGAAC--CAAATCCCATGGACACGGCCCTA

*

Oryza sativa TCACAATCTTCTGTACAACTAGCAGGACTCGACCATGGGCCAATCCATGG

Triticum turgidum GTACA-TCCATTGTTCTACCATCAGTATTCACACACGGTGACATACAGGT

Medicago truncatula AGTGGATCTAGTACACAGCAACCA-TACTCGACCGAGGTGTTACCCACT-

Arabidopsis thaliana CCAAACTCCACAAGTCGATTTATCGTATTCTACAGGTATGCCTCTAAAT-

Brassica spp. CGGAAGTTCACATGTCGATCTCACGTATTCTACAGATATGCCTTCAAAT-

H.annuus HAG003H10 CATACGAAGATAAAGCGGCAAAT---------------------------

Prunus persica ACACGAATTTATGAAAAACCAGTGGGGCCAAATGGAGAAGCAGTGCAGCA

Il multiallineamento ha consentito di calcolare le distanze genetiche per ogni

coppia di sequenze e quindi di costituire un albero che individua i rapporti filogenetici

fra le diverse sequenze analizzate, riportato in Figura 15.

Page 52: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

52

Fig. 15 - Albero di consenso che mostra le relazioni filogenetiche fra la sequenza del trasposone HAG003H10 di girasole ed altri trasposoni similari. La sbarra indica una distanza genetica del 10%.

L’albero mostra la separazione fra le sequenze appartenenti a dicotiledoni

(evidenziate con la linea blu) e a monocotiledoni (evidenziate con linea rossa).

6.3. Il trasposone HAG003I05

La sequenza HAG003I05 è qui sotto riportata: AGTTAGACTAACCTTTGTTGCAGAAACTAACTCCATTGCATTAAGGATGTCTTGGGATTTCTTTTGTAATGCTTGACTA

AGTGTTTCCGTTTTACTCATTACTTCTTTCATCAAGTGAAGAACAAGCACAAATTCAAATGATTGCAAGTAACTGTAAG

CTATATTAGCATCTCCACGTTGAGAACCAGTAGCATGAGACGTGTCTTCAATTATTCCCTTGAGAACAGCACGGGTGAC

ATCAAACATGTTAACCAAACTACAAATAGATTTAAAATGAGGACCCCAACGTGCATCACCAGCCCTTCGTAATGTCCCA

ACCTGATTTTGTCCTTTTCCCGATTTGATTTCACCCAATTCTAATAACTTTTTAATCTCATCTGCCTTCGCCATTTGTA

ACTCATCATGACGCTTACTTGAAGCACACACCACATTAATTATGAAAACTAAGTTTGAGAAGAATTGGTGTACTGGAGT

CACATCCCTTGAGACACAAACCAAGGCAAGTTGTAACCTGTGAGCAAAAAAAGAAAAATATAATTTAATAACCATAAGA

GTATTTTAGTAAATCTTTTGCACATCATC

Anche la sequenza HAG003I05 (la “query” dell’analisi BLAST) è stata

ribaltata poiché nell’allineamento si presentava in modo decrescente mentre la sequenza

corrispondente trovata dal programma (il “subject”) era crescente. Il ribaltamento è stato

quindi indispensabile per i successivi utilizzi informatici.

Page 53: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

53

La sequenza HAG003I05 ribaltata e la sua ipotetica traduzione sono riportate qui sotto:

gatgatgtgcaaaagatttactaaaatactcttatggttattaaattatatttttctttt

D D V Q K I Y - N T L M V I K L Y F S F

tttgctcacaggttacaacttgccttggtttgtgtctcaagggatgtgactccagtacac

F A H R L Q L A L V C V S R D V T P V H

caattcttctcaaacttagttttcataattaatgtggtgtgtgcttcaagtaagcgtcat

Q F F S N L V F I I N V V C A S S K R H

gatgagttacaaatggcgaaggcagatgagattaaaaagttattagaattgggtgaaatc

D E L Q M A K A D E I K K L L E L G E I

aaatcgggaaaaggacaaaatcaggttgggacattacgaagggctggtgatgcacgttgg

K S G K G Q N Q V G T L R R A G D A R W

ggtcctcattttaaatctatttgtagtttggttaacatgtttgatgtcacccgtgctgtt

G P H F K S I C S L V N M F D V T R A V

ctcaagggaataattgaagacacgtctcatgctactggttctcaacgtggagatgctaat

L K G I I E D T S H A T G S Q R G D A N

atagcttacagttacttgcaatcatttgaatttgtgcttgttcttcacttgatgaaagaa

I A Y S Y L Q S F E F V L V L H L M K E

gtaatgagtaaaacggaaacacttagtcaagcattacaaaagaaatcccaagacatcctt

V M S K T E T L S Q A L Q K K S Q D I L

aatgcaatggagttagtttctgcaacaaaggttagtctaact

N A M E L V S A T K V S L T

Si può osservare anche in questo caso che la sequenza presenta, nel frame

corretto, solo un codone di stop, indicando che solo poche mutazioni sono intervenute

durante l’evoluzione di questo trasposone.

L’analisi BLAST ha consentito di individuare un certo numero di sequenze

corrispondenti alla nostra in specie diverse dal girasole. L’elenco delle sequenze risultate

più simili, con l’indicazione dello score di similarità (probabilità che la sequenza

richiesta sia diversa da quella trovata) è riportata nella tabella sottostante; per ciascuna

sequenza è anche riportato l’allineamento delle proteine putativamente codificate, come

ottenuto dall’analisi BLAST.

Sequenza Specie Score

dbj|BAA36225.1| Ipomoea purpurea Expect = 3e-46

gb|EAY83186.1| Oryza sativa Expect = 4e-38

822606AT3G29450 Arabidopsis thaliana Expect = 2e-29

Page 54: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

54

>dbj|BAA36225.1| transposase [Ipomoea purpurea]

Length=808

Score = 187 bits (475), Expect = 3e-46

Identities = 102/176 (57%), Positives = 126/176 (71%), Gaps = 4/176 (2%)

Frame = -1

Query 534 YFSFFAHRLQLALVCVSRDVTPVHQFFSNLVFIINVVCASSKRHDELQMAKADEIKKLLE 355

Y FAHRLQLALV S++V PVHQFF+ L IINVV AS KR+D+L+ A A I LL

Sbjct 397 YVHCFAHRLQLALVASSKEVIPVHQFFTKLNSIINVVGASCKRNDQLKAAHASNISHLLS 456

Query 354 LGEIKSGKGQNQVGTLRRAGDARWGPHFKSICSLVNMFDVTRAVLKGIIED-TSHATGSQ 178

+ E++SG+G NQ+G+L+R GD RW H KSI SL+ MF T VL IIED T+HA

Sbjct 457 IDELESGRGLNQIGSLQRPGDTRWSSHLKSISSLMRMFSATCEVLLNIIEDGTTHA---H 513

Query 177 RGDANIAYSYLQSFEFVLVLHLMKEVMSKTETLSQALQKKSQDILNAMELVSATKV 10

RGDA+ AY L SFEFV ++HLMK+V+ + L QALQ +SQDILNAM LVS+TK+

Sbjct 514 RGDADAAYEVLTSFEFVFIMHLMKKVLEISNMLCQALQLQSQDILNAMHLVSSTKL 569

>gb|EAY83186.1| hypothetical protein OsI_037145 [Oryza sativa (indica

cultivar-group)]

Length=809

Score = 160 bits (405), Expect = 4e-38

Identities = 88/177 (49%), Positives = 119/177 (67%), Gaps = 1/177 (0%)

Frame = -1

Query 534 YFSFFAHRLQLALVCVSRDVTPVHQFFSNLVFIINVVCASSKRHDELQMAKADEIKKLLE 355

Y AH+LQLALV SR+V VH FF + FIINVV S KR+DEL +A+EI + +E

Sbjct 394 YIHCMAHQLQLALVAASREVHEVHNFFQHANFIINVVSVSPKRNDELLATQAEEISREIE 453

Query 354 LGEIKSGKGQNQVGTLRRAGDARWGPHFKSICSLVNMFDVTRAVLKGIIEDTSHATGSQR 175

LGE+ +G+G N + +L+R GD RW H+KSI SL MF T +VL+ I D S + S R

Sbjct 454 LGELDTGRGANHMSSLQRPGDTRWSSHYKSIQSLKKMFGATVSVLRNIAHDHSVSKYS-R 512

Query 174 GDANIAYSYLQSFEFVLVLHLMKEVMSKTETLSQALQKKSQDILNAMELVSATKVSL 4

GDA+ A + +F+FV +L +M+++M T+ L Q LQKKS DILNA++ VS TK+ L

Sbjct 513 GDASGALRMIITFDFVFILLMMEKIMKITDVLCQTLQKKSIDILNAVDSVSNTKMLL 569

>ref|NP_189591.1| unknown protein [Arabidopsis thaliana]

Length=522

GENE ID: 822606 AT3G29450 | protein coding [Arabidopsis thaliana]

Score = 131 bits (330), Expect = 2e-29

Identities = 74/177 (41%), Positives = 109/177 (61%), Gaps = 2/177 (1%)

Frame = -1

Query 534 YFSFFAHRLQLALVCVSRDVTPVHQFFSNLVFIINVVCASSKRHDELQMAKADEIKKLLE 355

Y FAH+LQL +V V++ + FF + +INVV AS KR D ++ ++++ +

Sbjct 244 YIHCFAHQLQLVVVAVAKKHFEIGDFFDMISVLINVVGASCKRKDRVRDEFRKKLEERIN 303

Query 354 LGEIKSGKGQNQVGTLRRAGDARWGPHFKSICSLVNMFDVTRAVLKGIIEDTSHATGSQR 175

GEIK+GKG NQ +L+R G+ RWG H+ ++ LV++F V VL+ I +D + +T +R

Sbjct 304 QGEIKTGKGLNQKLSLQRPGNTRWGTHYTTLLRLVDLFSVIIKVLEWIEDDGTDST--KR 361

Query 174 GDANIAYSYLQSFEFVLVLHLMKEVMSKTETLSQALQKKSQDILNAMELVSATKVSL 4

AN Y +F+FV L LM ++ T +LS ALQ+K QDILNAM LV +TK L

Sbjct 362 RQANGLLKYFNTFDFVFYLQLMLLILGLTNSLSVALQRKDQDILNAMSLVKSTKQQL 418

Page 55: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

55

Per stabilire i rapporti filogenetici fra le varie sequenze corrispondenti al

trasposone HAG003I05 abbiamo eseguito un multiallineamento a livello nucleotidico

con le tre sequenze sopra riportate (gli asterischi neri rappresentano un’omologia di

sequenza completa, mentre quelli rossi indicano che uno stesso nucleotide è presente in

almeno della metà delle sequenze; le sequenze evidenziate in azzurro rappresentano i

primer progettati per le successive analisi):

H.annuus HAG003I05 ---GATGATGTGCAAAAGATTTACTAAAATACTCTTATGGTTATTAAATT

Ipomoea purpurea ATGGATTGAAAGCTTTAATTTTGGATGAATGTCCTTATGCTTATTA----

Oryza sativa ATGGATTGAAGGCACTAGTTCTAAATGAGTGCCCTTATGCATATTA----

Arabidopsis thaliana ACGGGTTGAGATCTCTAATTTTGAGAGAAAATAGTTCTGCATATTA----

* * * * * * * ** ** *****

H.annuus HAG003I05 ATATTTTTCTTTTTTTGCTCACAGGTTACAACTTGCCTTGGTTTGTGTCT

Ipomoea purpurea ---TGTTCATTGTTTTGCACATCGATTGCAATTGGCATTAGTAGCTTCAT

Oryza sativa ---CATTCATTGCATGGCTCACCAGCTCCAATTGGCTCTTGTCGCGGCAT

Arabidopsis thaliana ---TATCCACTGCTTTGCGCATCAGCTTCAGTTAGTCGTCGTGGCAGTTG

* ** ** ********** **** *** * ***** ** *** *

H.annuus HAG003I05 CAAGGGATGTGACTCCAGTACACCAATTCTTCTCAAACTTAGTTTTCATA

Ipomoea purpurea CAAAGGAAGTCATCCCTGTCCATCAGTTTTTCACTAAGTTAAACTCCATT

Oryza sativa CAAGAGAAGTACATGAGGTACATAACTTCTTTCAGCATGCAAATTTCATC

Arabidopsis thaliana CTAAAAAACATTTTGAAATTGGAGATTTCTTTGATATGATTTCTGTCTTG

******* ** * ********* ** ****** * ** *** ******

H.annuus HAG003I05 ATTAATGTGGTGTGTGCTTCAAGTAAGCGTCATGATGAGTTACAAATGGC

Ipomoea purpurea ATTAATGTTGTTGGGGCTTCATGTAAGCGCAATGACCAATTAAAAGCTGC

Oryza sativa ATAAATGTTGTGAGTGTATCTCCTAAGCGCAACGATGAGTTACTAGCTAC

Arabidopsis thaliana ATAAATGTGGTTGGAGCTTCTTGTAAGAGAAAGGATAGGGTTCGAGATGA

************ ******** ******* ***** ****** *

H.annuus HAG003I05 GAAGGCAGATGAGATTAAAAAGTTATTAGAATTGGGTGAAATCAAATCGG

Ipomoea purpurea TCATGCCTCAAATATTTCTCATTTGCTGAGTATTGATGAGCTAGAAAGTG

Oryza sativa ACAAGCTGAAGAAATATCTCGTGAAATTGAGTTGGGAGAGCTTGACACAG

Arabidopsis thaliana ATTTCGGAAAAAGCTGGAGGAAAGAATCAATCAAGGTGAAATTAAGACGG

* * * * ** * * *

H.annuus HAG003I05 GAAAAGGACAAAATCAGGTTGGGACATTACGAAGGGCTGGTGATGCACGT

Ipomoea purpurea GGAGGGGCCTTAACCAAATTGGTTCTTTACAAAGGCCAGGTGATACTCGC

Oryza sativa GAAGAGGGGCAAATCATATGAGCTCTCTACAAAGGCCAGGGGATACAAGA

Arabidopsis thaliana GAAAAGGATTGAATCAGAAACTTTCACTACAGAGACCCGGTAATACTCGT

* * ** ** ** * *** *** * ****** *****

H.annuus HAG003I05 TGGGGTCCTCATTTTAAATCTATTTGTAGTTTGGTTAACATGTTTGATGT

Ipomoea purpurea TGGAGTTCTCATTTGAAATCTATATCAAGTTTGATGAGAATGTTTAGTGC

Oryza sativa TGGAGTTCCCATTACAAGTCAATTCAGAGCTTAAAGAAAATGTTTGGTGC

Arabidopsis thaliana TGGGGTACTCACTACACAACATTACTCCGGTTAGTTGATTTATTCTCTGT

*** ** * ** * * * * * ** * ** **

H.annuus HAG003I05 CACCCGTGCTGTTCTCAAGGGAATAATTGAAGACACGTCTCATGCTACTG

Ipomoea purpurea AACATGTGAAGTTTTACTTAATATTATTGAAGATGGA------ACTACAC

Oryza sativa AACAGTTTCAGTTCTACGCAACATTGCACATGATCATTCA---GTTTCAA

Arabidopsis thaliana TATCATTAAAGTGCTTGAGTGGATCGAAGATGATGGA------ACTGATA

* * ** * ** * ** *

H.annuus HAG003I05 GTTCTCAACGTGGAGATGCTA-ATATAGCTTAC-AGTTACTTGCAATCAT

Ipomoea purpurea ATGCTCACCGTGGAGATGCCG-ATGCAGCTTATGAGGTACTCACT-TCTT

Oryza sativa AGTATTCACGTGGAGATGCTTCAGGTGCCCTGCGAATGATTATCA--CAT

Arabidopsis thaliana GTACCAAAAGACGACAAGCTA-ATG-GTCTTCTCAAGTACTTTAATACCT

* ** * ** * ******* ** * * ***

Page 56: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

56

H.annuus HAG003I05 TTGAATTTGTGCTTGTTCTTCACTTGATGAAAGAAGTAATGAGTAAAACG

Ipomoea purpurea TTGAATTTGTATTCATTATGCATCTCATGAAAAAAGTTTTGGAGATTTCT

Oryza sativa TTGATTTTGTGTTTATTCTGCTCATGATGGAAAAGATTATGAAAATCACT

Arabidopsis thaliana TTGACTTTGTGTTCTACTTACAGTTGATGTTGCTTATTCTTGGACTCACA

*********** ** **** ************ **** ***** * **

H.annuus HAG003I05 GAAACACTTAGTCAAGCATTACAAAAGAAATCCCAAGACATCCTTAATGC

Ipomoea purpurea AATATGCTTTGCCAAGCTTTGCAACTTCAATCTCAAGATATATTGAATGC

Oryza sativa GATGTGCTGTGCCAAACTCTCCAAAAGAAGTCAATTGATATTTTAAATGC

Arabidopsis thaliana AATAGTTTATCAGTGGCTCTACAAAGGAAAGACCAAGACATTCTGAATGC

** * *** * ***** *********************** ** *****

H.annuus HAG003I05 AATGGAGTTAGTTTCTGCAACAAA-----GGTTAGTCTAACT--------

Ipomoea purpurea AATGCATCTTGTATCATCTACTAAA--TTGCTTATTCAAACTTTAAGAGA

Oryza sativa AGTTGATTCTGTTTCTAACACCAAA--ATGTTACTTGGTGACTTAAGAAA

Arabidopsis thaliana TATGTCACTAGTGAAATCCACCAAGCAACAGTTATTCAAGCTC--AGAGA

****** ********* * ** ** * *

Il multiallineamento ha consentito di calcolare anche in questo caso le

distanze genetiche per ogni coppia di sequenze e quindi di costituire un albero, da cui si

osserva che la sequenza più vicina a quella da noi studiata è, come era previsto, quella di

Ipomoea purpurea (Figura 16).

Figura 16 - Albero di consenso che mostra le relazioni filogenetiche fra la sequenza del trasposone

HAG003I05 di girasole ed altri 3 trasposoni similari. La sbarra indica una distanza genetica del

10%.

Page 57: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

57

6.4. Il LINE HAG004M10F

La sequenza HAG004M10 e la sua ipotetica traduzione sono riportate qui sotto:

ctagttgctgaaactagacaaaccctaaatgcgaggctagaggaatggagaacatcg

L V A E T R Q T L N A R L E E W R T S

ttagaaggcaacggtttaaggattagtcagtctaagactgaatacctgtattgtaatttc

L E G N G L R I S Q S K T E Y L Y C N F

agtggtgcaggtgacaacgaggacactcaggttatcattgaaggtcaagtggtcccacaa

S G A G D N E D T Q V I I E G Q V V P Q

acgactaagttcaagtacttaggatcgtttgtgcaaagggacggagagatagatagtgat

T T K F K Y L G S F V Q R D G E I D S D

gtatctcaccgcatccaggttggctggtgtaagtggagagcagccactgggatattgtgt

V S H R I Q V G W C K W R A A T G I L C

gacaggaggttcccgacaaaattgaagggaaaattctatagaatagcagttcgaccggct

D R R F P T K L K G K F Y R I A V R P A

atgttatacggaacagagtgttggtccatcaagaaaactcaagcgcgcaagatggaggta

M L Y G T E C W S I K K T Q A R K M E V

acggagatgagaatgttggggtggatgtgtggccacacgaggttagaccgaataagaagt

T E M R M L G W M C G H T R L D R I R S

gaggtttatagggattggttaggagtagctagtatatcagacaagttaaaagaggggagt

E V Y R D W L G V A S I S D K L K E G S

ttgagatggtttgggcatgtgaagaggaggtagttaaccaaaccagttagagcagtggaa

L R W F G H V K R R - L T K P V R A V E

aacataatagtggaaggaaggaggggt

N I I V E G R R G

L’analisi BLAST ha consentito di individuare anche in questo caso tre

sequenze con elevata similarità al nostro LINE in specie diverse dal girasole. L’elenco

delle sequenze risultate più simili, con l’indicazione dello score di similarità (probabilità

che la sequenza richiesta sia diversa da quella trovata) è riportata nella tabella

sottostante; per ciascuna sequenza è anche riportato l’allineamento delle proteine

putativamente codificate, come ottenuto dall’analisi BLAST.

Sequenza Specie Score

gb|AAT40504.2| Solanum demissum

Expect = 3e-67

gb|ABB00038.1| Glycine max Expect = 2e-60

gb|ABN08144.1| Medicago truncatula Expect = 1e-54

Page 58: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

58

>gb|AAT40504.2| Polyprotein, putative [Solanum demissum]

Length=868

Score = 257 bits (657), Expect = 3e-67

Identities = 117/207 (56%), Positives = 148/207 (71%), Gaps = 0/207 (0%)

Frame = +1

Query 1 LVAETRQTLNARLEEWRTSLEGNGLRISQSKTEYLYCNFSGAGDNEDTQVIIEGQVVPQT 180

L+ ETR +NARLE WR +LE G R+S++KTEYL C FS D D +V + QV+P+

Sbjct 443 LIDETRDRVNARLEVWRQTLESKGFRLSRTKTEYLGCKFSDGLDETDVEVRLAAQVIPKK 502

Query 181 TKFKYLGSFVQRDGEIDSDVSHRIQVGWCKWRAATGILCDRRFPTKLKGKFYRIAVRPAM 360

F+YLG+ +Q G+ID DV+HR+ W KWR A+G+LCD++ KLKGKFYR+ VRPA+

Sbjct 503 ESFRYLGAVIQGSGDIDDDVTHRVGAAWMKWRLASGVLCDKKISPKLKGKFYRVVVRPAL 562

Query 361 LYGTECWSIKKTQARKMEVTEMRMLGWMCGHTRLDRIRSEVYRDWLGVASISDKLKEGSL 540

LYG ECW +K KM V EMRML WMCGHTR D+IR+EV R+ +GVAS+ DKL+E L

Sbjct 563 LYGAECWPVKNAHVHKMHVAEMRMLRWMCGHTRSDKIRNEVIREKVGVASVVDKLREARL 622

Query 541 RWFGHVKRR*LTKPVRAVENIIVEGRR 621

RWFGHVKRR PVR E ++VEG R

Sbjct 623 RWFGHVKRRSADAPVRRCEVMVVEGTR 649

>gb|ABB00038.1| reverse transcriptase family member [Glycine max]

Length=377

Score = 234 bits (598), Expect = 2e-60

Identities = 109/201 (54%), Positives = 147/201 (73%), Gaps = 1/201 (0%)

Frame = +1

Query 1 LVAETRQTLNARLEEWRTSLEGNGLRISQSKTEYLYCNFSGAGDNEDTQVIIEGQVVPQT 180

L+ E+R+ LN RLE WR +LE +G R+S+SK+EY+ C F+ + +++V I ++PQ

Sbjct 128 LLGESREELNERLETWRRALETHGFRLSRSKSEYMECQFNKRRVS-NSEVKIGDHIIPQV 186

Query 181 TKFKYLGSFVQRDGEIDSDVSHRIQVGWCKWRAATGILCDRRFPTKLKGKFYRIAVRPAM 360

T+FKYLGS +Q DGEI+ DV+HRIQ GW KWR A+G+LCD + P KLKGKFYR AVRP +

Sbjct 187 TRFKYLGSVIQDDGEIEGDVNHRIQAGWMKWRKASGVLCDAKVPIKLKGKFYRTAVRPTI 246

Query 361 LYGTECWSIKKTQARKMEVTEMRMLGWMCGHTRLDRIRSEVYRDWLGVASISDKLKEGSL 540

LYGTECW++K K+ V EMRML WMCG TR D+IR+E R+ +GVA I +K+ E L

Sbjct 247 LYGTECWAVKSQHENKVGVAEMRMLRWMCGKTRQDKIRNEAIRERVGVAPIVEKMVENRL 306

Query 541 RWFGHVKRR*LTKPVRAVENI 603

RWFGHV+RR + +R V+ +

Sbjct 307 RWFGHVERRPVDSVLRRVDQM 327

>gb|ABN08144.1| RNA-directed DNA polymerase ; HMG-I and HMG-Y, DNA-binding,

putative

[Medicago truncatula]

Length=195

Score = 215 bits (548), Expect = 1e-54

Identities = 97/167 (58%), Positives = 124/167 (74%), Gaps = 0/167 (0%)

Frame = +1

Query 1 LVAETRQTLNARLEEWRTSLEGNGLRISQSKTEYLYCNFSGAGDNEDTQVIIEGQVVPQT 180

LV E+R+ +N RLE WR +LE G R+S+SKTEY+ NFSG +V + ++PQ

Sbjct 19 LVGESREEVNGRLETWRQALEAYGFRLSRSKTEYMEWNFSGRRSRSTLEVKVGDHIIPQV 78

Query 181 TKFKYLGSFVQRDGEIDSDVSHRIQVGWCKWRAATGILCDRRFPTKLKGKFYRIAVRPAM 360

T+FKYLGSFVQ DGEI++DVSHRIQ GW KWR A+G+LCD++ P KLKGKFYR A+RPA+

Sbjct 79 TRFKYLGSFVQNDGEIEADVSHRIQAGWLKWRRASGVLCDKKVPLKLKGKFYRTAIRPAL 138

Query 361 LYGTECWSIKKTQARKMEVTEMRMLGWMCGHTRLDRIRSEVYRDWLG 501

LYGTECW++K ++ VTEMRML WM G TR DRIR++ R+ G

Sbjct 139 LYGTECWAVKSQHENQVSVTEMRMLRWMSGKTRQDRIRNDTIREGRG 185

Page 59: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

59

Per stabilire i rapporti filogenetici fra le varie sequenze corrispondenti al

LINE di H. annuus HAG004M10 abbiamo eseguito ancora un multiallineamento a

livello nucleotidico con le tre sequenze sopra riportate (gli asterischi neri rappresentano

un’omologia di sequenza completa, mentre quelli rossi indicano che uno stesso

nucleotide è presente in almeno della metà delle sequenze; le sequenze evidenziate in

azzurro rappresentano i primer progettati per le successive analisi):

Glycine max TGCATGCTTTTTGCAG----ATGACATAGTCCTCCTTGGAGAGTCGAGGG

Medicago truncatula TACATTTCCTGTACAAGGAAATGATGTAGTCTTGGTGGGTGAGTCGAGGG

H.annuus HAG004M10 -------------------------------CTAGTTGCTGAAACTAGAC

Solanum demissum TGTATGTTATTTGCGG----ATGACATAGTACTGATTGATGAGACGCGGG

* * * ** * *

Glycine max AGGAGTTGAATGAGAGGTTGGAAACTTGGAGACGAGCTCTAGAAACACAT

Medicago truncatula AGGAAGTGAACGGGAGGCTAGAGACCTGGAGGCAAGCCTTAGAAGCGTAT

H.annuus HAG004M10 AAACCCTAAATGCGAGGCTAGAGGAATGGAGAACATCGTTAGAAGGCAAC

Solanum demissum ACAGAGTTAATGCGCGGTTGGAGGTGTGGAGACAAACGCTGGAGTCCAAA

* * * **************** ******* * ********* ***

Glycine max GGCTTTCGCCTAAGCAGAAGCAAATCAGAGTATATGGAATGTCAGTTCAA

Medicago truncatula GGATTCCGCTTGAGTAGAAGCAAGACGGAGTATATGGAATGGAACTTCAG

H.annuus HAG004M10 GGTTTAAGGATTAGTCAGTCTAAGACTGAATACCTGTATTGTAATTTCAG

Solanum demissum GGGTTTAGGTTGAGTAGGACCAAAACAGAATATTTGGGGTGCAAATTTAG

** ** ***** *** **************** ** * ***** *****

Glycine max CAAAAGGAGGGTT---TCTAACTCAGAGGTGAAAATAGGAGACCATATTA

Medicago truncatula CGGAAGAAGAAGTAGGTCTACCTTGGAGGTGAAAGTTGGAGATCATATCA

H.annuus HAG004M10 TGGTGCAGGTGACAACGAGGACACTCAGGTTATCATTGAAGGTCAAGTGG

Solanum demissum CGATGGGTTGGATGAGACAGACGTGGAAGTGAGACTTGCCGCACAAGTCA

* * ** * * * * ** *

Glycine max TCCCTCAAGTCACACGGTTTAAATATCTTGGGTCTGTAATACAGGATGAT

Medicago truncatula TACCCCAAGTTACGCGGTTTAAATATCTTGGGTCCTTCGTACAAAATGAC

H.annuus HAG004M10 TCCCACAAACGACTAAGTTCAAGTACTTAGGATCGTTTGTGCAAAGGGAC

Solanum demissum TTCCTAAGAAGGAAAGTTTTAGGTATCTTGGGGCTGTAATCCAAGGGAGT

* ** * ** * ** * ** * * ** *********

Glycine max GGGGAAATTGAAGGGGATGTGAATCATCGCATTCAAGCAGGATGGATGAA

Medicago truncatula GGAGAAATAGAAGCAGATGTAAGCCATCGTATTCAAGCTGGGTGGTTGAA

H.annuus HAG004M10 GGAGAGATAGATAGTGATGTATCTCACCGCATCCAGGTTGGCTGGTGTAA

Solanum demissum GGCGACATCGACGACGATGTCACACATCGCGTTGGGGCTGCTTGGATGAA

*********** * *********** ***** **** *** **** ***

Glycine max ATGGAGAAAAGCATCGGGGGTGTTATGTGATGCAAAGGTACCGATCAAGC

Medicago truncatula ATGGAGAAGAGCCTCAGGTGTTTTGTGCGATAAGAAAGTACCACTTAAGT

H.annuus HAG004M10 GTGGAGAGCAGCCACTGGGATATTGTGTGACAGGAGGTTCCCGACAAAAT

Solanum demissum ATGGAGGCTTGCCTCTGGAGTATTGTGTGATAAGAAAATTTCACCGAAAC

***** ** * ** * ** ** ** * * **** ****

Page 60: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

60

Glycine max TAAAGGGAAAGTTTTATCGGACTGCGGTAAGACCGACGATTTTGTACGGA

Medicago truncatula TGAAAGGAAAGTTCTATCGGACAGCAATCCGACCGGCGTTGTTGTATGGT

H.annuus HAG004M10 TGAAGGGAAAATTCTATAGAATAGCAGTTCGACCGGCTATGTTATACGGA

Solanum demissum TTAAAGGTAAGTTCTACAGAGTGGTAGTTAGACCGGCCTTGTTGTATGGA

********** ************************** ***** ******

Glycine max ACAGAATGTTGGGCGGTCAAGAGCCAACATGAGAATAAAGTAGGTGTAGC

Medicago truncatula ACGGAGTGTTGGGCGGTTAAGAGTCAACATGAGAATCAAGTAAGTGTAAC

H.annuus HAG004M10 ACAGAGTGTTGGTCCATCAAGAAAACTCAAGCGCGCAAGATGGAGGTAAC

Solanum demissum GCGGAGTGTTGGCCAGTTAAGAACGCACATGTTCATAAAATGCATGTTGC

************ * ******* * ** * ** ** ***** *****

Glycine max GGAGATGAGGATGTTGCGGTGGATGTGTGGTAAGACTCGACAGGATAAAA

Medicago truncatula AGAGATGAGGATGTTGCGTTGGATGAGTGGTAAGACTAGACAGGATAGGA

H.annuus HAG004M10 GGAGATGAGAATGTTGGGGTGGATGTGTGGCCACACGAGGTTAGACCGAA

Solanum demissum GGAGATGAGGATGTTGAGATGGATGTGTGGACACACTAGGAGCGACAAGA

********* ****** ************* ***** *** ** *

Glycine max TTAGAAACGAAGCTATTAGAGAGAGGGTTGGAGTAGCGCCTATTGTAGAG

Medicago truncatula TTAGGAATGACACCATTAGAGA--GGGTAGGGGTGGCATCCATAGTAGAA

H.annuus HAG004M10 TAAGAAGTGAGGTTTATAGGGATTGGTTAGGAGTAGCTAGTATATCAGAC

Solanum demissum TTAGGAATGAGGTTATCCGGGAGAAGGTGGGAGTGGCCTCGGTGGTGGAC

* ** * ** * ** * * ** ** ** * **

Glycine max AAGATGGTGGAAAATAGACTTAGGTGGTTTGGGCATGTAGAGAGAAGACC

Medicago truncatula AAGTTGGTAGAAAATAGgcttagatggtttgggcatgtagagagaagacc

H.annuus HAG004M10 AAGTTAAAAGAGGGGAGTTTGAGATGGTTTGGGCATGTGAAGAGGAGGTA

Solanum demissum AAGCTGAGGGAAGCGAGACTGAGATGGTTTGGACATGTGAAGAGACGGAG

*** * ** * *** ************************* **

Glycine max GGTAGACTCTGTATTGAGGAGAGTAGACCAGATGGAGAGAAGACAAACAA

Medicago truncatula CAGGTAG-------------------------------------------

H.annuus HAG004M10 GTTAACCAAACCAGTTAGAGCAGTGGAAAACATAATAGTGGAAGGAA---

Solanum demissum CGCAGACGCCCCAGTGAGGAGGTGCGAGGTAATGGTGGTAGAGGGTACGC

Il multiallineamento ha consentito di calcolare anche in questo caso le

distanze genetiche per ogni coppia di sequenze e quindi di costituire un albero, da cui si

osserva che la sequenza più vicina a quella da noi studiata è, come era previsto, quella di

Solanum demissum (Figura 17).

Page 61: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

61

Figura 17 - Albero di consenso che mostra le relazioni filogenetiche fra la sequenza del trasposone

HAG003I05 di girasole ed altri 3 trasposoni similari. La sbarra indica una distanza genetica del 10%.

6.5. Numero di copie delle sequenze studiate nel genoma di girasole e di

altre specie del genere Helianthus

In successivi esperimenti, è stato calcolato il numero di copie di ciascuna

delle sequenze selezionate nel genoma del girasole. A questo scopo sono stati realizzati

dei dot-blot su cui sono stati caricate quantità scalari di DNA genomico di diverse specie

del genere Helianthus e quantità scalari dei vari elementi. Le sequenze corrispondenti

agli elementi sono state anche marcate con digossigenina e ibridate al DNA caricato sulle

membrane. Le intensità dei segnali di ibridazione sulle sequenze corrispondenti agli

elementi e sul DNA genomico sono state comparate per stabilire il numero di copie per

pg di DNA genomico caricato. Usando una stima del contenuto di DNA del genoma

aploide (1C) di girasole di 3,30 pg di DNA (Cavallini et al. 1986), si è potuto riportare il

numero di copie per pg di DNA al numero di copie per genoma. Nella Figura 18 è

riportata una delle membrane ibridate per il calcolo del numero di copie.

Page 62: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

62

Fig. 18 - Esempio di membrana ibridata per il calcolo del numero di copie.

Il trasposone HAG003H10 è risultato ripetuto 670 volte per genoma aploide, il

trasposone HAG003I05 210 volte; il LINE HAG004M10 è risultato ripetuto in un

numero di copie per genoma aploide inferiore a 50, cioè al limite inferiore di sensibilità

della tecnica utilizzata. Si può osservare che i due retrotrasposoni sono relativamente

abbondanti nel genoma di H. annuus, se si considera che raramente i trasposoni di classe

II superano le 100-200 copie nelle piante. Invece, la ripetitività del LINE studiato è molto

bassa, confermando che nel genoma di questa specie i LINEs sono rari, come in effetti è

stato osservato anche in altre specie vegetali. Per quanto riguarda i vegetali, un numero

relativamente elevato di LINEs è stato recentemente riportato nel genoma di Vitis

vinifera, che peraltro è una specie con molte peculiarità rispetto alla composizione del

genoma: infatti, oltre ai LINEs, risultano abbondanti anche sequenze corrispondenti a

pararetrovirus e, nell’ambito dei retrotrasposoni di classe I, quelli di tipo copia sono più

abbondanti rispetto a quelli di tipo gypsy.

L’analisi del numero di copie è stata realizzata anche in altre specie del

genere Helianthus, quattro appartenenti alla sezione Helianthus (specie annuali) e sei

appartenenti alla sezione Atrorubentes (specie perenni). I risultati dell’analisi sono

riportati in Figura 19.

Page 63: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

63

Fig. 19 - Numero di copie per genoma aploide di due sequenze codificanti trasposoni e di una

sequenza codificante un LINE in 10 specie del genere Helianthus.

Si può osservare che per le tre sequenze sottoposte ad analisi, il numero di

copie resta essenzialmente lo stesso in tutte le specie del genere Helianthus analizzate,

sia annuali perenni. Un numero di copie significativamente ridotto del trasposone

HAG003H10 si osserva in H. argophyllus (annuale) e in H. pumilus (perenne). Una

futura analisi che sarà condotto su altre 30 specie di Helianthus, già disponibili presso il

Dipartimento di Biologia delle Piante Agrarie, potrà chiarire meglio se esiste una

variazione del numero di copie di queste sequenze e se l’eventuale variazione possa

avere una base filogenetica.

6.6. Espressione delle sequenze studiate

Il ciclo vitale dei trasposoni a DNA consiste nella trascrizione e traduzione di

geni, facenti parte del genoma del trasposone, codificanti enzimi specifici quali la

trasposasi, che vengono utilizzati per la excisione e l’inserimento in altro locus del

trasposone stesso. Il ciclo vitale dei trasposoni di classe I (fra i quali i LINEs) consiste

invece nella trascrizione dell’elemento, che codifica diversi enzimi impegnati nella

retrotrascrizione dell’RNA e nel successivo inserimento del cDNA in un locus

supplementare. In entrambi i casi la trascrizione degli elementi è cruciale per la loro

riproduzione.

Page 64: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

64

Per verificare se i trasposoni cui putativamente appartengono le sequenze

sottoposte al nostro studio sono attivi nella trascrizione, l’espressione delle tre sequenze è

stata analizzata mediante RT-PCR. Nelle sequenze selezionate sono stati individuati dei

domini conservati a livello nucleotidico, su cui sono stati progettati i primer (evidenziati

nei multiallineamenti delle pagine precedenti). La RT-PCR è stata condotta in due organi

molto diversi, cioè in foglie adulte (un tessuto somatico) e in embrioni a 28 giorni dalla

impollinazione. Da questi due tessuti sono stati isolati e retrotrascritti gli RNA

messaggeri, e i cDNA così ottenuti sono stati sottoposti a PCR utilizzando i primer

specifici per ciascuna delle tre sequenze di girasole selezionate.

In una prima PCR che utilizzava come stampo il cDNA amplificato si

osservavano bande molto leggere, non significative. I prodotti della prima amplificazione

sono stati però utilizzati come stampo per una ulteriore PCR utilizzando primer nested

appositamente progettati per le tre sequenze, impiegando le medesime condizioni di

reazione. Nella figura 20 è riportato un gel di agarosio dopo elettroforesi dei campioni di

cDNA sottoposti a PCR. Si può osservare che tutti e tre i trasposoni selezionati vengono

amplificati (RT1, RT2 ed RT3), indicando che le relative sequenze genomiche sono

attivamente trascritte.

RT1 C1 RT2 C2 RT3 C3

Fig. 20 - Prodotti di PCR su cDNA di foglie, utilizzando come stampo cDNA (RT) o RNA come

controllo (C). RT1 contiene l’amplificato con primer corrispondenti al trasposone HAG003H10; RT2 l’amplificato con primer del trasposone HAG003I05; RT3 l’amplificato con primer del LINE

HAG004M10. C1, C2 e C3 sono i controlli corrispondenti ai tre elementi. L’ultima lane a destra è il

marcatore di peso molecolare (Marker X, Roche).

Page 65: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

65

Al fine di escludere che l’amplificazione fosse dovuta non allo stampo di

cDNA, ma ad eventuale DNA genomico contaminante l’RNA, la reazione di PCR è stata

realizzata anche direttamente su RNA non retrotrascritto (C). Per quanto riguarda questi

controlli, nei primi due casi (C1 e C2) non c’è traccia di frammenti amplificati; mentre

nel terzo caso (C3), il LINE, la banda che compare nella lane di controllo ha un peso

palesemente inferiore rispetto al prodotto di PCR retrotrascritto, per cui possiamo

escludere che l’amplificato dopo retrotrascrizione sia dovuto a una contaminazione di

DNA genomico.

In altri controlli sono state eseguite anche prove di PCR utilizzando primer

singoli, senza osservare prodotti di amplificazione, sia in prima che in seconda PCR. Si

può escludere quindi che le bande osservate siano risultato di amplificazione aspecifica.

In effetti, il prodotto di PCR ottenuto nel caso del trasposone HAG003H10

(RT1) è risultato essere circa 290 pb (come atteso); nel caso del trasposone HAG003I05

(RT2) il prodotto di PCR ha una lunghezza di circa 190 pb. (come atteso); nel terzo caso

il prodotto corrispondente al LINE HAG004M10 (RT3) ha una lunghezza di circa 190 pb

(come atteso).

Per quanto riguarda le prove effettuate su campioni di foglie ed embrioni non

sono state riscontrate differenze nell’espressione degli elementi considerati; sia i

trasposoni che il LINE sembrano essere espressi in modo costitutivo in entrambi gli stadi

fenologici.

I risultati degli esperimenti di espressione confermano quanto si va

affermando negli ultimi anni. In molti studi, infatti, viene evidenziato come una grande

parte del genoma, oltre alle sequenze tipicamente codificanti geni ed RNA, venga

trascritta, includendo sequenze ripetute apparentemente non codificanti (Wu et al., 2008).

In girasole, recentemente, è stata dimostrata una elevata espressione di elementi

retrotrasponibili con LTR, sia di tipo copia che di tipo gypsy (Vukich, Tesi di Dottorato

di Ricerca, 2008). Questa elevata espressione non comporta alti tassi di inserimento di

nuove copie di retroelementi nel genoma: un solo polimorfismo legato all’inserimento di

un nuovo retrotrasposone è stato osservato in circa cento individui analizzati, a fronte

dell’elevata trascrizione di questi elementi.

E’ quindi probabile che la trascrizione non sia seguita dalla successiva

traduzione delle proteine corrispondenti, ma che l’RNA venga degradato, probabilmente

attraverso processi analoghi all’interferenza dell’RNA (Baulcombe, 2004). La continua

trascrizione di questi elementi (compresi i trasposoni da noi analizzati in questa Tesi di

Page 66: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

66

Laurea) potrebbe avere anche il significato di produrre sequenze di RNA che possono

essere utilizzate per la produzione di microRNA e per il conseguente silenziamento degli

elementi stessi.

Se infatti il ciclo vitale dei vari tipi di trasposoni venisse portato a termine,

l’effetto mutageno del continuo inserimento di nuovi elementi potrebbe essere

estremamente deleterio per l’organismo, in quanto potrebbero essere interrotti geni

codificanti.

Page 67: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

67

CONCLUSIONI

Lo studio condotto in questa tesi di laurea ha permesso una prima

caratterizzazione in girasole di sequenze non codificanti di origine virale che

generalmente compaiono nel genoma delle piante in un basso numero di copie. In

particolare, sono state studiate due sequenze con elevata similarità a porzioni codificanti

di trasposoni a DNA, di classe II (HAG003H10 e HAG003I05).

Questa classe di trasposoni, che è stata scoperta per la prima volta in mais ed

è responsabile di parte della variabilità genetica in questa specie, non era fino ad ora mai

stata descritta in girasole.

Le analisi hanno mostrato che le due sequenze studiate sono trasposoni a

DNA delle famiglie Mariner e hAT e che si presentano con frequenze abbastanza elevate

rispetto a quanto osservato in altre specie. Infatti, questi elementi trasponibili si spostano

nel genoma per mezzo di un meccanismo “taglia e incolla”, che non dovrebbe

determinare un incremento del numero di copie. Soprattutto la HAG003H10 è presente in

circa 700 copie per genoma aploide, non solo in girasole, ma in quasi tutte le specie di

Helianthus studiate. La ridondanza di queste sequenze è risultata molto simile all’interno

del genere Helianthus, indicando che i processi che hanno portato alla amplificazione di

questa sequenza sono avvenuti in gran parte nel progenitore di questo genere.

Un numero di copie relativamente alto di trasposoni di classe II, come quelli

studiati in questa Tesi di Laurea, può essere spiegato con numerose successive

“infezioni” da parte di questi elementi o, più probabilmente, con l’inserimento di un

trasposone (o pochi trasposoni) dentro un trasposone di classe I e con la successiva

amplificazione di questo. L’osservazione che RNA complementari alle sequenze da noi

studiate possono essere messi in evidenza mediante RT-PCR in embrioni e foglie di

girasole indica che questi trasposoni sono potenzialmente attivi, cioè in grado di far

produrre alla cellula gli enzimi, come la trasposasi, necessari per la loro trasposizione.

Per quanto riguarda la terza sequenza studiata (HAG004M10), essa ha mostrato

una elevata similarità di sequenza con una superfamiglia di trasposoni di classe I, i LINE,

retrotrasposoni senza lunghe ripetizioni terminali, che sembrano essere i più antichi

elementi di origine retrovirale ad avere “invaso” il genoma degli eucarioti. Anche per

questo tipo di sequenze, i nostri dati sono i primi ad essere disponibili in girasole.

Sebbene il meccanismo di riproduzione dei LINE sia di tipo “copia e incolla” e

consenta quindi un progressivo incremento del numero di copie di questi elementi, i

Page 68: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

68

LINE risultano molto frequenti soprattutto nell’uomo e negli altri animali, mentre sono

molto meno ripetuti nelle piante. Vanno però considerati i recenti dati sul

sequenziamento del genoma della vite, in cui i LINE appaiono molto ripetuti, suggerendo

che non è possibile fare una generalizzazione a questo livello.

In girasole, i LINE sono risultati pochissimo ripetuti, e la sequenza da noi

studiata, corrispondente alla porzione codificante la retrotrascrittasi, si presenta in circa

50 copie per genoma aploide sia in girasole che negli altri Helianthus. Tuttavia, anche

questa sequenza è risultata espressa negli embrioni e nelle foglie, indicando che

l’elemento cui la sequenza appartiene è potenzialmente attivo e quindi suscettibile di

aumentare il proprio numero di copie. E’ importante osservare che in mais sono proprio i

retrotrasposoni presenti in basso numero di copie ad essere attivi nella trascrizione

(Meyers et al., 2001), probabilmente a causa del fatto che un retrotrasposone molto

diffuso può essere più facilmente silenziato mediante produzione di micro RNA e

successiva metilazione della cromatina contenente il DNA ad essi complementare,

rispetto a un retrotrasposone più raro.

Il dato sull’espressione delle sequenze da noi studiate, trasposoni di classe II e

LINE, che in linea teorica non avrebbero dovuto risultare trascritte, è interessante anche

alla luce di recenti risultati, riguardanti per esempio il genoma umano, che mostrano che

le sequenze espresse sono molte di più rispetto a quanto si ipotizzava sulla base del

numero di geni codificanti proteine presenti nel genoma degli eucarioti (Wu et al., 2008).

Il significato di questa espressione “generalizzata” non è chiaro, è stato

ipotizzato che essa sia coinvolta nei processi di silenziamento, fornendo la “materia

prima” per la produzione di microRNA, ma altre funzioni non possono essere escluse.

Riguardo al girasole, un’analisi di tipo trascrittomico, già iniziata presso il

Dipartimento di Biologia delle Piante Agrarie, dovrebbe consentire di chiarire se la

trascrizione, osservata per queste sequenze e anche per sequenze di retrotrasposoni di

tipo Gypsy e Copia (Vukich, Tesi di Dottorato di Ricerca, 2008) sia osservabile o meno

per tutta la componente ripetitiva (tipicamente “non codificante”) del genoma.

Page 69: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

69

BIBLIOGRAFIA

o Antonius-Klemola, K., Kalendar, R., Schulman, A.H. 2006. TRIMretrotransposons

occur in apple and are polymorphic between varieties but not sports. Theor. Appl.

Genet. 112: 999–1008.

o THE ARABIDOPSIS GENOME INITIATIVE, 2000 Analysis of the genome

sequence of the flowering lant Arabidopsis thaliana. Nature 408: 796-815.

o Bannert, N., Kurth, R. 2006. The evolutionary dynamics of human endogenous

retroviral families. Annu. Rev. Genomics Hum. Genet. 7: 149–173.

o Benlloch, R., d’Erfurth, I., Ferrandiz, C., Cosson, V., Beltran, J.P., Canas, L.A.,

Kondorosi, A., Madueno, F., Ratet, P. 2006. Isolation of mtpim proves Tnt1 a

useful reverse genetics tool in Medicago truncatula and uncovers new aspects of

AP1-like functions in legumes. Plant Physiol. 142: 972–983.

o Bennetzen, J.L. 1993 The contribution of retroelements to plant genome

organization, function and evolution. Trends Microbiol.4: 347-353.

o Bennetzen, J.L.2000 Transposable element contributions to plant gene and genome

evolution. Trends Microbiol. 4: 347-353.

o Bennetzen J.L. 2005. Transposable element contributions to plant gene and genome

evolution. Plant Molecular Biology 42: 251–269

o Bennetzen J.L. 2005. Transposable elements, gene creation and genome

rearrangement in flowering plants. Genetics & Development 15:621–627.

o Boutabout, M., Wilhelm, M., Wilhelm, F.X. 2001. DNA synthesis fidelity by the

reverse transcriptase of the yeast retrotransposon Ty1. Nucl. Acids Res. 29: 2217–

2222.

Page 70: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

70

o Boeke, J.D., Corces, V.G. 1989 Transcriptions and reverse transcriptions of

retrotransposons. Annu. Rev. Microbiol. 43, 403-434.

o Brunner S., Pea G., Rafalski A. 2005. Origins, genetic organization and

transcription of a family of non-autonomous helitron elements in maize. The Plant

Journal 43:799–810.

o Bureaut, . E., and S. R. Wessler, 1992. Tourist: a large family of small inverted

repeat elements frequently associated with maize genes. Plant Cell 4 1283-1294.

o Bureau, T. E., and S. R. Wessier, 1994. Stowaway: a new family of inverted repeat

elements associated with the genes of both monocotyledonous and dicotyledonous

plants. Plant Cell 6: 907-916.

o Capy P., Gasperi G., Biémont C., Bazin C. 2000. Stress and transposable elements:

coevolution or useful parasites? Heredity 85:101-106

o Casacuberta, J.M., Vernhettes, S., Grandbastien, M.A., 1995. Sequence variability

within the tobacco retrotransposon Tnt1 population. EMBO J. 14, 2670–2678.

o Casacuberta, J.M., Verhettes, S., Audeon, C., Grandbastien, M.-A. 1997.

Quasispecies in retrotransposons: a role for sequence variability in Tnt1 evolution.

Genetica 100: 109–117.

o Casacuberta, E., Casacuberta, J.M., Puigdomenech, P., Monfort, A., 1998. Presence

of miniature inverted-repeat transposable elements MITEs in the genome of

Arabidopsis thaliana: characterisation of the Emigrant family of elements. Plant J.

16, 79–85.

o Casacuberta J.M., Santiago N. 2003. Plant LTR-retrotransposons and MITEs:

control of transposition and impact on the evolution of plant genes and genomes.

Gene 311: 1–11.

Page 71: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

71

o Chantret, N., A. Cenci, F. Sabot, O. Anderson&J. Dubcovsky, 2004. Sequencing of

the Triticum monococcum hardness locus reveals good microcolinearity with rice.

Mol Genet Genomics 271: 377–386.

o Cheng, C., Daigen, M., Hirochika, H. 2006. Epigenetic regulation of the rice

retrotransposon Tos17. Mol. Genet. Genomics 276: 378–390.

o Chopra S, Brendel V, Zhang J, Axtell JD, Peterson T. Molecular characterisation of

a mutable pigmentation phenotype and isolation of the first active transposable

element from Sorghum bicolor. Proc Natl Acad Sci USA. 1999;96:15330–15335.

o Cost, G.J., Feng, Q., Jacquier, A. and Boeke, J.D., 2002. Human L1 element target-

primed reverse transcription in vitro. EMBO J. 21, pp. 5899–5910.

o Current Opinion in Biotechnology 17:168-173

o Dewannieux, M., Harper, F., Richaud, A., Letzelter, C., Ribet, D., Pierron, G.,

Heidmann, T. 2006. Identification of an infectious progenitor for the multiple-copy

HERV-K human endogenous retroelements. Genome Res. in press:

Doi:10.1101/gr.5565706.

o Doolittle, R.F., Feng, D.F., Johnson, M.S. & MC Clure, M.A. 1989 Origins and

evolutionary relationship of retroviruses. Q.Rev. Biol. 64: 1-30.

o Evans, M.J., Bacharach, E., Goff, S.P. 2004. RNA sequences in the Moloney

murine leukemia virus genome bound by the Gag precursor protein in the yeast

three-hybrid system. J. Virol. 78: 7677–7684.

o Fedoroff N. 2000. Transposons and genome evolution in plants. PNAS vol. 97

13:7002–7007.

o Feng, Q., Moran, J., Kazazian, H. & Boeke, J. D. 1996 Cell 87, 905-916.

Page 72: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

72

o Feschotte, C., and Mouchès, C. 2000. Recent amplification of miniature inverted-

repeat transposable elements in the vector mosquito Culex pipiens: Characterization

of the Mimo family. Gene 250:,

o Feschotte C., Wessler S. R. 2001. Treasures in the attic: Rolling circle transposons

discovered in eukaryotic genomes. PNAS vol. 98 16: 8923–8924.

o Feschotte C., Jiang N., Wessler S.R. 2002 Plant transposable elements: where

genetics meets genomics. Nat Rev Genet. 5:329-341.

o Flichman, D., Cello, J., Castano, G., Campos, R., Sookoian, S. 1999. In vivo down

regulation of HIVreplication after hepatitis Csuperinfection. Medicina B. Aires 59:

364–366.

o Jääskeläinen, M., Mykkänen, A.-H., Arna, T., Vicient, C., Suoniemi, A., Kalendar,

R., Savilahti, H., Schulman, A.H. 1999. Retrotransposon BARE-1: Expression of

encoded proteins and formation of virus-like particles in barley cells. Plant J. 20:

413–422.

o Jiang, N., Feschotte, C., Zhang, X., Wessler, S.R. 2004. Using rice to understand

the origin and amplification of miniature inverted repeat transposable elements

MITEs. Curr. Opin. Plant Biol. 7: 115–119.

o Jiang, N. & S.R. Wessler, 2001. Insertion preference of maize and rice miniature

inverted repeat transposable elements as revealed by the analysis of nested element.

Plant Cell 13: 2553–2564.

o Kalendar, R., Tanskanen, J., Immonen, S., Nevo, E., Schulman, A.H. 2000.

Genome evolution of wild barley Hordeum spontaneum by BARE-1 retrotransposon

dynamics in response to sharp microclimatic divergence. Proc. Natl. Acad. Sci.

USA 97: 6603–6607.

o Kalendar, R., Vicient, C.M., Peleg, O., Anamthawat-Jonsson, K., Bolshoy, A.,

Schulman, A.H. 2004. LARD retroelements: conserved, non-autonomous

components of barley and related genomes. Genetics 166: 1437–1450.

Page 73: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

73

o Kajikawa, M., Okada, N. 2002 LINEs mobilize SINEs in the eel through a shared

3’ sequence. Cell 111: 433–444.

o Kapitonov V.V., Jurka J. 2001. Rolling-circle transposons in eukaryotes. PNAS vol.

98 15: 8714–8719.

o Kato, S., Hanabusa, H., Kaneko, S., Takakuwa, K., Suzuki, M., Kuji, N., Jinno, M.,

Tanaka, R., Kojima, K., Iwashita, M., Yoshimura, Y., Tanaka, K. 2006. Complete

removal of HIV-1 RNA and proviral DNA from semen by the swim-up method:

assisted reproduction technique using spermatozoa free from HIV-1. AIDS: 967–

973.

o Kempken, F. & F. Windhofer, 2001. The hAT family: A versatile transposon group.

Chromosoma 110: 1–9.

o Kidwell M. G. 2002 Transposable elements and the evolution of genome size in

eukaryotes. Genetica 115: 49–63

o Kidwell M. G., Lisch D. R. 2001. Perspective: transposable elements, parasitic dna,

and genome evolution. Evolution, 55:1–24

o Kumar A., Bennetzen J. L. 1999 Plant retrotransposons. Annu. Rev. Genet. 33:479–

532.

o Goff, S.A., D. Ricke, T.H. Lan, G. Presting, et al., 2002 A Draft Sequence of the

Rice Genome Oryza sativa L. ssp. japonica. Science 296: 92-100

o Gregor W, Mette MF, Staginnus C, Matzke MA, Matzke AJ 2004 A distinct

endogenous pararetrovirus family in Nicotiana tomentosiformis, a diploid

progenitor of polyploid tobacco. Plant Physiol. 134: 1191-1199ì.

o Harper, G., Hull, R., Lockhart, B., Olszewski, N. 2002. Viral sequences integrated

into plant genomes. Annu. Rev. Phytopathol. 40: 119–136.

Page 74: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

74

o Harter, A.V., K.A. Gardner, D. Falush, D.L. Lentz, R. Bye, et al., 2004 Origin of

extant domesticated sunflowers in eastern North America. Nature 430: 201–205.

o Hawkins, J.S., H.R. Kim, J.D. Nason, R.A. Wing, and J.F. Wendel, 2006

Differential lineagespecific amplification of transposable elements is responsible

for genome size variation in Gossypium. Genome Res. 16: 1252-1261.

o Heiser, C.B., D.M. Smith, S. Clevenger, and W.C. Martin, 1969 The North

American sunflowers. Memoirs Torrey Bot. Club 22: 1–218.

o Hohjoh H. and Singer. M.F. 1996. Cytoplasmic ribonucleoprotein complexes

containing human LINE-1 protein and RNA. EMBO J. 15: 630–639.

o Hohjoh H.and Singer M.F., 1997. Sequence specific single-strand RNA-binding

protein encoded by the human LINE-1 retrotransposon. EMBO J. 16: 6034–6043.

o Hutvagner G, McLachlan J, Pasquinelli AE, Balint E, Tuschl T, and Zamore

PD2001. A cellular function for the RNA-interference enzyme Dicer in the

maturation of the let-7 small temporal RNA. Science 293:834-838.

o Hutvagner, G. and Zamore, P.D 2002. A microRNA in a multipleturnover RNAi

enzyme complex. Science 297, 2056–2060.

o Hutvagner G, and Zamore P.D. 2002 RNAi: nature abhors a double-strand. Curr

Opin Genetics & Development 12:225-232.

o Hu, W.S., Bowman, E.H., Delviks, K.A., Pathak, V.K. 1997. Homologous

recombination occurs in a distinct retroviral subpopulation and exhibits high

negative interference. J. Virol. 71: 6028–6036.

o Izsvák, Z., Ivics, Z., Shimoda, N., Mohn, D., Okamoto, H., and Hackett, P.B. 1999.

Short inverted-repeat transposable elements in teleost fish and implications for a

mechanism of their amplification. J. Mol. Evol. 48:, 13–21.

Page 75: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

75

o Laten, H.M., Havecker, E.R., Farmer, L.M., Voytas, D.F. 2005. SIRE1, an

endogenous retrovirus family from Glycine max, is highly homogeneous and

evolutionarily young. Mol. Biol. Evol. 20: 1222–1230.

o Leigh, F., Kalendar, R., Lea, V., Lee, D., Donini, P., Schulman, A.H. 2003.

Comparison of the utility of barley retrotransposon families for genetic analysis by

molecular marker techniques. Mol. Genet. Genomics 269: 464–474.

o Le Rouzic, A., Dupas, S., Capy, P. 2006. Genome ecosystem and transposable

elements species. Gene in press: DOI 10.1016/j.gene.2006.09.023.

o Liu B., Wendel J. F. 2000 Retrotransposon activation followed by rapid repression

in introgressed rice plants. Genome 43: 874–880

o Loot, C., Santiago, N., Sanz, A., Casacuberta, J.M. 2006. The proteins encoded by

the pogo-like Lemi1 element bind the TIRs and subterminal repeated motifs of the

Arabidopsis Emigrant MITE: consequences for the transposition mechanism of

MITEs. Nucl. Acids Res. 34: 5238–5246.

o Luan D.D.et al., 1993. Cell 72:595-605.

o Luan DD, Eickbush TH, 1995. RNA template requirements for target DNA-primed

reverse transcription by the R2 retrotransposable element. Mol Cell Biol.

;157:3882–3891.

o Martin SL, Branciforte D, Keller D, Bain DL 2003 Trimeric structure for an

essential protein in L1 retrotransposition. Proc Natl Acad Sci USA 100:13815–

13820.

o Malik, H. S., W. D. Burke, and T. H. Eickbush. 1999. The age and evolution of

non-LTR retrotransposable elements. Mol. Biol. Evol. 16:793-805

Page 76: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

76

o Manninen, I., Schulman, A.H. 1993. BARE-1, a copia-like retroelement in barley

Hordeum vulgare L.. Plant Mol. Biol. 22: 829–846.

o McClintock, B. 1984 The significance of responses of the genome to challenge.

Science 226: 792-801.

o Meyers, B.C., S.V. Tingey, and M. Morgante, 2001 Abundance, distribution, and

transcriptional activity of repetitive elements in the maize genome. Genome Res. 11:

1660-1676.

o Miyao, A., Tanaka, K., Murata, K., Sawaki, H., Takeda, S., Abe, K., Shinozuka, Y.,

Onosato, K., Hirochika, H. 2003. Target site specificity of the Tos17

retrotransposon shows a preference for insertion within genes and against insertion

in retrotransposon-rich regions of the genome. Plant Cell 15: 1771–1780.

o Moore, S.P., Garfinkel, D.J. 2000. Correct integration of model substrates by Ty1

integrase. J. Virol. 74: 11522–11530.

o Moran, J.V. et al. 1996. High frequency retrotransposition in cultured mammalian

cells. Cell 87, 917−927.

o Morgan G.T. 1995. Identification in the human genome of mobile elements spread

by DNA-mediated transposition. J. Mol. Biol. 254:, 1–5.

o Morgante, M. 2005. Plant genome organisation and diversity: the year of the junk!

Curr. Opin. Biotechnol. 17: 168–173.

o Morgante M., Brunner S., Pea G., Fengler K., Zuccolo A., Rafalski A. 2005 Gene

duplication and exon-shuffling by helitron-like transposons generate intraspecies

diversity in maize. Nature Genetics Vol 37 9:997-1002

o Navarro-Quezada A. Schoen D.J. 2002. Sequence evolution and copy number of

Ty1-copia retrotransposons in diverse plant genomes. PNAS vol 99 1: 268–273

Page 77: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

77

o Nevo E. 2001 Evolution of genome–phenome diversity under environmental stress.

PNAS vol. 98 11:6233–6240

o Nykanen A, Haley B, and Zamore PD 2001. ATP requirements and small

interfering RNA structure in the RNA interference pathway. Cell 107:309-321.

o Okada, N., M. Hamada, I. Ogiwara, and K. Ohshima. 1997. SINEs and LINEs

share common 3' sequences: a review. Gene 205:229–243.

o Okamoto H and Hirochika H 2001 Silencing of transposable elements in plants.

Trends Plant Sci 6:527-534.

o Oosumi, T., Belknap, W.R., and Garlick, B. 1995a. Mariner transposons in

humans. Nature 378:, 672.

o Orgel L. E. F. Crick H. C. 1980. Selfish DNA: the ultimate parasite Nature 284,

604 – 607

o Osanai M, Takahashi H, Kojima KK, Hamada M, Fujiwara H 2004 Essential motifs

in the 3′ untranslated region required for retrotransposition and the precise start of

the reverse transcription in non-long-terminal-repeat retrotransposon SART1. Mol

Cell Biol 24: 7902–7913.

o Plasterk, R.H., 1991. The origin of footprints of the Tc1 transposon of

Caenorhabditis elegans. EMBO J. 10: 1919–1925.

Page 78: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

78

o Pozueta-Romero J., Houlné G. and Schantz R., 1996. Nonautonomous inverted

repeat Alien transposable elements are associated with genes of both

monocotyledonous and dicotyledonous plants, Gene 171: 147–153.

o Preston, B.D. 1996. Error-prone retrotransposition: rime of the ancient mutators.

Proc. Natl. Acad. Sci. USA 93: 7427–7431.

o Robertson, H.M. 2002 In Craig, N., Craigie, R., Gellert, M., LambowitZ, A. Eds.

Molecular evolution of DNA transposons. Mobile DNA II, American Society of

Microbiology press, Washington DC.

o Rice, P.A., Baker, T.A. 2001. Comparative architecture of transposase and

integrase complexes. Nat. Struct. Biol. 302–307.

o Rieseberg, L.H., S.M. Beckstrom-Sternberg, A. Liston, and D.M. Arias 1991

Phylogenetic and systematic inferences from chloroplast DNA and isozyme

variation in Helianthus sect. Helianthus Asteraceae. Syst. Bot. 16: 50-76.

o Rieseberg, L.H., 1995 The role of hybridization in evolution: old wine in new skins.

Am. J. Bot. 82: 944–953.

o Rogers, C.E., T.E. Thompson, and G.J. Seiler, 1982 Sunflower species of the

United States. National Sunflower Assoc., Fargo, USA.

o Sabot, F., Schulman, A.H. 2006. Parasitism and the retrotransposon life cycle in

plants: a hitchhiker’s guide to the genome. Heredity 97: 381–388.

o Sabot F., Simon D., Bernard M. 2004. Plant transposable elements, with an

emphasis on grass species. Euphytica 139: 227–247

o Sabot, F., Sourdille, P., Chantret, N., Bernard, M. 2006. Morgane, a new LTR

retrotransposon group, and its subfamilies in wheats. Genetica 128: 439–447.

Page 79: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

79

o Sanmiguel, P., Bennetzen, J.L. 1998 A evidence that a recent increase in maize

genome size was caused by the massive amplification of intergene

retrotransposons. Ann. Bot. 82: 37-44.

o Schilling, E.E., 1997 Phylogenetic analysis of Helianthus Asteraceae based on

chloroplast DNA restriction-site data. Theor. Appl. Genet. 94: 925–933.

o Schilling, E.E., 2001 Phylogeny of Helianthus and related genera. Oleagineaux

Corps Gras Lipides 8: 22–25.

o Schilling, E.E., and C.B. HEISER, 1981 Infrageneric classification of Helianthus

Compositae. Taxonomy 30: 393–403.

o Schilling, E.E., C.R. Linder, R.D. Noyes, and L.H. Rieseberg, 1998 Phylogenetic

relationships in Helianthus Asteraceae based on nuclear ribosomal DNA internal

transcribed spacer region sequence data. Syst. Bot. 23: 177–187.

o Schilling, E. E. and J. L. Panero. 2002. A revised classification of subtribe

Helianthinae Asteraceae: Heliantheae. I. Basal lineages. Botanical Journal of the

Linnean Society 140: 65-76

o Schilling, E. E. 2001. Phylogeny of Helianthus and related genera. Oleagineux

Corps gras Lipides. 8: 22-25

o Schulman, A.H., Kalendar, R. 2005. A movable feast: diverse retrotransposons and

their contribution to barley genome dynamics. Cytogenet. Genome Res. 110: 598–

605.

o Schwarz, D. S., Hutvagner, G., Haley, B. & Zamore, P. D. Evidence that siRNAs

function as guides, not primers, in the Drosophila and human RNAi pathways. Mol.

Cell 10, 537–548 2002.

o Smit, A.F., and Riggs, A.D. 1996. Tiggers and other transposon fossils in the

human genome. Proc. Natl. Acad. Sci. USA 93:, 1443–1448.

Page 80: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

80

o Singer, M.F. 1982 Higly repeated sequences in mammalian genomes. Int. Rev.

Cytol. 76: 422-430.

o Sugimoto M, Tahara H, Ide T, Furuichi Y 2004 Steps involved in immortalization

and tumorigenesis in human B-lymphoblastoid cell lines transformed by Epstein-

Barr virus. Cancer Res 64:3361–3364

o Surzycki, S.A., and Belknap, W.R. 2000. Repetitive-DNA elements are similarly

distributed on Caenorhabditis elegans autosomes. Proc. Natl. Acad. Sci. USA 97:,

245–249.

o Suoniemi, A., Narvanto, A., Schulman, A.H. 1996. The BARE-1 retrotransposon is

transcribed in barley from an LTRpromoter active in transient assays. Plant Mol.

Biol. 31: 295–306.

o Suoniemi, A., Schmidt, D., Schulman, A.H. 1997. BARE-1 insertion site

preferences and evolutionary conservation of RNA and cDNA processing sites.

Genetica 100: 219–230.

o Suoniemi, A., Tanskanen, J., Pentikäinen, O., Johnson, M.S., Schulman, A.H. 1998.

The core domain of retrotransposon integrase in Hordeum: predicted structure and

evolution. Mol. Biol. Evol. 15: 1135–1144.

o Suoniemi, R. Kalendar, H. Savilahti & A.H. Schulman, 1999. Retrotransposon

BARE-1: Expression of encoded proteins and formation of virus-like particles in

barley cells. Plant J 204: 413–422.

o Tanskanen, J.A., Sabot, F., Vicient, C., Schulman, A.H. 2006. Life without GAG:

The BARE-2 retrotransposon as a parasite’s parasite. Gene in press: DOI

10.1016/j.gene.2006.1009.1009.

o Thomas, C.A. 1971 The genetic organization of chromosomes Annu. Rev.

Genet. 5 : 237-256.

Page 81: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

81

o Thompson, H., Schmidt, R., Brandes, A., Heslop-Harrison, J.S., Dean, C. 1996 A

novel repetitive sequence associated with the centromeric regions of Arabidopsis

thaliana chromosomes. Mol. Gen. Genet. 253: 247-252.

o THE FRENCH-ITALIAN PUBLIC CONSORTIUM FOR GRAPE GENOME

CHARACTERIZATION, 2007 The grapevine genome sequence suggests ancestral

hexaploidization in major angiosperm phyla. Nature 449: 463-467.

o Tu, Z. 1997. Three novel families of miniature inverted-repeat transposable

elements are associated with genes of the yellow fever mosquito, Aedes aegypti.

Proc. Natl. Acad. Sci. USA 94:, 7475–7480.

o Tu, Z. 2001. Eight novel families of miniature inverted-repeat transposable

elements in the African malaria mosquito, Anopheles gambiae. Proc. Natl. Acad.

Sci. USA 98:, 1699–1704.

o Tuskan, G.A., S. Difazio, S. Jansson, J. Bohlmann, et al., 2006 The Genome of

Black Cottonwood, Populus trichocarpa Torr. & Gray. Science 313: 1596 – 1604.

o Vershinin, A.V., Schwarzacher, T., Heslop-Harrison, J.S. 1995 The large-scale

genomic organization of repetitive DNA families at the telomeres of rye

chromosomes. Plant Cell 7: 1823-33

o Vicient C. M., Kalendar R., Suoniemi A., Anamthawat-Jónsson K., Schulman A.H.

1999. Structure, functionality, and evolution of the BARE-I retrotransposon of

barley. Genetica 107: 53–63

o Vicient, C.M., Kalendar, R., Schulman, A.H. 2001a. Envelope-containing

retrovirus-like elements are widespread, transcribed and spliced, and insertionally

polymorphic in plants. Genome Res. 11: 2041–2049.

o Vicient, C.M., Kalendar, R., Anamthawat-Jonsson, K., Schulman, A.H. 1999a.

Structure, functionality, and evolution of the BARE-1 retrotransposon of barley.

Genetica 107: 53–63.

Page 82: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

82

o Vicient C. M., Suoniemi A., Anamthawat-Jónsson K., Tanskanen J., Beharav A.,

Nevo E., Schulman A.H. 1999. Retrotransposon BARE-I and Its Role in Genome

Evolution in the Genus Hordeum .The Plant Cell 11: 1769–1784

o Vicient, C.M., Schulman, A.H. 2005. Variability, recombination, and mosaic

evolution of the barley BARE-1 retrotransposon. Mol. Biol. Evol. 61: 275–291

o Vicient, C.M., Jääskeläinen, M., Kalendar, R., Schulman, A.H. 2001b. Active

retrotransposons are a common feature of grass genomes. Plant Physiol. 125: 1283–

1292.

o Vitte, C., Panaud, O. 2005. LTRretrotransposons and flowering plant genome size:

emergence of the increase/decrease model. Cytogenet. Genome Res. 110: 91–107.

o Waugh, R., McLean, K., Flavell, A.J., Pearce, S.R., Kumar, A., Thomas, W.T.B.,

Powell, W. 1997. Genetic distribution of BARE-1-like retrotransposable elements in

the barley genome revealed by sequence-specific amplification polymorphisms S-

SAP. Mol. Gen. Genet. 253: 687–694.

o Wessler S. R. Plant Transposable Elements. A Hard Act to Follow. Plant

Physiology 125: 149–151 Wessler S.R.,Wendel J. 2000. Retrotransposon-mediated

genome evolution on a local ecological scale. PNAS 97:6250–6252.

o Wicker, T., N. Stein, L. Albar, C. Feuillet, E. Schlagenhauf, and B. Keller, 2001

Analysis of a contiguous 211 kb sequence in diploid wheat Triticum monococcum

L. reveals multiple mechanisms of genome evolution. Plant J. 26: 307-316.

o Wicker, T., F. Sabot, A. Hua-Van, J.L. Bennetzen, et al., 2007 A unified

classification system for eukaryotic transposable elements. Nat. Rev. Genet.

doi:10.1038/nrg2165.

o Wilhelm, ., Wilhelm, F.X. 2001. Reverse transcription of retroviruses and

LTRretrotransposons. Cell. Mol. Life Sci. 58: 1246–1262.

Page 83: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

83

o Witte, C.P., Le, Q.H., Bureau, T., Kumar, A. 2001. Terminal-repeat

retrotransposons in miniature TRIM are involved in restructuring plant genomes.

Proc. Natl. Acad. Sci. USA 98: 13778–13783.

o Xiong, Y., Eickbush, T.H. 1990. Origin and evolution of retroelements based upon

their reverse transcriptase sequences. EMBOJ. 9: 3353–3362.

o Yu, Z., Wright, S.I., Bureau, T.E. 2000 Mutator-like elements in Arabidopsis

thaliana. Structure, diversity and evolution. Genetics 186: 2019-2031.

o Zhang, C.X., Feschotte, C., Zhang, Q., Jiang, N., Egglestone, W.B., Wessler, S.R.

2001. P instability factor: an active maize transposon system associated with the

amplification of tourist-like MITEs and a new superfamily of transposase. Prot.

Natl. Acad. Sci. USA 90: 6562-6566.

Zhang C.X., Marshall, J.B., Topp, C., Mroczek, R., Kato, A., Nagaki, K., Birchler,

J.A.., Jiang, J., Dawe, R.K. 2002 Centromeric retroelements and satellites interact

with maize kinetochore protein CENH3. Plant. Cell 14: 2825-2836.

Page 84: UNIVERSITA’ DEGLI STUDI DI PISA FACOLTA’ DI AGRARIA · All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. ... gli elementi

84

Ringraziamenti

Ringrazio Tommaso per la disponibilità con cui ha seguito il mio lavoro sperimentale e

per i suoi insegnamenti in laboratorio.

Ringrazio Marco, Matteo e Pierluigi per la preziosissima collaborazione.

Ringrazio i miei genitori per avermi aiutato sotto ogni aspetto.

Ringrazio Sara senza la quale questo lavoro non sarebbe stato lo stesso.