Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

51
Annotare i geni Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w

Transcript of Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Page 1: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geniAnnotare i geni

5’ 3’

Gene xxxx3 esoni

proteina y

Gene zzzz7 esoni

proteina w

Page 2: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Il primo passo...Il primo passo...

Abbiamo la sequenza completa del Abbiamo la sequenza completa del DNA di un organismo: DNA di un organismo: Quanti geni contiene in tutto?Quanti geni contiene in tutto? Dove sono localizzati i geni?Dove sono localizzati i geni? A cosa serve ciascun gene (ovvero, A cosa serve ciascun gene (ovvero,

qual è la funzione della proteina qual è la funzione della proteina codificata, ammesso che effettivamente codificata, ammesso che effettivamente codifichi per una proteina)?codifichi per una proteina)?

Quali sono gli splicing alternativi più Quali sono gli splicing alternativi più comuni di ciascun gene?comuni di ciascun gene?

Page 3: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““Annotare” i geniAnnotare” i geni

Dato un genoma, servono altri due Dato un genoma, servono altri due elementi:elementi: mRNA e proteinamRNA e proteina

Tre indizi fanno una provaTre indizi fanno una prova:: Conosciamo la proteina (la abbiamo Conosciamo la proteina (la abbiamo

“vista” e sequenziata)?“vista” e sequenziata)? Conosciamo il trascritto che codifica per Conosciamo il trascritto che codifica per

la proteina (lo abbiamo sequenziato)?la proteina (lo abbiamo sequenziato)? Conosciamo il gene che produce il Conosciamo il gene che produce il

trascritto (abbiamo sequenziato la trascritto (abbiamo sequenziato la regione corrispondente del genoma)? regione corrispondente del genoma)?

Page 4: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Leggere le sequenzeLeggere le sequenze

Ovviamente, è possibile determinare Ovviamente, è possibile determinare anche la sequenza di un trascritto anche la sequenza di un trascritto (mRNA), e, con diverse tecniche, (mRNA), e, con diverse tecniche, anche quella di una proteinaanche quella di una proteina

Quindi, se conosco la sequenza di Quindi, se conosco la sequenza di un mRNA, posso localizzare lungo la un mRNA, posso localizzare lungo la sequenza genomica la regione che sequenza genomica la regione che lo produce (e - a tratti - uguale al lo produce (e - a tratti - uguale al trascritto!)trascritto!)

Se conosco anche la sequenza della Se conosco anche la sequenza della proteina codificata, allora ho proteina codificata, allora ho completato la completato la annotazioneannotazione del gene del gene

Page 5: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Leggere le sequenzeLeggere le sequenze

Attenzione, però: mentre il DNA è “statico”, e Attenzione, però: mentre il DNA è “statico”, e quindi la sua sequenza è presente nella quindi la sua sequenza è presente nella stessa forma in tutte le cellule, lo stesso non stessa forma in tutte le cellule, lo stesso non vale per gli RNA:vale per gli RNA: NON tutti i geni sono trascritti in tutte le celluleNON tutti i geni sono trascritti in tutte le cellule

A seconda diA seconda di Stadio di sviluppoStadio di sviluppo Tipo di tessuto/cellulaTipo di tessuto/cellula Stimoli esterniStimoli esterni

Possono variare i geni trascritti e i relativi Possono variare i geni trascritti e i relativi splicing alternativisplicing alternativi

Morale: mentre abbiamo sequenze di Morale: mentre abbiamo sequenze di genomi completi, non siamo ancora sicuri di genomi completi, non siamo ancora sicuri di avere trascrittomi (e proteomi) completi avere trascrittomi (e proteomi) completi anche per gli organismi più studiati!anche per gli organismi più studiati!

Page 6: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geniAnnotare i geni

mRNAmRNADNADNA

(doppio(doppiofilamento)filamento)

Page 7: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geniAnnotare i geni

Quindi, se abbiamo la sequenza Quindi, se abbiamo la sequenza del DNA di un organismo del DNA di un organismo possiamo:possiamo: Prendere le sequenze di tutti i Prendere le sequenze di tutti i

trascritti che conosciamotrascritti che conosciamo Cercare regioni su uno dei due Cercare regioni su uno dei due

filamenti che sono uguali al filamenti che sono uguali al trascritto “a pezzi”trascritto “a pezzi”

Queste regioni sono... i “geni”!Queste regioni sono... i “geni”!

Page 8: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Un gene, schematicamenteUn gene, schematicamente

5’

5’

3’

3’

Il trascritto (mRNA) è costituito dalla giunzione deitratti corrispondenti ai rettangoli (esoni), per

i quali si trova una corrispondenza ESATTA suuno dei due filamenti del DNA

Sul DNA, gli esoni sono inframmezzati da parti di sequenza che non sono contenuti nell’mRNA, gli introni

Le frecce indicano di quale dei due filamentiil trascritto è una copia esatta

Gli intronisono sul DNA

ma non nel trascritto

Page 9: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Un gene, schematicamenteUn gene, schematicamente

5’

5’

3’

3’

Il trascritto (mRNA) è costituito dalla giunzione deitratti corrispondenti ai rettangoli (esoni), per

i quali si trova una corrispondenza ESATTA suuno dei due filamenti del DNA

Sul DNA, gli esoni sono inframmezzati da parti di sequenza che non sono contenuti nell’mRNA, gli introni

Le frecce indicano di quale dei due filamentiil trascritto è una copia esatta

Gli intronisono sul DNA

ma non nel trascritto

Page 10: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Un gene in un computerUn gene in un computer

Tre esoni: il gene è localizzato sul filamento “antisenso” (quello sotto), detto anche

“negativo” (il gene si annota sul filamento checontiene la copia esatta dell’mRNA)

Page 11: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

I “Browser” genomiciI “Browser” genomici

Come dice il nome stesso, sono Come dice il nome stesso, sono strumenti che permettono ai strumenti che permettono ai ricercatori di “navigare” all’interno dei ricercatori di “navigare” all’interno dei genomi di cui si conosce la genomi di cui si conosce la sequenza, visualizzando tutte le sequenza, visualizzando tutte le annotazioni che sono disponibiliannotazioni che sono disponibili

Sono accessibili via internet:Sono accessibili via internet: genome.genome.ucscucsc..eduedu (University of (University of

California Santa Cruz - California Santa Cruz - sito di riserva sito di riserva - - secondo sito di riservasecondo sito di riserva))

www.www.ensemblensembl.org.org (sviluppato da EMBL- (sviluppato da EMBL-EBI e dal Sanger Center)EBI e dal Sanger Center)

Page 12: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Le Coordinate GenomicheLe Coordinate Genomiche

In ogni sequenza nota, gli elementi che la In ogni sequenza nota, gli elementi che la compongono sono numerati da 1 fino compongono sono numerati da 1 fino all’ultimo all’ultimo

Sia le sequenze nucleotidiche che quelle Sia le sequenze nucleotidiche che quelle aminoacidiche sono orientateaminoacidiche sono orientate

I nucleotidi si leggono da 5’ a 3’ I nucleotidi si leggono da 5’ a 3’ Gli amminoacidi si leggono da N Gli amminoacidi si leggono da N

(terminale) a C (terminale)(terminale) a C (terminale) Quindi, anche tutti i cromosomi di una Quindi, anche tutti i cromosomi di una

specie sono numerati da 1 in poispecie sono numerati da 1 in poi Ciascun paio di basi in un genoma è Ciascun paio di basi in un genoma è

definito da due coordinate:definito da due coordinate: Numero di cromosomaNumero di cromosoma Posizione all’interno del cromosomaPosizione all’interno del cromosoma

I browser mostrano uno dei due filamenti I browser mostrano uno dei due filamenti del DNA, ed (implicitamente) anche l’altrodel DNA, ed (implicitamente) anche l’altro

Page 13: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Cliccando unoCliccando unodei due link sidei due link si

accede al browseraccede al browser

Page 14: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

ScelgoScelgoil gruppoil gruppo

ScelgoScelgola speciela specie ““versione”versione” tratto datratto da

visualizzarevisualizzare VIA!VIA!

Page 15: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

“pulsanti” per muoversilungo il cromosoma

“pulsanti” per avvicinare (zoom in) o allontanare(zoom out) la visuale

Page 16: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Un solo gene, con tantiUn solo gene, con tantipiccoli esoni ed intonipiccoli esoni ed intoni

molto più ampimolto più ampi

In più di In più di 300000 paia di basi300000 paia di basi

“RefSeq” - trascritti “rappresentatividel gene (all’epoca di un gene-un trascritto)UCSC Known Gene - idem, ma annotatidai curatori del sito

Page 17: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Ricerca per coordinateRicerca per coordinate

Tornate alla pagina iniziale, e Tornate alla pagina iniziale, e mantendendo le stesse mantendendo le stesse selezioni di prima, provate ad selezioni di prima, provate ad inserire queste coordinate:inserire queste coordinate:chr7:155,288,319-155,297,728 chr7:155,288,319-155,297,728

(potete copiare ed incollare)(potete copiare ed incollare)

Page 18: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Si viene portati alla regione genomica corrispondente.Tutti i trascritti “mappati” sul genoma sono cliccabili:

cliccandoci sopra è possibile cambiarela modalità di visualizzazione e/o accedere a tutte le

informazioni disponibili sul gene in questioneSe provate a cliccare sulla “riga” nera sotto “Human mRNA

from GenBank”....

Page 19: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

.... si scopre che ci sono tanti trascritti che provengonoda questa regione, non solo uno... e in particolare

i diversi trascritti “condividono” alcuni esoni, altri no splicing “alternativi”

Page 20: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

... riassumendo...... riassumendo...

Page 21: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Ricerca per parole chiaveRicerca per parole chiave

Procedendo come si è visto, è possibile Procedendo come si è visto, è possibile esplorare i diversi genomi disponibiliesplorare i diversi genomi disponibili

Ma: è possibile utilizzare la casella Ma: è possibile utilizzare la casella “coordinate” per effettuare una ricerca per “coordinate” per effettuare una ricerca per parole chiaveparole chiave

Ad esempio, si può cercare un gene, dato il Ad esempio, si può cercare un gene, dato il nomenome

Page 22: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Lunga lista di risultati, tipo “google”... ma se guardiamo con attenzionec’è un gene che si “chiama” shh sia nella lista “known” che nellalista RefSeq. Cliccando sul link corrispondente...

Page 23: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

... si ritorna dove eravamo prima!

Page 24: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare bioinformaticamente Annotare bioinformaticamente i genii geni Il genome browser permette anche di Il genome browser permette anche di

trovare la corrispondenza trascritto trovare la corrispondenza trascritto regione genomica come si era visto in regione genomica come si era visto in precedenzaprecedenza

Nella barra blu in cima alla pagina, cliccate Nella barra blu in cima alla pagina, cliccate su “Blat”su “Blat”

Page 25: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““BLAT”BLAT”Selezionateil genoma che

vi interessa Incollate lasequenzada cercare

Page 26: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““Blat”Blat”

Provate a copiare e incollare la Provate a copiare e incollare la sequenza 1 che trovate alla sequenza 1 che trovate alla pagina del corsopagina del corso

Page 27: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Come si può vedere, la vostra sequenza “mappa” in diverse regioni del genoma, su diversi cromosomi; per ogni risultato l’interfaccia vi indica da dove a dove è stata trovata corrispondenza per il trascritto (START-END)Quello che ci interessa, per ora, è il “match” che copre tutto il trascritto,con identità del 100%, ovvero il primo risultato. Cliccando sul link “browser”corrispondente, si viene mandati...

Page 28: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Questa è la vostra sequenza mappata sul

genoma

Page 29: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““Blat”Blat”

E’ possibile inserire nella casella di E’ possibile inserire nella casella di ricerca anche la sequenza di una ricerca anche la sequenza di una proteina (sequenza 2 della pagina)proteina (sequenza 2 della pagina)

L’interfaccia cercherà una regione L’interfaccia cercherà una regione genomica che - spezzettata in esoni genomica che - spezzettata in esoni ed introni - tradotta tripletta per ed introni - tradotta tripletta per tripletta codifica per la proteina che tripletta codifica per la proteina che avete sottomessoavete sottomesso

Page 30: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Come si può vedere, in questo caso la proteina è andata a “cadere” in unaregione dove è già annotato un gene, con il trascritto corrispondente. Però,stavolta, la regione “coperta” dalla proteina è più corta di quella coperta dal

trascritto... come mai?E... come mai sono state trovate altre due regioni in cui,

almeno parzialmente, è stata trovata corrispondenza per la proteina?Cliccando sul link in corrispondenza del secondo risultato..

Page 31: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

In questo caso, siamo andati a finire in una regione (e su un cromosoma!)completamente differente... eppure nella regione è annotato un gene,

che tradotto a triplette codifica per qualcosa di simile alla nostra proteinadi partenza, e le regioni corrispondenti cadono proprio sugli

esoni del gene…

Page 32: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““BLAT”BLAT”

Terzo esperimento: sempre Terzo esperimento: sempre partendo dalla proteina, partendo dalla proteina, nell’interfaccia di “BLAT” nell’interfaccia di “BLAT” selezioniamo il genoma del toposelezioniamo il genoma del topo

Cosa succederà, confrontando Cosa succederà, confrontando una proteina umana “contro” il una proteina umana “contro” il genoma del topo?genoma del topo?

Page 33: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Compaiono ben 6 (!) regioni di corrispondenza... notate in particolare che le prime tre coprono regioni abbastanza ampie della proteina, con un’alta percentuale di identità.Cliccando su “browser” in corrispondenza del primo risultato...

Page 34: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

... andiamo a cadere proprio in corrispondenza di un gene di topo... la proteinasembra anche coprire tutto il trascritto!

Quindi, apparentemente, nel genoma del topo c’è un gene che codifica per unaproteina che “assomiglia” a quella dell’uomo?

Andiamo a riprendere il primo risultato dell’uomo

Page 35: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

I due geni sono localizzati su due cromosomi diversi (topo - 5, uomo 7)... ma:Hanno tutti e due 3 esoni... e qualcuno ha dato lo stesso nome (Shh) sia al genedell’uomo che a quello del topo...

TOPO

UOMO

Page 36: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

““BLAT”BLAT”

Ora effettuiamo il procedimento Ora effettuiamo il procedimento inverso: a partire dalla proteina inverso: a partire dalla proteina del gene SHH di topo, andiamo del gene SHH di topo, andiamo a mapparla sul genoma umanoa mapparla sul genoma umano

Selezionate “Blat”, e “Human” Selezionate “Blat”, e “Human” come organismocome organismo

Page 37: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Ancora tre risultati.... e cliccando sul primo...

Page 38: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

.... si ritorna al gene chiamato “shh” dell’uomo!

Provando a ritornare indietro, selezionando stavolta il secondo risultato..

Page 39: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

... ritroviamo l’IHH, che era stato il secondo “match” di quando avevamo utilizzato la proteina dell’uomo contro il genoma dell’uomo...

.... morale.....

Page 40: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

SHH UOMO SHH TOPO

SHH UOMO

IHH UOMO

DHH UOMO

SHH TOPO

IHH TOPO

DHH TOPO

Partendo da…..

Trovo…..

Page 41: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

... e gli altri animali?... e gli altri animali?

Proviamo, sempre con BLAT, a Proviamo, sempre con BLAT, a selezionare una specie selezionare una specie evolutivamente più lontana, evolutivamente più lontana, utilizzando la proteina utilizzando la proteina dell’uomo..dell’uomo..

.... proviamo con la Drosophila!.... proviamo con la Drosophila!

Page 42: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

In questo caso, la regione che corrisponde alla nostra proteina è molto piùpiccola, ed è più piccolo anche il frammento di proteina che riusciamo a fare corrispondere...

Eppure, c’è una corrispondenza con un gene della Drosophila, che cade esattamente su un esone (e, non a caso, il gene si chiama “hh”....)

Page 43: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

L’evoluzione al lavoroL’evoluzione al lavoro

Duplicazione

Duplicazione

Speciazione uomo/topo

SHH DHH uomoIHH

SHH DHH topoIHH

HH Drosophila

Ad ogni duplicazione compare un nuovo “HH”

HH

Oggimilionidi anni

fa

Page 44: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

I geni omologhiI geni omologhi

A questo punto, si può ipotizzare che i vari A questo punto, si può ipotizzare che i vari geni “geni “similisimili” tra loro che troviamo nelle ” tra loro che troviamo nelle diverse specie, lo siano diverse specie, lo siano perché “parentiperché “parenti”, ”, ovvero discendenti dallo stesso/i gene/i in ovvero discendenti dallo stesso/i gene/i in specie antenate (specie antenate (speciazionespeciazione) o nella ) o nella stessa specie (stessa specie (duplicazioneduplicazione))

Due sequenze (sia DNA, sia RNA, sia Due sequenze (sia DNA, sia RNA, sia proteine) per cui possiamo fare questa proteine) per cui possiamo fare questa ipotesi – basandoci sulla loro similarità – ipotesi – basandoci sulla loro similarità – sono dette sequenze sono dette sequenze omologheomologhe

Quindi l’SHH dell’uomo è omologo Quindi l’SHH dell’uomo è omologo dell’SHH di topo e dell’HH della Drosophiladell’SHH di topo e dell’HH della Drosophila

Ma anche l’IHH dell’uomo è omologo di Ma anche l’IHH dell’uomo è omologo di SHH dell’uomo, in quanto duplicati dello SHH dell’uomo, in quanto duplicati dello stesso gene di partenzastesso gene di partenza

Page 45: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Omologhi: ortologhi e Omologhi: ortologhi e paraloghiparaloghi Per complicare un po’ la Per complicare un po’ la

nomenclatura: due sequenze nomenclatura: due sequenze omologhe sono detteomologhe sono dette OrtologheOrtologhe, se sono in specie diverse, se sono in specie diverse ParalogheParaloghe, se sono nella stessa specie, se sono nella stessa specie

Esempio: SHH topo è ortologo a Esempio: SHH topo è ortologo a SHH dell’uomo; DHH uomo è SHH dell’uomo; DHH uomo è ortologo a DHH del topo e paralogo ortologo a DHH del topo e paralogo a IHH e SHH dell’uomoa IHH e SHH dell’uomo

Sulla base della similarità riusciamo Sulla base della similarità riusciamo anche a ipotizzare se si sia verificata anche a ipotizzare se si sia verificata prima una duplicazione o una prima una duplicazione o una speciazionespeciazione

Page 46: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Omologhi e paraloghiOmologhi e paraloghi

SHH uomo è più simile a SHH topo SHH uomo è più simile a SHH topo che a IHH e DHH uomoche a IHH e DHH uomo

Quindi, gli eventi di duplicazione Quindi, gli eventi di duplicazione sono più lontani nel tempo rispetto sono più lontani nel tempo rispetto all’evento di speciazione uomo/topoall’evento di speciazione uomo/topo

Ma: considerando ad esempio i geni Ma: considerando ad esempio i geni dell’uomo, quanto è comune trovare dell’uomo, quanto è comune trovare ortologhi in altre specie? L’uomo ha ortologhi in altre specie? L’uomo ha dei geni “propri”?dei geni “propri”?

Page 47: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

I geni dell’uomo e di altre I geni dell’uomo e di altre speciespecie Per la Per la quasi totalità dei geniquasi totalità dei geni dell’uomo si dell’uomo si

trova un ortologo trova un ortologo negli altri mammiferinegli altri mammiferi (inclusi quelli tessuto-specifici, che (inclusi quelli tessuto-specifici, che “caratterizzano” particolari tipi di cellula)“caratterizzano” particolari tipi di cellula)

Per la Per la quasi totalità dei geniquasi totalità dei geni dell’uomo si dell’uomo si trovano ortologhi trovano ortologhi in altri vertebratiin altri vertebrati (ci (ci possono essere più o meno duplicati nelle possono essere più o meno duplicati nelle diverse specie)diverse specie)

Per Per buona partebuona parte dei geni dell’uomo si dei geni dell’uomo si trovano ortologhi in trovano ortologhi in altre specie animalialtre specie animali (inclusi, ad esempio, gli invertebrati come (inclusi, ad esempio, gli invertebrati come gli insetti)gli insetti)

Per i Per i geni “di base”geni “di base” responsabili del responsabili del “funzionamento” delle diverse cellule si “funzionamento” delle diverse cellule si riescono a trovare ortologhi riescono a trovare ortologhi negli eucarioti negli eucarioti più semplicipiù semplici (unicellulari come il lievito), o (unicellulari come il lievito), o addirittura nei procarioti come i batteriaddirittura nei procarioti come i batteri

Page 48: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Usare i geni ortologhiUsare i geni ortologhi

Oltre che per studi evolutivi, l’ortologia di Oltre che per studi evolutivi, l’ortologia di geni in specie diverse può servire anche geni in specie diverse può servire anche allo studio di uno o più geniallo studio di uno o più geni

Se non conosco la funzioneSe non conosco la funzione di un gene di un gene umano, posso cercarne l’ortologo in topo e umano, posso cercarne l’ortologo in topo e studiarlo lì (più “pratico” sperimentalmente)studiarlo lì (più “pratico” sperimentalmente)

Annotazione: Annotazione: se ho un gene “mancante”se ho un gene “mancante” in in una specie, posso cercare di localizzarlo una specie, posso cercare di localizzarlo basandomi su geni di altre speciebasandomi su geni di altre specie

Ovvero, posso cercare di annotare un gene Ovvero, posso cercare di annotare un gene in mancanza di “indizi” (trascritto e/o in mancanza di “indizi” (trascritto e/o proteina) basandomi sulle sequenze di proteina) basandomi sulle sequenze di altre specie altre specie se c’è una data proteina in se c’è una data proteina in topo mi posso aspettare che – da qualche topo mi posso aspettare che – da qualche parte – nel genoma dell’uomo ci sia un parte – nel genoma dell’uomo ci sia un gene che codifica per qualcosa di similegene che codifica per qualcosa di simile

Page 49: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geni con pochi Annotare i geni con pochi indiziindizi Manca la proteina:Manca la proteina:

Posso utilizzare appositi Posso utilizzare appositi programmi che predicono le programmi che predicono le possibili traduzioni di un trascritto possibili traduzioni di un trascritto in proteinain proteina

Verifico se in specie vicine a Verifico se in specie vicine a quella che sto studiando sono quella che sto studiando sono annotate (possibilmente, annotate (possibilmente, sperimentalmente) proteine simili sperimentalmente) proteine simili a quella che ho predettoa quella che ho predetto

Page 50: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geni con pochi Annotare i geni con pochi indiziindizi

Manca il trascrittoManca il trascritto Così come abbiamo fatto con la Così come abbiamo fatto con la

proteina di SHH, è possibile proteina di SHH, è possibile cercare nel genoma regioni che cercare nel genoma regioni che tradotte (e concatenate) tradotte (e concatenate) producono la proteina stessaproducono la proteina stessa

E se mancano sia il trascritto E se mancano sia il trascritto che la proteina?che la proteina?

Page 51: Annotare i geni 5’ 3’ Gene xxxx 3 esoni proteina y Gene zzzz 7 esoni proteina w.

Annotare i geni con pochi Annotare i geni con pochi indiziindizi

Basandoci sul principio “Basandoci sul principio “specie simili hanno specie simili hanno più o meno gli stessi genipiù o meno gli stessi geni” possiamo - data ” possiamo - data una proteina di una specie - cercare una una proteina di una specie - cercare una regione del genoma che codifica per regione del genoma che codifica per qualcosa di simile (così come quando qualcosa di simile (così come quando avevamo confrontato una proteina di uomo avevamo confrontato una proteina di uomo con il genoma del topo, e viceversa)con il genoma del topo, e viceversa)

Procedura “tipica” per genomi come quello Procedura “tipica” per genomi come quello del cane, del gatto, dell’opossum (di cui ho del cane, del gatto, dell’opossum (di cui ho la sequenza genomica, ma pochi trascritti)la sequenza genomica, ma pochi trascritti)

Ma: potrebbero esistere geni “fantasma” Ma: potrebbero esistere geni “fantasma” mai visti in nessuna specie (e quindi non mai visti in nessuna specie (e quindi non riscontrabili con l’approccio comparativo?)riscontrabili con l’approccio comparativo?)