Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto...

25
Osservando la Genoma con Ensembl Dr. Giulietta Spudich Ensembl User Support

Transcript of Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto...

Page 1: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

Osservando la Genoma con Ensembl

Dr. Giulietta SpudichEnsembl User Support

Page 2: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

OrdineOrdine del del GiornoGiornoPolaris, Polaris, FebbraioFebbraio 20072007

• Introduzione• Un ‘Worked Example’ • Parte Pratica

• Lettura del Programma ‘BioMart’• Esercizi ed Applicazioni (Parte Pratica)

• Presentazione (a Scelta): ‘Variazioni’

• Parte Pratica e Domande

Page 3: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

EsplorandoEsplorando le Genomele Genome

Con i Browser di genome possiamo:

• Sfogliare i geni nel contesto genomico• Mostrare I ‘features’ vicino un gene• Esplorare una regione genoma• Trovare informazione di un gene oppure tanti geni• Osservare l’ordine della genoma• Fare un paragone tra le genome

Page 4: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

AnnotazioneAnnotazione in in EnsemblEnsembl: : didi BaseBase

Geni• Posizione nelle genome • Strutture

– Exons– Introns– UTRs (Untranslated Regions)

• Transcript(s)– Pseudogenes– Non-coding RNA

• Proteine

Page 5: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

AnnotazioneAnnotazione in in EnsemblEnsembl: : didi PiuPiu

• Le bande citogenetiche• Polymorphic markers• Variazioni genetiche• Sequenze che si ripetano (repeats)• Expressed Sequence Tags (ESTs)• cDNAs o mRNAs dei speci vicini• Regioni similari tra genome

Page 6: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

DiversiDiversi ModiModi didi VedereVedere un Gene:un Gene:

Fenotipo(malattia,

caratteristiche)

Funzione(Cell-cycle,

riproduzione e riparazione del DNA )

Gene

Posizione(cromosoma,

base pair)

L’espressione delle proteine(tipo di tessuto, tempismo)

Page 7: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

UnaUna Specie Ha Specie Ha TantiTanti GeniGeni

2006 20052004

2,200 geni umani(cromosoma 1)

Geni umani totale:22,810 (protein-coding)

Page 8: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

27 Genome con 27 Genome con AnnotazioniAnnotazioni nelnelEnsemblEnsembl

Page 9: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

La La maggioranzamaggioranza sonosono vertebrativertebraticome:come:

cici sonosono ancheanche organismiorganismiinteressantiinteressanti per la per la ricercaricerca, come:, come:

Saccharomyces cerevisiae

Caenorhabditis elegans

Anopheles gambiae(malaria)

Page 10: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

Com’Com’éé OrganizattaOrganizatta per per PrenderePrenderell’’InformazioneInformazione??

• Ensembl Views (Sito Web)

• Ensembl Database (gratuito)

• BioMart (Applicazione per predereinformazione del database facilmente)

Page 11: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

EnsemblEnsembl• Fu fondata nel 1999• Progetto tra EBI (Istituto Europeo d’Informatica)

e il Centro di Sanger

• Finanziato principlamente dal Wellcome Trust, anche dal EMBL, NIH-NIAID and BBSRC

• Gruppo di circa 40 persone, i capi sono EwanBirney (EBI) and Tim Hubbard (Sanger)

• Usa uno dei piu grandi sistemi di computer dedicato alla biologia in Europa!

Page 12: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

GeniGeni nelnel EnsemblEnsembl::Tutti i geni (protein coding) hanno unabase biologica.• UniProt/Swiss-Prot

Un database ‘manually curated’ • NCBI RefSeq

Un database ‘manually curated’ in parte• UniProt/TrEMBL

‘Translations’ delle proteine da EMBL coding sequences (CDS)

Page 13: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

• Pseudogeni (geni falsi)

• RNA genes (rRNA, tRNA, miRNA, etc)

• Informazioni degli altri ‘database’

CheChe CosCos’ ’ AltroAltro??

Page 14: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

InterproInterpro

‘InterPro is a database of protein families, domains and functional sites in which identifiable features found in known proteins can be applied to

unknown protein sequences.’

Page 15: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

AltreAltre FontiFonti didi InformazioneInformazione::

• Chips (Affimetrix, Illumina, Agilent)• GO (Gene Ontology)• MIM (human diseases and phenotypes)• Identifiers nel Entrez, UniProt, Refseq,

etc• PDB, MSD (structural databases)

Page 16: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

NelNel EnsemblEnsembl: : paginepagine per un geneper un gene

Page 17: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

EnsemblEnsembl: : ComparaCompara (un (un paragoneparagone tratra le le genome)genome)

Sequence Alignment (species to species)

Gene Trees(Evolutionary Information)

Page 18: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

EnsemblEnsembl: : VariazioniVariazioni

SNPs

Choose SNP type

Table of Variations

Page 19: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

AiutoAiuto e e DocumentiDocumenti al al SitoSito WebWeb

Contatti

Download data

Pagine Customabile(User Logins)

BLAST contra una genoma

Notizie(con ogni ‘release’)

Aiuto…

Glossario

Publicazioni

Workshops

Page 20: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

I I GeniGeni e ‘Transcripts’ e ‘Transcripts’ didi EnsemblEnsembl

• Ensembl known genes or transcriptsIl base è evidenza della stessa specie Ensembl novel genes or transcriptsIl base è evidenza della specie similare

• Ensembl EST genes or transcriptsSolamente usa l’evidenza EST

• GENSCAN transcriptsSenza evidenza: predizioni ‘ab initio’

• VEGA/HAVANA transcripts Un’ altro gruppo che fanno le predizioni manualmente(manual curators)

Page 21: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

Nomi Nomi didi EnsemblEnsembl

• ENSG### Ensembl Gene ID• ENST### Ensembl Transcript ID• ENSP### Ensembl Peptide ID• ENSE### Ensembl Exon ID• ENSF### Ensembl Family ID

• Per le specie diverse da quella umana, cisono tre lettere di piu:MUS (Mus musculus) per topolino: ENSMUSG### DAR (Danio rerio) per zebrafish: ENSDARG###, etc.

Page 22: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

StruttureStrutture deidei genigeni nelnel EnsemblEnsembl

Calmodulin- galloSenza UTRs(untranslated regions)

Con l‘annotazione di

UTRsCalmodulin-umano

Page 23: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

Termini Termini didi EnsemblEnsembl

• I siti Pre! e Archive: nuovi assemblagi e siti ‘vecchi’(ricordate: un nuovo ‘release’ ogni due mesi)

• Geni ‘known e novel’: tutti hanno un base biologico

• ‘Views’: pagine specifice nel sito web

• ‘BioMart’: un’ applicazione per prendere il data di un gene o tanti geni/ regioni delle cromosome.

Page 24: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

Guy Coates, Tim Cutts, Shelley GoddardSystems & Support

Paul Flicek, Yuan Chen, Stefan Gräf, Nathan Johnson, Daniel RiosFunctional Genomics

Ewan Birney (EBI), Tim Hubbard (Sanger Institute)Leaders

Damian Keefe, Ernesto Lowy, Guy Slater, Michael Hoffman, Alison Meynert, Benedict Paten, Dace Ruklisa, Daniel ZerbinoResearch

Martin Hammond, Dan Lawson, Karyn MegyVectorbase Annotation

Kerstin Howe, Mario Caccamo, Ian SealyZebrafish Annotation

Val Curwen, Steve Searle, Bronwen Aken, Julio Banet, Laura Clarke, Sarah Dyer, Kevin Howe, Felix Kokocinski, Jan-Hinnerck Vogel, Simon White

Analysis and Annotation Pipeline

Abel Ureta-Vidal, Benoit Ballester, Kathryn Beal, Stephen Fitzgerald, Javier HerreroSánchez, Albert VilellaComparative Genomics

James Smith, Fiona Cunningham, Anne Parker, Stephen Rice, Steve Trevanion, Matt WoodWeb Team

Xosé M Fernández, Bert Overduin, Michael Schuster, Giulietta SpudichOutreach & QC

Eugene KuleshaDistributed Annotation System (DAS)

Arek Kasprzyk, Syed Haider, Richard Holland, Damian SmedleyBioMart

Glenn Proctor, Andreas Kähäri, Ian Longden, Patrick MeidlDatabase Schema and Core API Cambridge, UK

GruppoGruppo EnsemblEnsembl

Page 25: Osservando la Genoma con Ensembl - sardegnaricerche.it · • Sfogliare i geni nel contesto genomico • Mostrare I ‘features’ vicino un gene • Esplorare una regione genoma

AddessoAddesso: : ilil ‘Worked Example’‘Worked Example’• Worked Example• BioMart

• Le Variazioni

• Esercizi ed applicazioni dopo ogni lettura

Tutti le mie presentazioni sono a questo sito:http://www.ebi.ac.uk/~gspudich/workshop_presentations/p

ula