Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...

23
Riccardo Percudani 1/10/2015 File: bioinformatica_introduzione.odp Bioinformatica :studio dei problemi biologici attraverso le metodologie dell'informatica Viceversa: Biocomputazione, algoritmi genetici, reti neurali... :metodi informatici di applicazione generale che si ispirano ai principi della biologia Sinomimi: biochimica computazionale, biologia molecolare computazionale

Transcript of Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...

Page 1: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Bioinformatica

:studio dei problemi biologici attraverso le metodologie dell'informatica

•Viceversa: Biocomputazione, algoritmi genetici, reti neurali...

:metodi informatici di applicazione generale che si ispirano ai principi della biologia

Sinomimi: biochimica computazionale, biologia molecolare computazionale

Page 2: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Scopi della bioinformatica

Gestione dei dati biologicimantenimento, organizzazione, distribuzione...

Analisi dei dati biologiciinferenze e predizioni sul significato biologico

Page 3: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Oggetti della bioinformatica

Sequenze di acidi nucleici

Sequenze di proteine

Strutture di macromolecole

>P25032 MASSSSATSGDDRPPAAGGGTPAQAHAEWAASMHAYYAAAASAAGHPYAAWPLPPQAQQHGLVAAGAGAAYGAGAVPHVPPPPAGTRHAHASMAAGVPYMA

>gi|8886401|gb|AF162269.1| CCCACTCCTCCATCTCACAAACACTTCTCTATACCCAACAATCCCTTTTACAATCCCTGCTCATTTAGTCAAAATGGTCAAGATTGCTGCTATCATCCTCCTCATGGGCATTCTCGCCAATGCTGCCGCCATCCCTGTCATTTCAACACCCAAATTACAGAGCCAACCGGCGAGGGCGACCGTGGGGACGTGGCCGAC

Page 4: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Sequencing costs have dropped several orders of magnitude, from $10 per finished base in 1990 to today's cost, which are estimated at about 5 or 6 cents per base for finished sequence and about 2 to 4 cents for draft sequence.

The Scientist 17, 2003

Page 5: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Flusso dell'informazione negli esseri viventi

DNA RNA Proteine

Sequenza Struttura Funzione

Page 6: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Importanza della bioinformatica

Quantità di informazione

Valore dell'informazione

Esattezza e completezza dell'informazione

Page 7: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Genomica

“Genoma” indica l'insieme del materiale genetico trasmissibile di un essere vivente (Hans Winkler, 1920).

La genomica è la disciplina che studia i genomi completi.

Page 8: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Trascrittomica

- Studio dei profili di espressione (quantità di mRNA) dei geni in una cellula o tessuto

- Techniche utilizzate:● Microarray● RNA-Seq

- E' usata tipicamente per confrontare cellule in diverse condizioni (es. 'normale' vs 'tumorale')

Kidney Liver Intestine Brain Placenta0

1

2

3

4

5

6

Exp

ress

ion

(Ti

ssu

e/ K

idn

ey)

Kidney Liver Intestine Brain Placenta0

0.2

0.4

0.6

0.8

1

1.2

Exp

ress

ion

(Ti

ssu

e/ K

idn

ey)

Page 9: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Proteomica

- Separazione attraverso gel bidimensionale delle proteine presenti nella cellula

- Rilevazione delle proteine attraverso coloranti. Confronto tra diverse condizioni e individuazione delle macchie differenziali

- Sequenziamento parziale attraverso spettrometria di massa

- Identificazione tramite confronto con un database di sequenze

Punto isoelettrico

Massa

Page 10: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Homo sapiens: 3 * 109 b.p., ~30.000 geni

Il Genoma Umano

Page 11: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

…e le sue varianti

CONTROLLO AFFETTI

Varianti genetiche (polimorfismi)

(e.g. non-gout) (e.g. gout)

Genome-Wide Association Studies (GWAS)

Page 12: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Rilevazione polimorfismi genetici

Microarray

Es. Illumina HumanOmniExpress: ~700.000 varianti x 24 campioni 200 ng DNA

Page 13: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Rilevazione polimorfismi genetici

DNA-Seq: Next Generation Sequencing

AAAA

AA

GG

AA

GG

CCCC

CC

TTTT

CONTROLLO AFFETTO

Reference

Reads

CC

CC

AA

AA

Page 14: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Dimensione del genoma e numero di geni in diversi organismi

Page 15: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

18S rRNA tree of life

Divergenza da antenati comuni con modificazioni

Page 16: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Yeast(Saccharomyces

cerevisiae)

Bacteria(Escherichia

coli)

Organismi modello della biologia

Page 17: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

ATCGGCCACTTTCGCGATCA

Sequenza ancestrale

ATAGGCCACTTTCGCGATCA

ATAGGCCACTTTCGCGATTA

ATAGGGCACTTTCGCGATTA

ATAGGGCACTTT-GCGATTA

ATAGGGCACTTT-GCGATGA

ATCGGCCACTTTCGCGATCG

ATCGGCCACTTTCGTGATCG

ATCGGCCACGTTCGTGATCG

ATCGCCCACGTTCGCGATCG

ATTGCCCACGTTCGCGATCG

Sequenze omologhe

ATCGGCCACGTTCGCGATCG

Evoluzione nel tempo dell'informazione biologica

Omologia = condivisione di un ancestore comune

Evento di separazione

Page 18: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Separazione dei geni per speciazione

Page 19: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

I geni hanno una storia evolutiva più complicata di quella degli organismi

MIOGLOBINA

-GLOBINA -GLOBINA

EMOGLOBINA

GLOBINA

Page 20: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

ATCGGCCACTTTCGCGATCA

Sequenza ancestrale

ATAGGGCACTTT-GCGATGAATTGCCCACGTTCGCGATCG

ATAGGGCACTTT-GCGATGA** * *** ** *****

ATTGCCCACGTTCGCGATCG

Sequenze allineate

L'omologia è dedotta dall'allineamento

?

Osservazione

Ipotesi

Page 21: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Il “problema” della bioinformatica

Sequenza Struttura Funzione? ?

?

Page 22: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

ORARIO DI LEZIONE

* Postazione fissa o personal laptopEsercitatore: Dott. Pietro Cravedi

Bioinformatica

Aula informatica polifunzionale, Torre* - Mercoledì 16:30 – 18:30

Aula B, Podere la Grande - Mercoledì 11:30 – 13:30

Page 23: Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf · Sinomimi: biochimica computazionale, biologia molecolare computazionale. ... Discussione

MODALITA' di ESAMEMODALITA' di ESAME

Bioinformatica

- Elaborato contenente una analisi bioinformatica originale di unGene/proteina. Formato: articolo scientifico.Consegna in data di appello: PDF e cartaceo

- Esame orale. Discussione sulla relazione e domande sulla teoria