Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...

Post on 18-Feb-2019

229 views 2 download

Transcript of Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Bioinformatica

:studio dei problemi biologici attraverso le metodologie dell'informatica

•Viceversa: Biocomputazione, algoritmi genetici, reti neurali...

:metodi informatici di applicazione generale che si ispirano ai principi della biologia

Sinomimi: biochimica computazionale, biologia molecolare computazionale

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Scopi della bioinformatica

Gestione dei dati biologicimantenimento, organizzazione, distribuzione...

Analisi dei dati biologiciinferenze e predizioni sul significato biologico

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Oggetti della bioinformatica

Sequenze di acidi nucleici

Sequenze di proteine

Strutture di macromolecole

>P25032 MASSSSATSGDDRPPAAGGGTPAQAHAEWAASMHAYYAAAASAAGHPYAAWPLPPQAQQHGLVAAGAGAAYGAGAVPHVPPPPAGTRHAHASMAAGVPYMA

>gi|8886401|gb|AF162269.1| CCCACTCCTCCATCTCACAAACACTTCTCTATACCCAACAATCCCTTTTACAATCCCTGCTCATTTAGTCAAAATGGTCAAGATTGCTGCTATCATCCTCCTCATGGGCATTCTCGCCAATGCTGCCGCCATCCCTGTCATTTCAACACCCAAATTACAGAGCCAACCGGCGAGGGCGACCGTGGGGACGTGGCCGAC

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Sequencing costs have dropped several orders of magnitude, from $10 per finished base in 1990 to today's cost, which are estimated at about 5 or 6 cents per base for finished sequence and about 2 to 4 cents for draft sequence.

The Scientist 17, 2003

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Flusso dell'informazione negli esseri viventi

DNA RNA Proteine

Sequenza Struttura Funzione

Importanza della bioinformatica

Quantità di informazione

Valore dell'informazione

Esattezza e completezza dell'informazione

Genomica

“Genoma” indica l'insieme del materiale genetico trasmissibile di un essere vivente (Hans Winkler, 1920).

La genomica è la disciplina che studia i genomi completi.

Trascrittomica

- Studio dei profili di espressione (quantità di mRNA) dei geni in una cellula o tessuto

- Techniche utilizzate:● Microarray● RNA-Seq

- E' usata tipicamente per confrontare cellule in diverse condizioni (es. 'normale' vs 'tumorale')

Kidney Liver Intestine Brain Placenta0

1

2

3

4

5

6

Exp

ress

ion

(Ti

ssu

e/ K

idn

ey)

Kidney Liver Intestine Brain Placenta0

0.2

0.4

0.6

0.8

1

1.2

Exp

ress

ion

(Ti

ssu

e/ K

idn

ey)

Proteomica

- Separazione attraverso gel bidimensionale delle proteine presenti nella cellula

- Rilevazione delle proteine attraverso coloranti. Confronto tra diverse condizioni e individuazione delle macchie differenziali

- Sequenziamento parziale attraverso spettrometria di massa

- Identificazione tramite confronto con un database di sequenze

Punto isoelettrico

Massa

Homo sapiens: 3 * 109 b.p., ~30.000 geni

Il Genoma Umano

…e le sue varianti

CONTROLLO AFFETTI

Varianti genetiche (polimorfismi)

(e.g. non-gout) (e.g. gout)

Genome-Wide Association Studies (GWAS)

Rilevazione polimorfismi genetici

Microarray

Es. Illumina HumanOmniExpress: ~700.000 varianti x 24 campioni 200 ng DNA

Rilevazione polimorfismi genetici

DNA-Seq: Next Generation Sequencing

AAAA

AA

GG

AA

GG

CCCC

CC

TTTT

CONTROLLO AFFETTO

Reference

Reads

CC

CC

AA

AA

Dimensione del genoma e numero di geni in diversi organismi

18S rRNA tree of life

Divergenza da antenati comuni con modificazioni

Yeast(Saccharomyces

cerevisiae)

Bacteria(Escherichia

coli)

Organismi modello della biologia

ATCGGCCACTTTCGCGATCA

Sequenza ancestrale

ATAGGCCACTTTCGCGATCA

ATAGGCCACTTTCGCGATTA

ATAGGGCACTTTCGCGATTA

ATAGGGCACTTT-GCGATTA

ATAGGGCACTTT-GCGATGA

ATCGGCCACTTTCGCGATCG

ATCGGCCACTTTCGTGATCG

ATCGGCCACGTTCGTGATCG

ATCGCCCACGTTCGCGATCG

ATTGCCCACGTTCGCGATCG

Sequenze omologhe

ATCGGCCACGTTCGCGATCG

Evoluzione nel tempo dell'informazione biologica

Omologia = condivisione di un ancestore comune

Evento di separazione

Separazione dei geni per speciazione

I geni hanno una storia evolutiva più complicata di quella degli organismi

MIOGLOBINA

-GLOBINA -GLOBINA

EMOGLOBINA

GLOBINA

ATCGGCCACTTTCGCGATCA

Sequenza ancestrale

ATAGGGCACTTT-GCGATGAATTGCCCACGTTCGCGATCG

ATAGGGCACTTT-GCGATGA** * *** ** *****

ATTGCCCACGTTCGCGATCG

Sequenze allineate

L'omologia è dedotta dall'allineamento

?

Osservazione

Ipotesi

Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp

Il “problema” della bioinformatica

Sequenza Struttura Funzione? ?

?

ORARIO DI LEZIONE

* Postazione fissa o personal laptopEsercitatore: Dott. Pietro Cravedi

Bioinformatica

Aula informatica polifunzionale, Torre* - Mercoledì 16:30 – 18:30

Aula B, Podere la Grande - Mercoledì 11:30 – 13:30

MODALITA' di ESAMEMODALITA' di ESAME

Bioinformatica

- Elaborato contenente una analisi bioinformatica originale di unGene/proteina. Formato: articolo scientifico.Consegna in data di appello: PDF e cartaceo

- Esame orale. Discussione sulla relazione e domande sulla teoria