Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...
-
Upload
trinhkhanh -
Category
Documents
-
view
229 -
download
2
Transcript of Bioinformatica - biochimica.unipr.itbiochimica.unipr.it/biocomp/bioinformatica_introduzione.pdf ·...
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Bioinformatica
:studio dei problemi biologici attraverso le metodologie dell'informatica
•Viceversa: Biocomputazione, algoritmi genetici, reti neurali...
:metodi informatici di applicazione generale che si ispirano ai principi della biologia
Sinomimi: biochimica computazionale, biologia molecolare computazionale
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Scopi della bioinformatica
Gestione dei dati biologicimantenimento, organizzazione, distribuzione...
Analisi dei dati biologiciinferenze e predizioni sul significato biologico
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Oggetti della bioinformatica
Sequenze di acidi nucleici
Sequenze di proteine
Strutture di macromolecole
>P25032 MASSSSATSGDDRPPAAGGGTPAQAHAEWAASMHAYYAAAASAAGHPYAAWPLPPQAQQHGLVAAGAGAAYGAGAVPHVPPPPAGTRHAHASMAAGVPYMA
>gi|8886401|gb|AF162269.1| CCCACTCCTCCATCTCACAAACACTTCTCTATACCCAACAATCCCTTTTACAATCCCTGCTCATTTAGTCAAAATGGTCAAGATTGCTGCTATCATCCTCCTCATGGGCATTCTCGCCAATGCTGCCGCCATCCCTGTCATTTCAACACCCAAATTACAGAGCCAACCGGCGAGGGCGACCGTGGGGACGTGGCCGAC
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Sequencing costs have dropped several orders of magnitude, from $10 per finished base in 1990 to today's cost, which are estimated at about 5 or 6 cents per base for finished sequence and about 2 to 4 cents for draft sequence.
The Scientist 17, 2003
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Flusso dell'informazione negli esseri viventi
DNA RNA Proteine
Sequenza Struttura Funzione
Importanza della bioinformatica
Quantità di informazione
Valore dell'informazione
Esattezza e completezza dell'informazione
Genomica
“Genoma” indica l'insieme del materiale genetico trasmissibile di un essere vivente (Hans Winkler, 1920).
La genomica è la disciplina che studia i genomi completi.
Trascrittomica
- Studio dei profili di espressione (quantità di mRNA) dei geni in una cellula o tessuto
- Techniche utilizzate:● Microarray● RNA-Seq
- E' usata tipicamente per confrontare cellule in diverse condizioni (es. 'normale' vs 'tumorale')
Kidney Liver Intestine Brain Placenta0
1
2
3
4
5
6
Exp
ress
ion
(Ti
ssu
e/ K
idn
ey)
Kidney Liver Intestine Brain Placenta0
0.2
0.4
0.6
0.8
1
1.2
Exp
ress
ion
(Ti
ssu
e/ K
idn
ey)
Proteomica
- Separazione attraverso gel bidimensionale delle proteine presenti nella cellula
- Rilevazione delle proteine attraverso coloranti. Confronto tra diverse condizioni e individuazione delle macchie differenziali
- Sequenziamento parziale attraverso spettrometria di massa
- Identificazione tramite confronto con un database di sequenze
Punto isoelettrico
Massa
Homo sapiens: 3 * 109 b.p., ~30.000 geni
Il Genoma Umano
…e le sue varianti
CONTROLLO AFFETTI
Varianti genetiche (polimorfismi)
(e.g. non-gout) (e.g. gout)
Genome-Wide Association Studies (GWAS)
Rilevazione polimorfismi genetici
Microarray
Es. Illumina HumanOmniExpress: ~700.000 varianti x 24 campioni 200 ng DNA
Rilevazione polimorfismi genetici
DNA-Seq: Next Generation Sequencing
AAAA
AA
GG
AA
GG
CCCC
CC
TTTT
CONTROLLO AFFETTO
Reference
Reads
CC
CC
AA
AA
Dimensione del genoma e numero di geni in diversi organismi
18S rRNA tree of life
Divergenza da antenati comuni con modificazioni
Yeast(Saccharomyces
cerevisiae)
Bacteria(Escherichia
coli)
Organismi modello della biologia
ATCGGCCACTTTCGCGATCA
Sequenza ancestrale
ATAGGCCACTTTCGCGATCA
ATAGGCCACTTTCGCGATTA
ATAGGGCACTTTCGCGATTA
ATAGGGCACTTT-GCGATTA
ATAGGGCACTTT-GCGATGA
ATCGGCCACTTTCGCGATCG
ATCGGCCACTTTCGTGATCG
ATCGGCCACGTTCGTGATCG
ATCGCCCACGTTCGCGATCG
ATTGCCCACGTTCGCGATCG
Sequenze omologhe
ATCGGCCACGTTCGCGATCG
Evoluzione nel tempo dell'informazione biologica
•
Omologia = condivisione di un ancestore comune
Evento di separazione
Separazione dei geni per speciazione
I geni hanno una storia evolutiva più complicata di quella degli organismi
MIOGLOBINA
-GLOBINA -GLOBINA
EMOGLOBINA
GLOBINA
ATCGGCCACTTTCGCGATCA
Sequenza ancestrale
ATAGGGCACTTT-GCGATGAATTGCCCACGTTCGCGATCG
ATAGGGCACTTT-GCGATGA** * *** ** *****
ATTGCCCACGTTCGCGATCG
Sequenze allineate
L'omologia è dedotta dall'allineamento
?
Osservazione
Ipotesi
Riccardo Percudani 1/10/2015File: bioinformatica_introduzione.odp
Il “problema” della bioinformatica
Sequenza Struttura Funzione? ?
?
ORARIO DI LEZIONE
* Postazione fissa o personal laptopEsercitatore: Dott. Pietro Cravedi
Bioinformatica
Aula informatica polifunzionale, Torre* - Mercoledì 16:30 – 18:30
Aula B, Podere la Grande - Mercoledì 11:30 – 13:30
MODALITA' di ESAMEMODALITA' di ESAME
Bioinformatica
- Elaborato contenente una analisi bioinformatica originale di unGene/proteina. Formato: articolo scientifico.Consegna in data di appello: PDF e cartaceo
- Esame orale. Discussione sulla relazione e domande sulla teoria