Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone: Dipartimento di...
-
Upload
concetto-pizzi -
Category
Documents
-
view
214 -
download
1
Transcript of Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone: Dipartimento di...
Introduzione al Linguaggio “R”
di Giorgio Valentini - Rev. 1 di Sergio Capone: ftp://ftp.itisvinci.com
Dipartimento di Informatica ITIS Leonardo da Vinci
Carpi 2011
1
Cos’è “R”?
• E’ un applicativo che dispone di un’ambiente specifico per l’elaborazione interattiva1 di dati
• È un ambiente di sviluppo integrato2 ed è un “software open source” reperibile su Internet. Quindi è un ambiente di risorse software integrate per la gestione e l’elaborazione di dati e per l’ulteriore loro rappresentazione grafica
• R si interfaccia verso programmi e/o moduli scritti anche con altri linguaggi
2
Caratteristiche generiche di “R”
• R è un linguaggio ad alto livello1 orientato alla analisi dei dati
• R è un linguaggio ad alto livello interpretato2 • R è dotato di un insiemi di operatori, ad alto
livello, per effettuare calcoli su array3 e matrici
• R supporta paradigmi di programmazione imperativa, object-oriented e funzionale4.
3
“R” per la bioinformatica
• R è uno dei linguaggi maggiormente utilizzati dalla comunità internazionale dei bioinformatici
• R permette di strutturare dati complessi ed eterogenei
• R dispone di library1 (librerie/biblioteche) specifiche per la bioinformatica
• R è il linguaggio utilizzato dal progetto internazionale open source Bioconductor* per la gestione ed elaborazione di dati genomici2 e proteomici3
4
L’utile storia di “R”• “R” deriva dal linguaggio “S”, progetto sviluppato da John
Chambers negli anni ‘80 presso i Bell Laboratory. • “S” ha consentito a John Chamber nel 1999 di ritirare il
prestigioso ACM Software Systems Award.• R è un progetto Open Source:
– Il progetto nasce inizialmente grazie a Ross Ihaka e Robert Gentleman dell’Università di Auckland (Nuova Zelanda)
– Attualmente è seguito da una comunità internazionale di ricercatori e sviluppatori sia in ambito accademico che industriale
– È un progetto incentrato sul web: www.r-project.org– Dispone di archivi software e documentazione: cran.r-
project.org/
5
Dove viene usato?
• Agricoltura, astrofisica, climatologia, ecologia e studi ambientali, economia, ingegneria elettrica e elettronica, finanza, genetica e bioinformatica, geografia, psicologia, scienze sociali
• … …
6
Dove prelevare “R”?
• Al CRAN (the Comprehensive R Archive Network) http://cran.r-project.org/
• Sono disponibili distribuzioni binarie per :– Linux per tutte le principali distribuzioni– Apple Macintosh e MacOS X dalla 8.6 e succ.– Windows dalla ver. 95 a Seven 32 e 64 bit– Unix (su diverse piattaforme hardware)
7
Risorse testuali
• Un corso introduttivo scaricabile dal web:W. Venables and D.M. Smith, An Introduction to R: http://cran.r-project.org/doc/manuals/R-intro.pdf . 2008
• Libri sulla programmazione “avanzata” in R:1) Robert Gentleman R Programming for Bioinformatics, CRC/Computer Science & Data Analysis Volume 12 , Chapman & Hall, 20082) J. Chambers Software for Data Analysis: Programming with R, Springer, 2008
8
Risorse per la bioinformatica
• Materiale didattico è alle pagine web del corso: “Linguaggi di Programmazione per la Bioinformatica”: http://homes.dsi.unimi.it/~valenti/LPBio0708.htm
• Un libro specifico sull’ utilizzo di R per la bioinformatica e Bioconductor:Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit, S. Bioinformatics and Computational Biology Solutions using R and Bioconductor, Springer, 2005
9