Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone: Dipartimento di...

9
Introduzione al Linguaggio “R” di Giorgio Valentini - Rev. 1 di Sergio Capone: ftp://ftp.itisvinci.com Dipartimento di Informatica ITIS Leonardo da Vinci Carpi 2011 1

Transcript of Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone: Dipartimento di...

Page 1: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Introduzione al Linguaggio “R”

di Giorgio Valentini - Rev. 1 di Sergio Capone: ftp://ftp.itisvinci.com

Dipartimento di Informatica ITIS Leonardo da Vinci

Carpi 2011

1

Page 2: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Cos’è “R”?

• E’ un applicativo che dispone di un’ambiente specifico per l’elaborazione interattiva1 di dati

• È un ambiente di sviluppo integrato2 ed è un “software open source” reperibile su Internet. Quindi è un ambiente di risorse software integrate per la gestione e l’elaborazione di dati e per l’ulteriore loro rappresentazione grafica

• R si interfaccia verso programmi e/o moduli scritti anche con altri linguaggi

2

Page 3: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Caratteristiche generiche di “R”

• R è un linguaggio ad alto livello1 orientato alla analisi dei dati

• R è un linguaggio ad alto livello interpretato2 • R è dotato di un insiemi di operatori, ad alto

livello, per effettuare calcoli su array3 e matrici

• R supporta paradigmi di programmazione imperativa, object-oriented e funzionale4.

3

Page 4: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

“R” per la bioinformatica

• R è uno dei linguaggi maggiormente utilizzati dalla comunità internazionale dei bioinformatici

• R permette di strutturare dati complessi ed eterogenei

• R dispone di library1 (librerie/biblioteche) specifiche per la bioinformatica

• R è il linguaggio utilizzato dal progetto internazionale open source Bioconductor* per la gestione ed elaborazione di dati genomici2 e proteomici3

4

Page 5: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

L’utile storia di “R”• “R” deriva dal linguaggio “S”, progetto sviluppato da John

Chambers negli anni ‘80 presso i Bell Laboratory. • “S” ha consentito a John Chamber nel 1999 di ritirare il

prestigioso ACM Software Systems Award.• R è un progetto Open Source:

– Il progetto nasce inizialmente grazie a Ross Ihaka e Robert Gentleman dell’Università di Auckland (Nuova Zelanda)

– Attualmente è seguito da una comunità internazionale di ricercatori e sviluppatori sia in ambito accademico che industriale

– È un progetto incentrato sul web: www.r-project.org– Dispone di archivi software e documentazione: cran.r-

project.org/

5

Page 6: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Dove viene usato?

• Agricoltura, astrofisica, climatologia, ecologia e studi ambientali, economia, ingegneria elettrica e elettronica, finanza, genetica e bioinformatica, geografia, psicologia, scienze sociali

• … …

6

Page 7: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Dove prelevare “R”?

• Al CRAN (the Comprehensive R Archive Network) http://cran.r-project.org/

• Sono disponibili distribuzioni binarie per :– Linux per tutte le principali distribuzioni– Apple Macintosh e MacOS X dalla 8.6 e succ.– Windows dalla ver. 95 a Seven 32 e 64 bit– Unix (su diverse piattaforme hardware)

7

Page 8: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Risorse testuali

• Un corso introduttivo scaricabile dal web:W. Venables and D.M. Smith, An Introduction to R: http://cran.r-project.org/doc/manuals/R-intro.pdf . 2008

• Libri sulla programmazione “avanzata” in R:1) Robert Gentleman R Programming for Bioinformatics, CRC/Computer Science & Data Analysis Volume 12 , Chapman & Hall, 20082) J. Chambers Software for Data Analysis: Programming with R, Springer, 2008

8

Page 9: Introduzione al Linguaggio R di Giorgio Valentini - Rev. 1 di Sergio Capone:  Dipartimento di Informatica ITIS Leonardo da Vinci.

Risorse per la bioinformatica

• Materiale didattico è alle pagine web del corso: “Linguaggi di Programmazione per la Bioinformatica”: http://homes.dsi.unimi.it/~valenti/LPBio0708.htm

• Un libro specifico sull’ utilizzo di R per la bioinformatica e Bioconductor:Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit, S. Bioinformatics and Computational Biology Solutions using R and Bioconductor, Springer, 2005

9