I dati e la statistica nel mondo open source: InsulaR

Post on 12-Jul-2015

841 views 0 download

Transcript of I dati e la statistica nel mondo open source: InsulaR

I dati e la statisticanel mondo open source:

InsulaR

Davide Massiddadavide.massidda@gmail.com

www.insular.it

Cagliari, Open Data Day, 22 febbraio 2014

I dati

Consentono di digitalizzare la realtà, descrivendo un fenomeno attraverso un codice numerico (e non solo).

Veicolano informazioni, che però necessitano di opportune tecniche e adeguati strumenti per essere estratte.

La statistica

È quella disciplina che fa da ponte tra i dati e l'informazione.

Statistica descrittivaSintesi dei dati attraverso indici numerici e visualizzazioni grafiche per descrivere un fenomeno.

Statistica inferenzialeCerca di scoprire cosa regola la variabilità di un fenomeno, mettendolo in relazioni con altri fenomeni.

L'analisi statistica semplifica la realtà per renderla comprensibile: si scarta informazione per ottenere informazione!

Dai numeri alla conoscenza

Statistica

Dai numeri alla conoscenza

Statistica

Data scientist

Cosa è un data scientist?

Un atleta in grado di nuotare in mezzo ai dati.

Un artista creativo, in grado di intrecciare dati preesistenti per trovare soluzioni originali a un problema.

Un tecnico in grado di utilizzare gli strumenti informatici e statistici per l'utilizzo dei dati.

Un esperto conoscitore del fenomeno, capace di guidare lo studio del dato e individuare le strade più fertili su cui orientare il lavoro.

Un esploratore dei numeri.

Quali strumenti di lavoro?

Al data scientist non è chiesto di analizzare dati ma di creare con i dati.

A un artista servono gli strumenti per potersi esprimere: software flessibili, personalizzabili e che consentano di produrre qualcosa di nuovo.

Dato che, come tutti gli artisti, il data scientist è sempre al verde, questi strumenti dovrebbero essere gratuiti.

www.r­project.org

R è la risposta

R è la risposta

R è la risposta

R è la risposta

R è la risposta

R è la risposta

R in azione

Agitare bene (l'utente) prima dell'uso

A differenza di altri software, R richiede all’utente un adeguato addestramento sia informatico che statistico (uso consapevole della metodologia d’analisi).

R in Sardegna?

In un mondo dove le risorse economiche sono sempre più esigue, ma la richiesta di utilizzo dei dati è sempre maggiore, R può rappresentare una grande risorsa per tutti coloro che lavorano con i dati:

● Università● Pubbliche amministrazioni● Aziende● Professionisti

Nonostante questo, R in Sardegna è ancora poco diffuso.

Nel 2013 nasce InsulaR

È per colmare questa lacuna che nasce InsulaR, la prima comunità cagliaritana di utilizzatori di R.

www.insular.it

Cosa è InsulaR?

InsulaR è un R User Group (RUG).

RUG: gruppi di utilizzatori di R a carattere locale che mettono in connessione persone geograficamente vicine.

Il punto di partenza è il web, dove nascono delle relazioni sociali che nel mondo reale possono sfociare in collaborazioni e rapporti professionali.

InsulaR nasce da un'idea di alcuni studenti dei corsi di laurea di psicologia di Cagliari interessati a imparare a utilizzare R.

Obiettivi del gruppo

● Condividere la conoscenza sull’uso di R, sia all’interno del gruppo che all’esterno.

● Creare una rete di utilizzatori di R nell’Isola.

● Permettere a persone capaci di emergere e di farsi conoscere.

● Divulgare dati e software con licenze aperte.

● Creare delle opportunità di lavoro intorno a R!

I canali per la divulgazione

Internet● Blog (tutorial, videotutorial)● Forum● Social network (Facebook, Twitter)

Face-to-face● Meetings● Corsi di R

www.insular.it

davide.massidda@gmail.com

@DavideMassidda