Laboratorio di Statistica e Analisi Dati: Lezione...

Laboratorio di Statistica e Analisi Dati:Lezione 4

Tommaso C. & Marco G.

16 - 18 Novembre 2016

Controllo del flusso di esecuzione diun programma

In R esistono strutture di controllo specifiche per regolare il flussodi esecuzione di un programma:

Blocchi di istruzioni

Istruzioni condizionali

Istruzioni di looping

Sequenze e blocchi di istruzioni

Le istruzioni possono essere raggruppate insieme utilizzando leparentesi graffe. Una sequenza di istruzioni fra parentesi graffecostituisce un blocco

Un blocco non viene quasi mai usato da solo, ma in combinazionecon un’altra istruzione

x <- 4+2

z <- 4

## [1] 3

Sequenze e blocchi di istruzioni

x <- 4+2

z <- 4

## [1] 3

Differenze ?

x <- 4+2

z <- 4

## [1] 10

## [1] 3

Si, la valutazione delle singole istruzioni nel caso dei blocchi è di tipo lazy(rimandata al termine del blocco), questo comporta, per esempio, che

l’output dell’operazione x+z non sia visibile.

Istruzioni condizionali (IF)

x <- 6

if ( x %% 3 == 0 ){

x <- x + 6

} else {

## [1] 9

Istruzioni condizionali (IF) (cont.)

Sintassi:

Se l’istruzione in uno dei blocchi è unica le parentesi graffe possonoessere omesse.

Posso omettere il ramo else

x <- 120

if (x >= 100)

x <- x + 4

x <- x - 200

if(x<0)

x <- x + 2000

## [1] 124

N.B. Questo tipo di sintassi però è valida solo all’interno di un blocco

(potete provare ad incollare il codice senza le parentesi graffe)

Istruzioni di Loop

Esistono diverse forme di istruzioni di loop:

repeat

Tutte permettono di ripetere un blocco di istruzioni

Sintassi:

v = c(2,5,7,8)

for (i in v){

print(i)

## [1] 2

## [1] 5

## [1] 7

## [1] 8

N.B. La semantica di questo comando è pari al foreach di java, quindi difatto non avete una variabile i come contatore che si incrementa ad ogniripetizione

For (cont.)

Su cosa posso iterare?

Si può iterare su una lista di funzioni di R, quello che ottengo è lavalutazione di tutte le funzioni

Si può iterare su una lista di componenti di un dataframe

valore = 24

funzioni = list(sqrt, sum1, log, exp)

for (f in funzioni){

print(f(valore))

## [1] 4.898979

## [1] 25

## [1] 3.178054

## [1] 26489122130

Sintassi:

i <- 0

while (i < 2){

print (i)

i<-i+1

## [1] 0

## [1] 1

Repeat

Sintassi:

i <- 0

repeat{

print (i)

i <- i + 1

if (i >= 2) break;

## [1] 0

## [1] 1

N.B. La differenza principale con while è che posso eseguire del codiceprima di valutare la condizione (do while)

Cicli e prestazioniMolte delle funzioni di R su vettori operareno elemento per elemento

Utilizzare direttamente operazioni o funzioni vettorizzate è piùefficiente che effettuare le medesime operazioni utilizzando cicli for

Esempio calcolare il vettore sommma tra due vettori v e w. Useremosystem.time() per calcolare il tempo di esecuzione

v <- sample (1:400, 100000, replace = TRUE)

w <- sample (400:800, 10000, replace = TRUE )

system.time(for(e in 1:length(w)) v[e] <- v[e] + w[e] )

## user system elapsed

## 0.020 0.003 0.023

system.time(v <- v + w)

## user system elapsed

## 0.001 0.000 0.000

Definizione di funzioni

Ovviamente in R è possibile creare delle funzioni personalizzate usando laparola chiave function

Alla funzione è possibile passare dei parametri che vengono passati pervalore (se li modificate le modifiche non si propogano all’esterno)

Il corpo di una funzione è definito da un blocco e può restituire unvalore con la parola chiave return

Gli argomenti vengono separati da virgole, è possibile impostare deivalori di default usando gli uguali

# Definizione della funzione successore

succ <- function(x=0){

return(x+1)

Chiamare una funzione (opzione 1)Scrivere la funzione direttamente sull’interprete come nella slideprecedente e chiamarla usando il nome che le è stato assegnato

expY <- function(x=0,y){

return(yx)

expY(,3)

## [1] 1

expY(3,2)

## [1] 8

expY(y = 2, x = 3)

## [1] 8

N.B. La seconda e la terza chiamata sono assolutamente identiche, inexpY(3,2) la posizione del valore indica a quale parametro dellafunzione associarlo, in expY(y = 2, x = 3) il valore del parametroviene definito per nome

Chiamare una funzione (opzione 2)Scrivere su un file .R la vostra funzione e usare il comandosource("nomeFile.R") per importare il file

# esempioScript.R

expY <- function(x=0,y){

return(yx)

Chiamare una funzione (opzione 2)Scrivere su un file .R la vostra funzione e usare il comandosource("nomeFile.R") per importare il file

rm(list = ls())

source("esempioScript.R")

expY(3,2)

## [1] 8

Comandi sapply() e lapply()

In una delle slide precendenti abbiamo visto che è possibile ciclare su unalista di funzioni, ovvero applicare una dopo l’altra una serie di funzioni adun singolo valore. Qualora invece sia necessario applicare una singolafunzione a tutti i valori di un vettore/matrice/lista/datframe è possibileusare le funzioni lapply e sapply; mentre lapply restituisce unasempre una lista, sapply restituisce una matrice se applicato ad undataframe e un vettore altrimenti

In generale la loro esecuzione è più efficiente del corrispondente ciclofor

y <- sample(1:10, 2, replace=TRUE)

f <- function(el){

if(el%%2==0)

return(TRUE)

return(FALSE)

lapply(y, f)

## [[1]]

## [1] TRUE

## [[2]]

## [1] TRUE

sapply(y, f)

## [1] TRUE TRUE

N.B. lapply

Perché non applichiamo direttamente la funzione f sul vettore?

Il motivo sta nella condizione dell’if, infatti non è possibile inserirecome condizione un vettore di booleani

## Warning in if (el%%2 == 0) return(TRUE) else return(FALSE): the condition

## has length > 1 and only the first element will be used

## [1] TRUE

Esercizio 1

Usando le istruzioni viste oggi, scrivere le seguenti funzioni R e salvarlenel file mia_libreria.R

1. Calcolare la frequenza assoluta dei dati contenuti in un vettore(non usare table)

2. Calcolare la frequenza relativa dei dati contenuti in un vettore (nonusate table)

3. Calcolare la moda dei dati contenuti in un vettore (non usatetable)

N.B. Come ottenere una copia di un vettore senza duplicati

vector = c ("pippo", "pluto", "pluto", "paperino", "paperino", "pluto", "paperino", "paperino")

unique (vector)

## [1] "pippo" "pluto" "paperino"

Esercizio 1 (cont.)4. Calcolare la media campionaria dei dati contenuti in un vettore

usando le frequenze relative

5. Calcolare la covarianza campionaria di due vettori

6. Calcolare (senza usare quantile()) il percentile -esimo dei datiun vettore ( deve essere un parametro della funzione)

7. Calcolare l’indice di eterogeneità di Gini e Entropia normalizzatidei dati contenuti in un vettore

Esercizio 21. Scaricare il dataset reddito.csv

2. Importare il dataset creando un dataframe

3. Usare la funzione scritta in precendenza per calcolare Entropia eindice di Gini dei fattori StatoCivile e Nazione

4. Calcolare la moda dei due fattori

Esempio: passaggio per valore

foo <- function(x,y){

x <- x + y

print(paste("x dentro la funzione foo", x, sep = " "))

x <- 3

y <- 3

foo(x, y)

## [1] "x dentro la funzione foo 6"

## [1] 3

Esempio: superassegnamento

In R è possibile bypassare il passaggio per valore utilizzando il doppiosimbolo di minore: la variabile x viene modificata solo nell’ambienteda cui è stata effettuata la chiamata, non dentro la funzione; se nonviene trovata, viene creata e inizializzata

foo <- function(x,y){

x <<- x + y

print(paste("x dentro la funzione foo", x, sep = " "))

x <- 3

y <- 3

foo(x, y)

## [1] "x dentro la funzione foo 3"

## [1] 6

Questionario

Laboratorio di Statistica e Analisi Dati: Lezione...

Documents

Transcript of Laboratorio di Statistica e Analisi Dati: Lezione...

III MODULO “RESPONSABILITA’ ETICO - MaRSmastermars.it/private/materialeLezioni/1390041305040738900.pdf · • E importante per la bioetica la capacità di organizzare in forma

Il problema delle cadute accidentali in ospedalemastermars.it/private/materialeLezioni/1399722089057068300.pdf · e incontrollato del corpo da posizione sdraiata, seduta o eretta

Statistica Medica · 2020. 11. 24. · Corso di Statistica Medica Scaricare il materiale didattico da Moodle: Metodologia della Ricerca Statistica Medica 191ME-2 - STATISTICA MEDICA

Capitolo uno STATISTICA DESCRITTIVA BIVARIATAdida.fauser.edu/matetri/matematicarisorse/margheritavalsecchi/... · 1 Capitolo uno STATISTICA DESCRITTIVA BIVARIATA La statistica bidimensionale

Il consenso informato del paziente al trattamento sanitariomastermars.it/private/materialeLezioni/1386088445086015900.pdf · Il fondamento di liceità del trattamento medico-chirurgo

Statistica per l'impresa · 2020-05-18 · Statistica per l’impresa 8. Valutazione statistica delle prestazioni delle imprese ‘Statistica per l’Impresa’ (DEAMS) Giovanni Millo,

MECCANICA STATISTICA Classica Lezioni di meccanica statistica Lezioni di meccanica statistica 202002-2003/Files%20pdf/Statistica%20classica.pdf.

Analisi delle caratteristiche socio-demografiche - statistica statistica

Dopo Statistica I Libri - UniFII fondamenti della statistica sono trattati in due corsi: B000319 –Statistica I (9cfu), 1 semestre, Prof. Leonardo Grilli •Statistica descrittiva,

Università - Statistica - Manuale Di Statistica

LA METODOLOGIA DELLA RICERCA CLINICA Luciano M. …mastermars.it/private/materialeLezioni/1393073186021397200.pdf · consentire la mutua accettazione dei risultati delle sperimentazioni

Responsabilità civile - ingegneria.unipr.itingegneria.unipr.it/esamidistato/lez4.doc · Web viewScrive ancora Piero Pozzati in un suo saggio: “[...] attualmente, o in tempi relativamente

Statistica Inferenziale - Mozzanica Dispense SBIO/2016-2017 M… · Statistica Inferenziale L'inferenza statistica (o statistica inferenziale) è il procedimento per cui si inducono

La statistica ufficiale: il Sistan e l’Istat - unikore.it · La statistica ufficiale Si dice statistica ufficiale la produzione statistica contenuta nel programma statistico nazionale,

Lez4 storyboard

1 Nota Statistica , Versione 1palombo/didattica/AnalisiStatistica/Stat.pdf · 1.2 Statistica Descrittiva e Statistica Inferenziale La statistica si occupa dei procedimenti scienti

Il riconoscimento dei fattori di rischio. Associazione statistica vs associazione causale Associazione statistica: dipendenza statistica tra un determinante.

STATISTICA - agrariafree.altervista.orgagrariafree.altervista.org/appunti agraria/statistica/statistica1.pdf · 4 Scopo fondamentale della statistica è quello di aumentare la parte

CORSO DI MATEMATICA E BASI DI INFORMATICA E STATISTICA Dispense SBIO/2017-2018 MATEMATIC… · DI INFORMATICA E STATISTICA I ... • Statistica Descrittiva: Univariata • Statistica

Statistica 4 – inferenza – test di ipotesiishtar.df.unibo.it/.../Statistica-lez4-inferenza-testhp.pdfStatistica non parametrica – test del χ2 – preliminari • supponiamo