Esercitazione 1 - docenti-deps.unisi.itEsercitazione 1 6 Esercizio 5 Data la sequenza di intensità...

21
Esercitazione 1 1 Esercizio 1 Considerata la seguente distribuzione relativa allo sport principale praticato da 500 ragazzi e ragazze Sport Frequenza assoluta Basket 62 Calcio 182 Danza 28 Nuoto 75 Pallavolo 95 Tennis 58 500 si determini la distribuzione espressa mediante le frequenze relative, si costruisca il corrispondente grafico a nastri e si determini, se possibile: a) la moda, b) la mediana, c) la media Soluzione Sport Frequenza assoluta Basket 0.124 Calcio 0.364 Danza 0.056 Nuoto 0.150 Pallavolo 0.190 Tennis 0.116 1.000 a) La moda è la modalità “calcio”, come si nota anche dal grafico, mentre gli altri indici non possono essere calcolati per la natura della variabile 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 Danza Tennis Basket Nuoto Pallavolo Calcio frequenza relativa sport

Transcript of Esercitazione 1 - docenti-deps.unisi.itEsercitazione 1 6 Esercizio 5 Data la sequenza di intensità...

  • Esercitazione 1

    1

    Esercizio 1 Considerata la seguente distribuzione relativa allo sport principale praticato da 500 ragazzi e ragazze

    Sport Frequenza assoluta Basket 62 Calcio 182 Danza 28 Nuoto 75 Pallavolo 95 Tennis 58 500

    si determini la distribuzione espressa mediante le frequenze relative, si costruisca il corrispondente grafico a nastri e si determini, se possibile: a) la moda, b) la mediana, c) la media Soluzione

    Sport Frequenza assoluta Basket 0.124 Calcio 0.364 Danza 0.056 Nuoto 0.150 Pallavolo 0.190 Tennis 0.116 1.000

    a) La moda è la modalità “calcio”, come si nota anche dal grafico, mentre gli altri indici non possono essere calcolati per la natura della variabile

    0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4

    Danza

    Tennis

    Basket

    Nuoto

    Pallavolo

    Calcio

    frequenza relativa

    spo

    rt

  • Esercitazione 1

    2

    Esercizio 2 Considerata la seguente sequenza di modalità relative a una variabile qualitativa ordinabile

    A B B C D A A B A A B B C B C D si determini: a) la distribuzione di frequenza espressa mediante frequenze assolute e relative e le corrispondenti frequenze cumulate (sia assolute sia relative), b) si disegni il grafico a barre utilizzando le frequenze assolute, c) si individui la moda

    Soluzione a)

    X Freq. ass. Freq. rel. Freq. ass. cum. Freq. rel. cum.

    A 5 0.3125 5 0.3125

    B 6 0.3750 11 0.6875

    C 3 0.1875 14 0.8750

    D 2 0.1250 16 1.0000

    16 1.0000

    b)

    c) La moda corrisponde a B

  • Esercitazione 1

    3

    Esercizio 3 Considerata la sequenza dei valori della variabile “numero di smartphone” rilevata su 4 famiglie

    3 4 1 4 si determini: a) la moda, b) la mediana, c) la media, d) la varianza Soluzione a) La moda è 4 b) Una volta ordinata la serie dall’intensità più piccola alla più grande

    1 3 4 4 si determina il posto della mediana che risulta pari a ⌈4 × 0.5⌉ = 2 per cui x0.5=3 c)

    �̅� =3 + 4 + 1 + 4

    4= 3

    d) Il momento ordinario del secondo ordine è pari a

    𝑚2 =9 + 16 + 1 + 16

    4= 10.5

    per cui la varianza risulta 𝑠2 = 10.5 − 32 = 1.5

  • Esercitazione 1

    4

    Esercizio 4 Data la seguente sequenza di intensità relative a una variabile quantitativa discreta

    -2 -1 0 0 2 5 0 -1

    a) si determini la distribuzione di frequenza e si disegni il grafico ad aste corrispondente utilizzando le frequenze relative

    Si calcoli inoltre: b) la media, c) l’ampiezza del campo di variazione, d) il primo quartile, e) la varianza.

    Soluzione a) La distribuzione di frequenza risulta

    X Frequenza assoluta Frequenza relativa

    -2 1 0.125

    -1 2 0.250

    0 3 0.375

    2 1 0.125

    5 1 0.125

    8 1.000

    mentre il grafico corrispondente assume la forma riportata nella figura successiva

  • Esercitazione 1

    5

    b) La media è pari a

    �̅� =−2 − 1 × 2 + 2 + 5

    8= 0.375

    c) L’ampiezza del campo di variazione è dato da 5-(-2) =7 d) Il primo quartile occupa il posto ⌈8 × 0.25⌉ = 2 per cui corrisponde all’intensità -1 e) Il momento ordinario del secondo ordine è pari a

    𝑚2 =4 + 1 × 2 + 4 + 25

    8= 4.375

    per cui la varianza risulta

    𝑠2 = 4.375 − 0.3752 =4.234375

    0

    0,05

    0,1

    0,15

    0,2

    0,25

    0,3

    0,35

    0,4

    -3 -2 -1 0 1 2 3 4 5 6

    freq

    uen

    za r

    elat

    iva

    X

  • Esercitazione 1

    6

    Esercizio 5 Data la sequenza di intensità relative a una variabile quantitativa continua

    1.6 0.4 1.4 1.1 -0.1 0.2 0.6 0.9 -1.6 -0.5 1.3 0.0 -0.2 0.9 0.3 0.1 -0.8 1.9 1.4 -0.5

    a) si determini la distribuzione di frequenza nelle classi

    (-2 − 0], (0 − 1], (1 − 2] calcolando sia le frequenze assolute sia le frequenze relative b) si disegni l’istogramma. Sulla distribuzione in classi si calcoli: c) la classe modale, d) la media, e) la deviazione standard, f) l’indice 𝑎3 di asimmetria Soluzione a) La distribuzione in classi è riportata nella tabella successiva

    X Frequenza assoluta Frequenza relativa

    -2 − 0 7 0.35

    0 − 1 7 0.35

    1 − 2 6 0.30

    20 1.00

    b) Per disegnare l’istogramma occorre calcolare la densità di frequenza associata a ciascuna classe. I suoi valori sono riportati nella tabella successiva

    X Densità

    -2 − 0 0.175

    0 − 1 0.350

    1 − 2 0.300

  • Esercitazione 1

    7

    c) La classe modale è la seconda: (0, 1], in quanto è questa la classe a cui è associata la densità di frequenza massima

    d) La media è data da

    �̅� = −1 × 0.35 + 0.5 × 0.35 + 1.5 × 0.3 = 0.275

    e) Il secondo momento ordinario corrisponde a

    𝑚2 = 1 × 0.35 + 0.25 × 0.35 + 2.25 × 0.3 = 1.1125

    La varianza è pari quindi a 1.1125-0.2752 = 1.036875 La deviazione standard, approssimata a 6 cifre decimali, risulta

    𝑠 =1.018271

    f) Per calcolare l’indice di asimmetria conviene calcolare gli scarti elevati al cubo e poi farne la media. La tabella successiva riporta gli elementi utili ai fini del calcolo

    0

    0,05

    0,1

    0,15

    0,2

    0,25

    0,3

    0,35

    0,4

    -3 -2 -1 0 1 2 3

    den

    sità

    X

  • Esercitazione 1

    8

    Valori centrali Scarti Scarti al cubo Frequenza relativa

    -1 -1.275 -2.072672 0.35

    0 0.225 0.011391 0.35

    1 1.225 1.838266 0.30

    1.00

    Dai dati riportati nella tabella precedente si ottiene �̅�3 = −2.072672 × 0.35 + 0.011391 × 0.35 + 1.838266 × 0.3 =

    = −0.169969

    Per cui l’indice di asimmetria è pari a

    𝑎3 =−0.169969

    1.0182713≈ −0.16098

    La distribuzione presenta quindi una lieve asimmetria negativa, come si nota anche dalla forma dell’istogramma

  • Esercitazione 1

    9

    Esercizio 6 Considerate 50 unità statistiche su cui la variabile di interesse X presenta la distribuzione riportata nella tabella seguente

    Determinazioni Frequenza relativa 0 0.2 1 0.5 2 0.3

    si determini: a) la moda, b) i tre quartili, c) la media, d) la deviazione standard Soluzione a) la moda è 1 c) la media è pari a �̅� = 0×0.2 + 1×0.5 + 2×0.3 = 1.1 d) il momento ordinario di ordine 2 risulta m2 = 1×0.5 + 22×0.3 = 1.7 per cui la varianza è pari a 𝑠𝑥

    2 = 1.7 – 1.12 = 0.49 e 𝑠𝑥 = 0.7 b) Per determinare i quartili è necessario calcolare le frequenze assolute cumulate. Dai dati della tabella si ottiene

    Determinazioni Frequenza assoluta Frequenza assoluta cumulata 0 0.2×50=10 10 1 0.5×50=25 35 2 0.3×50=15 50

    x0.25 occupa il posto ⌈50 × 0.25⌉ = ⌈12.5⌉=13 per cui x0.25=1 x0.5 occupa il posto ⌈50 × 0.5⌉ = ⌈25⌉=25 per cui x0.5=1 x0.75 occupa il posto ⌈50 × 0.75⌉ = ⌈37.5⌉=38 per cui x0.75=2

  • Esercitazione 1

    10

    Esercizio 7 Date le seguenti informazioni relative a una variabile continua X

    Classi Frequenza

    -3 − -1 15

    -1 − 1 15 1 – 5 20

    50 Se ne disegni l’istogramma e si calcoli: a) la classe modale, b) la media, c) il momento ordinario di ordine 2, d) la varianza, e) il coefficiente di variazione Soluzione Per il calcolo della moda e per disegnare l’istogramma occorre calcolare la densità associata a ciascuna classe, ottenendo i valori riportati nell’ultima colonna della tabella successiva

    Classi Frequenza relativa

    densità

    -3 − -1 0.3 0.15

    -1 − 1 0.3 0.15 1 – 5 0.4 0.10

    1.0 Dalla tabella risulta che a) Esistono due classi modali: (-3, -1] e (-1, 1] L’istogramma assume la forma riportata nella figura successiva

  • Esercitazione 1

    11

    b) La media risulta

    �̅� =−2 × 15 + 0 × 15 + 3 × 20

    50= 0.6

    c) Il momento ordinario di ordine 2 è pari a

    𝑚2 =4 × 15 + 0 × 15 + 9 × 20

    50= 4.8

    d) La varianza è data quindi da

    𝑠2 = 4.8 − 0.62 = 4.44 e) Il CV non può essere calcolato perché la variabile assume valori negativi

    0

    0,05

    0,1

    0,15

    0,2

    -4 -3 -2 -1 0 1 2 3 4 5 6

    densità

    X

  • Esercitazione 1

    12

    Esercizio 8 Considerata la seguente sequenza di valori,

    -1 -2 -2 3 4 0 0 1

    si determini: a) la moda, b) i tre quartili, c) il rango interquartile, d) la media, e) la varianza Soluzione La sequenza ordinata è

    -2 -2 -1 0 0 1 3 4

    a) esistono due mode che corrispondono ai valori -2 e 0 b) x0.25 occupa il posto ⌈8 × 0.25⌉ = ⌈2⌉=2 per cui x0.25=-2

    x0.5 occupa il posto ⌈8 × 0.5⌉ = ⌈4⌉=4 per cui x0.5=0 x0.75 occupa il posto ⌈8 × 0.75⌉ = ⌈6⌉=6 per cui x0.75=1

    c) Il rango interquartile è Wx = 1-(-2) = 3 d) La media è data da

    �̅� =−2 × 2 − 1 + 1 + 3 + 4

    8=

    3

    8= 0.375

    e) Il secondo momento dall’origine è pari a

    𝑚2 =4 × 2 + 1 × 2 + 9 + 16

    8=

    35

    8= 4.375

    per cui la varianza è uguale a

    𝑠2 =35

    8−

    9

    64= 4.234375

  • Esercitazione 1

    13

    Esercizio 9 Data la seguente distribuzione in classi relativa a una variabile continua X

    Classi Frequenza assoluta cumulata

    -5 − -3 4

    -3 − -1 6 -1 – 3 10

    si rappresenti graficamente tale distribuzione e si determini: a) la classe modale, b) la media, c) il secondo momento centrale. Soluzione Occorre innanzitutto calcolare le frequenze assolute e le densità, che assumono i valori contenuti nella seconda e terza colonna della tabella successiva

    Classi Frequenza assoluta Frequenza relativa densità

    -5 − -3 4 0.4 0.2

    -3 − -1 2 0.2 0.1 -1 – 3 4 0.4 0.1

    10 1.0 L’istogramma assume la forma riportata nella figura successiva

    0

    0,05

    0,1

    0,15

    0,2

    0,25

    -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6

    densità

    X

  • Esercitazione 1

    14

    a) La classe modale corrisponde all’intervallo (-5, -3] b) La media è pari a

    �̅� = −4 × 0.4 − 2 × 0.2 + 1 × 0.4 = −1.6 c) Il secondo momento dall’origine è uguale a

    𝑚2 = 16 × 0.4 + 4 × 0.2 + 1 × 0.4 = 7.6 Per cui il secondo momento centrale (ossia la varianza) risulta

    �̅�2 = 𝑠2 = 7.6 − (−1.6)2 = 5.04

  • Esercitazione 1

    15

    Esercizio 10 I dipendenti di un’azienda commerciale risultano distribuiti come riportato nelle prime due colonne della tabella successiva. La terza colonna riporta invece lo stipendio medio pro-capite lordo annuo

    Frequenza assoluta Stipendio medio annuo (in euro)

    Dirigente 1 53000 Capo Ufficio 3 32500 Impiegato 14 28200 Operaio 27 23300 Manovale 30 15800

    Per la variabile stipendio medio annuo si vuole calcolare: a) la moda, b) i tre quartili, c) la media Soluzione a) La moda della variabile stipendio medio annuo è 15800, in quanto è questo il valore a cui è associata la frequenza massima b) Per determinare i tre quartili occorre ordinare i valori della variabile e calcolare le frequenze cumulate corrispondenti

    Stipendio medio annuo (in euro)

    Frequenza assoluta Frequenza assoluta cumulata

    15800 30 30 23300 27 57 28200 14 71 32500 3 74 53000 1 75

    I posti dei tre quartili risultano rispettivamente uguali a 19, 38 e 57, per cui risulta x0.25=15800, x0.5=23300, x0.75=23300 c) La media, infine, risulta

    �̅� =1

    75× (15800 × 30 + 23300 × 27 + ⋯ ) = 21978. 6̅

  • Esercitazione 1

    16

    Esercizio 11 Data la seguente sequenza di osservazioni relativa a una variabile quantitativa

    discreta X

    -1 0 1 2 -3 -2 4 3 1 5

    si determini: 1) la moda, 2) la mediana, 3) la media, 4) l’ampiezza del campo di variazione, 5) la differenza interquartile, 6) la varianza, 7) il coefficiente di variazione. Si disegni inoltre il boxplot

    Soluzione La sequenza ordinata risulta

    -3 -2 -1 0 1 1 2 3 4 5

    1) La moda corrisponde all’intensità 1

    2) La mediana occupa il 5°posto, per cui x0.5=1

    3) �̅�=1

    4) L’ampiezza del campo di variazione è 5-(-3)=8

    5) Il terzo quartile occupa l’8°posto, per cui x0.75=3 Il primo quartile occupa il 3°posto, per cui x0.25=-1 La differenza interquartile è quindi pari a x0.75-x0.25= Wx =4

    6) Il momento ordinario del secondo ordine risulta 𝑚2𝑥 = 7, per cui la

    varianza è 𝑠𝑥2 =6

    7) Il CV non può essere calcolato perché la variabile assume valori negativi

    Il rettangolo che compone il boxplot ha la base inferiore in corrispondenza di

    x0.25=-1 e la base superiore in corrispondenza di x0.75=3

  • Esercitazione 1

    17

    Il VAI corrisponde alla più piccola osservazione ≥ x0.25−Wx = −1−1.5×4 = −7

    Quindi il VAI è pari a -3

    Il VAS corrisponde alla più grande osservazione ≤ x0.75 + Wx = +1.5×4 = 9

    Quindi il VAS è pari a 5

    Il boxplot assume quindi la forma seguente, in cui il simbolo corrispondente al

    rombo indica la media aritmetica (che coincide con la mediana)

  • Esercitazione 1

    18

    Esercizio 12 Data la sequenza di osservazioni dell’esercizio precedente si consideri la

    variabile Y=4 - 2X e se ne determini: 1) la moda, 2) la mediana, 3) la media, 4)

    l’ampiezza del campo di variazione, 5) il rango interquartile, 6) la varianza.

    Sapendo inoltre che per la variabile X risulta 𝑎3𝑥 = 0 e 𝑎4𝑥 = 1.96̅ si determini

    7) l’indice di asimmetria 𝑎3𝑦 , 8) l’indice di curtosi 𝑎4𝑦 per la variabile Y.

    Soluzione La sequenza ordinata della variabile Y risulta

    -6 -4 -2 0 2 2 4 6 8 10

    1) La moda è 2

    2) La mediana occupa il 5° posto, per cui y0.5=2 3) la media è �̅� = 4 - 2�̅� = 2

    4) L’ampiezza del campo di variazione corrisponde alla differenza 10-(-6)=16

    5) Il terzo quartile occupa l’8° posto, per cui y0.75=6;

    mentre il primo quartile occupa il 3° posto, per cui y0.25=-2;

    La differenza interquartile (o rango interquartile) è y0.75-y0.25=8

    6) La varianza è 𝑠𝑦2 = (−2)2𝑠𝑥

    2 =24

    7) In base alla proprietà di una trasformazione lineare, tenendo presente che

    Y=4 - 2X, per cui il segno di b è negativo, l’indice di asimmetria per la Y risulta

    𝑎3𝑦 = −𝑎3𝑥 = 0

    8) In base alla proprietà di una trasformazione lineare risulta 𝑎4𝑦 = 𝑎4𝑥 per

    qualsiasi valore di 𝑎 e di b (con b≠0), per cui

    𝑎4𝑦 = 𝑎4𝑥 = 1.96̅

  • Esercitazione 1

    19

    Esercizio 13

    Date le seguenti distribuzioni delle età dei dipendenti di una cooperativa

    classificati per sesso

    Maschi Femmine

    Età ni Età ni 19 2 18 1 20 6 25 2 21 3 26 2 22 1 28 2 23 1 29 1 25 1 30 2 28 1 31 3 30 1 32 1 35 1 33 2 37 1 16 18

    disegnare i due boxplot corrispondenti

    Soluzione Conviene calcolare le frequenze assolute cumulate

    Maschi Femmine

    Età ni Ni Età ni Ni 19 2 2 18 1 1 20 6 8 25 2 3 21 3 11 26 2 5 22 1 12 28 2 7 23 1 13 29 1 8 25 1 14 30 2 10 28 1 15 31 3 13 30 1 16 32 1 14 35 1 17 33 2 16 37 1 18 16 18

  • Esercitazione 1

    20

    Maschi:

    I posti occupati dai 3 quartili sono, nell’ordine, il 5°, il 9° e il 14°

    Per cui risulta x0.25= 20, x0.5= 21, x0.75= 25.

    Per il calcolo dei valori adiacenti, risulta

    x0.25 − Wx = 20 – 1.5×(25-20) = 12.5,

    x0.75 + Wx = 25 + 1.5×(25-20) = 32.5,

    VAI = 19 in quanto è la più piccola osservazione ≥ 12.5

    VAS = 30 in quanto è la più grande osservazione ≤ 32.5

    Femmine:

    I posti occupati dai 3 quartili sono, nell’ordine, il 4°, l’8° e il 12°

    Per cui risulta x0.25= 26, x0.5= 29, x0.75= 31.

    Per il calcolo dei valori adiacenti, risulta

    x0.25 − Wx = 26 – 1.5×(31-26) = 18.5,

    x0.75 + Wx = 31 + 1.5×(31-26) = 38.5,

    VAI = 25 in quanto è la più piccola osservazione ≥ 18.5

    VAS = 33 in quanto è la più grande osservazione ≤ 38.5

    I due boxplot assumono la forma indicata nel grafico successivo, dal quale si

    nota che

    - l’ordine di grandezza dell’età è minore per gli individui di sesso maschile

    - la variabilità dell’età è più o meno la stessa per entrambi i sessi

    - nei maschi l’età mostra un’asimmetria positiva e nelle femmine

    un’asimmetria negativa.

  • Esercitazione 1

    21

    - Nei maschi sono presenti due valori anomali che corrispondono agli

    individui di età più elevata, mentre nelle femmine c’è un solo valore

    anomalo che corrisponde all’unità con la minore età