Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014.

99
Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014

Transcript of Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014.

  • Slide 1
  • Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE Dicembre 2014
  • Slide 2
  • Statistica descrittiva Statistica descrittiva e inferenziale Distribuzioni di frequenza Rappresentazioni grafiche Indici di sintesi e di dispersione
  • Slide 3
  • I termine statistica ha una radice italiana e cio deriva dalla parola STATO. Questa definizione apparve per la prima volta nel 1589 ad opera di Ghislin, che la indic come descrizione delle qualit che caratterizzano gli elementi che compongono uno Stato. Nella sua prima eccezione, quindi, la statistica principalmente lo studio di informazioni di interesse nazionale. Solo in un secondo momento, questa disciplina cominci ad allargare i propri confini e ad assumere il significato pi generale di analisi quantitativa dei fenomeni collettivi che hanno attitudine a variare.
  • Slide 4
  • La statistica lo studio dei fenomeni collettivi (ossia di quei fenomeni che riguardano una pluralit di soggetti), che hanno attitudine a variare. Essa si occupa di raccogliere ed analizzare dati, relativi ad un gruppo di persone (studenti di una scuola, elettori di una regione, abitanti di un quartiere,) o oggetti (automobili, dischi, libri,) per trarre conclusioni e fare previsioni.
  • Slide 5
  • Nello studio della statistica si distingue generalmente tra la statistica descrittiva e la statistica inferenziale. La statistica descrittiva: E un indagine che si occupa della raccolta, dellelaborazione dei dati e della descrizione dei fenomeni collettivi o di massa. Essa si occupa di descrivere la massa dei dati sperimentali con pochi numeri o grafici significativi. Quindi, per cos dire si occupa di fotografare una data situazione e di sintetizzarne le caratteristiche salienti. La statistica inferenziale: Studia le modalit con cui possibile estendere allintero universo statistico le conclusioni di un indagine svolta su di un campione e permette di valutare il grado di attendibilit di tali conclusioni. Essa utilizza i dati statistici, anche opportunamente sintetizzati dalla statistica descrittiva, per fare previsioni di tipo probabilistico su situazioni future o comunque incerte.
  • Slide 6
  • Slide 7
  • LINDAGINE STATISTICA E LE SUE FASI 1.IMPOSTAZIONE DELLINDAGINE STATISTICA 2.RILEVAZIONE DEI DATI 3.SPOGLIO E TRASCRIZIONE DEI DATI DEI DATI 4. ELABORAZIONE DATI Per INDAGINE STATISTICA si intende uninsieme di attivit finalizzate ad approfondire la conoscenza di un fenomeno. Le sue FASI sono:
  • Slide 8
  • 1) IMPOSTAZIONE DELLINDAGINE STATISTICA In questa prima fase occorre precisare: LOSCOPO DELLA RICERCA LO SCOPO DELLA RICERCA GLI OBIETTIVI CHE SI VOGLIONO GLI OBIETTIVI CHE SI VOGLIONO RAGGIUNGERE RAGGIUNGERE LE UNIT STATISTICHE OGGETTO DI INDAGINI LE UNIT STATISTICHE OGGETTO DI INDAGINI
  • Slide 9
  • Una distribuzione statistica serve ordinare e classificare i soggetti secondo un certo criterio. Le distribuzioni statistiche derivano dalloperazione di classificazione delle unit considerate secondo le modalit di uno o pi caratteri. Se si riferisce ad un solo carattere la distribuzione statistica si definisce SEMPLICE. Se si riferisce a 2, 3,.N caratteri allora la distribuzione statistica si definisce DOPPIA, TRIPLA,MULTIPLA. Se il carattere considerato qualitativo la distribuzione statistica si chiama anche SERIE STATISTICA. Se il carattere quantitativo allora si parla di SERIAZIONE STATISTICA. DISTRIBUZIONE STATISTICHE DISTRIBUZIONE STATISTICHE
  • Slide 10
  • 2) RILEVAZIONE DEI DATI CARATTERI Per rilevare dati statistici, fondamentale sapere esattamente COSA si vuole misurare e COME. In questa fase occorre individuare in modo preciso la caratteristica (CARATTERE) della popolazione che vogliamo sottoporre a studio. TECNICA DI RACCOLTA DEI DATI Tecnicamente, la raccolta dei dati pu essere fatta in modi diversi: misurazioni, questionario ecc.., tuttavia la raccolta pi seguita quella dell INTERVISTA DIRETTA o INDIRETTA. Lintervista diretta prevede domande poste direttamente dallintervistatore. Lintervista indiretta prevede il riempimento di un questionario a risposte aperte o chiuse che lintervistato deve riempire in tutte le sue parti come il censimento. In Italia il censimento si effettua ogni dieci anni (anni in cui lultima cifra 1, come lultimo che stato rilevato nel 2011, i precedenti 2001,1991,,1861 (anno dellunit dItalia) il prossimo sar nel 2021).
  • Slide 11
  • Questionario sullimpiego del tempo libero Esempio di intervista indiretta: Dati generali 1 Cittadinanza................ 2 Sesso M F 3 Et................ 4 Peso................ 5 Altezza................. Dati specifici 6 Pratichi uno sport SI NO 8 Ascolti la musica SI NO 9 Suoni qualche strumento SI NO 11 Guardi la televisione SI NO 12 Frequenti discoteche SI NO 13 Vai al cinema SI NO 14 Ti dedichi alla lettura SI NO 15 Coltivi qualche hobby Si NO 16 Pratichi volontariato SI NO INDAGINE STATISTICA
  • Slide 12
  • ORGANI PREPOSTI ALLA RACCOLTA DEI DATI La raccolta dei dati pu essere fatta da CHIUNQUE abbia interesse a fare una ricerca statistica. In Italia lorgano pi importante che si occupa della raccolta dei dati e della loro successiva elaborazione LISTITUTO CENTRALE DI STATISTICA (sigla ISTAT)
  • Slide 13
  • NATURA DEI CARATTERI I caratteri (dati raccolti) possono essere di natura QUANTITATIVA oppure QUALITATIVA. I caratteri o dati qualitativi (o mutabili) sono rappresentati da aggettivi (nazionalit, religione, ecc). I caratteri o dati quantitativi (o variabili) sono espressi da numeri (altezza, peso, ecc.). MODALITA DI UN CARATTERE Le modalit sono i diversi aspetti che un carattere pu assumere. Esempio: M ed F sono le 2 modalit del carattere sesso. In una rilevazione dei dati i caratteri stanno ad indicare l insieme dei fenomeni oggetto di studio riguardanti le caratteristiche che differenziano tra loro le unit statistiche.
  • Slide 14
  • NATURA DI UNA MODALITA Carattere qualitativo Carattere quantitativo La modalit pu essere Nominale o sconnessa Ordinale La modalit pu essere Discreta Continua Le modalit NON si possono ordinare secondo una scala di misurazione. Es. credo religioso, malattie, Le modalit si possono ordinare secondo una scala di misurazione. Es. giudizi, titolo di studio,... Le modalit sono numeri INTERI. Es. numero fratelli, Le modalit sono numeri REALI. Es. altezze, pesi,
  • Slide 15
  • Slide 16
  • Esempi caratteri qualitativi Esempio 1 modalit nominale o sconnesse: Sesso: M, F Corso di Laurea: Med. Ing. Sc.Pol. Giur. Stat. Mat. Provincia: Cz, Mi, Na, Pa, RM Religione. Cat., Mus.,. Ebreo, Ind, Taoista Esempio 2 modalit ordinate: Giudizio: Suff. Buono, Ottimo Posizione graduatoria: I II III IV V Classe Soc.: Bassa, Media, Alta Titolo Studio: Nessuno, Elem., Med.inf., Med.sup., Laurea
  • Slide 17
  • Esempi caratteri quantitativi Esempio 1 modalit discrete: a. N componenti famiglia: 1 2 3 4 5 6 7 8 b. N posti letto ospedale: 125 128 136 547 874 1258 2581 c. Residenti comune: 854 1258 5890 6587 15897 178.985 3.58.211 458.547 2.427.258 Esempio 2 modalit continue: a. Precipitazioni in pollici a Torino nel mese di aprile (20 giorni): 2.93.73.24.03.92.12.92.91.1 0.43.03.33.21.02.25.43.53.6 4.0 b. Altezza maschi Italiani: 175,3 168,4 187,1 158,4 167,5 170.2 174,6 175.6
  • Slide 18
  • SCHEMA RIASSUNTIVO La statistica lo studio quantitativo di un fenomeno collettivo: si studia individuando il collettivo statistico o popolazione statistica che linsieme delle unit statistiche: i singoli casi rispetto ai quali il fenomeno si manifesta le caratteristiche, dette caratteri, delle unit statistiche che ci sembrano rilevanti per la descrizione del fenomeno stesso Il modo in cui ogni carattere si manifesta nelle unit statistiche viene descritto attraverso delle modalit Le modalit possono essere di tipo qualitativo: si esprimono tramite aggettivi e sostantivi; possono essere quantitativo: si esprimono tramite numeri; possono essere ordinate se si pu stabilire un ordine discrete se vengono descritte da numeri interi continue se vengono descritte da numeri reali sconnesse: se non possono essere ordinate
  • Slide 19
  • METODI DI RILEVAZIONE DEI DATI La rilevazione dei dati pu essere effettuata su tutta la popolazione oggetto di studio, cio su tutto lUNIVERSO, oppure su una porzione di esso, cio su un CAMPIONE. Gli elementi della popolazione studiata prendono il nome di UNITA STATISTICHE.
  • Slide 20
  • 3) SPOGLIO E TRASCRIZIONE DEI DATI 3) SPOGLIO E TRASCRIZIONE DEI DATI Per lo spoglio dei dati occorre utilizzare unoperazione semplice, ma fondamentale che il CONTEGGIO. Infatti dopo la rilevazione dei dati occorre contare quante volte una modalit di un carattere si ripetuta cio con che frequenza si ripetuta. Dopo aver contato i dati, vengono scritti in tabelle (rappresentazione numerica) che possono essere semplici o composte. Una TABELLA SEMPLICE formata da DUE COLONNE e consente la classificazione dei dati rispetto ad un SOLO CARATTERE. Una TABELLA COMPOSTA formata da PI COLONNE, e consente la classificazione dei dati rispetto a PI CARATTERI
  • Slide 21
  • 1) TABELLA SEMPLICE Orario (h) Temperatura (C) 02 62 1211 188 244 ESEMPIO: Riportiamo in una TABELLA SEMPLICE i DATI riguardanti le TEMPERATURE registrate durante una giornata autunnale ad intervalli di sei ore: 1) h=0; T=2C; 2) h=6;T=2C; 3) h=12;T=11C; 4) h=18;T=8C; 5) h=24;T=4C dati tabella semplice
  • Slide 22
  • 2) TABELLA COMPOSTA ESEMPIO: Riportiamo in una TABELLA COMPOSTA i DATI riguardanti le ALTEZZE (h) ed i PESI (P) di una famiglia di quattro persone: 1) Padre; h = 175 cm; p = 80 kg; 2) Madre: h = 170 cm; p = 64 kg; 3) Figlio h = 180 cm; p = 74 kg; 4) Figlia h = 173 cm; p = 60 kg dati tabella composta Componente nucleo altezza h = cm peso P = kg Padre17580 Madre17064 Figlio18074 Figlia17360
  • Slide 23
  • 4) ELABORAZIONE DEI DATI 4) ELABORAZIONE DEI DATI In questa fase i dati vengono sottoposti ad una elaborazione matematica il cui scopo quello di esprimere i risultati dellindagine in modo sintetico, mediante: 2. rappresentazione grafica dei dati 3. Indici di centralit 1. rappresentazione numerica dei dati e relative frequenze
  • Slide 24
  • RAPPRESENTAZIONE DEI DATI STATISTICI Rappresentazione numerica dei dati: Rappresentazione grafica dei dati: La rappresentazione dei dati pu essere NUMERICA e GRAFICA TABELLE SEMPLICI 1) TABELLE SEMPLICI 2) TABELLE COMPOSTE DIAGRAMMI CARTESIANI 1) DIAGRAMMI CARTESIANI 2) ISTOGRAMMI 3) IDEOGRAMMI 4) DIAGRAMMI A TORTA
  • Slide 25
  • FREQUENZE ASSOLUTE La FREQUENZA ASSOLUTA indica quante volte la MODALIT di un CARATTERE si ripete. Colore capelli (carattere) N persone (frequenza assoluta) Neri 10 Castani 6 Rossi 1 Biondi 5 totale 22 Frequenze assolute carattere modalit
  • Slide 26
  • FREQUENZE RELATIVE La frequenza relativa di una certa modalit data dal rapporto tra la frequenza assoluta di tale modalit ed il numero totale dei casi. Spesso si esprime la frequenza relativa in forma percentuale. Le FREQUENZE ASSOLUTE, di due distribuzioni di dati, anche della stessa specie, non sono confrontabili in quanto si riferiscono, in generale, ad un diverso numero di casi complessivi. Questo inconveniente viene superato introducendo il concetto di FREQUENZA RELATIVA Frequenza relativa = frequenza assoluta / totale casi
  • Slide 27
  • Colore capelli (carattere) N persone (frequenza assoluta) Frequenza Relativa (f.a./totale) Neri100,46 Castani60,28 Rossi10,02 Biondi5 24 totale221 Frequenze relative Esempio:
  • Slide 28
  • FREQUENZE RELATIVE PERCENTUALI La frequenza relativa percentuale di una certa modalit data dalla frequenza relativa moltiplicata per 100. Frequenza relativa percentuale = frequenza relativa per 100
  • Slide 29
  • Colore capelli (carattere) N persone (frequenza assoluta) Frequenza Relativa (f.a./totale) Frequenza Relativa % Neri100,454545,45 Castani60,272727,27 Rossi10,04554,55 Biondi50,227222,72 totale221100 Esempio: Frequenze percentuali
  • Slide 30
  • Consideriamo un carattere le cui modalit siano ordinate. Si chiama frequenza cumulata (assoluta o relativa) della modalit x la somma delle frequenze (assolute o relative) della modalit x e di tutte quelle modalit che precedono la x. Si chiama frequenza retrocumulata (assoluta o relativa) della modalit x la somma delle frequenze (assolute o relative) della modalit x e di tutte quelle modalit che seguono la x. FREQUENZA CUMULATA E RETROCUMULATA
  • Slide 31
  • Colore capelli (carattere) N persone (frequenza assoluta) Frequenza. Cum assoluta Frequenza Retrocumulata assoluta Rossi11+0=11+5+6+10+22= 44 Biondi55+1=65+6+10+22=43 Castani66+5+1=126+10+22=38 Neri1010+6+5+1=2210+22=32 totale2222+10+6+5+1= 44 22+0=22 Esempio:
  • Slide 32
  • SCHEMA RIASSUNTIVO Lo spoglio dei questionari o delle schede di rilevazione porta alla costruzione della tabella o matrice dei dati grezzi: tabella in cui a ogni unit statistica compete una riga nella quale sono specificate le modalit che la descrivono in riferimento ai caratteri studiati; da essa si ottengono le tabelle di frequenza la frequenza di una modalit pu essere assoluta: numero delle modalit da esso descritte relativa: rapporto tra la frequenza assoluta e la numerosit del collettivo considerato pu anche essere espressa in forma percentuale. Essa serve a confrontare due collettivi distinti e a valutare il peso di una modalit rispetto alla totalit del collettivo per ogni modalit contengono la frequenza corrispondente cumulata: somma delle frequenze di tutte le modalit minori o uguali alla modalit considerata retrocumulata: somma delle frequenze di tutte le modalit maggiori o uguali alla modalit considerata
  • Slide 33
  • In una tabella di frequenza a ogni modalit di un carattere associato un numero che rappresenta la frequenza di quella modalit. Non difficile riconoscere che ci troviamo di fronte a una funzione. Si chiama distribuzione di frequenza la funzione che associa a ogni modalit ad un dato carattere la sua frequenza. Il dominio di una distribuzione di frequenza linsieme delle modalit di un carattere. DISTRIBUZIONE DI FREQUENZA
  • Slide 34
  • CLASSI DI FREQUENZE Si definisce ampiezza di una classe la differenza tra lestremo superiore e lestremo inferiore della stessa. Le classi possono essere: 1.di pari ampiezza (equi- ampie) 2.di pari frequenza (equi- frequenti ). Se in una DISTRIBUZIONE i dati sono molto NUMEROSI, allora i valori dei caratteri possono essere raggruppati in classi; nel caso di caratteri quantitativi le classi sono sovente intervalli di valori, i cui valori estremi siano compresi in uno e un solo intervallo. La suddivisione in classi consente di determinare le frequenze assolute e relative delle classi in luogo delle singole modalit.
  • Slide 35
  • Le regole fondamentali per la suddivisione in classi dei valori del carattere rilevati sono le seguenti: 1.Le classi devono essere esaustive: ogni valore deve appartenere ad almeno una classe; 2. le classi devono essere a due a due disgiunte, quindi ogni valore deve appartenere ad una sola classe (in modo da evitare che esso sia considerato due volte e quindi siano contate due volte le unit statistiche che hanno come determinazione del carattere quel valore ); 3.le classi devono essere ordinate in modo che i valori della prima precedono tutti quelli della seconda classe e quelli della seconda precedono quelli della terza classe e cosi via. REGOLE PER LA COSTRUZIONE DELLE CLASSI
  • Slide 36
  • I raggruppamenti delle classi possono essere operati in modo diverso, ma devono essere ordinate in ordine crescente. Di ogni classe si calcola: lampiezza, la densit di frequenza (se le ampiezze delle classi sono diverse) e il valore centrale. Ampiezza = differenza tra lestremo superiore e lestremo inferiore. Densit di frequenza = rapporto tra la frequenza relativa e lampiezza. Valore centrale = media aritmetica tra lestremo inferiore e lestremo superiore.
  • Slide 37
  • TRASCRIZIONE DEI DATI PER CLASSI La rappresentazione di una DISTRIBUZIONE DI DATI PER CLASSI, si presenta VANTAGGIOSA quando i dati sono molto NUMEROSI. Rappresentazione numerica Rappresentazione per classi di peso CLASSI DI PESO (termini) N STUDENTI (frequenze) 50 60 Kg4 60 70 Kg7 70 80 Kg3 totale14 L informazione, diviene meno precisa nel caso di una distribuzione per classi, tuttavia la visione della distribuzione diventa pi semplice e rapida PESO (Kg) (termini) N STUDENTI (frequenze) 52 1 54 1 55 2 611 631 682 693 711 731 751 TOTALE14 ESEMPIOESEMPIO
  • Slide 38
  • RAPPRESENTAZIONI GRAFICHE dei dati statistici I GRAFICI possono essere di diverso tipo : Le INFORMAZIONI che derivano da una raccolta dati sono pi evidenti se sono visualizzate attraverso GRAFICI Rappresentazioni grafiche dei dati: DIAGRAMMI CARTESIANI 1) DIAGRAMMI CARTESIANI 2) ISTOGRAMMI 3) IDEOGRAMMI 4) DIAGRAMMI A TORTA
  • Slide 39
  • Le rappresentazioni grafiche hanno lobiettivo di illustrare, mediante: -figure, -linee o segmenti, -superfici o aree, -solidi, -simboli convenzionali -ecc. una distribuzione di frequenze o delle modalit di uno o pi caratteri.
  • Slide 40
  • Per massimizzare lefficacia di un grafico lattenzione deve essere concentrata sui dati. Pertanto le componenti di supporto: Devono essere presenti solo se necessarie: titoli degli assi, legende e etichette in alcuni casi possono essere essenziali per la comprensione del grafico, ma in altri possono essere del tutto inutili. Devono essere lievi: preferibile usare linee pi leggere per gli assi e per la griglia e linee pi marcate per i dati. Gli effetti decorativi non devono allontanare lattenzione del lettore dai dati.
  • Slide 41
  • Il grafico a destra pi facile da leggere. Il ricorso a poche componenti di supporto permette di concentrare lattenzione sui dati. Nel grafico tutte le componenti hanno il massimo impatto. Il risultato un grafico confuso, difficile da leggere anche se sono presenti solo 3 valori.
  • Slide 42
  • 1.Diagrammi cartesiani 2.Diagrammi cartesiani a segmenti 3. Istogrammi 3. Poligono di frequenza
  • Slide 43
  • DIAGRAMMA CARTESIANO Esempio: Riportiamo su di un DIAGRAMMA CARTESIANO le TEMPERATURE registrare ogni sei ore, durante una giornata autunnale : 1) h=0; T=2c2) h=6;T=2C 3) h=12;T=11C 4) h=18;T=6C 5) h=24;T=4C dati Grafico T (C) Un DIAGRAMMA CARTESIANO formato da due RETTE (assi) perpendicolari tra loro, lasse ORIZZONTALE si chiama ASCISSA (asse X), lasse VERTICALE si chiama ORDINATA (asse Y). Su di essi vengono riportati i dati statistici, viene usato per rappresentare le SERIE STORICHE. 0 6 12 18 24 h (ore) 12 10 8 6 4 2 DIAGRAMMA CARTESIANO Y X (0;2)(0;2) (6;2)(6;2) (12;11) (18;6) (24;4) Basta riportare sull asse X il Tempo e sull asse Y le Temperature
  • Slide 44
  • Esempio: Riportiamo in un ISTOGRAMMA le marche di cellulari pi in uso fra i giovani : NOKIA (300), SIEMENS (240), SAMSUG (120), PANASONIC (80), MOTOROLA (50) LISTOGRAMMA un grafico a colonne: le colonne (rettangoli) hanno basi uguali e possono essere disegnate una vicino allaltra. Laltezza proporzionale alla frequenza di ciascun dato. Vien usato nei caratteri quantitativi CONTINUI. 320_ 280_ 240_ 200_ 160_ 120_ 180_ 140_ Noki Siem Sams Pana Moto 300 240 120 80 50 ISTOGRAMMA
  • Slide 45
  • Gli istogrammi si impiegano per rappresentare graficamente distribuzioni di frequenza di caratteri quantitativi le cui modalit sono costituite da classi di valori. A tal fine occorre distinguere due casi, ovvero: 1.Le classi di valori hanno uguale ampiezza. In questo caso avremo tanti rettangoli contigui, ciascuno avente base uguale allampiezza della classe e altezza uguale o proporzionale alla frequenza (assoluta o relativa) assunta nellinsieme delle unit della classe.
  • Slide 46
  • 2. Le classi di valori hanno diversa ampiezza. In questaltro caso avremo una serie di rettangoli aventi basi diverse uguali allampiezza delle classi e altezze da calcolarsi, in modo che le frequenze siano proporzionali alle aree dei rispettivi rettangoli. In ordinata, pertanto, avremo le cosiddette densit di frequenza date dal rapporto tra la frequenza (assoluta o relativa) di ciascuna classe e la relativa ampiezza.
  • Slide 47
  • Esempio: La classe (0 ; 2) indica un intervallo chiuso con lestremo inferiore uguale a zero e lestremo superiore uguale a 2. Tutte le altre classi indicano degli intervalli aperti allestremo inferiore e chiusi allestremo superiore.
  • Slide 48
  • Slide 49
  • Il poligono di frequenza una spezzata che unisce i punti aventi per ascissa i punti centrali delle classi e per ordinata la relativa frequenza. In un istogramma, il poligono delle frequenze unisce i punti medi dei lati superiori dei rettangoli; la spezzata deve essere chiusa e deve toccare lasse delle ascisse allesterno delle classi estreme, in modo che larea allinterno del poligono di frequenza equivalga a quella dellistogramma. Ogni vertice del poligono delle frequenze corrisponde al valore centrale di una classe. Il termine poligono usato impropriamente perch indica una spezzata aperta (e non chiusa). Se le classi hanno la stessa ampiezza, (di solito si considerano come vertici della spezzata anche i punti corrispondenti ai valori centrali delle classi immediatamente precedenti e immediatamente successive a quelle per le quali la frequenza diversa da zero. Queste classi hanno frequenza zero. Si pu verificare che in tal modo la somma delle aree dei rettangoli dellistogramma uguale allarea delimitata dallasse orizzontale e dal poligono delle frequenze. La somma delle aree dei rettangoli di un istogramma uguale allarea sottostante il poligono delle frequenze.
  • Slide 50
  • Slide 51
  • Sono impiegati per rappresentare graficamente caratteri quantitativi DISCRETI, non divisi in classi, e possono configurarsi a segmenti verticali. Esempio. Numero dei componenti per famiglia, numero delle stanze delle abitazioni, numero di unit locali delle aziende e cos via. Essi si costruiscono come gli usuali diagrammi cartesiani aventi due assi perpendicolari: lasse delle ascisse (x) e lasse delle ordinate (y), aventi origine comune in zero. Ogni coppia ordinata di valori (x i,y i ) determiner un punto nel piano e linsieme di tutte le coppie (x i = modalit quantitativa i-esima, y i = frequenza della modalit i-esima) determiner linsieme dei punti nel piano che costituiscono la rappresentazione grafica della distribuzione considerata. Per rendere maggiormente visibili tali punti, si tracciano dei segmenti verticali congiungenti lascissa (x i ) con il punto del piano corrispondente allordinata (y i ).
  • Slide 52
  • E da notare che in questo caso scorretto costruire il poligono o spezzata di frequenza congiungendo tra loro i punti poich il carattere considerato discreto e quindi, per sua natura, non possiede i valori intermedi a quelli indicati dalle modalit quantitative. Una spezzata di frequenza che unisse tra loro le modalit, infatti, attribuirebbe anche valori intermedi alle modalit stesse.
  • Slide 53
  • 1.Grafici a barre: ortogrammi o a nastri 2.Diagrammi circolari 3.Ideogrammi 4.Cartogrammi, mappe tematiche
  • Slide 54
  • I grafici a barre sono impiegati per rappresentare graficamente caratteri con modalit qualitative, serie sconnesse o rettilinee e possono essere di due tipi: 1.A colonne se sono costituiti da una successione di colonne, segmenti verticali o rettangoli (a base uguale) equidistanti, in numero pari alle modalit del carattere, e hanno altezza uguale o proporzionale alla frequenza (assoluta o relativa). Sullasse delle ascisse (orizzontale) si riportano le modalit, sullasse delle ordinate (verticale) si riportano le frequenze. 2.A nastri, se sono costituiti da tanti nastri (segmenti orizzontali, rettangoli) sovrapposti ed equidistanti, in numero pari alle modalit del carattere, e hanno lunghezza uguale o proporzionale alla frequenza (assoluta o relativa). Sullasse delle ascisse (orizzontale) si riportano le frequenze, sullasse delle ordinate (verticale) si riportano le modalit.
  • Slide 55
  • Se la rappresentazione grafica riguarda una serie sconnessa, lordine in cui saranno poste le modalit arbitrario; se si tratta invece di una serie rettilinea (es. titolo di studio), le modalit saranno poste nellordine naturale che esse presentano nella serie. Ortogramma a colonne Ortogramma a nastri
  • Slide 56
  • Maschi(in migliaia) Femmine(in migliaia) Agricoltura Industria Altre attivit In cerca di Occupazione 1.7865.901 6.520 808 9731.826 3.745 1.104 Esempio di ortogramma: popolazione per condizione, settore di attivit economica degli occupati e sesso in Italia nel 1981.
  • Slide 57
  • Gli ortogrammi si utilizzano anche per rappresentare contemporaneamente dati di segno opposto come entrate e uscite, importazioni ed esportazioni. Un esempio di ortogramma per la rappresentazione contemporanea di dati positivi e negativi quello riportato sotto.
  • Slide 58
  • Carattere qualitativo nominale a barre verticali: ORTOGRAMMA N.B. E possibile costruire il diagramma a barre riportando in ordinata le frequenze assolute OPPURE le frequenze relative, la forma della rappresentazione risulta invariata.
  • Slide 59
  • principali cause di morte nell'uomo nei Paesi industrializzati (fonte: WHO)
  • Slide 60
  • Nel grafico precedente, la scala delle ascisse indica i tassi di mortalit per 100.000 persone e per anno (cio il numero di morti ogni 100.000 persone in 1 anno per ogni causa considerata). In particolare, le barre verdi forniscono i valori osservati nel 1900, quelle gialle i valori del 1984. Ora, confrontando le differenze fra le barre verdi e le gialle per tutte le cause riportate nel grafico, saltano agli occhi gli enormi progressi ottenuti per le malattie infettive tubercolosi, influenza, polmonite ecc.) alcune delle quali risultano oggi pressoch scomparse nei Paesi industrializzati a cui il grafico si riferisce. La facilit con cui abbiamo acquisito informazioni dal grafico, una conseguenza della loro visualizzazione in forma di grafico a barre: questa rappresentazione consente di cogliere le caratteristiche salienti della rilevazione statistica e di effettuare raffronti con notevole immediatezza rispetto ai soli dati numerici. Per contro, a questa maggior immediatezza di sintesi pu far riscontro una diminuzione del senso critico nel valutare i dati.
  • Slide 61
  • In tal caso si traccia una CIRCONFERENZA e si procede alla sua divisione in parti proporzionali alle intensit delle componenti del fenomeno statistico. Esempio Un collezionista si ritrova con 5.750 francobolli di cui: 1.250 sono della Citt del Vaticano, 1.100 della Repubblica di S Marino e 3.400 Italiani. Rappresentare il fenomeno statistico mediante un diagramma a torta. DIAGRAMMI CIRCOLARI O AEROGRAMMA LAREOGRAMMA un tipo di rappresentazione grafica alla quale si ricorre quando si vogliono rappresentare le parti che compongono un fenomeno statistico, usato nei caratteri qualitativi SCONNESSI. 59% 22% 19% percentuali ampiezza settori circolari AEROGRAMMA o diagramma a torta
  • Slide 62
  • I diagrammi circolari (o aereogrammi) per la loro forma circolare, sono comunemente noti come diagrammi a torta. Sono particolarmente adatti alle serie sconnesse o rettilinee. Sono efficaci per mettere in evidenza limportanza relativa delle singole modalit rispetto al totale.
  • Slide 63
  • IDEOAGRAMMA LIDEOGRAMMA un tipo di rappresentazione grafica nel quale il fenomeno statistico viene rappresentato mediante limpiego di FIGURE che richiamano idealmente il contenuto del fenomeno e dove la sua frequenza proporzionale alle DIMENSIONI oppure al NUMERO delle figure impiegate. Esempio Rappresentare mediante un ideogramma le popolazioni di due cittadine formate da 6.500 e 4.000 abitanti. Quando il fenomeno da rappresentare non si pu rappresentare con una figura intera allora si ricorre ad una FRAZIONE di essa. Unit di riferimento = 1.000 abitanti 6.550 abitanti 4.000 abitanti
  • Slide 64
  • I cartogrammi sono grafici utili per rappresentare serie territoriali o geografiche. Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata lintensit o la frequenza di uno o pi caratteri (es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni).
  • Slide 65
  • I cartodiagrammi non sono altro che dei cartogrammi in cui, anzich delle serie territoriali semplici, vengono rappresentate delle serie territoriali di due o pi caratteri. Esempio: I nati vivi e i morti per 1.000 abitanti nelle 20 Regioni italiane nel 1986.
  • Slide 66
  • SCHEMA RIASSUNTIVO Caratteri qualitativi sconnessi Serie storiche Caratteri quantitativi discreti Caratteri quantitativi continui Diagramma a torta Diagramma a colonne: istogramma Diagramma a nastri o a barre Diagramma a segmento Caratteri qualitativi ordinati Serie geografiche Diagramma a colonne Diagramma a nastri Diagramma ad aste o segmenti Diagramma a colonne:istogrammi Diagramma cartesiano Diagramma a colonne: ortogrammi Cartogramma
  • Slide 67
  • La scelta della rappresentazione grafica Questi 2 grafici rappresentano la stessa distribuzione. Qual pi chiaro? Quale settore del diagramma circolare maggiore?
  • Slide 68
  • La scelta della rappresentazione grafica Per la maggior parte delle persone pi facile confrontare segmenti piuttosto che angoli. Nel diagramma circolare i settori numero 1 e 4 sembrano identici, mentre nel diagramma a barre evidente la differenza. E opportuno rappresentare la stessa distribuzione con pi grafici per individuare quello che meglio rappresenta il messaggio che si vuole veicolare.
  • Slide 69
  • I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. di calcolo MEDIE ( semplici e ponderate) ( tengono conto di TUTTI i valori della distribuzione) di sintesi valori della distribuzione) di posizione MEDIANA (si calcolano tenendo (si calcolano tenendo MODA conto solo di ALCUNI valori) conto solo di ALCUNI valori) INDICI CAMPO DI VARIAZIONE O RANGE di dispersione VARIANZA SCARTO QUADRATICO MEDIO COEFFICIENTE DI VARIAZIONE
  • Slide 70
  • MEDIA ARITMETICA SEMPLICE Consideriamo una distribuzione di DATI DIVERSI UNO DALLALTRO: La MEDIA ARITMETICA SEMPLICE uguale alla somma dei dati divisa per n, cio: Le medie sono adatte a rappresentare distribuzioni di caratteri quantitativi
  • Slide 71
  • COMPITOVOTO N 17 N 28 N 36 TOTALE21 Un alunno nei tre compiti di matematica ha riportato i voti presenti in tabella. Calcolare la MEDIA ARITMETICA dei voti. Dove: 21 = somma dei voti 3 = numero dei voti 7 = MEDIA ARITMETICA dei voti MEDIA ARITMETICA SEMPLICE Esempio di calcolo
  • Slide 72
  • MEDIA ARITMETICA PONDERATA Se i dati si presentano con una certa FREQUENZA o PESO allora il calcolo della media deve essere effettuato sommando ogni termine tante volte quante indica la sua frequenza. Supponiamo che: Il termine a 1 si presenta con frequenza p 1 Il termine a 2 si presenta con frequenza p 2 Il termine a n si presenta con frequenza p n Il calcolo della MEDIA PONDERATA si effettua con la relazione:
  • Slide 73
  • MEDIA ARITMETICA PONDERATA Esempio di calcolo 20 Studenti di una classe, hanno ottenuti in matematica i voti riportati in tabella. Calcolare la MEDIA PONDERATA dei voti. Dove: 122 = somma dei voti 20 = numero di studenti 6,1 = MEDIA PONDERATA dei voti Voto in Matematica Numero studenti 42 53 68 75 82 totale20
  • Slide 74
  • MEDIA PONDERATA NEL CASO DI UNA DISTIBUZIONE DI DATI PER CLASSI In questo caso ad ogni classe, viene sostituito il TERMINE CENTRALE, calcolato mediante la semisomma dei termini estremi della classe (X1-X2). I termini centrali cosi ottenuti costituiscono i termini a 1 ; a 2 ; a 3 ; ecc. della distribuzione. classefrequenza X 1 -X 2 p1p1 X 2 -X 3 p2p2 X 3 -X 4 p3p3 ecc. Termine centrale frequenze a1a1 p1p1 a2a2 p2p2 a3a3 p3p3 ecc. SEMISOMME Infine la media ponderata si calcola con la relazione
  • Slide 75
  • MEDIA PONDERATA DI UNA DISTIBUZIONE DI DATI PER CLASSI Esempio di calcolo Si fa riferimento ai dati della tabella 1 Classi di et (anni) n persone (Frequenze) 0 - 2035 20 - 404 40 - 601 totale40 termini central i n persone (Frequenz e) a 1 = 10 P 1 = 35 a 2 = 30P 2 = 4 a 3 = 50P 3 = 1 totale40 CALCOLO valori centrali Calcolo della media ponderata Et media = 13 anni
  • Slide 76
  • Si definisce MODA di una distribuzione di dati il termine corrispondente alla MASSIMA FREQUENZA assoluta o relativa. MODA ESEMPIO : Determinare la MODA della seguente distribuzione di voti: VOTOFREQUENZA 54 68 74 82 91 Il termine che corrisponde alla massima frequenza (8) il 6, pertanto: MODA = 6 La moda particolarmente adatta a rappresentare distribuzioni di caratteri qualitativi
  • Slide 77
  • Le distribuzioni di frequenza possono essere: zeromodali: nessuna modalit ha una frequenza pi elevata degli altricio fanno tutti frequenza uguale ad 1. Esempio A = {1, 2, 3, 4, 5, 6} unimodali : c una sola modalit con una frequenza pi elevata degli altri. Esempio: A = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6, 7, 8} bimodali : ci sono due modalit con una frequenza pi elevata degli altri. Esempio: A = {1, 2, 2, 3, 3, 3, 3, 5, 6, 6, 6, 6, 7, 7, 8, 8 } trimodali, ecc : ci sono tre,, modalit con una frequenza pi elevata degli altri. Esempio: A = {1, 2, 3, 3, 3, 3, 5, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8}. plurimodali: tutte le modalit della distribuzione hanno la stessa frequenza diversa da uno.
  • Slide 78
  • Nel caso di caratteri continui e per distribuzioni fornite per classi equi-ampie il calcolo della moda avviene mediante lindividuazione della classe modale, cio quella caratterizzata dalla massima frequenza. Se le classi non sono equi - ampie bene dividere la frequenza assoluta di ogni classe per lampiezza dellintervallo ottenendo la cosiddetta densit di frequenza. La classe modale quella con la densit di frequenza pi alta. Per la determinazione della classe modale opportuno ricorrere all'istogramma, individuando l'intervallo di altezza massima, ovvero il punto di massimo della curva. La classe con la maggiore densit media (che corrisponde all'altezza dell'istogramma) quella modale.istogramma CLASSE MODALE
  • Slide 79
  • MEDIANA Si definisce MEDIANA il termine che occupa il POSTO CENTRALE di una distribuzione di dati ordinati in modo crescenti. La mediana adatta a rappresentare distribuzioni di caratteri quantitativi. ESEMPIO : Determinare la MEDIANA della seguente distribuzione di voti: VOTOFREQUENZA 54 68 74 82 91 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 8 8 9 Il TERMINE CENTRALE il 6, infatti quello che lascia alla sua destra e alla sua sinistra un eguale numero di termini, pertanto si ha: MEDIANA = 6 Si ordinano i dati in maniera crescente
  • Slide 80
  • 80 Per caratteri quantitativi discreti: Si dispongono i valori in una serie ordinata in modo crescente o decrescente e si conta il numero totale n di dati: se n dispari, la mediana corrisponde al valore numerico del dato che occupa la posizione (n+1)/2; se n pari, la mediana calcolata come la media aritmetica dei valori che occupano le posizioni (n/2) e (n/2)+1. Per caratteri quantitativi continui: Il raggruppamento in classi delle modalit consente al pi di determinare la classe mediana nella quale ricade lunit statistica che bipartisce la distribuzione ordinata delle modalit.
  • Slide 81
  • Quando i dati sono distribuiti uniformemente su entrambi i lati del picco la distribuzione simmetrica. Quando i dati non sono distribuiti uniformemente su entrambi i lati del picco la distribuzione asimmetrica. In una distribuzione unimodale valgono le seguenti relazioni: media=mediana=moda ( simmetria) moda