Audience basket 2011

16
ANALISI DELL’AUDIENCE MEDIA DELLE ANALISI DELL’AUDIENCE MEDIA DELLE DIRETTE DELLA SERIE A DI BASKET DIRETTE DELLA SERIE A DI BASKET La regressione lineare è una metodologia statistica che tenta di individuare una relazione tra una variabile Y ed una o più variabili X che si presume la determinano. E' chiaro che non tutti i fenomeni possono essere spiegati con la regressione lineare senza errori "eccessivi". Per cui esistono una serie di indici che testano la "bontà" del modello stimato.

description

Regressione Lineare, Previsione

Transcript of Audience basket 2011

  • 1. ANALISI DELLAUDIENCE MEDIA DELLE DIRETTE DELLA SERIE A DI BASKET
    • La regressione lineare una metodologiastatistica che tenta di individuare una relazione tra una variabile Y ed una o pi variabili X che si presume la determinano.
  • E' chiaro che non tutti i fenomeni possono essere spiegati con la regressione lineare senza errori "eccessivi". Per cui esistono una serie di indici che testano la "bont" del modello stimato.

2.

  • fascia oraria e giornata di programmazione (sabato sera, domenica ore 11.45/12.00, domenica 18.15, domenica 20.00/21.00);
  • numerosit dei tifosi delle squadre coinvolte nella partita (il dato stato preso da SportFans);
  • posizione in classifica delle squadre prima di disputare il match (1, 2, 3, , ultima, etc.);

Variabili analizzate (1 di 3) La variabile dipendente inserita nel nostro modello lAudience Media delle dirette del campionato di serie A trasmesse da Sky nelle ultime 4 RG (2007-08, 2008-09, 2009-10, 2010-11 fino alla 16 giornata inclusa). Per tentare di spiegare a cosa sono dovuti livelli elevati o ridotti dellAudience Media sono state testate le seguenti variabili: 3.

  • differenza punti in classifica fra le squadre prima di disputare il match;
  • appeal della gara ( un indicatore costruito per combinare assieme le variabili posizioni in classifica e differenza punti);
  • BIG (presenza di almeno una fra le prime cinque squadre come numero di tifosi: Milano, Treviso, Siena, Roma, Virtus Bologna);
  • presenza di ognuna delle squadre del campionato di serie A 2010-2011 (lArmani Jeans Milano stata considerata sia nella modalit in casa che nella modalit in trasferta);
  • contemporanea presenza di una partita della serie A di calcio che vedeva in campo almeno una fra Juventus, Inter o Milan (le squadre con il maggior numero di tifosi nel calcio);
  • equilibrio della gara inteso come scarto in termini di punti alla conclusione della gara stesso (es. risultato: 90 a 80, scarto 10 punti; abbiamo analizzato classi di scarto).

Variabili analizzate (2 di 3) 4.

  • Mese dellanno in cui si sono disputati i match di Regular Season (da settembre a maggio)
  • Natale: stato considerato il periodo natalizio (dal 25/12 fino al 5/1) per valutare lanon sovrapposizionedel Campionato di Serie A di Basket con quello della Serie A di calcio
  • Derby: Milano-Cant, Milano-Varese, Cant-Varese, Fortitudo-Virtus, Pesaro-Montegranaro, Napoli-Avellino, Avellino-Caserta

Variabili analizzate (3 di 3) 5. Il modello di regressione stato costruito sulla base di 328 partite (tutte le partite delle stagioni 2007-08, 2008-2009 e 2009-2010, pi le prime 48 dirette della stagione 2010-2011). Il miglior modello per spiegare lAudience stato ottenuto includendo queste 17 variabili (sono ordinate in base allimportanza che il modello gli attribuisce nella spiegazione dellAudience): Il modello VARIABILI COEFFICIENTI Milano 13949,9 "Natale" 13933,0 Derby 8644,9 Siena 7148,1 Roma 4915,8 Diff.pti -678,8 Treviso -3303,1 Teramo -4304,6 Montegranaro -4793,3 Pesaro -4810,1 Cant -4934,5 Caserta -6446,9 Juve - Inter Milan -7772,8 Brindisi -10760,7 Biella -11318,6 Avellino -11701,7 Cremona -12154,0 (Constant) 41464,0 6. Interpretazione dei risultati (1 di 3)

  • Le variabili numero di tifosi, BIG, e quelle riferite alle singole squadre risultano evidentemente correlate, ovvero esprimono sostanzialmente il medesimo contenuto informativo. La correlazione fra i regressori causa problemi al modello in quanto peggiora la significativit e la precisione delle stime dei coefficienti rendendo pi difficoltosa linterpretazione dei risultati. Per ottimizzare il modello, evitando la ridondanza nel contenuto informativo dei dati, sono state incluse nel modello solamente le variabili relative alle squadre ed escluse le variabili numero di tifosi e BIG. Queste ultime due risultano anchesse significative nello spiegare lAudience Media, tuttavia linformazione contenuta nelle variabili Squadra risultata pi completa ed il modello di regressione che le include il migliore.
  • Un discorso analogo vale per le variabili Posizione in classifica, Differenza punti in classifica ed Appeal. Fra queste tre la caratteristica che meglio aiuta a comprendere la dinamica dellAudience risultata essere la Differenza Punti che quindi stata inserita nel modello a scapito delle altre due.

7. Interpretazione dei risultati (2 di 3)

  • La variabile Scarto a fine gara , utilizzata per misurare lequilibrio della gara, non risultata significativa nello spiegare lAudience Media delle dirette. Ci in parte spiegato dalla natura stessa della variabile Audience che rappresenta una misura di sintesi calcolata sullintera durata della partita, pertanto vistosi cali dellAudience nel finale di gara possono essere contro-bilanciati dallascolto registrato nei primi due quarti del match. In questottica si nota come le misure ex-ante (posizione in classifica, differenza punti in classifica) siano decisamente pi utili di questa misura ex-post al fine di ottenere una migliore comprensione dellAudience.
  • Sulla base del modello ottenuto si pu concludere inoltre che anche lafascia orariae lagiornata di programmazionenon sono fattori determinanti per il fenomeno Audience Media.

VARIABILI NON SIGNIFICATIVE 8. Interpretazione dei risultati (3 di 3)

  • I valori dei coefficienti delle 17 variabili significative incluse nel modello rappresentano limpatto di ciascuna variabile sullAudience. Ad esempio il coefficiente dell AJ Milano , pari a 13.950, significa che la presenza di Milano nel match porta (in media) un contributo positivo di 13.950 spettatori.
  • La presenza in contemporanea di una partita di calcio diJuve, Inter o Milancausa invece un calo di circa 7.800 spettatori alla diretta del basket.
  • La squadra che in assoluto porta la diminuzione pi elevata nel livello dellAudience e laVanoli-Braga Cremona , la cui presenza nella gara porta (in media) un contributo negativo di 12.150 spettatori.
  • Per ogni per ogni punto didifferenza in classificafra le due squadre che disputano il match si ha in media un calo di 679 spettatori (se ad esempio la differenza punti uguale a 6 si ha un calo di 679x6 = 4.074 spettatori).

VARIABILI SIGNIFICATIVE 9. IndicatoreR 2

  • Questo particolare indicatore fornisce una misura di quanto le variabili inserite nel modello (Milano, Siena, diff.pti, Juve-Inter-Milan, ecc.) spiegano lAudience. Ovvero un indicatore della bont del modello stimato.
  • Nel nostro casoR 2= 0.40 , ci significa che il modello realizzato in grado di spiegare il 40% dellAudience Media (variabile dipendente). Il restante 60% spiegato da variabili non incluse nel modello poich non individuate o non direttamente osservabili.

10. Confronto fra le squadre (dal 2007/08 alla 16giornata della stagione 2010-11) Squadre Partite % Audience Media Diff. Rispetto allAudience Media totale Dev.Std. Aud. Share medio Contatti netti medi Milano 44 22% 50.566 15.636 19.778 0,29% 211.135 Virtus 38 19% 34.738 -192 17.239 0,20% 181.462 Roma 37 18% 42.864 7.934 17.651 0,23% 196.426 Caserta 27 13% 28.138 -6.792 15.833 0,15% 166.620 Cant 26 13% 34.193 -737 23.687 0,18% 177.872 Avellino 26 13% 25.317 -9.613 14.660 0,13% 150.947 Treviso 25 12% 29.462 -5.468 20.564 0,15% 164.738 Siena 24 12% 40.825 5.895 17.040 0,23% 196.887 Pesaro 22 11% 30.993 -3.937 17.659 0,17% 170.551 Teramo 20 10% 33.437 -1.493 13.815 0,17% 173.622 Biella 20 10% 26.990 -7.940 12.152 0,14% 155.267 Montegranaro 18 9% 30.562 -4.368 16.559 0,16% 172.756 Varese 12 6% 32.138 -2.792 19.929 0,19% 165.561 Cremona 11 5% 27.201 -7.729 13.159 0,16% 156.457 Sassari 3 1% 45.126 10.196 7.888 0,25% 205.731 Brindisi 2 1% 32.758 -2.172 1.981 0,18% 238.805 TOTALE 201 100% 34.930 0 18.780 0,19% 177.791 11. Confronto fra le fasce orarie (dal 2007/08 alla 16giornata della stagione 2010-11) Squadre Partite % Audience media Differenza Audience Media totale Dev.Std. Audience Share medio Contatti netti medi Sabato sera 55 27% 20.950 -13.980 11.059 0,09% 163.558 Domenica 12.00 60 30% 48.907 48.907 17.728 0,31% 189.255 Domenica pomeriggio 46 23% 35.041 35.041 17.744 0,19% 175.002 Domenica sera 25 12% 35.028 35.028 15.514 0,13% 198.451 Altre 15 7% 33.059 33.059 12.491 0,21% 159.326 TOTALE 201 100% 34.930 0 18.780 0,19% 177.791 12. Interpretazione della Deviazione Standard (1 di 2)

  • La deviazione standard (Dev.Std.) un indicatore della variabilit di una caratteristica in una determinata popolazione. Pi risulta elevata maggiormente differenti sono i valori di tale caratteristica fra gli individui appartenenti alla popolazione.
  • Nel nostro studio la caratteristica oggetto di indagine lAudience Media e la popolazione di riferimento sono le partite.

13.

  • Fra le squadre con che sono state trasmesse in diretta almeno 20 volte quella con la deviazione standard maggiore Cant (23.687), mentre quella con deviazione standard minore Biella (12.152). Le due squadre in questione non hanno una differenza di Audience Media molto elevata (circa 7200 spettatori in meno per Biella), ma le partite di Cant presentano unAudience maggiormente variabile.
  • Ci significa che le avversarie di turno influenzano maggiormente lAudience di Cant rispetto a quanto non siano in grado di fare le avversarie di Biella.
  • In termini pratici trasmettendo in diretta una partita fra una BIG e Cant si hanno possibilit pi elevate di ottenere unAudience medio/alta rispetto a quella che si potrebbe ottenere in un match fra una BIG e Biella (i cui ascolti in generale sono bassi e poco variabili).

Interpretazione della Deviazione Standard (2 di 2) 14. La previsione (1 di 3) Uno degli obiettivi dellanalisi di regressione prevedere i valori futuri della variabile dipendente (lAudience Media) attraverso le variabili indipendenti incluse nel modello. Per farlo, la regressione multipla deve rendere massima la capacit previsiva delle variabili indipendenti considerandole globalmente. La regressione multipla permette di sfruttare molte opzioni, sia nella forma, sia nella specificazione delle variabili indipendenti, che consentono di modificare lequazione in modo tale da accrescere la sua capacit previsiva. Spesso, per, questa viene potenziata a scapito dellinterpretazione. Attualmente stiamo tentando di realizzare ulteriori specificazioni del modello che consentano di individuare oltre ai fattori maggiormente determinanti per comprendere al meglio i dati storici dellAudience anche le variabili pi utili per prevederne i valori futuri sulla base delle informazioni disponibili ex-ante la gara (squadre coinvolte, contro-programmazione, posizione in classifica, differenza punti in classifica, ecc.). 15. La previsione (2 di 3) Il miglior modello previsivo ottenuto al momento attuale (31/01/2011) stato ottenuto calibrando il modello di regressione sulle ultime due stagioni di Regular Season(135 dirette; tutta la stagione 2009/10 pi le prime 48 dirette della stagione in corso). IlMAE uno degli indicatori utilizzabili per valutare la bont previsiva di un modello e per il confronto fra modelli. E ottenuto calcolando media degli errori di previsione in valore assoluto (errore di previsione = valore vero valore previsto dal modello). Nel nostro caso il MAE assume valore pari a 10.395, ovvero in media la differenza fra il numero reale di spettatori che seguono la diretta ed il numero previsto dal modello (ex-ante la partita) pari a 10.395. 16. La previsione (3 di 3) Nella tabella seguente sono indicate le variabili incluse nel modello previsivo ed i relativi coefficienti: LindicatoreR 2in questo modello (calibrato su 135 partite) risulta pari a0,47 . VARIABILI COEFFICIENTI "Natale" 14249,5 Milano 13899,2 Roma 8681,8 Siena 8412,5 Varese 3720,1 Virtus 2300,7 Derby 730,2 Pesaro 320,8 Pti.POS 309,9 Diff.pti -305,2 Cant -1056,6 Caserta -3436,4 Teramo -3609,3 Treviso -4087 Cremona -4615,7 Brindisi -6160,2 Juve,Inter,Milan -7282,6 Biella -8008 Montegranaro -10429,3 Avellino -11453,8 (Constant) 26867,8