Corso Web 2.0: La coda lunga

38
Università degli Studi di Milano Bicocca Dipartimento di Informatica, Sistemistica e Comunicazione Lezione 7 La coda lunga Corso Web 2.0 2 Roberto Polillo [email protected] www.rpolillo.it 1

description

Settima lezione del corso sul Web 2.0 tenuto all'Università di Milano Bicocca. Vedi anche www.corsoweb20polillo.blogspot.com

Transcript of Corso Web 2.0: La coda lunga

Page 1: Corso Web 2.0: La coda lunga

Università degli Studi di Milano BicoccaDipartimento di Informatica, Sistemistica e Comunicazione

Lezione 7La coda lunga

Corso Web 2.02 Roberto Polillo

[email protected]

1

Page 2: Corso Web 2.0: La coda lunga

Il principio d Pareto

Principio empirico che afferma che la maggior parte degli effetti è dovuta ad un numero ristretto di cause:

in genere l'80% dei risultati dipende dal 20% delle cause (“legge dell’80/20”)

Esempi: L’80% della ricchezza è posseduta dall’80% della popolazione

Il 20% dei prodotti realizza l’80% delle vendite

(i valori 80% e 20% sono indicativi, e vanno verificati empiricamente caso per caso)

http://it.wikipedia.org/wiki/Principio_di_Pareto2R.Polillo – Corso Web 2.0 (ott 2008)

Page 3: Corso Web 2.0: La coda lunga

La coda lunga

3R.Polillo – Corso Web 2.0 (ott 2008)

Pop

ola

rità

Prodotti

HEAD: (pochi) top-seller, per i quali vale la legge di Pareto

LONG TAIL:(molti) prodotti con ridotti volumi di vendita

Page 4: Corso Web 2.0: La coda lunga

La coda lunga

4R.Polillo – Corso Web 2.0 (ott 2008)

HEAD: (pochi) top-seller, per i quali vale la legge di Pareto

Ai canali retail tradizionali conviene fermarsi qui

Possono occupare una quota di mercato equivalente o superiore a quella dei top-seller, a patto di avere un canale di distribuzione opportuno

LONG TAIL:(molti) prodotti con ridotti volumi di vendita

Pop

ola

rità

Prodotti

Page 5: Corso Web 2.0: La coda lunga

Il canale di distribuzione per la coda lunga

1.Deve poter disporre di un catalogo prodotti enormemente vasto, a costi marginali pressochè nulli

2.Deve poter raggiungere una popolazione di potenziali acquirenti enormemente vasta, a costi marginali pressochè nulli

3.I potenziali acquirenti devono poter disporre di strumenti di selezione, per individuare facilmente il prodotto di interesse all’interno del catalogo (motori di ricerca, filtri, raccomandazioni, e WOM)

La rete rende possibile tutto questo

5R.Polillo – Corso Web 2.0 (ott 2008)

Page 6: Corso Web 2.0: La coda lunga

Riferimenti

L'espressione (“The Long Tail”) è stata utilizzata da Chris Anderson in un famoso articolo di Wired (Ott 2004), per descrivere alcuni modelli di business come quelli di Amazon.com (libri), Raphsody (noleggio musica) o Netflix (noleggio film):

http://www.wired.com/wired/archive/12.10/tail.html

e successivamente nel suo libro del 2006:

The Long Tail – Why the Future of Business is Selling Less of More (trad. italiana: La coda lunga – Da un mercato di massa a una massa di mercati, Codice Edizioni, 2006-2008)

Vedi anche http://en.wikipedia.org/wiki/The_Long_Tai

Le citazioni delle slide che seguono sono tutte tratte da C.Anderson

6R.Polillo – Corso Web 2.0 (ott 2008)

Page 7: Corso Web 2.0: La coda lunga

(dall’articolo originale di Wired)

7R.Polillo – Corso Web 2.0 (ott 2008)

Page 8: Corso Web 2.0: La coda lunga

(dall’articolo originale di Wired)

8R.Polillo – Corso Web 2.0 (ott 2008)

Page 9: Corso Web 2.0: La coda lunga

Mercati a coda lunga

Esempi: Libri (www.amazon.com, …) DVD (www.netflix.com, …) Musica (www.rhapsody.com, www.itunes.com, …)

In questi mercati: si possono offrire molti più prodotti le vendite si distribuiscono più equamente tra hit e coda (la coda si ingrossa) grazie ai filtri

e alle raccomandazioni il profitto si ripartisce più equamente tra hit e non-hit

Si vede che nei mercati online la “testa” è molto meno importante che nei mercati tradizionali: es. nei DVD, i primi 5.000 titoli sommano il 65-70% delle vendite tradizionali, e il 40-50% delle vendite online

9R.Polillo – Corso Web 2.0 (ott 2008)

Page 10: Corso Web 2.0: La coda lunga

R.Polillo – Corso Web 2.0 (ott 2008) 10

Page 11: Corso Web 2.0: La coda lunga

R.Polillo – Corso Web 2.0 (ott 2008) 11

(dall’articolo originale di Wired)

Page 12: Corso Web 2.0: La coda lunga

Legge del 98%

“In un mondo di costi di packaging quasi inesistenti e di accesso istantaneo a quasi tutti i contenuti in formato digitale, il consumatore acquista almeno una copia di quasi tutti i prodotti disponibili (appunto il 98%).”

12R.Polillo – Corso Web 2.0 (ott 2008)

Page 13: Corso Web 2.0: La coda lunga

“Quel semplice quadro con pochi hit rilevanti e tantissimi non-hit irrilevanti sta oggi assumendo l'aspetto di un confuso mosaico di milioni di mini-mercati e micro-star ... il mercato di massa si sta tramutando in una massa di nicchie.”

“Il nuovo mercato di nicchie non sta sostituendo il tradizionale mercato di hit: sta solo dividendo, per la prima volta,la scena con quest'ultimo.”

“Per cent'anni abbiamo vagliato, e scartato, tutto tranne i best-seller, così da usare nel modo più efficace possibile scaffali espositivi costosi, schermi, canali e attenzione.”

“... pensate ai costi di distribuzione in calo come ad una marea che si ritira, rivelando una nuova terra che c'è sempre stata, ma che era sommersa.”

Conseguenze: da un mercato di massa a una massa di mercati

14R.Polillo – Corso Web 2.0 (ott 2008)

Page 14: Corso Web 2.0: La coda lunga

Conseguenze: dalla cultura di massa alla massa delle microculture

Stiamo passando da un cultura di massa (mainstream) a una cultura massicciamente parallela.

C'è un'esplosione di varietà e di scelta di contenuti, che trasforma la cultura di massa in milioni di microculture che coesistono e interagiscono ... “ultranicchie”... “tribù di interesse” culturali.

E' la fine della cultura del “boccione d'acqua” o del “prime time” televisivo, dove la maggior parte della popolazione ascolta, legge e guarda lo stesso bacino di hit; ora si va verso le microculture, dove ognuno si interessa di cose diverse.

Fenomeno parallelo nel mondo della produzione: just-in-time personalizzazione del prodotto ed eliminazione delle scorte, ma ... qui si parla di bit e non di atomi!

15R.Polillo – Corso Web 2.0 (ott 2008)

Page 15: Corso Web 2.0: La coda lunga

Conseguenze: dalla cultura di massa alla massa delle microculture

“La grandezza della trasmissione radio-televisiva è che può portare un programma a milioni di persone con un’efficienza incomparabile. Ma non può fare il contrario: portare un milione di programmi ad ogni persona. Ed è esattamente quello che internet riesce a fare così bene.

L’economia dell’era radiotelevisiva esigeva programmi ch catturassero un pubblico molto vasto. L’economia dell’era della banda larga è diametralmente opposta. Offrire lo stesso prodotto a milioni di persone è estremamente costoso nonché inutile, quando si ha una rete distributiva ottimizzata per comunicazioni point-to-point.

C’è ancora richiesta di grandi contenitori culturali, ma non sono più l’unico mercato. Oggi gli hit competono con un numero infinito di mercati di nicchia, di ogni dimensione. E i consumatori sono sempre più favorevoli a quello con maggior scelta. L’era del one-size-fits-all è al capolinea, rimpiazzata da qualcosa di nuovo: un mercato di moltitudini.”

16R.Polillo – Corso Web 2.0 (ott 2008)

Page 16: Corso Web 2.0: La coda lunga

I prodotti di nicchia

“Molti di questi prodotti sono sempre stati sul mercato, solo che non erano visibili o non erano facili da trovare […] ora sono disponibili grazie a Netflix, iTunes, Amazon o qualsiasi altro posto scovato da Google. Il mercato invisibile è diventato visibile.

Altri prodotti di nicchia sono invece delle novità, create da un’industria che sta emergendo nel punto d’intersezione tra il mondo commerciale e quello non commerciale, dove è difficile dire quando i professionisti si fanno da parte e gli amatori prendono il sopravvento. È l mondo dei blogger, dei video-maker e delle garage band, tutt’a un tratto in grado di trovare un pubblico grazie alla stessa invidiabile economia della distribuzione digitale.”

18R.Polillo – Corso Web 2.0 (ott 2008)

Page 17: Corso Web 2.0: La coda lunga

Video: Social Media in plain English:http://it.youtube.com/watch?v=MpIOClX1jPE&feature=user

(da Commoncraft, http://it.youtube.com/user/leelefever )

19R.Polillo – Corso Web 2.0 (ott 2008)

Page 18: Corso Web 2.0: La coda lunga

Google e la coda lunga del mercato della pubblicità

“What Google has done is to find and monetize the Long Tails of both advertisers and publishers. These include millions of small companies and individuals who may never have advertised before, at least not nationally. They were considered sub-scale--too small to be worth a call or visit from an ad salesperson, possible too small to even think of themselves as an advertiser at all. But Google ads are self-service, cheap, and performance based (pay-per-click), which all combine to dramatically lower the barrier to entry.”

http://longtail.typepad.com/the_long_tail/2005/02/googles_long_ta.html

"The surprising thing about The Long Tail is just how long the tail is, and how many businesses haven't been served by traditional advertising sales“

Eric Schmidt (Google CEO, 2005)

20R.Polillo – Corso Web 2.0 (ott 2008)

Page 19: Corso Web 2.0: La coda lunga

Google AdWords

AdWords (introdotto nel 2000) è il principale servizio pubblicitario di Google, e la principale fonte di ricavi ($16,4 md nel 2007)

Gli inserzionisti specificano le parole di ricerca che fanno apparire i loro annunci sulla destra della pagina dei risultati (“sponsored links”)

L’inserzionista paga quando l’utente clicca sull’annuncio (Pay Per Click, PPC)

Il prezzo per click viene determinato con regole complesse (paga di più l’annuncio mostrato per primo)

Il servizio è in self-service on-line: tutto il lavoro (trattativa, vendita, esecuzione) lo fa il software!

http://en.wikipedia.org/wiki/AdWords

https://adwords.google.it/select/Login

21R.Polillo – Corso Web 2.0 (ott 2008)

Page 20: Corso Web 2.0: La coda lunga

La coda lunga delle ricerche

R.Polillo – Corso Web 2.0 (ott 2008) 22

Le 10 parole più cercate corispondono al 3% di tutte le ricerche

http://bnoopy.typepad.com/bnoopy/2005/03/the_long_tail_o.html

Page 21: Corso Web 2.0: La coda lunga

Le keywords più profittevoli

R.Polillo – Corso Web 2.0 (ott 2008) 23

http://www.xedant.com/researches/top_500_adsense_keywords.php

Page 22: Corso Web 2.0: La coda lunga

Google AdSense

Con questo servizio, Google “amministra” spazi pubblicitari sulle pagine web dei siti clienti

Google inserisce negli spazi amministrati annunci dei propri inserzionisti, secondo criteri di correlazione semantica con le pagine del sito ospite(es.: la nostra social network)

Il sito ospite viene remunerato “per click”

AdSense ha contribuito a servire (creare?) la coda lunga della pubblicità, portando centinaia di migliaia di aziende a fare pubblicità e migliaia di siti a offrirla

http://en.wikipedia.org/wiki/AdSense

https://www.google.com/adsense/login/it/?hl=it&gsessionid=HlXsYrGNMiY

24R.Polillo – Corso Web 2.0 (ott 2008)

Page 23: Corso Web 2.0: La coda lunga

AdSense: business model

PROPRIETARIO DEL SITO

INSERZIONISTI

VISITATORE

GOOGLE

$

$

click

per clic

k

Analisi semantica dei siti per scegliere il sito più adatto all’inserzione

BANNER

SITO

25R.Polillo – Corso Web 2.0 (ott 2008)

Page 24: Corso Web 2.0: La coda lunga

Recommender systems (RS)

Sistemi che propongono all’utente elementi (musica, film, libri, notizie, immagini, pagine web, ristoranti, …) di suo potenziale interesse

“In its most common formulation, the recommendation problem is reduced to the problem of estimating ratings for the items that have not been seen by a user. Intuitively, this estimation is usually based on the ratings given by this user to other items and on some other information […]. Once we can estimate ratings for the yet unrated items, we can recommend to the user the item(s) with the highest estimated rating(s).”

Content based:all’utente vengono proposti elementi simili a quelli che ha gradito in passato

Collaborative: all’utente vengono proposti elementi che persone con gusti e preferenze simili a lui hanno gradito in passato

Hybrid: combinazione dei due metodi

27R.Polillo – Corso Web 2.0 (ott 2008)

Page 25: Corso Web 2.0: La coda lunga

Content-based RS: problemi

La bontà di questi metodi è legata alla completezza e qualità delle caratteristiche associate agli elementi

Questi metodi sono particolarmente adatti per elementi di natura testuale, per i quali le caratteristiche possono essere estratte automaticamente (“automatic feature extraction”)

Per altri tipi di informazioni (video, musica, foto, …) le caratteristiche non possono essere estratte automaticamente, e devono quindi essere associate a mano (tagging, tassonomie, …): costoso e difficile (es.come caratterizzare una barzelletta?)

Le raccomandazioni tendono ad essere “sintattiche”: es. due libri con le stesse caratteristiche risulteranno indistinguibili

Mancanza di varietà ed eccessiva specializzazione: vengono raccomandati sempre elementi simili

“New user problem”: le preferenze dei nuovi utenti non sono note

30R.Polillo – Corso Web 2.0 (ott 2008)

Page 26: Corso Web 2.0: La coda lunga

Collaborative RS

Utente Elem 1 Elem 2 Elem 3 Elem 4

Io 5 4 3

Mario 2 1 3

Mario 1 5 1

Luigi 5 4 2 5

Utenti“simili”

Elemento consigliato

Note:• non vengono considerate le caratteristiche degli elementi, ma solo le valutazioni espresse dagli utenti• quindi la tecnica funziona indipendentemente dalla natura degli elementi (libri, musica, barzellette, …), e non ha le rigidità tipiche dei metodi content-based• Le valutazioni possono essere esplicite o implicite

32R.Polillo – Corso Web 2.0 (ott 2008)

Page 27: Corso Web 2.0: La coda lunga

Es. www.amazon.com

Selezionando: Don't Make Me Think: A Common Sense Approach to Web Usability

33R.Polillo – Corso Web 2.0 (ott 2008)

Page 28: Corso Web 2.0: La coda lunga

Amazon recommendation system: http://www.inf.unibz.it/~ricci/ATIS/papers/Linden2003.pdf

34R.Polillo – Corso Web 2.0 (ott 2008)

Page 29: Corso Web 2.0: La coda lunga

Collaborative RS: problemi

La matrice di rating è sempre molto sparsa:- se pochi utenti hanno valutato un prodotto, questo verrà raccomandato di rado, anche se le valutazioni sono ottime- se ci sono pochi utenti simili a me, le raccomandazioni saranno di bassa qualità

Start-up problem: all’inizio la matrice di rating è quasi vuota, e la tecnica funziona male

New user problem (come nei content-based RS)

New item problem: nuovi elementi non sono stati valutati da nessuno, quindi non vengono raccomandati

Mancanza di trasparenza: le raccomandazioni vengono fornite da un algoritmo, sulla base di informazioni anonime e aggregate

È possibile ingannare il sistema, fornendo rating fittizi per promuovere specifici elementi

35R.Polillo – Corso Web 2.0 (ott 2008)

Page 30: Corso Web 2.0: La coda lunga

Social recommenders

Un approccio diverso (“2.0”, circa 2006) Non facciamoci consigliare da un algoritmo, ma dai membri

della nostra rete sociale (SNS), come nella vita reale Le segnalazioni sono quindi personalizzate (anche se

spesso gli utenti usano pseudonimi), e si esprimono con mezzi diversi: commenti, tag, rating, …

Gli algoritmi si limitano a facilitarci la consultazione, in modo più o meno sofisticato (ad es. ordinandole in modo opportuno)

38R.Polillo – Corso Web 2.0 (ott 2008)

Page 31: Corso Web 2.0: La coda lunga

www.lastfm.com

Costituita nel 2002 come mix di internet radio e SNS musicale, nel 2005 si fonde con Audioscrobbler; nel 2007 acquisita da CBS per USD 280 ml

Schede dettagliate di artisti, album e brani musicali, modificabili in modo collaborativo dagli utenti (wiki); foto, cover, videoclip; eventi passati e imminenti, con utenti partecipanti e foto (via flickr)

Profili personalizzabili per utenti e gruppi di utenti, che creano la propria “radio” personale (libreria, playlist)

Gli utenti possono aggiungere tag e commenti, e segnalare brani o album agli amici; forum di discussione

Gli utenti esprimono le proprie preferenze (♥ oppure ) e il sistema raffina la conoscenza dei gusti degli utenti anche sulla base degli ascolti con altri sistemi

Il sistema segnala gli artisti “simili” sulla base delle scelte effettuate dagli utenti segnala affinità con altri utenti e presenta classifiche di album e brani più ascoltati

http://it.wikipedia.org/wiki/Last.fm

39R.Polillo – Corso Web 2.0 (ott 2008)

Page 32: Corso Web 2.0: La coda lunga

Altre web radio

www.music.yahoo.com/launchcast/

E ancora: www.pandora.com www.rhapsody.com www.live365.com

40R.Polillo – Corso Web 2.0 (ott 2008)

Page 33: Corso Web 2.0: La coda lunga

www.11870.com

“11870.com is used for people to save, share and keep track of the places and services they like around the world through reviews, pictures and videos.

Create your profile and start saving and organizing the places and services that you like.

Discover new places and services through your friends and tell them about your favorite ones

Find out more about a country, city or neighborhood”

“Siamo il del.icio.us della vita reale”

41R.Polillo – Corso Web 2.0 (ott 2008)

Page 34: Corso Web 2.0: La coda lunga

www.netflix.com

Lanciata nel 1998, è il più grosso noleggiatore online di DVD (anche visibili in streaming)

100.000 titoli, 55 ml di dischi, 8+ ml di iscritti, spedisce quasi 2 ml di dischi al giorno (negli USA)

Recommender system basato su ratings e review degli utenti, del tipo di quello di Amazon

“Approximately 60% of Netflix members select their movies based on movie recommendations tailored to their individual tastes” (Netflix)

http://en.wikipedia.org/wiki/Netflix

42R.Polillo – Corso Web 2.0 (ott 2008)

Page 35: Corso Web 2.0: La coda lunga

“Il passaparola amplificato è la manifestazione della terza forza della coda lunga: sfruttare l’opinione dei consumatori per far incontrare offerta e domanda. La prima forza, la produzione democratizzante, popola la coda. La seconda forza, la distribuzione democratizzante, rende disponibile qualsiasi prodotto. Ma da sole queste due forze non bastano. Deve entrare in scena la terza forza, che aiuta la gente a trovare ciò che vuole in questa nuova super-abbondanza di varietà, perché il potenziale del mercato a coda lunga si possa dispiegare in tutta la sua potenza.”

“I nuovi tastemakers siamo noi. Il passaparola è oggi una manifestazione pubblica, che avviene nei commenti dei blog e nelle recensioni dei clienti, raccolte e misurate in modo esaustivo. Le formiche hanno i megafoni.”

Chris Anderson, La coda lunga, pag. 94 e 102

43R.Polillo – Corso Web 2.0 (ott 2008)

Sintesi: le tre forze della coda lunga

Page 36: Corso Web 2.0: La coda lunga

The wisdom of the crowds

James Surowiecki, The Wisdom of Crowds: Why the Many Are Smarter Than the Few and How Collective Wisdom Shapes Business, Economies, Societies and Nations (2004)

I 4 elementi necessari per formare una “wise crowd”: Diversity Independence Decentralization Aggregation

http://en.wikipedia.org/wiki/The_Wisdom_of_Crowds

44R.Polillo – Corso Web 2.0 (ott 2008)

Page 37: Corso Web 2.0: La coda lunga

Micro-progetti

45R.Polillo – Corso Web 2.0 (ott 2008)

Esplorare il catalogo di libri fotografici di www.blurb.com, e segnalarne uno di particolare interesse

Iscriversi a www.lastfm.com (o altra web radio analoga), definire un proprio canale e sperimentare l’efficacia del sistema di social recommendation utilizzato

Sperimentare www.11870.com, con riferimento a esercizi pubblici milanesi

Page 38: Corso Web 2.0: La coda lunga

Il presente materiale è pubblicato con licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo - 2.5 Italia”, reperibile presso il seguente sito Internet: http://creativecommons.org/licenses/by-nc-sa/2.5/it/.

Credits

Diverse lezioni di questo corso sono una rielaborazione delle slides del Corso sul Web 2.0 tenuto da Carlo Vaccari alla Università di Camerino nel dicembre 2007, disponibili con identica licenza Creative Commons dal blog del corso in http://camerino20.wordpress.com/.

Molto altro materiale è stato trovato in rete. Ho cercato di indicarne sempre la fonte; segnalatemi eventuali dimenticanze, sarò lieto di correggerle appena possibile.

46R.Polillo - Corso Web 2.0 (ott 2008)