Presentazione standard di PowerPointsomeni.di.unimi.it/progetti2017/Tanzi-LastFm.pdf · Ariana...
Transcript of Presentazione standard di PowerPointsomeni.di.unimi.it/progetti2017/Tanzi-LastFm.pdf · Ariana...
Teresa Tanzi
• Piattaforma
• Crowling Data Set
• Distribuzione del Grado
• Componenti Connesse
• Small World
• Community Detection
• Recomendation
• Conclusioni
2
OUTLINE
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
SOCIAL MEDIA
web radio
social network musicale
… come altri, ma
orientato alla visualizzazione di statistiche musicali.
3LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
4
SOCIAL MEDIA
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
PUNTI DI FORZA• integra servizi on demand e non
• collega più account per raggruppare in un’unica libreria tutta la musica ascoltata dall’utente su diversi dispositivi e diverse piattaforme
• produce statistiche accessibili di generi, ascolti, fascie orarie …
5
SOCIAL MEDIA
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Utenti : 48 Mln nel 201221 Mln attivi
Canzoni : 600 Mln al mese104 Mld dal 2003
Paesi: 240
6
DATASET
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
SEEDS: 30 maggiori auditori dei 20 artisti più ascoltati
per ogni auditore le 500 canzoni più ascoltate creanoun arco con l’artista
I following di ogni auditore sono aggiunti agli utenti da visitare
7
GRAFO
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Grafo bipartito, non diretto, pesato
NODI: Utenti 8.366Artisti 114.718
ARCO: tra un utente ed un artista se tale utente ha ascoltato almeno una canzone di tale artista negli ultimi 30 giorni
885.506
PESO di un arco: numero di canzoni che l’utente ha ascoltato dell’artista
123.084
8
DISTRIBUZIONE DEL GRADO
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Grafo bipartito, non diretto, pesato
NODI: Utenti, Artisti
ARCO: tra un utente ed un artista se tale utente ha ascoltato almeno una canzone di tale artista negli ultimi 30 giorni
PESO di un arco: numero di canzoni che l’utente ha ascoltato dell’artista
Utenti Artisti
9LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
DISTRIBUZIONE DEL GRADO: PDF
Media: 14.4Mediana: 1
Media: 106Mediana: 89
Media: 8Mediana: 1
Barabasi+1999
Aplha=1.8
Utenti Artisti
11LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
DISTRIBUZIONE DEL GRADO: CCDF
DISTRIBUZIONE DEL GRADO: RANDOM
Utenti Artisti
13LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Media: 61.542Mediana: 61.542
Link: 112.417
COMPONENTI CONNESSE
Componenti : 18
Giant : 123028 nodi (99.95%)
14LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
SMALL WORLD
+ relazioni di follow tra gli utenti : 139.349
Cc = 0.0343
Cc solo utenti = 0.1805
15LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
COMMUNITY DETECTION
16LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
1) gli utenti ascoltano sempre lo stesso genere musicale?
UTENTI - ARTISTI
17LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Louvain method : Blondel+2008
DISTRIBUZIONE DELLE COMMUNITY
54 community
18LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Community 2 – 20505 nodi
Artista Degree Genere
The Beatles 1228 classic rock, rock, british, 60s, pop
David Bowie 1170 rock, glam rock, classic rock, 80s, alternative
Red Hot Chili Peppers
1158 rock, alternative rock, alternative, funk, Funk Rock
Nirvana 1075 Grunge, rock, alternative, alternative rock, 90s
Pink Floyd 1041 Progressive rock, classic rock, Psychedelic Rock, rock, psychedelic
Queen 1013 classic rock, rock, 80s, hard rock, glam rock
Metallica 787 thrash metal, metal, heavy metal, hard rock, rock
Soundgarden 785 Grunge, rock, alternative rock, alternative, hard rock
Led Zeppelin 773 classic rock, rock, hard rock, 70s, Progressive rock
Depeche Mode 753 electronic, new wave, 80s, synth pop, synthpop
19LAST.FM - Teresa Tanzi, Metodi e
Applicazioni per Social Network, 9 Giugno 2017
Community 1 – 17294 nodi
Artista Degree Genere
Katy Perry 2879 pop, female vocalists, pop rock, indie, rock
Lady Gaga 2681 pop, dance, electronic, female vocalists, femalevocalist
Lana Del Rey 2645 female vocalists, indie, indie pop, pop, alternative
Rihanna 2406 pop, rnb, female vocalists, dance, Hip-Hop
Miley Cyrus 2391 pop, female vocalists, Disney, dance, guilty pleasure
Paramore 2360 rock, pop punk, alternative, female vocalists, emo
Ariana Grande 2293 pop, female vocalists, rnb, Ariana Grande, nickelodeon
Selena Gomez 2188 pop, female vocalists, Disney, pop rock, Selena Gomez
Harry Styles 2154 pop, rock, alternative, one direction, harry styles
Beyoncé 2082 rnb, pop, female vocalists, soul, Hip-Hop21
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno
2017
Community 7 – 7324 nodi
Artista Degree Genere
blackpink 498 Kpop, k-pop, pop, Korean, YG
2NE1 391 k-pop, Korean, dance, pop, yg family
소녀시대 387 k-pop, Korean, pop, Kpop, girlband
f(x) 376 k-pop, Korean, female vocalists, dance, Kpop
K.A.R.D 315 Kpop, Korean, k-pop, 2016, pop
EXID 305 k-pop, Korean, female vocalists, Kpop, pop
태연 304 k-pop, Korean, Kpop, SNSD, why so gorgeous
Red Velvet 304 k-pop, Korean, female vocalists, Kpop, pop
Exo 304 k-pop, Korean, Kpop, exo, exo-k
BTS 291 k-pop, Korean, Kpop, bts, pop
25LAST.FM - Teresa Tanzi, Metodi e
Applicazioni per Social Network, 9 Giugno 2017
COMMUNITY DETECTION
27LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Classic rock /Grunge
Indie/Alternative
Pop
K pop
Punk rock/MetalRap/Hip-Hop
RECOMENDATION
2) come funziona il sistema di raccomandazione
28LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
29LAST.FM - Teresa Tanzi, Metodi e
Applicazioni per Social Network, 9 Giugno 2017
RECOMENDATION
Quando due utenti sono simili?Quando ascoltano gli stessi artisti.
Gli artisti che un utente ascolta sono I suoi vicinidi grafo: il coefficiente di Jaccard calcola la frazione di artisti per ciascuna coppia di nodi.
DISTRIBUZIONE DEL COEF. DI JACCARD
30LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
31
GRAFO JACCARD
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
Grafo non diretto, pesato
NODI: Utenti 1.384
ARCO: se il coeff. di Jaccard > 0.2 23.360
PESO : coeff. di Jaccard
32LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
GRAFO JACCARD UTENTI
COMMUNITY DETECTION
34LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
95 community
35
GRAFO COMMUNITY
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
NODI: communities
CAPPIO: ogni nodo ha un cappioPESO: numero di link all’interno della community
ARCO: due nodi sono connessi se le community sono connessePESO: numero di archi che collegano le community
36
0. pop, dance3. pop, indie4. rock, alternatice5. pop, dance8. k-pop10. hip-hop, rap11. pop, eurovision18. rock, alternative19. pop, latin28. electronic, latin31. electronic, house41. pop, electronic44. pop punk, rock49. indie, alternative66. symphonic metal71. rock, pop
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
GRAFO COMMUNITY
Come per gli utenti.
Filtraggio:
gli artisti poco signnificativi (grado <10) sono esclusi 9906
37LAST.FM - Teresa Tanzi, Metodi e
Applicazioni per Social Network, 9 Giugno 2017
GRAFO JACCARD ARTISTI
38LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
DISTRIBUZIONE DEL COEF. DI JACCARD
GRAFO JACCARD ARTISTI
40LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
clique percolation (k=4)Palla+2005
143 community sovrapposte
41
GRAFO COMMUNITY
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
NODI: communities
ARCO: due nodi sono connessi se hanno almeno un nodo in comune
PESO: numero di nodi in comune
42LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
GRAFO COMMUNITY
43LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017
CONCLUSIONI
• Le distribuzioni hanno restituito un andamento a leggedi Potenza, quindi sono scale free
• Gli utenti si concentrano su un genere musicale principale, con connessioni diversificate, non solo con generi affini come atteso
• Gli artisti si dividono nettamente in gruppo di genere. Le connessioni sono solo tra generi affini.
• Gli algoritmi di raccomandazione si basano suattitudini comuni degli utenti, come si è cercato di simulare.
44
PROSPETTIVE FUTURE• Allargare il dataset, soprattutto relativamente agli artisti,• disporre di maggior potenza di calcolo e tempo dedicato
• Applicare entrambi gli algoritmi di ricerca di community ai grafi correlati
• valutarne somiglianze e differenze
• completare il sistema di raccomandazione
• confrontare i dati ottenuti con quelli offerti da last.fm
• indagare le preferenze musicali tra proposte recenti e pezzi datati
• investigare l’evoluzione del gusto musicale nel tempo.
LAST.FM - Teresa Tanzi, Metodi e Applicazioni per Social Network, 9 Giugno 2017