Seminario "Web 2.0 per la Statistica"

48
Università di Roma “La Sapienza” Facoltà di Scienze Statistiche 23 gennaio 2008 Web 2.0: La Statistica ai tempi di YouTube e Wikipedia Introduzione agli strumenti del nuovo Web Daniele Frongia

description

Seminario "Web 2.0 per la Statistica" presso il Dipartimento di Statistica, Probabilità e Statistiche Applicate, Università degli Studi di Roma "La Sapienza", 23 gennaio 2008

Transcript of Seminario "Web 2.0 per la Statistica"

Page 1: Seminario "Web 2.0 per la Statistica"

Università di Roma “La Sapienza” Facoltà di Scienze Statistiche

23 gennaio 2008

Web 2.0: La Statistica ai tempi di YouTube e Wikipedia

Introduzione agli strumenti del nuovo Web

Daniele Frongia

Page 2: Seminario "Web 2.0 per la Statistica"

Il presente materiale è distribuito con la licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo - 2.5 Italia”, reperibile presso il seguente sito Internet: http://creativecommons.org/licenses/by-nc-sa/2.5/it/.

Page 3: Seminario "Web 2.0 per la Statistica"

Programma

Introduzione al Web 2.0 Wiki in ambiente statisticoWikipedia e la StatisticaCondivisione di video scientificiPubblicazioni scientifiche 2.0 Blog e motori di ricerca 2.0Algoritmi di indicizzazione e ricercaProbabilità e Web 2.0Analisi delle reti sociali

Page 4: Seminario "Web 2.0 per la Statistica"

Web 2.0

Web 2.0: definizione di Wikipedia http://it.wikipedia.org/wiki/Web_2.0

Web 2.0, non si sa cos'è ma si misura lo stessohttp://punto-informatico.it/p.aspx?id=1948763

Web 2.0: una definizionehttp://blog.nicolamattina.it/?p=238

Page 5: Seminario "Web 2.0 per la Statistica"

Elementi innovativi del Web 2.0

L’elemento innovativo consiste nella combinazione di vecchie tecnologie e standard (come HTML, CSS, XML, JavaScript, DOM) per realizzarne di nuove (come AJAX)

RIA: Rich Internet Application

Mashup...

Page 6: Seminario "Web 2.0 per la Statistica"

Mashup

http://www.deeario.it/2006/08/21/mashup-mappa-dei-blog-italiani/

http://pipes.yahoo.com/pipes/

http://softwarecommunity.intel.com/articles/eng/1505.htm

http://code.google.com/apis/gdata/basics.html

Page 7: Seminario "Web 2.0 per la Statistica"

Tipologia strumento Web 2.0 Esempi

Social bookmarking Blue Dot, del.icio.us, StumbleUpon,Technorati

Calendaring Google Calendar, bCal, Yahoo!Calendar

Images / Video Sharing YouTube, Flickr, FOTOLOG

Collaborative authoring Wikipedia, PBwiki, Basecamp, SocialText, Writely

Social Networking MySpace, Orkut, Facebook, Hi5,Friendster, LinkedIn, Neurona, Ning

Blogs Blogger, Skyblog, dBlog, Splinder,WordPress

Communications tools Windows Live Messenger, ICQ,Google Talk, Yahoo! Messenger

Social games Second Life, Half Life, World ofWarcraft, Lineage, RuneScape, FinalFantasy XI, Online Chess

Feed reader / News aggregator Netvibes, Google Reader,FeedReader, Liferea, Straw

File sharing Gnutella, eMule, BitTorrent,Napster, Kazaa

Strumenti 2.0: una prima lista

Page 8: Seminario "Web 2.0 per la Statistica"

Caratteristiche Web 2.0

Le caratteristiche più importanti del Web 2.0 sono:

* I siti Web 2.0 sono piattaforme che consentono una forte interazione tra utenti

* Gli utenti usufruiscono di servizi innovativi mediante potenti interfacce grafiche

* Gli utenti forniscono il valore aggiunto con la produzione di contenuti e la condivisione della conoscenza

* I servizi offerti vengono aggiornati di continuo ( “perpetual beta”)

Page 9: Seminario "Web 2.0 per la Statistica"

“Il Web è il palcoscenico e la star sei tu”Centralità e protagonismo dell'utente

Page 10: Seminario "Web 2.0 per la Statistica"

Statistiche sull’uso del Web 2.0

YouTube e Second Life i primi della classe?

Quali sono i siti realmente più visitati e utilizzati?

Alcune indagini hanno provato a far luce sul alcuni aspetti del fenomeno.

http://tallblog.conted.ox.ac.uk/index.php/2007/03/16/some-real-data-on-web-20-use/

Page 11: Seminario "Web 2.0 per la Statistica"

Strumenti 2.0: i Blog

http://it.wikipedia.org/wiki/Blog

http://www.youtube.com/watch?v=IKcqge8SvzQ

Page 12: Seminario "Web 2.0 per la Statistica"

Nati nel 1997, esplosi nel 2002, quanti sono?

Blog

Page 13: Seminario "Web 2.0 per la Statistica"

Strumenti 2.0: i Wiki

Wiki: ambiente web di condivisione e gestione di documenti e file dove gli utilizzatori possono visualizzare e aggiungere contenuti, ma anche di modificare i contenuti esistenti inseriti da altri utilizzatori.

http://www.youtube.com/watch?v=-dnL00TdmLY

Sulla tecnologia Wiki si basa il funzionamento dell’enciclopedia online Wikipedia.

Page 14: Seminario "Web 2.0 per la Statistica"

La regina 2.0: Wikipedia

“Uno sforzo per creare e distribuire una enciclopedia libera della più alta qualità possibile ad ogni singola persona sul pianeta nella propria lingua” - Jimmy Wales

Wikipedia, con oltre 9 milioni di voci e 10 milioni di utenti registrati, rappresenta la più grande collezione di sapere umano. Wikipedia esiste in oltre 250 lingue differenti e riceve oltre 60 milioni di accessi al giorno.

Page 15: Seminario "Web 2.0 per la Statistica"

Sull’attendibilità di Wikipedia

Nel 2006 la rivista Nature ha confrontato Wikipedia e la prestigiosa Enciclopedia Britannica, giungendo a un giudizio di sostanziale parità quanto ad autorevolezza (3.86 errori per voce per Wikipedia, 2.92 l’EnciclopediaBritannica).

Page 16: Seminario "Web 2.0 per la Statistica"

Wikipedia: le motivazioni

Fonte: ACM http://delivery.acm.org

Page 17: Seminario "Web 2.0 per la Statistica"

Il futuro di Wikipedia

Proposte finalizzate a migliorare i contenuti (XVI International World Wide Web Conference):

● Definizione della reputazione degli utenti sulla base delle modifiche effettuate. Se il contributo resiste alle modifiche siguadagna reputazione, mentre se il contributo viene sostituito dalla versione precedente la reputazione scende.

● Segnalazione degli interventi faziosi prendendo in considerazione l’identità dell’utente.

Page 18: Seminario "Web 2.0 per la Statistica"

Strumenti 2.0 per la condivisione dei documenti

Alcuni strumenti 2.0 si propongono di realizzare una scrittura collaborativa via web

Servizi online che consentono la condivisione di documenti (file, e non pagine web come per i wiki):

Google Docs e Zoho Writer, strumenti per creare, modificare e condividere documenti

Scribd, una sorta di YouTube per documenti in formato Word, PDF, Excel o PowerPoint

SlideShare e Zoho Show

Page 19: Seminario "Web 2.0 per la Statistica"

Tagging

Nel Web 2.0, per tag si intendono delle etichette che vengono apposte ai contenuti

L’idea alla base dei tag è fare in modo che i contenuti siano ricercabili, correlabili e utilizzabili in base a parametri semantici (qualitativi e non quantitativi) definiti dagli utenti

Ragionare 2.0

Page 20: Seminario "Web 2.0 per la Statistica"

Dalla tassonomia alla folksonomia

Analisi cognitiva del tagging di Rashmihttp://www.rashmisinha.com/archives/05_09/tagging-cognitive.html

Il tagging può essere visto come una evoluzione della tassonomia classica: “from taxonomy to folksonomy”

Folksonomia: categorizzazione collaborativa di informazioni mediante l'utilizzo di parole chiave scelte liberamente

Scenari futuri: Ontolologie vs folksonomie, Web Semantico e Web 3.0

Page 21: Seminario "Web 2.0 per la Statistica"

Second Life

Second Life, un ambiente virtuale dove farsi una vita parallela con grafica 3D

Ogni utente può scegliersi o personalizzarti un personaggio e viaggiare e vivere in un mondo virtuale, spendendo o guadagnato linden dollars

Ridimensionato sia il numero di utenti attivi che la rilevanzadel business

Compravendita di “immobili” alle scommesse, dallo spaccio di droga alla prostituzione…ma qualcosa di buono?

Page 22: Seminario "Web 2.0 per la Statistica"

Second Life

L'avatar D73 all'ingresso del University of Portsmouth SL Research Centre

Page 23: Seminario "Web 2.0 per la Statistica"

Per non perdersi

RSSVantaggi rispetto alle tradizionali newsletter: la possibilità di avere un unico aggregatore per diverse fonti, evitare lo spam, ricevere in tempo reale un'informazione selezionata e personalizzata.

Page 24: Seminario "Web 2.0 per la Statistica"

Netvibes

Netvibes (così come Google Reader) consente di riorganizzare fonti informative in griglie personalizzate

http://www.netvibes.com

Page 25: Seminario "Web 2.0 per la Statistica"

Wiki in ambito statistico

Wiki in Istat: per gestire progetti, produrre pubblicazioni in modo collaborativo, avviare programmi educativi, condividere e commentare del materiale in ambito statistico, etc.

PBwiki è uno dei tanti servizi per la creazione e la gestione di wiki

http://www.apogeonline.com/webzine/2007/11/13/23/200711132301

Page 26: Seminario "Web 2.0 per la Statistica"

Wiki in ambito statistico

http://statistics.pbwiki.com/State%20Standards

Page 27: Seminario "Web 2.0 per la Statistica"

Wikipedia e la Statistica

http://it.wikipedia.org/wiki/Regressione_non_lineare

http://it.wikipedia.org/wiki/Moto_browniano

http://it.wikipedia.org/wiki/Ricerca_operativa

http://it.wikipedia.org/wiki/Censimento

http://it.wikipedia.org/wiki/Istat

Page 28: Seminario "Web 2.0 per la Statistica"

Condivisione di video scientifici

Non solo YouTube e Google Video

Video Lectures http://videolectures.net

Scivee, una piattaforma di scambio tra scienziati per video, abstract, paper, rating, commenti http://www.scivee.tv

WikiVideo http://www.wikivideo.it/corso.php?id=155

Page 29: Seminario "Web 2.0 per la Statistica"

Funzionamento di Scivee

http://www.oneweb20.it/21/01/2008/scivee-la-cultura-e-leducazione-viaggiano-online/

Page 30: Seminario "Web 2.0 per la Statistica"

Editoria 2.0: http://www.lulu.com/it/

Page 31: Seminario "Web 2.0 per la Statistica"

Blog statistici

Stat Project http://www.stat-project.com/

Data Steps http://datasteps.blogspot.com

Dataninja http://dataninja.wordpress.com/

WENSUI'S BLOG IN STATISTICAL COMPUTINGhttp://statcompute.spaces.live.com

Statistical Modeling, Causal Inference, and Social Science http://www.stat.columbia.edu/~gelman/blog

Page 32: Seminario "Web 2.0 per la Statistica"

Motori di ricerca 2.0Google Custom Search Engine (CSE)Motore di ricerca personalizzato per statisticihttp://www.google.com/coop/cse?cx=011691881635383585749%3Aug5syhxupjq

Motori di ricerca semanticihttp://www.lexxe.com

Ricerca visualehttp://www.grokker.com

Page 33: Seminario "Web 2.0 per la Statistica"

Web 2.0: approfondimenti teorici

o Algoritmi di indicizzazione e ricerca

o Probabilità e Web 2.0

o Analisi delle reti sociali

Page 34: Seminario "Web 2.0 per la Statistica"

Algoritmi di indicizzazione e ricerca

• http://it.wikipedia.org/wiki/Google

• http://it.wikipedia.org/wiki/Pagerank

Page 35: Seminario "Web 2.0 per la Statistica"

Algoritmi di indicizzazione e ricerca

Il successo di Google sta nell'algoritmo di ricerca ("Teorema di Randfish”?)

http://www.magnificaweb.it/algoritmo-di-google-teorema-di-randfish/

Un nuovo concorrente per Google: Wikia Searchhttp://search.wikia.com/wiki/Search_Wikia

…ed è possibile contribuire all’algoritmo

Motore Web 2.0 “italiano”http://www.ggoal.com/site/piz_search.php

Page 36: Seminario "Web 2.0 per la Statistica"

Il comportamento probabilistico (?) di Wikipedia

“Il punto non è che ogni voce di Wikipedia sia probabilistica, ma che l'intera enciclopedia si comporta in modo probabilistico ... Per dirlo in altro modo, nella Britannica la qualità varia da, diciamo, 5 a 9 con una media di 7. In Wikipedia varia da 0 a 10, con una media, diciamo, di 5. Ma visto che Wikipedia ha dieci volte le voci della Britannica, avete maggiori probabilità di trovare su Wikipedia una voce sensata su un qualunque argomento”

C. Anderson, La coda lunga

Possiamo formalizzare questa affermazione con l’introduzione di una v.a. e di una distribuzione di probabilità?

Page 37: Seminario "Web 2.0 per la Statistica"

Reti sociali: Da Sarnoff a Tilly

La legge di Metcalfe era un'evoluzione della legge di Sarnoff (pioniere della radiofonia) che sosteneva la relazione lineare tra gli utenti di una rete e il suo valore.

David Reed sostiene che il valore delle reti cresce in modo esponenziale.

Andrew Odlyzko e Benjamin Tilly: Metcalfe è eccessivamente ottimista, più prudente ipotizzare una crescita logaritmica

Immagine da www.kaltura.com

Page 38: Seminario "Web 2.0 per la Statistica"

Reti sociali: teoria dei grafi

Eulero e la teoria dei grafi

Erdős e Rény e i grafi a connessione casuale

“And what is your Erdős number?”

Page 39: Seminario "Web 2.0 per la Statistica"

Erdős Number (EN)

Distribuzione della v.a. EN tra i matematici censiti dal progetto

Mediana = 5Media = 4.65Deviazione standard = 1.21

http://www.oakland.edu/enp/trivia.html

Smarty, EN = 3

Page 40: Seminario "Web 2.0 per la Statistica"

Reti sociali: un approccio multidisciplinare…

Sei gradi di separazione di Stanley Milgram: la distanza con l’aborigeno australiano…

Legami deboli di Granovetter: dal Don Giovanni a LinkedIn

Page 41: Seminario "Web 2.0 per la Statistica"

Reti sociali: un approccio multidisciplinare…

Collective dynamics of small world networks di DuncanWatts e Steve Strogatz: > Alto livello di aggregazione e basso grado di separazione> Grafi casuali di Erdős

Reti a invarianza di scala di Albert-László Barabási:> L’evoluzione delle opinioni nelle reti sociali> Il sempre presente EN> IT e probabilità: attacchi mirati agli hub di una rete

Page 42: Seminario "Web 2.0 per la Statistica"

Legami deboli in un mondo piccolo (LinkedIn)

Page 43: Seminario "Web 2.0 per la Statistica"

La rete sociale di Gesù (Fonte: N.T.)

Page 44: Seminario "Web 2.0 per la Statistica"

…epistemologia della complessità

Altri temi delle reti sociali da approfondire da un punto di vista metodologico:

• Escalation dei fenomeni• Imprevedibilità• Ridondanza• Evoluzione a salti

Page 45: Seminario "Web 2.0 per la Statistica"

Perchè parlare di Web 2.0 agli statistici

StudentiNuovi metodi e strumentiApprofondimenti teorici su fenomeni web “appassionanti”Nuove opportunità lavorativeUniroma è già Web 2.0: http://www.uniroma.tv/

Ricercatori e professionistiStrumenti di condivisione del sapereStrumenti didatticiInnovazione di processo nel privato e nella PANuove opportunità di business

Page 46: Seminario "Web 2.0 per la Statistica"

Bibliografia Tim Berners Lee, L'architettura del nuovo Web, Feltrinelli, Milano, 2001

A.L. Barabasi, Link. La scienza delle reti, Einaudi, Torino, 2004

Henry Jenkins, Cultura convergente, Apogeo, Milano, 2007

Dal web 2.0 ai media sociali: Tracce e percorsi della partecipazione in rete A cura di CSP s.ca.rl. - Lara Marcellin, Fabiana Vernero, Ferdinando Ricchiuti, Enrico Sola, Andrea Toso, Giovanni Calia, CSP s.c.a.r.l., http://www.csp.it

Chris Anderson, La coda lunga, Codice edizioni, Torino, 2007

Sergio Maistrello, La parte abitata della rete, Tecniche Nuove, Milano, 2007

Howard Rheingold, Smart Mobs, Raffaello Cortina, Milano 2003

Pierre Lévy, L'intelligenza collettiva (per un'antropolgia del cyberspazio), Feltrinelli, Milano 1996

Daniele Frongia, Carlo Vaccari, Introduzione al Web 2.0 per la Statistica, Roma, 2008 (a febbraio su http://www.istat.it/dati/pubbsci/contributi)

Page 47: Seminario "Web 2.0 per la Statistica"

Quanto sei Web 2.0?

http://web20.designinterviews.com/quiz.php

Page 48: Seminario "Web 2.0 per la Statistica"

Contatti...Web 2.0

[email protected]

Bloghttp://segnalazionit.blogspot.com/

Skypedanielefrongia

LinkedInhttp://www.linkedin.com/in/frongia