Seminario "Web 2.0 per la Statistica"
-
Upload
daniele-frongia -
Category
Technology
-
view
3.105 -
download
4
description
Transcript of Seminario "Web 2.0 per la Statistica"
Università di Roma “La Sapienza” Facoltà di Scienze Statistiche
23 gennaio 2008
Web 2.0: La Statistica ai tempi di YouTube e Wikipedia
Introduzione agli strumenti del nuovo Web
Daniele Frongia
Il presente materiale è distribuito con la licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo - 2.5 Italia”, reperibile presso il seguente sito Internet: http://creativecommons.org/licenses/by-nc-sa/2.5/it/.
Programma
Introduzione al Web 2.0 Wiki in ambiente statisticoWikipedia e la StatisticaCondivisione di video scientificiPubblicazioni scientifiche 2.0 Blog e motori di ricerca 2.0Algoritmi di indicizzazione e ricercaProbabilità e Web 2.0Analisi delle reti sociali
Web 2.0
Web 2.0: definizione di Wikipedia http://it.wikipedia.org/wiki/Web_2.0
Web 2.0, non si sa cos'è ma si misura lo stessohttp://punto-informatico.it/p.aspx?id=1948763
Web 2.0: una definizionehttp://blog.nicolamattina.it/?p=238
Elementi innovativi del Web 2.0
L’elemento innovativo consiste nella combinazione di vecchie tecnologie e standard (come HTML, CSS, XML, JavaScript, DOM) per realizzarne di nuove (come AJAX)
RIA: Rich Internet Application
Mashup...
Mashup
http://www.deeario.it/2006/08/21/mashup-mappa-dei-blog-italiani/
http://pipes.yahoo.com/pipes/
http://softwarecommunity.intel.com/articles/eng/1505.htm
http://code.google.com/apis/gdata/basics.html
Tipologia strumento Web 2.0 Esempi
Social bookmarking Blue Dot, del.icio.us, StumbleUpon,Technorati
Calendaring Google Calendar, bCal, Yahoo!Calendar
Images / Video Sharing YouTube, Flickr, FOTOLOG
Collaborative authoring Wikipedia, PBwiki, Basecamp, SocialText, Writely
Social Networking MySpace, Orkut, Facebook, Hi5,Friendster, LinkedIn, Neurona, Ning
Blogs Blogger, Skyblog, dBlog, Splinder,WordPress
Communications tools Windows Live Messenger, ICQ,Google Talk, Yahoo! Messenger
Social games Second Life, Half Life, World ofWarcraft, Lineage, RuneScape, FinalFantasy XI, Online Chess
Feed reader / News aggregator Netvibes, Google Reader,FeedReader, Liferea, Straw
File sharing Gnutella, eMule, BitTorrent,Napster, Kazaa
Strumenti 2.0: una prima lista
Caratteristiche Web 2.0
Le caratteristiche più importanti del Web 2.0 sono:
* I siti Web 2.0 sono piattaforme che consentono una forte interazione tra utenti
* Gli utenti usufruiscono di servizi innovativi mediante potenti interfacce grafiche
* Gli utenti forniscono il valore aggiunto con la produzione di contenuti e la condivisione della conoscenza
* I servizi offerti vengono aggiornati di continuo ( “perpetual beta”)
“Il Web è il palcoscenico e la star sei tu”Centralità e protagonismo dell'utente
Statistiche sull’uso del Web 2.0
YouTube e Second Life i primi della classe?
Quali sono i siti realmente più visitati e utilizzati?
Alcune indagini hanno provato a far luce sul alcuni aspetti del fenomeno.
http://tallblog.conted.ox.ac.uk/index.php/2007/03/16/some-real-data-on-web-20-use/
Strumenti 2.0: i Blog
http://it.wikipedia.org/wiki/Blog
http://www.youtube.com/watch?v=IKcqge8SvzQ
Nati nel 1997, esplosi nel 2002, quanti sono?
Blog
Strumenti 2.0: i Wiki
Wiki: ambiente web di condivisione e gestione di documenti e file dove gli utilizzatori possono visualizzare e aggiungere contenuti, ma anche di modificare i contenuti esistenti inseriti da altri utilizzatori.
http://www.youtube.com/watch?v=-dnL00TdmLY
Sulla tecnologia Wiki si basa il funzionamento dell’enciclopedia online Wikipedia.
La regina 2.0: Wikipedia
“Uno sforzo per creare e distribuire una enciclopedia libera della più alta qualità possibile ad ogni singola persona sul pianeta nella propria lingua” - Jimmy Wales
Wikipedia, con oltre 9 milioni di voci e 10 milioni di utenti registrati, rappresenta la più grande collezione di sapere umano. Wikipedia esiste in oltre 250 lingue differenti e riceve oltre 60 milioni di accessi al giorno.
Sull’attendibilità di Wikipedia
Nel 2006 la rivista Nature ha confrontato Wikipedia e la prestigiosa Enciclopedia Britannica, giungendo a un giudizio di sostanziale parità quanto ad autorevolezza (3.86 errori per voce per Wikipedia, 2.92 l’EnciclopediaBritannica).
Wikipedia: le motivazioni
Fonte: ACM http://delivery.acm.org
Il futuro di Wikipedia
Proposte finalizzate a migliorare i contenuti (XVI International World Wide Web Conference):
● Definizione della reputazione degli utenti sulla base delle modifiche effettuate. Se il contributo resiste alle modifiche siguadagna reputazione, mentre se il contributo viene sostituito dalla versione precedente la reputazione scende.
● Segnalazione degli interventi faziosi prendendo in considerazione l’identità dell’utente.
Strumenti 2.0 per la condivisione dei documenti
Alcuni strumenti 2.0 si propongono di realizzare una scrittura collaborativa via web
Servizi online che consentono la condivisione di documenti (file, e non pagine web come per i wiki):
Google Docs e Zoho Writer, strumenti per creare, modificare e condividere documenti
Scribd, una sorta di YouTube per documenti in formato Word, PDF, Excel o PowerPoint
SlideShare e Zoho Show
Tagging
Nel Web 2.0, per tag si intendono delle etichette che vengono apposte ai contenuti
L’idea alla base dei tag è fare in modo che i contenuti siano ricercabili, correlabili e utilizzabili in base a parametri semantici (qualitativi e non quantitativi) definiti dagli utenti
Ragionare 2.0
Dalla tassonomia alla folksonomia
Analisi cognitiva del tagging di Rashmihttp://www.rashmisinha.com/archives/05_09/tagging-cognitive.html
Il tagging può essere visto come una evoluzione della tassonomia classica: “from taxonomy to folksonomy”
Folksonomia: categorizzazione collaborativa di informazioni mediante l'utilizzo di parole chiave scelte liberamente
Scenari futuri: Ontolologie vs folksonomie, Web Semantico e Web 3.0
Second Life
Second Life, un ambiente virtuale dove farsi una vita parallela con grafica 3D
Ogni utente può scegliersi o personalizzarti un personaggio e viaggiare e vivere in un mondo virtuale, spendendo o guadagnato linden dollars
Ridimensionato sia il numero di utenti attivi che la rilevanzadel business
Compravendita di “immobili” alle scommesse, dallo spaccio di droga alla prostituzione…ma qualcosa di buono?
Second Life
L'avatar D73 all'ingresso del University of Portsmouth SL Research Centre
Per non perdersi
RSSVantaggi rispetto alle tradizionali newsletter: la possibilità di avere un unico aggregatore per diverse fonti, evitare lo spam, ricevere in tempo reale un'informazione selezionata e personalizzata.
Netvibes
Netvibes (così come Google Reader) consente di riorganizzare fonti informative in griglie personalizzate
http://www.netvibes.com
Wiki in ambito statistico
Wiki in Istat: per gestire progetti, produrre pubblicazioni in modo collaborativo, avviare programmi educativi, condividere e commentare del materiale in ambito statistico, etc.
PBwiki è uno dei tanti servizi per la creazione e la gestione di wiki
http://www.apogeonline.com/webzine/2007/11/13/23/200711132301
Wiki in ambito statistico
http://statistics.pbwiki.com/State%20Standards
Wikipedia e la Statistica
http://it.wikipedia.org/wiki/Regressione_non_lineare
http://it.wikipedia.org/wiki/Moto_browniano
http://it.wikipedia.org/wiki/Ricerca_operativa
http://it.wikipedia.org/wiki/Censimento
http://it.wikipedia.org/wiki/Istat
Condivisione di video scientifici
Non solo YouTube e Google Video
Video Lectures http://videolectures.net
Scivee, una piattaforma di scambio tra scienziati per video, abstract, paper, rating, commenti http://www.scivee.tv
WikiVideo http://www.wikivideo.it/corso.php?id=155
Funzionamento di Scivee
http://www.oneweb20.it/21/01/2008/scivee-la-cultura-e-leducazione-viaggiano-online/
Editoria 2.0: http://www.lulu.com/it/
Blog statistici
Stat Project http://www.stat-project.com/
Data Steps http://datasteps.blogspot.com
Dataninja http://dataninja.wordpress.com/
WENSUI'S BLOG IN STATISTICAL COMPUTINGhttp://statcompute.spaces.live.com
Statistical Modeling, Causal Inference, and Social Science http://www.stat.columbia.edu/~gelman/blog
Motori di ricerca 2.0Google Custom Search Engine (CSE)Motore di ricerca personalizzato per statisticihttp://www.google.com/coop/cse?cx=011691881635383585749%3Aug5syhxupjq
Motori di ricerca semanticihttp://www.lexxe.com
Ricerca visualehttp://www.grokker.com
Web 2.0: approfondimenti teorici
o Algoritmi di indicizzazione e ricerca
o Probabilità e Web 2.0
o Analisi delle reti sociali
Algoritmi di indicizzazione e ricerca
• http://it.wikipedia.org/wiki/Google
• http://it.wikipedia.org/wiki/Pagerank
Algoritmi di indicizzazione e ricerca
Il successo di Google sta nell'algoritmo di ricerca ("Teorema di Randfish”?)
http://www.magnificaweb.it/algoritmo-di-google-teorema-di-randfish/
Un nuovo concorrente per Google: Wikia Searchhttp://search.wikia.com/wiki/Search_Wikia
…ed è possibile contribuire all’algoritmo
Motore Web 2.0 “italiano”http://www.ggoal.com/site/piz_search.php
Il comportamento probabilistico (?) di Wikipedia
“Il punto non è che ogni voce di Wikipedia sia probabilistica, ma che l'intera enciclopedia si comporta in modo probabilistico ... Per dirlo in altro modo, nella Britannica la qualità varia da, diciamo, 5 a 9 con una media di 7. In Wikipedia varia da 0 a 10, con una media, diciamo, di 5. Ma visto che Wikipedia ha dieci volte le voci della Britannica, avete maggiori probabilità di trovare su Wikipedia una voce sensata su un qualunque argomento”
C. Anderson, La coda lunga
Possiamo formalizzare questa affermazione con l’introduzione di una v.a. e di una distribuzione di probabilità?
Reti sociali: Da Sarnoff a Tilly
La legge di Metcalfe era un'evoluzione della legge di Sarnoff (pioniere della radiofonia) che sosteneva la relazione lineare tra gli utenti di una rete e il suo valore.
David Reed sostiene che il valore delle reti cresce in modo esponenziale.
Andrew Odlyzko e Benjamin Tilly: Metcalfe è eccessivamente ottimista, più prudente ipotizzare una crescita logaritmica
Immagine da www.kaltura.com
Reti sociali: teoria dei grafi
Eulero e la teoria dei grafi
Erdős e Rény e i grafi a connessione casuale
“And what is your Erdős number?”
Erdős Number (EN)
Distribuzione della v.a. EN tra i matematici censiti dal progetto
Mediana = 5Media = 4.65Deviazione standard = 1.21
http://www.oakland.edu/enp/trivia.html
Smarty, EN = 3
Reti sociali: un approccio multidisciplinare…
Sei gradi di separazione di Stanley Milgram: la distanza con l’aborigeno australiano…
Legami deboli di Granovetter: dal Don Giovanni a LinkedIn
Reti sociali: un approccio multidisciplinare…
Collective dynamics of small world networks di DuncanWatts e Steve Strogatz: > Alto livello di aggregazione e basso grado di separazione> Grafi casuali di Erdős
Reti a invarianza di scala di Albert-László Barabási:> L’evoluzione delle opinioni nelle reti sociali> Il sempre presente EN> IT e probabilità: attacchi mirati agli hub di una rete
Legami deboli in un mondo piccolo (LinkedIn)
La rete sociale di Gesù (Fonte: N.T.)
…epistemologia della complessità
Altri temi delle reti sociali da approfondire da un punto di vista metodologico:
• Escalation dei fenomeni• Imprevedibilità• Ridondanza• Evoluzione a salti
Perchè parlare di Web 2.0 agli statistici
StudentiNuovi metodi e strumentiApprofondimenti teorici su fenomeni web “appassionanti”Nuove opportunità lavorativeUniroma è già Web 2.0: http://www.uniroma.tv/
Ricercatori e professionistiStrumenti di condivisione del sapereStrumenti didatticiInnovazione di processo nel privato e nella PANuove opportunità di business
Bibliografia Tim Berners Lee, L'architettura del nuovo Web, Feltrinelli, Milano, 2001
A.L. Barabasi, Link. La scienza delle reti, Einaudi, Torino, 2004
Henry Jenkins, Cultura convergente, Apogeo, Milano, 2007
Dal web 2.0 ai media sociali: Tracce e percorsi della partecipazione in rete A cura di CSP s.ca.rl. - Lara Marcellin, Fabiana Vernero, Ferdinando Ricchiuti, Enrico Sola, Andrea Toso, Giovanni Calia, CSP s.c.a.r.l., http://www.csp.it
Chris Anderson, La coda lunga, Codice edizioni, Torino, 2007
Sergio Maistrello, La parte abitata della rete, Tecniche Nuove, Milano, 2007
Howard Rheingold, Smart Mobs, Raffaello Cortina, Milano 2003
Pierre Lévy, L'intelligenza collettiva (per un'antropolgia del cyberspazio), Feltrinelli, Milano 1996
Daniele Frongia, Carlo Vaccari, Introduzione al Web 2.0 per la Statistica, Roma, 2008 (a febbraio su http://www.istat.it/dati/pubbsci/contributi)
Quanto sei Web 2.0?
http://web20.designinterviews.com/quiz.php
Contatti...Web 2.0
Bloghttp://segnalazionit.blogspot.com/
Skypedanielefrongia
LinkedInhttp://www.linkedin.com/in/frongia