Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle...

23
RSS Sistemi di Elaborazione dell’informazione II Corso di Laurea Specialistica in Ingegneria Telematica II anno 4 CFU Università Kore Enna A.A. 2009-2010 Alessandro Longheu http://www.diit.unict.it/users/alongheu [email protected]

Transcript of Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle...

Page 1: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

RSS

Sistemi di Elaborazione dell’informazione II

Corso di Laurea Specialistica in Ingegneria TelematicaII anno – 4 CFUUniversità Kore – Enna – A.A. 2009-2010

Alessandro Longheu

http://www.diit.unict.it/users/[email protected]

Page 2: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

2

RSS è un’applicazione XML, ossia un linguaggio basato su XML,che definisce una propria sintassi (tag) e semantica (utilizzo tag)

RSS è uno dei più popolari formati per la distribuzione di contenutiWeb, quasi uno standard de facto

RSS è l’acronimo di “RDF Site Summary”, o “Rich Site Summary”o infine di “Really Simple Syndication”; in ambito giornalistico oeditoriale, “syndication” indica il processo con cui un giornalistavende il proprio pezzo, tramite una agenzia, a più giornali oriviste. La Web Syndication indica quindi la diffusione di contenutigenerici (news, link, URL, ecc.) a più lettori, tramite i flussi Web(feed RSS).

RSS definisce una struttura adatta a contenere un insieme dinotizie, ciascuna composta da vari campi (nome autore, titolo,testo, riassunto, ...). Quando si pubblicano delle notizie in formatoRSS, la struttura viene aggiornata con i nuovi dati; essendo ilformato predefinito, un qualunque lettore RSS potrà presentare inuna maniera omogenea notizie provenienti da fonti diverse.

RSS: definizione

Page 3: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

3

Due punti di vista:1. Per i webmaster, gli RSS rappresentano un modo per

ripubblicare i contenuti del proprio sito in una sorta dilinguaggio standard, che può essere letto ed eventualmenteripubblicato anche su siti, piattaforme e sistemi diversi daquello di partenza.

2. Per gli utenti, gli RSS sono un modo semplice ma potente diraccogliere contenuti da diverse fonti sul web, facilitando così lapossibilità di rimanere sempre aggiornati sulle ultime notiziepubblicate dai propri siti preferiti senza doverli visitare ognivolta singolarmente.

• Storicamente lanciato da Netscape, permetteva la visualizzazionesul portale MyNetscapeNetwork di headline e link relativi a notiziepubblicate su altri siti; fu adottato progressivamente dalla comunitàdei blogger: i post di un blog sono facilmente esportabili in RSS

RSS: definizione

Page 4: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

4

Considerando le versioni, esistono almeno tre differenti“dialetti”:RSS 0.91: il più vecchio tra gli standard oggi in uso,diretta evoluzione del formato usato originariamente daNetscape. In alcuni casi si è preferito usare il successivoRSS 0.92;RSS 2.0: rilasciato da Userland (software house) nel2002, è l'evoluzione del formato 0.92, di cui eredita lasemplicità, ma a cui aggiunge il supporto per moduliaggiuntivi;RSS 1.0: è il formato ufficiale del W3C, conforme ad RDF,estensibile e modulare.

Versioni di RSS

Page 5: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

5

le versioni superate non sono scomparse. I feed in formatoRSS 0.91 o 0.92 sono molto utilizzati, principalmente per laloro semplicità e per il fatto di essere più che sufficienti peruna syndication di base, ridotta all'essenziale.Chi deve preoccuparsi per la presenza di propostecontrapposte? Non chi consuma RSS: sono in grado di leggeretranquillamente tutti i formati. Se ne deve preoccupare,invece, il programmatore che voglia, per esempio, trasformareun feed.Chi produce contenuti da distribuire in formato RSS scegliequindi quale versione utilizzare o, come avviene nella maggiorparte dei casi, esporta i propri contenuti in tutti i formatidisponibili.

Versioni di RSS

Page 6: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

6

Esempio:

RSS

Page 8: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

8

La fruizione di un documento RSS avviene attraverso il feedreader, programma che effettua il download di un feed RSS(noto l'URL), e visualizza i contenuti in base alle preferenzedell'utente, oppure tramite i podcatcher (multimediali)

Spesso i feed reader sono in grado di rilevareautomaticamente se il produttore del feed ha effettuatoaggiornamenti, effettuandone il download a intervalli di temporegolari o in tempo reale.

I feed reader possono essere stand-alone (ad esempioFreeReader), oppure plug-in all'interno di altri programmi (e-mail, browser); esistono anche per dispositivi mobili(cellulari, palmari, ecc.), ed infine come aggregators

Elenco di feed reader:http://www.metacentric.net/feed/reader/desktop/Contents.jsp

Fruizione feed RSS

Page 9: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

9

Fruizione feed RSS

In seguito all'aumento di popolarità del formato RSSe alla sua standardizzazione, sono nati diversi servizionline che fungono da "collettori" di contenuti: icosiddetti aggregatori. Un aggregator è un feedreader il cui obiettivo è quello di fornire un unicopunto d'accesso a notizie provenienti da varie fonti,così l’utente accede a tutte le notizie attraverso ununico sito Web (l'aggregatore), evitando di dovervisitare, uno per uno, i siti da cui provengono lenotizie stesseEsempio: il servizio di Google (reader) o

http://www.eufeeds.eu/it, che aggrega news daparecchie fonti

Page 10: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

10

Pagine iniziali personalizzabili, o “DesktopVirtuali”, che sono (ancora) aggregator:

http://www.google.it/ig http://my.yahoo.com/ http://www.netvibes.com/ http://www.pageflakes.com/ http://www.yourminis.com/

Fruzione feed RSS

Page 11: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

11

Fruizione feed RSS

Confronto fra on-linefeed readers (2006)

Page 12: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

12

Un podcatcher è essenzialmente un feed reader perfile multimediali, e la maggior parte di essi permette diattivare automaticamente il download, di organizzare edi guardare o ascoltare i file multilmediali da unasingola applicazione. Un esempio su tutti: ilprogramma Itunes, ma anche Miro

Il podcasting è un sistema che permette di scaricarein modo automatico documenti multimediali chiamatipodcast, utilizzando un programma chiamatopodcatcher.

Podcasting è un termine basato sulla fusione di dueparole: iPod e broadcasting

Fruizione feed RSS

Page 13: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

13

Un altro caso di feed reader è costituito dai news radar: aRSS feed which is the result of aggregating, mixing andfiltering many source-specific and search-based RSS feeds.

A newsradar is a stream of news items covering a veryspecific topic. A newsradar is usually created byaggregating together news feeds from a multitude ofsources covering the specific topic selected and adding tothe resulting mix content items found through the use ofso-called search feeds. Newsradars normally require theuse of sophisticated filtering algorithms to eliminateduplicates and to include and exclude content based on anumber of variable factors.

Una forma rudimentale di news radar utile sia per il propriobusiness che ai blogger professionali è il cosiddetto "egoradar", conosciuto anche come “vanity feed”. Si riferiscealla creazione di feed per monitorare il proprio nome, oquello del proprio prodotto, azienda, blog.

RSS - Estensioni

Page 14: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

14

Il LifeStream è invece un aggregato dei feed personaliottenuto sia mediante video feed diretti che aggregando ilcontenuto online della stessa persona come blog post,aggiornamenti sui social network, foto online, ecc. Questorisulta utile per chi ha molti feed su siti come Twitter,YouTube, Flickr e Last.fm.

Un LifeStream può essere realizzato tramite diversisoftware online, ad esempio Jaiku e Tumblr, che effettuanola copia dei feed dai social media specificati e aggreganotutto il tuo contenuto insieme in un flusso di informazioni.

Ogniqualvolta che un’informazione viene aggiornata su unodi questi siti, l’intero flusso viene aggiornato; è possibileanche per gli “amici” sottoscriversi al lifestream, in mododa avere un unico canale di comunicazione

RSS - Estensioni

Page 15: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

15

Molte popolari piattaforme di blogging come Wordpress,Movable o Blogger assegnano automaticamente ad un blogil rispettivo RSS feed. Creare un feed è comunquepossibile con servizi come Feedburner.

Dopo la creazione, può essere utile una fase diregistrazione presso RSS directories, per pubblicizzareil proprio feed

Quando un sito non possiede RSS feed, è possibile creareun feed associato; questo processo è chiamato “feedscraping” e diversi sono i servizi disponibili ad esempioFeed43, Feedfire e Feedyes. L’operazione richiede diinserire la URL del sito, e i servizi menzionati cercano etrovano il contenuto da poter sottoscrivere. Selezionando leinformazioni chiave ed eliminando gli item non rilevanti (es.menù e metadata) si avranno le parti del sito che piùinteressano.

RSS – Creazione

Page 16: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

16

Sui feed RSS è possibile effettuareulteriori elaborazioni, quali filtraggio (perparole chiave), integrazione eaggregazione, conversione (da e versoHTML o altri formati)

Diversi i siti a supporto di qeste pre e postelaborazioni, ad esempio: http://www.blogbridge.com/ http://www.mysyndicaat.com

RSS - Manipolazione

Page 17: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

17

Oltre alla semplice fruizione, i feed possono essere usatianche per altri scopi, come business (b2b e b2c),marketing, sicurezza online, video entertainment ecc. Diseguito qualche esempio: Integrazione con gruppi usenet: Google Groups

può essere monitorato usando i feed RSS; aggiungendo"/feed/msgs.xml" a fine URL del gruppo desiderato.Questa possibilità è anche offerta da altri, ad esempio:http://www.yahoogroups.com/,http://www.socialtext.net/, http://www.near-time.com/

Calendario condiviso: i calendari condivisi possonoessere usati per promuovere gruppi scolastici, eventisportivi ecc. Un calendario condiviso può esserepienamente sindacato e condiviso usando i feed RSS.Servizi: http://www.calendarhub.com/,http://www.rsscalendar.com/, http://www.zimbra.com/

RSS - Utilizzi

Page 18: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

18

Previsioni del tempo: http://weather.yahoo.com/rss/,http://www.weather.com/

Ricerca lavoro: http://www.careermag.com/MKT/RSS/,http://www.rssjobs.com/

Egosearcher. Le Ego searches sono ricerche progettateper monitorare blog, portali di news per verificare quando èmenzionata una compagnia, un prodotto, un competitoroppure specifiche keyword. Le ego searches permettono dimantenere un vantaggio strategico su i competitor.Indirizzi: http://www.egosurf.org/,http://www.technorati.com/

Monitoraggio spedizioni via corriere (UPS, DHL, FedEx):http://www.simpletracking.com/,http://www.packtrack.com/

RSS - Utilizzi

Page 19: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

19

Monitorare le aste: Gli articoli su eBay come su altri sitidi aste online possono essere monitorati via RSS in mododa sapere in tempo reale l’uscita di nuovi prodotto.Indirizzi: http://www.freebiddingtools.com/,http://www.auctionmonitor.net/,http://www.rssauction.com/

Price Watching: Il Price watching permette di monitorarele modifiche dei prezzi di specifici prodotti su particolarimercati: http://www.rsstalker.com/

Video editing collaborativo: http://www.jumpcut.com/,http://www.eyespot.com/

X-eventi: gli X-eventi sono modi nuovi di interagire con unevento live che estendono la qualità dell’interazione prima edopo l’evento attraverso RSS, blog, P2P, forum, wiki e altritool, per espandere la portata dell’evento e la suapotenziale monetizzazione (http://www.eventmingle.com/)

RSS - Utilizzi

Page 20: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

20

Per effettuare la conversione di un feed RSS in html,esistono diversi servizi disponibili in rete, la maggiorparte dei quali fa uso di javascript o php, inparticolare:

Nel primo caso solitamente basta inserire la URL delfeed RSS, personalizzarne il layout, copiare le pochelinee di codice Javascript risultanti ed incollarle nelcodice della propria pagina web, avendo così un flussocostante di news aggiornate. Questa (semplice)soluzione ha lo svantaggio che le news nella paginanon possono essere lette dai bot dei motori di ricercache analizzano il contenuto del tuo sito.

coloro che sono interessati a strategie per migliorare ilposizionamento sui motori dovrebbero consideraresoluzioni basate su PHP.

RSS vs HTML

Page 21: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

21

Siti di riferimento per converire feed in HTML http://www.geckotribe.com/rss/jawfish/ http://www.feedburner.com/fb/a/publishers/buzzboost http://www.howdev.com/products/feedsweep/ http://www.rss-to-javascript.com/ http://www.feedrollpro.com/ http://www.rss-info.com/ http://www.rssfeedreader.com/ http://www.rss2html.com/

RSS vs HTML

Page 22: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

22

E’ anche possibile inserire nel sito un aggregator (webwidgets); il contenuto delle news anche in questo casonon può essere letto dai motori di ricerca. Siti: http://www.grazr.com/ http://www.musestorm.com/widgets/

Altri servizi permettono anche di filtrare ed editarepersonalmente il contenuto delle news prima dipubblicarlo sul web. Siti: http://www.mysyndicaat.com/ http://www.feeddigest.com/ http://www.tecnorama.org/ http://www.geckotribe.com/rss/carp/

RSS vs HTML

Page 23: Sistemi di Elaborazione dell’informazione II...A. Longheu –Sistemi di Elaborazione delle Informazioni II5 le versioni superate non sono scomparse. I feed in formato RSS 0.91 o

A. Longheu – Sistemi di Elaborazione delle Informazioni II

23

Spunti per esercitazioni: A partire da una notizia prelevata da un sito giornalistico,

scrivere manualmente il file RSS corrispondente (sceglierela versione)

Creare un news radar per un argomento a scelta, o un egoradar per un personaggio famoso a scelta

Scelto un sito web, effettuarne il feed scraping, lasuccessiva registrazione presso una RSS directory, e lasottoscrizione con un feed reader

Creare un calendario condiviso tramite feed RSS, nel qualesuccessivamente inserire ognuno il proprio evento(compleanno ecc.) e monitorarne la diffusione

Realizzare una o piu’ pagine web che integrino i feed deipunti precedenti visualizzandoli in HTML

RSS