Come estrarre dati e commenti degli utenti da articoli e social network

Post on 19-Nov-2014

219 views 2 download

description

Alcuni esempi e strumenti su come è possibile estrarre i commenti degli utenti per l'analisi di sentiment e la buzz analysis. Ulteriori informazioni sul sito www.semioanalysis.com

Transcript of Come estrarre dati e commenti degli utenti da articoli e social network

Sentiment Analysis:come estrarre dati e commenti degli

utenti da articoli e social network

Valentina Porcu valentina@semioanalysis.com

Aggiornamento - 1 Ottobre 2014

L’estrazione dei commenti per:

• analizzare l’interesse intorno a un soggetto o a un marchio

• variazioni dell’interesse nel tempo (ad esempio in seguito a una notizia)

• opinione dei commentatori riguardo al brand/soggetto in esame

Per questo motivo si parla di

sentiment analysis cosa gli utenti pensano di un prodotto/servizio/candidato

buzz analysis monitorare l’interesse nei confronti di un brand

Creare una base dati di commenti degli utenti

1. l’intervallo di tempo da analizzare

2. le pagine dei social network o siti che contengono le conversazioni

3. estrarre i dati

Copiare i dati a mano?

É più veloce utilizzare le tecniche per

l’estrazione automatica di dati

o

web scraping

Se sapete programmare

Esistono vari strumenti e librerie su più linguaggi di programmazione:

Scrapy

Portia

Gemme di Ruby (Scrubit, Scrapi)

Librerie di Python (BeautifulSoup, Urllib2)

Quelle di PHP (Curl)

Se non sapete programmare

Gli strumenti automatici, ad esempio:

Mozenda

Heritrix

Import.io

FMiner

Outwit

Wire

Utilizzi: le lead lists

vengono utilizzati soprattutto per le cosiddette lead lists, delle liste di contatti comprensivi di email e telefoni

“confezionate” per i motivi più svariati, dalla creazione di mailing list alle analisi di benchmark o sui competitors

A noi, in questo caso, interessa estrarre i commenti degli utenti

esistono vari modi per gestire i commenti degli utenti dal punto di vista di un sito web

quindi non è automatico utilizzare sempre lo stesso strumento

Ad esempio, Outwit, anche in versione gratuita, può essere utilizzato per i siti che gestiscono i commenti sulla normale pagina html

Oppure Import.io può essere utilizzato in modalità crawler o extractor per estrarre i commenti ai prodotti di Amazon

Per estrarre le conversazioni dalle pagine pubbliche di Facebook, ad esempio, possiamo usare Datatool

O, infine, potete utilizzare il Comment Extractor per estrarre i commenti dagli articoli con Disqus, da Amazon, dalle pagine pubbliche di Facebook, da IMDB o da

Youtube

copiando il link che vi interessa

e incollandolo nel Comment Extractor

I file di output sono solitamente in formato xls, csv o json, quasi tutti gestibili con excel

Oltre ai commenti sui siti uno degli strumenti più importanti per la sentiment:

…è senza dubbio

Cosa analizzare su Twitter

Testi

Numero di retweet

Numero di preferiti

Risposte

Gli strumenti per estrarre i dati da Twitter

Sono per la maggior parte a pagamento, e forniscono delle prime analisi dati

Qualche esempio:

Datasift

Tweetarchivist

Oppure…per raccogliere i dati (senza analisi) si può usare

Twitter Scraper

Scopri come utilizzare Comment Extractor e Twitter Scraper

http://www.semioanalysis.com/downloads/

…puoi anche scaricare le demo dei software

Se l’argomento ti interessa puoi trovarmi qui

valentina@semioanalysis.com

www.semioanalysis.com

Grazie!

Valentina