IL LINGUAGGIO DELLE TESTATE ONLINE

21
IL LINGUAGGIO DELLE TESTATE ONLINE Tesina di Fabio A. Cappelletto Corso di Metodi Statistici di Analisi dei Testi – Prof.ssa Arjuna Tuzzi Corso di Laurea in Strategie di Comunicazione Università degli Studi di Padova – Anno Accademico 2009/2010

Transcript of IL LINGUAGGIO DELLE TESTATE ONLINE

Page 1: IL LINGUAGGIO DELLE TESTATE ONLINE

IL LINGUAGGIO DELLE TESTATE ONLINE

Tesina di Fabio A. CappellettoCorso di Metodi Statistici di Analisi dei Testi – Prof.ssa Arjuna TuzziCorso di Laurea in Strategie di ComunicazioneUniversità degli Studi di Padova – Anno Accademico 2009/2010

Page 2: IL LINGUAGGIO DELLE TESTATE ONLINE

INDICE

Introduzione pag. 1Metodologia adottata pag. 2Risultati pag. 3Conclusioni pag. 10Appendici pag. 13

1. INTRODUZIONE

Internet, secondo la Online News Association, che riunisce oltre 600 esperti dell'informazione, è «il mezzo di comunicazione più potente apparso dalla nascita della televisione.»

La rete, in favore del giornalismo, racchiude almeno tre vantaggi: si presta alla sintesi informativa, bisogno ormai radicato nella società contemporanea; permette uno scambio migliore e rapido di interazioni tra produttori e fruitori di notizie; consente un aggiornamento del flusso informativo in tempo reale. La notizia online prevede dunque sintesi, precisione, una ritrovata chiarezza espositiva e la possibilità di approfondimento.

Dall’inizio del nuovo Millennio, le testate digitali si sono affermate e potenziate sempre di più in tutto il mondo. Così, anche in Italia i maggiori quotidiani nazionali hanno iniziato a sviluppare sempre di più la loro versione Web.

Al giorno d’oggi tali testate sono autonome dalla versione cartacea, ovverosia sono dotate di una loro redazione specifica e di un’organizzazione apposita.

In questa tesina si vuole allora avere come oggetto di studio il linguaggio delle pubblicazioni di questi “giornali digitali”. Il Web infatti, come ogni altro media, è dotato di una propria specificità che ne caratterizza il linguaggio. Con quest’ultimo intendiamo sia la forma che il contenuto dei testi che vi compaiono.

Le testate hanno capito che la formula più sbagliata per avere successo nel Web è riproporvi quanto già compare nelle versioni cartacee. Ovviamente, anche una testata digitale è formata essenzialmente da articoli, ma si pensa che essi possano avere una forma e un contenuto diversi da quanto compare nei fogli di carta. Anzi, negli ultimi anni è possibile osservare come gli stessi articoli online abbiano iniziato a influenzare quelli su carta, che hanno iniziato ad essere più corti e con una formattazione più moderna. Ma non è questo l’argomento della tesina.

In questa pubblicazione verranno analizzati i nuovi linguaggi che si possono osservare via Web: si osserverà se il lessico presenta delle novità nel panorama italiano, se si presenta più formale oppure più vicino alla lingua comune lettore. Verranno

1

Page 3: IL LINGUAGGIO DELLE TESTATE ONLINE

individuate le formule che caratterizzano solitamente gli articoli online, per ricercare le linee guida di questa nuova tendenza.

In linea generale questa tesina vuole rispondere ad alcune domande riguardo questo settore che, per il suo recente sviluppo, è ancora poco indagato:

1. qual è il livello di formalità degli articoli presenti nel Web?2. con che quantità e qualità sono presenti forme tipicamente giornalistiche e

quali sono le forme più usate nei campi sportivo e cronaca-politico?3. quali sono i termini specifici più ricorrenti per ogni singola testata?4. Quali nomi propri sono i più citati? Fanno riferimento a particolari ambiti

tematici?Con un’analisi di tale tipo non solo riusciremo ad avere un’idea generale della

lingua usata negli articoli online, ma anche dei temi di maggiore attualità nell'Italia di questo periodo.

La tesina vuole essere una sorta di primo test per quanto riguarda questo argomento di studio ancora poco esplorato e con poche basi su cui poter iniziare il lavoro.

Nello specifico, saranno analizzati in particolare gli articoli delle edizioni digitali dei tre maggiori quotidiani italiani: il Corriere della Sera (corriere.it), la Repubblica (repubblica.it) e la Gazzetta dello Sport (gazzetta.it). Va tenuto conto che, nel caso della gazzetta.it, il tema degli articoli sarà quasi totalmente sportivo.

2. METODOLOGIA ADOTTATA

Il primo passo per l’analisi è stata la costruzione del corpus. Per corpus si intende l’insieme di tutti gli articoli di testo che sono stati scelti e messi insieme per procedere nello studio. Sono stati selezionati articoli dalle versioni digitali dei tre maggiori giornali italiani: gazzetta.it, repubblica.it e corriere.it.

Il metodo utilizzato nella scelta è stato il seguente:• numero 28 articoli per il corriere.it, così distribuiti: 4 per la sezione

“politica”, 4 per la sezione “cronaca”, 4 per “esteri”, 4 per “economia”, 4 per “cultura”, 4 per “sport” e 4 per “editoriali”;

• numero 28 articoli per la repubblica.it, con la stessa distribuzione attuata per il corriere.it;

• numero 28 articoli per la gazzetta.it, tutti, ad eccezione di un unico caso, inerenti alla categoria sport – sia esso calcio, basket, ciclismo o quant’altro. Il caso d’eccezione è un articolo di cronaca-politica.

Gli articoli sono stati raccolti nel mese di Dicembre 2009.La scelta della suddivisione degli articoli per aree tematiche è stata fatta per

avere una certa spalmatura ottimale degli argomenti, nonostante essi non siano un

2

Page 4: IL LINGUAGGIO DELLE TESTATE ONLINE

fattore rilevante per l’analisi. Infatti, ci concentreremo essenzialmente sul linguaggio presente in genere negli articoli, senza distinzione della loro area tematica.

Gli unici veri confronti saranno fatti invece confrontando i linguaggi delle diverse testate digitali, per cercare di vedere quali sono le particolarità di ognuna e come vogliono presentarsi ai loro lettori.

In una seconda fase si è proceduto all’analisi mediante il software Taltac®, con il quale è stato elaborato l’intero corpus degli 84 articoli raccolti.

3. RISULTATI

I primi risultati mostrano in generale come sia composto il corpus:

Occorrenze: N= 41189Forme grafiche: V= 9248

Tradotto in parole, il corpus di tutti gli articoli presenta 41189 termini totali (o token), ma solo 9248 sono types, ovverosia le forme grafiche diverse (o modalità).

In particolare, per quanto riguarda corriere.it vi sono 4537 forme per 14238 occorrenze; in repubblica.it 4016 forme per 12537 occorrenze; infine gazzetta.it con 4392 forme grafiche e 14739 occorrenze.

Mediamente un singolo articolo è composto da 490 parole. Il risultato deriva dalla divisione tra il numero totale di occorrenze per il numero degli articoli che compongono il corpus.

Alcune altre considerazioni a livello generale possono essere utili per introdurre l’analisi. Anzitutto, per quanto riguarda la ricchezza lessicale, diamo un primo sguardo ai seguenti tre elementi:

(V/N)*100= 22,453

In linea generale, più alto è il valore del rapporto tra V e N, più alta è la frequenza di parole che si ripetono una sola volta nel corpus.

La percentuale di hapax allora, ossia la percentuale di forme grafiche che compaiono un’unica volta nell’intero corpus, risulta:

(V1/V)*100= 60,359%

Questo valore sta a significare che la grande maggioranza di forme grafiche ritrovate (60,4% circa) viene utilizzata un’unica volta in tutto l’insieme degli articoli

3

Page 5: IL LINGUAGGIO DELLE TESTATE ONLINE

raccolti. La tesina non si concentrerà su questi termini hapax, ma andrà alla ricerca del vocabolario significativo delle parole presenti nel corpus con una frequenza minima.

La frequenza media generale è invece:

N/V= 4,454

Questo valore significa che mediamente è possibile trovare un lemma già ripetuto all’interno del corpus ogni 4,5 parole circa.

3.1 FORMALITÀ DEL CORPUS

In questa fase centrale della tesina ci concentreremo sul lessico presente nelle testate online, per cercare di rispondere alle domande principali di cui all’introduzione.

Per quanto riguarda il grado di formalità sono stati selezionati tutti i vocaboli presenti in ognuna delle tre testate, con numero di lettere superiore a 3 ed esclusi sia quelli di fascia alta che gli hapax. Nella lista sono state escluse le parole che non fossero verbi, nomi, aggettivi o avverbi. La lista ottenuta ha fornito un’indicazione del livello generale di difficoltà degli stessi articoli. Da un’analisi dei singoli vocaboli emerge un uso della lingua tutt’altro che complesso, le cui parole sono lungamente usate in ambito giornalistico e nello scritto comune. Le prime e sporadiche difficoltà appaiono al di sotto del valore di frequenza 5, quando iniziano ad apparire termini, quali ad esempio “massimalismo”, “quarterback” e “management”, solitamente specifici di alcuni settori tematici.

Non sono inoltre presenti termini tipicamente informali e colloquiali. In altre parole viene mantenuto negli articoli online lo stile giornalistico che già contraddistingue la carta stampata.

Per approfondire l’analisi, è stato calcolato l’indice Gulpease di 6 articoli, due per ogni testata, poi selezionati random all’interno del corpus. Sono stati dunque scelti: “Berlusconi risponde a Napolitano” (da corriere.it, sezione politica); “Montanelli antifascista rifiutato” (da corriere.it, sezione cultura); “Bankitalia: Sale il debito pubblico” (da repubblica.it, sezione economia); “Turchia: fuorilegge il partito curdo” (da repubblica.it, sezione esteri); “Conto alla rovescia Shumi-Mercedes” (da gazzetta.it, sezione sport-motori); “Prandelli e il Mourinho Furioso” (da gazzetta.it, sezione sport-calcio).

In tabella vengono presentati i valori trovati e le medie riassuntive.

4

Page 6: IL LINGUAGGIO DELLE TESTATE ONLINE

Prandelli e il Mourinho Furioso

Conto alla rovescia Shumi-

Mercedes

Turchia: fuorilegge il partito curdo

GULPEASE: 55,84 53,49 48,54

frasi: 39 26 19parole: 706 650 560lettere: 3511 3088 2836

media parole/frasi: 18,1 25 29,47

media lettere/parole: 4,97 4,75 5,06

Bankitalia: Sale il debito

pubblico

Montanelli antifascista rifiutato

Berlusconi risponde a Napolitano

Medie

GULPEASE: 51,88 46,09 52,09 51,32

frasi: 15 28 24 25,17parole: 438 841 531 621,00lettere: 2076 4449 2680 3106,67

media parole/frasi: 29,2 30,04 22,13 25,66

media lettere/parole: 4,74 5,29 5,05 4,98

All’aumentare dell’indice Gulpease aumenta la difficoltà di comprensione di un testo. In generale, l’indice si attesa su un livello di non difficile comprensione per un lettore con un qualsiasi titolo di studio. La lunghezza media delle parole arriva a toccare le cinque lettere; le frasi sono relativamente lunghe, con oltre 25 parole ognuna.

Nell’analisi singola degli articoli selezionati emerge un indice significativamente più alto per i due articoli della gazzetta.it. Repubblica.it e corriere.it presentano infine valori mediamente simili.

Si può così concludere, affiancando i dati con quelli analizzati per il grado di formalità dei testi, che gli articoli delle testate online non presentano grandi difficoltà di comprensione, con un lessico e una struttura del testo adatti ad un qualsiasi lettore medio.

5

Page 7: IL LINGUAGGIO DELLE TESTATE ONLINE

3.2 LESSICO RILEVANTE PER TESTATA

In questa parte possiamo scoprire non solo quali termini compaiono più spesso all’interno dei singoli giornali, ma anche che ambiti tematici sono i più citati. Anche in questo caso è stato tenuto conto delle forme con numero di lettere superiore a 3 ed escludendo i lemmi di fascia alta.1

corriere.it

Al primo posto dell’elenco emerge “stato”, per il quale rimane però un’importante ambiguità semantica, ovverosia come participio passato di essere e sostantivo. Tra i termini rilevante emerge “degli”, che colpisce se lo si ritiene a priori una parola solitamente omogenea in un corpus come quello usato.

“Italia” e “Obama” compaiono un numero rilevante di volte e va considerato che ciò non avviene nelle altre due testate, anche contro quello che ci si potrebbe aspettare (soprattutto nel caso di “Italia”). Considerevole anche le volte in cui compare il participio “detto”: sembra esserci un largo ricorso ad esso da parte dei giornalisti del corriere.it, e di conseguenza un minor uso ad altri sinonimi, rispetto a repubblica.it e gazzetta.it.

repubblica.it

Tra i termini vicini alla specificità emerge “dello”, per cui valgono, ma in un modo ancora più evidenziato, le considerazioni fatte per “degli” in corriere.it; “cento”, “premier”, “piazza”.

Dal punto di vista dei temi, in quinta posizione risalta come primo nome rilevante “presidente”; seguono, in undicesima posizione “Berlusconi”, in trentesima “premier”, trentatreesimo “Italia” e trentaquattresimo “Casini”: la materia politica emerge così molto più che non in corriere.it.

gazzetta.it

Colpisce immediatamente la presenza della parola “squadra”, con 41 occorrenze, che in corriere.it e repubblica.it compare 2 volte a testa. Non è l’unica parola ad essere quasi unica e specifica per tale singola testata. Alcuni di questi altri termini, inoltre, non rimandano a un campo semantico prettamente sportivo, come “casa”, “tempo”, “sempre”… altri invece vi rientrano, come “punti”, “testa”, “quarto”, “vittoria”, “campo”, “partita”…

1 Appendice, tabelle 1

6

Page 8: IL LINGUAGGIO DELLE TESTATE ONLINE

I riferimenti sportivi dunque primeggiano, includendo tra questi anche “ripresa”, “campionato”, “gara”, ma non rimandano chiaramente ad un campo semantico calcistico da cui sono stati attinti diversi articoli del subcorpus.

Esclusi tali lemmi rimane un lessico con pochi sostantivi e solitamente inerente al tempo (“prima”, “dopo”, “anni”, “quando”…). Primo nome proprio risulta “Roma”, in ventinovesima posizione dell’elenco.

3.3 LESSICO SPECIFICO PER TESTATA

In questa parte di analisi è stato approfondito il discorso sui termini più usati dalle testate, trattando in particolare quali tra essi sono usati unicamente dal relativo “quotidiano digitale”. Sono stati allora cercati tutti i vocaboli che compaiono unicamente all’interno di una precisa testata online, ossia con frequenza 0 all’interno delle altre due. In questi elenchi, molti termini specifici erano nomi propri, specialmente di Paesi e persone o, nel caso i gazzetta.it, di squadre sportive. Questi sono stati rimossi dalla lista. Ecco in una tabella il riepilogo del lessico rilevante, con frequenza maggiore di 4.2

corriere.it

Tali parole non compaiono dunque nelle altre due testate digitali. Ciò è significativo a partire dalla parola “guerra”, ripetuta nel corpus del corriere.it per 14 volte. Altre parole, solitamente presenti sui giornali, compaiono soltanto in questa testata, come “senatore”, “opposizionismo”, “pentito”, ma anche e soprattutto parole di uso comune come “appunto”, “reazioni”, “tale”, “rispondere”, “regione”, “umani”. Tale elenco continua scorrendo le frequenze inferiori non riportate in tabella. Qui compaiono termini come “puntata”, “potere”, “libro”, “caldo”, “amore”, di cui erano ipotizzabili una maggiore frequenza e distribuzione in tutte le testate.

repubblica.it

La lista dei termini specifici ripetuta un numero consistente di volte (> 4) risulta, per quanto riguarda repubblica.it, più corta rispetto alle altre due.

I termini curiosamente presenti solo su questa testata sono “odio”, “responsabilità”, “campagna”, “studenti”. In particolare, per quest’ultima parola, va sottolineato come non si ritrovino, in nessuno dei tre siti, nemmeno i vocaboli con radice “student-”. Analogo discorso vale per “treni”, la cui radice compare sì altre due volte, ma nel caso particolare del nome proprio “Trenitalia”.

2 Appendice, tabelle 3

7

Page 9: IL LINGUAGGIO DELLE TESTATE ONLINE

gazzetta.it

Il vocabolario specifico della gazzetta.it non poteva non essere quasi completamente legato al campo semantico dello sport.

Emergono parole comuni a tutti gli sport, e di seguito quelle che fanno riferimento a calcio e basket, di cui trattano la maggior parte degli articoli. “Panchina”, “vantaggio”, “assist”, “palla”, “tiro”, “segna”, “squadre”, “gare”, “riposo”, “allenatore” sono i primi esempi di parole comuni, più specifiche rispetto a un preciso sport “angolo”, “cross” (calcio), “nets”, “rimbalzi”, “sirena” (basket). In un tutto questo elenco emerge allora il lemma “domani” la cui particolarità non è solo quella di essere l’unico termine all’interno di questo insieme “sportivo”, ma anche quello di non comparire in nessun altro articolo delle due testate corriere.it e repubblica.it.

3.4 SPECIFICITÀ TEMATICHE

Sono state portate in analisi alcune forme interessanti per analizzare il tipo di linguaggio. Per studiarle è stato tenuto conto dei poliformi e dell’ambito in cui vengono usati. Sono stati selezionati tutti i poliformi più importanti e suddivisi nei seguenti ambiti: sport, politica, cronaca e “lett.”, quest’ultima categoria indicare le forme prettamente giornalistiche indipendentemente dagli altri ambiti.3

Mondo politico e cronaca

Interessante il settore politico, in cui compaiono molte definizioni di personalità (“presidente della Camera”, “presidente del PD”, “leader dell’UDC”, “segretario del PD”, “senatore del PdL”) e alcuni poliformi spesso in uso e tipici del linguaggio politico (“elezioni anticipate”, “su base annua”, “in commissione bilancio”, “scontro politico”).

Unici altri poliformi interessanti riguardano tutti un livello inerente alla legge; si tratta cioè di termini giuridici, come “associazione per delinquere”, “arresti domiciliari”, o legati ad atti di delinquenza, come “gesto isolato” e “agito da solo”.

Mondo sportivo

Nel settore sportivo compaiono poliformi di uso molto frequente da parte di tutta la stampa sportiva, dunque non prettamente presenti nel Web e soprattutto non innovativi ma tradizionali modi di definire, talvolta retorici, certi aspetti: esemplificando, ecco allora “nel finale”, “padroni di casa”, “in vantaggio”, “tre punti”, “a casa il successo”, “squadra di casa”, “naso avanti”, “scendere in campo”, “sfiora il palo”.

3 Appendice, tabella 2

8

Page 10: IL LINGUAGGIO DELLE TESTATE ONLINE

Forme tipicamente giornalistiche

In grandi quantità sono presenti i participi passati dei verbi che introducono un discorso o intervento di una persona: ha detto primeggia tra tutti i poliformi con 40 occorrenze; seguono “ha spiegato”, in quarta posizione, “ha aggiunto”, in sesta, “ha parlato” (16°), ha replicato (24°), ha sottolineato (25°); a seguire “ha definito”, “ha ribadito”, “ha annunciato”, “ha commentato”, “ha sostenuto”.

Fatta eccezione per le prime tre forme, va tenuto conto della presenza quasi esclusiva delle altre in repubblica.it e corriere.it, da cui si può concludere di un loro uso solitamente esterno all’ambito sportivo – e solitamente interno a quello politico, cosa plausibile dato che in quest’ultimo ambito i discorsi da riportare sono obiettivamente maggiori.

Vi sono altri poliformi, spesso semplici nella struttura, ma usati molto spesso dai giornalisti: sono “per questo”, “in una nota”, ma soprattutto “ci sono”, “dopo aver”, “era stato”, che fanno pensare a una generale semplicità stilistica (è il caso di “ci sono”) e all’uso di subordinate temporali (“dopo aver”).

3.5 I SEGMENTI E L’INDICE DI SIGNIFICATIVÀ

L’indice di significatività mette in luce il grado di assorbimento di uno specifico segmento di parole rispetto alle parole stesse che lo compongono.

Dai valori ritrovati, l’unico dato significativo che emerge è l’alto grado di significatività per gli epiteti/descrizioni che vengono date assieme al nome della persona citata. Per esempio “capogruppo in commissione bilancio Pierpaolo Baretta”, “amministratore delegato del Milan Adriano Galliani”, “ministro dello sviluppo economico Claudio Scajola”, “sindaco di Milano Letizia Moratti”, “segretario del PD Pier Luigi Bersani”.4

3.6 CURIOSITÀ SUI LEMMI

La parola più lunga usata all’interno del corpus è “contemporaneamente”, di 18 lettere, usata una volta in repubblica.it. Seguono “generalizzazione”, “democratizzazione”, “intercontinentale”, “involontariamente”, “autotrasportatori”, “extraparlamentare” e, con due occorrenze, “antiberlusconismo” e “socialdemocratico”, tutte a quota 17 ripetizioni.

Quale testata fa allora più ricorso a parole lunghe? Per rispondere abbiamo selezionato parole composte da dieci o più lettere, sommando successivamente le loro

4 Appendice, tabella 4

9

Page 11: IL LINGUAGGIO DELLE TESTATE ONLINE

frequenze per ognuna delle tre testate. Indicativamente, gazzetta.it conduce con circa 14300 parole di oltre 10 lettere, segue corriere.it con 13750, infine repubblica.it con quasi 12100 parole. In tutto il corpus, “presidente” risulta essere l’unica parola di questa classe collocata all’interno della fascia media di frequenza.

Un’ulteriore ipotesi valuta la percentuale di avverbi in “–mente”, che potrebbe avere un valore significativo nell’analisi delle parole cosiddette lunghe.

In totale sono stati trovati 93 avverbi che terminano in “–mente”, di cui 87 superano le dieci lettere. Rapportando tale valore con 2170 (il numero dei lemmi presenti composti da 10 o più lettere), risulta che la percentuale di avverbi in “–mente” tra le parole di 10 o più lettere è del 4,01%.

Il più frequente è “decisamente” con 9 frequenze, seguono “finalmente”, 6 occorrenze, e “completamente”, con cinque.

Tornando ad un livello generale, è stata calcolata la percentuale della presenza di queste parole di dieci o più lettere all’interno dell’intero corpus. Considerando nuovamente i types, 2173 forme grafiche vanno rapportate alle 9248 totali, ottenendo una percentuale del 23,50%.

Dal punto di vista grammaticale, almeno 4214 occorrenze sono sicuramente delle forme verbali (participi esclusi); 7965 occorrenze sono sostantivi, di cui 2053 nomi propri. Non è stato tenuto conto delle forme ambigue.

4. CONCLUSIONI

Il linguaggio delle testate giornalistiche digitale non si scosta molto da quello che già è possibile trovate nella carta stampata e nei telegiornali. È presente un lessico mediamente formale e con diverse forme tipicamente giornalistiche.

Il livello di formalità può essere paragonato a quello delle testate cartacee: non vi sono elementi specifici di cui il Web potrebbe caratterizzarsi, non vi sono termini troppo aulici e forbiti, ma nemmeno troppo colloquiali. Così facendo si va incontro al lettore medio e ad un target che sostanzialmente non è differente da quello che legge la carta stampata.

Con lo studio dei poliformi è stato possibile trovare i sintagmi maggiormente usati in alcuni ambiti specifici (cronaca-politica e sport) e stilistici. Dall’elenco di tali poliformi trovato tramite Taltac®, sono stati specificatamente selezionati quelli utili a tale analisi, mettendo in mostra quelle che sono le forme più utilizzate e “di moda” nell’italiano, non solo giornalistico, di questi anni. Dal punto di vista politico e della cronaca emerge così la struttura [carica] di [gruppo] (es.: “leader dell’UDC”) molto usata nella descrizione di un personaggio pubblico. Altri termini afferiscono alla statistica o alla legge (“su base annua”, “arresti domiciliari”) o forme generalmente molto frequenti sia nello scritto che nel parlato (“scontro politico”).

10

Page 12: IL LINGUAGGIO DELLE TESTATE ONLINE

In ambito sportivo emergono più spesso alcune metafore: “padroni di casa” e “mettono il naso avanti” ne sono gli esempi più lampanti. Esse, insieme agli altri sintagmi rilevanti ritrovati, sono forme non innovative e spesso utilizzate in campo sportivo, soprattutto a livello giornalistico (“squadra di casa”, “sfiora il palo”…).

Sono state trovati anche poliformi che richiamano modi di dire, e di scrivere, tipicamente giornalistici, in cui è stato notato un largo ricorso al discorso diretto e indiretto con una buona varietà di verbi atti ad introdurlo (“dire”, “sottolineare”, “replicare”…).

Per quanto riguarda i temi d’attualità che emergono tra gli articoli selezionati, emerge sicuramente la politica italiana, esemplificata nei nomi di politici (in particolare il capo del Governo Berlusconi), di istituzioni (“Governo”) e di partiti. Minori i riferimenti alla politica estera, di cui emerge solo “Obama” e quasi esclusivamente in corriere.it.

“Calcio”, “Inter”, “campionato”, “Champions” indicano una buona presenza del tema calcistico all’interno dell’intero corpus.

Se “aggressione” con dieci occorrenze può far pensare ad una buona presenza di cronaca nera, tale ipotesi viene smentita dalla non rilevante presenza di altri termini solitamente collegati a tale tema, come forme la cui radice è “uccis-” (8 occorrenze totali), “assassin-” (2 occorrenze) o “mort-” (10 occorrenze). Si pensa così che “aggressione” possa avere un valore non esclusivamente di tipo fisico e che rimanda ad altri ambiti tematici.

Infine è presente la cronaca giudiziaria, esemplificata in termini quali “condannato”, “processo”, “giudice/i” o “magistratura”. Va comunque sottolineato come nel periodo in cui sono stati raccolti gli articoli del corpus possano essere strettamente collegati l’ambito giuridico e quello politico.

Nel corriere.it emergono ulteriori nomi propri che rimandano agli annessi temi d’attualità, come “Graviano”, “Spatuzza” e “Dell’Utri”. La parola “mafia” compare esclusivamente in corriere.it con otto occorrenze.

In repubblica.it alla politica sembra affiancarsi il tema economico. Ciò è testimoniato dalla rilevante e specifica presenza di forme quali “mercato”, “azienda”, “economia”.

Per quanto riguarda gazzetta.it il tema calcistico emerge sia rispetto alle altre testate che rispetto agli altri sport all’interno della stessa, con i nomi di calciatori, per esempio “Balotelli”, “Totti”, e nomi di squadre quali “Milan”, “Roma”, “Fiorentina”. Non mancano però gli sport americani, in particolare il basket, riconoscibili da “quarto” (sono sport le cui partite sono divise in quarti anziché in due tempi) e “rimbalzi”.

Durante lo svolgimento della tesina non sono mancate le difficoltà. L’utilizzo del software Taltac® non è sempre stato facile, in particolare quando si è voluto comunque cercare di analizzare il tipo di linguaggio per categoria di articolo (cronaca, politica,

11

Page 13: IL LINGUAGGIO DELLE TESTATE ONLINE

editoriali, sport, etc.). Non è stato così possibile riuscire a sviluppare questa seconda parte di analisi.

La stessa difficoltà, dovuta ad un malfunzionamento di Taltac®, è emersa in un’altra fase dell’analisi, quella del confronto con un lessico di frequenza, che avrebbe aiutato maggiormente nell’analisi e soprattutto nello studio della formalità e delle forme sotto e sovra-utilizzate rispetto all’italiano standard.

Tra le prospettive di studio future si potrà effettuare un’analisi comparativa tra gli articoli digitali e quelli su carta stampata. Altro fronte potrebbe essere la comparazione tra corpus di articoli presenti nel Web di anni diversi. Potrebbe inoltre rivelarsi utile l’ampliamento del corpus sia ad ulteriori articoli delle testate già analizzate, sia ad articoli di altre testate digitali. Un ulteriore possibile sbocco di studio potrebbe rivelarsi infine l’analisi di articoli presenti nei maggiori blog giornalistici della Rete, che possono essere sia aggiunti sia confrontati con i corpus degli articoli delle testate digitali.

12

Page 14: IL LINGUAGGIO DELLE TESTATE ONLINE

APPENDICI

Tabelle 1 Lessico rilevante per testata

corriere.it

Forma grafica Corriere.it Repubblica.it Gazzetta.itstato 37 21 15dopo 36 15 38hanno 32 31 19detto 32 15 7solo 29 29 30quando 27 11 21essere 26 18 21degli 25 14 11Italia 24 14 5aveva 23 18 12Obama 23 1 0secondo 22 15 25contro 21 10 21fine 20 7 21prima 19 17 38anni 19 33 23perché 19 21 20fatto 19 19 13loro 19 20 12nell' 19 18 10graviano 19 0 0dalla 18 18 36questo 18 32 21parte 18 17 13stata 18 19 9alle 17 17 17questa 17 7 14senza 17 13 11spatuzza 17 0 0primo 16 14 27tutti 15 16 21quello 15 13 11altri 15 11 11quella 15 11 10dall' 15 11 9fare 15 11 5così 14 7 13

13

Page 15: IL LINGUAGGIO DELLE TESTATE ONLINE

repubblica.it

Forma grafica Corriere.it Repubblica.it Gazzetta.itanni 19 33 23questo 18 32 21hanno 32 31 19solo 29 29 30presidente 13 28 13dello 7 24 7cento 0 24 1stato 37 21 15perché 19 21 20loro 19 20 12Berlusconi 14 20 2fatto 19 19 13stata 18 19 9oggi 8 19 14dalla 18 18 36essere 26 18 21aveva 23 18 12nell' 19 18 10prima 19 17 38alle 17 17 17parte 18 17 13anno 11 17 12tutti 15 16 21dopo 36 15 38secondo 22 15 25detto 32 15 7sarà 11 15 14nelle 5 15 15dove 10 15 8premier 6 15 2primo 16 14 27degli 25 14 11Italia 24 14 5Casini 8 14 0partito 8 14 0piazza 1 14 3senza 17 13 11

14

Page 16: IL LINGUAGGIO DELLE TESTATE ONLINE

gazzetta.it

Forma grafica Corriere.it Repubblica.it Gazzetta.itsquadra 2 2 41prima 19 17 38dopo 36 15 38casa 9 7 37dalla 18 18 36tempo 5 6 31solo 29 29 30ancora 11 7 29punti 6 1 28primo 16 14 27secondo 22 15 25testa 6 1 25quarto 0 1 24anni 19 33 23vittoria 2 4 23campo 6 0 22questo 18 32 21essere 26 18 21tutti 15 16 21quando 27 11 21contro 21 10 21sempre 7 9 21fine 20 7 21partita 6 2 21ripresa 5 0 21campionato 3 0 21perché 19 21 20hanno 32 31 19Roma 7 6 19molto 4 4 19gara 1 0 19però 12 6 18tutto 8 6 18ultimo 5 4 18porta 3 4 18Inter 4 1 18alle 17 17 17

15

Page 17: IL LINGUAGGIO DELLE TESTATE ONLINE

Tabella 2 Poliformi selezionati

Forma grafica Occorrenze totali Categoria corriere.it repubblica.it gazzetta.itha detto 40 lett. 19 14 7ci sono 21 lett. 7 5 9ha spiegato 13 lett. 7 3 3ha aggiunto 11 lett. 4 4 3in panchina 11 sport 0 0 11del partito 10 politica 3 7 0dopo aver 10 lett. 4 1 5era stato 9 lett. 4 4 1per questo 9 lett. 2 6 1ha deciso 8 lett. 5 3 0della sinistra 7 politica 2 5 0di gioco 7 sport 1 0 6nel finale 7 sport 0 0 7padroni di casa 7 sport 0 0 7campione del mondo 6 sport 0 1 5ha parlato 6 lett. 4 0 2in vantaggio 6 sport 0 0 6presidente della Camera 6 politica 4 1 1secondo tempo 6 sport 1 0 5associazione per delinquere 5 cronaca 0 3 2champions league 5 sport 0 0 5frode sportiva 5 sport 0 3 2ha replicato 5 lett. 4 1 0ha sottolineato 5 lett. 3 2 0presidente del PD 5 politica 0 5 0tre punti 5 sport 0 0 5a quel punto 4 lett. 0 1 3arresti domiciliari 4 cronaca 0 4 0dalla distanza 4 sport 0 0 4della minoranza 4 politica 2 2 0elezioni anticipate 4 politica 2 2 0ha definito 4 lett. 4 0 0ha ribadito 4 lett. 2 2 0in una nota 4 lett. 1 1 2indennità da ritardo 4 cronaca 0 4 0non è mai 4 lett. 1 0 3su base annua 4 politica 4 0 0a casa il successo 3 sport 0 0 3a centrocampo 3 sport 0 0 3agito da solo 3 cronaca 0 3 0al 15' 3 sport 0 0 3aveva detto 3 lett. 2 1 0

16

Page 18: IL LINGUAGGIO DELLE TESTATE ONLINE

compagno di squadra 3 sport 0 1 2della squadra di casa 3 sport 0 0 3dicembre scorso 3 lett. 2 1 0giornali di partito 3 politica 3 0 0governo Berlusconi 3 politica 1 2 0ha annunciato 3 lett. 1 1 1ha commentato 3 lett. 2 1 0ha sostenuto 3 lett. 1 2 0il secondo giallo 3 sport 0 0 3in attacco 3 sport 0 0 3in commissione bilancio 3 politica 3 0 0in cui ogni 3 lett. 3 0 0leader dell' UDC 3 politica 2 1 0mi auguro 3 lett. 2 1 0naso avanti 3 sport 0 0 3nel primo tempo 3 sport 0 0 3nell' ultimo quarto 3 sport 0 0 3non ci sarà 3 lett. 2 1 0non ho mai 3 lett. 3 0 0non vuole 3 lett. 0 1 2parole di Casini 3 politica 1 2 0per l' espulsione 3 sport 0 0 3poteva essere 3 lett. 0 0 3presidente dell' Inter 3 sport 0 0 3primo è stato 3 lett. 2 1 0primo turno 3 sport 0 3 0rispetto al mese precedente 3 lett. 1 2 0scendere in campo 3 sport 1 0 2scontro politico 3 politica 0 3 0se si vuole 3 lett. 0 3 0segretario del PD 3 politica 1 2 0senatore del PdL 3 politica 3 0 0sfiora il palo 3 sport 0 0 3si chiude 3 lett. 1 0 2si tratterebbe 3 lett. 2 1 0su facebook 3 lett. 0 0 3un colpo di testa 3 sport 0 0 3un gesto isolato 3 cronaca 0 2 1squadra di casa 2 sport 0 0 2gesto isolato 1 cronaca 0 1 0porta a casa 1 sport 0 0 1

17

Page 19: IL LINGUAGGIO DELLE TESTATE ONLINE

Tabelle 3 Lessico specifico per testata

corriere.it

Forma grafica Occorrenzeguerra 14regime 9

operazione 8senatore 8

mafia 8reazioni 6agenzia 6pentito 6

appunto 6corona 6

ebrei 6tale 6

opposizionismo 5

Forma grafica Occorrenzesuperindice 5deposizione 5capogruppo 5

rispondere 5compenso 5

editoria 5regione 5testate 5ucciso 5

truppe 5epoca 5umani 5

ciò 5

repubblica.it

Forma grafica OccorrenzeTreni 10

Consumatori 9Duomo 7

odio 7rimborso 6

2005 6responsabilità 5

conciliazione 5riconteggio 5

Forma grafica Occorrenzeindennità 5

glaciale 5studenti 5

campagna 5offerta 5

modello 5album 5

disco 5asta 5

gazzetta.it

Forma grafica Occorrenze totalipanchina 15

vantaggio 15assist 13palla 13

tiro 11angolo 10segna 10

squadre 10gare 9palo 9

Forma grafica Occorrenze totalirimbalzi 9doppia 8riposo 8

allenatore 7cross 7ospiti 7

padroni 7pareggio 7rimonta 7

sirena 7

18

Page 20: IL LINGUAGGIO DELLE TESTATE ONLINE

titolare 7azzurro 6

coach 6coppa 6corre 6

domani 6facendo 6

gioca 6granata 6motogp 6

poker 6sport 6

stagionale 6stiamo 6

yard 6canestro 5

centrocampo 5destro 5entra 5

espulsione 5lasciato 5league 5passa 5

punizione 5sfiora 5

tiri 5torneo 5

trasferta 5

Tabella 4 Lista dei segmenti con indice IS

SegmentoOccorrenze totali Numero di fg Indice IS

capogruppo in commissione bilancio Pierpaolo Baretta 2 6 17,01da certa stampa determina certi comportamenti 2 6 13,01utilizzare la questione giudiziaria per trasformare 2 6 12,60di consulenza non sarebbe più valido 2 6 10,50dove sarebbero state comminate ammonizioni 2 5 10,24pensa di utilizzare la questione giudiziaria 2 6 9,59questione giudiziaria per trasformare la democrazia 2 6 9,40amministratore delegato del Milan Adriano Galliani 2 5 9,30“We want nate” 2 3 9,00ciascuno si prenda le proprie responsabilità 2 6 8,99italian champions of poker 3 4 8,57più valido come vuole la logica 2 6 8,53non c' erano segni di effrazione 2 6 8,53superindice è aumentato di 1 punto 2 6 8,31apostrofò Marco travaglio con insulti 2 5 7,57ministro dello sviluppo economico Claudio Scajola 2 5 7,49decidesse di prendere un' altra strada 2 6 6,87nostro contratto di consulenza non sarebbe 2 6 6,39sindaco di Milano Letizia Moratti 2 5 6,38dirigenziali in società sportive 2 4 6,32Marco travaglio con insulti e parolacce 2 6 6,24sinistra e da certa stampa determina 2 6 6,17non sarebbe più valido come vuole 2 6 6,08contratto di consulenza non sarebbe più 2 6 5,95consulente per le vetture su strada 2 6 5,72segretario del PD Pier Luigi Bersani 2 5 5,69

19

Page 21: IL LINGUAGGIO DELLE TESTATE ONLINE

aumentato di 1 punto dal mese 2 6 5,64trasformare la democrazia in una monarchia 2 6 5,63strada il nostro contratto di consulenza 2 6 5,58clima di odio alimentato da certa 2 6 5,46questo clima incivile la loro responsabilità 2 6 5,44di odio alimentato da certa sinistra 2 6 5,41Tour de France 2 3 5,33si vuole indagare su questo clima 2 6 5,12Berlusconi risolva i problemi del Paese 2 6 5,10non sono il killer di nessuno 2 6 5,08è un consulente per le vetture 2 6 5,06come vuole la logica ha spiegato 2 6 4,97sarebbe poco più di una formalità 2 6 4,87

Tesina realizzata tra Dicembre 2009 e Marzo 2010

20