La distribuzione delle parti del discorso nel parlato e ... · La distribuzione delle parti del...

22
La distribuzione delle parti del discorso nel parlato e nello scritto 1 Miriam Voghera - Università degli Studi di Salerno 0. Lo studio delle variazioni linguistiche legate all'uso di diversi sistemi di trasmissione non occupa un posto definito nella linguistica generale né all'interno di quei settori della linguistica che studiano la variazione e la variabilità. Se da un lato la diffusione di nuove tecniche di catalogazione e di analisi ha permesso di oggettivare un testo parlato, come mai era avvenuto in passato, dall'altro con l'aumentare dei dati a disposizioni si è cominciato a capire che la modalità di trasmissione non può essere trattata come un altro/qualsiasi elemento di variazione del contesto. Si è infatti da più parti notata (tra gli altri Berruto 1993) la problematicità della nozione di diamesia e la difficoltà di considerare la distinzione tra parlato e scritto come una dimensione di variazione della lingua accanto alle più tradizionali variazioni diastratiche, diafasiche e diatopiche. Ciò non solo perché la distinzione tra parlato e scritto può tagliare trasversalmente, almeno in teoria, qualsiasi altra varietà, ma perché l'uso di un sistema di trasmissione piuttosto che un altro comporta strategie semiotiche diverse, preliminari alla produzione del singolo testo specifico (Voghera 1992; 1994). Mentre le differenze tra varietà diastratiche, diafasiche e diatopiche si concentrano nel prodotto, le principali differenze tra parlato e scritto ci costringono a risalire dal prodotto al processo di produzione e ricezione. La considerazione della variazione diamesica, appare insomma un argomento poco maneggevole con gli strumenti forgiati su altri campi di variazione. Inoltre è sempre difficile fare confronti tra parlato e scritto senza che si creino delle implicite subordinazioni dell'uno nei confronti dell'altro. Vorrei sottolineare l'aggettivo implicito, poiché per la linguistica teorica la lingua è strutturalmente e intrinsecamente amodale: qualsiasi affermazione sulla lingua dovrebbe quindi prescindere da qualsiasi considerazione diamesica. Eppure l'imparzialità, se così si può definire, rispetto alla modalità di trasmissione è continuamente disattesa nei fatti per ragioni di varia natura. E' per esempio frequente che il parlato venga analizzato e studiato utilizzando testi molto informali e spesso diastraticamente bassi, mentre per lo scritto si usino testi formali, pubblici, se non letterari o accademici. Come già aveva notato Rey-Debove (1983:215 ): (...) l'on observe que les corpus du langage parlé sont souvent choisis d'aprés le niveau de langue extrêmement familier, même populaire et déviant par 1 Questo testo è stato presentato al convegno «Langue écrite et langue parleé dans le passé et dans le présent» all’Università di Napoli Federico II nel 1997, e viene qui pubblicato senza alcuna aggiunta o modifica. Dato il lungo tempo trascorso tra la stesura e la pubblicazione, è necessario segnalare che sull’argomento qui trattato sono ora disponibili ulteriori ricerche di linguistica e di psicologia del linguaggio tra le quali vorrei segnalare Voghera in corso di stampa b; Laudanna, Voghera, Gazzellini in corso di stampa; Giordano e Voghera in corso di stampa.

Transcript of La distribuzione delle parti del discorso nel parlato e ... · La distribuzione delle parti del...

La distribuzione delle parti del discorso nel parlato e nello scritto1

Miriam Voghera - Università degli Studi di Salerno 0. Lo studio delle variazioni linguistiche legate all'uso di diversi sistemi di trasmissione non occupa un posto definito nella linguistica generale né all'interno di quei settori della linguistica che studiano la variazione e la variabilità. Se da un lato la diffusione di nuove tecniche di catalogazione e di analisi ha permesso di oggettivare un testo parlato, come mai era avvenuto in passato, dall'altro con l'aumentare dei dati a disposizioni si è cominciato a capire che la modalità di trasmissione non può essere trattata come un altro/qualsiasi elemento di variazione del contesto. Si è infatti da più parti notata (tra gli altri Berruto 1993) la problematicità della nozione di diamesia e la difficoltà di considerare la distinzione tra parlato e scritto come una dimensione di variazione della lingua accanto alle più tradizionali variazioni diastratiche, diafasiche e diatopiche. Ciò non solo perché la distinzione tra parlato e scritto può tagliare trasversalmente, almeno in teoria, qualsiasi altra varietà, ma perché l'uso di un sistema di trasmissione piuttosto che un altro comporta strategie semiotiche diverse, preliminari alla produzione del singolo testo specifico (Voghera 1992; 1994). Mentre le differenze tra varietà diastratiche, diafasiche e diatopiche si concentrano nel prodotto, le principali differenze tra parlato e scritto ci costringono a risalire dal prodotto al processo di produzione e ricezione. La considerazione della variazione diamesica, appare insomma un argomento poco maneggevole con gli strumenti forgiati su altri campi di variazione. Inoltre è sempre difficile fare confronti tra parlato e scritto senza che si creino delle implicite subordinazioni dell'uno nei confronti dell'altro. Vorrei sottolineare l'aggettivo implicito, poiché per la linguistica teorica la lingua è strutturalmente e intrinsecamente amodale: qualsiasi affermazione sulla lingua dovrebbe quindi prescindere da qualsiasi considerazione diamesica. Eppure l'imparzialità, se così si può definire, rispetto alla modalità di trasmissione è continuamente disattesa nei fatti per ragioni di varia natura. E' per esempio frequente che il parlato venga analizzato e studiato utilizzando testi molto informali e spesso diastraticamente bassi, mentre per lo scritto si usino testi formali, pubblici, se non letterari o accademici. Come già aveva notato Rey-Debove (1983:215 ):

(...) l'on observe que les corpus du langage parlé sont souvent choisis d'aprés

le niveau de langue extrêmement familier, même populaire et déviant par

1 Questo testo è stato presentato al convegno «Langue écrite et langue parleé dans le passé et dans le présent» all’Università di Napoli Federico II nel 1997, e viene qui pubblicato senza alcuna aggiunta o modifica. Dato il lungo tempo trascorso tra la stesura e la pubblicazione, è necessario segnalare che sull’argomento qui trattato sono ora disponibili ulteriori ricerche di linguistica e di psicologia del linguaggio tra le quali vorrei segnalare Voghera in corso di stampa b; Laudanna, Voghera, Gazzellini in corso di stampa; Giordano e Voghera in corso di stampa.

rapport à la norme sociale; bref, on cherche dans le langage parlé ce qui ne

s'écrirait pas. (…) Si on fait coïncider le langage parlé avec les phrases

inacceptables dans la communication orale elle même, on décrit une sous-

performance et si l'on fait coïncider le langage écrit avec la littérature, on decrit

une surperformance. L'essentiel du langage est alors oublié".

In tal modo si finisce con l'attribuire al parlato e allo scritto caratteristiche che in realtà sono proprie delle varietà diastratiche e/o diafasiche, con cui le modalità di trasmissione sono più frequentemente associate. L'insieme di questi problemi rende dunque necessario delimitare con precisione l'area di confronto tra parlato e scritto, prendendo in considerazione materiale non appartenente ad un unico genere testuale, ma diversificato in modo sistematico. Inoltre, sebbene i lavori di linguistica quantitativa non siano da soli sufficienti a risolvere i problemi definitori cui abbiamo accennato, è sempre utile dare una misura delle differenze tra parlato e scritto partendo da dati concreti e controllabili. 1. Esistono molti indizi per credere che l'organizzazione sintattica e testuale del parlato porti con sé anche una diversa distribuzione delle parti del discorso, e che questa diversità possa rivelare alcune connessioni non banali tra le proprietà delle parti del discorso e la costruzione dei testi nelle due modalità. Qui si presenta un'analisi quantitativa sulla frequenza d'uso di nomi e verbi in testi parlati e scritti italiani e inglesi appartenenti a generi diversi, con qualche accenno anche al tedesco e al francese. Lo scopo principale di questa indagine è di mostrare che vi sono differenze sistematiche nella frequenza d'uso di nomi e di verbi nei testi parlati e scritti e che queste differenze non sono connesse né all'uso di particolari generi testuali né all'uso di una lingua specifica. Al contrario, queste diversità, apparentemente superficiali, sembrano svelare strategie sintattiche e testuali profondamente diverse e non interscambiabili nelle due modalità di trasmissione. Questa ipotesi sembra tra l'altro sorretta anche da dati registrati in ricerche neuropsicologiche (Hillis e Caramazza 1995; Rapp e Caramazza 1997), dalle quali risulta che pazienti cerebrolesi con disturbi acquisiti di linguaggio possono manifestare usi deficitari diversi nel parlato e nello scritto. In particolare riferirò di alcuni casi in cui è proprio l'uso dei nomi e dei verbi ad essere deficitario in proporzioni diverse nel parlato e nello scritto2. La coincidenza dei risultati delle indagini linguistiche e neuropsicologiche permetterà infine di svolgere qualche riflessione/considerazione sullo statuto delle categorie

2 Ringrazio Alessandro Laudanna per avermi segnalato questi lavori e per varie conversazioni su questi argomenti.

di parlato e scritto non come generi testuali e/o varietà e/o registri, ma come modalità semiotiche generali. 2. Le fonti da cui ho attinto i dati sono varie e numerose. Oltre a darne una descrizione in questo paragrafo si riportano in bibliografia in ordine alfabetico per una consultazione più rapida. I dati sul parlato sono ricavati dal Lessico di frequenza dell'italiano parlato (LIP) (De Mauro et al. 1993) che si basa su un corpus di circa 60 ore di registrazione di testi parlati, pari a 500.000 occorrenze prodotte da 1653 parlanti. I testi sono suddivisi in cinque tipi selezionati grazie all'intersezione di due variabili che sono state considerate fondamentali per la fisionomia del parlato: 1) la presenza/assenza di turni di dialogo; 2) la presenza/assenza del ricevente. I cinque tipi di testo sono: a) conversazioni in casa e al lavoro; b) conversazioni telefoniche in casa e al lavoro; c) dibattiti, discussioni assembleari, interrogazioni ed esami scolastici, interrogatori processuali, interviste ecc.; d) lezioni scolastiche e universitarie, relazioni a congressi, comizi, omelie ecc.; e) trasmissioni televisive e radiofoniche. I testi, registrati a Milano, Firenze, Roma e Napoli, sono stati equamente suddivisi per le quattro città e per i cinque tipi ottenendo così testi per un totale di 25.000 parole appartenenti a ciascun gruppo in ogni città.

Per l'italiano scritto ho usato più fonti. Quella più immediatamente confrontabile con il LIP è il Lessico di frequenza della lingua italiana (LIF), basato su un corpus di 500.000 occorrenze suddiviso in cinque generi testuali: a) romanzi; b) sussidiari scolastici; c) periodici; d) cinema e) teatro (Bortolini et al. 1972). Purtroppo non dispongo di dati relativi alle forme del corpus, ma solo relativi ai lemmi.

Il Dizionario di riferimento (DR) raccolto dall'IBM è costituito 3,8 milioni di occorrenze tratte da quotidiani e testi di agenzia (Mancini 1993).

Il Lessico elementare (LE), basato su un corpus di 500.000 occorrenze di testi scritti da bambini delle cinque classi delle elementari di tutte le regioni di Italia e da testi scritti per i bambini: libri di lettura delle scuole, libri di fiabe, giornalini e fumetti, libri di testo. Il lessico riporta i lemmi che hanno una frequenza d'uso3 _ 3,8. I dati relativi al LE si riferiscono sia al lessico usato dai bambini sia al lessico usato nelle letture per bambini. Nonostante questa commistione limiti l'utilità di questo strumento (Voghera 1995), per ciò che riguarda la distribuzione delle categorie grammaticali gli autori sottolineano che "la

3 La frequenza d'uso si calcola tenendo conto non solo della frequenza assoluta di una parola, ma anche della sua dispersione nelle varie sottoparti del corpus. A parità di frequenza assoluta, avrà un indice d'uso maggiore la parola che occorre in tutti i sottosettori di un corpus e non solo in uno di essi.

proporzione non cambia, se non minimamente, andando a guardare all'interno dei due diversi lessici di lettura e di scrittura " [LE: 32].

Il Vocabolario elettronico della lingua italiana (VELI) è un vocabolario elettronico e solo secondariamente un lessico di frequenza per questo motivo si sono usati procedimenti parzialmente diversi da quelli normalmente adottati per la costituzione di un lessico di frequenza. E' infatti costituito dai primi 10000 lemmi in ordine di frequenza4, estratti da un corpus di 26,2 miilioni di occorrenze prese da testi di agenzia e di giornali5 .

Infine, come ultima fonte di italiano scritto ho usato un lessico di frequenza basato su quattro annate del giornale Due Parole (DP), un mensile di facile lettura indirizzato a persone con deficit di comprensione o a persone di scarsa istruzione. Il lessico si basa su 176.060 occorrenze per un totale di 5.690 lemmi [Piemontese 1996].

Per l'inglese uso i dati tratti dalla Longman Grammar of Spoken and Written English (LGSWE) di Biber, Johansson, Leech, Conrad, e Finegan, che uscirà nel 1999 presso l'editore Longman6. I dati sono relativi a due diversi tipi di testi parlati (conversazioni e fiction) e scritti (giornali e pubblicazioni accademiche). Ho utilizzato inoltre dati tratti dal corpus Lancaster-Oslo/Bergen, (LOB) [Johansson e Hofland 1989], costituito da testi scritti di inglese britannico appartenenti a generi diversi per un milione di occorrenze,

Per il tedesco si riportano i dati sulla frequenza di nomi e verbi dello Häufigkeitswörterbuch gesprochener Sprache (HWB) di Ruoff (1990), basato anch'esso, come il LIP, su un corpus di 500.000 occorrenze; non ho purtroppo dati confrontabili per lo scritto.

Per il francese, infine, si utilizzeranno alcuni dati tratti da L'élaboration du français fondamental (FF) (Gougenheim et al. 1964), basato su un corpus di circa 300.000 occorrenze di francese parlato; mancano anche in questo caso dati sullo scritto.

3. Prima di passare alla loro esposizione, è necessario avvertire che i dati sulle diverse lingue non sono tutti ugualmente confrontabili. Per l'italiano disponiamo di dati relativi sia alla frequenza dei nomi e dei verbi nei testi che costituiscono i corpora considerati sia alla frequenza dei lemmi ricavati dai testi. Per l'inglese abbiamo dati solo sulla frequenza delle forme nei testi e non sulla frequenza dei lemmi. Per il tedesco, ma solo per il parlato, abbiamo dati sia sulla frequenza delle forme sia sulla frequenza dei lemmi. Per il francese, infine,

4 Sono esclusi dal conteggio i nomi propri, le sigle e le parole straniere. 5 Ecco in dettaglio la suddivisione dei testi del corpus: ANSA 10,8 milioni di occorrenze, Il Mondo 7,4 milioni di occorrenze, Europeo 4 milioni di occorrenze, Domenica del Corriere 4 milioni di occorrenze. 6 Ringrazo il professor Leech per avermi permesso di consultare questi dati inediti.

abbbiamo dati solo relativi alla frequenza dei lemmi. Nelle pagine che seguono si terrà ovviamente conto della varietà dei dati confrontando solamente gli insiemi comparabili.

La tabella 1 riporta le frequenze di nomi e verbi registrate nelll'italiano parlato (LIP) e nell'italiano scritto (DR, VELI, LE, DP). I dati del VELI sono stati rielaborati da Rizzi (1994). Tutti i dati sull'italiano sono ricavati da liste ordinate sulla frequenza d'uso e non sulla frequenza assoluta.

FORME LIP DR VELI LE DP Nomi 15,7% 21,7% 20,2% 35,0% 27,8% Verbi 20,0% 10,4% 15,5% 21,0% 17,3% Tabella 1: frequenza d'uso di nomi e verbi nei corpora di italiano parlato e scritto.

Come si vede, mentre il parlato presenta un numero maggiore di verbi, in tutti i

corpora dello scritto si registra una proporzione inversa. Se si fa una media dei dati ricavati dai quattro corpora di italiano scritto, otteniamo i dati della tabella 2.

ITALIANO FORME PARLATO SCRITTO Nomi 15,7% 25% Verbi 20% 15,8% Tabella 2: frequenza d'uso di nomi e verbi nel corpus di italiano parlato LIP e media delle

frequenze d'uso nei quattro corpora di italiano scritto considerati.

La tabella 3 mostra la frequenza di occorrenza dei nomi e dei verbi nei diversi generi

di inglese parlato e scritto; mentre nella tabella 4 si presentano i valori medi dell'inglese parlato e scritto.

INGLESE PARLATO INGLESE SCRITTO FORME CONVERSAZIONI FICTION NOTIZIE ACCADEMICO Nomi 14,3% 22,1% 33,8% 24,2% Verbi 24% 21,2% 16,7% 15,1%

Tabella 3: frequenza di occorrenza dei verbi e dei nomi in testi di inglese parlato e scritto appartenenti a generi diversi.

INGLESE

FORME PARLATO SCRITTO

Nomi 36,5% 63,1%

Verbi 45,1% 31,8%

Tabella 4: media delle frequenze di occorrenza dei verbi e dei nomi nei due corpora di inglese parlato e scritto qui considerati.

La stessa tendenza si riscontra nel parlato tedesco in cui sono nuovamente più numerosi i verbi dei nomi, come si vede dai dati nella tabella 5.

FORME HWB Nomi 10,81% Verbi 21,19%

Tabella 5: frequenza di occorrenza dei verbi e dei nomi nel tedesco parlato. Da questi primi confronti possiamo dedurre varie cose. Innanzi tutto il parlato e lo

scritto si comportano in modo diverso indipendentemente dal tipo di testo considerato e dalla lingua considerata. In tutti i testi parlati si registrano più verbi che nomi, in tutti i testi scritti più nomi che verbi. L'unica eccezione sembra costituita dalla fiction inglese, ma è in realtà un'anomalia solo apparente: i copioni di film e sceneggiati sono pensati come parlato, ma in realtà sono scritti. La fiction non è parlato in senso proprio, ma uno scritto per la voce: "Il parlato scenico è (...) un parlato programmato, al quale possiamo applicare senza scrupolo l'attributo “recitato” (…)” (Nencioni 1983: 175). Come vedremo tra breve, il riferimento al ruolo della programmazione per la caratterizzazione dei testi si rivelerà un tratto decisivo.

I dati relativi ai copioni ci permettono una seconda considerazione. Anche quando lo scritto cerca di mimare il parlato, mantiene alcune caratteristiche che gli sono proprie (Testa 1990): la diversa proporzione di nomi e verbi sembra essere una di queste. Lo mostra chiaramente il fatto che nonostante i testi scritti italiani e inglesi qui considerati siano molto diversi per grado di formalità, si comportano sotto questo aspetto in modo identico. E' interessante notare che questa uniformità si registra anche in testi che si prefiggono di essere semplici, e leggibili da lettori che abbiano un basso livello di istruzione o deficit di

comprensione (Due Parole) e in testi scritti per o da bambini delle scuole elementari (LE). Parlato e scritto sembrano dunque costituire, sotto questo profilo, due insiemi distinti.

4. Le differenze che abbiamo registrato non dipendono dalla diversa quantità dei lemmi nominali e verbali nel parlato e nello scritto. Se si considera l'occorrenza dei lemmi anziché quella delle forme, le differenze tra parlato e scritto scompaiono. Nella tabella 6 si riporta il numero di nomi e verbi nei primi 2000 lemmi del LIP, LE, LIF, nei primi 3000 lemmi del VELI e sul totale dei lemmi di DP7.

LEMMI LIP LIF LE VELI8 DP Nomi 45,8% 50,1% 57,8% 48,6% 43,0% Verbi 21,8% 24,3% 20,4% 20,4% 13,6

Tabella 6: percentuale dei lemmi nominali e verbali.

Come si può vedere i corpora presentano una straordinaria concidenza nella quantità di nomi e verbi. La stessa proporzione si registra anche nei lemmi del tedesco parlato, come si vede dalla tabella 7.

Nomi Verbi LEMMI HWB 59,95% 28,16%

Tabella 7: percentuale dei lemmi nominali e verbali nel lessico del tedesco parlato.

Dunque, in tutti i corpora qui considerati, i lemmi nominali sono circa il doppio di quelli verbali. I lessici del parlato e dello scritto sono quindi del tutto simili per ciò che riguarda la proporzione tra nomi e verbi, e mostrano una tendenza conforme a quella registrata nei vocabolari.

Nella tabella 8 abbiamo infatti la frequenza dei nomi e dei verbi nel Vocabolario di base (VDB) (De Mauro 1991) e nello Zingarelli minore (ZM). Com'è noto, il Vocabolario di base comprende circa 7000 parole che costituiscono il nucleo basilare del lessico italiano.

7 Riteniamo di poter accostare i dati di DP a quelli sui lemmi più frequenti degli altri corpora, poiché DP usa programmaticamente lessico ad alta frequenza [Piemontese 1996]: il 47% dei lemmi usati appartiene infatti al vocabolario fondamentale. Per la definizione del vocabolario fondamentale si veda più oltre. 8 I dati del VELI sono stati rielaborati da Rizzi 1994.

Esso è suddiviso in tre fasce: la prima, il vocabolario fondamentale comprende circa 2000 parole estratte dai primi 2000 lemmi in ordine di rango d'uso del LIF; la seconda il vocabolario di alto uso comprende circa 2700 parole che compaiono nel LIF con rango d'uso tra il 2001 e il 5001; la terza, il vocabolario di alta disponibilità comprende circa 2300 parole che non appaiono nel LIF, ma che sono "legate a oggetti, fatti, esperienze ben noti a tutte le persone adulte nella vita quotidiana" (De Mauro 1991: 150).

LEMMI ZM9 VDB10

Nomi 61,8% 60,6% Verbi 12,6% 19.6%

Tabella 8: frequenza dei nomi e dei verbi nello Zingarelli minore e nel Vocabolario di base.

Come si vede, nel VDB i nomi sono circa tre volte più numerosi dei verbi, mentre nello ZM i nomi sono circa cinque volte più numerosi dei verbi. Si vede qui accentuata la tendenza mostrata dai dati sulla numerosità dei lemmi nei corpora. E' questo un punto interessante su cui è necessario soffermarsi. Benché il numero dei nomi sia sempre superiore a quello dei verbi in tutti i lemmari, la differenza tra i due insiemi può variare molto. Ciò accade perché il numero dei nomi aumenta col decrescere della frequenza del lemma. Se analizziamo i dati interni al VDB queste differenze risultano chiarissime.

LEMMI vocabolario vocabolario vocabolario fondamentale di alto usodi alta disponibilità Nomi 46,7% 58,6% 75,4% Verbi 25,8% 20,7% 12,8% Tabella 9: frequenza dei nomi e dei verbi nelle tre fasce del Vocabolario di base.

Come si vede la quantità dei nomi è inversamente proporzionale alla frequenza d'uso.

Questa tendenza è registrata tra l'altro anche per il francese, nel FF gli autori segnalano infatti che

la variation du pourcentage des noms est inverse de celle des mots

grammaticaux: elle s'eleve de 8,7% à 53,9% entre le frequence 1000 et la

9 I dati sono tratti da Ratti, Marconi e Burani 1995. 10 I dati sono tratti da Thornton, Iacobini, Burani 1994.

frequence 20. Les noms deviennent donc de plus en plus nombreux dans la liste

de frequences, à mesure que la fréquence décroit. (Gouggenheim et al. 1964:

116)

In conclusione, possiamo dire che si tende ad usare una grande quantità di nomi, molti dei quali poche volte; si tende invece ad usare spesso una minore quantità di verbi. Questa tendenza è ancor più accentuata nel parlato, in cui pur rimanendo maggiore il numero dei lemmi nominali, la frequenza d'uso delle frome verbali è sempre più alta. Prima di cercare una spiegazione di questo insieme di coincidenze e divergenze, è utile tener conto dei risultati di alcune ricerche neuropsicologiche su argomenti molto vicini a quelli finora considerati.

5. Riferirò qui i dati esposti in due articoli (Hillis e Caramazza 1995; Rapp e Caramazza 1997) sulle prestazioni di cerebrolesi con disturbi acquisiti di linguaggio, i quali mostrano difficoltà nella produzione di nomi e verbi diverse nel parlato e nello scritto.

In Hillis e Caramazza 1995, vengono analizzate le prestazioni di una paziente, EBA, che a seguito di vari ictus che avevano colpito l'emisfero sinistro presentava un'afasia anomica e una grave dislessia. In particolare vengono riferiti i risultati di EBA in una serie di compiti linguistici che avevano come scopo quello di indagare le eventuali differenze nell'uso di nomi e verbi nel parlato e nello scritto.

Alla paziente furono somministrati diversi tipi di test di comprensione e produzione di stimoli orali11. I risultati dei test di comprensione furono nella norma, mentre si registrarono molti errori nei test di produzione, la maggior parte dei quali nella produzione di nomi: EBA produceva infatti correttamente solo il 10% circa dei nomi contro il 70% dei verbi. Questi risultati apparsero del tutto coerenti con il fatto che il parlato spontaneo di EBA conteneva un numero più alto di verbi usati correttamente rispetto ai nomi.

Furono poi somministrati altri test il cui input non era orale, ma scritto12, in cui "EBA also showed a striking dissociation between nouns and verbs, but in the opposite direction.

11 I test somministrati erano: 1) denominazione orale che consiste nel dover nominare oralmente oggetti o eventi rappresentati in una serie di disegni; 2) lettura ad alta voce di nomi di oggetti; 3) comprensione di parole prodotte oralmente; 4) riconoscimento di nomi e verbi omonimi (per es. shed = n. capanno; v. versare, togliersi gli abiti); 5) produzione di parole appartenenti alla categoria verbo (per es. cose che si fanno all'aperto) e alla categoria nome (per es. cose che si usano all'aperto). Per l'illustrazione accurata delle condizioni di somministrazione e dei risultati ai singoli test si rimanda a Hill e Caramazza 1995. 12 I test sono del tutto simmetrici a quelli orali: 1) comprensione di parole scritte; 2) riconoscimento lessicale attraverso il controllo dell'ortografia di parole e pseudoparole; 3) lettura orale. Per l'illustrazone accurata delle condizioni di somministrazione e dei risultati ai singoli test si rimanda a Hill e Caramazza1995.

Using the same items that revealed an advantadge for verbs over nouns with spoken output, EBA showed a striking advantadge for nouns over verbs with written output." (Hill e Caramazza1995: 401).

In conclusione dai risultati dei test sembra che i verbi sono elaborati più accuratamente dei nomi per la realizzazione orale e che i nomi sono elaborati più accuratamente dei verbi per la realizzazione scritta.

Un altro caso viene descritto da Rapp e Caramazza 1997. Si tratta di un paziente cerebroleso con distubi acquisiti del linguaggio che quando parla usa con estrema difficoltà quasi tutte le parole, tranne quelle funzionali, mentre quando scrive mostra un'assenza quasi totale di parole funzionali, ma un uso relativamente normale dei nomi.

The impression created by his speech was that it contained the syntactic

elements as well as the prosody of appropriate sentences (albeit with very few

recognizable content words), while his writing contained content words but

lacked sentence structure. Thus, while his spoken output provided the surface

features of seemingly intact syntactic processing and function word vocabulary,

his written production exhibited difficulties with just these aspects of sentence

production (Rapp e Caramazza 1997: 260).

Al paziente, P.B.S., furono somministrati vari test mirati ad esaminare in dettaglio la diversità di comportamento nel parlato e nello scritto13. I risultati confermano l'impressione iniziale. In particolare se si confrontano i risultati di P.B.S. con quelli di persone non deficitarie, si vede che la produzione delle parole funzionali di P.B.S. è nella norma nel parlato, mentre è chiaramente fuori dalla norma nello scritto. Al contrario, la produzione dei nomi è eccessiva nello scritto, ma rara nel parlato. Meno compromesso sembra l'uso dei verbi, anche se nello scritto spesso mancano o sono usati in modo non specifico.

Queste difficoltà nell'uso di parole appartenenti a categorie grammaticali diverse sono, secondo gli autori, coerenti con dati provenienti da numerosi altri studi. E' stato infatti registrato che le produzioni orali di pazienti afasici manifestano più comunemente i tratti specifici dell'afasia di Wernicke, detta anche anomica, mentre le produzioni scritte manifestano più frequentemente i tratti specifici dell'afasia di Broca, che colpisce la fluenza. Parlato e scritto sembrano quindi colpiti in modo spesso diverso: l'uno con difficoltà nell'uso di nomi, l'altro con la mancata fluenza e con la difficoltà nell'uso delle parole grammaticali.

13 I test sono: 1) descrizione scritta di un disegno; 2) descrizione orale di un disegno; 3) racconto orale di una storia; 4) racconto scritto di una storia; 5) descrizione orale di azioni; 6) descrizione scritta di azioni. Per l'illustrazone accurata delle condizioni di somministrazione e dei risultati ai singoli test si rimanda a Rapp e Caramazza 1997.

Tanto in Hillis e Caramazza 1995 quanto in Rapp e Caramazza 1997 si avanza, dunque, l'ipotesi che le rappresentazioni semantiche e sintattiche di singole parole o di frasi non siano amodali, ma al contrario che vi siano rappresentazioni indipendenti per la forma fonologica e per la forma ortografica degli elementi lessicali appartenenti a categorie diverse. In Rapp e Caramazza 1997 in particolare si ipotizza che anche le diverse categorie grammaticali (almeno nome, verbo e parole funzionali) siano rappresentate separatamente per la forma fonologica e quella ortografica. Pur non volendo entrare nel merito della validità neuropsicologica di queste ipotesi, è importante sottolineare che i risultati di queste indagini si possono ben integrare con i dati da noi registrati sulla frequenza di nomi e verbi nel parlato e nello scritto. Essendo infatti nello scritto più usati i nomi dei verbi e nel parlato più usati i verbi, risulta che si preservano meglio le categorie grammaticali che caratterizzano di più ciascuna modalità di trasmissione.

Meno immediatamente spiegabili sono i dati esposti in Rapp e Caramazza 1997 sulle parole funzionali, benché anche in questo caso le frequenze indichino delle differenze non casuali tra parlato e scritto. La tabella 10 riporta la frequenza di articoli, congiunzioni e preposizioni nell'italiano parlato e scritto14.

FORME LIP DR DP VELI15

Articoli 10,9% 7,5% 11,5% 10,1% Pronomi 10,9% 2,5% 5,9% 5,8% Congiunzioni 10,1% 4,3% 5,6% 6,3% Preposizioni 11,6% 11,6% 16,4% 21,6% Tabella 10: frequenza delle parole appartenenti al vocabolario grammaticale in corpora di italiano

parlato e scritto.

Le diversità di percentuali di parole grammaticali nel parlato e nello scritto pur essendo meno marcate di quelle riscontrate per la frequenza di nomi e verbi, rivelano tendenze interessanti. La diversità maggiore si riscontra nella frequenza di pronomi e congiunzioni; articoli e preposizioni variano invece in misura minore, con l'eccezione del VELI, in cui le preposizioni costituiscono oltre un quinto delle occorrenze.

14 In Rapp e Caramazza 1997 si parla di functional words or closed class vocabulary senza ulteriori specificazioni. Poiché vengono presentati dati separati per nomi, verbi e aggettivi/avverbi, ritengo che le parole funzionali siano appunto articoli, pronomi, congiunzioni e preposizioni. 15 La fonte dei dati è Rizzi 1994.

Il maggior numero dei pronomi nel parlato è legato a vari fattori, tra i quali bisogna almeno ricordare i seguenti: a) uso di elementi deittici che fanno riferimento alla situazione; b) uso di catene anaforiche ; c) uso di dislocazioni a destra e sinistra con riprese pronominali. Benché non esistano, a mia conoscenza, dati quantitativi precisi sulla frequenza di queste strutture nel parlato e nello scritto, esistono molti studi che le indicano come più frequenti nei testi parlati [Berretta 1994; Mortara Garavelli 1993].

Il maggior numero di congiunzioni, già notato in altri lavori sulla sintassi del parlato e dello scritto (Policarpi e Rombi 1985; Halliday 1989; Voghera 1992), è attribuibile alle diverse strategie sintattiche usate nelle due modalità. Il parlato preferisce una sintassi a nodo centrale verbale con frasi connesse tra loro attraverso congiunzioni. Lo scritto, invece, preferisce una sintassi, per così dire, più compatta in cui le valenze dei verbi sono saturate da sintagmi complessi, connessi tra loro da preposizioni. Inoltre lo scritto, facendo un ampio uso di nominalizzazioni, privilegia l'uso di subordinate all'infinito introdotte da preposizioni.

Ad una sintassi compatta si accompagna generalmente un'alta densità lessicale. La densità lessicale si misura calcolando la percentuale di parole piene sul totale delle parole di ciascuna clausola; la densità lessicale di un testo è data quindi dalla media dei valori di densità registrati per ogni singola clausola. Halliday (1985) calcola che l'inglese scritto abbia una densità lessicale doppia di quella del parlato. In conclusione lo scritto usa molte più parole piene del parlato e, tra queste, più nomi. Un caso di sintassi compatta in un testo lessicalmente molto denso è il seguente:

(1)

Vertice a Palazzo Chigi dei responsabili delle relazioni pubbliche. Da una parte

pasquale Cascella e Fabrizio Rondolino, gli uomini comunicazione e immagine

di D'Alema; dall'altra i responsabili degli uffici stampa dei vari ministeri. Un'ora

e mezzo circa di riunione, si apprende, per una conoscenza reciproca (ci sono

alcuni volti nuovi) e per “coordinare” meglio il lavoro e il rapporto con i

giornalisti. (La Stampa, 5/11/1998)

Questo testo, tratto da un quotidiano, presenta una sintassi compatta al massimo grado

e un'altissima densità lessicale. Naturalmente non tutti i testi scritti sono ugualmente compatti e densi, come si può vedere dal confronto del testo precedente con quello riportato qui di seguito, tratto da un romanzo:

(2) Questa mattina mi sono distratto e ho cominciato a fischiare in classe. Stavo

sostituendo un collega assente e gli studenti si industriavano in vario modo: chi

ripassava un po' di francese, chi ragioneria, chi giocava a battaglia navale, chi

vagava da un banco all'altro, chi infilava pezzetti di carta nel pullover di qualche

compagno, chi inseguiva non so chi altro per giustiziarlo.

(D. Starnone, Fuori registro, Feltrinelli)

Questo testo è pur presentando quasi lo stesso numero di parole piene di (1), è

lessicalmente meno denso e meno compatto del precedente. Infatti in (1) abbiamo 35 parole piene su un totale di 65 in 7 clausole; in (2) abbiamo abbiamo 31 parole piene su un totale di 63 in 12 causole.

Benché la compattezza sintattica e la densità lessicale siano solitamente associate, esse sono due caratteristiche teoricamente separate. La densità lessicale è infatti legata al rapporto tra parole piene e parole vuote, mentre la compattezza dipende dal grado di incassatura e, quindi, di gerarchizzazione tra sintagmi all'interno della causola e di clausole all'intero della frase. E' importante tuttavia notare che non si tratta di variabili totalmente indipendenti: è difficile infatti che un testo sintatticamente compatto, non sia anche lessicalmente denso, mentre non sembra vero il contrario.

Nonostante, i testi scritti possano esibire gradi diversi di compattezza sintattica e densità lessicale, è, comunque, lecito però sostenere che i testi scritti sono mediamente più compatti e più densi dei testi parlati. Un'idea della differenza si può ricavare dal confronto dei brani precedenti con il testo di una lezione universitaria di diritto16:

(3) (...)in questo primo senso # il diritto sta ad indicare quel complesso di regole #

che derivano da una organizzazione e che sono fonte di quelle situazioni

soggettive di potere e dovere # alcune delle quali abbiamo esaminato (...)

nell'esempio che vi ho proposto # nello stesso tempo la parola diritto ha un

secondo significato anche nel linguaggio corrente e vorrei dire ancor di più nel

eh nel linguaggio giuridico che ha una sua nomenclatura un suo vocabolario ma

che per il novanta per cento se è possibile ed è giusto fare delle percentuali

ricalca il linguaggio corrente (...). (Testo LIP)

Il testo (3), nonostante sia un parlato pianificato e formale, si distingue dallo scritto

poiché presenta una sintassi a concatenazione seriale. Troviamo infatti molte relative che permettono di modificare un costituente senza interrompere l'ordine delle informazioni. A

16 Il segno # indica una pausa.

parte un inciso nella parte finale non abbiamo frasi incassate. Nel complesso quindi abbiamo una sintassi meno gerarchizzata, senza nominalizzazioni così tipiche della sintassi compatta del testo (1). Meno distante questo testo da (1) per ciò che riguarda la densità lessicale, a conferma del fatto che è possibile trattare la densità lessicale e la compattezza sintattica come variabili parzialmente indipendenti.

Questo breve confronto può dare una prima spiegazione della diversa distribuzione del vocabolario grammaticale nel parlato e nello scritto, illustrata nella tabella 10, e del diverso comportamento del paziente studiato in Rapp e Caramazza 1997. Il mantenimento del vocabolario grammaticale nelle produzioni orali di P.B.S. e, al contrario, la sua forte riduzione nello scritto, in cui vengono invece preservati i nomi, dipendono dal fatto che i testi parlati e i testi scritti sono organizzati in modo molto diverso. La lingua di P.B.S. mantiene quindi le caratteristiche proprie delle due modalità: pur con un linguaggio fortemente danneggiato, P.B.S. produce degli enunciati plausibili nella loro architettura generale sia quando parla sia quando scrive.

6. Non è facile, e forse anche poco utile, trovare una spiegazione unica all'insieme dei dati esposti finora. E' possibile però cercare di mettere ordine tra le variabili considerate.

Il primo dato da considerare è che la diversità nella frequenza d'uso di nomi e verbi non dipende da una diversa distribuzione delle categorie grammaticali nel lessico parlato e scritto. Il confronto tra i lemmari mette in evidenza che il lessico potenziale è ugualmente organizzato, per quel che riguarda la distribuzione delle categorie grammaticali, sia nel parlato sia nello scritto. I nomi sono sempre più numerosi dei verbi e il loro numero aumenta col decrescere della frequenza. Inverso è il comportamento delle parole grammaticali, il cui numero decresce col decrescere della frequenza. Più stabile è invece la quantità dei verbi nelle diverse fasce di frequenza, come si nota nel FF (Gouggenheim et al. 1964:117):

La variation du pourcentage des verbes est plus irrégulière. Au dèbut, elle croit

rapidement de 9,09% a 23% jusqu'à la frequence 500, puis elle decroit

légèrment jusqu'a à la frequence 300, pour se maintenir ensuite aux alentour de

20% (21,25%). Sauf dans que les plus hautes fréquences, qui comportent

presque exclusivement des mots grammaticaux, la proportion des verbes est

donc relativement stable, quelle que soit la frequence. (Gouggenheim et al.

1964: 117)

Le differenze nella percentuale di nomi, verbi e parole grammaticali nei testi parlati e scritti non dipendono quindi dall'organizzazione interna al lessico, ma dal modo in cui i testi vengono costruiti. Due sono le caratteristiche che condizionano maggiormente la configurazione dei testi parlati: la scarsa pianificabilità e la dialogicità. Quando parliamo i testi non sono, di norma, pianificati in anticipo e chi parla sa che la produzione di un testo parlato non è un processo che procede ininterrotto dall'inizio alla fine. Al contrario, i testi subiscono, per dir così, interruzioni e cambiamenti di rotta determinati in parte dall'intervento degli interlocutori in parte dall'emittente stesso che può modificare la propria strategia in qualsiasi momento a seconda del contesto. Un testo parlato è dunque per definizione un testo in movimento in cui non esiste un autore unico: è una struttura a più voci di cui non è predicibile la configurazione finale17. Date queste condizioni enunciative, perché un testo parlato risulti comprensibile e funzionale deve essere costruito in modo seriale sia dal punto di vista della progressione dell'informazione sia dal punto di vista della concatenazione sintattica. La serialità permette al produttore e al ricevente di procedere a piccoli passi senza sovraccaricare troppo la propria memoria e riduce al minimo la potenziale perdita di informazione dovuta alla frammentarietà della produzione e della ricezione. Dal punto di vista sintattico la serialità si manifesta primariamente con la concatenazione di clausole verbali in cui le valenze del verbo sono saturale da sintagmi semplici o da pronomi per lo più atoni. Un esempio si può vedere nella conversazione seguente:

(4)

B1- ciao come va?

A1- bene bene

B2- ah stai studiando?

A2- sì

B3- ti ho disturbato?

A3- no non non non ti preoccupare capirai

B4- ah

A4- per me ogni momento è buono

B5- no # ti ho telefonato ieri pomeriggio non c'era nessuno a casa tua

A5- io ho telefonato da te ieri pomeriggio era occupato poi ho dovuto fa' altre

telefonate perché m'avevano chiesto se andavo al cinema allora

B6- io ti ho telefonato ieri pomeriggio non c'era nessuno e poi eh non ci stava

nessuno saranno state tipo # le sette così

17 Esistono naturalmente situazioni che permettono gradi di pianificabilità diversa, per una discussione più ampia si veda Voghera 1992.

A6- ah

B7- e poi in serata ...

A7- era occupato (...)

(Testo LIP)

Una struttura così fatta risponde ad un altro requisito importante, connesso alle

condizioni enunciative generali del parlato: la brevità. La contemporaneità di produzione e ricezione, la possibilità di essere interrotti consigliano l'uso di frasi brevi in cui, tra l'altro, si possa ottimizzare il rapporto tra struttura prosodica e struttura sintattica. E' noto che la prosodia produce informazione solitamente in cooperazione con la struttura segmentale. Benché tra prosodia e sintassi non vi sia un rapporto gerarchico in nessun senso, è in qualche modo naturale che l'articolazione prosodica, in unità tonali, e quella sintattica, in clausole, tendano a cooperare nella costruzione del senso18. Ciò avviene tanto più quanto è maggiore il ritmo di produzione. I testi che presentano una frequenza maggiore di scambio verbale, e quindi ritmi di produzione più alti, tendono infatti a presentare clausole più brevi in cui la codificazione intonativa e quella sintattica procedono armonicamente [Voghera 1992]. Essendo l'intonazione, così come la sintassi, un meccanismo interno di costruzione testuale, non è strano constatare che la conversazione spontanea, in quanto espressione normale del parlato, rappresenti al meglio la compenetrazione tra questi due livelli.

L'insieme di questi fattori spiega perché una sintassi compatta fortemente gerarchica e ad alta densità lessicale non sia adatta al parlato e perché il parlato abbia bisogno di una struttura fluida e diluita. I testi parlati e i testi scritti si comportano infatti, da questo punto di vista, come due insiemi distinti.

Ciò non vuol dire, come è ovvio, che non vi siano differenze interne al parlato e allo scritto. Al contrario possiamo notare che la sintassi dello scritto può assomigliare a quella del parlato man mano che aumentano nei testi le porzioni narrative e/o dialogiche. Non è un caso che nel corpus LOB i verbi aumentano se si passa dalla prosa informativa (informative prose) alla prosa immaginativa (immaginative prose)19, come si vede nella tabella 11.

18 Esistono anche casi in cui prosodia e sintassi si contraddicono [Voghera 1998], ma sono senz'altro casi marcati. 19 Fanno parte della prosa informativa: articoli di giornali di cronaca, fondi editoriali, recensioni, libri e periodici religiosi, pubblicazioni professionali e di intrattenimento, pubblicazioni divulgative, saggi, biografie, pubblicazioni governative, pubblicazioni ufficiali di enti e istituzioni, pubblicazioni di scienze umane. Fanno parte della prosa immaginativa: romanzi e racconti appartenenti a generi diversi, articoli di periodici satirici. Per una descrizione dettagliata della composizione del corpus si veda Johansson e Hofland 1989.

FORME LOB PROSA INFORMATIVA PROSA IMMAGINATIVA TOTALE NOMI 26.9% 20.0% 25,4% VERBI 16.4% 21.9% 17,9% TABELLA 11: dei nomi e dei verbi nel corpus LOB di inglese scritto.

I nomi sono più dei verbi sul totale del corpus, ma diminuiscono considerevolmente fino a superare il numero dei nomi nella prosa immaginativa. Gli autori osservano a questo proposito che "The amount of dialogue is no doubt to a large extent responsible for the differences observed between the two groups" (Johansson e Hofland 1989: 16).

Come è già stato mostrato altrove [Voghera 1992], la dialogicità è tra le varie caratteristiche del parlato quella che lo connota maggiormente. La condizione più naturale ed immediata del discorso parlato è il dialogo, cioè lo scambio comunicativo libero e reciproco. Da ciò discendono alcuni caratteri primari dell'organizzazione discorsiva del parlato che informano la struttura dei testi anche quando essi sono monologici o prevalentemente monologici. Si è infatti constatato che anche i testi non costituiti in turni di presa di parola presentano alcune caratteristiche che sono attribuibili ad una sorta di sostrato dialogico (Voghera 1992). A questo scopo il parlato mette in atto, seppure con modalità e in proporzioni diverse a seconda dei contesti, alcune delle strategie discorsive specifiche cui corrisponde, tra l'altro, una diversa distribuzione delle categorie grammaticali.

Come si vede per cercare una prima spiegazione della diversa frequenza dei nomi e dei verbi in testi parlati e scritti siamo dovuti risalire dai testi alle strategie sintattico-testuali proprie delle due modalità. Non si tratta di presupporre due grammatiche separate per il parlato e lo scritto, ma probabimente processi codificativi specifici. Mi riferisco qui al procedimento di codificazione che comprende sia la parte articolatorio-uditiva e manuale-visiva sia la parte ideativa. Le peculiarità del parlato e dello scritto registrabili, per così dire, a valle, cioè nella fase di realizzazione/ricezione del messaggio, hanno probabilmente un corrispettivo a monte, cioè nella fase di progettazione. A meno di non voler rappresentare la facoltà del linguaggio come un ingranaggio che funziona autonomamente e indipendentemente dalle mediazioni operate dalle condizioni enunciative, non è difficile pensare che il discorso parlato sia regolato da un programma diverso da quello che regola il discorso scritto. Ciò prevede un rapporto attivo tra facoltà del linguaggio ed esecuzione: una potenziale influenza retroattiva a lungo termine dell'esecuzione tale che la competenza stessa viene regolata dalla progressiva attivazione del procedimento esecutivo. Questa linea interpretativa trova qualche conferma nei dati delle indagini neuropsicologiche, che abbiamo riportato nel paragrafo 5. La persistenza nel linguaggio degli afasici di caratteristiche diverse

nel parlato e nello scritto e il fatto che l'afasia possa colpire in modo divero il parlato e lo scritto sembrerebbe confermare l'idea che le diverse configurazione dei testi parlati e scritti rispondono ad esigenze semiotiche diverse, senza per questo dover immaginare competenze diverse. Nonostante i soggetti afasici mostrassero delle diversità marcate nelle loro produzioni parlate e scritte, la loro capacità di comprendere testi parlati e scritti non mostrava differenze.

In conclusione l'insieme dei dati presentati, benché richieda ulteriori e più approfondite indagini, mostra quanto sia difficile una linguistica amodale, che prescinda cioè totalmente e programmaticamente dal sistema di trasmissione usato. I testi non sono, se non per artificio, amodali; al contrario i testi dei discorsi parlati e scritti prevedono al loro interno una distribuzione dell'informazione e una struttura sintattica che sono vincolate al sistema di trasmissione usato già in fase di progettazione. Ciò che distingue il parlato dallo scritto non è tanto la codificazione in foni, ma il diverso rapporto tra sequenza verbale e contesto enunciativo che la diversa codificazione comporta. Ciò rende necessario trattare parlato e scritto non come variazioni d'uso o varietà diverse, ma come modalità semiotiche.

Fonti dei dati Elenco qui di seguito le abbreviazioni delle fonti consultate; per ogni fonte indico il volume o l'articolo in cui è possibile reperire i dati. DP= Due Parole, Piemontese 1996 DR= Dizionario di riferimento IBM, Mancini 1993. FF= Elaboration du français fondamental, Guggenheim et al. 1968 LGSRE= Longman Grammar of Spoken and Written English, Biber et al. 1999 LE= Lessico elementare, Marconi et al. 1994. LIF= Lessico di frequenza dell'italiano, Bortolini et al. 1971. LIP= Lessico di frequenza dell'italiano parlato, De Mauro et al. 1993. LOB= Corpus Lancaster-Oslo/Bergen, Johansson et al. 1989. HWB= Häufigkeitswörterbuch gesprochener Sprache, Ruoff 1990. ZM= Zingarelli minore VBD= Vocabolario di base, De Mauro 1991 VELI= Vocabolario elettronico della lingua italiana, Rizzi 1994. Riferimenti bibliografici Berretta, M., 1994, Il parlato italiano contemporaneo, in Serianni, L., Trifone, P. (a cura di), Storia della lingua italiana, vol. 2, Torino, Einaudi, pp. 239-270. Berruto, G.,1993, Varietà diamesiche, distratiche, diafasiche, in Sobrero, A.(a cura di), Introduzione all'italano contemporaneo. La vaiazione e gli usi, Bari-Roma, Laterza, pp. 37-92. Berruto, G., 1995, Fondamenti di sociolinguistica, Roma-Bari, Laterza. Biber, D., Johansson, S., Leech, G., Conrad, S., Finegan, E., 1999, Longman Grammar of spoken and Written English, London, Longman. Bortolini, U., Tagliavini, C., Zampolli, A., 1972, Lessico di frequenza della lingua italiana contemporanea, Garzanti-IBM, Milano. De Mauro, T., 1991, Guida all’uso delle parole, Roma, Editori Riuniti. De Mauro, T., Mancini, F., Vedovelli, M., Voghera, M., 1993, Lessico di frequenza dell’italiano parlato, Milano, ETASLIBRI. Giordano, R., Voghera, M., in corso di stampa, Verb types and verb forms in spoken and written Italian, JADT 2002 : 6es Journées internationales d’Analyse statistique des Données Textuelles. Halliday, M.A.K., 1989, Spoken and Written language, Oxford, Oxford University Press.

Hillis, A. E., Caramazza, A., 1995, Representation of Grammatical Categories of Words in the Brain, "Journal of Cognitive Neuroscience", 7: 3, pp. 396-407. Laudanna, A., Voghera, M., Gazzellini, S., in corso di stampa, “Lexical representations of written nouns and verbs in Italian”, Brain and language. Mancini, F., 1993, L’elaborazione automatica del corpus, in De Mauro et al., pp. 54-85. Mortara Garavelli, B., Strutture testuali e retoriche, in Sobrero, A. (a cura di), Introduzione all'italiano contemporaneo.Le strutture, Bari-Roma, Laterza, 1993, pp. 371- 402. Gougenheim, G., Michéa, R., Rivenc, P., Sauvageot, A., 1964, L'élaboration du français fondamental, Paris, Didier. Johansson, S., Hofland, K., Frequency analysis of English vocabulary and grammar, Oxford, Clarendon Press, 1989. Marconi, L., Ott, M., Pesenti, E., Ratti, D., Tavella, M., 1994, Lessico elementare. Dati statistici sull'italiano scritto e letto dai bambini delle elementari, Bologna, Zanichelli. Nencioni, G., 1983, Parlato-parlato, parlato-scritto, parlato-recitato, in Di scritto e di parlato, Bologna, Zanichelli, pp.133-141. Piemontese, E., 1996, Capire e farsi capire, Napoli, Tecnodid. Policarpi, G., Rombi, M., 1985, Usi dell’italiano. La nominalizzazione, in Franchi De Bellis, A., Savoia, L.M. (a cura di), Sintassi e morfologia della lingua italiana d’uso. Teorie e applicazioni descrittive, Atti del XVII Congresso Internazionale di Studi della SLI, Roma, Bulzoni, pp. 393- 406. Rapp, B., Caramazza, A., The Modality-Specific Organization of Grammatical Categories: Evidence from Impaired Spoken and Written sentence Production, “Brain and Language”, 56, 1997, pp.248-286. Ratti, D., Marconi, L., Burani, C., Radiografia dell'italiano, Pubblicazioni del "Dipartimento di statistica, probabilità e Statistiche applicate", n.2, 1995. Rey-Debove, J., 1983, Le mètalangage dans le langage parlé, in “Recherches sur le français parlé”, 5, pp.211-226. Rizzi, A., La distribuzione delle forme grammaticali nella lingua italiana, Pubblicazioni del "Dipartimento di statistica, probabilità e statistiche applicate", no.2 A2, Roma, Università La Sapienza, 1994. Ruoff, A., Häufigkeitswörterbuch gesprochener Sprache , Tübingen, Niemeyer, 1990. Sornicola, R.,

Testa, E., Simulazione di parlato, Firenze, Accademia della Crusca,1990. Thornton, A.M., Iacobini, C., Burani, C., BDVDB-Una base di dati sul vocabolario di base della lingua italiana, Roma, Bulzoni, 1994. Veli, 1989, Vocabolario elettronico della llingua italiana. Il vocabolario del 2000, Milano, IBM Italia. Voghera, M., 1992, Sintassi e intonazione nell’italiano parlato, Bologna, Il Mulino. Voghera, M., 1994, Promemoria per una teoria del linguaggio, in De Mauro, T.(a cura di), Come parlano gli italiani, Firenze, La Nuova Italia, pp.131-145. Voghera, M., 1995, Quali parole scrivono e leggono i bambini, “Italiano e Oltre”, 5, pp.317-318. Voghera, M., 1998, Qualche osservazione su significati lessicali e grammaticali, in Albano Leoni et al., Ai limiti del linguaggio, Roma-Bari, Laterza, 1998, pp. 127-137. Voghera M., in corso di stampa, Nouns and verbs in speaking and in writing, in E. Burr (a cura di), Linguistica e filologia italiana alle soglie di un nuovo millennio, Atti del VI Congresso internazionale della Società di linguistica e filologia italiane, Duisburg 2000.