LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2

10
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2 Lezione 2: Primi rudimenti di Python NLTK: operazioni su testi e stringhe 1

description

LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2. Lezione 2: Primi rudimenti di Python NLTK: operazioni su testi e stringhe. In questa lezione. Uso di IDLE Python: istruzioni , variabili , liste Documenti in Python ( Contenuti del Capitolo 1 del libro su NLTK). Per iniziare. - PowerPoint PPT Presentation

Transcript of LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2

Page 1: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2

Lezione 2: Primi rudimenti di Python

NLTK: operazioni su testi e stringhe

1

Page 2: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

In questa lezione

• Uso di IDLE• Python: istruzioni, variabili, liste• Documenti in Python

– (Contenuti del Capitolo 1 del libro su NLTK)

Page 3: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Per iniziare

• Aprite IDLE• Aprite la pagina: – http://www.nltk.org/book/ch01.html

Page 4: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Primi passi con un linguaggio di programmazione

• ISTRUZIONI• Istruzione piu’ semplice: PRINT

print 3• Notare: niente ;

• Poco piu’ difficile: assegnare un VALORE ad una VARIABILE x = 1+3

• Notare: il valore a destra di = e’ una funzione che puo’ essere arbitrariamente complessa

• Verificare che X ha effettivamente il valore desiderato: print X

Page 5: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Primi passi con il pacchetto nltk

• Uno dei motivi per cui Python e’ cosi’ popolare (per esempio tra i neuroscienziati) e’ il gran numero di LIBRERIE esistenti– per esempio PyMVPA

• Le librerie sono dei MODULI indipendenti• I moduli si caricano usando il comando IMPORT• Scrivete: import nltk

Page 6: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Primi documenti

• Una volta importato un modulo, ci si puo’ riferire ai suoi contenuti (variabili, funzioni, etc) usando la notazione modulo.funzione– Per esempio, nltk.book

• Eseguite: from nltk.book import *• In questo modo avete scaricato una serie di documenti

assegnando dei valori alle variabili text1, text2, …– (Vedremo tra un momento che valori vengono assegnati a

queste variabili)

Page 7: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Liste in Python• I documenti in NLTK hanno rappresentazioni diverse, una

delle quali e’ in forma di LISTA• Le liste sono il secondo tipo di dato che vedremo in

Python• Una lista e’ una sequenza di elementi anche di tipi diversi

sent1 = [‘Call’, ‘me’, ‘Ishmael’]• Operazioni base su liste:

– Accedere ad elementi: sent1[0], sent1[-1]– Accedere a sottoliste (slicing): text5[16715:16735]– Lunghezza: len(sent1)

Page 8: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Documenti come liste in NLTK

• p.12

Page 9: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Operazioni di base su documenti

• Frequency distribution• Concordance• Collocations

Page 10: LINGUISTICA GENERALE E COMPUTAZIONALE,  PARTE 2

Ancora Python

• Tipi dati aggiuntivi: Stringhe• Operatori• Costrutti:– Insiemi– Condizionali– Cicli

• Funzioni