LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
description
Transcript of LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
LINGUISTICA GENERALE E COMPUTAZIONALE, PARTE 2
Lezione 2: Primi rudimenti di Python
NLTK: operazioni su testi e stringhe
1
In questa lezione
• Uso di IDLE• Python: istruzioni, variabili, liste• Documenti in Python
– (Contenuti del Capitolo 1 del libro su NLTK)
Per iniziare
• Aprite IDLE• Aprite la pagina: – http://www.nltk.org/book/ch01.html
Primi passi con un linguaggio di programmazione
• ISTRUZIONI• Istruzione piu’ semplice: PRINT
print 3• Notare: niente ;
• Poco piu’ difficile: assegnare un VALORE ad una VARIABILE x = 1+3
• Notare: il valore a destra di = e’ una funzione che puo’ essere arbitrariamente complessa
• Verificare che X ha effettivamente il valore desiderato: print X
Primi passi con il pacchetto nltk
• Uno dei motivi per cui Python e’ cosi’ popolare (per esempio tra i neuroscienziati) e’ il gran numero di LIBRERIE esistenti– per esempio PyMVPA
• Le librerie sono dei MODULI indipendenti• I moduli si caricano usando il comando IMPORT• Scrivete: import nltk
Primi documenti
• Una volta importato un modulo, ci si puo’ riferire ai suoi contenuti (variabili, funzioni, etc) usando la notazione modulo.funzione– Per esempio, nltk.book
• Eseguite: from nltk.book import *• In questo modo avete scaricato una serie di documenti
assegnando dei valori alle variabili text1, text2, …– (Vedremo tra un momento che valori vengono assegnati a
queste variabili)
Liste in Python• I documenti in NLTK hanno rappresentazioni diverse, una
delle quali e’ in forma di LISTA• Le liste sono il secondo tipo di dato che vedremo in
Python• Una lista e’ una sequenza di elementi anche di tipi diversi
sent1 = [‘Call’, ‘me’, ‘Ishmael’]• Operazioni base su liste:
– Accedere ad elementi: sent1[0], sent1[-1]– Accedere a sottoliste (slicing): text5[16715:16735]– Lunghezza: len(sent1)
Documenti come liste in NLTK
• p.12
Operazioni di base su documenti
• Frequency distribution• Concordance• Collocations
Ancora Python
• Tipi dati aggiuntivi: Stringhe• Operatori• Costrutti:– Insiemi– Condizionali– Cicli
• Funzioni