A D IET – P ROGETTO PER L ESAME DI L INGUAGGI E M ODELLI C OMPUTAZIONALI LS Prof. Enrico Denti...
-
Upload
domenica-romeo -
Category
Documents
-
view
213 -
download
0
Transcript of A D IET – P ROGETTO PER L ESAME DI L INGUAGGI E M ODELLI C OMPUTAZIONALI LS Prof. Enrico Denti...
ADIET – PROGETTO PER L’ESAME DI LINGUAGGI E MODELLI COMPUTAZIONALI LSProf. Enrico Denti
Sviluppato da Fabio Bracci – AA 2009/2010
IDEA PROGETTUALE (1)
?
Dieta
L’idea progettuale è la definizione di un linguaggio che consenta di descrivere una dieta alimentare.
Però un semplice elenco degli alimenti non ha un gran interesse: sarebbe molto più utile poter fornire anche delle informazioni sulla dieta alimentare.
Per ottenere delle statistiche risulta necessario caratterizzare ogni alimento presente nella dieta con le proprie informazioni sui nutrienti più importanti.
Per fare questo, si potrebbe inserire nella dieta non solo il nome dell’alimento e la sua quantità, ma anche tutti i suoi valori
questo comporta una replicazione delle informazioni nel caso in cui un alimento sia presente più volte nella dieta alimentare
IDEA PROGETTUALE (2)
… ProteineLipidi
Carboidrati …
Database
Dieta
Si potrebbe realizzare un database degli alimenti, di supporto alla dieta alimentare, contenente tutti i dati sui nutrienti più rilevanti ai fini dietetici, in modo da inserire nella dieta per ogni alimento, non più il nome e la lista dei nutrienti, ma solamente un codice per risalire al medesimo alimento nel database di supporto
Non vi è alcuna replicazione
d’informazione In base alle scelte progettuali
quindi, si è scelto di definire non solo un linguaggio per la descrizione di un dieta alimentare ma anche di un linguaggio che consenta di descrivere un database alimentare.
FASI DI REALIZZAZIONE
Definizione di un’opportuna grammatica e di un linguaggio per descrivere un database e una dieta alimentare;
Realizzazione del Parser e dell’Interprete; Implementazione del sistema con l’aggiunta
di GUI; Collaudo.
VERSO LA GRAMMATICA (1) Durante la realizzazione del progetto, la grammatica
ha subito dei cambiamenti al fine di rendere il linguaggio di semplice utilizzo (pensando ad un ipotetico utilizzatore finale).
Per far ciò si sono eliminate le parti superflue e resa la grammatica più flessibile possibile (per fare fronte alla soggettività incontrata nel determinare equazioni corrette per il calcolo delle statistiche alimentari).
Ricordando che G = < VT, VN, P, S > VT e l’insieme dei simboli terminali VN è l’insieme dei simboli non terminali P è l’insieme delle produzioni della grammatica S rappresenta lo scopo
VERSO LA GRAMMATICA (2) <ADiet> ::= begin: ( <Database> | <User>) end.
<Database> ::= database: <Categories> enddatabase. <Categories> ::= category: <Category> endcategory. <Category> ::= <CATEGORY_NAME> <FoodsCategory> <FoodsCategory>::=(food: <FoodCategory> endfood.)+ <FoodCategory> ::= (<NUMBER> (<WORD>)+ <Property>)+ <Property> ::= composition: <Composition> <Composition> ::= ( ( <NUTRIEN> , <NUMBER> ) )+
<User> ::= user: <Data> <Diet> enduser. <Data> ::= data: (<WORD>)+ <SEX> <PhisicalData> <PhisicalData> ::= <BIRTHDAY> <WEIGHT> <HEIGHT> <Diet> ::= diet: (<Day>)+ enddiet. <Day> ::= <DAY> <Means> <Means> ::= (<TIME> <FoodDiets>)+ <FoodDiets> ::= (<NUMBER> <NUMBER>)+
Il linguaggio risulta troppo complicato per
essere poi effettivamente usato.
GRAMMATICA (1)
Per una questione di flessibilità, i token sono stati ridotti al minimo: <NUMBER> ::=[0 - 9] ([0 - 9])* |
[0 - 9] ([0 - 9])* . ([0 - 9])* <WORD> ::= [a - z, A - Z, \ , - , . , 0 - 9]
([a - z, A - Z, \ , - , . , 0 - 9])*
GRAMMATICA (2) <ADiet> ::= <Database> | <User> <Diet>
<Database> ::= database (<WORD>)+ (<Category>)+ <Category> ::= category <NUMBER> (<WORD>)+
(<FoodCategory>)+ <FoodCategory> ::= <NUMBER> (<WORD>)+ <NUMBER>
<NUMBER> <NUMBER> <NUMBER>
<User> ::= user (<WORD>)+<NUMBER> / <NUMBER> / <NUMBER> <WORD> <NUMBER> kg <NUMBER> cm<NUMBER>
<Diet> ::= diet (<Week>)+ <Week> ::= week (<Day>)+ <Day> ::= day (<Meal>)+ <Meal> ::= (<WORD>)+ <NUMBER> : <NUMBER> (<FoodDiet>)+ <FoodDiet> ::= <NUMBER> <NUMBER> g
Grammatica Database
Grammatica Dieta
GRAMMATICA DATABASE (1) <ADiet> ::= <Database> | <User> <Diet>
<Database> ::= database (<WORD>)+ (<Category>)+ <Category> ::= category <NUMBER> (<WORD>)+
(<FoodCategory>)+ <FoodCategory> ::= <NUMBER> (<WORD>)+
<NUMBER> <NUMBER> <NUMBER> <NUMBER> Possiamo osservare che:
il database ha una sua descrizione ogni categoria è caratterizzata da un codice numerico e un
nome ogni alimento è caratterizzato da un codice numerico, un nome
e quattro valori numerici che si riferiscono ai tre nutrienti principali e all’energia fornita dall’alimento (questi valori si riferiscono, come è usuale in tutti i database alimentari e alle specifiche presenti anche sui prodotti che comunemente comperiamo a supermercato, a 100 g di prodotto)
GRAMMATICA DATABASE (2)
<ADiet> ::= <Database> | <User> <Diet>
<Database> ::= database (<WORD>)+ (<Category>)+
<Category> ::= category <NUMBER> (<WORD>)+ (<FoodCategory>)+
<FoodCategory> ::= <NUMBER> (<WORD>)+ <NUMBER> <NUMBER> <NUMBER> <NUMBER>
Esempio:database INRANcategory 01 Cereali e Derivati960 Biscotti alla soia 11.5 6.1 70.8 366
descrizione
codice nome
codice nome proteinelipidi (grassi)carboidratienergia
GRAMMATICA DIETA (1) <ADiet> ::= <Database> | <User> <Diet>
<User> ::= user (<WORD>)+<NUMBER> / <NUMBER> / <NUMBER> <WORD> <NUMBER> kg <NUMBER> cm<NUMBER>
<Diet> ::= diet (<Week>)+ <Week> ::= week (<Day>)+ <Day> ::= day (<Meal>)+ <Meal> ::= (<WORD>)+ <NUMBER> : <NUMBER> (<FoodDiet>)+ <FoodDiet> ::= <NUMBER> <NUMBER> g
Possiamo osservare che: la dieta viene preceduta dai dati riguardanti l’utente (nome, data di
nascita, sesso, peso, altezza, stile di vita) Ogni pasto è caratterizzato da un nome e un orario Ogni alimento è caratterizzato da due valori numerici, un codice (con il
quale si possono recuperare informazioni sull’alimento nel database) e la quantità (in grammi).
GRAMMATICA DIETA (2) <ADiet> ::= <Database> | <User> <Diet>
<User> ::= user (<WORD>)+<NUMBER> / <NUMBER> / <NUMBER> <WORD> <NUMBER> kg <NUMBER> cm<NUMBER>
Esempio:user Paolo Grassi20/08/1986m61 kg174 cm1
nome utente
data di nascita
sessopeso
altezza
stile di vita
GRAMMATICA DIETA (3)
<ADiet> ::= <Database> | <User> <Diet>
<Diet> ::= diet (<Week>)+ <Week> ::= week (<Day>)+ <Day> ::= day (<Meal>)+ <Meal> ::= (<WORD>)+ <NUMBER> :
<NUMBER> (<FoodDiet>)+ <FoodDiet> ::= <NUMBER> <NUMBER> g
Esempio:diet week day Colazione 8:00 135020 125 g
nome pastoorariocodice alimentoquantità
GRAMMATICA: OSSERVAZIONI
Come accennato in precedenza, i token sono stati minimizzati ai soli <NUMBER> e <WORD> per una scelta progettuale: Questo progetto è stato più volte modificato
cercando di dare una più ampia configurazione all’utente finale: Non c’è vincolo sul nome della categoria del database Non c’è vincolo sul nome del pasto Facilità d’integrazione di altre lingue Scelta tra Domenica o Lunedì come primo giorno della
settimana Gestione del calcolo delle calorie (stile di vita)
La grammatica è di Tipo 2 (context-free) secondo la classificazione di Chomsky, in quanto tutte le produzioni risultano essere nella forma:
Il linguaggio generato risulta essere di Tipo 3 (regolare) poiché la grammatica non contiene self-embedding.
PROPRIETÀ DELLA GRAMMATICA
RICONOSCITORE L’unica produzione alternativa presente nella grammatica è:
e i relativi Starter Symbols sono:
Da sui possiamo assumere che la grammatica è LL(1): Infatti, non solo la condizione necessaria affinché la grammatica
sia LL(1) è verificata ma, poiché nessuno dei metasimboli può generare la stringa vuota, tale condizione è anche sufficiente e non si necessita di calcolare i Director Symbols.
Poiché la grammatica è LL(1): Le frasi vengono analizzate Left-to-Right applicando la left most
derivation (derivazione canonica sinistra) e basta un solo simbolo della frase per scegliere con certezza la produzione opportuna;
STRUMENTI UTILIZZATI
JavaCC 5.0 Genera automaticamente, a partire dalla
grammatica: Il parser; Il lexer (scanner) per il riconoscimento dei token; Le classi per lanciare eventuali errori lessicali e\o
sintattici;
JTB 1.4.3 Genera le classi necessarie a creare l’albero
sintattico AST (una classe per ogni produzione della grammatica);
Implementa Visitor che operano depth-first; Eclipse 3.6.1
STRUTTURA FINALE (1)
Partendo dai due Package creati:
database
Database Category FoodCategory
user
DayDiet Diet FoodDiet
Mean User WeekDiet
STRUTTURA FINALE (2)
visitor
syntaxtree parser
DietVisitor TreeVisitor ControlVisitor
userdatabase
services
guiEditorFrame
DietFrame
exception
Fornisce metodi per le operazioni sui file .txt e .xml
Per gestire gli errori
semantici come delle eccezioni
STRUTTURA FINALE – PARSER
Il package “parser” contiene le classi relative al Lexer, al Parser ed alle eccezioni sintattiche Parser:
Realizzato da JavaCC; Rapporto Client/Server col Lexer; Restituisce l’albero generato, in modo che i vari visitor
possano visitarlo ed interpretarlo.
Il package “syntaxtree”contiene le classi che rappresentano i nodi dell’albero, in particolare una per ogni metasimbolo della grammatica.
syntaxtree parser
STRUTTURA FINALE (2)
visitor
syntaxtree parser
DietVisitor TreeVisitor ControlVisitor
userdatabase
services
guiEditorFrame
DietFrame
exception
STRUTTURA FINALE – VISITOR
La classe DepthFirstVisitor, generata da JTB, è stata estesa da tre sottoclassi: ControlVisitor
visita l’APT e viene lanciato per primo poiché verifica la correttezza semantica, gestendo gli errori semantici come eccezioni;
TreeVisitor visita l’APT e ne fornisce una rappresentazione grafica
sotto forma di albero (la quale verrà passata all’interfaccia grafica EditorFrame.java);
DietVisitor visita l’APT e fornisce tutte le statistiche necessarie per
analizzare la dieta alimentare inserita (le quali verranno passate al’interfaccia grafica DietFrame.java)
visitor
DietVisitor TreeVisitor ControlVisitor
CONTROLLO SEMANTICO
Il visitor ControlVisitor, a partire dall’APT, verifica la correttezza semantica: infatti la sola correttezza sintattica non è
sufficiente affinché la dieta o il database alimentare inserito possano essere considerati corretti:
Ma quali sono le regole semantiche?
REGOLE SEMANTICHE – DATABASE (1)
01Cereali
•960Biscotti alla soia11.5 6.1 70.8366
•900Biscotti frollini7.2 13.8 73.742901
Legumi
•4010Ceci in scatola6.7 2.3 13.9100
•4000Ceci secchi crudi20.9 6.3 46.9316
Non si possono
avere due o più categorie con lo stesso
codice
REGOLE SEMANTICHE – DATABASE (2)
01Cereali
•960Biscotti alla soia11.5 6.1 70.8366
•900Biscotti frollini7.2 13.8 73.742902
Cereali
•4010Ceci in scatola6.7 2.3 13.9100
•4000Ceci secchi crudi20.9 6.3 46.9316
Non si possono
avere due o più categorie con lo stesso
nome
REGOLE SEMANTICHE – DATABASE (3)
01Cereali
•960Biscotti alla soia11.5 6.1 70.8366
•900Biscotti frollini7.2 13.8 73.742902
Legumi
•960Ceci in scatola6.7 2.3 13.9100
•4000Ceci secchi crudi20.9 6.3 46.9316
Non si possono
avere due o più alimenti con lo stesso
codice
REGOLE SEMANTICHE – DIETA (1)
Settimana
Lunedì
Colazione7:00
500 50 g
877 100 g
Pranzo12:00
Cena19:30
…
Domenica
Settimana
Lunedì
…
Domenica
…
Pranzo13:00
748 50 g
821 100g
787 67 g
…
La dieta può essere composta da un minimo di 1 ad una massimo di 52 settimana
REGOLE SEMANTICHE – DIETA (2)
Settimana
Lunedì
Colazione7:00
500 50 g
877 100 g
Pranzo12:00
Cena19:30
…
Domenica
Settimana
Lunedì
…
Domenica
…
Pranzo13:00
748 50 g
821 100g
787 67 g
…
Ogni settimana è composta da 7 giorni e l’ordine dei giorni va
rispettato
REGOLE SEMANTICHE – DIETA (3)
Settimana
Lunedì
Colazione7:00
500 50 g
877 100 g
Pranzo12:00
Cena19:30
…
Domenica
Settimana
Lunedì
…
Domenica
…
Pranzo13:00
748 50 g
821 100g
787 67 g
…
Ogni giorno può contenere da un minimo di un pasto ad un
massimo di 7 pasti
REGOLE SEMANTICHE – DIETA (4)
Settimana
Lunedì
Colazione12:00
500 50 g
877 100 g
Pranzo12:00
Cena19:30
…
Domenica
Settimana
Lunedì
…
Domenica
…
Pranzo13:00
748 50 g
821 100g
787 67 g
…
Non si può avere in un giorno due o più pasti con lo stesso
orario.
REGOLE SEMANTICHE – DIETA (5)
Settimana
Lunedì
Colazione7:00
500 50 g
500 100 g
Pranzo12:00
Cena19:30
…
Domenica
Settimana
Lunedì
…
Domenica
…
Pranzo13:00
748 50 g
821 100g
787 67 g
…
Non si può avere in un pasto due o più alimenti con lo
stesso codice.
STRUTTURA FINALE (2)
visitor
syntaxtree parser
DietVisitor TreeVisitor ControlVisitor
userdatabase
services
guiEditorFrame
DietFrame
exception
INTERFACCIA GRAFICA – EDITORFRAME
guiEditorFrame
DietFrame
EditorFrame
INTERFACCIA GRAFICA – EDITORFRAME
EditorFrame (Database)
Esito dell’analisi lessicale, sintattica e semantica.
(ControlVisitor)
Linguaggio da analizzare
Rappresentazione grafica sotto forma d’albero del linguaggio
analizzato (TreeVisitor)
INTERFACCIA GRAFICA – EDITORFRAME
EditorFrame (Dieta)
INTERFACCIA GRAFICA – DIETFRAME
DietFrame
NOTE SUL PROGETTO (1) Nato da un’idea di oramai quasi due anni fa, in questo lasso
di tempo è stato più volte riprogettato ripartendo proprio dalla grammatica: per quanto riguarda le regole del database, essendo quest’ultimo
ben strutturato e definito, non ha ricevuto modifiche sostanziali la parte invece dedicata alla descrizione dell’utente e della dieta
è stata più volte modificata per cercare di rendere il linguaggio più familiare e più facilmente utilizzabile
da un ipotetico utente finale e per far fronte alla facile possibilità rendere la grammatica resistente alle diverse idee in ambito dietistico.
L’ultimo stadio di questa evoluzione ha portato all’eliminazione di tutti i token specifici (come <DAY>, <MEANS>, <LIFESTYLE>, <SEX>, …) proprio per alleggerire la grammatica e darle maggiore elasticità;
Questo però ha portato ad un maggior controllo semantico da parte di ControlVisitor (la maggior parte dei valori utilizzati per effettuare i controlli sono inseriti nel file Conf.java).
NOTE SUL PROGETTO (2)
Oltre alla visualizzazione grafica data dall’interfaccia DietFrame, la dieta, con i relativi grafici delle statistiche, può essere visualizzata anche mediante web browser: prima viene salvata in un file xml poi trasformata mediante foglio di stile xslt e infine avviene la validazione del documento
(XSD) È presente anche lo strumento di Log.
COLLAUDO
Per il collaudo del sistema sono stati scritti alcuni significativi file di codice per verificare: la creazione corretta dell’albero sia per il
database sia per la dieta Segnalazione di errori sintattici Segnalazione di errori semantici Corretta visualizzazione del database e della
dieta
SVILUPPI FUTURI
Creare un’interfaccia per la configurazione del sistema;
Migliorare le statistiche utilizzando equazioni, riguardanti la dieta alimentare, più complesse e complete;
Inserire la gestione di più nutrienti (non solo proteine, lipidi e carboidrati);
Aumentare la gestione dei dati utente.
PROTOTIPO
COLLAUDO
Database•Errori semantici riguardanti il linguaggio di un database alimentare.
Utente•Errori semantici riguardanti il linguaggio di una dieta alimentare (sezione utente).
Dieta•Errori semantici riguardanti il linguaggio di una dieta alimentare (sezione dieta).
COLLAUDO DATABASE
FoodAlreadyInDatabase Inserimento di un alimento già presente nel
database CategoryNameAlreadyInDatabase
Inserimento di una categoria con un nome già presente nel database
CategoryCodeAlreadyInDatabase Inserimento di una categoria con un codice già
presente nel database
FOODALREADYINDATABASE
CATEGORYNAMEALREADYINDATABASE
CATEGORYCODEALREADYINDATABASE
COLLAUDO UTENTE
IncorrectDate Inserimento di una data non corretta
IncorrectSex Inserimento di un carattere o parola non corretta
per il sesso IncorrectWeight
Inserimento per il peso di un valore non corretto IncorrectHeight
Inserimento per l’altezza di un valore non corretto IncorrectLifestyle
Inserimento per lo stile di vita di una parola non corretta
COLLAUDO DIETA
DatabaseNotLoaded Inserimento di una dieta alimentare senza la
presenza di un database IncorrectWeek
Inserimento di una settimana non composta di 7 giorni nella dieta
WeekAlreadyComplete Inserimento di un giorno in una settimana già
composta da 7 giorni IncorrectTime
Inserimento di un pasto con un orario errato MeanAlreadyInDay
Inserimento di un pasto con un orario già presente nel giorno di dieta
COLLAUDO DIETA
FoodNotInDatabase Inserimento di un alimento non presente nel
database FoodAlreadyInMean
Inserimento di un alimento con codice già presente nel pasto
NumberOfWeeksInDiet Inserimento di una settimana in una dieta già
completa NumberOfMeansInDay
Inserimento di un pasto in un giorno già completo NumberOfFoodsInMean
Inserimento di un alimento in un pasto già completo