Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...
Transcript of Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...
Intelligenza Artificiale
Agenti intelligenti
Agenti intelligenti 1
Agenti intelligenti
♦ La nostra definizione di agente intelligente♦ Introduzione al concetto di ambiente
– esempio molto semplice di ambiente♦ Il concetto di Razionalita,
– misura di prestazione,– ambiente operativo,– azioni,– sensori
♦ Proprieta degli ambienti → complessita computazionale♦ Possibili tipologie di agente → capacita computazionali diverse
Agenti intelligenti 2
Agente Intelligente (o razionale)
Un agente e una entita che percepisce ed agisce
Nel contesto del corso, un agente razionale, cerca di raggiungere il piu possi-bile i suoi obiettivi data l’informazione disponibile, ovvero cerca di massimiz-zare il soddisfacimento dei propri bisogni sfruttando tutte le informazioni dicui dispone o che puo acquisire con le sue azioni
Da un punto di vista astratto, un agente e una funzione da tutte le possibilisequenze di percezioni P∗ ad azioni (ammissibili) A:
f : P∗ → A
Fra tutte le classi di ambienti e compiti, cerchiamo l’agente (o classe diagenti) con le prestazioni migliori
Caveat: limitazioni computazionali impediscono la realizzazione di razionalitaperfetta → progettare il miglior programma date le risorse rese disponibilidalla macchina
Agenti intelligenti 3
Agenti e ambienti
?
agent
percepts
sensors
actions
environment
actuators
Agenti: includono umani, robot, softbot, attuatori, etc.
La funzione agente mappa da tutte le possibili sequenze di percezioni adazioni A:
f : P∗ → A
Il programma agente viene eseguito sulla architettura fisica per produrre f
Agenti intelligenti 4
L’agente aspirapolvere
A B
Percezioni: locazioni e contenuti, e.g., [A,Dirty]
Azioni: Left, Right, Suck, NoOp
Agenti intelligenti 5
Un agente aspirapolvere
Percept sequence Action[A,Clean] Right
[A,Dirty] Suck
[B,Clean] Left
[B,Dirty] Suck
[A,Clean], [A,Clean] Right
[A,Clean], [A,Dirty] Suck... ...
function Reflex-Vacuum-Agent( [location,status]) returns an action
if status = Dirty then return Suck
else if location = A then return Right
else if location = B then return Left
Quale e la giusta funzione ?
Agenti intelligenti 6
Razionalita
Viene fissata una misura di prestazione che valuta la sequenza di percezioni– +1 per ogni spazio pulito in tempo T ?– +1 per ogni spazio pulito per istante di tempo, -1 per spostamento ?– . . .
Un agente razionale sceglie una qualunque azione che massimizza il valoreaspettato della misura di prestazione data la sequenza di percezioni ottenutafino all’istante corrente
Razionalita 6= OmniscenzaRazionalita 6= ChiaroveggenzaRazionalita 6= Successo
Razionalita ⇒ esplorazione, apprendimento, autonomia
Agenti intelligenti 7
PEAS (Performance Environment Actuators Sensors)
Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito
Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:
Misura di Prestazioni??
Ambiente operativo??
Attuatori??
Sensori??
Agenti intelligenti 8
PEAS (Performance Environment Actuators Sensors)
Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito
Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:
Misura di Prestazioni?? sicurezza, destinazione, profitto, comodita, . . .
Ambiente operativo?? strade e autostrade, traffico, pedoni, tempo, . . .
Attuatori?? volante, acceleratore, freni, clackson, microfono/video, . . .
Sensori?? telecamera, accelerometri, sensori del motore, GPS, . . .
Agenti intelligenti 9
Sistema di diagnosi medica
Misura di Prestazioni?? Paziente sano, minimizzare i costi
Ambiente operativo?? Paziente, ospedale, staff medico
Attuatori?? Schermo per visualizzare domande, test, diagnosi, trattamenti,documentazione
Sensori?? Tastiera per l’inserimento dei sintomi, dei risultati test, dellerisposte paziente
Agenti intelligenti 10
Sistema di analisi di immagini satellitari
Misura di Prestazioni?? Categorizzazione corretta delle immagini
Ambiente operativo?? Collegamento terra - satellite orbitante
Attuatori?? Visualizzazione della categorizzazione della scena
Sensori?? Array di pixel sensibili al colore
Agenti intelligenti 11
Osservabilita’ di un ambiente
• Completamente osservabile: se i sensori dell’agente misurano tutti gliaspetti rilevanti per la scelta dell’azione
• Rilevanza: dipende dala misura di prestazione
• Parzialmente osservabile: sensori inaccurati, mancanza di alcuni sensori,rumore
• Non osservabile: non ci sono sensori
Agenti intelligenti 12
Agente singolo o multiagente
• Esempio: agente che risolve un cruciverba vs. agente che gioca a scacchi
• Distinzione tra altro agente e oggetto partte dell’ambiente
• B agente se massimizza una misura di prestazione il cui valore dipendedal comportamento di A
• Scacchi: ambiente multi-agente competitivo
• Traffico: ambiente multi-agente parzialmente cooperativo (evitare gli in-cidenti massimizza la misura di prestazione di tutti, trovare un parcheggiolibero no)
Agenti intelligenti 13
Ambiente deterministico/stocastico
• Deterministico: lo stato successivo dell’ambiente e’ determinato dallostato corrente e dall’azione dell’agente
• Completamente osservabile e deterministico: non c’e’ incertezza
• Incerto: se non completamente osservabile o non deterministico
• Stocastico: incertezza descritta tramite probabilita’
• Non deterministico: azioni caratterizzate da risultati possibili, ma senzauso di probabilita’
Agenti intelligenti 14
Ambiente episodico/sequenziale
• Episodico: la scelta di una azione non dipende dalle scelte fatte in ”episodi”precedenti
• Agente che identifica i pezzi difettosi in una catena di montaggio
• Ambiente sequenziale: una decisione puo’ influenzare le successive
• Taxi, scacchi, ecc.
• In un ambiente sequenziale, l’agente deve ”pensare in avanti”
Agenti intelligenti 15
Ambiente dinamico/statico
• Dinamico: se l’ambiente puo’ cambiare mentre l’agente pensa a cheazione eseguire
• Semi-dinamico: l’ambiente non cambia, ma la valutazione delle prestazionidell’agente si
• Guidare un taxi e’ dinamico, scacchi con orologio semidinamico, cru-civerba statico
Agenti intelligenti 16
Altre caratteristiche di un ambiente
• Dicreto/continuo: Stato dell’ambiente, gestione del tempo, percezioni eazioni (scacchi discreto, taxi continuo)
• Noto/ignoto: stato di conoscenza dell’agente delle leggi dell’ambiente(puo’ essere noto ma parzialmente osservabile, es. solitario, oppure ignotoma completamente osservabile, es. nuovo videogioco)
Caso piu’ difficile: parzialmente osservabile, multi-agente, stocastico, se-quenziale, dinamico, continuo, ignoto (es. guidare taxi).
Agenti intelligenti 17
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile??Deterministico??Episodico??Statico??Discreto??Agente singolo??
Agenti intelligenti 18
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico??Episodico??Statico??Discreto??Agente singolo??
Agenti intelligenti 19
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico??Statico??Discreto??Agente singolo??
Agenti intelligenti 20
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico??Discreto??Agente singolo??
Agenti intelligenti 21
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto??Agente singolo??
Agenti intelligenti 22
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo??
Agenti intelligenti 23
Tipi di ambienti
Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo?? Si No Si (eccetto aste) No
Il tipo di ambiente determina largamente la progettazione dell’agente
Il mondo reale e, ovviamente, parzialmente osservabile, stocastico, sequen-ziale, dinamico, continuo, multi-agente
Agenti intelligenti 24
Tipi di agenti
agente = architettura + programma
• Architettura: deve essere compatibile con programma (es.: se azione”Cammina”, deve possedere gambe), deve rendere le percezioni disponibilial programma, eseguire il programma, passare le azioni agli attuatori
• Programma agente: da percezione corrente ad azione
• Funzione agente: da sequanza di percezioni ad azione
• Se serve una sequenza di percezioni per decidere l’azione, l’agente dovra’memorizzarla
Si possono definire in generale quattro tipi di agente:– agenti reattivi semplici– agenti reattivi basati su modello– agenti basati su obiettivi– agenti basati sull’utilita
Tutti questi tipi di agenti possono essere trasformati in agenti che apprendono
Agenti intelligenti 25
Agenti reattivi semplici
Agent
En
viron
men
t
Sensors
What the worldis like now
What action Ishould do nowCondition−action rules
Actuators
Esempio: aspirapolvere, non serve la tabella vista prima, azione indipendenteda storia percettiva
Agenti intelligenti 26
Agenti reattivi semplici
Agent
En
viron
men
t
Sensors
What the worldis like now
What action Ishould do nowCondition−action rules
Actuators
Problema: se l’ambiente e parzialmente osservabile puo fallire (randomizzare)
Soluzione migliore: tenere traccia delle percezioni passate → stato interno
Agenti intelligenti 27
Agenti reattivi basati su modello
Agent
En
viron
men
t
Sensors
What action Ishould do now
State
How the world evolves
What my actions do
Condition−action rules
Actuators
What the worldis like now
Problema: poco flessibile perche il comportamento e codificato direttamentenelle regole! Soluzione: introduzione di goal
Agenti intelligenti 28
Agenti basati su obiettivi
Agent
En
viron
men
t
Sensors
What it will be like if I do action A
What action Ishould do now
State
How the world evolves
What my actions do
Goals
Actuators
What the worldis like now
Agenti intelligenti 29
Agenti basati su obiettivi
Agent
En
viron
men
t
Sensors
What it will be like if I do action A
What action Ishould do now
State
How the world evolves
What my actions do
Goals
Actuators
What the worldis like now
Problema: se ho piu goal in conflitto fra loro o che non riesco a raggiungerepienamente? Soluzione: misura di utilita
Agenti intelligenti 30
Agenti basati sull’utilita
Agent
En
viron
men
t
Sensors
What it will be like if I do action A
How happy I will be in such a state
What action Ishould do now
State
How the world evolves
What my actions do
Utility
Actuators
What the worldis like now
Agenti intelligenti 31
Agenti basati sull’utilita
•Misura di prestazione: punteggio a sequenza di stati
• Funzione di utilita’: internalizzazione della misura di prestazione
• Sceglie l’azione che massimizza l’utilita’ attesa dei risultati (media datale probabilita’ e le utilita’ di ogni risultato)
Agenti intelligenti 32
Agenti capaci di apprendere
• Elemento di apprendimento (learning): serve a migliorare
• Elemento esecutivo (performance): selezioni delle azioni sulla base dellepercezioni
• Elemento critico (critic): analizza le prestazioni correnti e decide se ecome modificare l’elemento esecutivo per migliorarle
• Generatore di problemi: suggerisce azioni possibilmente subottime perarrivare ad eseguire azioni molto superiori a lungo termine
Agenti intelligenti 33
Agenti capaci di apprendere
Performance standard
Agent
En
viron
men
tSensors
Performance element
changes
knowledgelearning goals
Problem generator
feedback
Learning element
Critic
Actuators
Agenti intelligenti 34