Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...

Intelligenza Artificiale

Agenti intelligenti

Agenti intelligenti 1

Agenti intelligenti

♦ La nostra definizione di agente intelligente♦ Introduzione al concetto di ambiente

– esempio molto semplice di ambiente♦ Il concetto di Razionalita,

– misura di prestazione,– ambiente operativo,– azioni,– sensori

♦ Proprieta degli ambienti → complessita computazionale♦ Possibili tipologie di agente → capacita computazionali diverse


Agente Intelligente (o razionale)

Un agente e una entita che percepisce ed agisce

Nel contesto del corso, un agente razionale, cerca di raggiungere il piu possi-bile i suoi obiettivi data l’informazione disponibile, ovvero cerca di massimiz-zare il soddisfacimento dei propri bisogni sfruttando tutte le informazioni dicui dispone o che puo acquisire con le sue azioni

Da un punto di vista astratto, un agente e una funzione da tutte le possibilisequenze di percezioni P∗ ad azioni (ammissibili) A:

f : P∗ → A

Fra tutte le classi di ambienti e compiti, cerchiamo l’agente (o classe diagenti) con le prestazioni migliori

Caveat: limitazioni computazionali impediscono la realizzazione di razionalitaperfetta → progettare il miglior programma date le risorse rese disponibilidalla macchina


Agenti e ambienti

?

agent

percepts

sensors

actions

environment

actuators

Agenti: includono umani, robot, softbot, attuatori, etc.

La funzione agente mappa da tutte le possibili sequenze di percezioni adazioni A:

f : P∗ → A

Il programma agente viene eseguito sulla architettura fisica per produrre f


L’agente aspirapolvere

A B

Percezioni: locazioni e contenuti, e.g., [A,Dirty]

Azioni: Left, Right, Suck, NoOp


Un agente aspirapolvere

Percept sequence Action[A,Clean] Right

[A,Dirty] Suck

[B,Clean] Left

[B,Dirty] Suck

[A,Clean], [A,Clean] Right

[A,Clean], [A,Dirty] Suck... ...

function Reflex-Vacuum-Agent( [location,status]) returns an action

if status = Dirty then return Suck

else if location = A then return Right

else if location = B then return Left

Quale e la giusta funzione ?


Razionalita

Viene fissata una misura di prestazione che valuta la sequenza di percezioni– +1 per ogni spazio pulito in tempo T ?– +1 per ogni spazio pulito per istante di tempo, -1 per spostamento ?– . . .

Un agente razionale sceglie una qualunque azione che massimizza il valoreaspettato della misura di prestazione data la sequenza di percezioni ottenutafino all’istante corrente

Razionalita 6= OmniscenzaRazionalita 6= ChiaroveggenzaRazionalita 6= Successo

Razionalita ⇒ esplorazione, apprendimento, autonomia


PEAS (Performance Environment Actuators Sensors)

Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito

Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:

Misura di Prestazioni??

Ambiente operativo??

Attuatori??

Sensori??


PEAS (Performance Environment Actuators Sensors)

Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito

Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:

Misura di Prestazioni?? sicurezza, destinazione, profitto, comodita, . . .

Ambiente operativo?? strade e autostrade, traffico, pedoni, tempo, . . .

Attuatori?? volante, acceleratore, freni, clackson, microfono/video, . . .

Sensori?? telecamera, accelerometri, sensori del motore, GPS, . . .


Sistema di diagnosi medica

Misura di Prestazioni?? Paziente sano, minimizzare i costi

Ambiente operativo?? Paziente, ospedale, staff medico

Attuatori?? Schermo per visualizzare domande, test, diagnosi, trattamenti,documentazione

Sensori?? Tastiera per l’inserimento dei sintomi, dei risultati test, dellerisposte paziente


Sistema di analisi di immagini satellitari

Misura di Prestazioni?? Categorizzazione corretta delle immagini

Ambiente operativo?? Collegamento terra - satellite orbitante

Attuatori?? Visualizzazione della categorizzazione della scena

Sensori?? Array di pixel sensibili al colore


Osservabilita’ di un ambiente

• Completamente osservabile: se i sensori dell’agente misurano tutti gliaspetti rilevanti per la scelta dell’azione

• Rilevanza: dipende dala misura di prestazione

• Parzialmente osservabile: sensori inaccurati, mancanza di alcuni sensori,rumore

• Non osservabile: non ci sono sensori


Agente singolo o multiagente

• Esempio: agente che risolve un cruciverba vs. agente che gioca a scacchi

• Distinzione tra altro agente e oggetto partte dell’ambiente

• B agente se massimizza una misura di prestazione il cui valore dipendedal comportamento di A

• Scacchi: ambiente multi-agente competitivo

• Traffico: ambiente multi-agente parzialmente cooperativo (evitare gli in-cidenti massimizza la misura di prestazione di tutti, trovare un parcheggiolibero no)


Ambiente deterministico/stocastico

• Deterministico: lo stato successivo dell’ambiente e’ determinato dallostato corrente e dall’azione dell’agente

• Completamente osservabile e deterministico: non c’e’ incertezza

• Incerto: se non completamente osservabile o non deterministico

• Stocastico: incertezza descritta tramite probabilita’

• Non deterministico: azioni caratterizzate da risultati possibili, ma senzauso di probabilita’


Ambiente episodico/sequenziale

• Episodico: la scelta di una azione non dipende dalle scelte fatte in ”episodi”precedenti

• Agente che identifica i pezzi difettosi in una catena di montaggio

• Ambiente sequenziale: una decisione puo’ influenzare le successive

• Taxi, scacchi, ecc.

• In un ambiente sequenziale, l’agente deve ”pensare in avanti”


Ambiente dinamico/statico

• Dinamico: se l’ambiente puo’ cambiare mentre l’agente pensa a cheazione eseguire

• Semi-dinamico: l’ambiente non cambia, ma la valutazione delle prestazionidell’agente si

• Guidare un taxi e’ dinamico, scacchi con orologio semidinamico, cru-civerba statico


Altre caratteristiche di un ambiente

• Dicreto/continuo: Stato dell’ambiente, gestione del tempo, percezioni eazioni (scacchi discreto, taxi continuo)

• Noto/ignoto: stato di conoscenza dell’agente delle leggi dell’ambiente(puo’ essere noto ma parzialmente osservabile, es. solitario, oppure ignotoma completamente osservabile, es. nuovo videogioco)

Caso piu’ difficile: parzialmente osservabile, multi-agente, stocastico, se-quenziale, dinamico, continuo, ignoto (es. guidare taxi).


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile??Deterministico??Episodico??Statico??Discreto??Agente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico??Episodico??Statico??Discreto??Agente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico??Statico??Discreto??Agente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico??Discreto??Agente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto??Agente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo??


Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo?? Si No Si (eccetto aste) No

Il tipo di ambiente determina largamente la progettazione dell’agente

Il mondo reale e, ovviamente, parzialmente osservabile, stocastico, sequen-ziale, dinamico, continuo, multi-agente


Tipi di agenti

agente = architettura + programma

• Architettura: deve essere compatibile con programma (es.: se azione”Cammina”, deve possedere gambe), deve rendere le percezioni disponibilial programma, eseguire il programma, passare le azioni agli attuatori

• Programma agente: da percezione corrente ad azione

• Funzione agente: da sequanza di percezioni ad azione

• Se serve una sequenza di percezioni per decidere l’azione, l’agente dovra’memorizzarla

Si possono definire in generale quattro tipi di agente:– agenti reattivi semplici– agenti reattivi basati su modello– agenti basati su obiettivi– agenti basati sull’utilita

Tutti questi tipi di agenti possono essere trasformati in agenti che apprendono


Agenti reattivi semplici

Agent

En

viron

men

t

Sensors

What the worldis like now

What action Ishould do nowCondition−action rules

Actuators

Esempio: aspirapolvere, non serve la tabella vista prima, azione indipendenteda storia percettiva


Agenti reattivi semplici

Agent

En

viron

men

t

Sensors


What action Ishould do nowCondition−action rules

Actuators

Problema: se l’ambiente e parzialmente osservabile puo fallire (randomizzare)

Soluzione migliore: tenere traccia delle percezioni passate → stato interno


Agenti reattivi basati su modello

Agent

En

viron

men

t

Sensors

What action Ishould do now

State

How the world evolves

What my actions do

Condition−action rules

Actuators


Problema: poco flessibile perche il comportamento e codificato direttamentenelle regole! Soluzione: introduzione di goal


Agenti basati su obiettivi

Agent

En

viron

men

t

Sensors

What it will be like if I do action A


State


What my actions do

Goals

Actuators



Agenti basati su obiettivi

Agent

En

viron

men

t

Sensors



State


What my actions do

Goals

Actuators


Problema: se ho piu goal in conflitto fra loro o che non riesco a raggiungerepienamente? Soluzione: misura di utilita


Agenti basati sull’utilita

Agent

En

viron

men

t

Sensors


How happy I will be in such a state


State


What my actions do

Utility

Actuators



Agenti basati sull’utilita

•Misura di prestazione: punteggio a sequenza di stati

• Funzione di utilita’: internalizzazione della misura di prestazione

• Sceglie l’azione che massimizza l’utilita’ attesa dei risultati (media datale probabilita’ e le utilita’ di ogni risultato)


Agenti capaci di apprendere

• Elemento di apprendimento (learning): serve a migliorare

• Elemento esecutivo (performance): selezioni delle azioni sulla base dellepercezioni

• Elemento critico (critic): analizza le prestazioni correnti e decide se ecome modificare l’elemento esecutivo per migliorarle

• Generatore di problemi: suggerisce azioni possibilmente subottime perarrivare ad eseguire azioni molto superiori a lungo termine


Agenti capaci di apprendere

Performance standard

Agent

En

viron

men

tSensors

Performance element

changes

knowledgelearning goals

Problem generator

feedback

Learning element

Critic

Actuators


Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...

Documents

Transcript of Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...