Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...

34
Intelligenza Artificiale Agenti intelligenti Agenti intelligenti 1

Transcript of Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a...

Page 1: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Intelligenza Artificiale

Agenti intelligenti

Agenti intelligenti 1

Page 2: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti intelligenti

♦ La nostra definizione di agente intelligente♦ Introduzione al concetto di ambiente

– esempio molto semplice di ambiente♦ Il concetto di Razionalita,

– misura di prestazione,– ambiente operativo,– azioni,– sensori

♦ Proprieta degli ambienti → complessita computazionale♦ Possibili tipologie di agente → capacita computazionali diverse

Agenti intelligenti 2

Page 3: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agente Intelligente (o razionale)

Un agente e una entita che percepisce ed agisce

Nel contesto del corso, un agente razionale, cerca di raggiungere il piu possi-bile i suoi obiettivi data l’informazione disponibile, ovvero cerca di massimiz-zare il soddisfacimento dei propri bisogni sfruttando tutte le informazioni dicui dispone o che puo acquisire con le sue azioni

Da un punto di vista astratto, un agente e una funzione da tutte le possibilisequenze di percezioni P∗ ad azioni (ammissibili) A:

f : P∗ → A

Fra tutte le classi di ambienti e compiti, cerchiamo l’agente (o classe diagenti) con le prestazioni migliori

Caveat: limitazioni computazionali impediscono la realizzazione di razionalitaperfetta → progettare il miglior programma date le risorse rese disponibilidalla macchina

Agenti intelligenti 3

Page 4: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti e ambienti

?

agent

percepts

sensors

actions

environment

actuators

Agenti: includono umani, robot, softbot, attuatori, etc.

La funzione agente mappa da tutte le possibili sequenze di percezioni adazioni A:

f : P∗ → A

Il programma agente viene eseguito sulla architettura fisica per produrre f

Agenti intelligenti 4

Page 5: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

L’agente aspirapolvere

A B

Percezioni: locazioni e contenuti, e.g., [A,Dirty]

Azioni: Left, Right, Suck, NoOp

Agenti intelligenti 5

Page 6: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Un agente aspirapolvere

Percept sequence Action[A,Clean] Right

[A,Dirty] Suck

[B,Clean] Left

[B,Dirty] Suck

[A,Clean], [A,Clean] Right

[A,Clean], [A,Dirty] Suck... ...

function Reflex-Vacuum-Agent( [location,status]) returns an action

if status = Dirty then return Suck

else if location = A then return Right

else if location = B then return Left

Quale e la giusta funzione ?

Agenti intelligenti 6

Page 7: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Razionalita

Viene fissata una misura di prestazione che valuta la sequenza di percezioni– +1 per ogni spazio pulito in tempo T ?– +1 per ogni spazio pulito per istante di tempo, -1 per spostamento ?– . . .

Un agente razionale sceglie una qualunque azione che massimizza il valoreaspettato della misura di prestazione data la sequenza di percezioni ottenutafino all’istante corrente

Razionalita 6= OmniscenzaRazionalita 6= ChiaroveggenzaRazionalita 6= Successo

Razionalita ⇒ esplorazione, apprendimento, autonomia

Agenti intelligenti 7

Page 8: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

PEAS (Performance Environment Actuators Sensors)

Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito

Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:

Misura di Prestazioni??

Ambiente operativo??

Attuatori??

Sensori??

Agenti intelligenti 8

Page 9: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

PEAS (Performance Environment Actuators Sensors)

Per progettare un agente razionale dobbiamo specificare l’ ambiente opera-tivo, all’interno del quale si deve svolgere il compito

Consideriamo, ad esempio, il compito di progettare un taxi automatizzato:

Misura di Prestazioni?? sicurezza, destinazione, profitto, comodita, . . .

Ambiente operativo?? strade e autostrade, traffico, pedoni, tempo, . . .

Attuatori?? volante, acceleratore, freni, clackson, microfono/video, . . .

Sensori?? telecamera, accelerometri, sensori del motore, GPS, . . .

Agenti intelligenti 9

Page 10: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Sistema di diagnosi medica

Misura di Prestazioni?? Paziente sano, minimizzare i costi

Ambiente operativo?? Paziente, ospedale, staff medico

Attuatori?? Schermo per visualizzare domande, test, diagnosi, trattamenti,documentazione

Sensori?? Tastiera per l’inserimento dei sintomi, dei risultati test, dellerisposte paziente

Agenti intelligenti 10

Page 11: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Sistema di analisi di immagini satellitari

Misura di Prestazioni?? Categorizzazione corretta delle immagini

Ambiente operativo?? Collegamento terra - satellite orbitante

Attuatori?? Visualizzazione della categorizzazione della scena

Sensori?? Array di pixel sensibili al colore

Agenti intelligenti 11

Page 12: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Osservabilita’ di un ambiente

• Completamente osservabile: se i sensori dell’agente misurano tutti gliaspetti rilevanti per la scelta dell’azione

• Rilevanza: dipende dala misura di prestazione

• Parzialmente osservabile: sensori inaccurati, mancanza di alcuni sensori,rumore

• Non osservabile: non ci sono sensori

Agenti intelligenti 12

Page 13: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agente singolo o multiagente

• Esempio: agente che risolve un cruciverba vs. agente che gioca a scacchi

• Distinzione tra altro agente e oggetto partte dell’ambiente

• B agente se massimizza una misura di prestazione il cui valore dipendedal comportamento di A

• Scacchi: ambiente multi-agente competitivo

• Traffico: ambiente multi-agente parzialmente cooperativo (evitare gli in-cidenti massimizza la misura di prestazione di tutti, trovare un parcheggiolibero no)

Agenti intelligenti 13

Page 14: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Ambiente deterministico/stocastico

• Deterministico: lo stato successivo dell’ambiente e’ determinato dallostato corrente e dall’azione dell’agente

• Completamente osservabile e deterministico: non c’e’ incertezza

• Incerto: se non completamente osservabile o non deterministico

• Stocastico: incertezza descritta tramite probabilita’

• Non deterministico: azioni caratterizzate da risultati possibili, ma senzauso di probabilita’

Agenti intelligenti 14

Page 15: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Ambiente episodico/sequenziale

• Episodico: la scelta di una azione non dipende dalle scelte fatte in ”episodi”precedenti

• Agente che identifica i pezzi difettosi in una catena di montaggio

• Ambiente sequenziale: una decisione puo’ influenzare le successive

• Taxi, scacchi, ecc.

• In un ambiente sequenziale, l’agente deve ”pensare in avanti”

Agenti intelligenti 15

Page 16: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Ambiente dinamico/statico

• Dinamico: se l’ambiente puo’ cambiare mentre l’agente pensa a cheazione eseguire

• Semi-dinamico: l’ambiente non cambia, ma la valutazione delle prestazionidell’agente si

• Guidare un taxi e’ dinamico, scacchi con orologio semidinamico, cru-civerba statico

Agenti intelligenti 16

Page 17: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Altre caratteristiche di un ambiente

• Dicreto/continuo: Stato dell’ambiente, gestione del tempo, percezioni eazioni (scacchi discreto, taxi continuo)

• Noto/ignoto: stato di conoscenza dell’agente delle leggi dell’ambiente(puo’ essere noto ma parzialmente osservabile, es. solitario, oppure ignotoma completamente osservabile, es. nuovo videogioco)

Caso piu’ difficile: parzialmente osservabile, multi-agente, stocastico, se-quenziale, dinamico, continuo, ignoto (es. guidare taxi).

Agenti intelligenti 17

Page 18: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile??Deterministico??Episodico??Statico??Discreto??Agente singolo??

Agenti intelligenti 18

Page 19: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico??Episodico??Statico??Discreto??Agente singolo??

Agenti intelligenti 19

Page 20: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico??Statico??Discreto??Agente singolo??

Agenti intelligenti 20

Page 21: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico??Discreto??Agente singolo??

Agenti intelligenti 21

Page 22: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto??Agente singolo??

Agenti intelligenti 22

Page 23: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo??

Agenti intelligenti 23

Page 24: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di ambienti

Solitario Backgammon Internet shopping TaxiOsservabile?? Si Si No NoDeterministico?? Si No In parte NoEpisodico?? No No No NoStatico?? Si Semi Semi NoDiscreto?? Si Si Si NoAgente singolo?? Si No Si (eccetto aste) No

Il tipo di ambiente determina largamente la progettazione dell’agente

Il mondo reale e, ovviamente, parzialmente osservabile, stocastico, sequen-ziale, dinamico, continuo, multi-agente

Agenti intelligenti 24

Page 25: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Tipi di agenti

agente = architettura + programma

• Architettura: deve essere compatibile con programma (es.: se azione”Cammina”, deve possedere gambe), deve rendere le percezioni disponibilial programma, eseguire il programma, passare le azioni agli attuatori

• Programma agente: da percezione corrente ad azione

• Funzione agente: da sequanza di percezioni ad azione

• Se serve una sequenza di percezioni per decidere l’azione, l’agente dovra’memorizzarla

Si possono definire in generale quattro tipi di agente:– agenti reattivi semplici– agenti reattivi basati su modello– agenti basati su obiettivi– agenti basati sull’utilita

Tutti questi tipi di agenti possono essere trasformati in agenti che apprendono

Agenti intelligenti 25

Page 26: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti reattivi semplici

Agent

En

viron

men

t

Sensors

What the worldis like now

What action Ishould do nowCondition−action rules

Actuators

Esempio: aspirapolvere, non serve la tabella vista prima, azione indipendenteda storia percettiva

Agenti intelligenti 26

Page 27: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti reattivi semplici

Agent

En

viron

men

t

Sensors

What the worldis like now

What action Ishould do nowCondition−action rules

Actuators

Problema: se l’ambiente e parzialmente osservabile puo fallire (randomizzare)

Soluzione migliore: tenere traccia delle percezioni passate → stato interno

Agenti intelligenti 27

Page 28: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti reattivi basati su modello

Agent

En

viron

men

t

Sensors

What action Ishould do now

State

How the world evolves

What my actions do

Condition−action rules

Actuators

What the worldis like now

Problema: poco flessibile perche il comportamento e codificato direttamentenelle regole! Soluzione: introduzione di goal

Agenti intelligenti 28

Page 29: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti basati su obiettivi

Agent

En

viron

men

t

Sensors

What it will be like if I do action A

What action Ishould do now

State

How the world evolves

What my actions do

Goals

Actuators

What the worldis like now

Agenti intelligenti 29

Page 30: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti basati su obiettivi

Agent

En

viron

men

t

Sensors

What it will be like if I do action A

What action Ishould do now

State

How the world evolves

What my actions do

Goals

Actuators

What the worldis like now

Problema: se ho piu goal in conflitto fra loro o che non riesco a raggiungerepienamente? Soluzione: misura di utilita

Agenti intelligenti 30

Page 31: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti basati sull’utilita

Agent

En

viron

men

t

Sensors

What it will be like if I do action A

How happy I will be in such a state

What action Ishould do now

State

How the world evolves

What my actions do

Utility

Actuators

What the worldis like now

Agenti intelligenti 31

Page 32: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti basati sull’utilita

•Misura di prestazione: punteggio a sequenza di stati

• Funzione di utilita’: internalizzazione della misura di prestazione

• Sceglie l’azione che massimizza l’utilita’ attesa dei risultati (media datale probabilita’ e le utilita’ di ogni risultato)

Agenti intelligenti 32

Page 33: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti capaci di apprendere

• Elemento di apprendimento (learning): serve a migliorare

• Elemento esecutivo (performance): selezioni delle azioni sulla base dellepercezioni

• Elemento critico (critic): analizza le prestazioni correnti e decide se ecome modificare l’elemento esecutivo per migliorarle

• Generatore di problemi: suggerisce azioni possibilmente subottime perarrivare ad eseguire azioni molto superiori a lungo termine

Agenti intelligenti 33

Page 34: Agenti intelligenti - Dipartimento di Matematica - UniPDfrossi/cap2-ia2012.pdf · Razionalit`a Viene fissata una misura di prestazione che valuta la sequenza di percezioni – +1

Agenti capaci di apprendere

Performance standard

Agent

En

viron

men

tSensors

Performance element

changes

knowledgelearning goals

Problem generator

feedback

Learning element

Critic

Actuators

Agenti intelligenti 34