Concetti di soluzione in giochi dinamici a informazione ... dei giochi_lezione... · il...

29
1 Economia Industriale Economia Industriale (teoria dei giochi) (teoria dei giochi) Concetti di soluzione in giochi Concetti di soluzione in giochi dinamici a informazione dinamici a informazione perfetta in strategie pure perfetta in strategie pure (LEZIONE 4) (LEZIONE 4) Valerio Sterzi Università di Bergamo Facoltà di ingegneria

Transcript of Concetti di soluzione in giochi dinamici a informazione ... dei giochi_lezione... · il...

1

Economia IndustrialeEconomia Industriale(teoria dei giochi)(teoria dei giochi)

Concetti di soluzione in giochi Concetti di soluzione in giochi dinamici a informazione dinamici a informazione perfetta in strategie pureperfetta in strategie pure

(LEZIONE 4)(LEZIONE 4)

Valerio Sterzi

Università di BergamoFacoltà di ingegneria

2

Cosa si intende per..

• soluzione di un gioco?

Per soluzione di un gioco si intende un meccanismo “oggettivo” che, sotto alcune ipotesi, dà un modo

“ovvio” di giocare.

• gioco dinamico?

Un gioco è quando un giocatore sceglie un’azione dopo aver osservato alcune mosse dei propri

avversari.

• informazione perfetta?

Si ha informazione perfetta quando i giocatori sono sempre a conoscenza delle mosse che hanno fatto

gli avversari che sono stati chiamati a giocare in una fase precedente. In altre parole i giocatori

sanno sempre dove si trovano al momento di scegliere. (E ancora, per capirci meglio, quando ciascun

insieme informativo è composto da un nodo decisionale singolo –singleton)

• strategia pura?

Per strategia pura si intende una regola che assegna una mossa ad ogni stato informativo. Una

strategia mista è invece una distribuzione di probabilità sulle strategie pure.

3

Agenda

1. Credibilità nelle strategie

2. Principio di razionalità sequenziale

3. Induzione a ritroso

4. Equilibrio perfetto nei sottogiochi

5. Teorema di esistenza

6. Il valore del vincolo

7. Il modello di Stackelberg

4

Credibilità delle strategie (1)

Un possibile modo per approcciare i giochi dinamici è semplicemente quello di derivare la rappresentazione in forma normale e applicare i concetti di soluzione della seconda lezione (strategie dominanti, eliminazione iterata delle strategie strettamente dominate, equilibrio di Nash..)Problema: le strategie di equilibrio cosìtrovate sono tutte credibilicredibili?

5

Credibilità delle strategie (2)

• Il concetto di equilibrio di Nash non è sufficiente ad individuare ed eliminare le strategie non credibili.

• Esempio (1): the predation gameCi sono due imprese, un incumbent (I) e un potenziale entrante (E). Il potenziale entrante muove per primo e ha a disposizione due possibili strategie: rimanere fuori dal mercato (OUT) o entrare (IN). In quest’ultimo caso, I viene chiamato a giocare e ha a disposizione due strategie: assumere un atteggiamento aggressivo, attraverso per esempio una guerra di prezzo, (A), oppure assumere un atteggiamento pacifico (P).

6

the predation game …

Gioco in forma estesa (albero del gioco)

Entrantin

out[0, 3]

Incumbent

P

A

[2, 1]

[-3, -2]

7

… the predation game …

Gioco in forma normale

2, 1-3, -2In

0,30,3Out

P, se E “In”A, se E “In”Incumbent

Entrant

8

… the predation game

Esaminando il gioco in forma normale troviamo due equilibri di Nash, (Out, A se E “In”) e (In, P se E “In”). Ad uno sguardo più attento vediamo però che il primo equilibrio non è una ragionevole predizione del gioco: se il potenziale entrante dovesse scegliere di entrare (E) l’Incumbent troverà ottimale scegliere sempre un atteggiamento pacifico (P), quindi la strategia A se E ”In” non è credibile.

9

Principio di razionalità sequenziale (PRS)

Il PRS afferma che la strategia di un giocatore dovrebbe specificare azioni ottimali per ogni nodo nel gioco ad albero.

Nell’esempio del predation game la strategia di I, A se E “In” non rispetta il PRS, infatti una volta che l’entrante ha scelto “In”, la strategia ottimale per l’Incumbent è quello di adottare un comportamento pacifico (P).

Un concetto di soluzione che ci aiuta a tener conto delle sole strategie che rispettano il PRS è quello di induzione a ritroso.

10

Induzione a ritroso

Partiamo dal determinare le azioni ottimali nel nodo decisionale finale dell’albero. Dal momento che il nodo finale non richiede ulteriori interazioni strategiche tra i giocatori, la determinazione del comportamento ottimale si esaurisce in un semplice problema decisionale a livello di singolo individuo. Il giocatore chiamato a muovere per ultimo sceglierà l’azione a cui èassociato un pay-off più elevato. Una volta individuata l’azione “massimizzante”, è possibile ridurre il gioco eliminando il sottogioco appena risolto. A questo punto il procedimento appena descritto viene ripetuto per il giocatore che viene chiamato a giocare per penultimo, e così via..

11

Sottogioco ed equilibrio perfetto nei sottogiochi

Sottogioco : parte di un gioco dinamico che presenta le seguenti caratteristiche: (1) ha origine da un insieme di informazione che contiene un solo nodo, (2) contiene tutti i nodi decisionali successivi fino ai nodi finali (è chiuso nella sua successione), (3) non contiene alcun insieme informativo che presenta come suoi elementi nodi decisionali non successivi al nodo iniziale del sottogioco. In particolare, il gioco iniziale stesso è uno dei suoi sottogiochi.

(Colombo, 2003): Un sottogioco è una parte del gioco in forma estesa che inizia con un “singleton” e contiene tutti i nodi che seguono.

Equilibrio perfetto nei sottogiochiUn equilibrio perfetto nei sottogiochi è un vettore di strategie di equilibrio che hanno la caratteristica di costituire un equilibrio di Nash di ciascun sottogioco.

12

Esempio 2 …

Considerate il seguente gioco in forma estesa a tre giocatori:

Giocatore 1

Giocatore 2Giocatore 3

Giocatore 3 Giocatore 3

L R

l

l l

r

r r

a b

2 0 1

-1 56

3 1 2

5 4 4

0 -1 7

-2 2 0

13

… esempio 2 …

Partiamo dal giocatore 3: se dovesse essere chiamato a giocare dopo il giocatore 2, e quest’ultimo dovesse scegliere a, il giocatore 3 sceglierebbe r, se il giocatore 2 dovesse scegliere ballora il giocatore 3 sceglierebbe l.

Se il giocatore 1 dovesse scegliere nel primo nodo L, allora il gioco finirebbe di nuovo con la mossa dl giocatore 3, il quale sceglierebbe l’azione r.

14

… esempio 2 …

La forma ridotta del gioco sarà la seguente:

-1 56

5 4 4

0 -1 7

L R

Giocatore 1

Giocatore 2

a b

15

… esempio 2

A questo punto vediamo che il giocatore 2, se chiamato a giocare (ovvero se il giocatore uno dovesse scegliere R), sceglierà a (ottenendo un pay-off di 7 anziché di -4).Il giocatore uno a questo punto si troverebbe di fronte a due possibili pay-off associati alle due possibili azioni: se dovesse scegliere L otterrebbe -1, in caso di R otterrebbe invece 4.

La procedura per induzione a ritroso dunque identifica il profilo di strategie (“R”, “a se R”, “r se L, r se R e se a, l se R e se b”). Tale equilibrio è detto perfetto nei sottogiochi.

16

Esercizi consigliati

Esercizio 22, pag.239 (FM)

Esercizio 23, pag.241 (FM)

Identificate tutti gli equilibri di Nash del gioco

dinamico a tre giocatori appena visto

17

Teorema di esistenza

Ogni gioco finito a info perfetta ha (almeno) un

equilibrio di Nash perfetto nei sottogiochi (in

strategie pure).

18

Il valore del vincolo

I giochi sequenziali consentono di evidenziare il

grande valore del vincolo, dove quest’ultimo consente

di sfruttare il vantaggio iniziale della prima mossa in

modo tale da modificare la situazione strategica.

19

Esempio 3 …

Vediamo un’ applicazione analizzando un tipico gioco di entrata. E

Iin out

paΠE = 0ΠI = 40

ΠE = 10ΠI = 20

ΠE = -20ΠI = -20

20

… esempio 3 …

L’impresa entrante (E) deve decidere se entrare nel mercato (in)

oppure rimanerne fuori (out). Il monopolista che attualmente opera

sul mercato (I, Incumbent) osserva se l’entrata avviene, e in caso

positivo, decide se ostacolarla attraverso un atteggiamento

aggressivo (a) oppure accomodarla avendo un atteggiamento

pacifico (p). Se l’entrata non avviene l’Incumbent ottiene i profitti di

monopolio (40), ma se l’entrata avviene la strategia a non

costituisce un’opzione credibile.

L’equilibrio perfetto nei sottogiochi è {(In, p se In}.

21

… esempio 3 …

In questo gioco quindi l’entrata avviene e il monopolista subisce una perdita di 20 (40-20). Esiste però un modo per migliorare la situazione dal punto di vista dell’Incumbent: quest’ultimo potrebbe, attraverso un’ azione vscrivere un contratto non rinegoziabile in cui si impegna in caso di entrata a scegliere la strategia a.Ovviamente il vincolarsi può implicare un costo per il monopolista, e il massimo valore che può assumere il vincolo è ovviamente di 20.

22

… esempio 3…

L’albero del gioco diventa:

E E

I

II

inin

outout

nvv

a ap p

ΠE = -20ΠI = -20

ΠE = 10ΠI = -25

ΠE = 0ΠI = 40 (-V)

ΠE = -20ΠI = -20

ΠE = 10ΠI = 20

ΠE = 0ΠI = 40

23

… esempio 3

Se il vincolarsi ha un costo basso (v <20), il nuovo equilibrio perfetto nei sottogiochi è {(v, a se In se v, p se In se nv), (out se v, in se nv)}.Questo esempio illustra come un vincolo credibile possa possedere un notevole valore strategico. Nel nostro caso il valore del vincolo è pari a 20. Se il vincolo è credibile allora ha lo stesso impatto di una modifica dell’ordine delle mosse. Altri esempi di vincoli strategici, frequenti nel campo dell’economia industriale, sono gli investimenti in riduzione dei costi e/o della capacitàproduttiva, lo sviluppo di nuovi prodotti: sono tutti cambiamenti che influenzano la natura della futura competizione.

24

Modello di Stackelberg …

Nel modello di Cournot sono presenti due imprese che simultaneamente competono sulle quantità. Nel modello di Stackelberg (1934) invece operano sempre due imprese, ma una (leader) può stabilire la quantità da produrre prima dell’altra (follower). Il gioco non sarà più quindi statico come nel modello di Cournot, ma rientrerà nella categoria dei giochi dinamici.

Seguendo il metodo dell’induzione a ritroso, andiamo a determinare la quantità di produzione ottimale per l’impresa che sceglie per ultima, ovvero la follower, e solo successivamente andremo a calcolare la quantità ottimale per la leader, che terràconto ovviamente dell’azione-reazione della follower.

25

… modello di Stackelberg …

Supponiamo di trovarci in un mercato con prodotto omogeneo e

che le due imprese fronteggino la medesima curva di domanda (inversa) di mercato:

p = a – bQ, dove Q è la quantità totale prodotta dalle due imprese (Q = q1 + q2). Solo per chiarezza nell’esposizione, l’impresa leaderè denotata con il pedice 1, la follower con 2.

Infine supponiamo che le funzioni di costo siano lineari e identiche per le due imprese, in modo tale che i costi marginalisiano costanti e pari a c.

26

… modello di Stackelberg …

Poiché il gioco è a informazione perfetta si può ricavare l’esito con l’induzione a ritroso. Partiamo quindi dall’impresa 2, la quale dovràmassimizzare i propri profitti tenendo conto della quantità decisa nel primo stadio dall’impresa 1.

MaxΠ2(.) a − bq1 q2 − cq2

Foc: q2 R2q1 a − c − bq1

2b

27

… modello di Stackelberg …

Nel primo stadio deve decidere l’impresa leader,

tenendo conto della funzione di reazione dell’impresa follower; in altri termini l’impresa uno sceglierà la quantità ottima che:

MaxΠ1(.) a − bq1 R2q1 − cq1 a − bq1 a − c − bq1

2b − c q1

Foc: q1∗ a−c

2b

28

… modello di Stackelberg …

Sostituendo il valore ottimale per l’impresa monopolista nella funzione di reazione dell’impresa leader ne otterremo la quantità ottima:

Infine sostituendo i valori di e otterremo i rispettivi valori di equilibrio dei profitti.

q1∗ q2

q2∗ a − c

4b

29

Bibliografia

• Colombo, F. (2003), Introduzione alla teoria dei giochi, Carrocci Editore;

• Mas-Colell A., Whinston M.D., and Green J.R. (1995), Microeconomic Theory, Oxford University Press;

• Femminis G., Martini G. (1999), Razionalità individuale e decisioni strategiche, Giappichelli editore;

• Osborne, M.J.,Rubenstein A. (1994), A course in game theory, The Mit Press;