Massimi e minimi vincolati con vincoli di uguaglianza Indice · pero di vedere il risultato di...

21
UNIVR – Facolt`a di Economia – Corso di Matematica finanziaria 2008/09 1 Massimi e minimi vincolati con vincoli di uguaglianza Indice 1 Definizione del problema 1 2 Caso con un solo vincolo 2 2.1 Il metodo delle curve di livello ......................................... 2 2.2 Il metodo dei moltiplicatori di Lagrange ................................... 3 2.3 Interpretazione geometrica ........................................... 6 2.4 Significato economico del moltiplicatore di Lagrange ............................ 9 3 Caso generale (condizione necessaria) 10 4 Condizioni sufficienti 13 4.1 La condizione sul sottospazio tangente ai vincoli .............................. 13 4.2 La condizione sulla matrice Hessiana orlata ................................. 13 In questa dispensa consideriamo un problema di ottimizzazione con vincoli di uguaglianza. I principali risultati di questo settore matematico sono dovuti a Lagrange. 1 Definizione del problema Un problema di massimo o di minimo con vincoli di uguaglianza viene anche detto problema di programmazione classica. Riporto qui una formulazione generale di questo problema. Siano f,g 1 ,...,g m funzioni definite nell’aperto A R n , tutte di classe C 1 nell’insieme A, e sia m<n. Il problema max / min f (x 1 ,...,x n ) con vincoli g i (x 1 ,...,x n )= b i , i =1, 2,...,m consiste nel trovare i punti di massimo (o minimo, locali o globali) della funzione f sul sottoinsieme di A che ` e soluzione del sistema di condizioni espresse dai vincoli, cio` e dalle m equazioni g i (x 1 ,...,x n )= b i . Il problema si pu` o anche esprimere in forma vettoriale: se indichiamo con g la funzione a valori vettoriali che ha per componenti le funzioni di vincolo (g ` e funzione di A in R m ), con b il vettore dei temini noti b i (b R m ) e con x il vettore (x 1 ,...,x n ), possiamo scrivere il problema nella forma compatta max / min f (x) con vincoli g(x)= b. La funzione f si chiama funzione obiettivo e la funzione g si pu` o chiamare funzione di vincolo. L’insieme X = x A : g i (x 1 ,...,x n )= b i , per i =1,...m si chiama regione ammissibile e i suoi punti punti ammissibili. Definizioni Un punto x X ` e punto di massimo (minimo) globale vincolato di f se f ( x) f (x) ( f ( x) f (x) ) per ogni x X . Un punto x X ` e punto di massimo (minimo) locale vincolato di f se esiste un intorno I ( x, r) tale che f ( x) f (x) ( f ( x) f (x) ) per ogni x I ( x, r) X . Osservazione Per cautelarmi su possibili imprecisioni, avverto che con il termine vincolo intender` o sia l’equazione di vincolo sia il sottoinsieme di R n che ` e soluzione di un certo vincolo. Detto questo faccio osservare che ogni vincolo (l’insieme) si pu` o vedere come curva (o superficie o ipersuperficie) di livello della corrispondente funzione di vincolo. Quindi la ricerca del punto di massimo vincolato di f ` e la ricerca del punto di massimo di f sull’intersezione delle curve di livello dei vincoli.

Transcript of Massimi e minimi vincolati con vincoli di uguaglianza Indice · pero di vedere il risultato di...

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 1

Massimi e minimi vincolati con vincoli di uguaglianza

Indice

1 Definizione del problema 1

2 Caso con un solo vincolo 22.1 Il metodo delle curve di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22.2 Il metodo dei moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.3 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.4 Significato economico del moltiplicatore di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Caso generale (condizione necessaria) 10

4 Condizioni sufficienti 134.1 La condizione sul sottospazio tangente ai vincoli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134.2 La condizione sulla matrice Hessiana orlata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

In questa dispensa consideriamo un problema di ottimizzazione con vincoli di uguaglianza. I principali risultati diquesto settore matematico sono dovuti a Lagrange.

1 Definizione del problema

Un problema di massimo o di minimo con vincoli di uguaglianza viene anche detto problema di programmazioneclassica. Riporto qui una formulazione generale di questo problema.

Siano f, g1, . . . , gm funzioni definite nell’aperto A ⊂ Rn, tutte di classe C1 nell’insieme A, e sia m < n.

Il problemamax / min f(x1, . . . , xn)

con vincoligi(x1, . . . , xn) = bi, i = 1, 2, . . . , m

consiste nel trovare i punti di massimo (o minimo, locali o globali) della funzione f sul sottoinsieme di A che e soluzionedel sistema di condizioni espresse dai vincoli, cioe dalle m equazioni gi(x1, . . . , xn) = bi.

Il problema si puo anche esprimere in forma vettoriale: se indichiamo con g la funzione a valori vettoriali che haper componenti le funzioni di vincolo (g e funzione di A in R

m), con b il vettore dei temini noti bi (b ∈ Rm) e con x il

vettore (x1, . . . , xn), possiamo scrivere il problema nella forma compatta

max / min f(x) con vincoli g(x) = b.

La funzione f si chiama funzione obiettivo e la funzione g si puo chiamare funzione di vincolo. L’insieme

X ={

x ∈ A : gi(x1, . . . , xn) = bi, per i = 1, . . .m}

si chiama regione ammissibile e i suoi punti punti ammissibili.

Definizioni

• Un punto x ∈ X e punto di massimo (minimo) globale vincolato di f se f(x) ≥ f(x)(

f(x) ≤ f(x))

per ognix ∈ X .

• Un punto x ∈ X e punto di massimo (minimo) locale vincolato di f se esiste un intorno I(x, r) tale che f(x) ≥f(x)

(

f(x) ≤ f(x))

per ogni x ∈ I(x, r) ∩ X .

Osservazione Per cautelarmi su possibili imprecisioni, avverto che con il termine vincolo intendero sia l’equazionedi vincolo sia il sottoinsieme di R

n che e soluzione di un certo vincolo. Detto questo faccio osservare che ogni vincolo(l’insieme) si puo vedere come curva (o superficie o ipersuperficie) di livello della corrispondente funzione di vincolo.Quindi la ricerca del punto di massimo vincolato di f e la ricerca del punto di massimo di f sull’intersezione dellecurve di livello dei vincoli.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 2

Esempio Prima di continuare con le questioni generali presento un semplice esempio, che risulta molto istruttivoper il seguito.

Consideriamo il problema in R2

max / min f(x, y) = xyex+y con vincolo x + y2 = 0.

Nell’equazione di vincolo si puo facilmente esplicitare x in funzione di y. Si trova x = −y2 e, sostituendo nella funzionef si ha che la funzione obiettivo sul vincolo assume gli stessi valori della funzione h(y) = −y3e−y2

+y (funzione di unasola variabile).1

Chiaramente per trovare i punti di massimo/minimo vincolato della funzione obiettivo f bastera trovare i punti dimassimo/minimo della funzione h, con y ∈ R.

Con quello che gli studenti hanno imparato nel corso di matematica del primo anno si trova

h′(y) = −3y2e−y2+y − y3e−y2

+y(−2y + 1) = y2e−y2+y(2y2 − y − 3).

I punti stazionari di h sono quindi −1, 0 e 3

2. Dallo studio del segno della derivata si trova facilmente che, per la

funzione h, −1 e punto di massimo locale, 3

2e punto di minimo locale e 0 non e ne di massimo ne di minimo. Ma allora

possiamo concludere che, per la funzione f , (−1,−1) e punto di massimo locale vincolato, (− 9

4, 3

2) e punto di minimo

locale vincolato e (0, 0) non e ne di massimo ne di minimo. Da uno studio completo della funzione h, in particolaredal calcolo dei limiti per y → ±∞, si trova che abbiamo trovato in realta i punti di massimo/minimo globali.

Questo procedimento puo essere utilizzato ogniqualvolta il vincolo (o i vincoli) consentono di esprimere una o piuvariabili in funzione delle altre.2

Osservazione Chiaramente il fatto di poter ricavare una variabile in funzione delle altre dal vincolo e un eventoparticolarmente “fortunato”. Non sempre e possibile. Serve allora un risultato che consenta di procedere anche neicasi meno fortunati. A questo proposito viene una celebre intuizione di Lagrange.

Vediamo la cosa in due passi successivi: con un solo vincolo e con piu vincoli.

2 Caso con un solo vincolo

In questa sezione consideriamo un problema di programmazione classica con un solo vincolo (di equazione). Primapero di vedere il risultato di Lagrange, presento un metodo grafico a volte utilizzabile per la risoluzione del problema.

2.1 Il metodo delle curve di livello

Supponiamo di avere un problema in due variabili e un solo vincolo. Il problema sia

max / min f(x, y) con vincolo g(x, y) = b.

Se siamo in grado di disegnare la curva del vincolo e le curve di livello della funzione obiettivo f , possiamo risolvereil problema graficamente. Illustro il metodo attraverso qualche semplice esempio.

Esempiomax / min f(x, y) = x + y con vincolo x + y2 = 1.

Il vincolo definisce la parabola di equazione x = 1 − y2 (con asse orizzontale). Con-sideriamo la generica curva di livello della funzione obiettivo f , cioe l’insieme dellesoluzioni dell’equazione x + y = k. Si tratta, al variare di k, di rette di equazioney = k − x. Il livello (cioe il valore) di f aumenta all’aumentare di k e quindi il valoredi f aumenta “quando la retta si sposta verso l’alto”. Il verso dei livelli crescenti eindicato dalla freccia in figura. Tutto questo ci consente di dire che il livello massimoe quello che corrisponde alla retta tangente alla parabola.3 Non c’e un livello mini-mo, dato che la retta puo spostarsi verso il basso indefinitamente, continuando adincontrare la parabola. Questo dice che la funzione non e limitata inferiormente sulvincolo.

bmax

1

1

x

y

1Non abbiamo fatto altro che una restrizione della funzione obiettivo lungo la curva che costituisce il vincolo.2Qui si sta parlando della possibilita effettiva di ricavare dai vincoli una o piu variabili in funzione delle altre, ma si intuisce forse che in

generale, se valgono le ipotesi del teorema della funzione implicita, questa stessa strada e teoricamente percorribile per cercare le condizionidi ottimalita. In effetti questo e quello che succede, anche se noi non vedremo la questione dato che non studieremo le dimostrazioni deirisultati generali.

3Si pensi che, fino a che la retta di livello k interseca la parabola, vuol dire che ci sono punti sul vincolo in cui la funzione f ha livellok. La situazione di massimo si ha quando l’ultima retta (quella tangente) interseca la parabola.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 3

Per trovare numericamente il punto di massimo vincolato ci sono tanti modi: ad esempio trovare il punto sullaparabola in cui la pendenza della tangente e −1. Si puo anche imporre che, mettendo a sistema le rette con la parabola,il sistema abbia una sola soluzione. Presento questa seconda strada e lascio per esercizio agli studenti la prima. Ilsistema e

{

x + y = k

x + y2 = 1cioe

{

x = k − y

x + y2 = 1.

Sostituendo la prima nella seconda si ottiene l’equazione (nella sola y)

y2 − y + k − 1 = 0.

E ovvio che le soluzioni di questa equazione dipendono dal valore di k. Noi vogliamo che ci sia una sola soluzione.Deve allora necessariamente succedere che il discriminante dell’equazione sia zero, cioe

∆ = 1 − 4(k − 1) = 0 da cui si ricava k =5

4.

Con k = 5

4l’equazione diventa y2 − y − 1

4= 0, cioe (y − 1

2)2 = 0, cioe y = 1

2. Per trovare x basta sostituire i valori

trovati di k e y nella prima equazione del sistema e si ottiene x = 3

4. Pertanto il punto (3

4, 1

2) e di massimo (globale)

vincolato.

Esempiomax / min f(x, y) = x2 + y2 con vincolo x + y = 1.

Il vincolo definisce la retta di equazione y = 1 − x. Le curve di livello di f sonocirconferenze centrate nell’origine, di raggio crescente al crescere di k. La figura afianco aiuta a capire che c’e un punto di minimo (globale) vincolato dove indicato. Sivede anche che la funzione non e poi superiormente limitata sul vincolo. Per trovareil punto di minimo si puo semplicemente dire che per ragioni di simmetria il puntodeve stare sulla bisettrice del primo quadrante e quindi e il punto (1

2, 1

2). Si puo anche

procedere come prima imponendo che la retta e la circonferenza si incontrino in unsolo punto.

b

1

1

max

x

y

Esempiomax / min f(x, y) = xy con vincolo 2x + y = 2.

Il vincolo definisce la retta di equazione y = 2−2x. Le curve di livello k della funzionef sono iperboli equilatere: se k > 0 l’iperbole sta nel primo e terzo quadrante, se k < 0l’iperbole sta nel secondo e quarto quadrante. Tenendo conto, nella figura a fianco,che i livelli crescenti sono indicati dalla freccia, si vede che c’e un punto di massimovincolato (globale) e non ci sono punti di minimo vincolato, dato che la funzione fnon e limitata inferiormente.Per trovare il punto di massimo facciamo sistema tra il vincolo e le curve di livello:

{

xy = k

2x + y = 2cioe

{

y = 2 − 2x

x(2 − 2x) = kcioe

{

y = 2 − 2x

2x2 − 2x + k = 0.

bmax

1

2

x

y

Occorre che l’equazione di secondo grado abbia una sola soluzione e quindi poniamo il discriminante uguale a zero:

∆ = 1 − 2k = 0 da cui si ricava k =1

2.

L’equazione e quindi

2x2 − 2x +1

2= 0 cioe 4x2 − 4x + 1 = 0 cioe (2x − 1)2 = 0 e infine x =

1

2e y = 2 − 2x = 1.

Pertanto il punto di massimo vincolato (globale) e (1

2, 1).

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 4

Esempiomax / min f(x, y) = xy con vincolo x2 + y2 = 2.

Il vincolo definisce la circonferenze di centro l’origine e raggio√

2, Le curve di livellok della funzione f sono iperboli equilatere: se k > 0 l’iperbole sta nel primo e terzoquadrante, se k < 0 l’iperbole sta nel secondo e quarto quadrante. La solita figuramostra chiaramente che ci sono due punti di massimo vincolato globale4 e due puntidi minimo vincolato globale. I punti in questione si trovano sulle rette bisettrici equindi si trova facilmente che si tratta dei punti (1, 1) e (−1,−1) (di massimo) e deipunti (−1, 1) e (1,−1) (di minimo).

bb

b b

max

max

min

min

√2

√2

x

y

2.2 Il metodo dei moltiplicatori di Lagrange

Lagrange ha dimostrato questo risultato generale sui punti di massimo o minimo vincolato.

Teorema (Lagrange) Siano f, g : A → R due funzioni di classe C1 nell’aperto A ⊂ Rn. Dato il problema

max / min f(x) con vincolo g(x) = b,

definiamo la funzione Lagrangiana L(x, λ) = f(x) − λ(

g(x) − b)

.

Se x e punto di massimo o di minimo locale vincolato di f e se ∇g(x) 6= 0 allora esiste un λ ∈ R tale che∇L(x, λ) = 0.

Osservazione Si faccia attenzione che x ∈ Rn, ma f(x) e, essendoci un solo vincolo, anche g(x), b e λ sono tutti

numeri reali. La funzione Lagrangiana e funzione di x e di λ e una scrittura estesa sarebbe

L(x1, . . . , xn, λ) = f(x1, . . . , xn) − λ(

g(x1, . . . , xn) − b)

.

Quindi L e funzione di n +1 variabili. Il gradiente di L e un vettore di n + 1 componenti, che sono le derivate parzialidi L rispetto a x1, . . . , xn e a λ.

Osservazione A scanso di incomprensioni, le derivate parziali di L sono:

L′j(x, λ) = f ′

j(x) − λg′j(x), per j = 1, 2, . . . , n

L′λ(x, λ) = −(g(x) − b).

Dalla seconda scrittura si vede che l’annullarsi della derivata parziale di L rispetto a λ significa semplicemente ilrispetto del vincolo (g(x) − b = 0 cioe g(x) = b).

Osservazione Il risultato di Lagrange e una condizione necessaria del primo ordine per un punto di massimo/minimo(locale) vincolato. Essa dice che se c’e un punto di massimo/minimo vincolato allora la funzione Lagrangiana deveessere stazionaria in questo punto, per un particolare valore del parametro λ. Tale valore e universalmente noto conil nome di moltiplicatore di Lagrange.

Trattandosi di una condizione necessaria, se troviamo un punto stazionario della Lagrangiana non possiamo ancoradire di aver trovato un punto di massimo/minimo vincolato, ma soltanto un possibile “candidato”. Vedremo piu avantile condizioni sufficienti.

Osservazione Si noti da ultimo che c’e l’ipotesi sul gradiente di g, che non deve essere il vettore nullo. Questacondizione, importante, e il primo esempio di una condizione che ritroveremo in tutti i risuultati successivi, ancherelativi a problemi piu complessi. E una condizione di regolarita dei vincoli.5 Un vincolo che non rispetta questacondizione e in qualche modo un vincolo irregolare, per cui le condizioni di ottimalita potrebbero non valere.

Esempio Consideriamo la funzione f(x, y) = xy sul vincolo dato dall’equazione x + y = 1. Vogliamo trovare i punticandidati ad essere di massimo o di minimo vincolato per f .

Costruiamo la funzione Lagrangiana:

L(x, y, λ) = xy − λ(x + y − 1).

Osserviamo anzitutto che il gradiente del vincolo e ∇g(x, y) = (1, 1), quindi sempre diverso da zero. Allora possiamoessere certi che, se un punto e di massimo o di minimo vincolato, allora e anche stazionario per la funzione Lagrangiana.

4Per ragioni di simmetria si intuisce che il valore della funzione obiettivo nei due punti di massimo e lo stesso e quindi che si tratta didue massimi globali.

5Viene chiamata anche condizione di qualificazione dei vincoli (constraint qualification o non degenerate contraint qualification(NDCQ)).

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 5

Cerchiamo i punti stazionari della Lagrangiana calcolando intanto il

∇L(x, y, λ) =(

y − λ, x − λ,−x − y + 1)

.

Per trovare dove il gradiente si annulla basta risolvere il sistema di equazioni

y − λ = 0

x − λ = 0

x + y = 1

cioe

y = λ

x = λ

x + y = 1

cioe

y = λ

x = λ

2λ = 1

dal quale si ottiene l’unica soluzione (x, y, λ) = (1

2, 1

2, 1

2). Pertanto si ha l’unico punto stazionario vincolato (1

2, 1

2).

Osservazione Dato che il vincolo permette di esplicitare facilmente le variabili, il problema si puo risolvere comple-tamente, con la tecnica gia vista prima, costruendo la restrizione. Lo studente provi a farlo, trovando la vera naturadel punto stazionario vincolato. Volendo il problema si puo risolvere anche con le curve di livello.

Ecco un esempio che prova che la regolarita del vincolo e importante.

Esempio Consideriamo la funzione f(x, y) = x sul vincolo dato dall’equazione x3 + y2 = 0.Con un semplice ragionamento possiamo dire che l’origine e punto di massimo vincolato. Infatti nei punti che

stanno sul vincolo si ha x3 = −y2, e quindi questi punti hanno una x minore o uguale a zero. Ma allora in tali puntila funzione, che e f(x, y) = x, assume valore minore o uguale a zero. Dato che nell’origine essa assume il valore zero,l’origine e certamente punto di massimo globale vincolato.

Ora scriviamo la funzione Lagrangiana

L(x, y, λ) = x − λ(x3 + y2).

Il gradiente di L e

∇L(x, y, λ) =(

1 − 3λx2,−2λy,−x3 − y2

)

.

Si vede facilmente (esercizio) che il gradiente non si annulla mai, e in particolare non si annulla nell’origine, inapparente contrasto con il risultato di Lagrange (essendo l’origine punto di massimo vincolato, dovremmo avere che incorrispondenza c’e un punto stazionario per la Lagrangiana). La spiegazione e che il vincolo non e regolare nell’origine,dato che ∇g(0, 0) = (0, 0). In questo caso quindi per la non regolarita del vincolo la tesi di Lagrange viene a cadere.6

Vediamo ora la risoluzione col metodo di Lagrange degli altri esempi risolti prima con le curve di livello.

Esempiomax / min f(x, y) = x + y con vincolo x + y2 = 1.

La funzione Lagrangiana eL(x, y, λ) = x + y − λ(x + y2 − 1).

Il gradiente del vincolo e ∇g(x, y) = (1, 2y), sempre diverso da zero. Allora siamo certi che, se un punto e di massimoo di minimo vincolato, allora e anche stazionario per la funzione Lagrangiana.

Il gradiente della Lagrangiana e

∇L(x, y, λ) =(

1 − λ, 1 − 2λy,−x − y2 + 1)

.

Si trova facilmente che il gradiente si annulla soltanto nel punto (x, y, λ) = (3

4, 1

2, 1). Pertanto si ha l’unico punto

stazionario vincolato (3

4, 1

2). Il metodo delle curve di livello consentiva di dire che si tratta di un punto di massimo,

mentre la condizione di Lagrange, che e necessaria, non permette ancora di dire nulla.

Esempiomax / min f(x, y) = x2 + y2 con vincolo x + y = 1.

La funzione Lagrangiana eL(x, y, λ) = x2 + y2 − λ(x + y − 1).

6Attenzione che non e detto che se il vincolo e non regolare allora la tesi di Lagrange sia necessariamente falsa! Se il vincolo e nonregolare non possiamo dire nulla sulla stazionarieta della funzione Lagrangiana. Per questo motivo, dato che i punti di non regolarita deivincoli potrebbero non essere trovati tra i punti stazionari della Lagrangiana, nella ricerca dei punti di massimo o di minimo vincolatooccorre includere anche i punti in cui i vincoli non sono regolari.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 6

Il gradiente del vincolo e ∇g(x, y) = (1, 1), sempre diverso da zero. Il gradiente della Lagrangiana e

∇L(x, y, λ) =(

2x − λ, 2y − λ,−x − y + 1)

.

L’annullarsi del gradiente equivale al sistema

2x − λ = 0

2y − λ = 0

x + y = 1

cioe

λ = 2x

x = y

2x = 1

cioe

x = 1

2

x = 1

2

λ = 1.

Quindi l’unico punto stazionario per la Lagrangiana e (x, y, λ) = (1

2, 1

2, 1) e l’unico punto stazionario vincolato e (1

2, 1

2).

Esempiomax / min f(x, y) = xy con vincolo x2 + y2 = 2.

La funzione Lagrangiana eL(x, y, λ) = xy − λ(x2 + y2 − 2).

Il gradiente del vincolo e ∇g(x, y) = (2x, 2y): esso si annulla nell’origine, che pero non e un punto del vincolo. Quindipossiamo essere sicuri che sul vincolo il gradiente di g non si annulla mai.

Il gradiente della Lagrangiana e

∇L(x, y, λ) =(

y − 2λx, x − 2λy,−x2 − y2 + 2)

.

L’annullarsi del gradiente equivale al sistema

y = 2λx

x = 2λy

x2 + y2 = 2

cioe

y = 2λx

x = 2λ · 2λx

x2 + y2 = 2

cioe

y = 2λx

x(1 − 4λ2) = 0

x2 + y2 = 2.

Qui per trovare le soluzioni possiamo percorrere due strade: la seconda equazione puo essere verificata o con x = 0 ocon 1 − 4λ2 = 0. Con x = 0 si vede subito che il sistema e impossibile.

Con 4λ2 = 1, cioe λ2 = 1

4, cioe λ = ± 1

2, si ha

λ = 1

2

y = x

x2 = 1

oppure

λ = − 1

2

y = −x

x2 = 1.

Dal primo sistema si ottengono le soluzioni (1, 1, 1

2) e (−1,−1, 1

2), dal secondo le soluzioni (1,−1,− 1

2) e (−1, 1,− 1

2).

Abbiamo quattro punti stazionari per la Lagrangiana e quindi quattro punti stazionari vincolati: (1, 1), (−1,−1),(1,−1) e (−1, 1).

2.3 Interpretazione geometrica

Il risultato di Lagrange ha una semplice interpretazione geometrica. Per comprendere meglio e opportuno illustrareintanto due fatti che da un punto di vista operativo dell’ottimizzazione possono far capire molte cose: il primo e cheil gradiente di una funzione, calcolato in un certo punto, e un vettore ortogonale alla curva (o superficie) di livellodella funzione passante per quel punto;7 il secondo e che il gradiente indica una direzione in cui il valore della funzioneaumenta.

Spiego la prima questione. I casi rilevanti sono quando la funzione e definita in R2 o in R

3 (con dimensioni maggiorila cosa e ancora vera, parlando di ipersuperficie di livello, ma la cosa non e rappresentabile per le note ragioni).

7Sarebbe piu corretto dire ortogonale alla tangente a tale curva, ma va bene anche cosı.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 7

Consideriamo una funzione g definita in R2 e consideriamo l’equazione

g(x1, x2) = b.

Lo studente sa gia che l’equazione definisce la curva di livello b della funzione g.Se x = (x1, x2) e una soluzione dell’equazione, allora tale punto si trova sullasuperficie di livello (ovviamente si ha b = g(x)). Sia ∇g(x) il gradiente di g nelpunto x.Sappiamo che l’equazione della retta tangente alla curva di livello e

∇g(x) · (x − x) = 0.

Ora basta osservare che il vettore h = x − x e parallelo a tale retta tangente.

b x

x

h = x − x

−x

g(x) = b

∇g(x)

x1

x2

Pertanto, essendo ∇g(x) ortogonale a x − x, esso e ortogonale anche alla tangente alla curva di livello.In R

3 le cose sono analoghe. Una certa superficie di livello ha in un punto un piano tangente e il gradiente inquesto punto e ortogonale al piano tangente.

Spiego la seconda questione. Possiamo rifarci alla formula, vista parlando didifferenziabilita, che fornisce una prima approssimazione della variazione di f :

f(x) − f(x) ≈ ∇f(x) · (x − x).

Se x e un punto in prossimita di x per cui in corrispondenza del vettore variazionex−x la variazione di f e positiva, allora il gradiente deve “proiettarsi positivamente”su x− x. Quindi il gradiente e rivolto verso i punti che danno una variazione positivadi f . In realta si potrebbe dimostrare che il gradiente indica la direzione in cui si ha lamassima variazione positiva o, come si dice, indica la direzione di massima pendenza.

b

xb x

∇f(x)

h = x − x

f(x) = f(x)x1

x2

Ora veniamo all’interpretazione geometrica della condizione di Lagrange (per semplicita lo vediamo in R2). La

condizione necessaria per un punto di massimo o di minimo vincolato e che la funzione Lagrangiana L(x, y, λ) =f(x, y) − λ

(

g(x, y) − b)

abbia gradiente nullo nel punto (x, y, λ) e questo equivale a scrivere

f ′1(x) − λg′1(x) = 0

f ′2(x) − λg′2(x) = 0

−g(x) + b = 0

ossia

f ′1(x) = λg′1(x)

f ′2(x) = λg′2(x)

g(x) = b.

Come gia osservato la terza equazione impone soltanto il rispetto del vincolo. Le prime due possono essere scritte con∇f(x) = λ∇g(x): il gradiente di f e cioe proporzionale al gradiente di g (con coefficiente di proporzionalita λ).

Non e difficile vedere, anche geometricamente sulle figure, che questa condizione e necessaria per avere un punto dimassimo o di minimo. Infatti se in x c’e un tale punto, le curve di livello (di f e di g) devono essere “tangenti”, quindidevono avere la stessa retta tangente e quindi i due gradienti, che sono ortogonali a questa retta tangente, devonoessere proporzionali.

b

x

∇f(x)

∇g(x)

g(x) = b

f(x) = k

b

x

∇f(x)

∇g(x)g(x) = b

f(x) = k

∇g(x)

∇f(x)bxg(x) = b

f(x) = k

Nelle figure a sinistra e al centro il vincolo e la curva di livello di f sono tangenti e i gradienti sono proporzionali.E la situazione che si presenta in un punto di massimo o di minimo vincolato.

La figura a destra fa vedere invece che se il vincolo e la curva di livello di f non sono tangenti il punto x non puoessere di massimo o di minimo, dato che si possono trovare in prossimita di x punti sul vincolo in cui la funzione f havalori maggiori o minori.

Osservazione E importante osservare, ai fini di quanto vedremo successivamente quando i vincoli saranno espressiin forma di disequazione, che il segno del moltiplicatore λ non e necessariamente sempre lo stesso. Nella figura quisopra a sinistra i due gradienti sono da parti opposte (moltiplicatore negativo) mentre nella figura al centro i due

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 8

gradienti sono dalla stessa parte (moltiplicatore positivo). Lo studente rifletta anche sul fatto che le figure illustranola situazione relativa ad un punto di massimo. Per esercizio puo disegnarne una relativa ad un punto di minimo.

Concludiamo la sezione con altri esempi.

Esempio Consideriamo il problema

max / min f(x, y) = x2 − y2 con vincolo x2 − y = 0.

La funzione Lagrangiana eL(x, y, λ) = x2 − y2 − λ(x2 − y).

Dopo aver osservato che il gradiente del vincolo e ∇g(x, y) = (2x,−1), sempre diverso da zero, abbiamo che il vincoloe regolare. Il gradiente della Lagrangiana e

∇L(x, y, λ) =(

2x − 2λx,−2y + λ,−x2 + y)

.

L’annullarsi del gradiente equivale al sistema

2x − 2λx = 0

−2y + λ = 0

x2 − y = 0

cioe

2x(1 − λ) = 0

λ = 2y

y = x2.

Dalla prima, se x = 0 si trova che anche y e λ si annullano e quindi c’e la soluzione nulla. Se invece λ = 1, sostituendonella seconda e terza equazione si trova y = 1

2e x = ± 1√

2.

Pertanto si hanno i tre punti stazionari vincolati (0, 0), ( 1√2, 1

2) e (− 1√

2, 1

2).

Lo studente potrebbe risolvere il problema con il metodo delle curve di livello o anche studiando la restrizione dif al vincolo, che si ottiene facilmente esplicitando la variabile y dal vincolo.8

Esercizio Consideriamo il problema

max / min f(x, y) = x + y con vincolo x2 + y2 = 1.

La funzione Lagrangiana eL(x, y, λ) = x + y − λ(x2 + y2 − 1).

Come gia osservato in un esercizio precedente con vincolo analogo, il gradiente del vincolo puo annullarsi ma non suipunti del vincolo stesso. Quindi il vincolo e regolare. Il gradiente della Lagrangiana e

∇L(x, y, λ) =(

1 − 2λx, 1 − 2λy,−x2 − y2 + 1)

.

L’annullarsi del gradiente equivale al sistema

1 − 2λx = 0

1 − 2λy = 0

x2 + y2 = 1

cioe

2λx = 1

2λy = 1

x2 + y2 = 1.

Osserviamo che λ = 0 non porta a soluzioni.9 Quindi, dato che deve essere λ 6= 0, possiamo dividere per λ e otteniamo

x = 1/(2λ)

y = 1/(2λ)

1/(4λ2) + 1/(4λ2) − 1 = 0

cioe

λ = ±1/√

2

x = 1/(2λ)

y = 1/(2λ).

Si trovano pertanto i due punti stazionari vincolati ( 1√2, 1√

2) e (− 1√

2,− 1√

2).

Esempio Consideriamo il problema in R3

max / min f(x, y, z) = x + y + z con vincolo x2 + y2 + z2 = 3.

8Lo studio attraverso la restrizione di f al vincolo e semplice. Non altrettanto facile e lo studio con le curve di livello: le curve di livellodi f sono iperboli ma con asintoti che non sono gli assi cartesiani.

9Con λ = 0 le prime due equazioni non sono certamente soddisfatte.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 9

La funzione Lagrangiana eL(x, y, z, λ) = x + y + z − λ(x2 + y2 + z2 − 3).

Il gradiente del vincolo e ∇g(x, y, z) = (2x, 2y, 2z), che si annulla soltanto al di fuori del vincolo. Quindi il vincolo eregolare. Il gradiente della Lagrangiana e

∇L(x, y, z, λ) =(

1 − 2λx, 1 − 2λy, 1 − 2λz,−x2 − y2 − z2 + 3)

.

L’annullarsi del gradiente equivale al sistema

1 − 2λx = 0

1 − 2λy = 0

1 − 2λz = 0

x2 + y2 + z2 = 3

cioe

2λx = 1

2λy = 1

2λz = 1

x2 + y2 + z2 = 3.

Dopo aver osservato che il valore nullo non e accettabile per le incognite, ricavando dalle prime tre equazioni x, y, z siottiene x = y = z = 1

2λe sostituendo nella quarta si ha

1

4λ2+

1

4λ2+

1

4λ2= 3 cioe

3

4λ2= 3 da cui λ = ±1

2.

Quindi ci sono due punti stazionari vincolati: (1, 1, 1) con λ = 1

2e (−1,−1,−1) con λ = − 1

2.

Esempio Consideriamo il problema

max / min f(x, y, z) = x + y + z con vincolo xyz = 1.

La funzione Lagrangiana eL(x, y, λ) = x + y + z − λ(xyz − 1).

Il gradiente del vincolo e ∇g(x, y, z) = (yz, xz, xy), che si annulla soltanto al di fuori del vincolo. Quindi il vincolo eregolare. Il gradiente della Lagrangiana e

∇L(x, y, z, λ) =(

1 − λyz, 1 − λxz, 1 − λxy,−xyz + 1)

.

L’annullarsi del gradiente equivale al sistema

1 − λyz = 0

1 − λxz = 0

1 − λxy = 0

xyz = 1

cioe

λyz = 1

λxz = 1

λxy = 1

xyz = 1.

Dopo aver osservato che il valore nullo non e accettabile per le incognite, si trova facilmente che deve essere x = y =z = λ, da cui (per la quarta) λ3 = 1 e quindi λ = 1. L’unica soluzione e quindi (x, y, z, λ) = (1, 1, 1, 1) e quindi l’unicopunto stazionario vincolato e (1, 1, 1).

2.4 Significato economico del moltiplicatore di Lagrange

b

x(b1)

bx(b2)

g = b1

g = b2

f = k1

f = k2Il moltiplicatore di Lagrange ha un interessante significato “economico”.Consideriamo per semplicita il problema in due sole variabili

max / min f(x1, x2) con vincolo g(x1, x2) = b

con funzione Lagrangiana

L(x1, x2, λ) = f(x1, x2) − λ(

g(x1, x2) − b)

.

Sia z il valore massimo della funzione f del problema vincolato.Osserviamo quanto segue:

• Il valore z dipende dal valore di b e una variazione di b produce una variazione di z (solitamente per dire questosi scrive z = z(b)). La figura illustra che variando il valore di b (da b1 a b2) cambia la soluzione ottima (dax(b1) a x(b2)) e cambia il valore massimo di f (da k1 a k2). Quindi avremo che, se x(b) e il punto di massimovincolato, f(x(b)) e il valore massimo di f in tale punto e z(b) = f(x(b));

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 10

• Fissato un certo b e indicati con (x1(b), x2(b)) e λ(b) rispettivamente il punto di massimo vincolato e il corri-spondente valore del moltiplicatore, si ha che

L(

x1(b), x2(b), λ(b))

= f(

x1(b), x2(b))

− λ(b)(

g(x1(b), x2(b)) − b)

= f(

x1(b), x2(b))

= z(b). 10

Ora possiamo calcolare il tasso di variazione di z rispetto a b, cioe la variazione di z in conseguenza di una variazioneunitaria di b calcolando la derivata z′(b). Si ha11

z′(b) =dLdb

= f ′1x

′1 + f ′

2x′2 − λ′(g − b) − λ(g′1x

′1 + g′2x

′2 − 1)

= f ′1x

′1 + f ′

2x′2 − λ(g′1x

′1 + g′2x

′2 − 1)

= (f ′1 − λg′1)x

′1 + (f ′

2 − λg′2)x′2 + λ

= λ.

A commento di due passaggi significativi, faccio osservare che nel terzo passaggio il temine λ′(g − b) si annulla datoche il vincolo deve essere rispettato e nell’ultimo passaggio la semplificazione si ha dal fatto che nel punto di massimovalgono le condizioni necessarie di Lagrange e quindi i due termini f ′

1 − λg′1 e f ′2 − λg′2 si annullano.

Quanto trovato dice quindi che la variazione del valore ottimo z in corrispondenza ad una variazione unitaria dib e data dal valore del moltiplicatore di Lagrange. Se b rappresenta una risorsa e f(x1, x2) fornisce il profitto di unprocesso produttivo dove l’utilizzo della risorsa e regolato dal vincolo g(x1, x2) = b, allora il valore del moltiplicatore(valore monetario/quantita) e un prezzo. Per questo motivo solitamente gli economisti danno al moltiplicatore diLagrange il nome di prezzo ombra.

3 Caso generale (condizione necessaria)

Non ci sono sostanziali novita nel caso di un problema di massimo o di minimo vincolato in cui sono presenti piuequazioni di vincolo. Si osservi che, dovendo essere il numero di variabili maggiore del numero dei vincoli,12 questicasi avranno necessariamente almeno tre variabili. Una risoluzione grafica di questi casi, con metodi analoghi a quellodelle curve di livello, anche se possibile, non e di solito agevole.

Va detto anche che in qualche caso dal sistema dei vincoli e possibile esplicitare una variabile rispetto alle altre, equindi costruire la restrizione della funzione obiettivo alla regione ammissibile, restrizione che avra certamente menovariabili della funzione originaria. In questi casi cosı facendo il problema viene ricondotto ad un problema libero sullarestrizione e a tale problema sono ovviamente applicabili i metodi visti studiando i massimi e minimi liberi.

Vediamo subito un esempio in questo senso.

Esempio Consideriamo il problema

max / min f(x, y, z) = x2 + y2 + z2 con vincoli

{

x + y + z = 1

x − y + z = 1.

Il sistema dei vincoli e un sistema lineare, che sappiamo risolvere esprimendo due variabili in funzione della terza.Risolvendo tale sistema, ad esempio con una semplice sostituzione, si trova

{

z = 1 − x − y

y = 0da cui

{

z = 1 − x

y = 0che ha soluzioni (x, 0, 1 − x) con x ∈ R.

10Il termine del moltiplicatore scompare dato che nel punto di massimo il vincolo e rispettato e quindi g(x1(b), x2(b)) − b = 0.11Per non appesantire le notazioni evito di indicare gli argomenti: si pensi pero che tutto quello che compare e funzione di b. L’unica

derivazione non immediata e quella delle funzioni f e g. Si osservi che per derivare rispetto a b ad esempio la f , che e una f(x1(b), x2(b)),devo usare la regola di derivazione delle funzioni composte e ho

d

dbf(x1(b), x2(b)) = f ′

1(x1(b), x2(b))x′

1(b) + f ′

2(x1(b), x2(b))x′

2(b)

che nel seguito semplifico in f ′

1x′

1+ f ′

2x′

2.

12Si vada a rivedere la formulazione iniziale del problema: avevamo m < n dato che troppe equazioni di vincolo possono ovviamentesvuotare la regione ammissibile.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 11

I valori della funzione obiettivo sul vincolo coincidono quindi con quelli della funzione di una sola variabile (la restrizionedi f ai vincoli)

f(x, 0, 1 − x) = x2 + (1 − x)2 = 2x2 − 2x + 1.

Si trova facilmente che tale funzione ha un punto di minimo (globale) in x = 1

2e che quindi

(

1

2, 0, 1

2

)

e punto di minimoglobale vincolato per la funzione f .

Si puo anche osservare, sempre dai valori della restrizione, che la funzione obiettivo f non e superiormente limitatasul vincolo.

Osservazione Si noti che con il calcolo esplicito della restrizione di f sul vincolo si riesce a dare una soluzionecompleta del problema.

In generale e in particolare nei casi in cui non e possibile trovare una forma esplicita dei vincoli il metodo deimoltiplicatori di Lagrange consente di determinare i punti stazionari vincolati. Ricordo che la formulazione delproblema e ora

max f(x1, . . . , xn)con vincoli

gi(x1, . . . , xn) = bi, i = 1, 2, . . . , mossia, con notazione vettoriale,

max f(x)con vincoli

g(x) = b.

Vediamo la condizione necessaria di Lagrange. Sia A un insieme aperto in Rn.

Teorema (Lagrange) Siano f : A → R e g : A → Rm funzioni di classe C1 nell’aperto A. Dato il problema

max / min f(x) con vincoli g(x) = b,

definiamo la funzione Lagrangiana L(x, λ) = f(x) − λ ·(

g(x) − b)

, dove λ ∈ Rm.

Se x e punto di massimo o di minimo locale vincolato di f e se la matrice Jacobiana Jg(x) ha rango m allora esisteun λ ∈ R

m tale che ∇L(x, λ) = 0.

Osservazioni Mettendo a confronto questo enunciato con quello visto nel caso con un solo vincolo e da notare che:

• nella funzione Lagrangiana ora λ e un vettore (tanti moltiplicatori quanti sono i vincoli);

• sempre nella funzione Lagrangiana abbiamo il prodotto interno tra il vettore dei moltiplicatori e il vettore g(x)−b.Una scrittura estesa equivalente a

L(x, λ) = f(x) − λ ·(

g(x) − b)

e L(x, λ) = f(x) −m

i=1

λi

(

gi(x) − bi

)

.

• la precedente condizione di regolarita del vincolo (∇g(x) 6= 0) viene ora sostituita dalla analoga condizione diregolarita dei vincoli che chiede alla derivata di g (la matrice Jacobiana) di essere di rango massimo nel punto x;

• la condizione necessaria e la stessa: esiste un vettore λ per cui il punto (x, λ) e stazionario per la funzioneLagrangiana.

Ora vediamo qualche esempio di applicazione del metodo dei moltiplicatori di Lagrange quando ci sono piu vincoli.

Esempio Possiamo iniziare dall’esempio risolto poco fa con la restrizione. Il problema e

max / min f(x, y, z) = x2 + y2 + z2 con vincoli

{

x + y + z = 1

x − y + z = 1.

La matrice Jacobiana dei vincoli e

Jg(x, y, z) =

(

1 1 1

1 −1 1

)

e ha chiaramente rango 2.

I vincoli sono quindi regolari. La funzione Lagrangiana e

L(x, y, z, λ1, λ2) = x2 + y2 + z2 − λ1(x + y + z − 1) − λ2(x − y + z − 1).

Il gradiente della Lagrangiana e

∇L(x, y, z, λ1, λ2) =(

2x − λ1 − λ2, 2y − λ1 + λ2, 2z − λ1 − λ2,−x − y − z − 1,−x + y − z − 1)

.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 12

L’annullarsi del gradiente equivale al sistema

2x − λ1 − λ2 = 0

2y − λ1 + λ2 = 0

2z − λ1 − λ2 = 0

x + y + z = 1

x − y + z = 1.

Si tratta di un sistema lineare e con qualche calcolo si trova che ha come unica soluzione (x, y, z, λ1, λ2) = (1

2, 0, 1

2, 1

2, 1

2)

e quindi c’e il solo punto stazionario vincolato (1

2, 0, 1

2).

Esempio

max / min f(x, y, z) = −x − y + 2z con vincoli

{

x2 + y2 = 10

y + z = 3.

La matrice Jacobiana dei vincoli e

Jg(x, y, z) =

(

2x 2y 0

0 1 1

)

,

che non ha rango 2 soltanto nei punti (0, 0, z), z ∈ R,13 punti che non stanno sui vincoli. La funzione Lagrangiana e

L(x, y, z, λ1, λ2) = −x − y + 2z − λ1(x2 + y2 − 10)− λ2(y + z − 3).

Il gradiente della Lagrangiana e

∇L(x, y, z, λ1, λ2) =(

− 1 − 2λ1x,−1 − 2λ1y − λ2, 2 − λ2,−x2 − y2 + 10,−y − z + 3)

.

L’annullarsi del gradiente equivale al sistema

−1 − 2λ1x = 0

−1 − 2λ1y − λ2 = 0

2 − λ2 = 0

x2 + y2 = 10

y + z = 3.

cioe

1 + 2λ1x = 0

1 + 2λ1y + λ2 = 0

λ2 = 2

x2 + y2 = 10

y + z = 3.

Osservando che λ1 = 0 non fornisce soluzioni, dalle prime due equazioni si ottiene

x = − 1

2λ1

y = − 3

2λ1

λ2 = 2

x2 + y2 = 10

y + z = 3

da cui, sostituendo nella quarta, 1

4λ2

1

+ 9

4λ2

1

= 10 e quindi λ1 = ± 1

2. Ricavando infine z dalla quinta equazione si

ottengono i due punti stazionari vincolati

(−1,−3, 6) con λ1 = 1

2, λ2 = 2

e (1, 3, 0) con λ1 = − 1

2, λ2 = 2.

Esempio

max / min f(x, y, z) = x con vincoli

{

x2 + y2 + z2 = 5

2

y + z = 1.

La matrice Jacobiana dei vincoli e

Jg(x, y, z) =

(

2x 2y 2z

0 1 1

)

,

13Il rango minore di 2 si ha solo se i tre minori del secondo ordine sono tutti nulli. I minori in questione sono 2x e 2y e quindi questi siannullano contemporaneamente appunto sul sottospazio (0, 0, z), con z ∈ R.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 13

che non ha rango 2 soltanto nei punti (0, z, z), z ∈ R, punti che non stanno sui vincoli. La funzione Lagrangiana e

L(x, y, z, λ1, λ2) = x − λ1(x2 + y2 + z2 − 5

2) − λ2(y + z − 1).

Il gradiente della Lagrangiana e

∇L(x, y, z, λ1, λ2) =(

1 − 2λ1x,−2λ1y − λ2,−2λ1z − λ2,−x2 − y2 − z2 + 5

2,−y − z + 1

)

.

L’annullarsi del gradiente equivale al sistema

1 − 2λ1x = 0

−2λ1y − λ2 = 0

−2λ1z − λ2 = 0

x2 + y2 + z2 = 5

2

y + z = 1.

cioe

1 − 2λ1x = 0

2λ1y + λ2 = 0

2λ1z + λ2 = 0

x2 + y2 + z2 = 5

2

y + z = 1.

Dato che λ1 = 0 non fornisce soluzioni, dalle prime tre equazioni si puo ottenere

x = 1

2λ1

y = − λ2

2λ1

z = − λ2

2λ1

x2 + y2 + z2 = 5

2

y + z = 1.

Ora dalla quinta equazione si ottiene λ2

λ1

= −1 e cioe λ2 = −λ1. Allora y = z = 1

2e dalla quarta x = ±

√2.

Ci sono quindi due soluzioni:

(√

2, 1

2, 1

2) con λ1 = 1

2√

2, λ2 = − 1

2√

2

e (√

2, 1

2, 1

2) con λ1 = − 1

2√

2, λ2 = 1

2√

2.

4 Condizioni sufficienti

Esistono, come per il problema sui massimi e minimi liberi, alcune condizioni sufficienti di ottimalita, condizioni cioeche, se verificate, consentono di concludere che il punto in questione e di massimo o di minimo vincolato. Vediamo duetipi di condizioni sufficienti per un problema vincolato. Il primo utilizza una restrizione della funzione Lagrangianasu di un sottospazio che dipende dai vincoli. Il secondo utilizza invece una specie di matrice Hessiana che tiene inconsiderazione, oltre la funzione obiettivo, anche i vincoli.

4.1 La condizione sul sottospazio tangente ai vincoli

Teorema (Lagrange) Siano f : A → R e g : A → Rm funzioni di classe C2 nell’aperto A ⊂ R

n. Dato il problema

max / min f(x) con vincoli g(x) = b,

se x e un punto nella regione ammissibile tale che

(a) esistono dei moltiplicatori λ = (λ1, . . . λm) per cui (x, λ) e stazionario per la funzione Lagrangiana

(b) ∇2xxL(x, λ) e definito positivo (negativo) nel sottospazio

{

h ∈ Rn : Jg(x)h = 0

}

allora x e punto di minimo (massimo) locale vincolato per la funzione f .

Osservazione Unica doverosa precisazione sulle notazioni: la scrittura ∇2xxL(x, λ) indica il gradiente secondo par-

ziale della Lagrangiana rispetto alle sole x, cioe alle variabili vere e proprie (quelle contenute nel vettore x). E la

matrice i cui elementi sono le ∂2L∂xi∂xj

.

Osservazione Il punto (a) chiede che valga la condizione necessaria del primo ordine.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 14

Per quanto riguarda il punto (b), e bene anzitutto riflettere sul significato dell’e-quazione Jg(x)h = 0, che definisce il sottospazio rilevante ai fini della condizionedi ottimalita. Si tratta ovviamente di un prodotto matrice × vettore. Dato che lamatrice Jacobiana dei vincoli ha sulle righe i gradienti dei vari vincoli, il prodottodelle righe per il vettore h, uguagliato a zero, significa l’ortogonalita di h con tuttii gradienti dei vincoli. Ricordando che i gradienti sono ortogonali alle superfici dilivello, questo significa che il sottospazio formato dai vettori h con questa proprietae il sottospazio tangente ai vincoli nel punto x. La cosa si puo cogliere facilmente seconsideriamo un problema con un solo vincolo g(x) = b in R

2. Il sottospazio e definitoallora da ∇g(x)h = 0, cioe h deve essere ortogonale al gradiente del vincolo in x. Lafigura illustra che i vettori h sono quelli tangenti al vincolo.

b

x

∇g(x)

h

h

g(x) = b

La condizione (b), che e la condizione sufficiente per l’ottimalita di x, significa allora che il gradiente secondo(matrice Hessiana) della funzione Lagrangiana (la sua parte relativa alle sole variabili effettive) o ancora meglio laforma quadratica ad esso associata e definita positiva o negativa sul sottospazio tangente ai vincoli del problema nelpunto x.

Osservazione Da notare che le condizioni sufficienti non coprono i casi in cui il gradiente secondo della Lagrangiana eindefinito o semidefinito sul sottospazio tangente ai vincoli. Si puo pero vedere che, mentre nel primo caso (∇2

xxL(x, λ)indefinito sul sottospazio tangente) si ha un punto che non e ne di massimo ne di minimo vincolato, nel secondo caso(∇2

xxL(x, λ) semidefinito), come avviene per l’ottimizzazione libera, non si puo concludere nulla.

4.2 La condizione sulla matrice Hessiana orlata

C’e un secondo tipo di condizione sufficiente, che si fonda sulla costruzione della cosiddetta matrice Hessiana orlata.Si definisce matrice Hessiana orlata (della funzione Lagrangiana) la matrice

0 Jg

JgT ∇2xxL

=

0 . . . 0 ∂g1

∂x1

. . . ∂g1

∂xn

.... . .

......

. . ....

0 . . . 0 ∂gm

∂x1

. . . ∂gm

∂xn

∂g1

∂x1

. . . ∂gm

∂x1

L′′11 . . . L′′

1n

.... . .

......

. . ....

∂g1

∂xm. . . ∂gm

∂xnL′′

n1 . . . L′′nn

.

Qui per non appesantire le notazioni non ho indicato gli argomenti, ma va detto che la matrice va calcolata nelpunto stazionario, cioe in (x, λ). Si puo provare che, nelle stesse ipotesi di prima, se (x, λ) e un punto stazionario perla funzione Lagrangiana,

(a) se gli ultimi n−m minori di NO della matrice Hessiana orlata sono di segno alterno a partire da (−1)m+1, allorax e punto di massimo locale vincolato di f ;

(b) se gli ultimi n−m minori di NO della matrice Hessiana orlata hanno lo stesso segno di (−1)m, allora x e puntodi minimo locale vincolato di f .

Osservazione Le regole sulla matrice Hessiana orlata come si vede sono piuttosto elaborate. Si puo osservare chenel caso di un problema in R

2 (n = 2) con un vincolo (m = 1) la matrice e

0 g′1 g′2g′1 L′′

11 L′′12

g′2 L′′21 L′′

22

e le complicate regole sui minori di NO si riducono a queste semplici regole (si ha n − m = 1):

(a) se l’ultimo minore di NO (cioe il determinante) e positivo, allora il punto e di massimo locale vincolato;

(b) se l’ultimo minore di NO (cioe il determinante) e negativo, allora il punto e di minimo locale vincolato.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 15

Lo studente provi a scrivere le regole sui minori nel caso di un problema in R3 (n = 3) con un vincolo (m = 1) e nel

caso di un problema in R3 con due vincoli.

Ora concludo la dispensa con qualche esempio (alcuni sono problemi gia affrontati in precedenza col metodo dellecurve di livello, oppure costruendo la restrizione, oppure limitatamente alle condizioni necessarie.

Esempio (vedi anche in precedenza)

max / min f(x, y) = x + y con vincolo x + y2 = 1.

Avevammo trovato

L(x, y, λ) = x + y − λ(x + y2 − 1) ; ∇L(x, y, λ) =(

1 − λ, 1 − 2λy,−x − y2 + 1)

.

Unico punto stazionario vincolato (3

4, 1

2) con λ = 1. Si ha14

∇2xyL =

(

0 0

0 −2λ

)

e ∇g = (1, 2y) e quindi ∇2xyL(x, λ) =

(

0 0

0 −2

)

e ∇g(x) = (1, 1).

Calcoliamo il sottospazio tangente al vincolo:

(

1 1)

(

h1

h2

)

= 0 cioe h1 + h2 = 0 cioe h2 = −h1.

Il sottospazio tangente al vincolo e quindi formato dai vettori del tipo (h1,−h1), con h1 ∈ R. Quindi il gradientesecondo della Lagrangiana sul sottospazio tangente al vincolo si trova con

(

h1 −h1

)

(

0 0

0 −2

) (

h1

−h1

)

= −2h21.

Questa forma quadratica (funzione solo di h1) e definita negativa e quindi il punto e di massimo locale vincolato.15

Utilizzando invece la matrice Hessiana orlata, si costruisce la matrice

0 1 1

1 0 0

1 0 −2

il cui determinante e 2.

Allora, per le regole viste prima, questo conferma che il punto e di massimo locale vincolato.

Esempio (vedi anche in precedenza)

max / min f(x, y) = x2 + y2 con vincolo x + y = 1.

Avevamo trovato

L(x, y, λ) = x2 + y2 − λ(x + y − 1) ; ∇L(x, y, λ) =(

2x − λ, 2y − λ,−x − y + 1)

.

Unico punto stazionario vincolato (1

2, 1

2) con λ = 1. Si ha

∇2xyL =

(

2 0

0 2

)

e ∇g = (1, 1).

Qui non serve nemmeno trovare il sottospazio tangente al vincolo, dato che la forma del gradiente secondo e definitapositiva in tutto R

2 (e quindi definita positiva anche sul sottospazio). Pertanto il punto e di minimo locale vincolato.Utilizzando la matrice Hessiana orlata,

0 1 1

1 2 0

1 0 2

il cui determinante e −4,

14Nel seguito scrivero ∇2xy

L oppure ∇2xyz

L per indicare il gradiente secondo parziale rispetto alle variabili effettive. La notazione esemplificata rispetto a quella che dovrebbe essere dato che, trattandosi di una derivazione seconda, le variabili andrebbero ripetute. Infattinella notazione generale usata in precedenza scrivevo ∇2

xxL, dove x era il vettore delle variabili.

15Si noti che la forma in R2 e semidefinita negativa, mentre risulta definita negativa sul sottospazio tangente al vincolo.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 16

e confermato che il punto e di minimo locale vincolato.

Esempiomax / min f(x, y) = x2 + y2 con vincolo x + y2 = 1.

Si haL(x, y, λ) = x2 + y2 − λ(x + y2 − 1) ; ∇L(x, y, λ) =

(

2x − λ, 2y − 2λy,−x − y2 + 1)

.

Ponendo il gradiente uguale al vettore nullo e risolvendo il sistema corrispondente si trova (si provi per esercizio) checi sono tre punti stazionari vincolati:

(1, 0) con λ = 2

(1

2, 1√

2) con λ = 1

e (1

2,− 1√

2) con λ = 1.

Si ha

∇2xyL =

(

2 0

0 2 − 2λ

)

e ∇g = (1, 2y)

(i) Studiamo il punto (1, 0).

∇2xyL(x, λ) =

(

2 0

0 −2

)

e ∇g(x) = (1, 0).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (0, h2), con h2 ∈ R. Quindi il gradiente secondodella Lagrangiana sul sottospazio tangente al vincolo e

(

0 h2

)

(

2 0

0 −2

) (

0

h2

)

= −2h22.

La forma e definita negativa e quindi il punto e di massimo locale vincolato.16

(ii) Studiamo il punto (1

2, 1√

2).

∇2xyL(x, λ) =

(

2 0

0 0

)

e ∇g(x) = (1,√

2).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (−√

2h2, h2), con h2 ∈ R. Quindi il gradientesecondo della Lagrangiana sul sottospazio tangente al vincolo e

(

−√

2h2 h2

)

(

2 0

0 0

) (

−√

2h2

h2

)

= 4h22.

La forma e definita positiva sul sottospazio e quindi il punto e di minimo locale vincolato.

(iii) Studiamo il punto (1

2,− 1√

2).

∇2xyL(x, λ) =

(

2 0

0 0

)

e ∇g(x) = (1,−√

2).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (√

2h2, h2), con h2 ∈ R. Quindi il gradientesecondo della Lagrangiana sul sottospazio tangente al vincolo e

( √2h2 h2

)

(

2 0

0 0

) (√

2h2

h2

)

= 4h22

e quindi anche questo punto e di minimo locale vincolato.

16Qui la forma e indefinita in tutto R2, ma definita negativa sul sottospazio tangente al vincolo.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 17

E interessante risolvere il problema appena visto con le curve di livello. Lo studente provi a farlo.

Esempio (vedi anche in precedenza)

max / min f(x, y) = xy con vincolo x2 + y2 = 2.

Abbiamo trovato

L(x, y, λ) = xy − λ(x2 + y2 − 2) ; ∇L(x, y, λ) =(

y − 2λx, x − 2λy,−x2 − y2 + 2)

.

Vi sono quattro punti stazionari vincolati:

(1, 1) e (−1,−1) con λ = 1

2

e (1,−1) e (−1, 1) con λ = − 1

2.

Studiamo ad esempio il primo punto.

∇2xyL =

(

−2λ 1

1 −2λ

)

e ∇g = (2x, 2y) e quindi ∇2xyL(x, λ) =

(

−1 1

1 −1

)

e ∇g(x) = (2, 2).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (h1,−h1), con h1 ∈ R. Quindi il gradiente secondodella Lagrangiana sul sottospazio tangente al vincolo e

(

h1 −h1

)

(

−1 1

1 −1

) (

h1

−h1

)

= −h21 + 2h1(−h1) − h2

1 = −4h21.

La forma sul sottospazio e definita negativa e quindi si tratta di un punto di massimo locale vincolato. Lo studenteprovi a studiare gli altri punti trovati (con λ = 1

2sono di massimo, con λ = − 1

2sono di minimo).

Esempiomax / min f(x, y) = y − x2 con vincolo 2x2 − y = 0.

Dopo aver osservato che il vincolo e regolare, si ha

L(x, y, λ) = y − x2 − λ(2x2 − y) ; ∇L(x, y, λ) =(

− 2x − 4λx, 1 + λ,−2x2 + y)

.

Ponendo il gradiente uguale al vettore nullo si trova facilmente che c’e l’unico punto stazionario vincolato (0, 0) conλ = −1.

Il gradiente secondo parziale della Lagrangiana e

∇2xyL =

(

−2 − 4λ 0

0 0

)

e ∇g = (4x,−1) e quindi ∇2xyL(x, λ) =

(

2 0

0 0

)

e ∇g(x) = (0,−1).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (h1, 0), con h1 ∈ R. Quindi il gradiente secondo dellaLagrangiana sul sottospazio tangente al vincolo e

(

h1 0)

(

2 0

0 0

) (

h1

0

)

= 2h21.

Forma quadratica definita positiva e quindi si tratta quindi di un punto di minimo locale vincolato.

Esempio

max / min f(x, y) = y − 1

4x4 con vincolo

1

3x3 − y = 0.

Dopo aver osservato che il vincolo e regolare, si ha

L(x, y, λ) = y − 1

4x4 − λ(1

3x3 − y) ; ∇L(x, y, λ) =

(

− x3 − λx2, 1 + λ,− 1

3x3 + y

)

.

Ponendo il gradiente uguale al vettore nullo si trova facilmente che ci sono due punti stazionari vincolati: (0, 0) e(1, 1

3), entrambi con λ = −1.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 18

Il gradiente secondo parziale della Lagrangiana e

∇2xyL =

(

−3x2 − 2λx 0

0 0

)

e ∇g = (x2,−1).

Ora, volendo studiare il primo punto (l’origine), si vede subito che la forma e semidefinita e questo non consente diconcludere sulla natura dell’origine. Nell’altro punto invece non ci sono questi problemi dato che

∇2xyL(x, λ) =

(

−1 0

0 0

)

e ∇g(x) = (1,−1).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (h1, h1), con h1 ∈ R. Quindi il gradiente secondo dellaLagrangiana sul sottospazio tangente al vincolo e

(

h1 h1

)

(

−1 0

0 0

) (

h1

h1

)

= −h21.

Si tratta quindi di un punto di massimo locale vincolato.Per quanto riguarda l’origine la conclusione puo essere trovata facilmente esplicitando y dal vincolo e costruendo

la restrizione di f sul vincolo stesso (o anche con le curve di livello, ma le cose non sono immediate).

Esempio (vedi anche in precedenza) Consideriamo il problema

max / min f(x, y) = x2 − y2 con vincolo x2 − y = 0.

Abbiamo trovato

L(x, y, λ) = x2 − y2 − λ(x2 − y) ; ∇L(x, y, λ) =(

2x − 2λx,−2y + λ,−x2 + y)

.

Si hanno i tre punti stazionari vincolati:

(0, 0) con λ = 0

e ( 1√2, 1

2) e (− 1√

2, 1

2) con λ = 1.

Il gradiente secondo parziale della Lagrangiana e

∇2xyL =

(

2 − 2λ 0

0 −2

)

e ∇g = (2x,−1).

Studiamo i tre punti.

(i) Con il punto (0, 0) abbiamo

∇2xyL(x, λ) =

(

2 0

0 −2

)

e ∇g(x) = (0,−1).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (h1, 0), con h1 ∈ R. Quindi il gradiente secondodella Lagrangiana sul sottospazio tangente al vincolo e

(

h1 0)

(

2 0

0 −2

) (

h1

0

)

= 2h21.

Si tratta quindi di un punto di minimo locale vincolato.

(ii) Con il punto ( 1√2, 1

2) abbiamo

∇2xyL(x, λ) =

(

0 0

0 −2

)

e ∇g(x) = (√

2,−1).

Il sottospazio tangente al vincolo e formato dai vettori del tipo (h1,√

2h1), con h1 ∈ R. Quindi il gradientesecondo della Lagrangiana sul sottospazio tangente al vincolo e

(

h1

√2h1

)

(

0 0

0 −2

) (

h1√2h1

)

= −4h21.

Si tratta quindi di un punto di massimo locale vincolato.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 19

(iii) Il terzo punto e analogo al secondo, cioe e ancora un punto di massimo locale vincolato.

Esempio (vedi anche in precedenza)

max / min f(x, y, z) = x + y + z con vincolo x2 + y2 + z2 = 3.

Abbiamo trovato

L(x, y, z, λ) = x + y + z − λ(x2 + y2 + z2 − 3) ; ∇L(x, y, z, λ) =(

1 − 2λx, 1 − 2λy, 1 − 2λz,−x2 − y2 − z2 + 3)

.

Si hanno i due punti stazionari vincolati:

(1, 1, 1) con λ = 1

2

e (−1,−1,−1) con λ = − 1

2.

Il gradiente secondo parziale della Lagrangiana e

∇2xyzL =

−2λ 0 0

0 −2λ 0

0 0 −2λ

e ∇g = (2x, 2y, 2z).

Qui possiamo subito osservare che con λ = 1

2il gradiente secondo e definito negativo in tutto R

3 e quindi tale anchenel sottospazio tangente al vincolo: quindi il primo punto e di massimo locale vincolato.

Invece con λ = − 1

2il gradiente secondo e definito positivo in tutto R

3 e quindi il secondo punto e di minimo localevincolato.

Esempio (vedi anche in precedenza)

max / min f(x, y, z) = x + y + z con vincolo xyz = 1.

Abbiamo trovato

L(x, y, z, λ) = x + y + z − λ(xyz − 1) ; ∇L(x, y, z, λ) =(

1 − λyz, 1 − λxz, 1 − λxy,−xyz + 1)

.

Si ha il solo punto stazionario vincolato (1, 1, 1) con λ = 1.Il gradiente secondo parziale della Lagrangiana e

∇2xyzL =

0 −λz −λy

−λz 0 −λx

−λy −λx 0

e ∇g = (yz, xz, xy)

e quindi

∇2xyzL(x, λ) =

0 −1 −1

−1 0 −1

−1 −1 0

e ∇g(x) = (1, 1, 1).

Troviamo il sottospazio tangente al vincolo. Esso e formato dai vettori (h1, h2, h3) tali che

(

1 1 1)

h1

h2

h3

= 0 cioe h1 + h2 + h3 = 0 cioe h3 = −h1 − h2.

Il sottospazio tangente al vincolo e formato quindi dai vettori del tipo (h1, h2,−h1 − h2), con h1, h2 ∈ R. Quindi ilgradiente secondo della Lagrangiana sul sottospazio tangente al vincolo e

(h1, h2,−h1 − h2)

0 −1 −1

−1 0 −1

−1 −1 0

h1

h2

−h1 − h2

= −2h1h2 − 2h1(−h1 −h2)− 2h2(−h1 − h2) = 2h21 + 2h1h2 + 2h2

2.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 20

Tale forma quadratica (funzione di h1 e h2) e definita positiva17 e quindi il punto (1, 1, 1) e un punto di minimo localevincolato.

Esempio (vedi anche in precedenza)

max / min f(x, y, z) = −x − y + 2z con vincoli

{

x2 + y2 = 10

y + z = 3.

Abbiamo trovatoL(x, y, z, λ) = −x − y + 2z − λ1(x

2 + y2 − 10) − λ2(y + z − 3)

e∇L(x, y, z, λ) =

(

− 1 − 2λ1x,−1 − 2λ1y − λ2, 2 − λ2,−x2 − y2 + 10,−y − z + 3)

.

Le condizioni del primo ordine portavano ai due punti stazionari vincolati

(−1,−3, 6) con λ1 = 1

2, λ2 = 2

e (1, 3, 0) con λ1 = − 1

2, λ2 = 2.

Il gradiente secondo parziale della Lagrangiana e la matrice Jacobiana dei vincoli sono

∇2xyzL =

−2λ1 0 0

0 −2λ1 0

0 0 0

e Jg =

(

2x 2y 0

0 1 1

)

.

Dobbiamo ora studiare le condizioni sufficienti sui due punti.

(i) Per quanto riguarda il primo punto, il sottospazio tangente ai vincoli e formato dai vettori (h1, h2, h3) tali che

(

−2 −6 0

0 1 1

)

h1

h2

h3

=

(

0

0

)

cioe

{

−2h1 − 6h2 = 0

h2 + h3 = 0cioe

{

h1 = −3h2

h3 = −h2.

Il sottospazio tangente al vincolo e formato quindi dai vettori del tipo (−3h2, h2,−h2), con h2 ∈ R. 18

Il gradiente secondo della Lagrangiana sul sottospazio tangente al vincolo e

(

−3h2 h2 −h2

)

−1 0 0

0 −1 0

0 0 0

−3h2

h2

−h2

= −9h22 − h2

2 = −10h22.

Tale forma quadratica (funzione solo h2) e definita negativa e quindi il punto (−1,−3, 6) e un punto di massimolocale vincolato.

(ii) Per quanto riguarda il secondo punto, il sottospazio tangente ai vincoli e formato dai vettori (h1, h2, h3) tali che

(

2 6 0

0 1 1

)

h1

h2

h3

=

(

0

0

)

cioe

{

2h1 + 6h2 = 0

h2 + h3 = 0cioe

{

h1 = −3h2

h3 = −h2.

Il sottospazio tangente al vincolo e formato quindi dai vettori del tipo (−3h2, h2,−h2), con h2 ∈ R. Il gradientesecondo della Lagrangiana sul sottospazio tangente al vincolo e

(

−3h2 h2 −h2

)

1 0 0

0 1 0

0 0 0

−3h2

h2

−h2

= 9h22 + h2

2 = 10h22.

Tale forma quadratica e definita positiva e quindi il punto (1, 3, 0) e un punto di minimo locale vincolato.

17Lo si trova immediatamente scrivendo la matrice della forma quadratica e trovando che i minori di NO sono positivi.18Non deve sorprendere che il sottospazio sia una retta: infatti i due vincoli definiscono due superfici, i sottospazi tangenti sono due piani

e l’intersezione dei due piani e una retta.

UNIVR – Facolta di Economia – Corso di Matematica finanziaria 2008/09 21

Esempio

max / min f(x, y, z) = −1

2x2 + y3 +

1

2z2 con vincolo z = 0.

Si trovaL(x, y, z, λ) = − 1

2x2 + y3 + 1

2z2 − λz ; ∇L(x, y, z, λ) =

(

− x, 3y2, z − λ,−z)

.

Le condizioni del primo ordine portano immediatamente all’unico punto stazionario vincolato (0, 0, 0) con λ = 0.Il gradiente secondo parziale della Lagrangiana e

∇2xyzL =

−1 0 0

0 6y 0

0 0 1

e quindi ∇2xyzL(x, λ) =

−1 0 0

0 0 0

0 0 1

e ∇g(x) = (0, 0, 1).

Il sottospazio tangente al vincolo e dato dai vettori ortogonali a (0, 0, 1), e cioe dai vettori della forma (h1, h2, 0), conh1, h2 ∈ R, e quindi il gradiente secondo della Lagrangiana sul sottospazio tangente al vincolo e

(

h1 h2 0)

−1 0 0

0 0 0

0 0 1

h1

h2

0

= −h21.

Attenzione qui. La forma quadratica e funzione di h1 e h2 e quindi e semidefinita negativa sul sottospazio. Pertantole condizione del secondo ordine in questo caso non consentono di concludere nulla sulla natura del punto stazionario.

La conclusione si puo pero trovare pensando che la restrizione di f al vincolo z = 0 e la funzione di due variabili− 1

2x2 + y3 e che questa ha certamente nell’origine un punto di sella, dato che ad esempio sui punti del tipo (0, t) con

t ∈ R si riduce alla t 7→ t3, e questa cambia di segno in un intorno dell’origine. Quindi per la funzione iniziale l’originenon e ne di massimo ne di minimo vincolato.19

19Si noti che, dopo aver scritto la restrizione di f al vincolo, cioe la funzione di due sole variabili − 1

2x2 + y3, usando le condizioni del

secondo ordine (gradiente secondo) non si riesce a concludere nulla sulla natura dell’origine, dato che la matrice risulta semidefinita.