Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

56
Complementi di matematica M. Cigola

description

1 Lo spazio vettoriale R. 11.1 Norma e distanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Confronti tra vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Topologia ordinaria in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Funzioni di più variabili reali 112.1 Limiti e continuità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.1 Successioni di vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.2 Limite per funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2 Massimi eminimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Calcolo differenziale 213.1 Funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213.1.1 Significato geometrico di derivate parziali, gradiente e differenziale primo. . . . 273.2 Funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 Funzioni concave e convesse 334.1 Proprietà delle funzioni concave (convesse) . . . . . . . . . . . . . . . . . . . . . . . . . 355 Ottimi liberi 396 Vincoli di uguaglianza 416.1 Analisi di sensibilità: il significato deimoltiplicatori di Lagrange . . . . . . . . . . . . 456.2 Moltiplicatori di Lagrange e prezzi ombra . . . . . . . . . . . . . . . . . . . . . . . . . 48

Transcript of Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

Page 1: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

Complementi di matematica

M. Cigola

Page 2: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

ii

Page 3: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

Indice

Indice iii

1 Lo spazio vettoriale R. 1

1.1 Norma e distanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Confronti tra vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Topologia ordinaria in R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Funzioni di più variabili reali 11

2.1 Limiti e continuità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.1.1 Successioni di vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.1.2 Limite per funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Calcolo differenziale 21

3.1 Funzioni scalari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.1.1 Significato geometrico di derivate parziali, gradiente e differenziale primo. . . . 27

3.2 Funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4 Funzioni concave e convesse 33

4.1 Proprietà delle funzioni concave (convesse) . . . . . . . . . . . . . . . . . . . . . . . . . 35

5 Ottimi liberi 39

6 Vincoli di uguaglianza 41

6.1 Analisi di sensibilità: il significato dei moltiplicatori di Lagrange . . . . . . . . . . . . 45

6.2 Moltiplicatori di Lagrange e prezzi ombra . . . . . . . . . . . . . . . . . . . . . . . . . 48

Bibliografia 51

Page 4: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

iv INDICE

Page 5: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

Prefazione

Queste pagine sono una possibile integrazione del testo adottato nel corso di matematica 1 e sono (in

parte) estratte dalla dispensa Ottimizzazione statica e teoria dell’utilità scritta in collaborazione conil prof. E. Castagnoli, pertanto alcuni argomenti sono stati ripetuti (rispetto al testo adottato) per

offrire continuità di lettura e introdurre una simbologia uniforme.

Alcuni concetti non sono in programma e ne mancano altri che sono nel programma.

Chi volesse usufruire di questa nota didattica deve quindi avere l’accortezza di controllare sempreil syllabus del corso e di affiancarla comunque allo studio del libro di testo.

Ringrazio sin d’ora chi volesse segnalarmi ogni svista ed errore.

Margherita Cigola

Page 6: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

1Lo spazio vettoriale R.

Spesso occorre considerare congiuntamente variabili reali, ovvero −uple, ordinatamente prese, dinumeri ∈ R con = 1 :

1 2

Esempio 1 (triste) Per verificare se una persona è in sovvrappeso o meno si usa calcolare il suoindice di massa corporea, basato su due quantità:

1 = altezza (in cm) e 2 = peso (in Kg)

A questi due dati si può aggiungerne un terzo che tiene conto (misericordiosamente) dell’età:

3 = età (in anni)

In tal modo la terna:

(1 2 3) = (165 51 22)

potrebbe rappresentare una persona normo-pesa (o in forma smagliante). Attenzione che la terna

(22 165 51)

sarebbe un disastro (e neppure credibile...).

L’insieme di tutte le -uple di numeri reali 1 2 convenzionalmente rappresentate comecolonne di numeri1

x =

⎡⎢⎢⎢⎣12...

⎤⎥⎥⎥⎦1Per convenzione tipografica, usiamo lettere in grassetto per denotare i vettori di dimensione 1 Dunque x indica

un vettore mentre indica uno scalare (dimensione = 1). Per indicare gli elementi di un vettore, useremo sempre lastessa lettera (non in grassetto) accompagnata da un indice che ne indica il posto d’ordine: 1 è il primo elemento di x,4 è il quarto di y, ecc..

Page 7: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2 1. Lo spazio vettoriale R.

è indicato con R, i suoi elementi sono detti vettori : ovvero x è un vettore di R. Un vettore puòanche essere scritto orizzontalmente, come una riga di numeri; in tal caso si parla di vettore trasposto

e si indica con xT ovvero

xT =£1 2 · · ·

¤In R si possono introdurre le due operazioni di addizione x+ y e di moltiplicazione per uno scalare

xTali operazioni sono definite per ogni scalare ∈ R e per ogni coppia xy ∈ R nel seguente modo

x+ y :=

⎡⎢⎢⎢⎣1 + 12 + 2...

+

⎤⎥⎥⎥⎦ e x :=

⎡⎢⎢⎢⎣12...

⎤⎥⎥⎥⎦ con ∈ R

Si dice che R é chiuso rispetto a esse nel senso che il risultato è ancora un vettore di R

xy ∈ R =⇒ x+ y ∈ Rx ∈ R ∈ R =⇒ x ∈ R

Per tali operazioni valgono alcune proprietà: si rimanda al testo.

Utilizzando le due operazioni di somma e moltiplicazione per uno scalare congiuntamente si otten-

gono le cosiddette combinazioni lineari, ovvero dati due vettori xy ∈ R e due scalari ∈ R, ilvettore z dato da:

z = x+ y

è una combinazione lineare di x e y con pesi o coefficienti e rispettivamente. Più in generale, dati vettori x1x2 x ∈ R ed altrettanti pesi 1 2 ∈ R, il vettore

z = 1x1 + 2x

2 + · · ·+ x =

X=1

x

è una combinazione lineare dei vettori x1x2 x. In particolare se tutti i pesi sono compresi tra0 e 1, la combinazione lineare si dice convessa

Esempio 2 (notevole) È chiamata base canonica di R la base formata dai cosiddetti vettori fonda-mentali (o versori degli assi) cioé dai vettori e ∈ R = 1 che hanno tutte componenti nullefuorché l’ -esima uguale a 1:

e1 =

⎡⎢⎢⎢⎣10...

0

⎤⎥⎥⎥⎦ e2 =⎡⎢⎢⎢⎣01...

0

⎤⎥⎥⎥⎦ e =

⎡⎢⎢⎢⎣00...

1

⎤⎥⎥⎥⎦Ogni vettore x ∈ R può essere scritto come combinazione lineare degli vettori fondamentali conpesi pari alle componenti = 1 di x stesso

x = 1e1 + 2e

2 + · · ·+ e =

X=1

e

Le operazioni appena descritte fanno sì che R sia uno spazio vettoriale. Inoltre è la sua dimen-sione: si può anche dire che x ∈ R è un vettore di dimensione . Se = 1 ci si sta riferendo al casoparticolare dei numeri reali ∈ R.Introduciamo una terza operazione

Page 8: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

1.1 Norma e distanza 3

Definizione 3 Dati due vettori xy ∈ R, il numero

(xy) :=X1

si chiama prodotto interno (o prodotto scalare) di x e y.

Il prodotto interno è dunque una funzione che associa a ogni coppia di vettori xy ∈ R il numeroreale (xy). Esso può essere indicato anche in altri modi, in particolare il modo che spesso useremo è:

xT · y = yT · xdove è (formalmente) importante che il vettore che premoltiplica sia un vettore riga (ovvero trasposto

di default).

Il prodotto interno gode di alcune proprietà

Proposizione 4 Per ogni xy z ∈ R e ogni scalare ∈ R il prodotto interno è:(a) Commutativo: (xy) = (yx)(b) Distributivo rispetto all’addizione tra vettori: (xy+ z) = (xy) + (x z)(c) Omogeneo (rispetto a entrambi i fattori): (xy) = (xy) = (xy)(d) Non negativo: (xx) = 0 e (xx) = 0⇐⇒ x = 0.

Il prodotto interno vìola la legge di annullamento del prodotto nel senso che può accadere (xy) = 0anche quando nessuno dei due vettori è nullo.

Esempio 5

x =

∙21

¸y =

∙15−3

¸=⇒ (xy) = 2 · 15 + 1 · (−3) = 3− 3 = 0

Definizione 6 Due vettori xy ∈ R si dicono ortogonali (tra loro) se(xy) = 0

Dato che è sempre (x0) = 0, il vettore nullo 0 ∈ R è ortogonale a ogni vettore x ∈ R.

1.1 Norma e distanza

Possiamo ora introdurre le prime nozioni “metriche” che consentiranno di arricchire la strumentazionedello spazio vettoriale R.

Definizione 7 Dato un vettore x ∈ R, il numero

kxk =vuut X

1

2 =p(xx)

è detto norma euclidea di x.

La norma è dunque una funzione che associa a ogni x ∈ R un numero reale. Essa gode di alcuneproprietà

Proposizione 8 Per ogni xy ∈ R e per ogni scalare ∈ R si ha(a) Non negatività: kxk = 0 e kxk = 0⇐⇒ x = 0(b) Omogeneità (positiva di grado 1): kxk = || kxk(c) Subadditiva (rispetto alla somma tra vettori): kx+ yk 5 kxk+ kyk.

Page 9: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

4 1. Lo spazio vettoriale R.

Uno spazio vettoriale dotato di norma è detto normato.

In R la norma la norma euclidea può essere interpretata geometricamente come la lunghezza delsegmento che congiunge l’origine con il punto x.In generale vale la seguente disuguaglianza (di Cauchy — Schwarz):

|(xy)| 5 kxk · kyk per ogni xy ∈

Essa vale come uguaglianza se e solo se x e y sono linearmente dipendenti (cioé uno dei due vettori èun multiplo dell’altro).

Osservazione 9 Per x 6= 0 e y 6= 0, si dice angolo formato da x e y, l’angolo , 0 5 5 , per ilquale

cos =(xy)

kxk · kykGeometricamente (in R2):

θ

x

y

Si osservi che se = 2, risulta senz’altro (xy) = 0: ciò giustifica il termine di vettori “ortogonali”sopra introdotto.

La norma euclidea ci consente di introdurre la nozione di distanza (euclidea).

Definizione 10 La distanza (euclidea) tra due vettori xy ∈ R è

(xy) := kx− yk =vuut X

1

( − )2

Dunque la distanza è una funzione che associa a ogni coppia di vettori xy ∈ R un numero reale.Anche la distanza gode di alcune proprietà:

Proposizione 11 Per ogni xy z ∈ R si ha:(a) Simmetria: (xy) = (yx).(b) Non negatività: (xy) = 0 e (xy) = 0⇐⇒ x = y.(c) Disuguaglianza triangolare: (xy) 5 (x z) + (zy).

Uno spazio vettoriale nel quale sia stata introdotta una distanza è detto spazio metrico.

Osservazione 12 Quando = 1, le nozioni di norma e quindi di distanza assumono una conno-tazione “speciale”:

∈ R =⇒ kk =√2 = || cioé il valore assoluto di

∈ R =⇒ ( ) = k− k =q(− )

2= |− | cioé il valore assoluto di −

Page 10: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

1.2 Confronti tra vettori 5

Graficamente, la distanza tra due vettori può essere interpretata come la lunghezza del segmentocongiungente i due punti che corrispondono ai vettori assegnati:

x y

d(x,y) = |x - y| = y - x

n = 1 x

y

n =2 x2

y2

x1 y1

n = 3 x

y

1.2 Confronti tra vettori

Come per R, anche in R vi è un ordine “naturale”: il cosiddetto ordinamento componente percomponente. Precisamente si dice che, per due vettori xy ∈ R:1. x è maggiore di y se = 1 e si scrive x y;

2. x è maggiore o uguale a y se = = 1 e si scrive x = y;

3. x è debolmente maggiore di y se = = 1 ma x 6= y (ogni componente di x è =della componente omonima di y, ma almeno una ne è strettamente maggiore) e si scrive x ≥ y.

In particolare se

• x 0 si dice che x è positivo;

• x = 0 si dice che x è non negativo;• x ≥ 0 si dice che x è semipositivo (o debolmente positivo).Può succedere comunque che tra x e y non valga nessuna delle precedenti relazioni: si dice allora che

x non è confrontabile con y: indicheremo questo caso con x / y. Ciò comporta che in R l’ordinamentonaturale (componente per componente) sia parziale, nel senso che non è sempre possibile confrontaredue vettori2.

Per esempio, per:

x =

∙12

¸y =

∙01

¸z =

∙21

¸si può senz’altro affermare che x y e che z ≥ y ma x e z non sono confrontabili.

2R è un insieme completamente ordinato. Tra due numeri reali risulta sempre oppure = oppure .

Page 11: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6 1. Lo spazio vettoriale R.

1.3 Topologia ordinaria in R

Occupiamoci ora dello spazio vettoriale R, normato e dotato di metrica (euclidea), anche se quantodiremo può essere esteso facilmente a generici spazi metrici.

Cominciamo con la

Definizione 13 Si dice intorno di raggio 0 di un punto x0 ∈ R l’insieme ¡x0¢dei punti che

distano da x0 meno di :¡x0¢:=©x ∈ R : ¡xx0¢

ªGraficamente

x°-ε

n = 1 n =2

n = 3

• x°+ε

x° • x°ε

• x° ε

La definizione di intorno consente di dare le fondamentali nozioni di insieme aperto, chiuso ecompatto in R.

Definizione 14 Sia ⊆ R. Un punto x0 ∈ R si dice:

1. interno ad se esiste (almeno) un suo intorno tutto contenuto in ;

2. esterno ad se esiste (almeno) un suo intorno che non ha punti in comune con ;

3. di frontiera per se non è né interno né esterno, cioè se ogni suo intorno contiene almeno un

pumto di e almeno un punto di c;

4. di accumulazione per se ogni suo intorno contiene (almeno) un altro punto x 6= x0 ∈ 3 ;

5. isolato di se x0 ∈ ed esiste un suo intorno che non contiene nessun altro punto di (oltre

x0).

Esempio 15 Per l’insieme := [3 10) ∪ {15} ⊂ R

• 5 è interno ad A ed è anche di accumulazione per ;

3 Si osservi che, in tal caso, ogni suo intorno contiene necessariamente infiniti punti di .

Page 12: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

1.3 Topologia ordinaria in R 7

• 3 10 e 15 sono punti di frontiera per ; 3 e 10 sono anche di accumulazione per ;• 0 è punto esterno ad ;

• 15 è punto isolato di .

Esempio 16 Per l’insieme ⊂ R2 rappresentato da

• x

• y

• z

• tutti i punti x nella zona grigia, bordo tratteggiato escluso, sono punti interni a ;

• tutti i punti y appartenenti al bordo tratteggiato sono di frontiera per e non appartengono a

;

• tutti i punti z appartenenti alla “coda” di sono punti di frontiera e appartengono a ;

• tutti i punti appartenenti a sono di accumulazione.

Ovviamente:

(a) Ogni punto interno a un insieme, a maggior ragione, è di accumulazione.

(b) Se un punto è esterno a un insieme, non può essere né di frontiera né di accumulazione.

(c) I punti isolati e interni appartengono necessariamente all’insieme. La caratteristica di essere puntodi frontiera o di accumulazione non implica invece l’appartenenza all’insieme; quella di puntoesterno invece la esclude.

Definizione 17 Per un insieme ⊆ R si chiama

1. interno di l’insieme ◦ costituito da tutti i punti interni a ;

2. frontiera di l’insieme di tutti i punti di frontiera per ;

3. derivato di l’insieme 0 di tutti i punti di accumulazione per ;

4. chiusura di l’insieme := ∪ ◦ ovvero costituito da tutti i punti interni e di frontiera.Risulta anche := ∪0 e := ∪.

Esempio 18 Per l’insieme := [3 10) ∪ {15} ⊂ R

• ◦ = (3 10);

• = {3 10 15};• 0 = [3 10];

Page 13: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

8 1. Lo spazio vettoriale R.

• = [3 10] ∪ {15}.

Definizione 19 Un insieme ⊆ R si dice

1. aperto se ogni punto x ∈ è interno ad . Ovvero se coincide con il suo interno: ≡ ◦;

2. chiuso se contiene tutti i suoi punti di frontiera. Ovvero se coincide con la sua chiusura:

L’insieme vuoto∅ e tutto R sono gli unici insiemi contemporaneamente aperti e chiusi. Ovviamenteesistono anche insiemi che non sono né aperti né chiusi: entrambi gli insiemi ⊂ R e ⊂ R2considerati nei due esempi 15 e 16, non sono né aperti né chiusi.

Una diretta conseguenza della definizione 19 è che

1. l’interno ◦ è il più grande insieme aperto contenuto in ;

2. la chiusura è il più piccolo insieme chiuso che contiene .

Ci si convince facilmente che

è aperto ⇐⇒ è chiuso

Un’importante proprietà degli insiemi aperti e chiusi è contenuta nel

Teorema 20 L’unione di aperti è sempre un insieme aperto. L’intersezione di un numero finito diaperti è aperta, ovvero, data una collezione (anche infinita) A di insiemi aperti, sono aperti i due

insiemi: [∈A

e

\=1

finito

L’intersezione di chiusi è sempre un insieme chiuso. L’unione di un numero finito di chiusi è uninsieme chiuso, ovvero data una collezione (anche infinita) C di chiusi, gli insiemi

\∈C

e

[=1

finito

sono chiusi.

In generale, le proprietà elencate nel Teorema 20 sono assunte addirittura come definizioni di insiemeaperto e chiuso in spazi arbitrari.

Con le nozioni di insieme aperto e di insieme chiuso si possono introdurre ora le seguenti

Definizione 21 Un insieme ⊆ R si dice:

1. limitato se esiste un numero reale 0 tale che kxk 5 per ogni x ∈ ;

2. compatto se è chiuso e limitato.

Avvertiamo che, in generale, il concetto di compattezza è molto più profondo: in R esso si riducealle proprietà di chiusura e limitatezza, ma in generale è ben diverso.

Vediamo ora una proprietà che può avere un sottoinsieme di R. Esse ci serviranno per poterparlare in seguito di funzioni concave (convesse).

Definizione 22 Un insieme ⊆ R è detto convesso se, per ogni coppia di punti xy ∈ , accadeche

x+ (1− )y ∈ ∀ ∈ [0 1]

Page 14: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

1.3 Topologia ordinaria in R 9

Il significato di convessità è basato sulla nozione di combinazione lineare convessa

x+ (1− )y ∈ [0 1]

che, al variare di e quindi di = 1− in [0 1], rappresenta geometricamente ogni punto appartenenteal segmento di retta che congiunge x con y. Dunque un insieme è convesso se contiene tutto il segmentodi retta congiungente ogni coppia di suoi punti

x

y

x y x

y

Insiemi convessi in R2

x y

x

y x

y

Insiemi non convessi in R2

Osservazione 23 • La chiusura, l’interno e il derivato di un insieme convesso sono convessi;non è vero il viceversa.

• L’intersezione tra due insiemi convessi è convessa.• In R gli unici insiemi convessi sono gli intervalli.

Page 15: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

10 1. Lo spazio vettoriale R.

Page 16: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2Funzioni di più variabili reali

Ci occuperemo qui di funzioni, ovvero di relazioni che associano a ogni elemento di un prefissatoinsieme uno e un solo elemento di un insieme .Seguendo una terminologia ormai ampiamente consolidata:

• se ⊆ R e ⊆ R si parla di funzioni scalari di scalare (funzioni reali di una variabile reale);• se ⊆ R e ⊆ R si parla di funzioni scalari di vettore (funzioni reali di variabili reali);• se ⊆ R e ⊆ R si parla di funzioni vettoriali di scalare;

• se ⊆ R e ⊆ R si parla di funzioni vettoriali di vettore.

Detta f (o se = 1) una funzione, scriveremo f : ⊆ R → R.È chiaro che il quarto caso è il più generale e contiene tutti i precedenti. Non tratteremo il primo,

già noto, e parleremo prevalentemente del secondo perché è il più comune nelle applicazioni.

In ogni modo l’insieme è chiamato dominio della funzione, mentre = R è detto codominio ospazio di arrivo della funzione.L’insieme di tutte le immagini di una funzione con dominio è indicato con f () (o () se = 1)

ed è chiamato insieme immagine.Spesso il dominio non è preassegnato: si dà per scontato di voler applicare la funzione al più

esteso sottoinsieme di R possibile. In tal caso si parla di dominio naturale della funzione.Vediamo qualche esempio di funzioni scalari di vettore (di variabili).

Esempio 24 La funzione

(1 2) = 321 + 22

non pone problemi visto che è possibile effettuare le operazioni da essa richieste per qualunque scelta

di 1 e 2 in R. Il dominio naturale è dunque tutto R2 e possiamo etichettarla come : R2 → R.L’insieme immagine è invece dato da tutti i numeri reali non negativi, ovvero

¡R2¢ ≡ R+.

Invece la funzione

(1 2 3) = ln¡21 + 22 + 23

¢= ln

³kxk2

´non può essere applicata ad argomenti negativi o nulli del logaritmo, quindi all’origine 0 ∈ R3. Il suodominio naturale è allora l’insieme

= R3\ {0}

Page 17: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

12 2. Funzioni di più variabili reali

Risulta inoltre () ≡ R.Per le funzioni vettoriali di vettore f : ⊆ R → R è sufficiente tenere presente che esse non sono

altro che un modo breve per scrivere vettori di funzioni scalari:

f (x) =

⎡⎢⎢⎢⎣1 (x)2 (x)...

(x)

⎤⎥⎥⎥⎦ =⎡⎢⎢⎢⎣

1 (1 )2 (1 )

...

(1 )

⎤⎥⎥⎥⎦Per individuare il loro dominio naturale basta individuare i domini naturali delle singole componenti

: ⊆ R → R = 1 2 : il dominio naturale della funzione vettoriale f è dunque la lorointersezione

=\=1

Esempio 25 Sia

f (x) =

⎡⎣ ln (1 − 2)

√1 + 22

⎤⎦Per la prima componente risulta

1 =©x ∈ R2 : 2 1

ªmentre per la seconda

2 =©x ∈ R2 : 2 = −0 51

ªQuindi

= 1 ∩2 =©x ∈ R2 : 1 2 = −0 51

ªGraficamente il dominio di f è la parte del piano cartesiano sotto la retta di equazione 2 = 1(rettaesclusa) e sopra la retta 2 = −0 51 (retta inclusa) con 1 0

Definizione 26 Per una f : ⊆ R → R si chiama grafico l’insieme

f = {(xy) : x ∈ y = f (x)}

Quindi, in generale, f ⊂ R ×R.Nel caso scalare con = 2, esso è una superficie in R3. Per esempio il grafico di

= 2 + 2

è:

Page 18: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2. Funzioni di più variabili reali 13

A ogni : ⊆ R2 → R corrisponde una superficie, ma il contrario non è vero. La superficie sferica diraggio 3 e centro nell’origine:

non rappresenta una funzione in quanto a infinite1 coppie ( ) corrispondono due distinti valori di.Nel caso = 2 e = 1 esso è una curva in R3:

y xz

È chiaro che la rappresentazione grafica è fattibile soltanto quando + 5 3.Per le funzioni : ⊆ R2 → R la rappresentazione grafica, anche quando sia possibile, non è

sempre agevole e quindi, eccezion fatta per casi davvero semplici, si ricorre sovente alla cosiddetta

rappresentazione attraverso le curve di livello.

Definizione 27 Per una : ⊆ R2 → R, si chiama curva di livello l’insieme

() =©( ) ∈ ⊆ R2 : ( ) =

ªPer esempio, la funzione ( ) = 2+2, prima rappresentata in R3, ha curve di livello d’equazione

2 + 2 =

che, per = 0, sono rappresentate nel piano ( ) da circonferenze con centro nell’origine e raggio√

1Ne basterebbe una.

Page 19: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

14 2. Funzioni di più variabili reali

-4 -2 2 4

-4

-2

2

4

x

y

Esempio 28 La funzione ( ) = 2 + 42 − 2 ha curve di livello ellittiche

-2 2

-2

2

x

y

Come vedremo oltre, si chiamano insiemi di soprallivello (sottollivello) gli insiemi nei quali è = (5 ).

2.1 Limiti e continuità

La definizione di limite è sostanzialmente la stessa che si ha per le funzioni di una variabile. Per“ricalcarla” occorre prima introdurre la nozione di limite per una successione di vettori.

2.1.1 Successioni di vettori

Così come una successione numerica {} in R è una funzione che associa a ogni numero naturale (escluso al più un numero finito di naturali) un numero reale = () in modo tale di ottenere unelenco “senza fine” di numeri:

0 1

una successione di vettori©xªin R è un elenco “senza fine” di vettori con componenti reali

ciascuno:

x0x1 x

Ovvero una successione di vettori in R è una funzione che associa a ogni numero naturale (esclusoal più un numero finito di naturali) il vettore:

x =

⎡⎢⎢⎢⎣12...

⎤⎥⎥⎥⎦ ∈ R

Page 20: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2.1 Limiti e continuità 15

Esempio 29 La successione

x =

∙1

(1 + 1)

¸è una successione in R2, definita per ogni = 1. La successione:

y =

⎡⎣ 1 ( − 3)2

10−

⎤⎦è una successione in R3, definita per ogni 6= 3.Più semplicemente si potrebbe dire che una successione di vettori è ... un vettore di successioni: si

considerano successioni numeriche ordinatamente raccolte in un vettore di componenti.Anche per le successioni vettoriali siamo interessati a determinarne il comportamento per → +∞.

In particolare siamo interessati al caso di successioni convergenti. La cosa è meno complicata di quello

che potrebbe sembrare in quanto basta calcolare il limite di ogni componente del vettore:

lim→+∞

x =

⎡⎢⎢⎢⎣lim→+∞ 1lim→+∞ 2

...

lim→+∞

⎤⎥⎥⎥⎦Esempio 30 Si consideri il precedente esempio. Si ha:

lim→+∞

x = lim→+∞

∙1

(1 + 1)

¸=

∙lim→+∞ 1

lim→+∞ (1 + 1)

¸=

∙0e

¸e

lim→+∞

y = lim→+∞

⎡⎣ 1 ( − 3)2

10−

⎤⎦ =⎡⎣ lim→+∞ 1 ( − 3)

lim→+∞ 2lim→+∞ 10−

⎤⎦ =⎡⎣ 020

⎤⎦Più formalmente possiamo dare la seguente

Definizione 31 Si dice che la successione©xª ⊂ R converge al vettore a = £ 1 2 · · ·

¤T ∈R se

lim→+∞

= = 1 2

e si scrive

lim→+∞

x = a oppure x → a

2.1.2 Limite per funzioni scalari

Siamo ora pronti a fornire la nozione di limite per una funzione : ⊆ R → R. Siamo interessatiprincipalmente al comportamento di nelle vicinanze di un punto x∗ (con componenti finite): nonesamineremo (esplicitamente) il caso in cui una o più variabili indipendenti divergano a ±∞.

Definizione 32 Siano : ⊆ R → R e x∗ ∈ R un punto di accumulazione per . Si dice che tende a (eventualmente +∞ o −∞) per x che tende a x∗ ∈ 0 e si scrive

limx→x∗ (x) =

oppure

(x)→ per x→ x∗

Page 21: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

16 2. Funzioni di più variabili reali

se per ogni successione di vettori©xªcontenuta nel dominio e convergente a x∗, con x 6= x∗ per

ogni , la successione delle immagini©¡x¢ªtende a

¡x¢→ per ogni successione

©xª ⊂ con x → x∗x 6= x

Intuitivamente, ciò significa che, in qualunque modo x si avvicini a x∗, (x) si avvicina sempre a.

Osservazione 33 Non è necessario che x∗ ∈ per considerare il limite di per x→ x∗: l’unicarichiesta è che x∗ sia di accumulazione per in quanto occorre avvicinarsi quanto si vuole a x∗ senzauscire dal dominio .

Osservazione 34 La richiesta x 6= x∗ serve in quanto il limite controlla il comportamento dellafunzione in prossimità di x∗ e non esattamente nel punto x∗. Sarebbe dunque sufficiente richiedereche x 6= x∗ almeno definitivamente, ovvero per ogni 0.

Purtroppo il calcolo dei limiti per funzioni di variabili non è affatto banale nemmeno per = 2.Il problema nasce dalle possibili modalità di avvicinamento a un vettore x∗: esse coinvolgono non solole (infinite) direzioni “rettilinee” ma anche tutti i possibili percorsi “curvilinei” e altri ben più esotici.

• x

Per essere sicuri dell’esistenza (e del valore) di un limite, dovremmo controllare tutte le possibili

traettorie di avvicinamento per x→ x∗ verificando che per ciascuna di esse sia sempre (x)→ .

Esempio 35 Si consideri il limite

lim()→(00)

+

Se ci avviciniamo all’origine lungo rette d’equazione = , abbiamo un valore che dipende dalcoefficiente

lim→0

+=

1

1 +

Il limite dunque non esiste.

Esempio 36 Per il limite

lim()→(00)

2

se scegliamo gli avvicinamenti del tipo = 6= 0 otteniamo sempre:

lim→0

2

= lim

→0

= 0

Se invece scegliamo gli avvicinamenti del tipo = 2 6= 0 otteniamo un valore dipendente da

lim→0

2

2= lim

→01

=1

Di conseguenza il limite considerato non esiste.

Page 22: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2.2 Massimi e minimi 17

Dato che si dimostra abbastanza facilmente che un limite per una funzione vettoriale si ottiene

componente per componente:

limx→x∗ f (x) = lim

x→x∗

⎡⎢⎢⎢⎣1 (x)2 (x)...

(x)

⎤⎥⎥⎥⎦ =⎡⎢⎢⎢⎢⎣

limx→x∗ 1 (x)

limx→x∗ 2 (x)

...

limx→x∗ (x)

⎤⎥⎥⎥⎥⎦quanto esposto è sufficiente per trattare anche il caso vettoriale.

Possiamo ora dare la nozione di continuità.

Nei punti isolati del suo dominio una funzione è, per convezione, continua. Negli altri punti, non

isolati (ovvero di accumulazione), del suo dominio si ha

Definizione 37 Una funzione : ⊆ R → R si dice continua in un punto x0 ∈ ∩0 selimx→x0

(x) = f¡x0¢

Una funzione continua in ogni punto x0 ∈ , è detta continua su e si scrive ∈ 0 (), avendoindicato 0 () la classe delle funzioni continue2 su .

Come nel caso unidimensionale, le funzioni scalari “più semplici” risultano essere sempre continuenel loro dominio naturale e anche quelle che si ottengono per somma, prodotto, composizione, ecc. (con

le dovute avvertenze sul possibile cambiamento che tali operazioni comportano sul dominio naturale).

Per le funzioni vettoriali vale un analogo ragionamento componente per componente: infatti esse sono

continue in punto se e solo se lo sono tutte le componenti.

Esempi notevoli di funzioni scalari ∈ 0 (R), cioé definite e continue su tutto R, sono:

• Lineari: (x) = cTx =P=1

• Lineari affini: (x) = cTx+ =P

=1 +

• Quadratiche: (x) = P=1

P=1 . In particolare, per = 2, una funzione quadratica

assume la forma

(1 2) = 21 + 22 + 12 (2.1)

che si può anche scrivere, come vedremo in seguito, come prodotto vettore riga-matrice-vettore

colonna

(1 2) =£1 2

¤ ∙ 22

¸ ∙12

¸=

= xTx

avendo battezzato con la lettera la tabella 2×2 (detta matrice) che raccoglie i coefficienti e .

2.2 Massimi e minimi

Per le funzioni di variabili si possono reintrodurre, senza sostanziali modificazioni rispetto al casodi funzioni reali di una variabile reale, le nozioni di (punto di) massimo e minimo.

2 In realtà la “vera” definizione di continuità non richiederebbe il calcolo di limiti. In generale infatti, una fun-zione si dice continua se la controimmagine −1 () di ogni aperto è un insieme aperto (o, equivalentemente, se la

controimmagine −1 () di ogni chiuso è un insieme chiuso).

Page 23: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

18 2. Funzioni di più variabili reali

Definizione 38 Sia : ⊆ R → R.Un punto x∗ ∈ si dice:

1. Punto di massimo globale (di su ) se

(x∗) = (x) per ogni x ∈

Qualora valga la disuguaglianza forte per ogni x 6= x∗, x∗ è detto punto di massimo globaleforte.

2. Punto di massimo locale (di ) se esiste un intorno (x∗) tale che

(x∗) = (x) per ogni x ∈ ∩ (x∗)

Qualora valga la disuguaglianza forte per x 6= x∗, x∗ è detto punto di massimo locale forte.Il valore ∗ = (x∗) assunto da nel punto x∗ è detto massimo globale (forte) e massimo locale(forte) rispettivamente.

Se valgono le disuguaglianze opposte (5 e ) si parla di minimo invece che di massimo.

Osserviamo subito che la definizione non richiede alcuna proprietà alla funzione . Dalle definizionidate si può inoltre dedurre che

1. I punti di minimo di una funzione coincidono con i punti di massimo di − . Per i valorimassimi e minimi vale invece l’ovvia relazione

min = −max (−))

2. Globale implica, a fortiori, locale. Forte implica debole.

3. I punti isolati di sono simultaneamente di massimo e di minimo, almeno in senso locale.

4. Se esiste un punto di massimo (o di minimo) globale forte, esso è forzatamente unico. Possono

invece esserci anche infiniti punti di massimo (o di minimo) globale non in senso forte: peresempio la funzione sin presenta infiniti punti di massimo globale ∗ = 2± 2. Nessuno diessi è globale in senso forte poiché in tutti la funzione vale 1: ciascuno di essi è punto di massimo

locale forte.

5. Possono esistere anche infiniti massimi (o minimi) locali in senso forte: per esempio la funzione sin ha infiniti valori di massimo e di minimo locale in senso forte come mostra il suo grafico

x

y

Page 24: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

2.2 Massimi e minimi 19

Osservazione 39 Cominciamo con il rilevare come frequentemente il dominio di sia più piccolodel suo dominio naturale (“massimo dominio”) : ciò sia per motivi di sensatezza economica3 siaperché, come vedremo approfonditamente nei capitoli 11, 13 e 14, il variare delle variabili indipendentiè soggetto a vincoli.

La vera differenza tra definizione globale e locale di punto di massimo è che, con la prima, l’insieme peril quale si richiede il valere della disuguaglianza (x∗) = (x) è prefissato ( ⊆ ) e, con la seconda,non lo è: ci si chiede se esiste almeno un insieme (intorno di x∗) nel quale vige la disuguaglianza.In maniera scorretta ma efficace: con la definizione globale, l’insieme di riferimento è scelto da noi,con la definizione locale “dalla funzione”.

Le funzioni continue godono di alcune importanti proprietà, in particolare:

Teorema 40 (Weierstrass) Una funzione : ⊆ R → R continua su compatto ammette ivi

massimo e minimo globali.

Alle nozioni di massimo e minimo si può affiancare il concetto di sella. Consideriamo una funzione

: ⊆ R2 → R di due variabili che indicheremo con e .Se in un punto (0 0) accade che

(0 0) = ( 0) e (0 0) 5 (0 )

per ogni scelta di ∈ , (0 0) è detto punto di sella globale di su Qualora le disuguaglianzevalgano in un intorno di (0 0), si parla di punto di sella locale. Il punto (0 0) è, apparentemente,molto strano: è di massimo al variare della sola e di minimo al variare della sola .Un esempio di sella (globale) è dato dalla funzione ( ) = 2 − 2 nel punto (0 0) = (0 0):

xyz

Grafico di 2 − 2

Come si vede dal grafico, nell’origine la funzione presenta una forma che ricorda la sella di un cavallo(da cui il nome): movendosi lungo l’asse si incontra un minimo mentre lungo l’asse si trova unmassimo.

Osservazione 41 Nulla cambia se si scambiano di posto le due variabili e : un punto è di sellase presenta un massimo rispetto a una delle due variabili (non importa quale) e un minimo rispettoall’altra. Anche ( ) = 2 − 2 presenta una sella nell’origine: in (0 0) tale funzione è minimarispetto a e massima rispetto a .

La definizione si estende facilmente a funzioni di variabili qualora sia possibile raccoglierle in duedistinti vettori y e x per i quali valgano le precedenti disuguaglianze.

3Per esempio, potrebbe essere definita su tutto R (come oggetto matematico) ma interessa considerarla solo pervalori positivi delle variabili indipendenti (perché si tratta di quantità di merci).

Page 25: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

20 2. Funzioni di più variabili reali

Page 26: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3Calcolo differenziale

Presentiamo ora le nozioni basilari del calcolo differenziale per funzioni di più variabili. Tratteremo

prima le funzioni scalari; accenneremo quindi alle funzioni vettoriali. Non parleremo di derivate e

differenziali di ordine successivo al primo.

3.1 Funzioni scalari

Per funzioni : ⊆ R → R, la derivata prima rappresenta ancora il limite di un rapporto incremen-tale e quindi uno strumento per l’indagine in piccolo, ovvero locale, del comportamento della funzione.L’unica lieve e ovvia complicazione è che la presenza di variabili indipendenti 1 2 induce lanecessità di calcolare altrettanti rapporti incrementali e quindi derivate: una per ciascuna variabileindipendente .Più precisamente

Definizione 42 Siano : ⊆ R → R e x0 un punto interno di . Se esiste finito

lim→0

¡01

0 + 0

¢− ¡01

0

0

¢

=

= lim→0

¡x0 + e

¢− ¡x0¢

si dice derivabile (parzialmente) rispetto a in x0 e il risultato del limite è detto derivata parziale

(prima) di rispetto a calcolata in x0. Essa può essere indicata con i simboli

¡x0¢

0¡x0¢

¡x0¢

Qualora esistano tutte le derivate parziali in un punto x0, è detta derivabile in x0 e le derivatesono raccolte in un vettore riga chiamato gradiente di in x0 e indicato con ∇ ¡x0¢1 :

∇ ¡x0¢ = ∙

1

¡x0¢

2

¡x0¢

¡x0¢ ¸

1 Il simbolo ∇ si legge “nabla”.

Page 27: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

22 3. Calcolo differenziale

Il vettore gradiente può anche essere indicato semplicemente con 0¡x0¢.

Osservazione 43 Qualora non esista il limite di qualcuno dei rapporti incrementali presi in esame

ma ne esistano i limiti destro e sinistro, si può parlare di derivata parziale destra

+ ¡x0¢= lim

→0+¡x0 + e

¢− ¡x0¢

e sinistra

− ¡x0¢= lim

→0−¡x0 + e

¢− ¡x0¢

Come si evince dalla definizione, la derivata parziale è un concetto genuinamente unidimensionale.Anche se la funzione è di variabili, si considerano variazioni di una sola variabile alla volta: ci sisposta dal punto iniziale x0 movendosi lungo una retta “parallela all’asse ”. Si osserva dunque ilcomportamento di solo relativamente alla sua restrizione:

() = ¡01

0 + 0

¢Infatti, dato che (0) =

¡01

0

0

¢, la derivata parziale

¡x0¢non è altro che la derivata

(calcolata in 0) della funzione di una sola variabile:

¡x0¢= lim

→0 ()− (0)

= 0 (0)

Ciò comporta che, dal punto di vista del calcolo di una derivata parziale, si possano “riciclare” leregole di calcolo del caso unidimensionale: è sufficiente trattare come costanti le variabili rispetto alle

quali non si sta calcolando la derivata.Di solito quindi:

1. si calcolano le derivate parziali in un generico punto x ottenendo (se è derivabile) la funzionegradiente:

∇ (x) =∙

1(x)

2(x)

(x)

¸che associa a ogni punto x ∈ ⊆ R in cui è derivabile il vettore —dimensionale delle suederivate parziali; dunque ∇ è una funzione del tipo ∇ : e ⊆ ⊆ R → R dove e indica

l’insieme dei punti in cui è derivabile.

2. Per ottenere ∇ ¡x0¢ si sostituiscono le coordinate del punto x0 nell’espressione di ∇ (x).2Esempio 44 Siano

(1 2) = 21 + 22 ; x0 =

∙35

¸Abbiamo

1(x) = 21 e

2(x) = 22

ovvero è derivabile in ogni punto di R2 con gradiente

∇ (x) = £ 21 22¤

Quindi

∇ ¡x0¢ = £ 6 10¤

2 In realtà ciò è corretto se le derivate parziali sono tutte continue.

Page 28: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3.1 Funzioni scalari 23

Esempio 45 Siano

(1 2 3) = ln (1 + 32 · 3) ; x0 =

⎡⎣ 021

⎤⎦si ha

1(x) =

1

1 + 32 · 3

2(x) =

331 + 32 · 3

3(x) =

321 + 32 · 3

Nel punto assegnato la funzione è derivabile e risulta

1

¡x0¢=1

6

2

¡x0¢=3

6=1

2

3(x) =

6

6= 1

ovvero

∇ ¡x0¢ = ∙ 1

6

1

21

¸Esempio 46 La norma euclidea in R è una funzione derivabile ovunque tranne che nell’origine.Infatti derivando:

(x) = kxk =vuut X

1

2 =¡21 + 22 + + 2 + + 2

¢12rispetto alla variabile si ottiene

(x) =

1

2

ÃX1

2

!−12· 2 =

kxk

da cui

∇ (x) = 1

kxk£1 2 · · ·

¤La funzione derivata è ben definita in ogni punto x 6= 0. Nell’origine si ha

(0+ e)− (0)

=

√2 − 0

=||=

½1 se 0−1 se 0

quindi

lim→0+

(0+ e)− (0)

= 1 e lim

→0− (0+ e)− (0)

= −1

pertanto kxk non è derivabile nell’origine.

Come abbiamo visto, le derivate parziali sono limiti di rapporti incrementali calcolati lungo direzioni

parallele agli assi.

Vedremo ora l’importante nozione di differenziale primo.

Page 29: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

24 3. Calcolo differenziale

Definizione 47 Una funzione : ⊆ R → R si dice differenziabile in un punto x0 ∈ ◦ se esisteun vettore riga a =

£1

¤non dipendente da h tale che, per h→ 0:

¡x0 + h

¢=

¡x0¢+ a · h+ (khk) (3.1)

La parte lineare a · h (rispetto a h) prende il nome di differenziale primo di in x0 e si indica con¡x0¢:

d¡x0¢= a · h

Come nel caso unidimensionale, la differenziabilità in un punto x0 sta a significare che, in un intornodel punto x0 la funzione è ben approssimabile con una funzione lineare affine: ben approssimabilenel senso che la differenza tra

¡x0 + h

¢e la sua approssimazione lineare affine

¡x0¢+ a · h tende

a 0 più rapidamente della lunghezza khk dello spostamento compiuto. Ribattezzando infatti il puntovariato x0 + h = x, cosicché h = x− x0, si può riscrivere la (3.1)

(x)− ¡x0¢= a

¡x− x0¢+

¡°°x− x0°°¢e quindi, se a

¡x− x0¢ 6= 0:

(x)− ¡x0¢ ∼ a ¡x− x0¢

che mette in evidenza il legame tra il differenziale primo d¡x0¢= a

¡x− x0¢ e l’incremento subito

dalla funzione: ∆¡x0¢= (x)−

¡x0¢.3

Che legami sussistono tra derivate (parziali) e il differenziale? Vi sono relazioni tra continuità,

derivabilità e differenziabilità?

Una prima risposta è contenuta nel seguente

Teorema 48 Se : ⊆ R → R è differenziabile in un punto x0 ∈ ◦, allora

1. è continua in x0;

2. è derivabile in x0 e risulta a = ∇ ¡x0¢;Dimostrazione.

1. Se è differenziabile in x0

(x)− ¡x0¢= a

¡x− x0¢+

¡°°x− x0°°¢Poiché

limx→x0

£a¡x− x0¢+

¡°°x− x0°°¢¤ = 0risulta

limx→x0

(x) = ¡x0¢

e è continua in x0.

3 Si ricorda che date due funzioni di una variabile () e () si dice che:

• è un “o piccolo” di per → 0 e si scrive = () se

lim→0

()

()= 0

• è un “asintotico” a per → 0 e si scrive ∼ se

lim→0

()

()= 1

Tra e ∼ vale la seguente relazione:

+ () ∼

Page 30: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3.1 Funzioni scalari 25

2. Se è differenziabile in x0, scelto h = e

¡x0 + e

¢− ¡x0¢= a·e + (kek) == · + (||)

Dividendo entrambi i membri per si ottiene

¡x0 + e

¢− ¡x0¢

= + (1)

Il secondo membro, per → 0, ammette limite e quindi anche il primo membro ammettelimite finito

lim→0

¡x0 + e

¢− ¡x0¢

=

ovvero esiste

¡x0¢e coincide necessariamente con , = 1 .

Osservazione 49 Il punto 2 del Teorema 48 non dice semplicemente che a = ∇ ¡x0¢; affermache, se esiste a, necessariamente esiste anche ∇ ¡x0¢ e sono uguali. Può accadere infatti che esista∇ ¡x0¢ ma non a.Il punto 2 può essere riformulato dicendo che una funzione è differenziabile se e solo se vale la

cosiddetta formula di Taylor arrestata al primo ordine:

(x) = ¡x0¢+∇ ¡x0¢ ¡x− x0¢+

¡°°x− x0°°¢Il secondo membro è la somma del polinomio di Taylor del primo ordine:

(x) = ¡x0¢+∇ ¡x0¢ ¡x− x0¢

e del resto secondo Peano:

(x) = ¡°°x− x0°°¢

Il differenziale primo è quindi

d¡x0¢= ∇ ¡x0¢ ¡x− x0¢

Spesso si indica l’incremento x− x0 con dx dato che la formula di Taylor è significativa per ¡x− x0¢→0. Quindi

d¡x0¢= ∇ ¡x0¢dx

La precedente scrittura si indica anche con la locuzione di differenziale totale poiché, scrivendola indettaglio (ommettendo per brevità l’indicazione del punto iniziale x0), si ha

d =X=1

d =

1d1 +

2d2 + +

d

L’espressione sopra riportata mette in evidenza come il differenziale totale sia la somma di dif-

ferenziali parziali: d =

d, ognuno dei quali rappresenta l’incremento “di competenza” della

−esima variabile indipendente. Tale precisazione non è solo formale: potrebbe infatti risultare utileconsiderare solo alcune variabili, per esempio perché si è interessati a capire qual è l’infuenza su diuna specifica variabile o perché la funzione risulta differenziabile solo rispetto ad alcune variabili (equindi non esiste il differenziale totale).

Page 31: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

26 3. Calcolo differenziale

Non vale nessuna delle implicazioni inverse del precedente teorema!. Più precisamente: l’esistenzadi ∇ ¡x0¢ non implica né la continuità e quindi neppure la differenziabilità in x0. Per esempio, lafunzione : R2 → R così definita:

( ) =

½0 se 6= 01 se = 0

ammette entrambe le derivate parziali nell’origine. Infatti:

(0) = lim

→0 ( 0)− (0 0)

= lim

→01− 1

= 0

(0) = lim

→0 (0 )− (0 0)

= lim

→01− 1

= 0

Ciò nonostante non è continua nell’origine: spostandosi da 0 lungo direzioni diverse dagli assi, lafunzione passa dal valore 1 al valore 0 compiendo un “salto” anche per spostamenti piccolissimi. Ciòcomporta che in x0 = 0 non sia neppure differenziabile.Il Teorema 48 fornisce alcune condizioni necessarie di differenziabilità. Il seguente, in un certo senso,

è il suo viceversa.

Teorema 50 Se : ⊆ R → R ammette derivate parziali in un intorno di un punto x0 ∈ ◦ e sele derivate parziali risultano tutte continue4 in x0, allora è differenziabile in x0.

La derivabilità non implica la differenziabilità ma la derivabilità con continuità sì.

Possiamo introdurre una nuova classe di funzioni, indicata con 1: la classe delle funzioni derivabiliuna volta con continuità. La notazione 1 () indica l’insieme delle funzioni che ammettono in ognipunto di derivate parziali prime tutte continue.

Possiamo riassumere i legami visti nel seguente schema:

f derivabile con continuità

f differenziabile

f continua

f derivabileparzialmente

f derivabiledirezionalmente

Osservazione 51 I precedenti teoremi mostrano come la differenziabilità di una funzione (scalare o

vettoriale di vettore) sia una importante proprietà di struttura: dalla differenziabilità conseguono con-

tinuità, derivabilità e derivabilità direzionale. La derivabilità è invece una proprietà piuttosto povera:

una funzione derivabile può anche essere molto poco “liscia” e regolare, per esempio può essere dis-continua. Il motivo è piuttosto evidente. La differenziabilità di una funzione in x0 è una “proprietà di

4Anzi, basta un po’ di meno: che e − 1 derivate parziali siano continue e che esista la −esima derivata parziale.

Page 32: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3.1 Funzioni scalari 27

regolarità” in un intorno pluridimensionale di x0: essa garantisce dunque un “buon comportamento”in tutti i punti “vicini” a x0. La derivabilità richiede invece un “buon comportamento” soltanto nelledirezioni unidimensionali parallele a uno degli assi, che può benissimo esserci (come mostrano alcuni

degli esempi precedenti) senza che vi sia anche in tutte le altre direzioni. Nel caso di una funzione di

una sola variabile, differenziabilità e derivabilità coincidono perché gli intorni sono necessariamente

unidimensionali.

Osservazione 52 L’idea di differenziale è veramente brutale: con essa si vuole approssimare unafunzione nel modo più semplice, cioé con una funzione lineare.È chiaro che tale brutale approssimazione è facile da ottenere ma riesce a dire ben poco su :(i) se è regolare (“liscia”), nelle immediate vicinanze di x0, i suoi valori sono ben approssimatidalla funzione lineare;

(ii) permette di riconoscere se cresce, cala (meglio in quali direzioni cresce o cala) o è stazionaria.Dunque il differenziale fornisce poche informazioni ma costa poca fatica: le informazioni fornite sono

peraltro semplici ma fondamentali, cosicché i benefici (scarsi) superano i costi (ancor più scarsi).

Esempio 53 Per la funzione : R2 → R :

(1 2) = 21 + 322

si ha

1(x) = 21 e

2(x) = 62

Entrambe le derivate parziali sono definite e continue su tutto R2. Dunque ∈ 1¡R2¢e quindi esiste

il differenziale primo in ogni punto di R2. Consideriamo il punto:

x0 =

∙21

¸Il differenziale primo di in x0 è

d¡x0¢=£4 6

¤ ∙ 1 − 22 − 1

¸=

= 41 + 62 − 14

Il corrispondente polinomio di Taylor è

(x) = ¡x0¢+ d

¡x0¢=

= 7 + 41 + 62 − 14 == 41 + 62 − 7

3.1.1 Significato geometrico di derivate parziali, gradiente e differenziale primo.

Per interpretare geometricamente i concetti prima introdotti dobbiamo limitarci, per ovvi motivi, al

caso di funzioni scalari di sole due variabili : ⊆ R2 → R.Cominciamo dalle derivate parziali. Come già anticipato, ciascuna di esse può essere vista come la

derivata di una restrizione della funzione . Di conseguenza ciascuna di esse può essere interpretatacome la pendenza della retta tangente al grafico della funzione sulla restrizione considerata:

Page 33: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

28 3. Calcolo differenziale

Il gradiente a sua volta ha un interessante significato geometrico: si dimostra che, in ipotesi didifferenziabilità e se non è nullo, rappresenta la direzione di massima crescita della funzione. In altri

termini, fissato un punto x0 non stazionario (cioé con∇ ¡x0¢ 6= 0), se ci si sposta dal punto x0 nelpunto x0+ v∗, dove v∗ = ∇ ¡x0¢ con 0, la funzione cresce lungo tale direzione con la massimapendenza possibile rispetto a ogni altra direzione v ammissibile. Rappresentando dunque i gradienticome vettori orientati nel punto considerato, si visualizzano le direzioni di crescita della funzione.

Per esempio, il comportamento della funzione ( ) = , di cui la seguente figura riportasuperficie e curve di livello

può essere letto nel seguente grafico in cui sono riportati i gradienti e le curve di livello:

Page 34: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3.1 Funzioni scalari 29

Concludiamo con il significato geometrico del polinomio di Taylor del prim’ordine dal quale puòessere ricavato il significato del differenziale primo.Tale polinomio di Taylor è una funzione lineare affine dello stesso tipo (dimensioni dello spazio di

partenza e di arrivo) di :

(x) = ¡x0¢+∇ ¡x0¢ ¡x− x0¢

Nel caso = 2 e = 1, esso è rappresentato dal piano tangente al grafico della funzione5 nel puntox0:

L’inclinazione del piano tangente è determinata dal valore di entrambe le derivate parziali nel punto.Osservando che

¡x0¢=

¡x0¢si deduce che il differenziale primo

¡x0¢= ∇ ¡x0¢ ¡x− x0¢ = (x)−

¡x0¢

è l’incremento subito da . Si può dunque affermare che il differenziale primo è la variazione letta sulpiano tangente anziché sulla superficie di e che, per piccole variazioni ∆x0 = x− x0 non ortogonalia ∇ ¡x0¢, fornisce una buona approssimazione della vera variazione ∆ subita dalla funzione .Aumentando il numero di variabili indipendenti, la rappresentazione grafica non è più fattibile. Il

differenziale, anziché un piano, è un iperpiano e, in ogni caso, il gradiente è la direzione di massima

crescita.

5La differenziabilità dunque equivale a richiedere che esista un (solo) piano tangente.

Page 35: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

30 3. Calcolo differenziale

3.2 Funzioni vettoriali

Per estendere quanto introdotto nella sezione precedente al caso di funzioni vettoriali f : ⊆ R → Rè sufficiente applicare le nozioni appena viste a ogni loro componente : ⊆ R → R = 1 .Se tutte le funzioni sono derivabili in un punto x

0, f a sua volta è derivabile in x0 e la suaderivata prima è rappresentata da tutti i vettori gradiente ∇

¡x0¢che sono raccolti usualmente in

una matrice = di righe ed colonne detta matrice jacobiana:

f¡x0¢=

⎡⎢⎢⎢⎣∇1

¡x0¢

∇2¡x0¢

...

∇¡x0¢⎤⎥⎥⎥⎦ =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

11

¡x0¢ 1

2

¡x0¢ · · · 1

¡x0¢

21

¡x0¢ 2

2

¡x0¢ · · · 2

¡x0¢

......

. . ....

1

¡x0¢

2

¡x0¢ · · ·

¡x0¢

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦che può anche essere indicata f 0

¡x0¢.

Il calcolo delle derivate prime rimane del tutto analogo a quanto s’è detto in precedenza.

Esempio 54 La funzione f : R2 → R3:

f (x) =

⎡⎣ 21 + 2251 − 32e2

⎤⎦avendo tutte e tre le componenti derivabili su tutto R2, risulta a sua volta derivabile su tutto R2. Lasua derivata in un generico punto è la matrice

f 0 (x) = f (x) =

⎡⎣ 21 225 −30 e2

⎤⎦di dimensione 3× 2. La derivata nel punto

x0 =

∙31

¸è dunque

f 0¡x0¢= f

¡x0¢=

⎡⎣ 6 25 −30 e

⎤⎦.

Esempio 55 La funzione f : R→ R3:

f () =

⎡⎣ ln¡1 + 2

¢4− 2sin

⎤⎦è derivabile su tutto R e risulta

f 0 (x) = f (x) =

⎡⎢⎣2

1 + 2−2cos

⎤⎥⎦In questo caso la matrice jacobiana è un vettore colonna.

Page 36: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

3.2 Funzioni vettoriali 31

Anche per il differenziale possiamo seguire lo stesso schema. Una f : ⊆ R → R è differenziabilein un punto x0 se e solo se lo sono tutte le sue componenti, ovvero se:

(x) = ¡x0¢+∇

¡x0¢ ¡x− x0¢+

¡°°x− x0°°¢ = 1

che, messe insieme, possono scriversi nella forma più compatta:

f (x) = f¡x0¢+ f

¡x0¢ ¡x− x0¢+ o ¡°°x− x0°°¢

dove o¡°°x− x0°°¢ è il vettore −dimensionale che raccoglie quantità tutte infinitesime, per x→ x0,

di ordine superiore a°°x− x0°°.

La formula precedente altri non è che la formula di Taylor arrestata al prim’ordine. L’unica differenzarispetto al caso scalare è che, al posto del vettore a = ∇ ¡x0¢ non dipendente da h = x− x0, comparela matrice = f

¡x0¢non dipendente da h = x− x0.

Il differenziale primo è a sua volta rappresentato dal vettore di dimensione che raccoglie i

differenziali primi delle sue componenti:

df¡x0¢=

⎡⎢⎢⎢⎣d1

¡x0¢

d2¡x0¢

...

d¡x0¢⎤⎥⎥⎥⎦ =

=

⎡⎢⎢⎢⎣∇1

¡x0¢ ¡x− x0¢

∇2¡x0¢ ¡x− x0¢...

∇¡x0¢ ¡x− x0¢

⎤⎥⎥⎥⎦ = f¡x0¢ ¡x− x0¢

Infine una f : ⊆ R → R è detta di classe 1 se ogni sua componente è di classe 1.Rimangono invariati i legami tra continuità, derivate parziali e differenziale primo, ovvero lo schema

presentato in figura a pag. 26 è ancora valido.I precedenti esempi riportano casi di funzioni differenziabili con continuità: per essi si può dunque

procedere al calcolo di differenziali sfruttando quanto visto nel caso scalare.

Page 37: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

32 3. Calcolo differenziale

Page 38: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

4Funzioni concave e convesse

Vedremo orale classiche nozioni di concavità (e convessità) per funzioni scalari. Cominciamo con la

seguente

Definizione 56 Una funzione : ⊆ R → R, convesso, è detta concava se, per ogni scelta di

xy ∈ , risulta

(x+ y) = (x) + (y) ∀ ∈ [0 1] (4.1)

dove = 1−. Si dice convessa se − è concava, cioè se vale la disuguaglianza opposta 5. Se valgonole disuguaglianze forti per ogni ∈ (0 1), si dice strettamente concava (convessa).

La stessa definizione si dà anche per funzioni vettoriali f : ⊆ R → R, convesso

f (x+ y) = f (x) + f (y) ∀ ∈ [0 1]

Ciò equivale a richiedere la concavità di ogni componente di f e ciò ci autorizza ad esaminare soltantole funzioni scalari di vettore.

Geometricamente la concavità (convessità) di una funzione significa che, relativamente al segmentoda x a y (ovvero per i punti del tipo z = x+ y 0 5 5 1), il grafico di non sta mai al di sotto(di sopra) della corda che congiunge i punti = (x (x)), = (y (y)).

Funzione (strettamente) concava Funzione (strettamente) convessa

Page 39: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

34 4. Funzioni concave e convesse

Funzione convessa (non strettamente) Funzione concava (non strettamente)

Le funzioni lineari affini, cioé del tipo (x) = aTx + , con a ∈ R e ∈ R, sono le unichesimultaneamente concave e convesse.

Le combinazioni lineari con pesi non negativi di funzioni concave (convesse) sono concave (convesse).

Le funzioni concave sono utilizzate molto frequentemente nella Teoria economica. La (4.1) esprime

infatti tre proprietà piuttosto importanti e ragionevoli in molte circostanze:

1. la preferibilità della diversità. Meglio un pezzo di pane e un bicchiere di vino piuttosto che due

pezzi di pane o due bicchieri di vino.

2. La preferibilità del certo: meglio 100C= sicuri che una scommessa che può far vincere 200C= oppure

nulla con probabilità 1/2.

3. La legge degli “incrementi decrescenti”: il passaggio da 10 a 20 è “maggiore” di quello da 20 a30.

Il concetto di concavità (convessità) di una funzione è genuinamente unidimensionale: riguarda il

suo comportamento su ogni segmento x+ y 0 5 5 1. Infatti si vede facilmente che

Teorema 57 Una funzione : ⊆ R → R, convesso, è concava (convessa) se e solo se lo sono

tutte le funzioni di una sola variabile

xh () = (x+ h) ∈ [0 1]

con xx+ h ∈ .

Vale dunque la pena di ricordare prima le proprietà delle funzioni concave (convesse) di una sola

variabile

Teorema 58 Sia : ⊆ R→ R definita in un intervallo .

1. Se è differenziabile, condizione necessaria e sufficiente affinché sia concava (convessa) è che0 sia decrescente (crescente).

2. Se è due volte differenziabile, condizione necessaria e sufficiente affinché sia concava (con-vessa) è che 00 5 0 ( 00 = 0) per ogni ∈ .

3. Se è differenziabile, condizione necessaria e sufficiente affinché sia strettamente concava

(convessa) è che 0 sia strettamente decrescente (crescente).

4. Se è due volte differenziabile, condizione sufficiente affinché sia strettamente concava (con-vessa) è che 00 0 ( 00 0) per ogni ∈ .

Page 40: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

4.1 Proprietà delle funzioni concave (convesse) 35

4.1 Proprietà delle funzioni concave (convesse)

I prossimi due teoremi affermano che le funzioni concave (convesse) sono piuttosto regolari.

Teorema 59 Una funzione concava (convessa) è continua in ogni punto interno del suo dominio. In

particolare, se esso è aperto, la funzione è ovunque continua.

Si rifletta, nel caso di funzioni di una variabile, sulla circostanza che la presenza di una discontinuitàin un punto interno al dominio fa sì che, necessariamente, qualche corda corda tagli il grafico dellafunzione. Se la discontinuità è di frontiera, invece ciò non necessariamente accade.

Discontinuità interna Discontinuità di frontiera

Inoltre vale il

Teorema 60 Sia una funzione concava (convessa) definita su un convesso ⊆ R. Se è

derivabile in un punto x, è ivi anche differenziabile.

In conclusione una funzione concava (o convessa) non può comportarsi troppo male: in ogni punto

interno al suo dominio è continua e derivabilità implica differenziabilità1.

Teorema 61 Sia : ⊆ R → R derivabile in aperto convesso. La funzione è concava se esolo se risulta

∇ (x) (y − x) = (y)− (x) per ogni xy ∈ (4.2)

La funzione è convessa se e solo se vale la disuguaglianza opposta.

Si osservi che la (4.2) si può riscrivere come:

(y) 5 (x) +∇ (x) (y− x) per ogni xy ∈

Il secondo membro è l’approssimazione lineare di (approssimazione costruita in x e valutata in y):si tratta del primo termine dello sviluppo di Taylor, ovvero dell’espressione dell’iperpiano tangente a in x. Il Teorema 61 afferma allora che una funzione differenziabile è concava (convessa) se e solose l’approssimazione lineare approssima, in ogni punto, per eccesso (per difetto) , cioé se l’iperpianotangente le sta sempre sopra (sotto).

Un’altra caratterizzazione del prim’ordine è fornita dalla seguente

Proposizione 62 Sia : ⊆ R → R differenziabile in aperto convesso. La funzione è concavase e solo se risulta

[∇ (y)−∇ (x)] (y− x) 5 0 per ogni xy ∈ (4.3)

La funzione è convessa se e solo se vale la disuguaglianza opposta.

1Abbiamo già avvertito che i concetti di concavità e di convessità sono genuinamente unidimensionali. Ne abbiamo

qui una riprova: come per le funzioni di una variabile, la derivabilità equivale alla differenziabilità anche per le funzioni

concave o convesse.

Page 41: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

36 4. Funzioni concave e convesse

Il precedente risultato stabilisce che, anche nel caso di funzioni di più variabili, condizione necessaria

e sufficiente di concavità è che la derivata prima sia, in un certo senso, monotona decrescente2. Infatti

la condizione (4.3), nel caso = 1, diventa

[ 0 ()− 0 ()] ( − ) 5 0 per ogni ∈ ⊆ Rche si riduce alla decrescenza di 0

=⇒ 0 () = 0 () =⇒ 0 () 5 0 ()

Diamo ora alcune caratterizzazioni che non coinvolgono l’uso del calcolo differenziale.

Definizione 63 Sia : ⊆ R → R una funzione qualsiasi. Si dice

1. ipografico ( epigrafico) di l’insieme dei punti di R ×R che stanno sotto (sopra) il grafico di

ipo () = {(x ) ∈ R ×R : x ∈ e 5 (x)}epi () = {(x ) ∈ R ×R : x ∈ e = (x)}

2. Insieme di sottolivello o livello inferiore ( soprallivello o livello superiore) di quota l’insiemedei punti di per i quali il valore di è inferiore (superiore) a

() = {x ∈ ⊆ R : (x) 5 } () = {x ∈ ⊆ R : (x) = }

Per funzioni di una sola variabile la rappresentazione grafica è

x

y

epi(f)

Ipo(f) x

y

k

Sf (k)

Si prova senza difficoltà che una funzione è concava (convessa) se e solo se il suo ipografico (epigrafico)è un insieme convesso. La proprietà ha un notevole rilievo economico.

Vale inoltre

Proposizione 64 Se : ⊆ R → R è concava (convessa) in convesso, allora tutti i suoi insiemi

di soprallivello (sottolivello) sono convessi3 .

2Anzi, la condizione del prim’ordine di concavità (convessità) in questione è stata adottata come definizione dimonotonia per le mappe. Una : ⊆ R → R è detta monotona crescente se

[ (y)− (x)] (y− x) = 0 per ogni xy ∈

È detta monotona decrescente se vale la disuguaglianza opposta.3O vuoti. Si rammenti che l’insieme vuoto, ad honorem, è convesso.

Page 42: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

4.1 Proprietà delle funzioni concave (convesse) 37

Dimostrazione. Sia concava. Consideriamo un livello per cui () 6= ∅. Se () contiene unsolo punto, è convesso. Se () contiene almeno due punti x e y, supponiamo che sia (y) = (x) =. Ma allora

(x+ y) = (x) + (y) =

= (x) + [ (y)− (x)] = (x) =

quindi anche x+ y ∈ (), ovvero () è convesso.Il viceversa non è vero.

Per esempio, tutte le funzioni : ⊆ R → R monotòne hanno insiemi di livello sia superiori siainferiori che risultano convessi anche se non si tratta di funzioni concave. La funzione () = 3

non è concava e neppure convessa eppure () e () sono convessi per ogni valore di .In altri termini, la proprietà in discorso è goduta dalle funzioni concave (convesse) ma non è una

loro esclusiva. Le funzioni con tali proprietà sono dette quasi concave (quasi convesse).

In generale, come per le funzioni di una sola variabile reale, per testare la concavità/convessità di

una funzione bisognerebbe ricorrere alle derivate di ordine superiore (non previste in questo corso per

funzioni di più variabili).

Possiamo comunque fornire una condizione sufficiente di concavità/convessità per le funzioni qua-

dratiche di due variabili (cfr. 17)

( ) = 2 + 2 +

Per tali funzioni basta studiare il segno dei coefficienti. Più precisamente abbiamo la seguente casistica:

(a) Se

− 2

4 0

allora

0 =⇒ strettamente convessa su R2

0 =⇒ strettamente concava su R2

(b) Se

− 2

4= 0

allora

= 0 e = 0 =⇒ convessa su R2

5 0 e 5 0 =⇒ concava su R2

(c) Se

− 2

4 0

allora non è né convessa né concava.

Page 43: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

38 4. Funzioni concave e convesse

Come vedremo in seguito, la quantità − 2

4coincide con il determinate della matrice

=

∙ 22

¸

Page 44: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

5Ottimi liberi

Il più generale problema di ottimo (del quale ci occuperemo) consiste nel ricercare il punto (o i punti)

di un prefissato insieme ⊆ R che rende (rendono) massima o minima una funzione scalare di variabili definita su un insieme ⊇ . Scriveremo rispettivamente

maxx∈

(x) ; minx∈

(x)

oppure

optx∈A

(x)

nei casi in cui si vogliano individuare sia i minimi sia i massimi (o non interessi specificarlo).Dato che min (x) = −max [− (x)], possiamo sempre scrivere un problema di ottimo come un

problema di massimo.

La soluzione di un problema di ottimo è dunque un punto bx di massimo (o di minimo) globale di in : se bx è un punto di massimo (o di minimo) locale di in , esso è detto soluzione locale delproblema di ottimo.

Come vedremo, i risultati principali dell’ottim(izz)azione, detta anche programmazione matematica,dipendono sia dalle caratteristiche della funzione obiettivo , sia da quelle dell’insieme di scelta oregione ammissibile .Se è il dominio naturale di , ovvero se ≡ , il problema

maxx∈

(x)

è detto di ottimizzazione (o di programmazione) libera.Illustriamo una condizione necessaria di massimo (minimo) detta del prim’ordine

Teorema 65 (Fermat) Se bx è un punto di massimo (o un punto di minimo) locale per interno ad e se in bx esiste qualche derivata parziale di , essa è nulla:

esiste

(bx) =⇒

(bx) = 0

Dimostrazione. Supponiamo che bx sia un punto di massimo locale interno ad . Dato che (bx) = (x) per ogni x ∈ (bx) ⊂ , la disuguaglianza vale, a maggior ragione, facendo variare la sola−esima componente di bx

(bx+ e) 5 (bx) per ogni ∈ (0)

Page 45: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

40 5. Ottimi liberi

dove è un intorno, ovviamente unidimensionale, di = 0. Ne segue che

(bx+ e)− (bx)

⎧⎨⎩ 5 0 per 0

= 0 per 0

Per → 0 il primo membro tende a

(bx) (che esiste per ipotesi) e quindi può essere soltanto

(bx) = 0.

Corollario 66 Se bx è un punto di massimo (o un punto di minimo) locale per interno ad e se

esiste il gradiente ∇ (bx), esso è nullo.I punti che annullano il gradiente, cioé le soluzioni del sistema

∇ (x) = 0

sono detti punti stazionari: i punti di massimo e di minimo locale liberi per una funzione ovunquederivabile necessariamente sono stazionari.

Osservazione 67 I punti stazionari, cioé le soluzioni del sistema ∇ (x) = 0, possono rivelarsi puntidi massimo, di minimo, oppure né di massimo né di minimo. Dunque su di essi non si ha alcuna

informazione; l’informazione si ha per gli altri (i punti non stazionari, cioé tali che ∇ (x) 6= 0): essinon possono certamente essere punti di massimo o di minimo liberi.

Osservazione 68 Osserviamo che, se è aperto (come sovente accade con i domini naturali), la

definizione di punto di massimo locale bx (cfr: 18) si può scrivere più semplicemente chiedendo cheesista un intorno (bx) tale che (bx) = (x) per ogni x ∈ (bx) dato che si può sempre prendere (bx) ⊆ . In tale evenienza è sufficiente richiedere, nei precedenti enunciati, che bx appartenga ad: infatti ogni punto di insieme aperto è interno ad esso.

Per le funzioni concave si può dire molto di più (per le convesse valgono gli stessi risultati in termini

di minimo).

Teorema 69 (del massimo locale—globale) Sia : ⊆ R → R una funzione concava su convesso.

1. Ogni punto di massimo locale è anche globale.

2. L’insieme dei punti di massimo (necessariamente globali) è convesso.

3. Se è differenziabile, ogni punto stazionario è di massimo (globale).

Una funzione concava non può dunque ammettere genuini punti di massimo locale: ogni punto di

massimo locale è anche globale. Se la funzione è differenziable, tutti i punti stazionari sono di massimo

globale.

Page 46: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6Vincoli di uguaglianza

Supponiamo che l’insieme ⊆ ⊆ R, nel quale si vogliono cercare i punti di massimo (o di minimo)di una funzione scalare definita su , sia determinato da un’equazione vettoriale (cioé da un sistemadi equazioni scalari) del tipo g (x) = b con g : ⊆ R → R, b ∈ R e .1

In altri termini supponiamo che l’insieme di scelta sia:

= {x ∈ ⊆ R : g (x) = b}Il corrispondente problema di ottimo è detto di programmazione classica vincolata e scriveremo

maxx

(x) sub g (x) = b o minx

(x) sub g (x) = b

Anche in questo caso concentremo la nostra attenzione sui problemi di massimo.

Per farci la bocca, cominceremo dal caso più semplice nel quale è una funzione di due variabili evi è un solo vincolo di uguaglianza ( = 2 = 1)

max

( ) sub ( ) =

supponendo e entrambe differenziabili.Può darsi che il vincolo ( ) = definisca implicitamente una funzione del tipo = () che

siamo in grado di esplicitare. In tal caso è sufficiente sostituire nella funzione obiettivo

( ) = ( ()) = ()

per ottenere una funzione di una sola variabile di cui si può ricercare il massimo senza più vincoli.

Questo metodo è detto di esplicitazione.

Esempio 70 Dato il problema

max ·(−1) sub 2+ 3 = 6

si può ricavare dal vincolo

= 2− 32

1Quest’ultima richiesta è motivata dalla circostanza che ogni equazione scalare (x) = riduce, di norma, di unoi “gradi di libertà”, cioé vincola una variabile.

Page 47: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

42 6. Vincoli di uguaglianza

Sostituendo nella funzione obiettivo, si ottiene

( ) = (2−32−1) = −

32

2

= ()

Il problema originario è ora equivalente a ricercare il massimo di su tutto R. Annullando la derivataprima si trova

0 () = (1− 3) − 32

2

= 0 =⇒ = 13

cui corrisponde = 2− 12 = 32. Poiché

00 () = (1− 3)2 − 32

2 − 3− 32

2

=¡92 − 6− 2¢ − 3

22

⇓ 00 (13) = −313− 3

2·9 = −316 0

il punto (13 23) è di massimo vincolato locale per .

Ma, anche quando non siamo in grado di esplicitare (globalmente) una incognita rispetto all’altra,si può fare molto grazie al classico risultato dovuto a Lagrange.

Teorema 71 Sia (b b) un punto di massimo (o di minimo) locale per ( ) subordinatamente alvincolo ( ) = . Se:

1. è differenziabile in (b b),2. è di classe 1 in un intorno (b b),3. ∇ (b b) 6= 0,allora esiste uno scalare b tale che la funzione

( ) = ( ) + [− ( )]

è stazionaria nel punto³b b b´, cioé

∇³b b b´ = 0

ovvero³b b b´ è una soluzione del sistema⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩

( )

= − ( ) = 0

( )

=

( )

( )

= 0

( )

=

( )

( )

= 0

La condizione ∇ (b b) 6= 0 è detta condizione di qualificazione dei vincoli o condizione di regolaritàdei vincoli: se è rispettata diremo che il problema è regolare in (b b).Il precedente teorema può essere esteso in maniera (quasi) indolore al caso generale con vincoli

e variabili d’azione. Introduciamo prima la

Definizione 72 Dato il problema classico vincolato

optx

(x) sub g (x) = b (6.1)

Page 48: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6. Vincoli di uguaglianza 43

con : ⊆ R → R e g : ⊆ R → R, b ∈ R, , la funzione : ×R → R

(λx) = (x) + λ [b− g (x)] =

= (x) +X=1

[ − (x)]

è detta funzione lagrangiana associata al problema di ottimo. Il vettore riga

λ =£1 2

¤ ∈ Rraccoglie i cosiddetti moltiplicatori di Lagrange, uno per ognuno degli vincoli presenti nel

problema di ottimo.

Teorema 73 Dato il problema

optx

(x) sub g (x) = b

con : ⊆ R → R e g : ⊆ R → R, b ∈ R, , se

1. bx è una soluzione (almeno) locale;2. è differenziabile in bx;3. è di classe 1 in un intorno (bx);4. i gradienti degli vincoli ∇ (bx), calcolati in bx, solno linearmente indipendenti. Ovvero se ilrango della matrice jacobiana

g (bx) =⎡⎢⎢⎢⎣∇1 (bx)∇2 (bx)...

∇ (bx)

⎤⎥⎥⎥⎦è massimo

(g (bx)) = (6.2)

allora esiste bλ = h b1 b2 b itale che la funzione lagrangiana associata al problema è

stazionaria nel punto³bλ bx´

∇³bλ bx´ = 0

ovvero³bλ bx´ è soluzione del sistema (di + equazioni)½ ∇ (λx) = b− g (x)= 0

∇x (λx) = ∇ (x)− λg (x) = 0 (6.3)

Osservazione 74 La condizione 4 del precedente teorema, è la condizione di regolarità dei vincoli che

si riduce alla richiesta ∇ (b b) 6= 0 quando = 1.

Esempio 75 Il problema

optx

¡21 + 22

¢sub 1 + 2 = 1

si può risolvere elementarmente: infatti 2 = 1−1 e quindi (1) = (1 1− 1) = 21+(1− 1)2 =

221−21+1. Essendo 0 (1) = 41−2 = 0 per b1 = 12 e 00 (12) = 4, il punto b1 è (l’unico) punto

Page 49: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

44 6. Vincoli di uguaglianza

di minimo per , cioé (12 12) è (l’unico) punto di minimo del problema vincolato. Il problema èovunque regolare, infatti:

∇ (1 2) =£1 1

¤ 6= 0Proviamo a utilizzare la funzione lagrangiana:

( 1 2) = 21 + 22 + (1− 1 − 2)

Il sistema: ⎧⎨⎩ 0 = 1− 1 − 2 = 001 = 21 − = 002 = 22 − = 0

conduce a concludere che 1 = 2 = 2 e quindi che 1 − 2 − 2 = 0, cioé = 1, ovvero1 = 2 = 12.

Esempio 76 Consideriamo il problema

max (51 + 22 − 3) sub

½12 = 313 = 1

Il problema è ovunque regolare, infatti il rango della matrice jacobiana in un generico punto:∙2 1 03 0 1

¸può essere minore di = 2 solo se 1 = 0: ma in tal caso nessuno dei due vincoli potrebbe esseresoddisfatto. La funzione lagrangiana è

(λx) = 51 + 22 − 3 + 1 (3− 12) + 2 (1− 13)

Il sistema ∇ (λx) = 0 è ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩3− 12 = 01− 13 = 0

5− 12 − 23 = 02− 11 = 0−1− 21 = 0

che ha due soluzioni (punti stazionari della funzione lagrangiana)³bλ bx´ =£2 −1 1 3 1

¤µbbλ bbx¶ =£ −2 1 −1 −3 −1 ¤

Dunque se il problema ammette una soluzione almeno locale, essa non può che essere in

bx =⎡⎣ 131

⎤⎦ o bbx =⎡⎣ −1−3−1

⎤⎦L’ultimo esempio lascia l’amaro in bocca: non abbiamo strumenti per capire se i punti trovati

siano effettivamente di massimo/minimo (o altro ancora). Occorrerebbero condizioni sufficienti che,

tipicamente, sono basate sul calcolo delle derivate seconde.

Possiamo comunque dare una condizione sufficiente:

Page 50: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6.1 Analisi di sensibilità: il significato dei moltiplicatori di Lagrange 45

Proposizione 77 Se la funzione obiettivo è concava e i vincoli g sono lineari:

g (x) = x = b

dove è una matrice con righe e colonne, allora la condizione di Lagrange ∇³bλ bx´ = 0 è

sufficiente affinché bx sia di massimo globale vincolato per .Analogamente, se è convessa e i vincoli sono lineari, se ∇

³bλ bx´ = 0 allora è bx è un punto diminimo globale vincolato.

Esempio 78 Si consideri il problema dell’esempio 75. la funzione obiettivo è convessa e il vincololineare. Dunque il punto trovato è di minimo globale vincolato.

6.1 Analisi di sensibilità: il significato dei moltiplicatori di Lagrange

In generale, con analisi di sensibilità (sensitivity analysis) si intende lo studio delle variazioni delle

soluzioni di un problema al variare di uno o più parametri. Questo tipo di studio affianca sempre

la risoluzione di un problema quando non è possibile conoscere esattamente il valore dei parametri

in questione ed è necessario ricorrere a una loro stima. In questi casi la bontà della soluzione di un

problema dipende non solo dalla precisione della stima dei parametri ma anche dalla “stabilità” dellesoluzioni al variare dei valori attribuiti ad essi. Infatti è chiaro che se le soluzioni sono troppo sensibili

ai valori di uno o più parametri, una loro piccola variazione, porterebbe la soluzione esatta molto

lontana dalla stimata.

Nel nostro caso l’analisi di sensibilità riguarda un problema di programmazione classica e i parametririspetto ai quali si vuole studiare la stabilità delle soluzioni sono i termini noti dei vincoli 1 raccolti nel vettore b. Da questo punto di vista il problema di ottimo deve essere visto come unafamiglia di problemi P (b) dipendenti dalla scelta di b

P (b) : optx

(x) sub g (x) = b

dove : ⊆ R → R e g : ⊆ R → R, b ∈ R, .Se per ogni b ∈ ⊆ R il problema P (b) ammette soluzione, ovvero la funzione obiettivo ammette

ottimo (globale) b, possiamo affermare che la funzione b : ⊆ R → R associa a un generico vettoreb di termini noti il valore ottimo della funzione obiettivo nel corrispondente problema secondo ilseguente schema

b −→ bx = bx (b) −→ (bx (b)) = b (b)L’obiettivo è capire come varia b al variare di b. Infatti ogni variazione ∆b provoca, a “cascata”, levariazioni

∆bx = bx (b+∆b)− bx (b)e

∆b (b) = b (b+∆b)− b (b) = (bx (b+∆b))− (bx (b))Se la funzione b : ⊆ R → R fosse differenziabile, almeno per piccole variazioni ∆b, si potrebbescrivere la formula di Taylor arrestata al prim’ordine

∆b (b) = ∇b (b)∆b+ o (k∆bk)e di conseguenza approssimare la sua variazione tramite il suo differenziale primo

∆b (b) ∼ ∇b (b)∆bSotto alcune ipotesi, non solo b è differenziabile ma è facilmente determinabile il suo differenzialeprimo.

Più precisamente vale la

Page 51: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

46 6. Vincoli di uguaglianza

Proposizione 79 Data la famiglia di problemi P (b), con e g differenziabili in ⊆ R, se perogni b ∈ ⊆ R

1. esiste una soluzione bx = bx (b);2. ogni punto bx = bx (b) soddisfa la condizione di regolarità dei vincoli (RV) e ad esso è associatoun unico vettore bλ = bλ (b) tale che

∇ (bx (b)) = bλ (b)g (bx (b))3. le funzioni bx : ⊆ R → R e bλ : ⊆ R → R, di cui ai precedenti punti, sono differenziabiliin b,allora la funzione b (b) = (bx (b)) è differenziabile e risulta

∇b (b) = bλ (b)Facciamo due osservazioni:

(a) È possibile indebolire le ipotesi fatte. La proposizione si può riformulare senz’altro in versionelocale e quindi il risultato vale anche per ogni soluzione locale di un problema di ottimo vincolato.

(b) I moltiplicatori di Lagrange in realtà misurano la sensibiltà dei valori stazionari rispetto alle

variazioni dei termini noti, a prescindere dal fatto che essi siano effettivamente ottimi locali o

globali.

Il risultato ottenuto permette comunque di stimare la variazione del valore ottimo dovuta a una

variazione ∆b dei termini noti attraverso i moltiplicatori di Lagrange

∆b (b) = b (b+∆b)− b (b) ∼ bλ (b)∆bMettendo in evidenza poi il contributo di ogni variazionebλ∆b = b1∆1 + + b∆si riesce a isolare il significato del singolo moltiplicatore:

• b 0 segnala variazioni del valore ottimo di segno uguale a ∆: più è elevato il valore di b,più il problema è sensibile ai valori del termine noto ;

• b 0 segnala variazioni del valore ottimo di segno opposto a ∆: tanto più è basso (ovvero

alto in valore assoluto) il valore di b, tanto più il problema è sensibile ai valori del termine noto;

• b = 0 segnala immobilità del valore ottimo rispetto a (piccole) variazioni ∆: il problema nonè sensibile ai valori del termine noto ;

Vediamo qualche esempio

Esempio 80 Dato il problema

maxxln

µ1

1 + 21 + 22

¶sub 1 + 2 = 5

vogliamo conoscere non solo il valore del massimo ma anche come esso vari modificando il terminenoto di ±05. La funzione lagrangiana associata al problema è

( 1 2) = − ln¡1 + 21 + 22

¢+ (5− 1 − 2)

Page 52: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6.1 Analisi di sensibilità: il significato dei moltiplicatori di Lagrange 47

Annullandone il gradiente si trova il sistema⎧⎪⎪⎪⎨⎪⎪⎪⎩5− 1 − 2 = 0

− 211 + 21 + 22

− = 0

− 221 + 21 + 22

− = 0

che offre l’unica soluzione b1 = b2 = 52 b = −1027

Esplicitando il vincolo si può verificare che il punto bx è di massimo. Il valore massimo èb = lnµ 1

1 + 504

¶= ln

µ2

27

¶∼= −26027

Essendo b negativo, un valore del termine noto pari a 55 comporta una diminuzione del valoremassimo di circa

∆b = b (55)− b (5) ∼= −1027· 05 = − 5

27= −018519

e quindi un valore massimo

b (55) ∼= −2602 7− 018519 = −2787 9Viceversa se il termine noto fosse portato a 45, si otterebbe un aumento del massimo

∆b = b (45)− b (5) ∼= −1027· (−05) = 5

27= 018519

e quindi un massimo b (45) ∼= −2602 7 + 018519 = −24175Esempio 81 Dato il problema

max¡10 + 321 + 5

22

¢sub 21 + 22 = 9

conduciamo un’analisi di sensibilità. La funzione lagrangiana del problema

( 1 2) = 10 + 321 + 5

22 +

¡9− 21 − 22

¢ammette 4 punti stazionari

a =

∙03

¸b =

∙0−3

¸abbinati a b1 = 5 e con (a) = (b) = 55

c =

∙03

¸d =

∙0−3

¸abbinati a b2 = 3 e con (c) = (d) = 37

Essendo la regione ammissibile compatta, il teorema di Weierstrass garantisce che i punti a e b sianodi massimo globale mentre c e d sono punti di minimo globale.Esaminiamo i punti di massimo. Un incremento ∆ = 1 comporta un aumento del massimo

∆b = b (10)− b (9) ∼= 5 · 1 = 5⇒ b (10) ∼= 55 + 5 = 60Confrontiamo la stima con la variazione vera. Considerando il nuovo vincolo 21+

22 = 10 e risolvendo

il corrispondente problema P (10) troviamo le nuove soluzioni

a =

∙0√10

¸b =

∙0

−√10¸con (a) = (b) = 60

Page 53: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

48 6. Vincoli di uguaglianza

La stima è esatta2 .

Tocchiamo un punto che avevamo lasciato in sospeso a pag. 28 sul significato del gradiente comedirezione di massima crescita.

6.2 Moltiplicatori di Lagrange e prezzi ombra

Vediamo ora una interessante e diffusa interpretazione economica dei moltiplicatori di lagrange.

Supponiamo che la funzione obiettivo sia il profitto ottenuto con la produzione di merci nellequantità 1 raccolte nel vettore x. Sia poi g la funzione (inversa) di produzione che associaa ogni combinazione produttiva x le quantità consumate 1 di fattori di produzionedisponibili nelle quantità 1 raccolte nel vettore b.In un sistema produttivo rigidamente “chiuso” non è possibile comprare o vendere le risorse pro-

duttive per soddisfare fabbisogni ulteriori o eliminare eccedenze delle stesse.

Quindi, se si vuole massimizzare il profitto in un sistema chiuso, il problema da risolvere è il classico

maxx

(x) sub g (x) = b

D’altro canto, se si opera in un sistema “aperto”, si possono produrre anche le combinazioni produt-tive x che violano i vincoli di uguaglianza acquistando o vendendo le risorse produttive. Ovviamentela compravendita dei fattori produttivi comporta una modificazione del profitto dipendente sia dallequantità scambiate sia dai prezzi dei fattori stessi.

Indichiamo con il prezzo (unitario) del fattore , = 1 .Abbiamo le seguenti possibilità

Disavanzo di fattore produttivo. Si vuole produrre x che fa superare la disponibiltà della risorsa, ovvero (x) . È possibile farlo acquistando la quantità mancante (x)− e ciò comportaun costo aggiuntivo pari a

[ (x)− ]

Avanzo di fattori produttivi. Si vuole produrre x che non fa consumare tutta la disponibiltà dellarisorsa , ovvero (x) . È possibile vendere la quantità eccedente − (x) con un ricavopari a

[ − (x)]

Il profitto ora non è più (x) poiché ad esso debbono essere sottratti i costi e sommati i ricaviderivanti dalla compravendita dei fattori produttivi. Il nuovo profitto da massimizzare, senza piùvincoli, sarà quindi

(x) +X=1

[ − (x)] = (x) + λ [b− g (x)] = (λx)

funzione non solo delle quantità prodotte ma anche del sistema di prezzi λ delle risorse produttive.Il teorema di Lagrange afferma, sotto qualche ipotesi tecnica, che esiste un sistema di prezzi bλ =hb1 bi con il quale non conviene mai violare i vincoli. Detto in altri termini il problema di ottimo

libero

maxx

³bλx´

è equivalente al vincolato

maxx

(x) sub g (x) = b

2Ciò è accaduto perché, in questo esempio, () è una funzione lineare affine di .

Page 54: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

6.2 Moltiplicatori di Lagrange e prezzi ombra 49

nel senso che essi hanno la stessa soluzione sia in termini di punti di massimo sia, ovviamente, in

termini di profitto massimo.I prezzi b che svolgono questo ruolo sono detti prezzi ombra delle risorse produttive e il loro valore

svolge il compito di allineare i consumi alle disponibiltà esistenti. In tal senso

• b 0 disincentiva consumi superiori a ; un valore elevato serve a compensare elevateproduttività marginali della risorsa .

• b 0 disincentiva consumi inferiori a ; un valore molto negativo serve a compensare basseproduttività marginali della risorsa .

• b = 0 lascia libero il consumo della risorsa : ciò accade il problema originale non spinge aviolare il vincolo -esimo.

Page 55: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

50 6. Vincoli di uguaglianza

Page 56: Dispensa Matematica - Spazi Vettoriali, Differenziazione, Ottimizzazione (M.Cigola)

Bibliografia

[1] M. S. Bazaraa, H. D. Sherali, C. M. Shetty (1993), Nonlinear Programming: theory andalgorithms, 2 ed., J. Wiley & Sons, New York.

[2] E. Castagnoli, L. Peccati (1979), Matematica per l’analisi economica, Etas Libri, Milano.

[3] E. Castagnoli, L. Peccati (1996), La matematica in azienda: strumenti e modelli, fascc. 1-5,2 ed., Egea, Milano.

[4] J. C. Culioli (1994), Introduction à l’Optimisation, Edition Marketing, Paris.

[5] G. Giorgi (1998), Elementi di algebra lineare, Giappichelli, Torino.

[6] A. Guerraggio, S. Salsa (1997), Metodi matematici per l’economia e le scienze sociali,Giappichelli, Torino.

[7] C. D. Pagani, S. Salsa (1990), Analisi matematica, voll. 1 e 2, Masson, Milano.

[8] G. E. Šilov (1979), Analisi matematica: funzioni di più variabili reali, Mir, Mosca.

[9] C. P. Simon, L. Blume (1994), Mathematics for Economists, 3 ed., W. W. Norton &Co., NewYork.