Appunti di Algebra Lineare e Matrici · 2006. 10. 10. · Basilio Bona - Algebra Lineare e Matrici...

Appunti di Algebra Lineare e Matrici

Basilio BonaDipartimento di Automatica e Informatica

Politecnico di Torino

Internal Report: DAUIN/BB-2003-09-01

Capitolo 1

Matrici e vettori

Il lettore interessato puo fare riferimento a numerosi libri che trattano le matrici el’algebra vettoriale; in lingua italiana posso suggerire i testi di base [8, 9], in ingleseun classico per la teoria della matrici e rappresentato da [4], mentre per l’algebralineare consiglio il testo di Strang [10]. Le lezioni videoregistrate di quest’ultimosono visibili alla pagina Web del MIT OpenCourseWare, all’indirizzo [1].

1.1 Definizioni

Con il termine matrice si definisce un insieme composto da elementi ordinati in mrighe e n colonne, che viene indicato da una delle notazioni seguenti:

A = Am×n = [aij] =

a11 a12 · · · a1n

a21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

Gli elementi aij posso essere variabili reali, quando aij ∈ R o variabili complesse,quando aij ∈ C; allora si scrive A ∈ Rm×n oppure A ∈ Cm×n. In questa Appendiceconsideriamo di solito matrici reali, salvo quando espressamente dichiarato. Se n =1, abbiamo una matrice particolare, detta vettore colonna o semplicemente vettore.

Data una matrice Am×n si definisce matrice trasposta la matrice ottenuta scambian-do le righe e le colonne

ATn×m =

a11 a21 · · · am1

a12 a22 · · · am2...

.... . .

...a1n a2n · · · amn

Vale la proprieta che (AT)T = A.

2

Basilio Bona - Algebra Lineare e Matrici 3

Una matrice si dice quadrata se m = n. Se una matrice e quadrata, anche la suatrasposta e quadrata. Una matrice quadrata n × n si dice triangolare superiore seaij = 0 per i > j

An×n =

a11 a12 · · · a1n

0 a22 · · · a2n...

.... . .

...0 0 · · · ann

Se una matrice quadrata e triangolare superiore, la sua trasposta e triangolareinferiore

ATn×n =

a11 0 · · · 0a12 a22 · · · 0...

.... . .

...a1n a2n · · · ann

Se una matrice K ha elementi complessi kij = aij + jbij, (dove j =√−1) si indica

con K la matrice coniugata, ossia quella che ha elementi kij = aij − jbij.

Data una matrice complessa K , si chiama matrice aggiunta K ∗ la matrice trasposta

coniugata, K ∗ = KT

= KT. Alcuni testi indicano questa matrice con il simboloK † oppure con il simbolo KH .

Una matrice reale quadrata si dice simmetrica se A = AT, una matrice complessasi dice autoaggiunta o hermitiana se K = K ∗. In una matrice reale simmetrica vi

sono al piun(n + 1)

2elementi indipendenti.

Una matrice quadrata si dice diagonale se aij = 0 per i 6= j

An×n = diag(ai) =

a1 0 · · · 00 a2 · · · 0...

.... . .

...0 0 · · · an

Una matrice diagonale e sempre simmetrica.

Una matrice quadrata A si dice antisimmetrica se A = −AT; dati i vincoli impostida questa relazione, la matrice antisimmetrica ha la seguente struttura

An×n =

0 a12 · · · a1n

−a12 0 · · · a2n...

.... . .

...−a1n −a2n · · · 0

In una matrice antisimmetrica vi sono al piun(n− 1)

2elementi indipendenti e non

nulli. Vedremo in seguito alcune importanti proprieta delle matrici antisimmetriche3× 3.


1.2 Operazioni sulle matrici

Le matrici sono elementi di un’algebra (lineare) detta algebra della matrici .

Ricordiamo che, in generale, un’algebra e uno spazio lineare (vettoriale) con l’ag-giunta di un operatore (prodotto) bilineare.1

Uno spazio lineare e una struttura matematica in cui sono definiti gli elementi dellospazio, che indicheremo, per il caso che stiamo trattando, con il simbolo maiuscolograssetto A, e alcune altre condizioni, qui di seguito elencate:

1) e definita un’operazione di somma, indicata con il simbolo +; la somma deveessere commutativa. Esiste un elemento neutro rispetto alla somma detto O .Esso prende il nome di elemento nullo (relativamente alla somma).

2) per ogni elemento A dello spazio, data una variabile α reale o complessa2,esiste l’operazione di prodotto per α, tale che αA appartiene ancora allo spazio.Inoltre, date due variabili scalari α e β,

(a) vale la proprieta associativa rispetto al prodotto degli scalari: α(βA) =(αβ)A;

(b) vale la proprieta distributiva rispetto alla somma: α(A+B) = αA+αB ;

(c) vale la proprieta distributiva rispetto al prodotto per scalare: (α+β)A =αA + βA;

Nel caso particolare delle matrici queste proprieta generali prendono le forme parti-colari descritte nel seguito.

Prodotto per scalare

αA = α

a11 a12 · · · a1n

a21 a22 · · · a2n...

.... . .

...am1 am2 · · · amn

=

αa11 αa12 · · · αa1n

αa21 αa22 · · · αa2n...

.... . .

...αam1 αam2 · · · αamn

1per bilinearita si intende la linearita rispetto a entrambi gli operandi.2ci limiteremo a considerare il caso di α reale.


Somma di matrici

A + B =

a11 + b11 a12 + b12 · · · a1n + b1n

a21 + b21 a22 + b22 · · · a2n + b2n...

.... . .

...am1 + bm1 am2 + bm2 · · · amn + bmn

Per poter essere sommate, le matrici devono avere le stesse dimensioni.

Valgono le seguenti proprieta, che sono state genericamente affermate nella condi-zione 1) precedente:

A + O = A

A + B = B + A

(A + B) + C = A + (B + C )

(A + B)T = AT + BT

L’elemento neutro o nullo O prende il nome di matrice nulla. L’operazione differenzaviene definita con l’ausilio dello scalare α = −1:

A−B = A + (−1)B .

Prodotto di matrici

Indicheremo per ora l’operatore prodotto con il simbolo ·, ma nell’uso comune essoviene quasi sempre omesso, come si usa fare per il simbolo di prodotto tra grandezzescalari.

L’operazione si effettua con la ben nota regola “riga per colonna”: il genericoelemento cij della matrice prodotto Cm×p = Am×n ·Bn×p vale

cij =n∑

k=1

aikbkj

La proprieta di bilinearita del prodotto tra matrici e garantita, in quanto si verificaimmediatamente che, dato uno scalare generico α, vale la seguente identita:

α(A ·B) = (αA) ·B = A · (αB)

Valgono le seguenti proprieta, anch’esse genericamente fissate nelle condizioni 2)(a)-(c) precedenti:

A ·B ·C = (A ·B) ·C = A · (B ·C )A · (B + C ) = A ·B + A ·C(A + B) ·C = A ·C + B ·C(A ·B)T = BT ·AT

In generale si verifica quanto segue:


• il prodotto tra matrici non e commutativo: A · B 6= B · A, salvo in casiparticolari;

• A ·B = A ·C non implica B = C , salvo in casi particolari;

• A·B = O non implica che sia A = O oppure B = O , salvo in casi particolari.

Esiste un elemento neutro rispetto al prodotto, che prende il nome di matrice identitae viene indicata con I n oppure semplicemente I quando non ci sono ambiguita nelladimensione; data una matrice rettangolare Am×n si ha

Am×n = ImAm×n = Am×nI n.

Oltre a queste operazioni fondamentali, esistono altre funzioni su matrici che elen-cheremo brevemente nel seguito.

Potenza di matrice

Data una matrice quadrata A ∈ Rn×n, la potenza k-esima di matrice vale

Ak = A ·A · · ·A k volte

Una matrice si dice idempotente se

A2 = A.

Traccia

La traccia di una matrice quadrata An×n e la somma dei suoi elementi diagonali

tr (A) =n∑

k=1

akk

La traccia di una matrice soddisfa le seguenti proprieta

tr (αA + βB) = α tr (A) + β tr (B)tr (AB) = tr (BA)tr (A) = tr (AT)tr (A) = tr (T−1AT ) per T non singolare (vedi oltre)


Determinante

Data la matrice A ∈ Rn×n, indichiamo con A(ij) la matrice quadrata di dimensioni(n − 1) × (n − 1) ottenuta cancellando la i-esima riga e la j-esima colonna dellamatrice A. Ad esempio, data la matrice

A =

1 −5 3 2

−6 4 9 −77 −4 −8 20 −9 −2 −3

si ha

A(23) =

1 −5 27 −4 20 −9 −3

Si definisce minore di ordine p di una matrice Am×n il determinante Dp di unasottomatrice quadrata ottenuta selezionando p righe e p colonne qualsiasi di Am×n.Esistono tanti minori quante sono le scelte possibili di p su m righe e p su n colonne.

Si definiscono minori principali di ordine k di una matrice Am×n i determinanti Dk,con k = 1, · · · , min{m, n}, ottenuti selezionando le prime k righe e k colonne dellamatrice Am×n.

Si definisce minore complementare Drc di un generico elemento arc di una matricequadrata An×n il determinante di A(rc)

Drc = det(A(rc)).

Si definisce complemento algebrico o cofattore (in inglese cofactor) di un elementoarc di una matrice quadrata An×n il prodotto

Arc = (−1)r+cDrc

Una volta definito il complemento algebrico si puo definire il determinante di A.

Fissata una qualsiasi riga i, si ha la definizione per riga:

det (A) =n∑

k=1

aik(−1)i+k det (A(ik)) =n∑

k=1

aikAik

oppure, fissata una qualsiasi colonna j, si ha la definizione per colonna:

det (A) =n∑

k=1

akj(−1)k+j det (A(kj)) =n∑

k=1

akjAkj

Poiche le precedenti definizioni sono ricorsive e coinvolgono i determinanti di minorivia via piu piccoli, occorre definire il determinante della matrice 1 × 1, che valedet (aij) = aij.

In generale si hanno le proprieta seguenti:


• det(A ·B) = det(A) det(B);

• det(AT) = det(A);

• det(kAn×n) = kn det(An×n);

• se si effettua un numero s di scambi tra righe o tra colonne della matrice Aottenendo la matrice As, si ha det(As) = (−1)s det(A);

• se la matrice A ha due righe o due colonne uguali o proporzionali, si hadet(A) = 0;

• se la matrice A ha una riga o una colonna ottenibile da una combinazionelineare di altre righe o colonne, si ha det(A) = 0;

• se la matrice An×n e triangolare superiore o inferiore, si ha det(An×n) =∏ni=1 aii;

• se la matrice An×n e triangolare a blocchi, con p blocchi Aii sulla diagonale,si ha det(An×n) =

∏pi=1 detAii;

Una matrice A si dice singolare se det(A) = 0.

Rango

Si definisce rango (o caratteristica) della matrice Am×n il numero ρ(Am×n) definitocome il massimo intero p per cui esiste almeno un minore Dp non nullo.

Valgono le seguenti proprieta:

• ρ(A) ≤ min{m,n};• se ρ(A) = min{m,n}, la matrice A si dice a rango pieno;

• ρ(A ·B) ≤ min{ρ(A), ρ(B)}.• ρ(A) = ρ(AT);

• ρ(A ·AT) = ρ(AT ·A) = ρ(A);

D’ora in poi il prodotto tra matrici A ·B sara indicato semplicemente come AB .

Matrice aggiunta

Data una matrice quadrata A ∈ Rn×n, si definisce matrice aggiunta di A la matricequadrata Adj(A) = {αij} i cui elementi αij sono definiti come

αij = (−1)i+jDji

ossia quella matrice che ha come elemento di riga i e colonna j il minore comple-mentare del corrispondente elemento aji di riga j e colonna i.


Matrice inversa

Data una matrice quadrata A ∈ Rn×n si dice invertibile o non singolare se esiste lamatrice inversa A−1

n×n tale che

AA−1 = A−1A = I n

La matrice e invertibile se e solo se ρ(A) = n, ossia e di rango pieno; cio equivalead avere det(A) 6= 0.

L’inversa si ottiene come:

A−1 =1

det(A)Adj(A)

Valgono le seguenti proprieta:

• (A−1)−1 = A;

• (AT)−1 = (A−1)T.

Si definisce matrice ortonormale la matrice quadrata per cui A−1 = AT. Per questematrici vale quindi l’identita

ATA = AAT = I

Date due matrici quadrate di pari dimensioni A e B , vale la seguente identita

(AB)−1 = B−1A−1

Esiste un importante risultato, chiamato Lemma d’inversione, che stabilisce quantosegue: se A e C sono matrici quadrate invertibili e B e D sono matrici di dimensioniopportune, allora

(A + BCD)−1 = A−1 −A−1B(DA−1B + C−1)−1DA−1

La matrice (DA−1B + C−1) deve essere anch’essa invertibile.

Se la matrice quadrata A(t) e composta da elementi aij(t) tutti derivabili nel tempot, allora la derivata della matrice vale

d

dtA(t) = A(t) =

[d

dtaij(t)

]= [aij(t)]

Se la matrice quadrata A(t) ha rango ρ(A(t)) = n per ogni valore del tempo t,allora la derivata della sua inversa vale

d

dtA(t)−1 = −A−1(t)A(t)A(t)−1

La matrice inversa, quando esiste, permette risolvere la trasformazione lineare

y = Ax

in funzione dell’incognita x , come

x = A−1y .


Decomposizione di matrice

Data una matrice quadrata A, e sempre possibile decomporla in una somma di duematrici, come segue:

A = As + Aa (1.1)

dove

As =1

2(A + AT)

e una matrice simmetrica e

Aa =1

2(A−AT)

e una matrice antisimmetrica (vedi Sezione 1.4).

Data una matrice reale di dimensioni qualsiasi A ∈ Rm×n, risultano simmetricheentrambe le matrici seguenti

ATA ∈ Rn×n

AAT ∈ Rm×m

Trasformazioni di similarita

Data una matrice quadrata A ∈ Rn×n e una matrice quadrata non singolare T ∈Rn×n, la matrice B ∈ Rn×n ottenuta come

B = T−1AT oppure B = TAT−1

si dice similare ad A e la trasformazione si dice di similarita. Se la matrice A esimilare alla matrice diagonale Λ = diag(λi)

A = TΛT−1

si puo scrivereAT = TΛ

e se indichiamo con t i la i-esima colonna di T , ossia

T =[t1 · · · tn

]

avremo la nota formula che lega autovalori e autovettori (vedi Paragrafo 1.2.1)

At i = λit i

e quindi potremo dire che le costanti λi sono gli autovalori di A e i vettori t i sonogli autovettori di A, in generale non normalizzati.


1.2.1 Autovalori e autovettori

Data una matrice quadrata An×n, si chiamano autovalori della matrice (in ingleseeigenvalue) le soluzioni λi (reali o complesse) dell’equazione caratteristica

det(λI −A) = 0

det(λI −A) e un polinomio in λ, detto polinomio caratteristico.

Se gli autovalori sono tutti distinti, si chiamano autovettori (in inglese eigenvector)i vettori u i che soddisfano l’identita

Au i = λiu i

Se gli autovalori non sono tutti distinti, si ottengono autovettori generalizzati, la cuideterminazione va oltre gli scopi di questa Appendice.

Geometricamente gli autovettori rappresentano quelle particolari “direzioni” nellospazio Rn, in cui si applica la trasformazione lineare rappresentata da A, che si tra-sformano in se stesse; sono quindi le direzioni invarianti rispetto alla trasformazioneA e gli autovalori forniscono le rispettive costanti di “scalamento” lungo questedirezioni.

L’insieme degli autovalori di una matrice A sara indicato con Λ(A) oppure con{λi(A)}; l’insieme degli autovettori di A sara indicato con {u i(A)}. In generale,essendo gli autovettori delle rappresentazioni di direzioni invarianti rispetto allatrasformazione rappresentata da A, essi sono definiti a meno di una costante, ossiapossono o meno essere normalizzati; tuttavia e convenzione tacita che essi abbianonorma unitaria, salvo quando altrimenti dichiarato.

Proprieta degli autovalori

Data una matrice A e i suoi autovalori {λi(A)}, sara

{λi(A + cI )} = {(λi(A) + c)}Data una matrice A e i suoi autovalori {λi(A)}, sara

{λi(cA)} = {(cλi(A)}Data una matrice triangolare (superiore o inferiore)

a11 a12 · · · a1n

0 a22 · · · a2n...

.... . .

...0 0 · · · ann

,

a11 0 · · · 0a21 a22 · · · 0...

.... . .

...an1 an2 · · · ann


i suoi autovalori sono gli elementi sulla diagonale {λi(A)} = {aii}; lo stesso vale peruna matrice diagonale.Data una matrice An×n e i suoi autovalori {λi(A)}, sara

det(A) =n∏

i=1

λi

e

tr (A) =n∑

i=1

λi

Data una qualunque trasformazione invertibile, rappresentata dalla matrice T , gliautovalori di A sono invarianti alle trasformazioni di similarita

A = T−1AT

ossia{λi(A)} = {λi(A)}

Se costruiamo una matrice di trasformazione M ordinando per colonne gli autovet-tori normalizzati u i(A)

M =[u1 · · · un

]

allora la trasformazione di similarita fornisce una matrice diagonale

Λ =

λ1 0 · · · 00 λ2 · · · 0...

.... . .

...0 0 · · · λn

= M −1AM

La matrice M si chiama matrice modale.Se la matrice A e simmetrica, i suoi autovalori sono tutti reali e si ha l’identita

Λ = M TAM

In questo caso la matrice M e ortonormale.

1.2.2 Decomposizione ai valori singolari

Data una matrice A ∈ Rm×n qualsiasi, di rango r = ρ(A) ≤ s con s = min{m,n},essa si puo fattorizzare secondo la decomposizione ai valori singolari, come segue:

A = UΣV T (1.2)

dove:


• U e una matrice (m×m) ortonormale

U =[u1 · · · um

]; UU T = Im

contenente per colonne gli autovettori u i della matrice AAT

• V e una matrice n× n ortonormale

V =[v 1 · · · vn

]; VV T = I n

contenente per colonne gli autovettori v i della matrice ATA

• Σ e una matrice (m× n) con la seguente struttura

se m < n Σ =[

Σ s O]

se m = n Σ = Σ s

se m > n Σ =

[Σ s

O

].

La matrice Σ s = diag(σi) e diagonale di dimensioni s × s e contiene sulladiagonale i valori singolari, definiti come segue.

• σi(A) ≥ 0 sono detti valori singolari e coincidono con le radici quadrate nonnegative degli autovalori della matrice simmetrica ATA:

σi(A) =

√λi(A

TA) =

√λi(AAT) σi ≥ 0

ordinati in ordine decrescente

σ1 ≥ σ2 ≥ · · · ≥ σs ≥ 0

se r < s vi sono r valori singolari positivi, mentre i restanti s− r sono nulli:

σ1 ≥ σ2 ≥ · · · ≥ σr > 0; σr+1 = · · · = σs = 0

Alternativamente, possiamo descrivere la decomposizione della matrice A nel modoseguente, che e del tutto analogo a quello dato in (1.2), ma mette in evidenza i solivalori singolari positivi:

A =[P P

]︸︷︷︸

U

[Σ r OO O

]

︸︷︷︸Σ

[QT

QT

]

︸︷︷︸V T

= PΣ rQT =

s∑i=1

σip iqTi (1.3)

dove


• P e una matrice ortonormale m×r, P e una matrice ortonormale m×(m−r);

• Q e una matrice ortonormale n×r, QT e una matrice ortonormale n×(n−r);

• Σ r e una matrice diagonale r × r che contiene sulla diagonale i soli valorisingolari positivi σi, i = 1, · · · , r.

Il rango r della matrice A e pari al numero r ≤ s di valori singolari non nulli.

Un altro modo ancora di definire la decomposizione SVD di Am×n e il seguente:

Am×n = UΣV T (1.4)

dove ora

• U e una matrice (m× n) ortonormale

U =[u1 · · · un

]

I vettori colonna u i di U sono chiamati vettori singolari sinistri di A, ecorrispondono agli n autovettori della matrice ATA, cioe ATAu i = σ2

i u i.

• V e una matrice n× n ortonormale

V =[v 1 · · · vn

]

I vettori colonna v i di V sono chiamati vettori singolari destri di A, e corri-spondono agli m autovettori della matrice AAT, cioe AATv i = σ2

i v i.

• Σ e una matrice (n × n) diagonale Σ = diag(σi) e contiene sulla diagonale ivalori singolari, definiti come descritto sopra.

Si fa notare che:

• La decomposizione singolare esiste sempre ed e unica, a meno

1. di identiche permutazioni delle colonne di U , V , Σ ,

2. combinazioni lineari di colonne di U e V con con uguali valori singolari.

• data una matrice A ∈ Rm×n qualsiasi, le due matrici ATA e AAT sonosimmetriche, hanno gli stessi valori singolari positivi e differiscono soltantoper il numero di valori singolari nulli.

Altre proprieta della decomposizione singolare

• le colonne u i che corrispondono a valori singolari positivi sono una base perlo spazio immagine (range) di A.

• le colonne v i che corrispondono a valori singolari positivi sono una base perlo spazio nullo (kernel o null-space) di A.


1.3 Vettori e spazi vettoriali

Un vettore puo essere semplicemente interpretato come una particolare matricecolonna di dimensioni n× 1:

v =

v1

v2...

vn

Esso gioca un ruolo fondamentale in molti campi dell’ingegneria, dalla modellisti-ca dei sistemi dinamici alla cinematica dei corpi rigidi nello spazio tridimensio-nale, dall’elettromagnetismo alla statica – per citarne solo alcuni – permettendodi passare agevolmente dalla rappresentazione algebrica di un fenomeno alla suarappresentazione geometrica e viceversa.

In generale, un vettore e un elemento di uno spazio vettoriale. Nella Sezione 1.2abbiamo gia fatto conoscenza con gli spazi vettoriali delle matrici. Ora ne daremouna definizione piu completa.

1.3.1 Spazio vettoriale

Come detto sopra, gli elementi di uno spazio vettoriale rappresentano entita assaiutili nello studio di molti settori dell’ingegneria e della fisica classica e moderna [3].

Dato un campo3 qualsiasi F , lo spazio vettoriale (in inglese vector space) V(F), el’insieme di quegli elementi, chiamati vettori , che soddisfano le seguenti proprietaassiomatiche:

1. esiste l’operazione +, detta somma vettoriale, tale che {V(F); +} forma ungruppo abeliano; l’elemento identita e chiamato 0;

2. per ogni α ∈ F e ogni v ∈ V(F), esiste un vettore αv ∈ V(F); inoltre perogni α, β ∈ F e ogni v ,w ∈ V(F) valgono le seguenti proprieta:

associativa rispetto al prodotto per scalare: α(βv) = (αβ)videntita rispetto al prodotto per scalare: 1(v) = v ; ∀vdistributiva rispetto alla somma vettoriale: α(v + w) = αv + αwdistributiva rispetto al prodotto per scalare: (α + β)v = αv + βv

(1.5)

Uno spazio vettoriale e detto reale se F = R, e detto complesso se F = C.

3per le definizioni di campo e gruppo, vedere [2, Appendice A]


Esempio classico di spazio vettoriale reale e quello rappresentato da n-ple di reali,Vn(R) = Rn; in questi casi un elemento (vettore) viene rappresentato per componenti

v =

v1

v2...

vn

, v ∈ Rn, vi ∈ R

Poiche le proprieta (1.5) inducono una struttura lineare sullo spazio V, esso vieneindicato anche con il termine di spazio vettoriale lineare o semplicemente spaziolineare (in inglese linear vector space o semplicemente linear space).

Il termine “vettore” ha un significato molto ampio, nel senso che essa include entitamatematiche in apparenza anche molto diverse. Ad esempio, non solo le n-ple direali, ma anche le sequenze infinite di numeri reali o complessi, le funzioni continueche assumono valori reali nell’intervallo [a, b], i polinomi a coefficienti complessidefiniti nell’intervallo [a, b] ecc. [7].

Come si puo notare, tra gli assiomi dello spazio vettoriale non compare alcunaoperazione di prodotto.

Per questo motivo la struttura dello spazio vettoriale, ossia l’insieme di proprieta chederivano dagli assiomi, non permette di definire concetti geometrici quali l’angoloo la distanza, che invece sono impliciti nella definizione puramente geometrica divettore. Per consentire di definire tali concetti e necessario dotare lo spazio vettorialedi una struttura quadratica o metrica. L’introduzione di una metrica in uno spaziovettoriale genera un’algebra che rende possibile l’esecuzione di calcoli su oggettigeometrici. La metrica piu comune e quella indotta dalla definizione di prodottoscalare.

Prima di passare alla definizione di questo prodotto, riassumiamo brevemente alcuneproprieta delle funzioni lineari.

1.3.2 Funzioni lineari

Dati due spazi vettoriali U(F) e V(F), che per comodita assumiamo definiti entrambisul campo F , una funzione L : U→ V si dice lineare, se per ogni a , b ∈ U e λ ∈ Fvalgono i seguenti assiomi:

L(a + b) = L(a) + L(b) = La + LbL(λa) = λL(a) = λLa (1.6)

La funzione lineare L : U → U viene anche chiamata operatore lineare, trasforma-zione lineare, applicazione lineare oppure endomorfismo (in inglese endomorphism).

L’insieme di tutte le funzioni lineari L : U → V forma, a sua volta, uno spaziolineare vettoriale L(F).


L’insieme delle funzioni lineari L : U → U forma un anello, indicato con il simboloEnd(U).

Ricordiamo infine che qualsiasi funzione o trasformazione lineare da U a V e rap-presentabile con una matrice quadrata A ∈ Rm×n, dove m e n sono le dimensioni(vedere piu oltre la definizione di dimensione) rispettivamente di V e U.

Indipendenza lineare – Base – Dimensione

Dati n vettori qualsiasi a i ∈ V(F), un vettore generico v ∈ V(F) e detto combina-zione lineare di {a1,a2, . . . ,an} se esso puo essere scritto come

v = v1a1 + v2a2 + · · · vnan

con vi ∈ F . L’insieme di vettori {a1,a2, . . . ,an} e detto linearmente indipendentese nessun a i puo essere scritto come combinazione lineare dei restanti a j, j 6= i. Inaltre parole, l’unica soluzione dell’equazione

v1a1 + v2a2 + · · · vnan = 0

e quella con v1 = v2 = · · · = vn = 0. In caso contrario si dice che a i e linearmentedipendente dagli altri vettori.

Nella combinazione lineare v = v1a1 + v2a2 + · · · vnan, se tutti i vettori a i so-no linearmente indipendenti, allora gli scalari vi sono unici e prendono il nome dicoordinate o componenti di v .

Le combinazioni lineari di vettori linearmente indipendenti {a1,a2, . . . ,ak}, conk ≤ n, formano un sottospazio S(F) ⊆ V(F). Si dice che questo sottospazio ecoperto o descritto (in inglese spanned) da {a1,a2, . . . ,ak}.Ogni insieme di vettori {a1,a2, . . . ,an} che risulti linearmente indipendente, formauna base in V. Tutte le basi in V hanno lo stesso numero di elementi (nel nostrocaso n), che prende il nome di dimensione dello spazio e si indica con dim(V).

1.3.3 Matrici come rappresentazione di operatori lineari

Dati due spazi vettoriali X ⊆ Rn e Y ⊆ Rm, aventi rispettivamente dimensioni n em, e dati due generici vettori x ∈ X e y ∈ Y , la piu generica trasformazione linearetra gli spazi si puo rappresentare attraverso l’operatore matriciale A ∈ Rm×n, comesegue:

y = Ax ; x ∈ Rn; y ∈ Rm.

Quindi una matrice puo essere sempre interpretata come un operatore che prendeun vettore dello spazio di “partenza” X e lo trasforma in un vettore dello spaziodi “arrivo” Y . Qualunque trasformazione lineare ha (almeno) una matrice che la


rappresenta e, di converso, qualunque matrice e la rappresentazione di una qualchetrasformazione lineare.

Si definisce spazio immagine (in inglese range) della trasformazione A il sottospaziodi Y definito dalla seguente proprieta:

R(A) = {y | y = Ax , x ∈ X}; R(A) ⊆ Y

Si definisce spazio nullo (in inglese kernel o null-space) della trasformazione A ilsottospazio di X definito dalla seguente proprieta:

N (A) = {x | 0 = Ax , x ∈ X}; N (A) ⊆ XLo spazio nullo rappresenta cioe tutti quei vettori di X che vengono trasformati nelvettore nullo (l’origine) di Y .

Le dimensioni dello spazio immagine e dello spazio nullo si chiamano, rispettivamen-te, rango ρ(A) (che abbiamo gia definito in 1.2) e nullita ν(A):

ρ(A) = dim(R(A)); ν(A) = dim(N (A)).

Se X e Y hanno dimensioni finite, e questo e il nostro caso in quanto X ⊆ Rn eY ⊂ Rm, allora valgono le seguenti relazioni:

N (A) = R(AT)⊥

R(A) = N (AT)⊥

N (A)⊥ = R(AT)R(A)⊥ = N (AT)

dove il simbolo ⊥ indica il complemento ortogonale al (sotto-)spazio corrispondente.Ricordiamo che {0}⊥ = R.

Vale anche la seguente decomposizione ortogonale degli spazi X e Y (vedere [9] e[10])

X = N (A)⊕N (A)⊥ = N (A)⊕R(AT)Y = R(A)⊕R(A)⊥ = R(A)⊕N (AT)

dove il simbolo ⊕ indica la somma diretta tra due sottospazi.

1.3.4 Inversa generalizzata

Data una matrice reale qualsiasi A ∈ Rm×n, con m 6= n, la matrice inversa nonrisulta definita. Tuttavia, e possibile definire una classe di matrici, dette pseudo-inverse, inverse generalizzate o 1-inverse A−, che soddisfano la seguente relazione:

AA−A = A

Se la matrice A ha rango pieno, ossia ρ(A) = min{m,n}, e possibile definire dueclassi di matrici inverse generalizzate particolari


• se m < n (ossia ρ(A) = m), l’inversa destra di A e quella matrice Ad ∈ Rn×m

per cuiAAd = Im×m

• se n < m (ossia ρ(A) = n), l’inversa sinistra di A e quella matrice As ∈ Rn×m

per cuiAsA = I n×n

Tra le molte inverse destre e sinistre concepibili, due sono particolarmente impor-tanti:

• pseudo-inversa destra (m < n):

A+d = AT(AAT)−1

che rappresenta una particolare inversa destra. Si puo dimostrare che quandoρ(A) = m allora (AAT)−1 esiste.

• pseudo-inversa sinistra (n < m):

A+s = (ATA)−1AT

che rappresenta una particolare inversa sinistra. Si puo dimostrare che quandoρ(A) = n allora (ATA)−1 esiste.

Questa particolare pseudo-inversa sinistra prende anche il nome di pseudo-inversa di Moore-Penrose. In generale, anche se ATA non risulta invertibile, sipuo sempre definire una pseudo-inversa di Moore-Penrose, che e quella matriceA+ che soddisfa le seguenti relazioni:

AA+A = AA+AA+ = A+

(AA+)T = AA+

(A+A)T = A+A

(1.7)

Queste due pseudo-inverse coincidono con la matrice inversa quando A e quadratae ha rango pieno:

A−1 = A+d = A+

s

La trasformazione lineare associata alla matrice A ∈ Rm×n

y = Ax , (1.8)

con x ∈ Rn e y ∈ Rm, e equivalente ad un sistema di m equazioni lineari in nincognite, i cui coefficienti sono dati dagli elementi di A; questo sistema lineare puonon ammettere soluzioni, ammetterne una sola o ammetterne un numero infinito[10].

Se vogliamo utilizzare le pseudo-inverse definite sopra per risolvere il sistema linearein (1.8), dobbiamo distinguere due casi, sempre nell’ipotesi che il rango di A siapieno:


• m < n: abbiamo piu incognite che equazioni; allora, tra le infinite soluzio-ni possibili x ∈ Rn, scegliamo convenzionalmente quella che ha norma ‖x‖minima, che viene individuata da

x = A+d y = AT(AAT)−1y

Tutte le altre possibili soluzioni di y = Ax si ottengono come

x = x + v = A+d y + v

dove v ∈ N (A) e un vettore dello spazio nullo di A, che ha dimensioni n−m.Queste possibili soluzioni si possono anche esprimere in una forma alternativa,ovvero

x = A+d y + (I −A+

d A)w

dove w ∈ Rn e un vettore n × 1 qualsiasi. La matrice I −A+d A proietta w

nello spazio nullo di A, trasformandolo in v ∈ N (A); essa prende il nome dimatrice di proiezione.

• n < m: abbiamo piu equazioni che incognite; allora non esistono soluzioniesatte alla y = Ax , ma solo soluzioni approssimate, tali per cui esiste unerrore e = Ax − y 6= 0. Tra queste possibili soluzioni approssimate si sceglieconvenzionalmente quella che minimizza la norma dell’errore, ossia

x = arg minx∈Rn

‖Ax − y‖

Essa valex = A+

s y = (ATA)−1ATy

e geometricamente consiste nella proiezione ortogonale di y sul complementoortogonale di N (A), ovvero sul sottospazio R(AT). L’errore di approssima-zione, detto anche errore di proiezione, vale in questo caso

e = (I −AA+s )y

e la sua norma e minima, come detto sopra.

La somiglianza tra la matrice di proiezione I−A+d A e la matrice che fornisce l’errore

di proiezione I −AA+s verra spiegata nella Sezione 1.3.6.

Per calcolare le inverse generalizzate, si puo utilizzare la decomposizione ai valorisingolari; in particolare, ricordando la (1.3), la pseudo-inversa vale

A+ = V

[Σ−1

r OO O

]U T = QΣ−1

r PT.


1.3.5 Prodotti tra vettori

Abbiamo visto nella Sezione 1.3.1 che la definizione assiomatica di spazio vettorialenon comprenda anche la definizione di un prodotto, mentre per calcolare con entigeometrici e spesso necessario introdurre sia un prodotto sia una struttura quadraticao metrica, che possa fornire la “misura” degli elementi che si manipolano; una dellemetriche piu comuni e quella derivata dal prodotto scalare o interno tra vettori.

Prodotto scalare e norma di vettore

Dati due vettori reali a , b ∈ V(R), il prodotto scalare o interno (in inglese scalar oinner product) a ·b e un numero reale che puo venire definito sia in modo geometricosia in modo analitico (per componenti):

definizione geometrica: a · b = ‖a‖ ‖b‖ cos θ (1.9)

definizione analitica: a · b =∑

k

akbk = aTb (1.10)

dove ‖a‖ e la lunghezza del vettore a e θ, (0◦ ≤ θ ≤ 180◦) e l’angolo compreso traa e b. Alcuni testi indicano il prodotto scalare con il simbolo 〈a , b〉.Il prodotto scalare soddisfa le seguenti proprieta:

e distributivo rispetto alla somma: (a + b) · c = a · c + b · ce distributivo rispetto al prodotto per scalare: α(a · b) = (αa) · b = a · (αb)e commutativo: a · b = b · ae positivo: a · a > 0, ∀a 6= 0

(1.11)

La definizione geometrica di prodotto scalare implica di aver preventivamente defini-to il concetto di angolo e di lunghezza, mentre nell’approccio analitico la lunghezzaovvero la norma (in inglese norm) puo essere definita come grandezza derivata dalprodotto scalare

‖a‖ =√

a · a =

√∑

k

a2k =

√aTa (1.12)

e l’angolo tra a e b come

θ = cos−1

(a · b

‖a‖ ‖b‖)

Si chiamano spazi euclidei o cartesiani quelli per i quali e definita la norma euclidea(1.12).

La norma euclidea derivata dal prodotto scalare non e l’unica norma possibile per“misurare le dimensioni” di un vettore. In generale la norma di un vettore devesoddisfare le seguenti tre proprieta (assiomi della norma):


1. ‖x‖ > 0 per ogni x 6= 0, ‖x‖ = 0 se e solo se x = 0;

2. ‖x + y‖ ≤ ‖x‖+ ‖y‖ (diseguaglianza triangolare);

3. ‖αx‖ = |α| ‖x‖ per ogni scalare α e ogni x .

Generalizzando la norma euclidea, possiamo definire la p-norma ‖·‖p come

‖x‖p =

(∑

k

|ak|p)1/p

Tra le p-norme piu usate nei vari campi della matematica e dell’ingegneria ricordia-mo:

la norma 2 o euclidea p = 2 ‖x‖2 =√

xTx

la norma 1 p = 1 ‖x‖1 =∑

k |ak|la norma ∞ o max-norma p = ∞ ‖x‖∞ = maxk |xk|

Si definisce versore un generico vettore diviso per la sua norma

u =x

‖x‖ ; ‖u‖ = 1.

Il prodotto scalare · opera tra due vettori e genera uno scalare, mentre in generalevorremmo poter definire un prodotto piu generale che operi su due vettori e genericome risultato ancora un vettore.

E possibile definire quest’ultimo prodotto anche nel caso generale di vettori appar-tenenti a spazi n-dimensionali, ma per i fini che ci proponiamo e sufficiente limitarsial caso tridimensionale, in cui possiamo definire il cosiddetto prodotto vettoriale.

Prodotto vettoriale o esterno

Nel caso particolare di due vettori tridimensionali

x =[x1 x2 x3

]Te y =

[y1 y2 y3

]T, con x ,y ∈ R3

il prodotto vettoriale o esterno4 (in inglese outer o external o vector product) x ×ye un vettore che soddisfa le relazioni seguenti:

z = x × y =

x2y3 − x3y2

x3y1 − x1y3

x1y2 − x2y1

(1.13)

4 Per il prodotto esterno utilizzeremo il simbolo ×, che e molto comune nella letteraturaanglosassone; testi italiani usano piu spesso il simbolo ∧.


La (1.13) puo essere scritta come prodotto della matrice antisimmetrica S(x ) per ilvettore y :

x × y =

0 −x3 x2

x3 0 −x1

−x2 x1 0

y = S(x )y

Le proprieta delle matrici antisimmetriche e i loro utilizzi sono descritte nel paragrafo1.4.

La norma del prodotto esterno vale

‖z‖ = ‖x‖ ‖y‖ sin θ (1.14)

dove θ e l’angolo tra i due vettori x e y misurato sul piano xy definito da questiultimi; la direzione di z e ortogonale al piano, il verso e dato dall’applicazione dellaregola della mano destra5, per portare x su y compiendo la rotazione di angolominimo.

Il prodotto vettoriale soddisfa le seguenti proprieta:

e non commutativo o anticommutativo: x × y = − (y × x )e distributivo rispetto alla somma: x × (y + z ) = (x × y)e distributivo rispetto al prodotto per scalare: α (x × y) = (αx )× y = x × (αy)e non associativo: x × (y × z ) 6= (x × y)× z

(1.15)

Dati tre vettori tridimensionali x , y , z , si definisce prodotto triplo il prodottoesterno triplo non associativo, ossia:

x × (y × z ) = (x · z )y − (x · y) z(x × y)× z = (x · z )y − (y · z )x

(1.16)

Dati tre vettori x , y , z , vale inoltre la seguente relazione:

(x × y) · z = − (z × y) · x (1.17)

Il prodotto vettoriale, come abbiamo visto, e definito solo in spazi vettoriali didimensione 3; la generalizzazione di questo prodotto a spazi n-dimensionali, conn > 3, richiede di introdurre le algebre di Clifford [5], cosa che va oltre gli scopi diquesta Appendice.

5Regola della mano destra: se con le dita della mano destra si accompagna il movimento cheporta x a sovrapporsi a y secondo il percorso a minimo angolo, allora il pollice si allinea lungox × y ; questa e la stessa regola che definisce i tre versori di un sistema di riferimento cartesianodestrorso.


Prodotto diadico

Dati due vettori x , y ∈ Rn, si definisce prodotto diadico il seguente

x ¦ y = xyT = D(x ,y) =

x1y1 · · · x1yn... xiyi

...xny1 · · · xnyn

Si fa notare che alcuni testi anglosassoni chiamano questo prodotto external product,generando confusione con il prodotto vettoriale.

Risulta immediato dimostrare che il prodotto non e commutativo, in quanto, ingenerale xyT 6= yxT, essendo

D(x ,y) = DT(y ,x )

risulta quindi x ¦ y 6= y ¦ x .

La matrice D che si ottiene come risultato del prodotto risulta sempre avere rangoρ(D) = 1, qualunque sia la dimensione n dei vettori di partenza.

Una proprieta utile che lega il prodotto vettoriale triplo e il prodotto diadico pervettori tridimensionali e la seguente

x × (y × z ) = [(x · z ) I − z ¦ x ]y(x × y)× z = [(x · z ) I − x ¦ z ]y

E interessante sottolineare che, mentre il prodotto esterno al primo termine delleequazioni precedenti, e stato definito solo per vettori tridimensionali, i prodottial secondo termine si possono calcolare indipendentemente dalle dimensioni dellospazio vettoriale.

Altri prodotti

Poiche il prodotto interno e un prodotto tra vettori che fornisce uno scalare edil prodotto esterno non e associativo, nasce la necessita di definire un prodottoab tra vettori che obbedisca alla maggior parte delle regole della moltiplicazione“ordinaria”, ovvero possegga almeno le proprieta di essere associativo e distributivo,mentre la commutativita non e essenziale. Si richiede anche che, nel fare il prodotto,venga preservata la norma, ossia ‖ab‖ = ‖a‖ ‖b‖.Sono stati definiti in passato prodotti tra vettori che soddisfano questi requisiti. Disolito essi vengono trascurati nei testi elementari di algebra vettoriale. Tra questi,un qualche interesse per l’applicazione alla cinematica teorica e alla computer vision,oltreche nella fisica quantistica, rivestono il prodotto di Hamilton e il prodotto diClifford.


Prodotto di Hamilton

Il prodotto di Hamilton trova la sua giustificazione nell’ambito della definizione diprodotto tra quaternioni. Qui ci limitiamo a definire tale prodotto come quel vettorec ottenuto dai vettori a e b nel modo seguente

c = ab = −a · b + a × b (1.18)

Questo prodotto ha solo piu un significato storico, in quanto presenta la spiacevolecaratteristica di fornire un numero negativo come risultato del prodotto di un vettoreper se stesso

aa = −a · a + a × a = −‖a‖2 (1.19)

Esso fu presto abbandonato in favore di altri piu semplici e utili, come i precedentiprodotti interno ed esterno, oppure piu generali dal punto di vista geometrico, comeil prodotto di Clifford.

Prodotto di Clifford

E stato dimostrato che un prodotto vettoriale che permetta di soddisfare gli stessiassiomi del prodotto tra due numeri reali, ossia la distributivita, l’associativita ela commutativita, non esiste per spazi vettoriali con dimensioni n ≥ 3; se si lasciacadere l’assioma della commutativita, si puo definire il prodotto di Clifford, dal nomedel matematico inglese William Clifford (1845-79) che per primo lo introdusse. Essoconsente di estendere a spazi vettoriali Rn, con n > 3, il prodotto esterno definitoin 1.3.5.

Limitiamoci in un primo momento, per semplicita, al piano R2: dati due vettoria = a1i + a2j , e b = b1i + b2j , il prodotto di Clifford risulta essere definito come:

ab = a1b1 + a2b2 + (a1b2 − a2b1)e12 = a · b + (a1b2 − a2b1)e12 (1.20)

dove e12 prende il nome di bivettore. Esso e definito come l’area dotata di segno delparallelogrammo compreso tra i e j ; in un certo senso e analogo al prodotto esternoi × j , salvo il fatto che quest’ultimo e interpretato come vettore ortogonale al pianoin cui sono contenuti i e j , mentre il primo e da interpretarsi come una “pezza” (ininglese patch) nel medesimo piano, come illustrato in Fig. 1.1.

L’estensione allo spazio R3 si ottiene assumendo che sia verificata per il prodotto laseguente identita:

cc = c2 = c · c (1.21)

se poi consideriamo c = a + b, otteniamo:

(a + b)(a + b) = (a + b) · (a + b) (1.22)

da cui segueab + ba = 2a · b (1.23)


i

j

12e

×i j

i

j

12e

×i j

Figura 1.1: Il bivettore e12 nel piano R3.

e quindiab = 2a · b − ba (1.24)

Il lettore interessato puo fare riferimento al testo [6] per ulteriori approfondimenti.

1.3.6 Proiezioni e matrici di proiezione

Dato uno spazio vettoriale reale V(Rn) di dimensioni n, dotato di prodotto scalare,ed un suo sottospazio W(Rk) di dimensioni k ≤ n, e possibile definire la proiezionedei vettori v ∈ V sul sottospazio W.

L’operatore di proiezione e definito dalla matrice quadrata di proiezione P ∈ Rn×n,le cui colonne sono le proiezioni degli elementi della base di V in W. Una matricee di proiezione se e solo se P2 = P ossia se essa e idempotente. La proiezione puoessere ortogonale, oppure non ortogonale; nel primo caso la matrice P e simmetrica,nel secondo caso no. Se P e una matrice di proiezione, anche I −P lo e.

Classici esempi di matrici di proiezione ortogonale sono le matrici associate allapseudo-inversa sinistra P1 = AA+

s e P2 = I −AA+s e alla pseudo-inversa destra

P3 = A+d A e P4 = I −A+

d A (vedi Sezione 1.3.4).

Dal punto di vista geometrico, P1 proietta ogni vettore v ∈ V nel spazio immagineR(A) (vedi 1.3.3), mentre P2 proietta v nel suo complemento ortogonale R(A)⊥ =N (AT).

1.3.7 Norme di matrice

Come per il vettore, e possibile fornire una “misura” della “grandezza” di una ma-trice, definendone la norma. Poiche una matrice rappresenta una trasformazionelineare tra vettori, la norma misura quando grande sia questa trasformazione, madeve in qualche modo “normalizzare” il risultato perche questo non sia influenzatodalla “grandezza” del vettore che viene trasformato, ossia:

‖A‖ = sup‖x‖

‖Ax‖‖x‖ = sup

‖x‖=1

‖Ax‖ .


Data una matrice quadrata A ∈ Rn×n la sua norma deve soddisfare in generale iseguenti assiomi generali:

1. ‖A‖ > 0 per ogni A 6= O , ‖A‖ = 0 se e solo se A = O ;

2. ‖A + B‖ ≤ ‖A‖+ ‖B‖ (diseguaglianza triangolare);

3. ‖αA‖ = |α| ‖A‖ per ogni scalare α e ogni A;

4. ‖AB‖ ≤ ‖A‖ ‖B‖.

Data A ∈ Rn×n e i suoi autovalori {λi(A)}, vale la seguente diseguaglianza

1∥∥A−1∥∥ ≤ |λi| ≤ ‖A‖ ∀i = 1, . . . , n

Fatte queste premesse, elenchiamo le norme di matrice piu comunemente adottate,considerando solo matrici reali

1. norma spettrale:

‖A‖2 =√

maxi{λi(A

TA)}

2. norma di Frobenius :

‖A‖F =

√∑i

∑j

a2ij =

√trATA

3. massimo valore singolare:

‖A‖σ =√

maxi{σi(A)}

4. norma 1 o max-norma:

‖A‖1 = maxj

n∑i=1

|aij|

5. norma ∞:

‖A‖∞ = maxi

n∑j=1

|aij|

In generale ‖A‖2 = ‖A‖σ e ‖A‖22 ≤ ‖A‖1 ‖A‖∞


1.4 Matrici antisimmetriche

Abbiamo visto sopra che una matrice S si dice antisimmetrica quando soddisfa laseguente proprieta:

S + ST = O (1.25)

Una matrice antisimmetrica ha percio tutti zeri sulla diagonale principale ed elementifuori dalla diagonale che soddisfano la relazione sij = −sji.

Ne segue che una matrice antisimmetrica e definita da solin(n− 1)

2parametri.

Per n = 3 risultan(n− 1)

2= 3, per cui la matrice antisimmetrica ha esattamente

tre elementi indipendenti, che possono essere considerati come le componenti di ungenerico vettore tridimensionale v ; la matrice viene allora indicata come S(v).

Nel seguito studieremo le proprieta delle matrici antisimmetriche per n = 3, inquanto sono di fondamentale importanza per definire la cinematica delle rotazionidi corpi rigidi in spazi tridimensionali.

Se v =[vx vy vz

]Te un vettore qualsiasi, possiamo definire S(v) come l’operatore

che trasforma v in una matrice antisimmetrica:

S(v) =

0 −vz vy

vz 0 −vx

−vy vx 0

(1.26)

e viceversa, data una matrice antisimmetrica qualsiasi, e sempre possibile estrarreda essa un vettore v .

La matrice S(v) si indica semplicemente con S quando non si vuole evidenziarela dipendenza dal vettore v . La proprieta di antisimmetria comporta la seguenteidentita:

ST(v) = −S(v) = S(−v) (1.27)

Le matrici antisimmetriche soddisfano la proprieta di linearita; dati due scalariλi ∈ R, vale la proprieta

S(λ1u + λ2v) = λ1S(u) + λ2S(v) (1.28)

Inoltre, dati due vettori qualsiasi v e u , si ha la seguente importante proprieta:

S(u)v = u × v (1.29)

e quindi S(u) puo essere interpretata come l’operatore (u×) e viceversa.

Da questa proprieta e dalla anti-commutativita del prodotto esterno segue cheS(u)v = −S(v)u .

E semplice verificare che la matrice S(u)S(u) = S 2(u) e simmetrica e verifica larelazione

S 2(u) = vvT − ‖v‖2 I (1.30)


Autovalori e autovettori di matrici antisimmetriche Data la matrice anti-simmetrica S(v) i suoi autovalori sono immaginari o nulli:

λ1 = 0, λ2,3 = ±j ‖v‖

L’autovettore relativo all’autovalore λ1 = 0 vale v ; gli altri due sono complessiconiugati.

1.5 Matrici ortogonali e ortonormali

Una generica matrice quadrata U ∈ Rn e detta ortonormale quando:

• la sua inversa coincide con la sua trasposta

UU T = U TU = I (1.31)

ovveroU −1 = U T (1.32)

• Le colonne di U sono tra loro ortogonali e a norma unitaria, come pure lerighe.

• ‖U ‖ = 1;

• Il determinante di U ha modulo unitario:

|det(U )| = 1 (1.33)

percio esso puo valere +1 oppure −1.

Viene chiamata ortogonale quella matrice quadrata per cui vale una relazione menoforte della (1.31), ovvero

U TU =

α1 0 · · · 00 α2 · · · 0...

.... . .

...0 0 · · · αn

con αii 6= 0.

Il termine “ortonormale” viene riservato al caso in cui αii = 1.

Il prodotto scalare e invariante a trasformazioni ortonormali, ossia

(Ux ) · (Uy) = (Ux )T(Uy) = xTU TUy = xTI y = xTy = x · y


Se U e una matrice ortonormale,6 di dimensioni opportune, allora ‖AU ‖ = ‖UA‖ =‖A‖.Limitandoci al caso di matrici U 3×3, solo 3 dei 9 elementi che compongono la matricesono indipendenti, in quanto le condizioni di ortonormalita tra le righe o tra lecolonne definiscono 6 vincoli.

Come si puo vedere in [2], le matrici ortonormali U 3×3 sono la rappresentazionedi trasformazioni geometriche di corpi rigidi nello spazio Euclideo: infatti quandodet(U ) = +1, U rappresenta una rotazione propria , mentre quando det(U ) =−1, U rappresenta una rotazione impropria ovvero una roto-riflessione .

Se U e una matrice ortonormale, vale la proprieta distributiva7 rispetto al prodottoesterno:

U (x × y) = (Ux )× (Uy) (1.34)

Per ogni matrice di rotazione U e ogni vettore x si dimostra che

US(x )U Ty = U(x × (U Ty)

)= (Ux )× (UU Ty)= (Ux )× y= S(Ux )y

(1.35)

dove S(x ) e la matrice antisimmetrica associata a x ; si ricavano pertanto le relazioniseguenti:

US(x )U T = S(Ux )US(x ) = S(Ux )U

(1.36)

1.6 Forme bilineari e quadratiche

Si definisce forma bilineare associata alla matrice A ∈ Rm×n la variabile scalare

b(x ,y) = xTAy = yTATx

Si definisce forma quadratica associata alla matrice quadrata A ∈ Rn×n la variabilescalare

q(x ) = xTAx = xTATx

Qualsiasi forma quadratica associata ad una matrice antisimmetrica S(y) e identi-camente nulla, ossia

xTS(y)x ≡ 0 (1.37)

6La regola vale anche nel caso piu generale in cui U sia una matrice unitaria, definita daU ∗U = I .

7 Questa proprieta non e generalmente vera, salvo appunto quando U e ortonormale.


per ogni x e ogni y . La dimostrazione di questa proprieta e semplice: definendow = S(y)x = y × x , avremo xTS(y)x = xTw , ma essendo w ortogonale sia a ysia a x per definizione, il prodotto scalare xTw , e quindi la forma quadratica, sarasempre nullo.

Pertanto, ricordando la decomposizione (1.1), la forma quadratica dipende solo dallaparte simmetrica As della matrice A:

q(x ) = xTAx = xT(As + Aa)x = xTAsx

Una matrice quadrata A si dice definita positiva se la forma quadratica associataxTAx soddisfa le condizioni

xTAx > 0 ∀x 6= 0xTAx = 0 x = 0

Una matrice quadrata A si dice semidefinita positiva se la forma quadratica associataxTAx soddisfa la condizione

xTAx ≥ 0 ∀x

Una matrice quadrata A si dice definita negativa se −A e definita positiva; analo-gamente una matrice quadrata A si dice semidefinita negativa se −A e semidefinitapositiva.

Spesso, per indicare queste matrici si usano le notazioni seguenti:

matrice definita positiva: A Â 0matrice semidefinita positiva: A º 0matrice definita negativa: A ≺ 0matrice semidefinita negativa: A ¹ 0

Condizione necessaria affinche la matrice quadrata A sia definita positiva e che glielementi sulla diagonale siano strettamente positivi.

Condizione necessaria e sufficiente affinche la matrice quadrata A sia definita posi-tiva e che tutti gli autovalori siano strettamente positivi.

Il criterio di Sylvester afferma che condizione necessaria e sufficiente affinche lamatrice quadrata A sia definita positiva e che tutti i suoi minori principali sianostrettamente positivi. Una matrice definita positiva ha rango pieno ed e sempreinvertibile.

La forma quadratica xTAx soddisfa la relazione seguente

λmin(A) ‖x‖2 ≤ xTAx ≤ λmax(A) ‖x‖2

dove λmin(A) e λmax(A) sono, rispettivamente, l’autovalore minimo e massimo diA.


Una matrice A semidefinita positiva ha rango ρ(A) = r < n, ovvero possiede rautovalori strettamente positivi e n − r autovalori nulli. La forma quadratica siannulla per ogni x ∈ N (A).

Data una matrice reale di dimensioni qualsiasi A ∈ Rm×n, abbiamo visto che siaATA, sia AAT sono simmetriche; inoltre abbiamo visto nella Sezione 1.2.2 cheρ(ATA) = ρ(AAT) = ρ(A). Si puo dimostrare che esse hanno sempre autovalorireali non negativi, e quindi sono definite o semi-definite positive: in particolare, sela matrice A ha rango pieno,

• se m < n, ATA º 0 e AAT Â 0,

• se m = n, ATA Â 0 e AAT Â 0,

• se m > n, ATA Â 0 e AAT º 0.

Data la forma bilineare b(x ,y) = xTAy , si definiscono gradienti le seguenti espres-sioni:

gradiente rispetto a x : gradxb(x ,y) =

(∂b(x ,y)

∂x

)T

= Ay

gradiente rispetto a y : gradyb(x ,y) =

(∂b(x ,y)

∂y

)T

= ATx

Data la forma quadratica q(x ) = xTAx , si definisce gradiente rispetto a x laseguente espressione:

gradxq(x ) =

(∂q(x )

∂x

)T

= 2Ax .

Bibliografia

[1] http://ocw.mit.edu/18/18.06/f02/index.htm.

[2] B. Bona. Modellistica dei Robot Industriali. CELID, Torino, 2002.

[3] C. N. Dorny. A Vector Space Approach to Models and Optimization. JohnWiley & Sons, 1975.

[4] F. R. Gantmacher. The Theory of Matrices, volume 2. Chelsea PublishingCompany, 3rd edition, 1989.

[5] P. Lounesto. Clifford Algebras and Spinors. Cambridge University Press, secondedition, 2001.

[6] P. Lounesto. Clifford Algebras and Spinors. Cambridge University Press, secondedition, 2001.

[7] D. G. Luenberger. Optimization by Vector Space Methods. John Wiley & Sons,1969.

[8] R. Monaco and A. Repaci. Algebra Lineare: Vettori, Matrici, Applicazioni.CELID, Torino, 2002.

[9] S. Rinaldi. Algebra Lineare. CLUP, Milano, 1971.

[10] G. Strang. Introduction to Linear Algebra. Wellesey- Cambridge Press, 1998.

33

Indice

1 Matrici e vettori 2

1.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Operazioni sulle matrici . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Autovalori e autovettori . . . . . . . . . . . . . . . . . . . . . 11

1.2.2 Decomposizione ai valori singolari . . . . . . . . . . . . . . . . 12

1.3 Vettori e spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3.1 Spazio vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3.2 Funzioni lineari . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.3.3 Matrici come rappresentazione di operatori lineari . . . . . . . 17

1.3.4 Inversa generalizzata . . . . . . . . . . . . . . . . . . . . . . . 18

1.3.5 Prodotti tra vettori . . . . . . . . . . . . . . . . . . . . . . . . 21

1.3.6 Proiezioni e matrici di proiezione . . . . . . . . . . . . . . . . 26

1.3.7 Norme di matrice . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.4 Matrici antisimmetriche . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.5 Matrici ortogonali e ortonormali . . . . . . . . . . . . . . . . . . . . . 29

1.6 Forme bilineari e quadratiche . . . . . . . . . . . . . . . . . . . . . . 30

34

Elenco delle figure

1.1 Il bivettore e12 nel piano R3. . . . . . . . . . . . . . . . . . . . . . . 26

35

Appunti di Algebra Lineare e Matrici · 2006. 10. 10. · Basilio Bona - Algebra Lineare e Matrici...

Documents

Transcript of Appunti di Algebra Lineare e Matrici · 2006. 10. 10. · Basilio Bona - Algebra Lineare e Matrici...