MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le...

24
Marino COLIZZA : appunti su giugno 2001 MATRICI A GRADINI E LORO APPLICAZIONI 1. Matrici a gradini Una matrice A di m righe ed n colonne si dice a gradini (o gradinizzata) per righe se è la matrice nulla, o se è costituita da una sola riga, o se (caso generale) considerando gli elementi della sua prima riga a 1i , e supponendo che per ogni i minore di un certo d ( 1 d n ) risulti a 1i = 0 e sia invece a 1d 0 , accade che: - tutti gli elementi delle colonne 1, 2, …,d-1 sono nulli, e così pure tutti gli elementi della colonna d, tranne, per questa colonna, quello della prima riga a 1d . - detta A* la matrice ottenuta da A eliminando da essa la prima riga e le prime d colonne, la matrice A* è a sua volta a gradini. Si noti che nessuna ipotesi viene fatta sugli elementi di A appartenenti alla prima riga ed a colonne successive alla colonna d , cioè sugli elementi a 1i con i > d . La definizione data è una definizione di tipo ricorsivo, che permette di stabilire se una matrice è a gradini considerando via via matrici con un numero di righe sempre minore (sono necessari come massimo m-1 passi). (Il termine “a gradini” traduce l’aspetto grafico della matrice (nel caso generale): se si traccia una linea che separi, nella matrice stessa, la parte tutta nulla dal resto, si ottiene una specie di scala, con gradini tutti dell’altezza di una riga, ma la cui lunghezza non è necessariamente sempre la stessa.) L’elemento a 1d , e gli analoghi elementi delle matrici A*, A** ecc. (cioè i primi elementi non nulli di ogni gradino) prendono il nome di elementi pivot della matrice a gradini A, e le colonne a cui essi appartengono vengono dette colonne pivot. Osserviamo che se la matrice a gradini è non nulla, essa è costituita da un certo numero h di righe non nulle seguite, eventualmente, da altre righe tutte nulle. Gli elementi pivot della matrice si trovano uno su ciascuna delle righe non nulle, ed appartengono a colonne via via successive (non però necessariamente immediatamente successive!). Essi sono cioè del tipo a 1d , a 2d’ , a 3d” , ecc. con d < d’< d” ecc. e sono in numero uguale al numero delle righe non nulle ed al numero delle colonne pivot. Matrici a gradini, in cui sono evidenziati in carattere grassetto gli elementi pivot sono ad esempio: A= 0 2 1 -1 B= 0 0 0 1 0 0 C= 0 1 0 1 0 0 2 -1 3

Transcript of MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le...

Page 1: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Marino COLIZZA : appunti su giugno 2001

MATRICI A GRADINIE LORO APPLICAZIONI

1. Matrici a gradini

Una matrice A di m righe ed n colonne si dice a gradini (o gradinizzata) per righe se è lamatrice nulla, o se è costituita da una sola riga, o se (caso generale) considerando gli elementidella sua prima riga a1i , e supponendo che per ogni i minore di un certo d ( 1 ≤ d ≤ n ) risultia1i = 0 e sia invece a1d ≠ 0 , accade che:- tutti gli elementi delle colonne 1, 2, …,d-1 sono nulli, e così pure tutti gli elementi della

colonna d, tranne, per questa colonna, quello della prima riga a1d .- detta A* la matrice ottenuta da A eliminando da essa la prima riga e le prime d colonne, la

matrice A* è a sua volta a gradini.Si noti che nessuna ipotesi viene fatta sugli elementi di A appartenenti alla prima riga ed acolonne successive alla colonna d , cioè sugli elementi a1i con i > d .

La definizione data è una definizione di tipo ricorsivo, che permette di stabilire se unamatrice è a gradini considerando via via matrici con un numero di righe sempre minore (sononecessari come massimo m-1 passi).

(Il termine “a gradini” traduce l’aspetto grafico della matrice (nel caso generale): se sitraccia una linea che separi, nella matrice stessa, la parte tutta nulla dal resto, si ottiene una speciedi scala, con gradini tutti dell’altezza di una riga, ma la cui lunghezza non è necessariamentesempre la stessa.)

L’elemento a1d , e gli analoghi elementi delle matrici A*, A** ecc. (cioè i primi elementinon nulli di ogni gradino) prendono il nome di elementi pivot della matrice a gradini A, e lecolonne a cui essi appartengono vengono dette colonne pivot.

Osserviamo che se la matrice a gradini è non nulla, essa è costituita da un certo numero hdi righe non nulle seguite, eventualmente, da altre righe tutte nulle. Gli elementi pivot dellamatrice si trovano uno su ciascuna delle righe non nulle, ed appartengono a colonne via viasuccessive (non però necessariamente immediatamente successive!). Essi sono cioè del tipo a1d ,a2d’ , a3d” , ecc. con d < d’< d” ecc. e sono in numero uguale al numero delle righe non nulle edal numero delle colonne pivot.

Matrici a gradini, in cui sono evidenziati in carattere grassetto gli elementi pivot sono adesempio:

A =0

2

1

-1

B =0

0 0

1 0

0

C =

0 1

0 1

0 0

2

-1

3

Page 2: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

In esse le colonne pivot sono rispettivamente: in A la 1° e la 2° ; in B la 2° ; in C la 1°, la 2°e la 3° ; in D la 1° e la 3° ; in E la 1°, la 2° e la 3° e in F la 1° e la 2°.

2. Determinazione del rango di una matrice a gradini

E’ immediato constatare che, considerata una matrice a gradini, i vettori costituiti dallesue righe non nulle sono un sistema di vettori linearmente indipendenti. Dato che le rimanentirighe sono nulle, il massimo numero di righe linearmente indipendenti della matrice, cioè il rangoper righe della matrice, coincide dunque con il numero di righe non nulle della matrice stessa. Inuna matrice a gradini è perciò immediatamente individuabile il rango per righe.Si può inoltre verificare che in una matrice a gradini le colonne pivot costituiscono un sistemamassimale di colonne linearmente indipendenti, e perciò il loro numero dà il rango per colonnedella matrice stessa: ma le colonne pivot sono tante quante le righe non nulle, il cui numero dà ilrango per righe e dunque ritroviamo in questo caso il ben noto risultato che in una qualsiasimatrice rango per righe e rango per colonne coincidono.

Concludendo dunque il rango di una matrice a gradini è dato dal numero di righe nonnulle della matrice (o anche dal numero delle colonne pivot, o ancora dal numero degli elementipivot; ovviamente però, dal punto di vista della sua determinazione effettiva, il dato piùsignificativo è quello delle righe non nulle.)

Negli esempi del paragrafo precedente, i ranghi delle matrici sono 1 per B , 2 per A , D ,F e 3 per C ed E.

3. Operazioni elementari su una matrice

Detta A una matrice, e detto Ai il suo vettore riga i-esima (ed Ah il suo vettore colonnah-esima), consideriamo questi tre tipi di operazioni che si possono fare sulle righe della matrice:

I) scrivere il vettore Ai al posto della riga j (i≠j) ed il vettore Aj al posto della rigai (“scambio della riga i con la riga j”)

II) scrivere il vettore αA i (con α≠0) al posto della riga i(“moltiplicare la riga i per lo scalare α≠0 ”)

III) scrivere il vettore Ai+Aj al posto della riga i(“scrivere al posto della riga i la somma della riga i e della riga j”)

Queste tre operazioni vengono dette operazioni elementari sulle righe di una matrice,rispettivamente del primo, del secondo e del terzo tipo.

D =

4

1

3 1 2

0 0 0

0 0 0 0E =

−−

1

1

2

3 0

0 1

0 0

0 0 0

F =−

3

2

1 0 1

0 1 0

0 0 0 0

0 0 0 0

Page 3: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Per questione di praticità per le applicazioni che seguiranno, osserviamo che tramite unasequenza finita di operazioni del secondo e del terzo tipo si può ottenere un’ulteriore operazione eprecisamente:

IV) scrivere al posto della riga i il vettore Ai+αA j

(“scrivere al posto della riga i la riga i più α volte la riga j”)

Per ottenere questo risultato basta infatti: a) scrivere il vettore Aj’ = αA j al posto dellariga j (operazione del II tipo); b) scrivere il vettore Ai + Aj’ = A i + αA j al posto della riga i(operazione del III tipo); c) scrivere il vettore Aj” = (1/α)A j’ = A j al posto della riga j(operazione del III) tipo.

Notiamo dunque che la IV pur non essendo, a rigor di termini, una operazioneelementare, è comunque il risultato di una sequenza di tre di esse: il risultato che da essa deriva èdunque ottenibile tramite operazioni elementari (e parlando di operazioni elementari,includeremo generalmente fra esse, se pur impropriamente, anche la IV).

4. Operazioni elementari e prodotti di matrici

Per poter trattare una delle applicazioni successive, risulta essenziale la seguenteosservazione.

Data una qualsiasi matrice A di m righe ed n colonne, ogni operazione elementare sullamatrice stessa può essere ottenuta moltiplicando a sinistra la matrice A per una opportunamatrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe inevidenza per ciascuno dei tre tipi di operazioni elementari (con ovvia estensione per la IV),vengono dette matrici elementari, e sono ottenibili con delle semplici modifiche della matriceidentica In .

I) per ottenere nella matrice A lo scambio della riga i con la riga j basta moltiplicarea sinistra A per la matrice I(i↔j) ottenuta dalla matrice In scambiando in essa lariga i con la riga j.

II) per moltiplicare nella matrice A la riga i per lo scalare α basta moltiplicare asinistra la matrice A per la matrice I(i,αi) ottenuta dalla matrice In

moltiplicando in essa la riga i per lo scalare αIII) per ottenere dalla matrice A una matrice in cui al posto della riga i risulti la

somma della riga i e della riga j di A basta moltiplicare a sinistra la matrice Aper la matrice I(i,i+j) ottenuta dalla matrice In scrivendo in essa, al posto dellariga i, la somma della riga i e della riga j.

Page 4: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

5. Gradinizzazione di una matrice tramite operazioni elementari sulle sue righe

Dimostreremo ora che, partendo da una matrice A qualsiasi, si può sempre, con l’usoripetuto di operazioni elementari (e quindi anche, per comodità, operazioni del IV tipo) ecomunque in un numero finito di passi, arrivare ad una matrice gradinizzata (“gradinizzazionedella matrice A tramite operazioni elementari sulle righe”).

Ne consegue che il procedimento di gradinizzazione di A equivale a moltiplicare asinistra la matrice A via via per un certo numero (finito) di matrici elementari Er , e quindi, allafine, a moltiplicare a sinistra A per una opportuna matrice H quadrata di ordine m. Dettainfatti g(A) una qualsiasi gradinizzata della matrice A , risulta g(A) = Ez(Ez-1(….(E2(E1A)))) = (EzEz-1…E2E1)A = H A .

Detta dunque A una matrice qualsiasi, se essa è una matrice nulla, essa è per definizione agradini, ed il risultato è quindi già raggiunto in partenza. Analogamente se la matrice è compostada una sola riga. Se invece non accade alcuna delle due precedenti ipotesi, sia h il più piccolointero tale che la colonna Ah sia non nulla, e sia aih un elemento non nullo di tale colonna. Se i =1 possiamo direttamente proseguire, altrimenti otteniamo tale situazione scambiando la riga i conla prima riga. Diciamo A’ la matrice così ottenuta. Nella prima riga di A’ abbiamo allora uncerto numero di elementi nulli, fino a quello appartenente alla colonna h, che è proprio aih, primonon nullo. [Talvolta può interessare che tale elemento sia uguale ad 1, e ciò si può sempreottenere moltiplicando l’attuale prima riga per 1/aih].

Le colonne fino alla (h-1)-esima sono tutte nulle. Consideriamo ora la colonna h-esima:se essa ha, tranne il suo elemento appartenente alla prima riga, tutti gli altri elementi nulli, lamatrice A’ è una matrice soddisfacente il primo punto della definizione di matrice a gradini. Seinvece nella colonna h-esima di A’ ci sono elementi akh (oltre ovviamente al primo aih), chesiano diversi da zero, allora scriviamo al posto della riga k-esima, la riga k-esima meno akh/aih

volte la prima riga: otteniamo così uno zero al posto del precedente elemento akh. Procedendo inmodo analogo per tutti gli elementi non nulli della colonna h-esima successivi a quelloappartenente alla prima riga, otteniamo allora anche in questo caso una matrice A” che soddisfa ilprimo punto della definizione di matrice a gradini.

Considerata ora la matrice A* ottenuta dalla matrice di cui sopra trascurando la sua primariga e le sue prime h colonne, procediamo su A* con lo stesso metodo, e poi, eventualmente suA**, A***, ecc., fino ad arrivare, con un numero finito di operazioni elementari, ad una matricegradinizzata.

Osserviamo soltanto che nel procedimento pratico di gradinizzazione di una matrice, nonsi vanno di solito a scrivere separatamente le matrici A*, A**, A***, ecc., ma si lavora scrivendosempre tutta la matrice, precisamente prima si lavora con la matrice A, poi con la sua parte A*,poi con la sua parte A**, e così via, fino ad ottenere la matrice gradinizzata.

Esempio: vogliamo gradinizzare la matrice:

A =

0

2

1

1 0 2 1 3

1 0 1 0 0

1 0 1 0 2

0 1 1 0 1 0

Page 5: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Conviene allora agire al seguente modo:

in cui nel primo passaggio è stata portata la terza riga al primo posto (era necessario fare in modoche il primo elemento della prima riga fosse diverso da zero) e, per comodità, la seconda alquarto posto, la prima al secondo posto e la quarta al terzo posto; nel secondo passaggio, persistemare la prima colonna, sono state lasciate inalterate le prime tre righe e al posto della quartariga è stata scritta la quarta meno due volte la prima; nel terzo passaggio, per sistemare la secondacolonna, sono state lasciate inalterate le prime due righe, al posto della terza è stata scritta la terzameno la seconda, e al posto della quarta è stata scritta la quarta più tre volte la seconda; a questopunto la terza colonna è risultata automaticamente a posto, e la matrice è gradinizzata. (dal puntodi vista pratico si noti come si proceda mettendo a posto via via la prima, la seconda, la terzacolonna …. ed ogni volta lo si fa aggiungendo o togliendo rispettivamente la prima, la seconda,la terza riga …. moltiplicate per un opportuno scalare).

Come ulteriore osservazione mettiamo in evidenza una proprietà che risulterà utile in unadelle applicazioni successive. E’ facile rendersi conto che, assegnata una matrice a gradini (equindi anche la gradinizzata di una matrice qualsiasi), procedendo in maniera del tutto analoga aquella appena vista per la gradinizzazione di una matrice (procedendo però non più partendodalla prima riga ed aggiustando le successive, cioè “dall’alto verso il basso”, bensì partendodall’ultima riga ed aggiustando via via le precedenti, cioè “dal basso verso l’alto”), è semprepossibile, tramite operazioni elementari, arrivare ad una matrice ancora a gradini e con imedesimi elementi pivot, tale inoltre che anche tutti gli elementi appartenenti ad ogni colonnapivot e a righe precedenti la riga del relativo elemento pivot siano nulli: tale cioè che, se ahk è unsuo qualsiasi elemento pivot, risulti aik = 0 per ogni i < h (oltre che, ovviamente, perdefinizione di elemento pivot, per ogni i > h ).

Tale procedimento avrà interesse in una applicazionbe che verrà vista in seguito (par. 9), ein quel momento verranno allora visti degli opportuni esempi.

0

2

1

1

0

0

1 0 2 1 3

1 0 1 0 0

1 0 1 0 2

0 1 1 0 1 0

1 0 1 0 2

1 0 2 1 3

1 1 0 1 0

2 1 0 1 0 0

− − −

→− −

1

0

0

1

0

0

1 0 1 0 2

1 0 2 1 3

1 1 0 1 0

0 3 0 1 0 4

1 0 1 0 2

1 0 2 1 3

0 1 2 0 3

0 0 0 5 3 5

Page 6: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

6. Determinazione del rango di una matrice

Come noto il rango di una matrice coincide con il suo rango per righe. Abbiamo giàasservato che il rango di una matrice a gradini è immediatamente determinabile in quanto datodal numero di righe non nulle della matrice stessa. Ci proponiamo ora di dimostrare che il rango(per righe) di una matrice qualsiasi coincide con il rango (per righe) di una sua gradinizzata. Lofaremo dimostrando che una qualsiasi operazione elementare sulle righe di una matrice A lasciainalterato il suo rango.I) Se in una matrice si scambiano due righe, si scambia soltanto l’ordine dei vettori rigapresi in considerazione, il che, ovviamente, non incide su ogni relazione di dipendenza oindipendenza lineare tra gli stessi o tra sottoinsiemi di essi: non altera quindi il rango dellamatrice.II) Se in una matrice si moltiplica la riga i-esima per lo scalare α≠0, niente sicuramentecambia relativamente alla dipendenza o indipendenza lineare per quanto riguarda le righe diversedalla riga i. Se invece consideriamo un sistema di righe comprendenti la riga i-esima, abbiamo,nella matrice A di partenza i vettori Ap , Aq ,…. , Ai , …. , Ar , As , e nella matrice A’ di arrivo icorrispondenti vettori Ap , Aq ,…. , αA i , …. , Ar , As . E’ però immediatamente verificabile che iprimi sono linearmente indipendenti (dipendenti) se e solo se lo sono i secondi. Dunque anche intale caso l’operazione effettuata non altera il rango della matrice.III) Se in una matrice al posto della riga i-esima si scrive la somma della riga i-esima più lariga j-esima, va ripetuto integralmente quanto detto al punto II), considerando, nel caso dicoinvolgimento della riga i-esima, i sistemi di vettori Ap , Aq ,…. , Ai , …. , Aj , … , Ar , As eAp , Aq ,…. , Ai +A j, …. , Aj , … , Ar , As . Anche in questo caso si osserva dunque chel’operazione effettuata non altera il rango della matrice.IV) Se in una matrice al posto della riga i-esima si scrive la somma della riga i-esima più αvolte la riga j-esima si arriva ad una nuova matrice che si sarebbe potuta ottenere con al più trepassaggi del tipo II) e III): dato che ciascuno di essi conserva il rango della matrice, anche unaoperazione del tipo IV) conserva il rango della matrice.

In conclusione allora, un metodo (piuttosto comodo e consigliabile) per determinare ilrango di una matrice è quello di gradinizzare tale matrice mediante operazioni elementari sullesue righe (e abbiamo appena visto che in ciascuno dei passaggi a ciò necessari il rango rimaneinalterato), e di determinare poi il rango della matrice diagonalizzata così ottenuta contando lesue righe non nulle.

7. Dipendenza e indipendenza di vettori. Dimensione e basi dello spazio da essi generato

Un problema che si presenta spesso è quello di stabilire, dato un siatema S di m vettori diuno spazio vettoriale V di dimensione finita n :a) se essi sono linearmente dipendenti o indipendentib) nel caso siano dipendenti, qual’è il numero massimo di vettori indipendenti fra essi, cioè

qual’è la dimensione del sottospazio < S > da essi generatoc) determinare una base del sottospazio < S >d) più in particolare determinare una base di < S > formata da vettori tratti dal sistema

assegnato S .

Page 7: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Come noto, tali problemi possono essere risolti rifacendosi direttamente alle definizionied alle proprietà degli spazi vettoriali. Può tuttavia risultare comodo, soprattutto se, come moltospesso accade, si lavora con vettori di Rn, ricorrere ad un metodo, che viene qui di seguitoindicato, legato al procedimento di gradinizzazione di una matrice.

Ricordiamo che qualora in uno spazio vettoriale V di dimensione finita n venga fissatauna base BV , e si considerino le coordinate dei vettori di V (coordinate che sono, come noto, n-

uple di scalari, cioè a loro volta vettori di Kn, e sono addirittura le componenti stesse dei vettoriconsiderati se V coincide con Kn ed in tale spazio si pensa fissata la base canonica), al sistemaS di vettori si può associare la matrice A(S) che ha le loro coordinate come righe. Conviene poiricordare che per l’isomorfismo tra un qualsiasi spazio vettoriale V di dimensione n e lo spazioKn, isomorfismo ottenuto associando ad ogni vettore di V l’n-upla delle sue coordinate rispettoad una base prefissata, un sistema di vettori di V è linearmente dipendente (rispettivamenteindipendente) se e solo se lo è il sistema delle n-uple loro coordinate.

Allora, una volta valutato, generalmente tramite il procedimento di gradinizzazione comevisto in precedenza, il rango della matrice A(S) , diciamolo ad esempio k, abbiamo immediatarisposta alle questioni a) e b). Per definizione di rango di una matrice infatti, il numero massimodi vettori linearmente indipendenti fra essi è k , e tale è dunque anche la dimensione delsottospazio da essi generato. Come immediata conseguenza i vettori sono linearmenteindipendenti se e solo se k = m , e sono dipendenti in caso contrario.

Per quanto riguarda la questione c), considerate la matrice A(S), e la sua gradinizzatagA(S), come conseguenza del procedimento di gradinizzazione si ha che non solo ogni riga digA(S) può essere ottenuta come combinazione lineare delle righe di A(S), ma viceversa ancheogni riga di A(S) può essere ottenuta come combinazione lineare delle righe di gA(S) , inparticolare delle sue k righe non nulle [la dimostrazione di questo fatto richiede soltanto un po’di pazienza: per semplicità formale conviene comunque effettuarla per ogni passaggio relativo aduna singola operazione elementare!] Ciò significa che i vettori del sistema S (le cui coordinatesono le righe di A(S)) sono ottenibili come combinazione lineare dei k vettori (linearmenteindipendenti) le cui coordinate sono date dalle k righe non nulle di gA(S), ed altrettanto vale diconseguenza per ogni vettore del sottospazio generato dai vettori del sistema S. Abbiamo dunquedeterminato, in questo modo, in maniera immediata tramite la matrice gA(S), una base delsottospazio generato dai vettori di S.

Per quanto riguarda il punto d), la questione risulta, anche se solo formalmente,lievemente più complessa. Senza scendere nei dettagli delle verifiche, tutte banali dal punto divista concettuale, ma eventualmente complicate da scrivere esplicitamente) in generale,ricordiamo che per gradinizzare una matrice, si procede con operazioni elementari del I, II e IIItipo (o, in pratica, del I e IV tipo). Abbiamo anche osservato, parlando della determinazione delrango di una matrice, che agendo con queste operazioni, un sistema di vettori riga della matriceA è linearmente dipendente o indipendente se e solo se lo è il corrispondente sistema di vettoririga della matrice trasformata (conviene pensare alla verifica relativamente ad ogni singolopassaggio, di volta in volta agendo con una sola operazione elementare). Ne consegue che, unavolta arrivati alla matrice gradinizzata gA, e constatato che in essa sono linearmente indipendentile prime k righe, altrettanto accade per le k righe di A da cui tali righe provengono. Si notiche esse sono le prime k righe di A se e solo se per gradinizzare A non è stato necessarioricorrere ad operazioni elementari del primo tipo, cioè a scambi di righe; in caso contrario, per

Page 8: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

determinare le k righe indipendenti di A bisogna risalire a quelle che hanno poi dato luogo alleprime k righe di gA. Una volta determinate queste, ed osservato che, come precedentementevisto, il sottospazio generato dai vettori di G ha dimensione k , risulta dunque che i k vettori lecui coordinate sono costituite dalle suddette righe di A sono una base di tale sottospazio comerichiesta nel punto d). E’ dunque evidente che, volendo risolvere il problema posto nel punto d),il procedimento di gradinizzazione risulta comunque quanto mai comodo, ma esso va applicatocon molta attenzione, dovendo alla fine risultare evidente la “storia” delle righe di g(A), cioè qualè la riga di A da cui ciascuna di esse proviene: la cosa risulta abbastanza banale nei casi dimatrici di poche righe o in cui si proceda con pochi scambi di riga, in caso contrario può essereconveniente contrassegnare in un qualche modo le righe di A e, nel corso dei vari passaggi,quando si spostino delle righe, trasportarle assieme ai loro contrassegni.

Come esempio vediamo un caso che, se pur particolarmente semplice, mette in evidenzaun possibile modo di procedere.

Considerati i cinque vettori di R6 : v1 = (1 , 0 , 1 , 0 , 1 , 1) v2 = (1 , 2 , 1 , -1 , 0 , 1)v3 = (0 , 2 , 0 , -1 , -1 , 0) v4 = (1 , 0 , 1 , 0 , 1 , 2) v5 = (2 , 2 , 2 , -1 , 1 , 1) ,rispondere alle domande di cui ai punti a) , b) , c) , d) relativamente a tale sistema di vettori.

Procediamo considerando la matrice che ha tali vettori come righe, e gradinizziamo talematrice. Per le considerazioni fatte sopra, contrassegneremo tali rihe con una lettera che ciporteremo dietro nei vari scambi, in modo che alla fine risulti evidente la “storia” di ciascuna riga(osserviamo che non è opportuno contrassegnare le righe con il nome dei vari vettori, dato chenel procedimento di gradinizzazione i vettori non rimangono gli stessi, e verremmo quindi acontrassegnare con lo stesso nome dei vettori diversi).

(nel primo passaggio, per metter a posto la prima colonna, abbiamo trascritto la prima e la terzariga, al posto della seconda abbiamo scritto la seconda meno la prima, al posto della quarta laquarta meno la prima ed al posto della quinta la quinta meno due volte la prima; nel secondopassaggio, per mettere a posto la seconda colonna, abbiamo lasciate inalterate la prima, laseconda e la quarta riga, al posto della terza abbiamo scritto la terza meno la seconda, ed al postodella quinta abbiamo scritto la quinta meno la seconda; nel terzo passaggio, per poter procedere

αβγδε

αβγδε

αβγδε

1 0 1 0 1 1

1 2 1 -1 0 1

0 2 0 -1 -1 0

1 0 1 0 1 2

2 2 2 -1 1 1

1

0

0

0

0

1 0 1 0 1

→− −− −

− − −

0 1 0 1 1

2 0 1 1 0

2 0 1 1 0

0 0 0 0 1

2 0 1 1 1

11

0 2 0 -1 -1 0

0 0 0 0 0 0

0 0 0 0 0 1

0 0 0 0 0 -1

→− −

αβδεγ

αβδεγ

1 0 1 0 1 1

0 2 0 -1 -1 0

0 0 0 0 0 1

0 0 0 0 0 -1

0 0 0 0 0 0

1

0

0

0

0

0 1 0 1 1

2 0 1 1 0

0 0 0 0 1

0 0 0 0 0

0 0 0 0 0

Page 9: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

oltre abbiamo portato all’ultimo posto la terza riga, operazione che può ad esempio essereottenuta con lo scambio della terza e della quarta riga, e successivo scambio della quarta con laquinta; nel quarto passaggio infine, al posto della quarta riga abbiamo scritto la quarta più laterza, lasciando inalterato tutto il resto; siamo così arrivati alla matrice gradinizzata.)

A questo punto, in base alle considerazioni fatte nella descrizione teorica, possiamoconcludere che:2) la matrice gradinizzata ha 5 righe e rango 3 , quindi i vettori v1 , v2 , v3 , v4 , v5 sono

linearmente dipendenti3) tra essi il numero massimo di vettori linearmente indipendenti è 3 , e risulta dunque anche

dim < v1 , v2 , v3 , v4 , v5 > = 34) una base dello spazio < v1 , v2 , v3 , v4 , v5 > è data, ad esempio, dai tre vettori

u1 = (1 , 0 , 1 , 0 , 1 , 1) , u2 = (0 , 2 , 0 ,-1 , -1 , 0) , u3 = (0 , 0 , 0 , 0 , 0 ,1)5) una base dello spazio < v1 , v2 , v3 , v4 , v5 > , tratta dal sistema di generatori { v1 , v2 , v3 , v4 ,

v5} è data dai tre vettori { v1 , v2 , v4} (che sono i tre vettori, contrassegnati con i simboliα , β , δ da cui sono derivati i tre vettori u1 , u2 , u3 ) . Si noti che i tre vettori v1 , v2 , v3 noncostituiscono una base di < v1 , v2 , v3 , v4 , v5 > , in quanto sono linearmente dipendenti egenerano uno spazio di dimensione 2.

Osserviamo che il procedimento di gradinizzazione avrebbe potuto essere svolto in modi diversida quello sopra visto, e che in questi casi si sarebbe arrivati alle stesse risposte sopra ottenuterelativamente ai punti a) e b), ma, in generale, a basi diverse relativamente ai punti c) e d) (d’altrocanto la cosa non deve meravigliare, dato che, come ben noto, uno spazio vettoriale non nulloammette infinite basi!).

8. Calcolo del determinante di una matrice quadrata

Cominciamo con l’osservare che se una matrice quadrata è a gradini essa è, in particolare,una matrice triangolare superiore (potendo eventualmente avere alcune delle ultime righe tuttenulle). Il suo determinante è perciò immediatamente ottenibile come prodotto degli elementi dellasua diagonale principale.

Vediamo allora come il procedimento di gradinizzazione possa essere usato, con leopportune cautele, anche per calcolare il determinante di una matrice quadrata qualsiasi.

Ricordiamo che, come già osservato in precedenza, la gradinizzazione di una matricequalsiasi, e quindi in particolare anche di una matrice quadrata, può essere effettuata tramiteoperazioni del I e del IV tipo sui vettori riga della matrice stessa, e ricordiamo che, per leproprietà del determinante, se su di una matrice quadrata viene effettuata una operazione del IVtipo, si ottiene un’altra matrice quadrata avente lo stesso determinante. Bisogna però fareattenzione che se sulla matrice viene effettuata una operazione del I tipo (scambio di righe), siottiene una matrice il cui determinante è l’opposto di quello della matrice di partenza (n.b.: sifaccia attenzione al fatto che una operazione elementare del I tipo è uno scambio di righe, nonuno spostamento di righe: se ad un certo punto, per esempio in una matrice del quarto ordine, sisposta la seconda riga portandola, al quarto posto, si effettuano due operazioni elementari del I

Page 10: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

tipo, lo scambio della seconda riga con la terza, e poi lo scambio di quella che è divenuta la terzariga, con la quarta !). Di conseguenza risulta

det A = (-1)r det (gA)

essendo r il numero di operazioni del I tipo (scambi di riga) che si sono dovute effettuare perottenere gA. Essendo, per quanto visto sopra, immediato il calcolo di det (gA), si perviene cosìfacilmente al calcolo di det A. In pratica il procedimento risulta molto semplice, purchè, a manoa mano che si procede con la gradinizzazione, si cambi il segno ogni volta che si effettua unaoperazione del I tipo.

Vediamo due esempi:

Il segno - che compare nel primo passaggio deriva dall’aver portato la prima riga della matriceal quarto posto, il che equivale ad aver fatto tre scabi di righe. Per il resto si è proceduto con ilsolito metodo di gradinizzazione della matrice di cui si voleva calcolare il detrerminante. Da unpunto di vista pratico si noti che in uno qualsiasi dei vari passaggi si poteva, invece cheproseguire con la gradinizzazione, procedere al calcolo del determinante con un qualsiasi altrometodo (di solito con il metodo di Laplace). Nel caso in questione, ad esempio, si poteva anche,arrivati al terzo passaggio, proseguire con il metodo di Laplace:

arrivando, forse in modo più comodo, allo stesso (ovviamente !) risultato.

Secondo esempio:

det

0 0 1 3

1 0 1 0

0 1 2 1

1 2 1 0

det

1 0 1 0

0 1 2 1

1 2 1 0

0 0 1 3

det

1 0 1 0

0 1 2 1

0 2 0 0

0 0 1 3

det

1 0 1 0

0 1 2 1

0 0 -4 -2

0 0 1 3

= −

= −

= −

=

= - det

1 0 1 0

0 1 2 1

0 0 -4 -2

0 0 0 5/2

= − −[ ] = − −[ ] =1 1 4 5 2 10 10* *( )*( / )

..... = - det

1 0 1 0

0 1 2 1

0 2 0 0

0 0 1 3

det

1 2 1

2 0 0

0 1 3

det 2 1

1 3

= −

= − −

= − =1 1 2 1 2 6 1 10* * ( )* * *( )

det

1 0 1

1 0 0

2 1 1

2 1 0

det

1 0 1 2

0 0 -1 -3

0 1 -1 -5

0 1 -2 -8

det

1 0 1 2

0 1 -1 -5

0 1 -2 -8

0 0 -1 -3

2

1

1

4

−−−

=

=

=

Page 11: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

In questo caso, nel secondo passaggio la seconda riga è stata portata al quarto posto, sono stateeffettuati quindi due scambi di riga, ed il segno del determinante è dunque rimasto inalterato.Come nel caso precedente si poteva ad un certo punto proseguire con il metodo di Laplace, ocomunque, dopo il terzo passaggio osservare che nella matrice c’erano due righe uguali econcludere quindi direttamente che il determinante era nullo.

Si noti che nell’utilizzazione del metodo di gradizzazione per il calcolo del determinantedi una matrice quadrata abbiamo applicato solo operazioni del I e del IV tipo; avremmo potutoapplicare anche operazioni del III tipo (che del resto sono casi particolari di operazioni del IVtipo), ma non operazioni del II tipo, che invece, in generale, alterano il determinante dellamatrice! Può a prima vista sembrare strano il fatto che operazioni del II tipo alterino ildeterminante, mentre operazioni del IV tipo, che sono, come più volte visto, riconducibili adoperazioni del II e del III tipo non lo facciano: la ragione è che in ogni operazione del IV tipointervengono due operazioni del II tipo che annullano complessivamente l’effetto di ciascunadelle due di cambiare il determinante (la prima lo moltiplica per α e la seconda lo moltiplica per1/α !).

9. Invertibilità di una matrice e determinazione della sua inversa

Il metodo di gradinizzazione di una matrice, opportunamente completato, si presta moltobene anche allo scopo di scoprire se una assegnata matrice quadrata è invertibile, e, in casoaffermativo, per calcolare la sua inversa.

Per quanto riguarda la prima parte del problema, la risposta viene immediatamente dalparagrafo precedente. Sappiamo infatti che una matrice quadrata è invertibile se e solo se il suodeterminante è non nullo. Per quanto visto sopra allora una matrice quadrata A è invertibile se esolo se tutti gli elementi della diagonale principale di gA sono non nulli.

Per quanto riguarda la determinazione dell’inversa, nel caso che essa esista, si usa poi unprocedimento a prima vista piuttosto strano, ma in realtà molto comodo (anche se prevede, ingenere, un certo numero di passaggi anche piuttosto laboriosi dal punto di vista numerico) efacilmente giustificabile.

Ricordiamo varie osservazioni fatte in precedenza, parlando della gradinizzazione di unamatrice tramite operazioni elementari sulle righe, e precisamente:

=− −− −− −

=

= − =det

1

0

0

0

det

1 0 1 2

0 1 -1 -5

0 0 -1 -3

0 0 0 0

0 1 2

1 1 5

0 1 3

0 1 3

1 1 1 0 0* *( )*

Page 12: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

- ogni operazione elementare sulle righe di una matrice A corrisponde al prodotto a sinistra diA per una matrice elementare, ed una successione finita di operazioni elementari corrisponde diconseguenza al produtto a sinistra di A per una opportuna matrice quadrata H.- data una qualsiasi matrice A essa può sempre essere gradinizzata tramite una successionefinita di operazioni elementari, ed anzi si può sempre trovare una sua gradinizzata gA aventetutti gli elementi pivot uguali ad 1.- data una qualsiasi matrice gradinizzata si può sempre ottenere da essa, tramite operazionielementari, una matrice in cui tutti gli elementi al di sopra degli elementi pivot sono nulli.

Pensiamo allora assegnata una matrice quadrata A di ordine n, e supponiamo di volerdeterminare se essa è invertibile, e, in caso affermativo, di voler calcolare la sua inversa. Ilprocedimento che verrà ora indicato risolve contemporaneamente i due problemi. Cominciamocon lo scrivere, accanto alla matrice A, per esempio alla sua destra, la matrce In , cioè la matriceidentica di ordine n. Per questioni di praticità converrà formare una unica matrice (A | In),tenendo separati graficamente gli elementi della prima dagli elementi della seconda con una barraverticale. Si eseguono a questo punto delle operazioni elementari sulla matrice A econtemporaneamente le medesime operazioni elementari sulla matrice In (il che è come dire chesi eseguono delle operazioni elementari sulla matrice (AIn) ).

Si incomincia col fare in modo di gradinizzare la matrice A. Se allora otteniamo unamatrice gA in cui qualche elemento della diagonale principale è nullo, det A = 0 e quindi Anon è invertibile, e quindi abbiamo concluso. Se invece gA ha tutti gli elementi della diagonaleprincipale diversi da zero, A è invertibile, e possiamo proseguire.

Osserviamo che in questo caso necessariamente tutti gli elementi della diagonaleprincipale sono elementi pivot. Sempre tramite operazioni elementari possiamo allora fare inmodo che essi divengano tutti uguali ad 1 , e che tutti gli elementi che stanno al di sopra di essidivengano uguali a 0 (è indifferente ottenere prima l’una o l’altra cosa, o anche mescolare iprocedimenti). In conclusione allora abbiamo alla fine ottenuto, al posto della matrice A lamatrice identica di ordine n . Dato che tutto il procedimento è stato fatto usando operazionielementari, esso, per quanto già osservato, equivale ad aver moltiplicato a sinistra la matrice Aper una matrice H (il prodotto, nell’ordine opportuno, di tutte le matrici elementaricorrispondenti alle operazioni elementari effettuate). Risulta dunque, per quanto visto, H A = In ,relazione che afferma che H è una inversa a sinistra di A . Ricordiamo però che esattamente lestesse operazioni elementari fatte su A le abbiamo fatte anche sulla matrice scritta accanto adessa, cioè su In . Quest’ultima si è quindi trasformata nella matrice H In , che, come noto, èuguale ad H. Siamo dunque passati dalla matrice (AIn) alla matrice (InH) . Non è dunquenecessario fare alcun particolare calcolo per determinare la matrice H : semplicemente quandosiamo giunti ad ottenere al posto della matrice A la matrice identica, accanto a quest’ultimatroviamo pronta la matrice H. Se ora ricordiamo che se una matrice è invertibile, ogni suainversa a sinistra è anche inversa a destra ed è dunque la sua (unica) inversa, vediamo che ilprocedimento indicato è un algoritmo concettualmente molto semplice per la determinazionedell’inversa della matrice (quadrata invertibile) A.

Page 13: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Esempi: determinare se sono invertibili, e in caso affermativo determinare le inverse, le matrici:

Incominciamo con la matrice A :

nel primo passaggio al posto della seconda riga è stata scritta la seconda meno la prima: abbiamocosì ottenuto una matrice a gradini con tutti gli elementi della diagonale principale (della primaparte della matrice) diversi da zero, quindi possiamo concludere che la matrice A è invertibile,ed ha quindi senso proseguire; nel secondo passaggio abbiamo diviso per -2 la seconda riga; nelterzo passaggio al posto della prima riga abbiamo scritto la prima meno tre volte la seconda: lamatrice a sinistra è allora diventata la matrice identica, e possiamo quindi concludere che risulta

Passiamo alla matrice B :

nel primo passaggio al posto della seconda riga è stata scritta la seconda riga più la prima e alposto della terza riga la terza meno il doppio della prima; nel secondo passaggio al posto dellaterza riga è stata scritta la terza più 3/2 volte la seconda : a questo punto si è arrivati ad unamatrice che nella prima parte è triangolare con un elemento della diagonale principale nullo. Siconclude perciò che risulta det B = 0 , e quindi B non è invertibile. Risulta dunque inutileproseguire, e, d’altro canto, non sarebbe comunque possibile arrivare ad ottenere, nella primaparte, la matrice identica.

Vediamo ora la matrice C :

A =1 3

2 4

B =

1 2 3

-1 0 1

2 1 0

C =

1 0 -1 1

1 1 -1 0

2 0 0 2

0 1 2 -2

1 3 1 0

2 4 0 1

1 3 1 0

0 2 2 1

1 3 1 0

0 1 1 1 2

1 0 2 3 2

0 1 1 1 2

→− −

→−

→−

/

/

/

A -1 =−

2 3 2

1 1 2

/

/

1 2 3 1 0 0

1 0 1 0 1 0

2 1 0 0 0 1

1 2 3 1 0 0

0 2 4 1 1 0

0 3 6 2 0 1

1 2 3 1 0 0

0 2 4 1 1 0

0 0 0 1 2 3 2 1

→− − −

→−

/ /

1 0 1 1 1 0 0 0

1 1 1 0 0 1 0 0

2 0 0 2 0 0 1 0

0 1 2 2 0 0 0 1

1 0 1 1 1 0 0 0

0 1 0 1 1 1 0 0

0 0 2 0 2 0 1 0

0 1 2 2 0 0 0 1

−−

−− −

−−

Page 14: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Nel primo passaggio al posto della seconda riga è stata scritta la seconda meno la prima e al postodella terza la terza meno due volte la prima; nel secondo passaggio sono state scambiate la terza ela quarta riga; nel terzo passaggio al posto della terza riga si è scritta la terza meno la seconda; nelquarto passaggio al posto della quarta riga si è scritta la quarta meno la terza. A questo punto(vedi esempi precedenti) si conclude che la matrice C è invertibile e si prosegue quindi perindividuare la matrice inversa. Nel quinto passaggio (indicato, solo per indicare che siamo nellaseconda parte dell’algoritmo, con una doppia freccia), per rendere nulli gli elementi della quartacolonna al di sopra dell’elemento pivot, al posto della prima riga è stata scritta la prima meno laquarta, al posto della seconda la seconda più la quarta, ed al posto della terza la terza più laquarta; nel sesto passaggio, per rendere uguale ad 1 l’elemento pivot della terza riga, la terza rigaè stata divisa per due; e nel settimo passaggio, per rendere uguali a zero gli elementi della terzacolonna al di sopra dell’elemento pivot, al posto della prima riga è stata scritta la prima più laterza. Siamo così arrivati ad avere a sinistra la matrice identica, e quindi a destra la matrice C-1 .Risulta dunque:

−− −− −

− −

→→

− − −− −−− −

1 0 1 1 1 0 0 0

0 1 0 1 1 1 0 0

0 0 2 1 1 1 0 1

0 0 0 1 3 1 1 1

1 0 1 0 4 1 1 1

0 1 0 0 4 2 1 1

0 0 2 0 2 0 1 0

0 0 0 1 3 1 1 1

C-1 =

− −− −−− −

3 1 1 2 1

4 2 1 1

1 0 1 2 0

3 1 1 1

/

/

− − −− −−− −

− −− −−− −

1 0 1 0 4 1 1 1

0 1 0 0 4 2 1 1

0 0 1 0 1 0 1 2 0

0 0 0 1 3 1 1 1

1 0 0 0 3 1 1 2 1

0 1 0 0 4 2 1 1

0 0 1 0 1 0 1 2 0

0 0 0 1 3 1 1 1

/

/

/

−− −−

−− −− −

1 0 1 1 1 0 0 0

0 1 0 1 1 1 0 0

0 1 2 2 0 0 0 1

0 0 2 0 2 0 1 0

1 0 1 1 1 0 0 0

0 1 0 1 1 1 0 0

0 0 2 1 1 1 0 1

0 0 2 0 2 0 1 0

Page 15: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

SISTEMI LINEARI

Si chiama sistema lineare di m equazioni in n incognite su un campo K un sistema diequazioni del tipo

in cui gli aij ed i bi sono elementi del campo K (solitamente il campo dei numeri reali) , le xi

sono dei simboli detti incognite e dei semplici simboli sono pure i segni = . Gli aij sono detti icoefficienti delle incognite (precisamente aij è il coefficiente dell’incognita xj nella i-esimaequazione) e le bi sono dette termini noti.

Si chiama soluzione del sistema ogni n-upla (h1,h2, …….,hn) di elementi di K che siasoluzione di ogni equazione del sistema, tale cioè che risulti, per ogni i

ai1h1 + ai2h2 + ……. + ainhn = bi

dove ora il segno = è il segno di uguaglianza fra due elementi di K , quello scritto al primomembro e quello scritto al secondo.

Prima di proseguire, notiamo che anche una singola equazione lineare in una o piùincognite è un sistema lineare (con m = 1), e anche in tale caso si applicheranno i risultati cheverranno di seguito trovati.

Un sistema lineare si dice omogeneo se in esso tutti i termini noti sono uguali a zero, secioè bi = 0 per ogni i.

In particolare, dato un arbitrario sistema lineare, si dice sistema lineare omogeneo ad essoassociato quel sistema lineare omogeneo che ha tutti i coefficienti (delle incognite) coincidenticon quelli del sistema assegnato (e, ovviamente, essendo omogeneo, tutti i termini noti uguali azero).

Risulta utile e comodo, da parecchi punti di vista, associare ad un sistema lineare alcunematrici, ed usare di conseguenza delle particolari notazioni. Con riferimento al sistemainizialmente scritto si considerano le matrici:

a x a x + .... + a x b

a x a x + .... + a x b

...................

...................

a x a x + .... + a x b

11 1 12 2 1n n 1

21 1 22 2 2n n 2

m1 1 m2 2 mn n m

+ =+ =

+ =

A =

a a ..... .... a

a a .... .... a

.... .... .... .... ....

.... .... .... .... ....

a a .... .... a

11 12 1n

21 22 2n

m1 m2 mn

X

x

x

=

1

2

....

....

xm

B =

b

b

....

....

b

1

2

m

Page 16: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

dette rispettivamente matrice dei coefficienti (del sistema), matrice delle incognite e matrice deitermini noti. Si considera spesso, inoltre, una ulteriore matrice, detta matrice completa associataal sistema, che è precisamente la matrice

Da notare che la divisione interna di questa matrice con una barra verticale è puramente formale,ed ha il solo scopo di evidenziare, per ragioni pratiche che verranno viste in seguito, come la suaprima parte altro non sia che la matrice A .

Con l’uso di tali matrici (e ricordando il significato del prodotto di due matrici, edell’uguaglianza di matrici), il sistema può semplicemente essere scritto nella forma (dettamatriciale) :

AX = Be dire che una n-upla (h1,h2, …….,hn) è una soluzione del sistema significa dire che, pensato discrivere tale n-upla sotto forma di matrice colonna H, è verificata l’uguaglianza

AH = B .Osserviamo inoltre che il sistema lineare omogeneo associato al sistema AX = B è con

notazione matriciale il sistema AX = 0 (dove adesso 0 indica la matrice nulla ad m righe eduna colonna).

NB. In tutto quanto segue sarà sempre detto n il numero delle incognite del sistema, ed m ilnumero delle equazioni, e verrà usata, per quanto possibile, la notazione matriciale.

10. Discussione e soluzione di un sistema lineare

DISCUTERE un sistema lineare significa dire se esso ammette o non ammette soluzioni(o, come solitamente si dice, se esso è o non è compatibile), “quante” esse sono (in un senso cheverrà precisato in seguito), e precisare la eventuale struttura del loro insieme.

RISOLVERE un sistema lineare significa determinare tutte le sue soluzioni.Molte volte, specialmente in questioni di tipo teorico, è sufficiente la discussione del sistema chesi considera; comunque, anche quando sia necessaria la effettiva soluzione del sistema ègeneralmente utile una sua preventiva discussione.

A A B' = ( ) =

a a ..... .... a

a a .... .... a

.... .... .... .... ....

.... .... .... .... ....

a a .... .... a

b

b

....

....

b

11 12 1n

21 22 2n

m1 m2 mn

1

2

m

Page 17: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

11. Teoremi sui sistemi lineari

In relazione alla discussione e successivamente alla risoluzione dei sistemi lineari,valgono i seguenti risultati:

Proposizione 1 Un sistema omogeneo A X = 0 è sempre compatibile, e la totalità delle suesoluzioni costituisce un sottospazio di Kn .Dim. Per quanto riguarda la compatibilità è immediato constatare che l’n-upla nulla è sempresoluzione di un sistema omogeneo, qualunque siano i suoi coefficienti. Se poi questa è l’unicasoluzione, essa costituisce il sottospazio nullo di Kn . Supponendo invece che ci siano altresoluzioni, dette H1 ed H2 due di esse, cioè due n-uple tali che risulti A H1 = 0 e A H2 = 0 ,risulta anche A (H1 + H2) = A H1 + A H2 = 0 + 0 = 0 e A (αH1) = α (A H1) = α 0 = 0e perciò anche H1 + H2 e α H1 sono soluzioni del sistema, e dunque le soluzioni

costituiscono un sottospazio di Rn. (Per quanto riguarda la dimensione di tale sottospazio, essaverrà individuata nella proposizione 4).

Proposizione 2 Un sistema non omogeneo A X = B può essere compatibile o non compatibile.Se è compatibile le sue soluzioni costituiscono una varietà lineare affine, sono cioè tutte e sole len-uple del tipo H = H* + H0 , essendo H* una particolare soluzione del sistema dato e H0

una soluzione variabile nel sottospazio vettoriale delle soluzioni del sistema AX = 0 , sistemaomogeneo associato al sistema assegnato.Dim. Per dimostrare che un sistema (non omogeneo) può essere compatibile o non compatibile,basta fornire due opportuni esempi. Limitandosi, per semplicità, al caso più banale possibile,basta allora considerare “sistemi” di una equazione in un’incognita, ad esempio 2x = 4 e 0x = 4,il primo dei quali ammette, come ben noto, la soluzione 2 , ed il secondo non ammette alcunasoluzione (casi di sistemi più “grandi” sono altrettanto facili da costruire).

Per quanto riguarda la parte più significativa della proposizione, sia AX = B un sistemacompatibile, e sia H* una sua soluzione. Sia inoltre H0 una (qualsiasi) soluzione dell’omogeoassociato. Queste ipotesi si traducono nelle due relazioni AH* = B e AH0 = 0 . Da esse siricava allora A (H* + H0) = AH* + AH0 = B + 0 = B , risultato che afferma che H* + H0 èsoluzione del sistema considerato. Dimostrato dunque che ogni n-upla ottenuta come somma diuna particolare soluzione del sistema e di una qualsiasi soluzione dell’omogeneo associato è puressa soluzione del sistema di partenza, resta da dimostrare che in questo modo si ottengono tuttele soluzioni del sistema, cioè che data una qualsiasi soluzione del sistema, diciamola H, esisteuna soluzione dell’omogeneo associato, diciamola H0*, tale che risulti H = H* + H0*. PoniamoH0* = H – H*, e verifichiamo che in questo modo tutto funziona. Risulta infatti

H* + H0* = H* + (H – H*) = H* + H – H* = HEd inoltre H0* è soluzione dell’omogeneo associato, in quanto

A H0* = A (H – H*) = AH – AH* = B – B = 0 .La proposizione risulta dunque completamente dimostrata.

Page 18: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Proposizione 3 Un sistema (omogeneo o non omogeneo) A X = B in cui m = n , ed in cui lamatrice (quadrata) A dei coefficienti sia invertibile (ed abbia perciò determinante diverso dazero), è detto sistema di Cramer. Un tale sistema ammette sempre una ed una sola soluzione, edessa è data dall’n-upla A-1 B (Teorema di Cramer) .Dim. Tenuto conto dell’ipotesi che A è invertibile, e che dunque esiste la sua inversa A-1 (ed è,ovviamente, non nulla), osserviamo che se H* è una soluzione di AX = B vale allora larelazione AH* = B da cui H* = (A-1 A) H* = A -1 (A H*) = A -1 B . Da cui si deduce che unaeventuale soluzione del sistema è necessariamente di questa forma, e quindi se soluzione esisteessa è certamente unica. Vediamo allora se esiste, vediamo cioè se A-1 B è soluzione. RisultaA (A -1 B) = (A A-1) B = In B = B , e quindi la risposta è affermativa. La proposizione è alloracompletamente dimostrata.

La scrittura in forma esplicita della soluzione A-1 B porta poi ad esprimere tale soluzionemediante delle particolari formule che vengono talora dette formule di Cramer. (Questioneformale lasciata eventualmente al lettore).

Proposizione 4 Un sistema A X = B è compatibile se e solo se risulta rg A = rg A’ (dove rgA indica il rango della matrice dei coefficienti del sistema, e rg A’ il rango della matricecompleta associata al sistema). Se il sistema è compatibile, detto k il rango comune di tali duematrici, ed essendo al solito n il numero delle incognite del sistema, la generica soluzione delsistema dipende da n-k parametri arbitrari. Più precisamente, riferendosi alla strutturadell’insieme delle soluzioni, la dimensione della varietà lineare affine delle soluzioni (che perdefinizione è la dimensione del sottospazio delle soluzioni del sistema omogeneo associato) èn-k .

Questa proposizione, nota con il nome di Teorema di Rouché-Capelli, può esseredimostrata in vari modi. Qui verrà preferito un modo piuttosto veloce e molto comodo dal puntodi vista pratico, in quanto permette di discutere il sistema e di arrivare poi in maniera del tuttoautomatica a determinare le sue soluzioni. Tale metodo si basa sul procedimento digradinizzazione delle matrici, ed è conosciuto come metodo di Gauss. Esso, e quindi ladimostrazione della proposizione 4, verrà esposto dettagliatamente nel prossimo paragrafo.

12. Discussione e soluzione di un sistema lineare con il metodo di Gauss

Ricordiamo che due sistemi di equazioni si dicono equivalenti se e solo se ammettono lostesso insieme di soluzioni, ed osserviamo prima di tutto che, assegnato un sistema lineare S,esso si trasforma in un sistema equivalente qualora:- in S si scambiano fra loro due equazioni- una qualsiasi equazione di S viene moltiplicata per un fattore α ≠ 0- al posto di una equazione di S si scrive la somma dell’equazione stessa e di un’altra

equazione del sistema

Page 19: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

- al posto di una equazione di S si scrive l’equazione stessa più α volte un’altra equazionedel sistema

In quanto detto sopra, parlando di prodotto di un’equazione per un fattore α e di somma di dueequazioni, si pensa sempre di eseguire tali operazioni a membro a membro, cioèil prodotto del fattore α per l’equazione ai1x1 + ai2x2 + … + ainxn = bi è l’equazioneα (ai1x1 + ai2x2 + … + ainxn) = α bi cioè αai1x1 + αai2x2 + … + αainxn = αbi

mentre la somma delle due equazioniai1x1 + ai2x2 + … + ainxn = bi e aj1x1 + aj2x2 + … + ajnxn = bj

è l’equazione(ai1x1 + ai2x2 + … + ainxn) + (aj1x1 + aj2x2 + … + ajnxn) = bi + bj

cioè l’equazione(ai1 + aj1)x1 + (ai2 + aj2) x2 + … + (ain + ajn)xn = bi + bj .

La verifica di queste proprietà segue banalmente dalla definizione si soluzione di unsistema lineare, e non viene qui, per brevità, esplicitamente riportata.

Se ora si pensa alla matrice completa associata al sistema, è del tutto chiaro che leoperazioni sopra esposte relativamente alle equazioni del sistema corrispondono alle operazionielementari su detta matrice, e viceversa.

Si conclude allora che, considerato un sistema lineare S e considerata la sua matrice(completa) associata A’, se si esegue sulla matrice A’ un numero qualsiasi di operazionielementari, questa viene trasformata in una matrice A*’ che è la matrice associata ad un sistemaS* equivalente al sistema S .

Dato che tramite operazioni elementari una matrice qualsiasi, nel nostro caso la matriceA’, può sempre essere trasformata in una matrice a gradini gA’, ne consegue che un qualsiasisistema lineare S può sempre essere trasformato in un sistema lineare, che potremmo indicarecon gS , ad esso equivalente (cioè avente le medesime soluzioni!), ed avente una formaparticolare “a gradini”. La matrice gA’ , supponendo per semplicità di notazione che il rangodella matrice A dei coefficienti del sistema sia tre, e che sia quindi costituita da tre gradini nonnulli, è infatti della forma:

in cui gli elementi pivot, e quindi sicuramente non nulli sono a1i , a2j , a3h , e ad essa corrispondeil sistema gS :

0 ... 0 a ... a a ... a a ... b

0 ... 0 0 ... 0 a ... a a ... b

0 ... 0 0 ... 0 0 ... 0 a ... b

0 ... 0 0 ... 0 0 ... 0 0 ... b

0 ... 0 0 ... 0 0 ... 0 0 ... 0

... ... ... ... ... ... ... ... ... ... ... ... ...

0 ... 0 0 ... 0 0 ... 0

1i 1j-1 1j 1h-i 1h 1

2j 2h-1 2h 2

3h 3

4

a

a

a

n

n

n

1

2

3

0

0

00 ... 0 0

Page 20: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

che scritto nel modo usuale (omettendo cioè tutti i monomi con coefficiente zero) è :

(sono state omesse anche tutte le ultime equazioni del tipo 0 = 0 , ovviamente irrilevanti nelsistema).

Arrivati allora al sistema ultimo scritto è molto facile discutere il sistema gS e quindi ilsistema S (dato che i due sistemi sono equivalenti, la discussione fatta per gS , e la suarisoluzione, sono la discussione e la risoluzione per S).

Per prima cosa è del tutto ovvio che se risulta b4 ≠ 0 il sistema non è compatibile (datoche per nessuna scelta dei valori delle incognite l’ultima equazione può risultare soddisfatta). Intermini di rango (o caratteristica) delle matrici questo caso corrisponde al fatto che il rango dellamatrice A dei coefficienti del sistema sia diverso (necessariamente minore di una unità) dalrango della matrice completa A’ associata al sistema.

Considerando ora il caso che risulti b4 = 0 , cioè che le due matrici A ed A’ abbiano lostesso rango, proviamo che il sistema è compatibile.

La cosa verrà fatta mostrando come effettivamente si trovano tutte e sole le soluzioni, e siotterrà in tale modo anche l’ulteriore risultato sul modo come viene espressa la genericasoluzione del sistema. (Per brevità e semplicità ci si riferirà sempre al sistema scritto sopra, nelquale risulta rg A = rg A’ = 3 , ma il metodo è assolutamente analogo nel caso generale.)

Ricordando che ora risulta b4 = 0 , il sistema è dunque:

0 0

0 0 0 0

1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 2 2 1 1 2 2

x x a x a x a x a x a x a x b

x x x x a x a x a x a

i i i j j j j h h h h n n

i i j j j h h h h

+ + + + + + + + + + + =

+ + + + + + + + + + +− − − − −

− − − −

... ... ... ...

... ... ... ... nn n

i i j j h h h n n

i i j j h h n

i

x b

x x x x x x a x a x b

x x x x x x x x b

x x

=

+ + + + + + + + + + + =

+ + + + + + + + + + + =

+ +

− − −

− − −

2

1 1 1 1 3 3 3

1 1 1 1 4

1

0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0

... ... ... ...

... ... ... ...

... −− − −

− − −

+ + + + + + + + + =

+ + + + + + + + + + + =

1 1 1

1 1 1 1

0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0

x x x x x x

x x x x x x x x

i j j h h n

i i j j h h n

... ... ...

...................................

... ... ... ...

a x a x a x a x a x a x b

a x a x a x a x b

a x a x b

b

i i j j j j h h h h n n

j j h h h h n n

h h n n

1 1 1 1 1 1 1 1 1 1 1

2 2 1 1 2 2 2

3 3 3

40

+ + + + + + + + =

+ + + + + =

+ + ==

− − − −

− −

... ... ...

... ...

...

a x a x a x a x a x a x b

a x a x a x a x b

a x a x b

i i j j j j h h h h n n

j j h h h h n n

h h n n

1 1 1 1 1 1 1 1 1 1 1

2 2 1 1 2 2 2

3 3 3

+ + + + + + + + =

+ + + + + =

+ + =

− − − −

− −

... ... ...

... ...

...

Page 21: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

Cominciamo col considerare l’ultima equazione ed in essa fissiamo dei valori arbitrari pertutte le variabili che vi compaiono, successive alla prima: poniamo cioè xh+1 = αh+1 , ….. , xn= αn e ricaviamo dall’equazione il valore α0

h di xh (cosa sicuramente possibile dato che unavolta fissati dei valori per le variabili da xh+1 ad xn , l’equazione considerata risulta essereun’equazione del tipo a3h xh = β , con a3h , per ipotesi, ≠ 0). Risulta allora che una qualsiasi

n-upla del tipo ( * , * , …. , * , α0h , αh+1 , … , αn ) , dove i termini * sono assolutamente

arbitrari, è una soluzione della equazione considerata.Prendiamo ora in considerazione la penultima equazione, e procediamo in maniera

analoga: precisamente diamo alle variabili da xh ad xn i valori determinati nel caso precedente,lavorando con l’ultima equazione, diamo a tutte le rimanenti variabili, esclusa la prima, dei valoridel tutto arbitrari, poniamo cioè xj+1 = αj+1 , …. , xh-1 = αh-1 , e ricaviamoci il conseguente

valore α0j di xj . Abbiamo allora ricavato un’n-upla ( * , … , * , α0

j , αj+1 , … , αh-1 , α0h ,

αh+1 , … , αn ) che è, per una scelta assolutamente arbitraria dei termini indicati con * ,

soluzione della penultima equazione, e dato che tutti i suoi termini successivi ad α0h sono

esattamente quelli considerati nel caso precedente, è anche soluzione dell’ultima equazione.Si procede ora allo stesso modo considerando la terzultima equazione …… e così via fino

alla prima (nel caso di tre equazioni da noi preso in considerazione non ci sono ulteriori passaggiintermedi in quanto la terzultima è proprio la prima).

Considerata infine la prima equazione, e attribuendo a tutte le incognite da xj in poi i

valori già determinati e dei valori arbitrari alle incognite da xi+1 ad xj-1 si ricava il valore α0i

per l’incognita xi . Fissati a questo punto dei valori, sempre totalmente arbitrari, per le incogniteche precedono xi , si ottengono delle n-uple

(α1 , ... , αi-1 , α0i , αi+1 , … , αj-1 , α

0j , αj+1 , … , αh-1 , α

0h , αh+1 , … , αn )

che, per quanto osservato via via nel procedimento, sono soluzioni di tutte le equazioni delsistema, cioè sono soluzioni del sistema.

(Notiamo che in generale xi è proprio la prima delle incognite del sistema, in quanto seciò non fosse avremmo delle incognite, quelle precedenti xi , che non compaiono in nessunaequazione del sistema, e allora sarebbe del tutto artificioso considerare anche quelle comeincognite del sistema: l’ultimo passaggio nel procedimento precedente non sarà quindi, ingenerale, necessario.)

Osserviamo che la generica soluzione a cui siamo pervenuti è stata ottenuta fissandoarbitrariamente dei valori per tutte le incognite non pivot, e ricavando, nella maniera opportuna(cioè procedendo a ritroso, a partire dall’ultima equazione via via fino alla prima), i valori delleincognite pivot. Per esprimere poi contemporaneamente tutte le soluzioni di questo tipo nonvengono dati dei valori determinati alle incognite non pivot, ma a ciascuna di esse viene sostituitoun parametro arbitrario. La generica soluzione ottenuta dipende perciò da n-k parametri arbitrari,essendo n il numero totale delle incognite e k il rango della matrice A (o, indifferentemente,A’), rango che, come già osservato, uguaglia il numero degli elementi pivot della matrice, cioè ilnumero delle incognite pivot.

Con il procedimento indicato si sono dunque ottenute delle soluzioni del sistema. Rimaneda osservare che, più precisamente, si sono in tal modo ottenute tutte le soluzioni del sistemadato. Quest’ultima verifica è però immediata appena si osservi che, data una qualsiasi soluzionedel sistema, (β1 , …………. , βn) , ci sono certamente soluzioni tra quelle trovate che hanno itermini dall’ h+1-esimo all’n-esimo coincidenti con i corrispondenti β, dato che gli α , dall’

Page 22: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

h+1-esimo all’n-esimo, possono assumere tutti i valori possibili ; d’altro canto, una volta sceltiquesti coincidenti con i relativi β, necessariamente α0

h deve coincidere con β0h , dato che

entrambi devono soddisfare all’ultima equazione del sistema, che, una volta fissati i valori delleincognite da xh+1 ad xn diviene un’equazione in xh dotata di una ed una sola soluzione. Tratutte le soluzioni trovate aventi allora gli α dall’h-esimo in poi coincidenti con i β, ce n’ècertamente qualcuna (stesso discorso di prima) che ha anche gli α dal j+1-esimo all’h-1-esimocoincidenti con i relativi β , e quindi (stesso discorso di prima, riferito alla penultima equazionedel sistema) altrettanto vale per α0

j , e così via ……. fino a trovare una delle soluzionideterminate coincidente con la soluzione (β1 , …………. , βn). Il sistema delle soluzioni primaricavato rappresenta dunque tutte e sole le soluzioni del sistema a gradini considerato. Dato peròche è stato preliminarmente dimostrato che il sistema a gradini è equivalente al sistema dipartenza abbiamo in realtà determinato tutte e sole le soluzioni del sistema di partenza.

Le conclusioni a cui si è pervenuti dimostrano dunque la prima parte della Proposizione 4del paragrafo precedente. Per quanto riguarda la parte strutturale, osserviamo che il procedimentosopra esposto, ripetuto per il sistema omogeneo associato al sistema di equazioni considerato,porta a dimostrare che la generica soluzione dell’omogeneo dipende pur essa da n-k parametriarbitrari, e quindi, dato che la totalità di tali soluzioni, come già osservato nella Proposizione 1,costituisce un sottospazio di Kn , la dimensione di tale sottospazio è pur essa n-k . DallaProposizione 2 segue allora che la dimensione del sottospazio affine delle soluzioni del sistema dipartenza è proprio n-k.

Viene per brevità omesso nel caso generale, ma verrà visto nei successivi esempi, ilprocedimento atto a mettere in evidenza nei casi concreti il legame tra le soluzioni di un sistema equelle dell’omogeneo associato, e a trovare una base del sottospazio di quest’ultime.

Esempi

1) Discutere ed eventualmente risolvere il sistema, nelle incognite x , y , z :

Consideriamo la matrice completa associata al sistema e gradinizziamola:

Perciò il rango della matrice completa associata al sistema ed il rango della matrice deicoefficienti sono entrambi uuali a 3, e quindi il sistema è compatibile. Essendo 3 il numero delleincognite e 3 = (rg A =) rg A’ , la generica soluzione dipende da 3-3=0 parametri arbitrari, cioè

x y z

x y z

x y

+ − =+ + =

+ =

0

2 2

1

A' =−

→−

1 1 1 0

2 1 1 2

1 1 0 1

1 1 1 0

0 1 3 2

0 0 1 1

Page 23: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

c’è una ed una sola soluzione (in effetti questo è un sistema di Cramer). Per determinarla,consideriamo il sistema gradinizzato equivalente al sistema di partenza, che risulta essere:

Dalla terza equazione abbiamo direttamente che deve essere z = 1 . Sostituendo tale valore nellaseconda ricaviamo y = 1 , e sostituendo entrambi tali valori nella prima otteniamo x = 0 . Nonabbiamo dunque dovuto assegnare alcun valore arbitrario, ed abbiamo ottenuta l’unica soluzionedel sistema che è (0 , 1 , 1).

2) Discutere ed eventualmente risolvere il sistema, nelle incognite x , y , z , t :

Passiamo alla matrice completa associata al sistema e gradinizziamola:

risulta dunque rg A = 2 e rg A’ = 1, quindi il sistema non ammette soluzioni.Da notare che anche senza ricordare il risultato che afferma che se le due matrici A ed

A’ hanno rango diverso il sistema non è compatibile, alla stessa conclusione si poteva arrivareconsiderando il sistema associato alla matrice gradinizzata, in cui l’ultima equazione risultaessere 0 = -2 , quindi chiaramente priva di soluzioni.

3) Discutere ed eventualmente risolvere il sistema, nelle incognite x , y , z , u , v :

Passiamo, come al solito, alla matrice completa associata al sistema e gradinizziamola:

x y z

y z

z

+ − =− + =

=

0

3 2

1

2 3 3 1

2

2 1

y z t

x y z t

x z t

− + =+ − + =

+ − =

0 2 3 3 1

1 1 1 1 2

2 0 1 1 1

1 1 1 1 2

0 2 3 3 1

2 0 1 1 1

1 1 1 1 2

0 2 3 3 1

0 2 3 3 3

1 1 1 1 2

0 2 3 3 1

0 0 0 0 2

−−

→−−

→−−

− − −

→−−

x z u v

y z v

x y u v

y z v

+ − + =+ − =

− + + + =+ + =

0

1

7

2 7

1 0 1 1 1 0

0 1 1 0 1 1

1 1 0 1 1 7

0 1 1 0 2 7

1 0 1 1 1 0

0 1 1 0 1 1

0 1 1 0 2 7

0 1 1 0 2 7

1 0 1 1 1 0

0 1 1 0 1 1

0 0 0 0 3 6

0 0 0 0 3 6

−−

−−

−−

→→

Page 24: MATRICI A GRADINI - dmi.units.itcolizza/matriciAgradini.pdf · matrice quadrata di ordine m. Le matrici usate a questo scopo, e che verranno ora messe in evidenza per ciascuno dei

(l’ultimo passaggio è per pura comodità e certamente non necessario).Osserviamo allora che risulta rg A = rg A’ = 3 . Il sistema è dunque compatibile, e la suagenerica soluzione, essendo 5 il numero delle incognite, dipende da 5 – 3 = 2 parametri arbitrari.

Per determinare le soluzioni consideriamo il sistema associato alla matrice gradinizzata,che risulta essere:

Dall’ultima equazione si ha dunque v = 2 . Fissati allora arbitrariamente i valori di u e z ,posto cioè, in maniera generica, z = α , u = β , dalla penultima equazone ricaviamoy = 1 - α + 2 = 3 - α e, di conseguenza, dalla prima equazione x = -α + β - 2 .La generica soluzione è dunque (-α + β - 2 , 3 - α , α , β , 2 ) .

Se, a questo punto, vogliamo delle soluzioni (effettive, cioè vere quintuple di R5 , bastache noi fissiamo dei valori numerici per α e β. Sono ad esempio soluzioni (-2 , 3 , 0 , 0 ,2)(per α = 0 e β = 0) ; (-3 , 2 , 1 , 0 , 2) (per α = 1 e β = 0) ; (0 , 3 , 0 , 2 , 2) (per α = 0 eβ = 2) ; (3 , -4 , 7 , 12 , 2) (per α = 7 e β = 12) ; e così via, per ottenere quante soluzioniparticolari si vogliano.

Notiamo che la generica soluzione può essere scritta nella forma:

(-α + β - 2 , 3 - α , α , β , 2 ) = (-2 , 3 , 0 , 0 , 2) + α (-1 , -1 , 1 , 0 , 0) + β (1 , 0 , 0 , 1 , 0)

(nella prima quintupla sono state raccolte le parti non dipendenti né da α né da β , nella secondaquelle dipendenti da α e nella terza quelle dipendenti da β).

Risulta allora che la totalità delle soluzioni del sistema è data da

(-2 , 3 , 0 , 0 , 2) + [α (-1 , -1 , 1 , 0 , 0) + β (1 , 0 , 0 , 1 , 0)] = = (-2 , 3 , 0 , 0 , 2) + < (-1 , -1 , 1 , 0 , 0) , (1 , 0 , 0 , 1 , 0) >

dove, come abbiamo visto prima, (-2 , 3 , 0 , 0 , 2) è una particolare soluzione del sistemaassegnato (quella ottenuta per α = 0 e β = 0) , mentre , come è facile verificare,< (-1 , -1 , 1 , 0 , 0) , (1 , 0 , 0 , 1 , 0) > è il sottospazio vettoriale delle soluzioni del sistemaomogeneo associato, sottospazio generato da due vettori linearmente indipendenti (tanti quanti iparametri arbitrari che abbiamo introdotto!) , e quindi sottospazio di dimensione 2 .

x z u v

y z v

v

+ − + =+ − ==

0

1

2

−−

−−

1 0 1 1 1 0

0 1 1 0 1 1

0 0 0 0 3 6

0 0 0 0 0 0

1 0 1 1 1 0

0 1 1 0 1 1

0 0 0 0 1 2

0 0 0 0 0 0