Post on 25-Jan-2021
1
Appunti di Teoria dei Sistemi - Anno 2002-2003 – Prof. Laura Giarrè
2.4.3 Matrici e funzioni di Trasferimento
Consideriamo un sistema lineare tempo-invariante e poniamoci nel dominio
trasformato; le formule 2.29) e 2.30) forniscono, rispettivamente, l’uscita per un sistema
tempo-continuo ed un sistema tempo-discreto.
Se supponiamo nulle le condizioni iniziali si ottiene
)(])([)( 1 sUDBAsICsY +−= −
)(])([)( 1 zUDBAzICzY +−= −
che, nel dominio trasformato, forniscono delle rappresentazioni ingresso/uscita per il
sistema dato.
Se il sistema è MIMO (Multiple Input, Multiple Output) si definisce Matrice di
Trasferimento la matrice
mp
x
mp
x
pm
zHDBAzIczUzYzH
sHDBAsIcsUsYsH
yu
×−
=
×−
=
××
ℜ∈+−==
ℜ∈+−==
ℜ∈ℜ∈
)()()()()(
)()()()()(
1
0)0(
1
0)0(
11
2.31)
Nel caso in cui p=m=1 il sistema si dice SISO (Single Input, Single Output) e la matrice
di trasferimento si riduce ad una funzione scalare che prende appunto il nome di funzione
di trasferimento; la sua antitrasformata fornisce la risposta impulsiva del sistema; infatti se
supponiamo di applicare in ingresso un impulso si ha
)]([)]([)()()(1)( 11 sHLsYLthsHsYsU −∂−
∂ ==⇒=⇒= 2.32)
Nel caso MIMO, invece, se supponiamo che il sistema presenta m ingressi e p uscite si
ha
2
=
)()()(
)(
)()()(
)(
21
11211
sHsHsH
sH
sHsHsH
sH
pmpp
ij
m
il generico termine Hij(s) rappresenta, nel dominio di s, la risposta yi(s) ad un impulso
applicato all’ingresso uj(s); la sua antitrasformata darà, dunque, la risposta hij(t) presente
all’uscita yi del sistema quando all’ingresso uj è applicato un impulso (nell’ipotesi che tutti
gli altri ingressi siano nulli)
)]([)]([)( 11 sHLsYLth ijiij j−
∂− == 2.33)
La matrice
== −
)()()(
)(
)()()(
)]([)(
21
11211
1
ththth
th
ththth
sHLth
pmpp
ij
m
prende il nome di matrice delle risposte impulsive.
Da quanto detto è facile ricavare il legame che sussiste nel dominio del tempo tra
risposta di un sistema ad un generico ingresso u(t) e risposta all’impulso; tale legame è
sancito dal cosiddetto integrale di convoluzione
MIMOcasoiHikuiuikHky
SISOcasoihikuiuikhky
DiscretiTempoSistemi
MIMOcasodHtudutHty
SISOcasodhtuduthty
ContinuiTempoSistemi
k
i
k
i
k
i
k
i
t t
o
t t
o
∑∑
∑∑
∫ ∫
∫ ∫
==
==
−=−=
−=−=
−=−=
−=−=
00
00
0
0
)()()()()(
)()()()()(
)()()()()(
)()()()()(
ττττττ
ττττττ
Se consideriamo la formula dell’inversa di una matrice
)det()(1
AAAggA =−
si ottiene, nel caso di un sistema TC,
3
DBAsIAsIAggCsH +
−−=
)det()()(
Nel dominio trasformato i sistemi si possono classificare in:
1. Sistema strettamente proprio: Un sistema si dice strettamente proprio quando
D=0. In questo caso il grado del numeratore della funzione di trasferimento (per sistemi
SISO) o di ciascun termine della matrice di trasferimento (per sistemi MIMO) può al più
essere uguale a n-1, se n è la dimensione del sistema, mentre quello del denominatore è n.
2. Sistema non strettamente proprio: Un sistema si dice non strettamente proprio
quando D≠0. In questo caso il grado del numeratore della funzione di trasferimento (per
sistemi SISO) o di ciascun termine della matrice di trasferimento (per sistemi MIMO) può
al più essere uguale a quello del denominatore e cioè n, se n è la dimensione del sistema.
3. Sistema non proprio: Un sistema si dice non proprio quando D≠0 ed il grado del
numeratore è maggiore di quello del denominatore.
Noi prenderemo in considerazione prevalentemente sistemi non strettamente propri e
sistemi strettamente propri.
E’ molto utile, inoltre, dare la definizione di zeri e poli di un sistema, perché vedremo
giocano un ruolo importante nella discussione delle proprietà strutturali e di stabilità di un
sistema:
4. Zeri di un sistema: Si definiscono zeri di un sistema le radici del numeratore
della f.d.t. (nel caso SISO) o dei numeratori dei termini della matrice di trasferimento
(nel caso MIMO). Un sistema MIMO può possedere più zeri con molteplicità diversa nello
stesso punto del dominio di Laplace o del piano complesso.
5. Poli di un sistema: Si definiscono poli di un sistema le radici del denominatore
della f.d.t. (nel caso SISO) o dei denominatori dei termini della matrice di trasferimento
(nel caso MIMO). Un sistema MIMO può possedere più poli con molteplicità diversa nello
stesso punto del dominio di Laplace o del piano complesso.
Da notare che, in un sistema SISO, poli e autovalori coincidono se e solo se
nell’espressione della f.d.t non ci sono cancellazioni tra termini comuni a numeratore e
denominatore; ciò invece può non essere vero per i sistemi MIMO dove poli ed autovalori
possono coincidere anche in presenza di cancellazioni in alcuni termini.
Ciò significa che, in generale, per un sistema nel passaggio da una rappresentazione
i/s/u ad una rappresentazione i/u può avvenire una perdita di informazione circa gli
autovalori del sistema a causa della presenza di eventuali cancellazioni tra binomi comuni
a numeratore e denominatore della f.d.t. (o dei termini della m.d.t); tale perdita accade
4
puntualmente in sistemi SISO nelle condizioni suddette, mentre può non verificarsi per un
sistema MIMO nel caso in cui gli autovalori che subiscono cancellazioni in alcuni termini
rimangono in ogni caso presenti in altri termini.
2.5 Interconnessione di sistemi
Si possono distinguere due fondamentali connessioni tra sistemi:
1. Connessione serie
2. Connessione parallelo
Analizziamole distintamente
Connessione serie
Due sistemi si dicono interconnessi in serie quando uno dei due sistemi è pilotato
dall’altro
u u1 H1(s) y1=u2 H2(s) y2 y
u = u1
y1 = u2
=
2
1
xx
x
y = y2
++=++=++=
+=•
•
uDDxCDxCYuDBxCBxAuDxCBxAx
uBxAx
1211222
12112221112222
111
)(1
La rappresentazione del sistema complessivo si ottiene ponendo y1=u2
[ ] uDDxCCDY
uDB
Bx
ACBA
x
12212
12
1
212
1 0
+=
+
=
•
Passando nel dominio trasformato si ha
5
)()()()()()()()()()()()()()()(
211212222
11
sHsHsHsUsHsHsYsHsUsHsYsYsUsHsY
=⇒=====
Nel caso di sistemi MIMO bisogna stare attenti all’ordine delle matrici.
Connessione parallela
Due sistemi si dicono interconnessi in parallelo quando gli ingressi coincidono e le
uscite si sommano.
H1(s) y1
u y
y2 H2(s)
=
2
1
xx
x
+++=+=
+=•
•
uDxCuDxCYuBxAx
uBxAx
222111
111
111
1
1
La rappresentazione del sistema complessivo è
[ ] uDDxCCY
uBB
xA
Ax
)(0
0
1221
2
1
2
1
++=
+
=
•
Passando nel dominio trasformato si ha
)()()()())()(()()()()()()()()()(
212121
2211
sHsHsHsUsHsHsYsYsYsUsHsYsUsHsY
+=⇒+=+===
6
3. Modelli ARMA di un sistema LTI e loro identificabilità
Abbiamo prima visto com’è possibile ottenere una rappresentazione nello spazio degli
stati di un sistema LTI, partendo da una rappresentazione ingresso/uscita; il metodo da noi
usato si basa su uno studio nel dominio del tempo attraverso il quale si cerca di
determinare una rappresentazione i/s/u del sistema dopo un’opportuna scelta del vettore di
stato.
In molti casi può essere conveniente lavorare nel dominio trasformato, cercando di
ottenere una rappresentazione nello spazio degli stati a partire dalla matrice di
trasferimento del sistema, ottenuta mediante trasformazione della rappresentazione i/u
(ovviamente tale metodo è valido solo per condizioni iniziali nulle).
In pratica, prendendo per esempio un sistema LTI-TD con rappresentazione ingresso-
uscita
(modello ARMA)
si opera una trasformazione che, supponendo nulle le condizioni iniziali, permette di
ottenere la f.d.t. del sistema
)()()()(
)()()(
)()()()()(
212
21
221221
zUzDzNzY
azazbzb
zUzYzH
zzUb
zzUb
zzYa
zzYazY
=⇒++
+==
+=++
A questo punto si sostituisce, in N(z) e D(z), la variabile z con l’operatore p, il qual è un
operatore che applicato ad una funzione f(k) ne provoca una traslazione in avanti; in
pratica nel passo successivo si ottiene
)()()()( ku
pDpNky =
Definendo una variabile ausiliaria
)()(
1)( kupD
kx =
si ottiene
)()1()()()()()()()()1()2()()()()()()(
2121
21212
kxbkxbkxbzbkxpNkykukxakxakxkukxazazkukxpD
++=+===++++⇒=++⇒=
Prendendo, allora, come vettore di stato
+=
)1()(
)(kx
kxkz
7
si ottiene
[ ] )()(
)(10
)(10
)2()1(
)1(
12
12
kzbbky
kukzaakx
kxkz
=
+
−−=
++
=+
Analogo discorso per i sistemi TC dove l’operatore p s’identifica con quello di
derivazione e non con quello di traslazione come accade nei sistemi TD.
E’ ovvio che anche con questo metodo la dimensione del sistema dipende molto dalla
scelta del vettore di stato; una cosa è certa, qualunque sia la realizzazione del sistema
questa deve ammettere gli stessi autovalori di ogni altra (cambiando dimensione
dovrebbero cambiare il numero di autovalori, ma non perché non ci sono, semplicemente
perché si cancellano durante il calcolo della f.d.t per cui non sono visibili esternamente)
nonché la stessa f.d.t. o m.d.t. Analogo discorso per i sistemi TC dove l’operatore p
s’identifica con l’operatore di derivazione.
3.1 Determinazione di una rappresentazione i/u a partire da una rappresentazione
i/s/u
Abbiamo visto che una f.d.t. di un sistema non è altro che una sua rappresentazione i/u
nell’ipotesi che lo stesso sistema si evolva a partire dallo stato zero.
Ciò implica che un modo per ottenere una rappresentazione i/u di un sistema a partire da
una sua rappresentazione i/s/u è di determinare la f.d.t del sistema,
)()()()( zU
zDzNzY =
sostituire, in N(z) e D(z), la variabile z con l’operatore p (di traslazione nel caso TD e di
derivazione nel caso TC)
pinpolinomiPNepD
kupNkypDkupDpNky
)()(
)()()()()()()()( =⇒=
e quindi sviluppare entrambi i membri della relazione ottenuta tenendo presente che
TCkfkfpTDnkfkfp
nn
n
)()()()(
)(=
+=
8
3.2 dentificabilità o taratura dei modelli ARMA di un sistema LTI
3.2.1 Assenza di errori sull’ingresso e sull’uscita:
9
10
11
3.2.2Presenza di errori sull’ingresso e sull’uscita:
12
4. STABILITA’ INTERNA ALLA LYAPUNOV
Le nozioni di stabilità interna che ci proponiamo di introdurre forniscono indicazioni
circa il comportamento del sistema nell’intorno di un suo punto d’equilibrio; in pratica
servono a stabilire se una piccola perturbazione, da x0, provoca una risposta nello stato del
sistema che si estingue nel tempo (lo stato tende, dopo un piccolo scostamento, di nuovo a
x0), che converge ad un altro stato x o addirittura divergente.
Nell’introdurre queste nozioni di stabilità, è bene premettere che, noi considereremo
prevalentemente il caso in cui il punto d’equilibrio x0 sia isolato (in realtà i sistemi
dinamici possono avere più punti d’equilibrio ed, addirittura, quelli non lineari possono
avere punti d’equilibrio periodici) e coincidente con l’origine (ciò non è restrittivo perché
possiamo sempre ricondurci a questo caso tramite una traslazione di coordinate).
4.1 Asintotica stabilità (locale) e stabilità nel senso di Lyapunov
Un sistema si dice asintoticamente stabile attorno al suo punto d’equilibrio se soddisfa
le seguenti condizioni
a. 0101 )()(00 tttxtxsechetale ≥∀∀ εε
(Questa condizione richiede che la traiettoria di stato debba essere confinata in una
piccola sfera di raggio ε, centrata nel punto d’equilibrio, nell’ipotesi che il sistema si
evolva da un’arbitraria condizione iniziale che cada in una piccola sfera di raggio δ1>0
sufficientemente piccolo)
b. ∞→→∂∃∂ tpertxalloratxsechetale 0)()(0 202
Se un sistema soddisfa soltanto la prima condizione si dice stabile nel senso di
Lyapunov o semplicemente stabile (i.s.l); in questo caso il punto d’equilibrio si dice
marginalmente stabile.
Se un sistema soddisfa entrambe le condizioni si dice asintoticamente stabile e con lui il
suo punto d’equilibrio.
Se un sistema non soddisfa la prima condizione si dice instabile così come il suo punto
d’equilibrio. N.B.: ESISTONO SISTEMI NON LINEARI CHE SODDISFANO LA SECONDA CONDIZIONE SENZA
SODDISFARE LA PRIMA.
13
ESEMPIO: Consideriamo il seguente sistema LTI-TC
��
���
===+=
•
)0,(),(
xgxyuxfbuaxx
determinare
(a) PUNTI D’EQUILIBRIO: −−−−−−
−=+== uabxubxauxf 0),(0
(b) SOLUZIONE:
Operiamo una traslazione di coordinate
0)(sup)()(
)()(
)()()(
0000 ≠=−=
=+==
+=−=
−
−••
−−
txponendozxtxtz
tazubaxxtz
uabtxxtxtz
Integrando si ottiene
��
�
��
�
�
==
∞=>
=<
+−==
−
∞→
∞→
∞→
−−
;)(lim0
;)(lim0
;sin0)(lim0
])([)()( 00
semplicestabilitàxtza
àinstabilittza
stabilitàtoticaatza
xxtxetxzetz
t
t
t
atat
14
4.2 Stabilità dei sistemi lineari tempo-invarianti
Vogliamo studiare la stabilità di un sistema LTI non forzato d’equazioni
Supponiamo che la matrice A sia diagonalizzabile; dalle formule di Lagrange del
sistema diagonalizzato si ricava
dove W=V-1.
Un sistema è stabile se partendo da un punto la sua evoluzione nello stato rimane
limitata dentro una sfera; dalle precedenti relazioni si deduce che
TDWxVkx
TCWxVetxk
t
)0()(
)0()(
Λ=
= Λ
per cui )(tx è limitato se e solo se è limitato
niTDTCe
ki
ti
,.......,2,1=λ
λ
Quindi un sistema è stabile nel senso di Lyapunov se e solo se
TDniTCni
i
i
,....,11,....,10)Re(
=∀≤=∀≤
λλ
Per l’asintotica stabilità è necessario invece che tale disuguaglianza sia in senso stretto
TDniTCni
i
i
,....,11,....,10)Re(
=∀<=∀<
λλ
stabileetoticamentasistema sin⇒
15
Osservazioni:
• Nel caso in cui un sistema ammetta autovalori immaginari (TC) o con modulo
unitario (TD) è necessario che tali autovalori abbiano molteplicità unitaria (siano soluzioni
semplici del polinomio caratteristico della matrice A) affinché il sistema sia
marginalmente stabile (stabile nel senso di Lyapunov).
• Se il sistema ammette autovalori immaginari (TC) o di modulo unitario (TD)
con molteplicità maggiore di uno, o ancora autovalori con parte reale positiva (TC) o con
modulo maggiore di uno (TD), allora tale sistema è instabile.
• Nel caso in cui la matrice A non sia diagonalizzabile si ricorre alla matrice di
JORDAN (sempre tramite traslazione di coordinate) e si dimostra che continuano a valere i
risultati di prima (vedi espressione matrice eJt a pag. 18).
16
4.3 Metodo diretto di Lyapunov per sistemi TC-NL-TI
Consideriamo il seguente sistema TC-NL-TI
))(( txfx =•
4.1)
che ha un punto d’equilibrio a x=0.
Consideriamo una funzione continua, scalare V(x) che è nulla nell’origine e positiva in
un intorno sufficientemente piccolo di essa
• V(0)=0
• V(x)>0 per x≠0 e 0
17
Esempio: Consideriamo il sistema
)(1)(
)1()(1
)()1( 2
2
122
2
21 kx
kxkxkx
kxkx+
=++
=+
il quale ha un solo punto d’equilibrio nell’origine; scegliamo la funzione di Lyapunov
quadratica 22
21)( xxxV +=
quindi
[ ] [ ]
[ ] [ ] 0)1)(11)](([)]([
)(1
)()(
)]([)(1
)(
)(1
)()]([)]1([)]([))](([)(
222
222
22
21
222
21
222
22
≤−+
=−+
+=
=−+
++
=−+=−=•
kxkxVkxV
kx
kxkx
kxVkx
kx
kx
kxkxVkxVkxVkxfVxV
per cui x=0 è stabile nel senso di Lyapunov.
4.5 Funzione quadratica di Lyapunov per sistemi TC-LTI
Consideriamo il sistema lineare tempo continuo
)()( tAxtx =•
4.3)
e la funzione nT xPxxxV ℜ∈=)(
dove P è una matrice simmetrica.
V(x) è una funzione definita positiva se e solo se tutti gli autovalori di P sono positivi.
Una matrice P che soddisfa
00 ≠∀> xPxxT
si dice definita positiva (s’indica con P>0).
Una matrice P che soddisfa
00 ≠∀≥ xPxxT
è chiamata semidefinita positiva (s’indica con P≥0).
Supponiamo ora che la matrice V(x), candidata come funzione di Lyapunov per il
sistema, sia così definita
0)( >= PPxxxV T
Allora
18
QxxxPAPAxPAxxPxAxxPxPxxxV TTTTTTTT −=+=+=+=•••
)()( dove la matrice Q è data da
PAPAQ T +=−
Ovviamente il punto d’equilibrio nell’origine è i.s.l. se e solo se Q≥0 (in questo caso
V(x) è una funzione di Lyapunov) mentre è asintoticamente stabile se e solo se Q>0.
Possiamo riassumere quanto detto affermando che possiamo trovare una funzione di
Lyapunov quadratica per il sistema 4.3) scegliendo una matrice simmetrica Q>0 e
provando a risolvere la seguente equazione (equazione di Lyapunov)
PAPAQ T +=−
rispetto a P. se tal equazione ha una soluzione definita positiva (P>0) allora il sistema
è asintoticamente stabile. Ciò è provato dal seguente teorema.
Teorema: Dato il sistema dinamico
)()( tAxtx =•
ed una Q>0, esiste una soluzione P>0 dell’equazione di Lyapunov
PAPAQ T +=−
se e solo se tutti gli autovalori di A sono nel semipiano sinistro. In questo caso la
soluzione P è unica.
4.6 Funzione quadratica di Lyapunov per sistemi TD-LTI
Consideriamo il sistema
x(k+1)=Ax(k)=f(x(k)) 4.4)
Se V(x)=xTPx allora
PxxPAxAxkxVkxfVxV TTT −=−=•
)]([))](([)(
Quindi l’equazione di Lyapunov da studiare è
PPAAQ T −=−
Teorema: Dato il sistema 4.4) e una Q>0, esiste una soluzione P>0 dell’equazione di
Lyapunov
PPAAQ T −=−
se e solo se tutti gli autovalori di A hanno modulo minore di 1. La soluzione P in questo
caso è unica.
19
4.7 Metodo indiretto di Lyapunov: mediante linearizzazione
Supponiamo che il sistema
)(xfx =•
4.5)
ha un punto di equilibrio in x0=0 (eventualmente si ricorre alla traslazione).
Supponiamo che il sistema linearizzato nell’intorno dell’origine sia:
Axx =∂•
4.6)
dove
00=
∂∂=
xxfA
Vale il seguente teorema.
Teorema: Se il sistema 4.6) è asintoticamente stabile allora il punto di equilibrio x0=0
è (localmente) asintoticamente stabile.
Se il sistema 4.6) è instabile (autovalori di A nel semipiano destro) allora il punto di
equilibrio x0=0 è instabile.
Se la matrice A ha autovalori nulli o con parte reale nulla allora il sistema linearizzato
non può comunicarmi nessun’informazione circa il comportamento del sistema di partenza
4.5) in x0=0.
Analoghe considerazioni per i sistemi tempo discreti.
4.8 Teorema di Lyapunov per la stabilità asintotica globale
Se una funzione V(x) è l.p.d. nell’intero spazio degli stati, è tale che
∞→∞→ xperxV )(
ed inoltre )(xV•
è l.n.d. nell’intero spazio degli stati, allora il punto di equilibrio x0=0 è
asintoticamente globalmente stabile.
4.9 Stabilità dei sistemi LTV
La soluzione generale di un sistema LTV non forzato è del tipo
per cui valgono le due seguenti definizioni
• Un sistema LTV non forzato è stabile nel senso di lyapunov nell’origine se e
solo se
20
• Un sistema LTV non forzato è asintoticamente stabile nell’origine se e solo se
ot∀
5 STABILITA’ INGRESSO-USCITA O ESTERNA
Affronteremo in questo capitolo l’analisi della stabilità esterna di sistemi LTI tempo-
continui e tempo-discreti. Per stabilità esterna s’intende la proprietà di un sistema di
mantenere un’uscita limitata quando è forzato con un ingresso anch’esso limitato.
Per introdurre queste nozioni è necessario, dapprima, presentare le cosiddette misure sui
segnali, con le quali è possibile ottenere quattro parametri fondamentali:
1. Ampiezza di picco
2. Energia
3. Potenza
4. Azione
5.1 Misure sui segnali
Tenendo conto del fatto che un segnale è una variabile manifesta che dipende dal
tempo,
TDZkTCt
n
n
ℜ→
ℜ→ℜ
:)(:)(
ϖϖ
consideriamo una successone infinita o semi-infinita (qualora t0=0) di valori che un
segnale assume in instanti di tempo successivi
5.1)
La prima misura che possiamo fare su questa successioni di segnali è quella
dell’ampiezza di picco.
21
Ampiezza di picco
L’ampiezza di picco si misura attraverso la norma a uno 1:
• Tempo discreto: Data la successione 5.1) si definisce norma a uno il massimo
dell’ampiezza che assume il segnale
∞∞== )(sup)(maxsup kk
kiik
ϖϖϖ
• Tempo continuo: Data la successione 5.1) si definisce norma a uno il massimo
dell’ampiezza che assume il segnale
∞∞== )(sup)(maxsup tt
tiit
ϖϖϖ
Esempio:
>∞<=
=⇒=∞
11111
)(aseasease
ak k ϖϖ
Energia
L’energia si misura attraverso la norma a 2 2; la norma a 2 è la radice quadrata
dell’energia
• Tempo discreto:
∑∑ ==kk
T kkk 222
)()()( ϖϖϖϖ
• Tempo continuo:
∫∫ ==tt
T ttt 222
)()()( ϖϖϖϖ
Esempio:
∞≥= ∫∞
−−
adtetatet atat
21)(00)(
0
22
ϖϖ
Potenza
La potenza si definisce mediante le seguenti relazioni
• Tempo discreto:
))()(21(lim
1
)1(∑−
−−=∞→=
N
Nk
T
Nkk
NP ϖϖϖ
• Tempo continuo:
22
∫−
∞→=
L
L
T
Ltt
LP ))()(
21(lim ϖϖϖ
Come si può notare, la potenza non è una norma perché non soddisfa necessariamente la
condizione
00 =⇔= xx
Un parametro molto utile, legato alla potenza, è il valore quadratico medio dell’energia
o energia media:
ϖσρ P=
Azione del segnale
L’azione di un segnale è definita mediante la sua norma a 1 1
• Tempo discreto:
∑ ∑∑ ===k k
n
ii kk 1
11
)()( ϖϖϖ
• Tempo continuo:
∫ ∫∑∞ ∞
===
0 01
11
)()( dttdtkn
ii ϖϖϖ
Esempio di norme:
=
∞==
=
⇒≥=
∫
∫∞
∞∞
01
0
22
0)(
dtV
dtV
V
tVt
ϖ
ϖ
ϖ
ϖ222
1 2
0
2 VpVdtVL
PL
=⇒== ∫ϖ
Relazioni fra le norme
Per un sistema tempo-discreto vale la seguente relazione tra le norme
∞
23
Bisogna stare attenti inoltre al fatto che se un segnale è a potenza finita non
necessariamente deve estinguersi nel tempo (si pensi al segnale sinusoidale), a differenza
di quanto accade per un segnale ad energia limitata.
5.2 Sistemi BIBO-stabili e Lp-stabili
Consideriamo un sistema
u H y
nel quale l’uscita y è legata all’ingresso u attraverso un operatore generico (anche non
lineare); un sistema di questo tipo si dice lp-stabile o p-stabile (con ∞= ,2,1p ) se esiste
una costante finita ℜ∈C tale che
ppuCy ≤ 5.2)
Se questa condizione è verificata per ∞=p allora il sistema si dice BIBO-stabile
(Bounded Input Buonded Output ossia Ingresso Limitato Uscita Limitata).
Vediamo adesso di determinare delle condizioni attraverso le quali è possibile stabilire
se un sistema LTI è Bibo-stabile (stabile esternamente) o Lp-stabile.
Teorema: Consideriamo un sistema LTI-TC con m ingressi e p uscite e matrice delle
risposte impulsive )]([)( 1 sHLtH −= ; tale sistema è BIBO stabile se e solo se
∞
24
che soddisfa la 5.2) e quindi il sistema è BIBO stabile.
Nel caso SISO inoltre vale pure il seguente teorema
stabileLpèsistemailuHyueHseppp
⇒∞
25
6. PROPRIETA’ STRUTTURALI
In questo capitolo analizzeremo in dettaglio gli effetti che l’ingresso di un sistema LTI
può avere sullo stato; in pratica introdurremo le cosiddette proprietà strutturali
(raggiungibilità, controllabilità e osservabilità) di un sistema LTI.
Inizieremo la nostra discussione analizzando la proprietà di raggiungibilità per i sistemi
LTI-TD perché il caso tempo continuo è più difficile da trattare per cui ci limiteremo ad
estrarre delle considerazioni dall’analisi sui sistemi TD.
6.1 Raggiungibilità per sistemi LTI-TD
Consideriamo un sistema LTI-TD
Ci chiediamo se è possibile scegliere una sequenza di ingressi
in modo da portare il sistema dallo stato iniziale ( ) 00 =x allo stato obiettivo ( ) xkx ~= ;
in pratica vogliamo che ad un certo passo k lo stato raggiunga il valore prefissato x~ .
Se è possibile trovare tale sequenza di ingresso allora lo stato x~ si dice raggiungibile
in k passi; ovviamente non sempre è possibile trovare tale sequenza per cui non sempre
uno stato è raggiungibile.
Vediamo di determinare delle condizioni che ci permettano di stabilire quando uno stato
del sistema è raggiungibile o meno.
Se guardiamo la formula di lagrange per un sistema LTI-TD
ponendo ( ) 00 =x e ( ) xkx ~= si ottiene
kkURx =~ 6.1)
26
Otteniamo un sistema lineare di n equazioni in k incognite che ammette soluzione se e
solo se nk ≤ e la matrice Rk è invertibile; in tal caso la soluzione è data da
xRU kk ~1−=
e tale soluzione diventa unica se k=n.
Chiamiamo con
rkkk XRRangeRRa ===ℜ )()(
lo spazio generato dai vettori colonna della matrice di raggiungibilità Rk; tale
sottospazio lineare prende il nome di sottospazio raggiungibile in k passi perché è formato
da tutti e soli gli stati del sistema che sono raggiungibili in k passi e quindi ottenuti dalla
6.1) al variare della sequenza di ingresso Uk.
Si dimostra che vale il seguente teorema
Teorema: Per lnk ≤≤
)()()( lnk RRaRRaRRa =⊆ 6.2)
con n=dim(A)=dim(x).
Infatti dal teorema di Caylei-Hamilton si sa che
[ ]BABBABABABARmatricenellaquindi
nlAAAA
nnlll
n
i
ii
ln
i
ii
n
2121
1
1
0
−−−−
=
−
=
=
≥=⇒= ∑∑ γα
le prime l-n colonne sono generate dalle restanti n e quindi
)()( ln RRaRRa =
ossia più in generale la 6.2).
Questo risultato permette di eliminare la dipendenza tra la raggiungibilità di uno stato
ed il numero di passi necessari per ottenerla visto che ogni stato raggiungibile in al più K
passi lo è anche in un numero di passi almeno pari a n.
Il sottospazio )( nn RRa=ℜ si dice sottospazio raggiungibile in al più n passi o, per
quanto detto prima, semplicemente sottospazio raggiungibile.
Nel caso in cui sia soddisfatta la seguente condizione
nRRaXRRa nn =⇒= )](dim[)( 6.3)
27
il sottospazio Ra(Rn) coincide con l’intero spazio degli stati, il che significa che tutti gli
stati del sistema sono raggiungibili; in tal caso è il sistema stesso che si dice raggiungibile
o completamente raggiungibile.
In un sistema SISO la matrice di raggiungibilità Rn è quadra di ordine n per cui la 6.3) è
verificata se e solo se
0)det()( ≠⇒= nn RnRrango 6.4)
In un sistema MIMO, invece, la completa raggiungibilità di un sistema non può essere
testata mediante la non singolarità della matrice Rn in quanto questa non è quadra, ma
rettangolare e di ordine nmn× ; allora è più corretto dire che, indipendentemente
dall’ordine della matrice di raggiungibilità, un sistema è completamente raggiungibile se e
solo se la matrice Rn ha rango massimo, il che si verifica quando
0)det( ≠nTn RR . 6.5)
Se la matrice di raggiungibilità ha rango minore di n allora non tutti gli stati sono
raggiungibili ed il sistema si dice non completamente raggiungibile.
Supponiamo, ora, che il sistema LTI-TD sia completamente raggiungibile; ci
chiediamo: assegnato uno stato x~ qual’è la sequenza nU che ci permette di raggiungerlo?
Distinguiamo i seguenti casi:
• xR
nu
uou
URnRrangoRtu nnnnnn
n~
)1(
)1()(
0)det()(1)](dim[ 1−× =
−
=⇒≠⇒=⇒ℜ∈⇒=
•
2min
~)(0)det()(
~~1)](dim[
1
anormalaimizzachesoluzionelaèUxRRRURRnmassimoRrangose
URRxRURxRmtu
n
Tnn
Tnnn
Tnn
nnTn
Tnnn
nmnn
∗
−∗
×
=⇒≠⇒==
=⇒=
ℜ∈⇒>=
Consideriamo ora il caso in cui si voglia raggiungere un generico stato d non a partire
dallo stato zero, ma a partire da un arbitrario stato iniziale S; dalla formula di lagrange si
deduce che la sequenza d’ingresso che ci risolve questo problema è soluzione del seguente
sistema
28
kkk URSAd =−
Se d e S sono stati arbitrari, indipendentemente dalle caratteristiche della matrice A, la
quantità a primo membro la si può considerare come un nuovo generico stato x~ da
raggiungere a partire dallo stato zero; ciò significa che il concetto di raggiungibilità dallo
stato zero è più generale del concetto di raggiungibilità a partire da uno stato S non nullo,
per cui diciamo che se uno stato x~ è raggiungibile dallo stato zero, allora è anche
raggiungibile da qualsiasi stato S non nullo e viceversa.
Gramiano di raggiungibilità: Si definisce Gramiano di Raggiungibilità la matrice
∑−
===
1
0)(
k
i
iTTiTkkk ABBARRρ
e si dimostra che
• kρ è simmetrica: Tkk ρρ =
• kρ è semidefinita positiva: 0≥kρ
Teorema: Lo spazio immagine della matrice kρ è uguale allo spazio immagine della
matrice di raggiungibilità:
kkk R ℜ== )Im()Im(ρ
per cui
nlperRR nnll ≥ℜ=== )Im()Im()Im(ρ
quindi un sistema LTI-TD è raggiungibile se e solo se
0)det()( ≠⇒= nn nrango ρρ
Quest’ultima relazione può essere usata in sostituzione della 6.5) quando si ha a che fare
con sistemi MIMO, per i quali la 6.4) non può essere applicata.
Teorema: Il sottospazio di raggiungibilità è A-invariante:
rrrr XAXXAxXxse ⊆⇒∈⇒∈
dim:
[ ]BABBABARrangeX nnnr 21Im)( −−== quindi un vettore x di Xr è combinazione lineare delle colonne di Rn; pre-moltiplicando x
con la matrice A si ottiene un vettore che è combinazione lineare delle colonne di
[ ]BABBABA nn 1−
29
ma per Cailey-Hamilton la prima colonna è combinazione lineare delle precedenti per
cui
[ ]BABBABAAx nnr 21Im −−∈
6.2 Decomposizione standard per sistemi non completamente raggiungibili
(Decomposizione di Kalman di raggiungibilità)
Consideriamo un sistema LTI-TD non completamente raggiungibile e supponiamo di
voler evidenziare e separare la parte irraggiungibile da quella raggiungibile (se esiste).
Ciò può essere ottenuto mediante una trasformazione per similitudine ottenuta con un
cambiamento di coordinate che fa uso di un’opportuna matrice di trasformazione T.
Questa matrice di trasformazione deve essere tale da farci ottenere una rappresentazione
equivalente del tipo
ℜ∈ℜ∈
= −rn
r
zz
conkzkz
z2
1
2
1
)()(
mrrnrnrnrrr BAAA
kuB
kzkz
AAA
kzkz
×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈
+
=
++
1)()(
2)(
121
1
2
1
2
121
2
1 )(0)(
)(0)1(
)1(
6.6)
dove le z1 sono le componenti del vettore di stato sulle quali si ha un’azione diretta
dell’ingresso e pertanto sono le componenti modificabili per raggiungere o controllare uno
stato; le componenti z2 sono, invece, quelle non modificabili né tramite l’ingresso né
tramite le altre componenti z1.
Quindi il sistema
)()()()1( 1212111 kuBkzAkzAkz ++=+
rappresenta il sottosistema raggiungibile del sistema dato e gli autovalori di A1 si dicono
autovalori raggiungibili.
Il sottosistema non raggiungibile è, invece, il seguente
)()1( 222 kzAkz =+
è gli autovalori di A2 si dicono autovalori irraggiungibili.
Vediamo adesso come è composta la matrice T che mi permette di ottenere una simile
decomposizione; se il sistema non è completamente raggiungibile significa che
nrXnrRRa rn
30
Queste colonne saranno le prime r colonne della matrice T; le restanti n-r colonne
saranno composte da vettori linearmente indipendenti tra di loro e con le prime r colonne
di T.
ATTTTAATATATTAxTzTzx
][][ 21211
1
=⇒=⇒==⇒=
−
−
T1 è la base dello spazio di raggiungibilità per cui AT1appartiene ancora a tale spazio e
quindi, visto che lo spazio Xr ha dimensione r, sarà del tipo
=
01
1
AAT
Il seguente schema a blocchi è una rappresentazione grafica della decomposizione di
Kalman di raggiungibilità o controllabilità
u z1(k+1) z1(k)
B1 Delay
A1
A12 z2(k)
Delay
A2
Da notare come le componenti z1 non abbiano influenza alcuna sulle z2 le quali
risultano, quindi, irraggiungibili.
6.3 Test modali di raggiungibilità
Quando si ha a che fare con sistemi non completamente raggiungibili di dimensioni
elevate, applicare la decomposizione standard di Kalman può risultare molto laborioso; in
questi casi si possono distinguere gli autovalori raggiungibili e non raggiungibili, mediante
i cosiddetti test modali di raggiungibilità.
31
Teorema 1: Un sistema LTI-TD è non raggiungibile se e solo se esiste qualche
autovettore sinistro della matrice A
0)(: '' =− AIλϖϖ che è ortogonale a B:
0' =Bϖ L’autovalore corrispondente a tale autovettore è irraggiungibile.
Dim:
• Supponiamo che esista un autovettore sinistro di A ortogonale a B
000)(: '''' ≠==− ϖϖλϖϖ conBeAI Dalle precedenti relazioni si ottiene
[ ] 0000
'21'
'''''
=⇒=⇒≥=⇒=⇒=
−−n
kk
k
RBABBABAkBABABA
ϖϖϖλϖϖλϖϖ
e cioè che il rango della matrice Rn non è n ma è minore, per cui il sistema non è
completamente raggiungibile.
• Supponiamo, ora, che il sistema non sia completamente raggiungibile ossia che
nRrangonRRa nn
32
N.B.: Nel caso in cui una matrice M non è quadrata, per vedere se perde di rango si può
calcolare il determinante di (MTM) e verificare se si annulla; se il determinante si annulla
allora la matrice M non ha rango massimo.
6.4 Raggiungibilità per sistemi TC
Uno stato x~ di un sistema TC si dice raggiungibile (a partire dallo stato zero)
all’istante L 0≥ se esiste un ingresso u definito in [0.L] tale che
xLx f ~)( =
Un sistema TC in cui tutti gli stati sono raggiungibili si dice sistema completamente
raggiungibile.
Vediamo, dalle formule di Lagrange, come è fatta la risposta forzata
∫−=
ttA
f dBuetx0
)( )()( τττ
e definiamo il seguente integrale
∫ >===+==< )(),( ττρ
Si dimostra che
• simmetricaèLρ
• 0≥Lρ
33
Teorema: Lo spazio di raggiungibilità è dato da
∫==L
TLr dFFRaRaX
0
)()([)( τττρ ]
Teorema: Il range del gramiano di raggiungibilità coincide con il range della matrice
di raggiungibilità Rn anche per i sistemi TC
][)( 21 BABBABARaRa nnL−−=ρ
per cui un sistema TC è completamente raggiungibile se e solo se
nRrango n =)(
N.B.: è conveniente usare la matrice Rn per studiare la raggiungibilità di un sistema
LTI-TC in quanto questa matrice è indipendente dall’istante considerato.
Inoltre anche per i sistemi TC ogni stato che è raggiungibile dallo stato zero, lo è anche
da qualsiasi stato diversa da zero.
6.5 Controllabilità per sistemi LTI-TD
Vogliamo, in questo paragrafo, affrontare il problema della controllabilità allo stato zero
di un generico stato di un sistema LTI-TD; in pratica, dato uno stato iniziale x~ ci
proponiamo di determinare, se esiste, una successione di k valori del segnale di ingresso in
grado di annullare lo stato del sistema.
Se questa successione di k valori esiste allora lo stato x~ si dice controllabile in k passi.
In pratica dalle formule di lagrange si deduce che uno stato x~ è controllabile in k passi
se e solo se esiste una successione di k valori dell’ingresso
tale da soddisfare la seguente relazione
kkk
kkk URxAURxAkx =−⇒+== ~~0)(
Nel caso di sistemi TD completamente controllabili, l’esistenza di tale successione
dipende molto dalle caratteristiche del sistema ed in particolare della matrice A; infatti si
possono distinguere due casi:
1) Se la matrice A è invertibile, la soluzione di controllabilità coincide con quella di
raggiungibilità; in questo caso infatti ad ogni stato raggiungibile mi corrisponde uno ed
uno solo stato controllabile mediante la relazione
34
rk
kkk
c xAURAx ~~−− −=−=
in pratica cx~ è combinazione lineare delle colonne l.i. di A-k con coefficienti gli
elementi di rx~
2) Se la matrice A non è invertibile la soluzione di controllabilità coincide con quella
di raggiungibilità se e solo se è soddisfatta la seguente condizione
)()( nn RRaARa ⊂
Nei sistemi TD, un sistema raggoungibile e’ sempre anche controllabile, ma puo’
esistere un sistema non completamente raggiungibile che e’ controllabile.
Nei sistemi TC, invece, controllabilità e raggiungibilità coincidono sempre.
6.6 Osservabilità per i sistemi LTI-TD
Supponiamo di avere un sistema lineare tempo-discreto del quale conosciamo una
sequenza di k valori dell’ingresso applicati in istanti successivi e la corrispondente
sequenza dei valori dell’uscita.
Ci chiediamo: è possibile, note le informazioni sull’ingresso e sull’uscita, determinare
lo stato iniziale del sistema?
Tale problema è conosciuto come problema dell’osservabilità di uno stato del sistema.
Definizione: Uno stato q di un sistema dinamico è detto non osservabile nell’intervallo
[0,T) se, con x(0)=q e ),0[)( Ttx ∈∀ , si ottiene la stessa uscita y(t) che si otterrebbe a
partire da x(0)=0.
Si parla di sistema completamente non osservabile, o semplicemente non osservabile, se
tutti gli stati sono non osservabili. In tal caso non è possibile determinare univocamente la
condizione iniziale x(0) note le informazioni sugli ingressi e sulle uscite.
Vediamo di determinare una condizione che ci permetta di stabilire quando un sistema è
osservabile.
Consideriamo un sistema LTI-TD di equazioni
)()()()()()1(
kDukCxkykBukAxkx
+=+=+
dalle formule di Lagrange si ricava
35
)()0()()()(
)0()()0()(1
0
1
kDuUCRxCAkDukCxky
URxAlBuAxAkx
kkk
k
lkk
klkk
++=+=
+=+= ∑−
=
−−
Dall’equazione che descrive l’evoluzione dell’uscita del sistema notiamo che oltre
l’uscita, che è nota, figura l’ingresso u(k), anch’esso noto, e la nostra incognita
rappresentata dallo stato x(0) (composto da n componenti se la rappresentazione è di ordine
n); quindi lo stato iniziale potrebbe essere valutato come soluzione di un sistema lineare di
n equazioni in n incognite ottenuto dall’espressione di y(k) considerata in n istanti di tempo
successivi, in corrispondenza dei quali si conoscono i valori dell’ingresso e dell’uscita del
sistema (in pratica supponiamo di osservare l’uscita del sistema man mano che
applichiamo la successione di n valori in ingresso e per ogni instante di tempo ci scriviamo
l’equazione dell’evoluzione dell’uscita con al posto di y(k) e x(k) i valori assunti all’istante
k considerato). Tale sistema è dato da
kkk
k
DUUCRkykydove
nkxCAky
−−=
−==
)()(~
1,...,1,0)0()(~
e può essere scritto in forma compatta nel seguente modo
)0()0(~
1
2 xx
CA
CACAC
Y n
n
k θ=
=
−
6.7).
L’incognita x(k) è univocamente determinata se e solo se la matrice nθ , che prende il
nome di matrice di osservabilità del sistema, ha rango massimo ossia
nrango n =)(θ
per cui possiamo concludere che un sistema LTI-TD di ordine n è completamente
osservabile se e solo se la matrice di osservabilità nθ è tale che
• SISOcason 0)det( ≠θ
• MIMOcasonTn 0)det( ≠θθ
Si osservi come la 6.7) assomigli a quella che è la risposta libera nell’uscita del sistema,
per cui l’osservabilità di uno stato iniziale x(0) può essere verificata anche nell’ipotesi
semplificativa che il sistema non sia forzato (ingresso nullo); in tal caso
)()(~ kyky =
36
Valgono i seguenti teoremi:
Teorema 1: Il sistema è completamente osservabile se e solo se il nucleo( nθ )={0}.
Dim: Se il nucleo( nθ )=Kerr( nθ )≠{0} allora tutti gli stati appartenenti a tale nucleo
sarebbero non osservabili, in quanto
0)( =⇔∈ xnucleox nn θθ
Quindi il sottospazio di non osservabilità coincide con lo spazio nullo della matrice di
osservabilità e si indica con oX .
Teorema 2: Lo spazio nullo di ( nθ ) è uguale allo spazio nullo di ( 1+nθ ), cioè
)()( 1+= nn NN θθ ; inoltre nkNN nk ≤⊆ )()( θθ .
Dim: Dal teorema di Cailey-Hamilton
∑∑−
=+
−
+
−
=
≥==
=⇒=⇒=1
01
1
2
1
1
0)()()(
n
ilnn
n
n
ni
in
n
i
ii
n nlperNNNallora
CACA
CACAC
seCACAAA θθθθαα
Ciò significa che, qualunque sia l'istante di tempo considerato purché questo non risulti
inferiore a n, lo spazio degli stati non osservabili e lo stesso.
N.B.: Non è possibile osservare uno stato a partire da una sequenza d’ingresso e di
uscita di lunghezza inferiore alla dimensione del sistema in quanto il numero di equazioni
del sistema 6.7) sarebbe inferiore al numero delle incognite per cui lo stesso sistema non
ammetterebbe soluzione.
Teorema 3: Un sistema è osservabile in l passi (l≥n) se e solo se è osservabile in n
passi.
6.7 Decomposizione standard per sistemi non osservabili (Decomposizione di Kalman di
osservabilità)
Consideriamo un sistema LTI-TD non completamente osservabile e supponiamo di
voler evidenziare e separare la parte non osservabile da quella osservabile (se esiste).
Ciò può essere ottenuto mediante una trasformazione per similitudine ottenuta con un
cambiamento di coordinate che fa uso di una opportuna matrice di trasformazione T.
Questa matrice di trasformazione deve essere tale da farci ottenere una rappresentazione
equivalente del tipo
37
ℜ∈ℜ∈
= −on
o
zz
conkzkz
z2
1
2
1
)()(
[ ]moonononooo BAAA
kDukzkz
Cky
kBukzkz
AAA
kzkz
×−×−−×× ℜ∈ℜ∈ℜ∈ℜ∈
+
=
+
=
++
1)()(
2)(
121
2
11
2
1
221
1
2
1
)()()(
0)(
)()()(0
)1()1(
6.8)
dove le z1 sono le componenti del vettore di stato che ci ritroviamo in uscita e pertanto
sono le componenti osservabili attraverso y(k); in pratica sono le prime “no” componenti
del vettore di stato dove “no” è la dimensione del sottospazio osservabile; le componenti
z2 sono, invece, quelle non osservabili né attraverso l’uscita né attraverso le z1.
Quindi il sistema
)()()()()()1(
11
1111
kDukzCkykuBkzAkz
+=+=+
rappresenta il sottosistema osservabile del sistema dato e gli autovalori di A1 si dicono
autovalori osservabili.
Il sottosistema non osservabile è, invece, il seguente
)()()()1( 2221212 kuBkzAkzAkz ++=+
è gli autovalori di A2 si dicono autovalori non osservabili.
Vediamo adesso come è composta la matrice T che mi permette di ottenere una simile
decomposizione; se il sistema non è completamente osservabile significa che
nnXnnrango ooon
38
ATTTTAATATATTAxTzTzx
][][ 21211
1
=⇒=⇒==⇒=
−
−
Il seguente schema a blocchi è una rappresentazione grafica della decomposizione di
Kalman di osservabilità
u(k) z1(k+1) z1(k) y(k)
B1 Delay C1
A1
A21
z2(k+1) z2(k)
B2 Delay
A2
Da notare come le componenti z2 non abbiano legame alcuno con l’uscita e quindi sono
non osservabili.
In molti casi si può avere a che fare con sistemi che sono contemporaneamente non
osservabili e non raggiungibili; in questi casi per determinare la parte osservabile e/o
raggiungibile del sistema, si può procedere in due modi
• Studiare separatamente la raggiungibilità e l’osservabilità mediante le rispettive
decomposizioni
• Fare un’unica decomposizione mediante un’opportuna matrice T
In pratica si può procedere prima con una decomposizione in forma standard di
raggiungibilità sulla quale si effettua, dopo, un’ulteriore decomposizione standard
d’osservabilità; oppure si opera un’unica opportuna trasformazione di coordinate che mi
permetta di ottenere una rappresentazione del tipo
39
[ ] )(
)()()()(
00)(
)(
00
)()()()(
00000
00
)1()1()1()1(
4
3
2
1
31
2
1
4
3
2
1
4443
33
24232221
1311
4
3
2
1
kDu
kzkzkzkz
CCky
kuBB
kzkzkzkz
AAA
AAAAAA
kzkzkzkz
+
=
+
=
++++
dove le
• z1(k) sono le componenti raggiungibili ed osservabili
• z2(k) sono le componenti raggiungibili e non osservabili
• z3(k) sono le componenti non raggiungibili ed osservabili
• z4(k) sono le componenti non raggiungibili e non osservabili
Pertanto, gli autovalori di
• A11 sono raggiungibili e osservabili
• A22 sono raggiungibili e non osservabili
• A33 sono non raggiungibili e osservabili
• A44 sono non raggiungibili e non osservabili
Se supponiamo che
{ } { } { } 0dim0)()( 0
≠∩⇒≠∩==
oror
nrn
XXXXnrangoenRrango θ
allora la matrice che ci permette di ottenere tale rappresentazione è del tipo
[ ]
{ }{ }
{ }{ } esisteseXXersezionespaziodellobaseindiplinvettori
esisteseXXersezionespaziodellobasevv
esisteseXXersezionespaziodellobasevv
esisteseXXersezionespaziodellobasevvdove
vvindiplinvettorivvvvTxTzTzx
or
ori
ornkn
orri
nknrii
∩=
∩=
∩=
∩=
==⇒=
−
+
−+
−
int..
int
int
int
..
1
1
11
1
Il seguente schema a blocchi è una rappresentazione grafica della decomposizione di
Kalman di raggiungibilità e osservabilità
40
u(k) ∑ro y(k)
∑ or
∑ or
∑ or
6.8 Test modali d’osservabilità
Quando si ha a che fare con sistemi non completamente osservabili di dimensioni
elevate, applicare la decomposizione standard di Kalman può risultare molto laborioso; in
questi casi si possono distinguere gli autovalori osservabili e non osservabili, mediante i
cosiddetti test modali d’osservabilità.
Teorema 1: Un sistema LTI-TD è non osservabile se e solo se esiste qualche
autovettore destro della matrice A
0)(: '' =− ϖλϖ AI che è ortogonale a C:
0' =Cϖ L’autovalore corrispondente a tale autovettore è non osservabile.
Teorema 2: Un sistema è irraggiungibile se e solo se la matrice
−C
AzI
perde di rango per qualche autovalore della matrice A; tali autovalori sono quelli
irraggiungibili.
41
6.9 Teorema della dualità di Kalman
Dato un sistema LTI, supponiamo di avere una rappresentazione nello spazio degli stati
descritta da
{ }∑= DCBA ,,, Si definisce rappresentazione duale la seguente
{ }
,,,,
,,,TTTT DDBCCBAAdove
DCBA
====
=∗∗∗∗
∗ ∗∗∗∗∑
Kalman ha dimostrato che
• ( ) ∑∑ =∗∗ e cioè il duale del sistema duale è il sistema stesso • Tnn
Tnn ReR ==
∗∗ θθ , perciò se si vuole studiare la raggiungibilità
(osservabilità) di un sistema basta studiare l’osservabilità (raggiungibilità) del suo duale.
6.10 Forme canoniche di controllabilità e d’osservabilità
Forma canonica di raggiungibilità e controllabilità
Supponiamo di avere un sistema LTI, completamente raggiungibile, descritto da
un’equazione differenziale del tipo
Si chiama forma canonica di raggiungibilità una rappresentazione nello spazio degli
stati del tipo
Tale forma canonica, che prende anche il nome di 1° forma canonica di raggiungibilità,
si può ottenere da una generica rappresentazione mediante una trasformazione di
coordinate del tipo
)()()()()()( 111 tTztzRRtxtxRRtz nnnn ==⇒=−−−
42
dove Rn è la matrice di raggiungibilità del sistema.
Esiste una 2° forma canonica di raggiungibilità dove la matrice A è del tipo
Forma canonica di osservabilità
Supponiamo di avere un sistema LTI, completamente osservabile, descritto da
un’equazione differenziale del tipo
Si chiama forma canonica di osservabilità una rappresentazione nello spazio degli stati
del tipo
Tale forma canonica si può ottenere da una generica rappresentazione mediante una
trasformazione di coordinate del tipo
)()()()()()( 111 tTztztxtxtz nnnn ==⇒=−−− θθθθ
dove nθ è la matrice di osservabilità del sistema.
N.B.: Le forma canoniche si ottengono immediatamente dalle rappresentazioni ingresso
uscita di un sistema LTI; ciò suggerisce un altro metodo per ottenere una rappresentazione
i/u di un sistema a partire da una sua rappresentazione i/s/u.
6.11 Minimalità dei sistemi LTI
Definizione: Un rappresentazione di un sistema LTI si dice in forma minima quando
non è possibile ottenere una nuova rappresentazione che utilizza un numero minore di
variabili di stato.
43
Teorema 1: Condizione necessaria e sufficiente affinché un sistema sia in forma
minima è che il sistema sia completamente osservabile e completamente raggiungibile.
Teorema 2: La matrice di trasferimento, e di conseguenza la matrice delle risposte
impulsive, di un sistema LTI dipendono solo dalla sua parte completamente osservabile e
completamente raggiungibile.
)()()()()()()()(
111111
111
1111
11111
kDBACkhDBAzICsHtDBeCthDBAsICsH
k
tA
∂+=⇒+−=
∂+=⇒+−=−
−
Teorema 3: Un sistema non è completamente osservabile e/o completamente
raggiungibile se e solo se nella sua f.d.t. sono presenti cancellazioni tra binomi comuni a
numeratore e a denominatore.
Da questi teoremi si possono trarre alcune importanti considerazioni:
• I poli della f.d.t. di un sistema coincidono con gli autovalori della parte
completamente osservabile e completamente raggiungibile, salvo cancellazioni.
Ciò significa che gli autovalori non raggiungibili e/o non osservabili non compaiono,
come poli, nella f.d.t. del sistema per cui non sono visibili esternamente; gli unici
autovalori a comparire come poli nella f.d.t. del sistema sono quelli completamente
osservabili e completamente raggiungibili.
• Se un sistema è solo non raggiungibile tutto gli autovalori che si cancellano sono
non raggiungibili.
• Se un sistema è solo non osservabile tutto gli autovalori che si cancellano sono
non osservabili.
• Se un sistema non ha almeno un autovalore osservabile e raggiungibile la sua
f.d.t è nulla.
• Se il sistema è non osservabile e non raggiungibile non possiamo dire nulla sugli
autovalori che si cancellano
• Un sistema asintoticamente stabile è anche BIBO stabile, mentre, un sistema
BIBO stabile è anche asintoticamente stabile se e solo esso è in forma minima.
Infatti, se il sistema non è in forma minima ci sono degli autovalori di A che non
figurano esternamente; se questi autovalori sono gli unici autovalori instabili, il sistema
risulta BIBO stabile, ma non asintoticamente stabile perché ci sono delle comportamenti
interni indesiderati (divergenza delle componenti dello stato del sistema che non sono
osservabili dall’uscita).
44
• La stabilità marginale non è in grado di garantirmi la BIBO stabilità, tuttavia,
un sistema marginalmente stabile in cui gli autovalori nulli o con modulo unitario sono
irraggiungibili o non osservabili è BIBO stabile
7 STABILIZZAZIONE TRAMITE RETROAZIONE DELLO STATO
Consideriamo un sistema LTI strettamente proprio (D=0) del quale conosciamo lo stato
iniziale x(0) e supponiamo che in ingresso e in uscita non agisca alcun disturbo; la
descrizione nello spazio degli stati del nostro sistema è la seguente
)()()( tButAxtx +=•
Supponiamo che la matrice A ammetta autovalori instabili, per cui il nostro sistema
presenta comportamenti interni e/o esterni indesiderati; ci proponiamo di stabilizzare il
nostro sistema, cioè di ottenere, dal sistema di partenza, un sistema che abbia un
comportamento ingresso-uscita equivalente ma con autovalori stabili.
Ciò può essere ottenuto mediante un’opportuna retroazione dello stato del tipo
evidenziato in figura
v(t) u(t) ∑ x(t) C y(t)
F
In questo caso l’ingresso u(t) del nostro sistema sarà dato da nmFtvtFxtu ×ℜ∈+= )()()( Legge di controllo
Per cui la rappresentazione del sistema controllato sarà la seguente
)()()()()()()(
tCxytBvtxAtBvtxBFAtx CL
=+=++=
•
Per stabilizzare il sistema, allora, basta scegliere opportunamente la matrice F in modo
che gli autovalori della matrice ACL siano quelli desiderati.
Domanda: E’ sempre possibile stabilizzare un sistema instabile, ossia è sempre
possibile determinare una matrice di retroazione F che sia in grado di posizionarmi gli
autovalori di A nel semipiano sinistro del piano complesso (TC) o all’interno del cerchio
45
unitario (TD)? E’ sempre possibile scegliere arbitrariamente una matrice di retroazione F
in modo che gli autovalori della matrice A+BF siano assegnati ad arbitrio?
Risposta: No, salvo che non sia verificata una delle due condizioni
• Il sistema sia completamente raggiungibile
• Eventuali autovalori irraggiungibili siano asintoticamente stabili.
Per dimostrare quanto detto enunciamo il seguente teorema:
Teorema: Esiste una matrice F tale che
7.1)
per ogni possibile insieme di numeri complessi-coniugati o reali, se e solo se la coppia
(A,B) è completamente raggiungibile.
Dim. necessaria: Supponiamo che la coppia (A,B) non sia completamente
raggiungibile; ciò significa che esiste un autovettore sinistro di A, ωi’, ortogonale a B:
iiiiii
iiii
ABFABFABA
ϖλϖϖϖϖϖϖλϖ
==+=+⇒==
)(0
In pratica ogni autovalore irraggiungibile di A è autovalore irraggiungibile per (A+BF),
il che significa che gli autovalori irraggiungibili di A non possono essere posizionati ad
arbitrio; quindi, nell’ipotesi che il sistema sia irraggiungibile, esso è stabilizzabile se e
solo se gli autovalori irraggiungibili sono asintoticamente stabili.
Studiare la stabilizabilità di un sistema significa, quindi, determinare eventuali
autovalori irraggiungibili e vedere se sono stabili o meno.
Dim. sufficiente: Supponiamo che la coppia (A,B) sia raggiungibile e vediamo se
riusciamo a trovare una matrice F che soddisfa la 7.1).
Se il sistema è completamente raggiungibile allora esiste una matrice di trasformazione 1~ −= nn RRT
che riporta il sistema in forma canonica di raggiungibilità
46
[ ]110
110 10
00
10000
0100010
~−
−
=
=
−−−
= n
n
cccCB
aaa
A
dove i termini 10 ,......, −naa sono i coefficienti del polinomio caratteristico della matrice
di partenza
011
1 .......)det()( aaaAIPn
nn ++++=−= −− λλλλλ 7.2)
Supponiamo di applicare questa trasformazione di coordinate e successivamente di
retrazionare lo stato tramite una matrice
[ ]nfffF ~~~~ 21= La matrice ACL del sistema controllato sarà
+−+−+−
=+=
− nn
CL
fafafa
FBAA
~~~1000
00100010
)~~~(
12110
e, dato che il polinomio caratteristico è invariante rispetto ad una trasformazione per
similitudine, vogliamo che gli autovalori di tale matrice coincidano con gli autovalori
desiderati nidi ,.....,2,1=µ .
In pratica dobbiamo determinare la matrice F~ che soddisfa la condizione
)(.......
)()~()~(.......)~()]~~~(det[
011
1
11021
11
λλλλ
µλλλλλ
dddnd
nn
n
i
di
nnn
n
Paaa
fafafaFBAI
=++++=
=−=−+−++−+=+−
−−
=
−− ∏
dalla quale si ricava
−=
−=−=
−−−
−−
d
dnnn
dnnn
aaf
aafaaf
001
221
11
~
~~
La matrice di retroazione F che soddisfa la 7.1) può allora essere determinata
riportandoci alle vecchie coordinate come mostrato di seguito: 111 ~)()(~)()(~)()()( −−− =⇒+=+=⇒= TFFtvtxTFtvtzFtutxTtz .
47
Riassumendo: Un sistema LTI è stabilizzabile se e solo se
• è completamente raggiungibile
• eventuali autovalori irraggiungibili sono asintoticamente stabili
La stabilizzazione è ottenuta mediante una retroazione dello stato che fa uso di una
matrice di retroazione F calcolabile nei tre modi mostrati di seguito:
• imponendo la condizione
[ ]n
n
i
did
fffFdove
PBFAI
21
1
)()()](det[
=
−==+− ∏=
µλλλ
autovalori desiderati (stabili)
Otteniamo, in questo modo, un sistema di n equazioni in n incognite che sono gli
elementi della matrice F.
tale metodo è applicabile sia a sistemi completamente raggiungibili sia non
completamente raggiungibili.
• Mediante la formula di ACKERMAN:
necon
APReF dnT
=
−= −
0
01
)(
1
11
• Se il sistema non è completamente raggiungibile si decompone nella forma
standard di raggiungibilità di Kalman; quindi una volta determinato il sottosistema
raggiungibile si determina, per esso, una matrice di retroazione Fr con uno dei due metodi
sopra mostrati, oppure con il metodo costruttivo della dimostrazione. Una volta
determinata la matrice Fr la si completa con n-r colonne nulle in modo da ottenere la
matrice F.
( ) ( )[ ]0mindet
ˆ,ˆ,ˆˆ,ˆ,ˆtan)(
rr
rrr
n
FFFazioneerCBAileraggiungibmasottosisteCBA
ilitàraggiungibdardsionedecomposizrRrango
=⇒⇒⇒
⇒⇒=
48
8 CONTROLLORI BASATI SUL MODELLO
Nel precedente paragrafo abbiamo visto come è possibile stabilizzare un sistema
mediante una retroazione dello stato, nell’ipotesi che esso sia completamente accessibile e
quindi noto.
Purtroppo, visto che le variabili di stato generalmente sono delle variabili interne, non
sempre lo stato del sistema è completamente noto; in effetti nella maggior parte dei casi
risultano accessibili soltanto alcune componenti, per cui è impossibile operare una
stabilizzazione se prima non si effettua una “misura” dello stato del sistema.
Tale misura può essere ottenuta direttamente dall’uscita dato che questa è una
combinazione lineare delle componenti dello stato del sistema (caso SISO)
)()()( tDutCxty += In pratica si tratta di stimare lo stato, in quanto si parla di stima proprio quando si riesce
a misurare le variabili di stato non accessibili attraverso l’uscita del sistema.
Ma come si effettua una stima x̂ dello stato x del sistema?
Attraverso un sistema dinamico che prende il nome di Osservatore dello stato del
sistema.
Un Osservatore dello stato del sistema è un simulatore, in tempo reale, del sistema; in
pratica è un sistema dinamico che riceve in ingresso lo stesso ingresso del sistema u(t) e,
in base ad un fattore di correzione che dipende dall’uscita y(t) del sistema, fornisce in
uscita una stima x̂ dello stato del sistema. Un osservatore si dice asintotico quando è
verificata la seguente condizione:
xxt
=∞→
ˆlim
Prima di vedere come si progetta un osservatore vediamo invece come osservatore e
controllore sono collegati al sistema da stabilizzare
Consideriamo ora il nostro sistema da stabilizzare descritto dalle seguenti relazioni
49
+=+=
•
)()()()()()(
tDutCxtytButAxtx
Sulla base del sistema l’osservatore sarà descritto dalle seguenti relazioni
+=−−+=
•
)()(ˆ)(ˆ)](ˆ)([)()(ˆ)(ˆ
tDutxCtytytyLtButxAtx 8.1)
Inizialmente i due vettori di stato, quello reale e quello stimato, saranno diversi per cui
saranno diverse anche le uscite )(ˆ ty e )(ty ; al divergere del tempo, però, se l’osservatore
è asintotico, tale differenza si annullerà per cui i due stati tendono a coincidere per t
sufficientemente grande.
Possiamo definire un vettore errore nella stima dello stato
)(ˆ)()(~ txtxtx −=
in base al quale le 8.1) diventano
)()(ˆ)(ˆ)()()(
)](ˆ)([)()(ˆ)()()(~
tDutxCtytDutCxty
tytyLtButxAtButAxtx
+=+=
−+−−+=•
per cui
0)0(ˆ)0()0(~)0(~)(~)(~)()]()(ˆ)()([)(~)(~
)( ≠−==⇒+=+−++=
+
•
xxxconxetxtxLCAtDutxCtDutCxLtxAtx
tLCA 8.2)
Queste relazioni mostrano che il vettore errore, e quindi la stima, non dipendono
dall’ingresso u(t) del sistema; inoltre mostrano che, affinché l’errore della stima si estingua
nel tempo (ossia il nostro osservatore sia asintotico) è necessario determinare una matrice
L tale che la matrice (A+LC) abbia autovalori tutti asintoticamente stabili.
Domanda: E’ sempre possibile stimare lo stato di un sistema, ossia è sempre possibile
determinare una matrice di osservazione L che sia in grado di posizionarmi gli autovalori
di (A+LC) nel semipiano sinistro del piano complesso (TC) o all’interno del cerchio
unitario (TD)? E’ sempre possibile scegliere arbitrariamente una matrice di osservazione
L in modo che gli autovalori della matrice A+LC siano assegnati ad arbitrio?
Risposta: No, salvo che non sia verificata una delle due condizioni:
• Il sistema sia completamente osservabile
• Eventuali autovalori non osservabili siano asintoticamente stabili.
Per dimostrare quanto detto enunciamo il seguente teorema:
50
Teorema: Esiste una matrice L tale che
8.3)
per ogni possibile insieme di numeri complessi-coniugati o reali ),,.........( 1 nµµ , se e
solo se la coppia (A,C) è completamente osservabile.
La validità di questo teorema si basa sul fatto che ogni autovalore non osservabile di A è
autovalore non osservabile per (A+LC) per cui gli autovalori di (A+LC) sono posizionabili
ad arbitrio se e solo se sono osservabili; se vi sono degli autovalori non osservabili ed
instabili il nostro osservatore non sarà asintotico; quindi, nell’ipotesi che il sistema sia non
osservabile, esso è misurabile se e solo se gli autovalori non osservabili sono
asintoticamente stabili.
Studiare la misurabilità di un sistema significa, quindi, determinare eventuali
autovalori non osservabili e vedere se sono stabili o meno.
Come si fa a determinare la matrice L in modo che (A+LC) abbia tutti autovalori
desiderati, ossia stabili?
Si può procedere nei tre modi seguenti:
• imponendo la condizione
n
n
i
did
l
ll
Ldove
PLCAI
2
1
1
)()()](det[
=
−==+− ∏=
µλλλ
autovalori desiderati (stabili)
Otteniamo, in questo modo, un sistema di n equazioni in n incognite che sono gli
elementi della matrice L.
Tale metodo è applicabile sia a sistemi completamente osservabili sia non
completamente osservabili.
• Mediante la formula di ACKERMAN:
51
necon
eAPF
n
nnd
=
−= −
1
00
)( 1θ
• Se il sistema non è completamente osservabile si decompone nella forma
standard di osservabilità di Kalman; quindi una volta determinato il sottosistema
osservabile si determina, per esso, una matrice di osservazione Lr con uno dei due metodi
sopra mostrati, oppure con il metodo costruttivo della dimostrazione. Una volta
determinata la matrice Lr la si completa con n-r colonne nulle in modo da ottenere la
matrice L.
( ) ( )[ ]0mindet
ˆ,ˆ,ˆˆ,ˆ,ˆtan)(
rr
rrr
n
LLLazioneerCBAeosservabilmasottosisteCBA
ilitàraggiungibdardsionedecomposizrrango
=⇒⇒⇒
⇒⇒=θ
N.B.: Nel determinare la matrice L (o Lr) con il metodo
costruttivo si può sfruttare il principio di dualità di Kalman mediante il quale è possibile
posizionare gli autovalori della matrice di osservazione L mediante posizionamento degli
autovalori della matrice di retroazione F* del sistema duale; in pratica ∗∗∗ =⇒+=+=+ FLLBALCALCA TTTTTT )()()(
Ovviamente la matrice F* viene trovata assegnandole gli
autovalori desiderati per l’osservatore.
Mettiamo insieme ora Sistema-Osservatore-Controllore:
+=
+=+=
•
•
eosservatortxLCAtx
sistematDutCxtytButAxtx
)(~)()(~
)()()()()()(
Progettiamo la retroazione:
)()(~)]([)()(
)()](~)([)()()(~)()()(ˆ)(
tBrtxBFtFxBtAxtu
trtxtxFtutrtxFtFxtrtxFtu
+−+=
⇒+−=⇒+−=+=•
Definendo lo stato complessivo
52
)(~)(txtx
si ottiene
[ ] 0')(0)(
)(0)(~
)(0)(~
)(
==
+
+−+
=
•
•
DcheipotesinelltxCty
trB
txtx
LCABFBFA
tx
tx 8.4)
Gli autovalori del controllore basato sul modello saranno dati da
)()()](det[)](det[)det( λλλλλ d eosservatord
controlloCL PPLCAIBFAIAI ×=+−×+−=−
Quest’ultimo risultato, noto come teorema di separazione tra stima e controllo, mostra
come si possa eseguire separatamente il progetto del controllore e dell’osservatore.
Se calcoliamo la funzione di trasferimento complessiva, a causa degli zeri del sistema
8.4) si ottiene
BBFAsICBFAsI
BBFAsIACAsIAsI
BAsIBFAsIACsH gg
contoss
ossgg
×+−×=
=+−
×+−×=
−×−×−×+−×
=
−1)]([
)](det[)]([
)det()det()det()]([
)(
Per cui ai fini del comportamento ingresso-uscita figurano solo gli autovalori del
controllore.