A deterministic interpretation of the Kalman...

Laboratorio di Navigazione

Laurea Specialistica in Ingegneria Informatica, Ingegneria per l’Ambiente e il Territorio

Politecnico di Milano – Campus Como

NNAAVVIIGGAAZZIIOONNEE IINNEERRZZIIAALLEE

1

Sistemi di riferimento Un sistema di riferimento è un insieme di regole e misure che ci permettono di rispondere ai quesiti: “dove si trova un punto?”, “quando è avvenuto un evento?”. Esigenze storiche e strumentali, nonché differenti applicazioni, hanno portato alla definizione di differenti sistemi di riferimento per geo-referenziare punti e per tempo-referenziare eventi. Dato un sistema di riferimento si può definire un sistema di coordinate che fa corrispondere biunivocamente punti dello spazio con una terna (x1, x2, x3) di numeri reali (per esempio coordinate cartesiane). Un sistema inerziale è un sistema di riferimento in cui ogni punto materiale, non soggetto a forze esterne, resta in quiete o si muove di moto rettilineo uniforme, come postulato dalla I legge della dinamica. Le stelle, prese come punti materiali date le loro dimensioni rispetto alle grandi distanze relative, possono essere considerate punti isolati (trascurabile interazione gravitazionale) e possono essere utilizzate per definire un sistema di riferimento per cui la I legge della dinamica è soddisfatta su scale temporali dell’ordine di qualche anno. Per fenomeni spaziali inferiori a 1000 km e temporali inferiori al giorno, un sistema eliocentrico può essere considerato realisticamente inerziale. Tuttavia qualunque sistema di coordinate associato a questo sistema di riferimento sarebbe scomodo per descrivere la navigazione di un veicolo sulla (o intorno) alla terra. Un sistema traslato nel centro della terra è sicuramente più comodo, ma non può più essere considerato inerziale per via del moto di rivoluzione della terra intorno al sole (che implica un’accelerazione del sistema terra). Tuttavia, per un punto prossimo alla superficie della terra la sua dinamica risente della presenza del sole solo per la diversa attrazione che il sole esercita sul baricentro terrestre rispetto al punto considerato. Tale differenza, detta marea, è piccola e può essere trascurata o modellizzata nel caso di lunghi periodi di osservazione. Idem per l’effetto della luna. Un sistema pseudo-inerziale è un sistema di riferimento con origine nel baricentro terrestre e con assi paralleli ad un sistema inerziale (definiti tramite osservazioni astronomiche). In tale sistema vale la legge di Newton con la convenzione che l’accelerazione di gravità includa anche i termini mareali dovuti all’attrazione luni-solare. Sistema pseudo-inerziale (i): - origine nel baricentro terrestre; - asse x3: asse istantaneo di rotazione; - asse x1: all’incrocio tra l’eclittica e il piano equatoriale; - asse x2: per completare terna destrorsa.

Eclittica: percorso apparente del sole visto dalla Terra

2

Un sistema pseudo-inerziale può risultare comodo per descrivere le orbite dei satelliti intorno alla terra, ma non è conveniente per descrivere il moto di un veicolo sulla terra, che compie un moto di rotazione attorno al proprio asse. A tal fine risulta utile definire un sistema solidale con la terra, anche detto earth-fixed Sistema earth-fixed (e): - origine nel baricentro terrestre; - asse x3: diretto verso un polo nord convenzionale; - asse x1: all’incrocio tra il piano meridiano di Greenwich e il piano equatoriale terrestre; - asse x2: per completare terna destrorsa.

x3

x2 x1

Sistema earth-fixed

Si noti che l’asse di rotazione terrestre varia nel tempo e quindi in generale l’asse x3 del sistema inerziale non coincide con quello del sistema earth-fixed. Inoltre la velocità angolare della terra subisce piccolissime variazioni e la Terra stessa subisce deformazioni di tipo geologico e legate alle forze mareali. Tuttavia per gli scopi della navigazione, a meno di correzioni calcolabili, il corpo della Terra può essere considerato rigido e in moto di rotazione uniforme attorno ad un asse fisso, con periodo di 24 ore. Tutte le correzioni necessarie sono fornite dal IERS (International Earth Rotation and Reference Systems Service). Alcuni sistemi earth-fixed sono il WGS84 e ITRF 2000. All’interno del sistema earth-fixed possono essere usate le tradizionali coordinate cartesiane o le coordinate geodetiche più comode per il posizionamento dei punti sulla superficie, ovvero (ϕ, λ, h) cioè latitudine, longitudine e altezza ellisoidica rispetto ad un ellissoide geocentrico. Possiamo allora definire un ulteriore sistema, adatto a descrivere il moto di un veicolo sulla superficie; questo sistema è chiamato sistema di riferimento navigazionale o di livello-locale ed è definito come segue. Sistema navigazionale (n) o di livello-locale: - origine in un generico punto P (non necessariamente sull’ellissoide); - asse x1: diretto in direzione est; - asse x2: diretto in direzione nord; - asse x3: diretto come la normale rispetto all’ellissoide di riferimento, verso l’alto.

3

x3 x2

x1

Sistema navigazionale

Mentre il sistema navigazionale è adatto a descrivere il moto del veicolo, gli strumenti sono tipicamente vincolati al veicolo stesso e richiedono l’introduzione di un ulteriore sistema: Sistema veicolo o body (b): - origine in un generico punto P; - asse x1: diretto nella direzione di marcia; - asse x3: perpendicolare al piano del veicolo (verso l’alto); - asse x2: per completare terna destrorsa. Il sistema (n) e il sistema (b) condividono l’origine del punto P, ma in genere il loro orientamento è diverso. Si definisce imbardata (yaw) la rotazione rispetto all’asse x3, beccheggio (pitch) la rotazione rispetto all’asse x2 e rollio (roll) la rotazione rispetto all’asse x1. Si noti che vi sono alcuni strumenti che attraverso giunti cardanici e servo-motori si mantengono costantemente orientati secondo il sistema (n). Più comuni (e meno costosi) sono invece i sistemi strapdown, che seguono l’orientamento del veicolo.

x3 yaw

roll

x1 x2 pitch

Sistema veicolo e rotazioni ad esso associate

4

Strumenti inerziali Un sistema inerziale di navigazione (INS) è un insieme formato da una piattaforma su cui sono rigidamente montati di norma 6 sensori, tre che rilevano le accelerazioni impresse alla piattaforma stessa (accelerometri) e tre che misurano la velocità angolare rispetto ad un sistema inerziale (giroscopi). E’ parte dello strumento anche l’hardware che raccoglie i dati e il software che li processa in tempo reale. I singoli componenti di un INS sono detti IMU (Inertial Measurement Unit), termine che viene anche utilizzato come sinonimo di INS. Il sistema di riferimento proprio dell’INS, considerato come corpo rigido, è materializzato da una terna di assi ortogonali che coincidono con gli assi di misura degli accelerometri. I giroscopi a loro volta sono montati in modo che i loro assi di misura siano paralleli agli assi degli accelerometri. Vi sono due possibili configurazioni di INS. In un caso, quello più costoso dal punto di vista economico, la piattaforma è montata su sospensioni cardaniche che ne vincolano i movimenti e che attraverso servo-motori mantengono il sistema di riferimento dell’INS orientato come il sistema di livello locale (n) (o almeno lo mantengono parallelo al piano orizzontale). Altri strumenti, detti di tipo strapdown, mantengono la piattaforma rigidamente vincolata al mezzo mobile, così che il sistema di riferimento interno all’INS coincida con il sistema body (b).

Scheme of inertial navigation system Accelerometri Il principio base degli accelerometri è di misurare la forza agente su una massa di prova (proof mass). Si distinguono principalmente due tipi di sensori, di tipo open-loop o closed-loop. Nel primo caso gli accelerometri misurano direttamente lo spostamento della massa di prova dovuto alle forze esterne agenti sul sensore. I sensori closed-loop invece mantengono la massa di prova in uno stato di equilibrio generando una forza opposta alla forza applicata. Questo è ottenuto attraverso un sistema di controllo retroazionato (feedback system) di tipo elettrico o magnetico. Il principale vantaggio dell’architettura closed-loop è la miglior linearità della misura rispetto alle forze applicate. Nella sua configurazione più elementare un accelerometro è costituito da uno chassis che vincola la massa di prova a muoversi solo lungo un asse determinato e da una molla che lega la massa di prova allo chassis stesso. La dinamica di un tale sistema è descritta dalle seguente equazione differenziale lineare:

Fkkm ev =−+ ll&l&& dove m è la massa di prova, l è l’allungamento della molla, kv la costante di viscosità, ke la costante elastica della molla, F la forza applicata al sensore. La soluzione omogenea (cioè quella in cui non

5

viene applicata alcuna forza) è un oscillatore armonico, smorzato nel caso di attrito. Con F=costante, dopo che le oscillazioni iniziali si sono esaurite, vale la legge

Fke =− l ovvero misurando l’allungamento della molla e conoscendo la costante elastica è possibile misurare la forza applicata; poiché dalla legge di Newton si ha

amF = conoscendo la massa di prova, si può ricavare l’accelerazione a lungo l’asse della molla.

F

m

Open-loop accelerom

Un sistema di tipo closed-loop più vicino alla realtà èmassa di prova m è vincolato ad essere oscillante attoSe la massa di prova m subisce una certa acceleraziooscillare, ma la variazione di posizione è percepita ddi reazione comanda una bobina che esercita una fomassa di prova m in quiete (vedi figura). La forza(legata alla corrente I che circola nella bobina) ed è p

A

m

Close-loop accelerom

l

eter principle

l’accelerometro a pendolo, in cui il moto della rno ad un perno P, con un unico grado di libertà. ne, il pendolo lasciato libero comincerebbe ad

a un sensore ottico S, che attraverso un circuito rza F su un magnete A in grado di riportare la indotta dalla bobina è facilmente calcolabile roporzionale alla forza che si vuole misurare.

feedback system

eter principle

6

Accelerometri ad uso scientifico con accuratezze estremamente più elevate sono installati per esempio a bordo di satelliti geodetici per la misura del campo gravitazionale. Si tratta tipicamente di accelerometri elettrostatici, in cui la massa di prova (di platino) è posta all’interno di un dielettrico circondato da elettrodi. Ogni movimento della massa di prova produce una variazione di capacità misurata agli estremi degli elettrodi. Questa differenza viene rilevata, amplificata e poi utilizzata in un sistema retroazionato per riportare la massa di prova nella sua posizione iniziale. La tensione applicata agli elettrodi rappresenta l’output dell’accelerometro (vedi figura).

Accelerometro elettrostatico per missioni geodetiche da satellite

L’errore di un accelerometro può essere descritto come segue:

νλδ +−++= )( 0TTcaba T dove b è un bias, λ un fattore di scala, cT una costante termica dipendente dalla temperatura T e v il noise di misura. Valori tipici per uno strumento commerciale possono essere

mGalb 25= 5105 −=λ

CmGalcT °= /5.0 HzmGalv /40=σ (ovvero circa 0.6 Gal per osservazione, con una frequenza di campionamento

dell’ordine di 200 Hz) Giroscopi Il giroscopio è uno strumento in grado di misurare la velocità angolare della rotazione impressa al sensore rispetto ad un sistema di riferimento inerziale. Storicamente i giroscopi erano strumenti di tipo meccanico, costituiti essenzialmente da un corpo rigido con simmetria circolare (rotore) in grado di ruotare intorno al suo asse principale (asse di spin). Tuttavia questi sensori meccanici sono stati utilizzati negli anni sempre meno, a vantaggio dei sensori ottici, che presentano precisioni elevate, grande semplicità di funzionamento e costi relativamente bassi in quanto non necessitano di parti meccaniche di alta precisione. Inoltre offrono la possibilità di essere miniaturizzati. Gli strumenti ottici funzionano esclusivamente in modo strapdown, a differenza di quelli meccanici che sono adatti anche a piattaforme stabilizzate.

7

Tra i giroscopi ottici è degno di nota il giroscopio a fibra ottica (FOG, Fiber Optic Gyroscope) che funziona sulla base di un effetto relativistico noto, sin dal 1913, come effetto Sagnac dal nome del suo scopritore. Si consideri una spira circolare di fibra ottica in rotazione uniforme nel suo piano, con velocità angolare ω rispetto ad un sistema inerziale; lungo la fibra, nella stessa direzione della rotazione, si propaga un segnale luminoso che viene emesso da un sorgente E al tempo t0 e raccolto dallo stesso sensore E al tempo t0+∆t. Quindi un osservatore solidale con la fibra vede la luce compiere esattamente un giro ϑ’ = 2π (l’apice indica una grandezza vista dall’osservatore solidale con la fibra), mentre un osservatore inerziale giudica che il fronte luminoso abbia girato per un angolo ϑ = 2π+∆ϑ (vedi figura).

Effetto Sagnac

Tenendo conto che un osservatore inerziale vede muoversi il raggio luminoso a velocità c, indipendentemente dalla velocità della sorgente, la differenza angolare risulta

πωϑ∆ 2⋅=cR

dove R è il raggio della spira e ωR è la velocità della sorgente. Tale angolo corrisponde ad un percorso ottico di

cA

cRRL ωπωϑ∆∆ 22

2

=⋅==

dove A è l’area abbracciata dalla spira. Se ora, a partire dalla sorgente E al tempo iniziale t0 emettiamo anche un raggio luminoso simmetrico che percorra la spira in senso inverso, è facile capire che un osservatore inerziale vede il raggio tornare alla sorgente dopo un angolo di ϑ =2π-∆ϑ. Se inoltre supponiamo che i due raggi di luce abbiano la stessa frequenza e siano emessi in fase, ricombinati alla ricezione e facendoli interferire tra loro è possibile eseguire la misura dello sfasamento, cioè

cALL

λω

λ∆∆

ϕ∆ 4=

−= −+

dove ∆L+ e ∆L- sono i due cammini ottici nei due sensi opposti. La misura dello sfasamento permette di ricavare una misura di ω, ovvero una misura della velocità angolare. Poiché 4A/λc costituisce la sensibilità dello strumento, allo scopo di migliorarne il rendimento, la fibra ottica viene avvolta in una bobina che contiene N spire, fino ad una lunghezza di oltre 1 km.

8

Analogamente ad un accelerometro, l’errore di un giroscopio può essere descritto come segue:

νλωδω +−++= )( 0TTcb T dove b è un bias, λ un fattore di scala, cT una costante termica dipendente dalla temperatura T e v il noise di misura. Valori tipici per uno strumento commerciale possono essere

orab /10 3 °= − 6102 −=λ

CoracT °°= − /105 5 Hzsradv /106 7−=σ (ovvero circa 10-5 rad/s per osservazione, con una frequenza di

campionamento dell’ordine di 200 Hz) Rotazioni e velocità angolari Richiamiamo brevemente i concetti della rotazione di un sistema di riferimento. Dette (x1,x2) le coordinate cartesiane di un vettore nel sistema di riferimento A, (x1’,x2’) le coordinate dello stesso vettore in un sistema B ruotato di un angolo α rispetto ad A, vale la seguente relazione

x2’x1’

x2

x1

+−=++=

αααα

cossin'sincos'

212

211

xxxxxx

o in forma vettoriale

xUx BA='

con

−

=αααα

cossinsincosB

AU

Notiamo che se lo stesso risultato può essere ottenuto mantenendo fisso il sistema di riferimento e ruotando il vettore di un angolo -α, ovvero ( )+= B

ABA UR .

Nel caso tri-dimensionale una qualunque rotazione può essere ottenuta combinando tre singole rotazioni rispetto agli assi cartesiani, ovvero

−=

11

111

cossin0sincos0

001

ααααU , U , U

−=

22

22

2

cos0sin010

sin0cos

αα

αα

−=

1000cossin0sincos

33

33

3 αααα

)()()( 312213 ααα UUUU B

A = =

=

−+−−−+

12122

123131231323

123131231323

coscossincossincossinsinsincossinsinsincoscoscossincossincossinsinsinsincoscossincoscos

ααααααααααααααααααααααααααααα

9

Per derivare il legame tra matrice di rotazione e velocità angolari (da utilizzare poi per le misure dei giroscopi) consideriamo degli angoli infinitesimi dα1 , dα2 , dα3 , cosicché 1cos ≈αd ,

αα dd ≈sin . Le tre matrici di rotazione diventano

−=

1010

001

1

11

αα

dddU , ,

−=

10010

01

2

2

2

α

α

d

ddU

−=

1000101

3

3

3 αα

dd

dU

e la rotazione congiunta, trascurando i termini di secondo ordine, si può scrivere come

dAIddUddUddUdU BA −== )()()( 312213 ααα

−−

−=

00

0

12

13

23

αααααα

dddd

dddA

Sfruttando questa matrice, la rotazione compiuta in un tempo t0 viene definita come

BA

BA UtU =)( 0

mentre la rotazione in un tempo t0+dt, con dt infinitesimo, può essere vista come la combinazione di due rotazioni successive, ovvero

BA

BA

BA

BA UdAItUdtUdttU )()()()( 00 −==+

Calcolando ora la derivata nel tempo, si ottiene

BA

BA

BAdt

BA

BA

dt

BA

BA

dt

BA UU

dtdA

dtUUdAI

dttUdttU

U Ω−=−=−−

=−+

=→→→ 00

00

0lim)(lim

)()(lim&

dove la matrice delle velocità angolari Ω è definita come

BAdtdt

dtd

dtd

dtd

dtd

dtd

dtd

dtdA Ω

ωωωωωω

αα

αα

αα

=

−−

−=

−

−

−

=→→

00

0

0

0

0

limlim

12

13

23

12

13

23

00

Questa espressione può essere ulteriormente elaborata. Per le proprietà delle rotazioni, si ha

IUU AB

BA =

ovvero due rotazioni opposte si annullano. Derivando questa relazione si ottiene

10

0=+ AB

BA

AB

BA UUUU &&

Ora moltiplicando entrambi i lati dell’equazione differenziale U per la matrice U , con qualche passaggio algebrico si ottiene

BA

BA

BA UΩ−=& A

B

AB

BA

BA

AB

BA UUUU Ω−=&

BA

AB

BA UU Ω−=&

BA

AB

BA UU Ω−=− &

BA

AB

AB

BA

AB UUUU Ω−=− &

BA

AB

AB UU Ω=&

Equazioni di navigazione Le equazioni di navigazione mettono in relazione le incognite del problema (ovvero posizione, velocità e assetto del veicolo istante per istante) con le osservazioni disponibili dagli accelerometri e dai giroscopi (ed eventualmente dal GPS). A seconda del sistema di riferimento scelto le equazioni possono essere più o meno complicate dal punto di vista analitico. Considereremo il caso di un sistema inerziale (adatto a descrivere la navigazione nello spazio, per esempio le orbite di un satellite artificiale) e di un sistema earth-fixed (più adatto a descrivere la navigazione terrestre, richiedendo poi un ulteriore passaggio al sistema di livello locale). Navigazione in un sistema inerziale In un sistema inerziale la seconda legge di Newton della dinamica può essere scritta come

iitot xmF &&=

dove Ftot rappresenta la forza complessiva applicata al corpo di massa m lungo i tre assi del sistema di riferimento e x&& è l’accelerazione dovuta a tale forza. Se il corpo è soggetto ad un campo gravitazionale, la precedente equazione può essere esplicitata come

iii gmFxm +=&& dove g è l’accelerazione gravitazionale. Dividendo l’equazione per m, si ottiene la relazione fondamentale

iii gfx +=&& dove f è la forza specifica (non gravitazionale), cioè la forza per unità di massa, applicata alla massa m. Poiché lo stato del veicolo in movimento è solitamente descritto in termini di posizione e velocità (ed eventualmente assetto), la precedente equazione differenziale (in tre dimensioni) è separata in un sistema di due equazioni differenziali (sempre in tre dimensioni), ovvero

11

+=

=

iii

ii

gfdtxd

xdtxd

&

&

Come è immediato vedere la determinazione di posizione e velocità richiede la conoscenza (o la modellizzazione) del campo gravitazionale terrestre. Nel caso più comune di sistemi strapdown, gli accelerometri misurano la forza specifica f

b nel sistema body. Per poter utilizzare la precedente relazione è necessario applicare la seguente rotazione

bib

i fUf = dove U è la matrice di rotazione dal sistema body al sistema inerziale. Questa matrice cambia con il tempo e può essere derivata dalle misure dei giroscopi, integrando numericamente l’equazione differenziale

ib

ib

ib

ib UU Ω−=&

Si noti come nel caso di una rotazione rispetto ad un singolo asse, per esempio

−=

1000cossin0sincos

αααα

BAU

−=

0000000

ωω

Ω BA

l’equazione differenziale precedente diventa

−

−−=

−−

−

1000cossin0sincos

0000000

000

0sincos

0cossin

αααα

ωω

αααα

αααα

dtd

dtd

dtd

dtd

−−

−=

−−

−

1000sincos0cossin

000

0sincos

0cossin

αωαωαωαω

αααα

αααα

dtd

dtd

dtd

dtd

da cui segue

12

ωα=

dtd 0

0

)()( αττωα += ∫ dtt

t

che richiede la conoscenza dell’assetto iniziale. Navigazione in un sistema earth-fixed L’equazione della navigazione in un sistema earth-fixed può essere ottenuto sulla base del teorema di Coriolis, che descrive velocità e accelerazione di un punto, visto in due sistemi di riferimento qualsiasi in moto (rigido) uno rispetto all’altro. Un qualunque vettore di posizione può essere visto o nel sistema inerziale o nel sistema earth fixed, semplicemente applicando la rotazione istantanea (e l’eventuale traslazione dell’origine) tra i due sistemi, ovvero

)()()()( 0 txtUtxtx eie

ii += Per semplificare la notazione si omette di scrivere la dipendenza dal tempo, che riguarda comunque tutti i vettori e le matrici coinvolte nell’equazioni seguenti. Applichiamo una prima differenziazione nel tempo, ottenendo

)(00ee

iei

eiei

eei

eii xxUxxUxUxx Ω++=++= &&&&&&

e successivamente una seconda differenziazione nel tempo, cioè

)2(0

0

eei

eei

ei

eei

eie

i

eei

ie

eei

ie

eei

ie

eie

eie

ii

xxxxUx

xUxUxUxUxUxx

ΩΩΩΩ

ΩΩΩ&&&&&&

&&&&&&&&&&&

++++=

=+++++=

Moltiplicando entrambi i termini dell’equazione per U e ricordando che e

i

IUU i

eei =

si ottiene la dinamica del punto rispetto ad un sistema di riferimento rotante

)2()( 0ee

iee

iei

eei

iiei

e xxxxxUx ΩΩΩΩ &&&&&&&& ++−−= Analizziamo i diversi termini (con particolare attenzione alle accelerazioni apparenti sperimentate dall’oggetto in movimento nel sistema earth-fixed) - ex&& =accelerazione del punto vista nel sistema earth-fixed - ix&& =accelerazione del punto vista nel sistema inerziale - ix 0&& = accelerazione dell’origine del sistema di riferimento inerziale. Poiché il sistema inerziale e

il sistema earth-fixed hanno la stessa origine (centro della Terra) questo termine risulta pari a 0 (la trasformazione tra i due sistemi di riferimento è solo una rotazione e non c’è traslazione).

- = rotazione istantanea dal sistema di riferimento inerziale e quello earth-fixed. La rotazione avviene intorno all’asse x

eiU

3, coincidente fra i due sistemi di riferimento.

13

- = matrice delle velocità angolari tra i due sistemi di riferimento in rotazione fra loro. Poiché la Terra ruota attorno all’asse x

eiΩ

3, supponendo il moto circolare uniforme, si ha 021 == ωω , costanteore2423 === πωω E .

- eeei xx && ∧−=− ωΩ 22 = accelerazione di Coriolis che appare quando un oggetto è in movimento

rispetto ad un sistema di riferimento in rotazione. A causa di questa accelerazione l’oggetto in movimento subisce una deflessione verso destra rispetto alla direzione della velocità nell’emisfero boreale e una deflessione verso sinistra nell’emisfero australe. Questa accelerazione è diretta perpendicolarmente al piano formato dalla velocità dell’oggetto e dall’asse di rotazione del sistema di riferimento. Si annulla quando la velocità è diretta come l’asse di rotazione. Svolge un ruolo fondamentale nella circolazione atmosferica.

- )( eeei

ei xx ∧∧−=− ωωΩΩ = accelerazione centrifuga dovuta alla rotazione del sistema earth

fixed rispetto al sistema inerziale. E’ diretta verso l’esterno, perpendicolarmente all’asse di rotazione della Terra.

- eei xΩ&− = accelerazione tangenziale dovuta alla variazione della velocità angolare del sistema

earth-fixed. Poiché la velocità della Terra è assunta costante, questo termine risulta pari a 0. Con le opportune semplificazioni, l’equazione della dinamica diventa

eei

ei

eei

iei

e xxxUx ΩΩΩ −−= &&&&& 2 Ricordando che l’accelerazione nel sistema inerziale, per la seconda legge di Newton, è dato da:

iii gfx +=&& si ha

eei

ei

eei

eeeei

ei

eei

iiei

e xxgfxxgfUx ΩΩΩΩΩΩ −−+=−−+= &&&& 22)( dove eg e ef rappresentano rispettivamente l’accelerazione gravitazionale e le forze specifiche non gravitazionali applicate all’oggetto espresse nel sistema earth-fixed. Tipicamente l’accelerazione gravitazionale e l’accelerazione centrifuga sono raggruppate insieme per formare il vettore accelerazione di gravità

eei

ei

ee xgg ΩΩ−= Si ottiene così l’espressione finale della dinamica in un sistema earth-fixed

eei

eee xgfx &&& Ω2−+= Tenendo conto che le forze specifiche f sono misurate nel sistema di riferimento interno del veicolo (sistema body), si ha

bib

ei

e fUUf =

14

dove U è la matrice di rotazione dal sistema body al sistema inerziale che può essere derivata dalle misure dei giroscopi, mentre U è la matrice di rotazione nota dal sistema inerziale al sistema earth-fixed, che dipende dall’istante di osservazione t, ovvero

ib

ei

−=

1000cossin0sincos

tttt

U EE

EEei ωω

ωω

assumendo che al tempo t=0 il sistema inerziale e il sistema earth-fixed siano allineati. Poiché lo stato del veicolo in movimento è solitamente descritto in termini di posizione, velocità ed assetto, le equazioni di navigazione del veicolo sono espresse tramite il seguente sistema di equazioni differenziali, ovvero

=

−+=

=

bi

ib

ib

eei

ebib

ei

e

ee

UU

xgfUUdtxd

xdtxd

Ω

Ω

&

&&

&

2

dove bf e sono grandezze osservate, b

iΩ eg , U e sono grandezze modellate (in funzione del

tempo di osservazione) ed infine

ei

eiΩ

ex , ex& e U sono le incognite del problema. ib

L’equazione differenziale che descrive la dinamica nel sistema earth-fixed può essere divisa in un sistema di tre equazioni differenziali, una per ogni componente; infatti, ricordando che

−=

0000000

E

Eei ω

ωΩ

si ha

−−

=0000000

2

2

E

Eei

ei ω

ωΩΩ

−+

=−0

22 1

2e

e

Eee

i xx

x &

&

& ωΩ (accelerazione di Coriolis)

15

=−0

2

12 e

e

Eee

iei x

xx ωΩΩ (accelerazione centripeta)

Inoltre, in prima approssimazione, il campo gravitazionale della Terra può essere assunto uguale al campo prodotto da una massa puntiforme posta al centro della Terra e avente massa uguale alla massa della Terra stessa. In questo modo, per la legge di gravitazione universale, si ha

2e

e

x

GMg =

e

e

e xx

GMg 3−=

dove G è la costante di gravitazione universale e M la massa della Terra. Espressa per componenti la precedente relazione diventa

[ ]

++−=

e

e

e

eee

e

xxx

xxxGMg

3

2

1

2/323

22

21 )()()(

Occorre sottolineare che questa approssimazione sferica del campo gravitazionale introduce errori non accettabili nella navigazione, per cui si preferisce utilizzare almeno un’approssimazione che tenga conto della forma prevalentemente ellissoidica del pianeta Terra. Esistono anche modelli globali e locali del campo gravitazionale terrestre che permettono di ridurre ulteriormente l’errore dovuto a questo termine, al costo di una maggior complessità computazionale. Sostituendo i singoli termini, l’equazioni della navigazione nel sistema earth-fixed componente per componente

[ ]

[ ]

[ ]

++−=

−+++

−=

++++

−=

===

e

eee

ee

eE

eE

e

eee

ee

eE

eE

e

eee

ee

ee

ee

ee

xxxx

GMfdtxd

xxxxxx

GMfdtxd

xxxxxx

GMfdtxd

xdtdxxdtdxxdtdx

32/323

22

21

33

122

22/323

22

21

22

212

12/323

22

21

11

33

22

11

)()()(

2)()()(

2)()()(

&

&&

&&

&

&

&

ωω

ωω

16

Un utile suddivisione dell’equazione differenziale U nelle diverse componenti richiede l’introduzione della matrice di Rodriguez e della notazione dei quaternioni, argomenti che non rientrano negli obiettivi di questo corso. Con questa ulteriore suddivisione il problema della determinazione dello stato del veicolo può essere separato in due problemi disgiunti:

bi

ib

ib U Ω=&

- prima si determina l’assetto del veicolo sulla base delle osservazioni dei giroscopi e indipendentemente dalla posizione e velocità del veicolo stesso;

- poi si risolve il sistema di equazioni differenziali con posizione e velocità incognite, supponendo noto l’assetto e ruotando le forze specifiche misurate dagli accelerometri nel sistema earth-fixed.

Analisi dell’errore Al fine di studiare le performance dei sistemi inerziali, consideriamo uno scenario molto semplificato, assumendo che la Terra sia sferica e non rotante (utilizzeremo quindi un sistema di riferimento inerziale) con un campo gravitazionale dipendente solo dalla distanza dal centro della Terra. Supponiamo inoltre che l’asse x3 passi per il centro dell’area di interesse, cioè che il veicolo si muova nell’intorno del polo nord (diametro massimo di qualche chilometro). Con queste ipotesi, si può assumere in prima approssimazione che le coordinate cartesiane x1 e x2 descrivano il moto “orizzontale”, mentre la coordinata x3 il moto verticale. Il moto della dinamica in un sistema così approssimato possono essere descritte come

i

i

iiii xx

GMfgfx 3−=+=&&

Ora le forze non gravitazionali sono osservate dagli accelerometri a bordo del veicolo con un certo errore di misura, ovvero

iii ff ν+=0

ovvero possiamo scrivere

iii

i

i fxx

GMx ν−+−=03

&&

Linearizziamo l’equazione ottenuta al fine di studiare la propagazione del noise

iiiii

i

i fxxJxx

GMx ν−+−+−=03 )~(~

~&&

dove

17

∂∂

∂∂

∂∂

∂∂

∂∂

∂∂

∂∂

∂∂

∂∂

=

33

33

3

23

3

1

32

33

2

23

2

1

31

33

1

23

1

1

i

i

ii

i

ii

i

i

i

i

ii

i

ii

i

i

i

i

ii

i

ii

i

i

x

xxx

xxx

xx

x

xxx

xxx

xx

x

xxx

xxx

xx

GMJ (matrice jacobiana)

Nel calcolo delle derivate parziali si distinguono due casi

[ ]

[ ] [ ][ ]

[ ] [ ] [ ] ( )[ ]

[ ]( )

++−

++=

=

++

−++++

++=

=++

++−++=

=++∂

∂=

∂∂

23

22

21

2

2/323

22

21

2/323

22

21

223

22

212/12

32

22

12/323

22

21

323

22

21

2/123

22

21

2/323

22

21

2/323

22

21

3

)()()(3

1)()()(

1

)()()(

3)()()()()()(

)()()(1

)()()(

2)()()(23)()()(

)()()(

iii

ik

iii

iii

ik

iiiiii

iii

iii

ik

iiiik

iii

iii

ik

ik

i

ik

ik

xxxx

xxx

xxx

xxxxxxx

xxx

xxx

xxxxxxxx

xxx

xxx

xx

[ ]

[ ][ ]

[ ]

++

−++

=

=++

++−=

=++∂

∂=

∂∂

23

22

21

2/323

22

21

323

22

21

2/123

22

21

2/323

22

21

3

)()()(3

)()()(1

)()()(

2)()()(23

)()()(

iii

ih

ik

iii

iii

ih

iiiik

iii

ik

ih

i

ik

ih

xxxxx

xxx

xxx

xxxxx

xxx

xxx

xx

con k ≠ h

In altri termini la matrice jacobiana può essere scritta come

[ ] )3()~()~()~( 2/32

32

22

1

PIxxx

GMJiii

−++

−=

dove il proiettore radiale P è definito come

( )( )

( )( )

22

33231

322

221

31212

1

23

22

21 ~

~~

~~~~~~~~~~~~~~~

)~()~()~(1

i

ii

iiiii

iiiii

iiiii

iiix

xx

xxxxxxxxxxxxxxx

xxxP

+

=

++=

18

L’equazione della dinamica può essere spezzata in due parti

iii xxx &&&&&& δ+= ~ , una che descrive la traiettoria di riferimento dovuta all’applicazione delle forze specifiche osservate

ii

i

ifx

x

GMx03

~~

~ +−=&&

e un’altra che invece descrive l’effetto del noise

[ ]ii

iii

i xPIxxx

GMx νδδ −−++

−= )3()~()~()~( 2/32

32

22

1

&&

dove

iii xxx ~−=δ Nel caso particolare dello schema considerato, ricordando il raggio medio terrestre R=6378 km, valgono le seguenti approssimazioni

31 10~~

−

Rx , 32 10~

~−

Rx , Rx ~~

3

cosicché, a meno di errori dell’ordine di 10-3, è possibile considerare le seguenti approssimazioni

223

22

21 )~()~()~( Rxxx iii ≅++

( )( )

≅

≅100000000

~~~~~~~~~~

1

221

22

221

1212

1

2

RRxRxRxxxxRxxxx

RP

ii

iiii

iiii

ottenendo il seguente sistema di equazioni differenziali per la dinamica dovuta al noise

−=−−=−−=

iis

i

iis

i

iis

i

xxxxxx

332

1

222

2

112

1

2 νδωδνδωδνδωδ

&&

&&

&&

dove

sradR

GMs /1024.1 3

3−≅=ω

è detta frequenza di Schuler e corrisponde ad un periodo di T=84.46 minuti.

19

Se ora supponiamo di applicare un noise di misura solo in un certo istante, possiamo studiare come evolve la dinamica del sistema in seguito a questo ingresso impulsivo considerando il sistema di equazioni omogeneo associato. In altri termini, se il sistema è asintoticamente stabile, l’effetto del noise impulsivo deve esaurirsi dopo un certo transitorio. In alternativa si possono verificare comportamenti oscillanti o divergenti. Il sistema omogeneo associato può essere scritto come

=−=+=+

0200

32

1

22

2

12

1

is

i

is

i

is

i

xxxxxx

δωδδωδδωδ

&&

&&

&&

Esistono ovviamente le soluzioni triviali ( 01 =x , 02 =x , 03 =x ) che corrispondono a non applicare al sistema alcun segnale impulsivo del noise e quindi a lasciare il veicolo fermo; queste soluzioni ovviamente non sono di nostro interesse. La prima considerazione che si può dedurre è che le componenti cartesiane hanno una dinamica disaccoppiata; nel caso di modelli più complessi questo è verificato solo in parte, nel senso che le due componenti “orizzontali” (x1,x2) si legano tra di loro (si pensi per esempio all’accelerazione di Coriolis nel caso in cui si modellizzi anche la rotazione della Terra). La seconda considerazione è che le componenti “orizzontali” (x1,x2) hanno una dinamica completamente diversa dalla componente “verticale” (x3). La soluzione delle prime due equazioni differenziali è infatti un oscillatore armonico con frequenza pari alla frequenza di Schuler, cioè

)sin()( 0 txtx sik ωδδ = k=1,2

dove 0xδ è l’ampiezza massima dell’oscillazione. Questo significa che l’effetto del noise non tende ad esaurirsi (il sistema non è asintoticamente stabile), ma è limitato e quindi controllabile nel tempo. Lo stesso non accade nel caso della terza equazione differenziale che descrive il moto “verticale”, la cui soluzione è un oscillatore armonico inverso

( )txtx si ωδδ 2exp)( 03 =

dove 0xδ è lo spostamento verticale iniziale a t=0 legato all’impulso iniziale. Dopo un intervallo di tempo di dieci minuti, l’errore è già tre volte più grande dell’errore iniziale. E’ per questo motivo che i sistemi inerziali “stand-alone” possono essere utilizzati per la navigazione “orizzontale”, ma non per quella in “verticale”, dove richiedono il supporto di altre tecniche come per esempio il GPS. Vedi programma MATLAB su simulazione degli errori. Bibliografia B. Hofmann-Wellenhof, K. Legat, M Wieser (2003). “Navigation. Principles of positioning and guidance”. Springer-Verlag. F. Sansò (2006). “Navigazione geodetica e rilevamento cinematico”. Polipress L. Biagi (2003). Appunti del corso di Misure Geodetiche. http://geomatica.como.polimi.it/corsi/misure_geodetiche/

20

A deterministic interpretation of the Kalman...

Documents

Transcript of A deterministic interpretation of the Kalman...