Università degli Studi di Bologna
FACOLTÀ DI INGEGNERIA
Corso di Laurea Specialistica in Ingegneria delle Telecomunicazioni Propagazione LS-B
ANALISI DI ALGORITMI ADATTATIVI DI BEAMFORMING APPLICABILI ALLA
RADIOASTRONOMIA E STUDIO DELL’IMPLEMENTAZIONE DELLA KLT (KARHUNEN-LOÈVE TRANSFORM) PER
SCHIERE DI ANTENNE
Tesi di Laurea di: Relatore: GIOVANNI NALDI Chiar.mo Prof. Ing. GABRIELE FALCIASECCA Correlatori:
Dott. Ing. MICHELE BOSCHI Dott. Ing. STELIO MONTEBUGNOLI
Anno Accademico 2005-2006
PAROLE CHIAVE
Radio astronomia
Beamforming
Array di antenne
MVDR (Minimum Variance Distortionless Response)
KLT (Karhunen-Loève Transform)
259
RINGRAZIAMENTI
Eccomi giunto alla fine di questo lungo e faticoso percorso che ha portato al
completamento della mia, speriamo interessante, tesi di laurea.
Eh sì, sembra difficile da credere, ci ho lavorato per ben 10 mesi!!
Non mi resta quindi che ringraziare le persone che mi hanno aiutato e sostenuto in
questo periodo. Il primo grazie mi sembra doveroso esprimerlo alla mia famiglia
che forse troppo spesso mi dimentico di ringraziare, ma che mi è stata vicina in
tutti questi anni di studio credendo sempre nelle mie capacità. Adesso basta
altrimenti poi mi commuovo.
Un ringraziamento particolare spetta al direttore del radiotelescopio di Medicina,
Stelio Montebugnoli, che mi ha concesso l’opportunità di svolgere una tesi così
stimolante ed appassionante, seppur non priva di difficoltà.
Ringrazio il prof. G. Falciasecca dell’Università di Bologna per aver accettato la
proposta di diventare relatore per questa tesi.
Grazie anche al mio tutor Michele che mi ha seguito durante la realizzazione della
tesi fornendomi costantemente utili suggerimenti ed osservazioni: scusa Michele
se ti ho fatto tribolare per la correzione degli ultimi capitoli, specie la sera prima
della consegna!
Ringrazio anche tutto lo staff di Medicina per aver creato sempre un clima sereno
e amichevole: in particolare Federico, Germano, Marco e Luca.
Un sentito grazie a Salvo per la sua disponibilità e gentilezza, per aver dedicato
tempo alle preziose discussioni sulla KLT; senza il tuo supporto non so come
avrei potuto concludere la tesi.
Desidero ringraziare tutti i miei compagni di laboratorio: un grazie speciale a
Ilaria con la quale ho condiviso tanti bei momenti, grazie per avermi fatto sentire
meno il peso della fatica per lo studio.
Ringraziamenti
260
Grazie a Luca “Caparezza” e ad Alice, in bocca al lupo per la vostra laurea, se
sarò ancora disoccupato vi verrò a vedere!!
Grazie anche ai miei compagni di università: grazie Giova per il portatile, con cui
ho potuto scrivere la tesi quando mio padre doveva lavorare al computer; grazie
Francesco, grazie Moro per il vostro sempre vivo interessamento e supporto
morale.
Ringrazio anche Luca e Guido, che, grazie alla loro esperienza acquisita (hanno
svolto la tesi a Medicina prima di me), mi hanno saputo dare tanti validi consigli.
Un saluto anche a tutti i miei amici! Non li posso citare tutti, sarebbe troppo lungo
ed è ora che vada a letto!
Bè, spero di non essermi scordato di qualcuno, se così fosse chiedo vivamente
perdono.
INDICE INTRODUZIONE ................................................................................................. I
CAPITOLO 1
LA STAZIONE RADIOASTRONOMICA DI MEDICINA ........................... 1
1.1 Introduzione .................................................................................................... 1
1.2 I parametri fondamentali di un radiotelescopio: accenni ................................ 2
1.3 La parabola VLBI ........................................................................................... 4
1.4 Il radiotelescopio “Croce del Nord” .............................................................. 6
1.5 Principi di funzionamento della “Croce del Nord” ...................................... 10
1.6 Il progetto LOFAR (LOw Frequency ARray) ............................................... 16
1.6.1 Introduzione .......................................................................................... 16
1.6.2 Configurazione del sistema LOFAR..................................................... 20
1.6.3 Applicazioni.......................................................................................... 23
1.6.4 Possibile realizzazione del sistema LOFAR
al radiotelescopio “Croce del Nord” di Medicina ............................... 25
1.7 Il progetto SKA (Square Kilometer Array) .................................................. 28
1.7.1 La “Croce del Nord” e SKA ................................................................ 32
1.8 La tesi ............................................................................................................ 40
CAPITOLO 2
METODI DI BEAMFORMING ....................................................................... 43
2.1 Generalità ...................................................................................................... 43
2.2 Beamforming come filtraggio spaziale.......................................................... 46
2.3 Operatori statistici del secondo ordine: richiami ........................................... 54
2.4 Classificazione dei beamformers .................................................................. 57
Indice
2.5 Beamforming data-independent .................................................................... 58
2.5.1 Beamforming classico........................................................................... 58
2.5.2 Beamforming data-independent generalizzato ..................................... 60
2.5.3 Analogie e differenze tra i metodi
classico e generalizzato ........................................................................ 61
2.6 Beamforming ad ottimo statistico ................................................................. 62
2.6.1 Multiple Sidelobe Canceller (MSC) ..................................................... 63
2.6.2 Utilizzo di un segnale di riferimento (REF SIGNAL)
e massimizzazione del rapporto segnale/rumore (MAX SNR)............ 64
2.6.3 Linearly Constrained Minimum Variance (LCMV)
beamforming ........................................................................................ 65
2.6.4 Generalised Sidelobe Canceller (GSC)................................................. 68
2.6.5 La cancellazione del segnale desiderato nel
beamforming ad ottimo statistico......................................................... 71
2.7 Algoritmi adattativi per il beamforming ....................................................... 71
2.8 Algoritmi di beamforming parzialmente adattativi ...................................... 75
2.8.1 Cancellazione delle radiointerferenze e gradi di libertà ....................... 77
2.9 Riassunto ...................................................................................................... 80
CAPITOLO 3
ALGORITMO MVDR ADATTATIVO ........................................................... 83
3.1 Algoritmi di beamforming adattativo ........................................................... 84
3.2 MVDR beamforming deterministico .............................................................88
3.3 MVDR beamforming adattativo ................................................................... 91
3.3.1 Velocità di convergenza della matrice di covarianza ........................... 97
3.3.2 Iniezione di rumore artificiale e calcolo di -1R̂ ................................... 98
3.4 Creazione di un modello di simulazione dinamico
attraverso l’uso di Simulink ......................................................................... 100
3.4.1 Considerazioni introduttive................................................................. 102
3.4.2 Modello dinamico con Simulink ......................................................... 107
Indice
3.5 Simulazioni........................................................................................... 115 3.5.1 Caso statico ......................................................................................... 115
3.5.1.1 Esempio 1................................................................................... 115
3.5.1.2 Esempio 2................................................................................... 118
3.5.1.3 Esempio 3................................................................................... 122
3.5.1.4 Esempio 4................................................................................... 125
3.5.1.5 Esempio 5................................................................................... 127
3.5.1.6 Esempio 6................................................................................... 131
3.5.1.7 Esempio 7................................................................................... 132
3.5.2 Caso dinamico..................................................................................... 134
3.5.2.1 Esempio 8................................................................................... 134
3.5.2.2 Esempio 9................................................................................... 138
3.5.2.3 Esempio 10................................................................................. 140
CAPITOLO 4
ALGORITMO LCMV ADATTATIVO NEL DOMINIO
DELLA FREQUENZA..................................................................................... 145
4.1 Formulazione nel dominio del tempo ......................................................... 146
4.2 Formulazione nel dominio della frequenza ................................................. 148
4.3 Algoritmo adattativo vincolato nel dominio della
frequenza (Frequency Domain-LCMV, FD-LCMV).................................... 151
4.4 Implementazione dell’algoritmo su calcolatore........................................... 153
4.5 Esempi numerici mediante MATLAB ........................................................ 161
4.5.1 Caso statico ......................................................................................... 161
4.5.1.1 Esempio 1................................................................................... 161
4.5.1.2 Esempio 2................................................................................... 165
4.5.1.3 Esempio 3................................................................................... 167
4.5.1.4 Esempio 4................................................................................... 168
4.5.1.5 Esempio 5................................................................................... 169
4.5.2 Caso dinamico..................................................................................... 171
4.5.2.1 Esempio 6................................................................................... 171
Indice
CAPITOLO 5
ANALISI AGLI AUTOVALORI ED AUTOVETTORI
DELLA MATRICE DI COVARIANZA ........................................................ 173
Autostruttura della matrice di covarianza ......................................................... 174
5.2 Prove su autovalori ed autovettori .............................................................. 175
5.2.1 Esempio 1 ........................................................................................... 176
5.2.2 Esempio 2 ........................................................................................... 180
5.2.3 Esempio 3 ........................................................................................... 183
5.3 Null Steering beamforming adattativo ........................................................ 185
5.3.1 Implementazione................................................................................. 186
5.3.2 Esempio di simulazione in ambiente statico....................................... 187
5.3.3 Esempio di simulazione in ambiente dinamico .................................. 190
5.4 LCMV beamforming adattativo .................................................................. 192
5.4.1 Esempio di simulazione in ambiente statico....................................... 193
5.4.2 Esempio di simulazione in ambiente dinamico .................................. 195
CAPITOLO 6
KLT E BEAMFORMING................................................................................ 199
6.1 Considerazioni introduttive ......................................................................... 200
6.2 Approccio analitico ..................................................................................... 203
6.3 Progetto del beamformer ............................................................................ 209
6.3.1 Implementazione................................................................................. 210
6.3.2 Prove di simulazione........................................................................... 211
6.3.2.1 Esempio di simulazione in ambiente statico .............................. 211
6.3.2.2 Esempio di simulazione in ambiente dinamico.......................... 213
APPENDICE A
IL SISTEMA BEST-1....................................................................................... 217
A.1 Equivocazione spaziale e lobi di grating .................................................... 218
A.2 Caratterizzazione del beampattern del sistema BEST-1 ............................. 221
A.2.1 Beampattern del singolo dipolo di BEST-1........................................ 222
Indice
Beampattern di una singola antenna della schiera di BEST-1 ..................... 224
A.2.3 Beampattern di BEST-1...................................................................... 225
APPENDICE B
COMUNICAZIONI SATELLITARI ............................................................. 233
CONCLUSIONI E SVILUPPI FUTURI ....................................................... 249
BIBLIOGRAFIA ...................................................................................... 253
RINGRAZIAMENTI ....................................................................................... 259
I
INTRODUZIONE
Una delle problematiche che hanno costantemente segnato la storia delle
comunicazioni via radio, a partire dal momento in cui hanno subito un forte
sviluppo, è senza dubbio quello legato alle interferenze: quando più sorgenti
trasmettono contemporaneamente dei segnali nello spazio, diventa impossibile
una corretta ricezione del segnale desiderato se non si adottano opportune
contromisure.
Nel caso in cui i vari segnali che si propagano nel mezzo radio viaggiano su
portanti a frequenze diverse, le interferenze vengono efficacemente soppresse
mediante l’applicazione della tecnica del filtraggio spettrale. Quest’ultima si
dimostra però totalmente inefficiente qualora i segnali interferenti ed il segnale
voluto occupano contemporaneamente la stessa banda di frequenze. Tale
situazione costituisce un problema decisamente rilevante, in quanto, da una parte
coinvolge qualunque sistema di telecomunicazione wireless, dall’altra presenta un
trend che, da alcuni anni a questa parte, è in forte crescita. Infatti, lo sviluppo
tecnologico e la continua ricerca di servizi innovativi in grado di soddisfare le
richieste di un’utenza sempre più esigente hanno portato allo sviluppo di una
grande quantità di sistemi operanti su una risorsa, quella radio, per sua stessa
natura limitata.
La questione introdotta non risparmia certo il mondo della radioastronomia, anzi
la colpisce in maniera ancor più profonda e decisiva. I segnali che si vogliono
osservare in radioastronomia hanno un’intensità di molti ordini di grandezza
inferiore a quella di qualsiasi segnale di origine terrestre. Ciò fa sì che, anche
segnali raccolti dai lobi secondari delle antenne, armoniche di ordine superiore,
intermodulazioni e quant’altro possa capitare alle frequenze di un radiotelescopio
possono causare gravi danni all’osservazione fino ad invalidarla completamente.
Introduzione
II
Nasce quindi la necessità di trovare un metodo valido, in grado di fronteggiare in
maniera alternativa il problema delle interferenze. A tal proposito si candida in
maniera preponderante la tecnica del beamforming: quest’ultima rappresenta la
realizzazione di un filtro spaziale in ricezione che, sfruttando la diversità spaziale
delle sorgenti che emettono segnali nello spazio, riesce a isolare il segnale
desiderato da quelli interferenti. Più nello specifico, si tratta di combinare i segnali
provenienti da un array di piccole antenne non direzionali per formare una grande
antenna direzionale che riceva il segnale proveniente da una direzione ben precisa,
eliminando (o limitando) il contributo di segnali che provengono da altre
direzioni. L’antenna risultante può essere puntata elettronicamente, senza
compiere quindi alcun movimento fisico.
Il radiotelescopio “Croce del Nord” di Medicina (BO) possiede proprio le
caratteristiche ideali per diventare un ottimo banco di prova in cui testare sul
campo gli algoritmi di beamforming. Esso infatti mette a disposizione un numero
estremamente elevato di ricevitori e permette di verificare la validità di tali
algoritmi in un ambiente decisamente ostile e difficile, in modo da svilupparli
verso un funzionamento ottimo.
Da alcuni anni è sorto l’interesse, da parte dell’Istituto di RadioAstronomia (IRA),
di coinvolgere il radiotelescopio nell’ambito di due progetti radioastronomici di
livello mondiale, entrambi estremamente ambiziosi: LOFAR (LOw Frequency
ARray) e SKA (Square Kilometer Array); andando in ordine cronologico, già da
alcuni anni si stanno effettuando ricerche in ambito SKA, mentre solo da qualche
anno è emersa l’intenzione di entrare nel consorzio LOFAR.
Il primo mira alla costruzione di un grande radiotelescopio per osservazioni a
bassa frequenza, il secondo si pone l’obiettivo di realizzare un radiotelescopio di
proporzioni gigantesche, mai raggiunte fino ad ora: esso, come suggerisce il nome
stesso, dovrebbe avere un’area efficace pari a circa 1 Km2.
Risulta allora evidente che, per la messa in opera di questi due grandi progetti,
occorre compiere una serie di studi e ricerche volti allo sviluppo di nuove
tecnologie e sistemi dai quali poter ottenere le massime prestazioni. In particolar
modo questo discorso è valido a proposito del beamforming: occorre infatti, da un
Introduzione
III
lato sperimentare gli algoritmi già conosciuti, in modo da verificarne
l’applicabilità e la reale efficacia in ambito radioastronomico; dall’altro ricercarne
dei nuovi, che possibilmente offrano risultati migliori.
Il presente lavoro di tesi, realizzato presso la stazione radioastronomica di
Medicina, si inserisce proprio in questo contesto. In particolare esso si articola nel
seguente modo: dapprima verrà eseguito uno studio approfondito (in fase di
simulazione) di un algoritmo già utilizzato nel campo delle telecomunicazioni
tradizionali, l’MVDR (Minimum Variance Distortionless Response), allo scopo di
saggiarne le prestazioni sia in ambiente statico (con interferenti in posizioni
fissate dello spazio), sia in ambiente dinamico (con interferenti in movimento).
Successivamente verranno ricercati, partendo da un’attenta indagine bibliografica,
e poi implementati al calcolatore altri possibili algoritmi da analizzare e valutare
in riferimento alle applicazioni radioastronomiche.
Da ultima, verrà presa in esame la possibilità di applicare al beamforming lo
stesso principio di funzionamento dell’algoritmo che realizza l’analisi di segnali
radioastronomici tramite KLT (Karhunen-Loève Transform): questo allo scopo di
trovare, se possibile, un modo alternativo e innovativo per realizzare il filtraggio
spaziale.
CAPITOLO 1
LA STAZIONE RADIOASTRONOMICA DI
MEDICINA
1.1 Introduzione
La stazione radioastronomica di Medicina (Bologna) è gestita dall’Istituto di
RadioAstronomia (IRA) dell’Istituto Nazionale di AstroFisica (INAF) (fig. 1.1).
Fig. 1.1: veduta aerea della stazione di Medicina con il radiotelescopio “Croce del Nord” e la
parabola VLBI
Capitolo 1 La stazione radioastronomica di Medicina
2
Nella stazione sono attivi due grandi radiotelescopi:
1. un’antenna parabolica di diametro pari a 32 m
2. l’interferometro “Croce del Nord”, che consta di due bracci disposti lungo
le direzioni Nord-Sud ed Est-Ovest.
Numerosi sono gli studi ed i progetti nei quali tali strumenti sono coinvolti: i
maggiori impulsi scientifici riguardano la continua osservazione del cielo e la
possibilità di elaborare mappe radio, con particolare attenzione ai fenomeni di
transito (ad esempio la Croce si adatta molto bene alla ricerca ed alla misura del
periodo di oscillazione delle pulsar), nonché applicazioni di spettroscopia a bassa
frequenza, come l’identificazione della riga di ricombinazione del carbonio.
La stazione, con la sua parabola, fa inoltre parte dell’European VLBI Network,
lavorando quindi in rete con i maggiori siti di ricerca radioastronomica europei e
mondiali; come verrà meglio illustrato nel paragrafo 1.5, la stazione stessa ha
recentemente acquistato ulteriore importanza grazie alla possibilità di divenire un
ottimo banco di prova per il progetto SKA (Square Kilometer Array).
1.2 I parametri fondamentali di un radiotelescopio:
accenni
Un radiotelescopio viene caratterizzato principalmente da due parametri: la
sensibilità e la risoluzione (o potere risolutivo) ([1]).
Per sensibilità di un radiotelescopio si intende l’intensità della più debole
radiosorgente rilevabile dallo strumento; in termini fisici essa rappresenta la
minima variazione di potenza o di flusso per unità di banda rilevabile.
Per poterne fornire un’espressione matematica occorre esprimere la densità di
potenza ricevuta dallo strumento in termini di temperatura equivalente: in questo
modo la sensibilità si può definire come la minima variazione di temperatura di
rumore rilevabile dal radiotelescopio minT∆ :
Capitolo 1 La stazione radioastronomica di Medicina
3
nB
TkT sysr
min τ∆ = (1.1)
dove:
• rk è una costante adimensionale di sensibilità che dipende dal tipo di
architettura del ricevitore e può variare tra 0.6 e 2;
• sysT è la temperatura equivalente di rumore dell’intero sistema;
• B è la larghezza di banda del ricevitore;
• τ è il tempo di integrazione;
• n è il numero di osservazioni.
Si può dunque affermare che, affinché una radiosorgente sia rilevabile, occorre
che porti una variazione della temperatura d’antenna che sia maggiore o uguale a
minT∆ .
Ci si riferisce alla risoluzione, invece, per indicare la capacità di distinguere due
sorgenti adiacenti; più precisamente essa è definita come l’angolo minimo che
deve esserci tra due oggetti affinché siano distinguibili.
Ad alta risoluzione corrisponde alta direttività di un’antenna, cioè un diagramma
di radiazione con il lobo principale angolarmente molto stretto. Ciò, unitamente a
lobi secondari molto ridotti, consente una buona precisione nell’individuazione di
una sorgente.
L’estensione angolare del lobo principale (detta anche fascio o beam) viene
convenzionalmente descritta dall’ampiezza del fascio o BWFN (BeamWidth
between First Nulls): questa è la distanza angolare tra i due zeri ai lati del lobo
principale (fig. 1.2).
E’ possibile definire la risoluzione di un radiotelescopio come:
HPBW2
BWFN≅ dove
DHPBW λ
∝ (1.2)
Capitolo 1 La stazione radioastronomica di Medicina
4
HPBW (Half Power Beam Width) è l’ampiezza angolare a metà potenza del lobo
principale, λ è la lunghezza d’onda d’osservazione e D è il diametro dello
specchio primario. La precedente relazione si ottiene considerando che l’HPBW è
approssimabile all’angolo compreso tra il picco del diagramma di potenza ed il
primo zero.
Fig. 1.2: diagramma di potenza in dB in funzione di una sola coordinata angolare (θ).
1.3 La parabola VLBI
L’antenna parabolica è stata costruita nel 1983 secondo il progetto della ditta
americana TIW, per partecipare alle osservazioni VLBI (Very Long Baseline
Interferometry), tecnica mediante la quale si è in grado di aumentare il potere
risolutivo dell’antenna ([2], [3]).
Essa è basata sul principio dell’ottica secondo il quale, per ottenere la massima
risoluzione possibile da uno specchio di un dato diametro, non è necessario
utilizzare tutta la superficie ma bastano due punti diametralmente opposti; tale
principio è applicabile anche in campo radio, l’unica differenza è rappresentata
dalla diversa frequenza. Nella radioastronomia la tecnica interferometrica
permette l’utilizzo di due o più radiotelescopi di dimensioni ridotte posti anche a
grande distanza, al posto di uno singolo e di grandi dimensioni.
Capitolo 1 La stazione radioastronomica di Medicina
5
L’antenna parabolica è formata da uno specchio primario di 32 m di diametro ed è
completamente orientabile in ogni direzione: essa è quindi in grado di puntare ed
inseguire una qualunque sorgente sopra l’orizzonte, compensando il suo moto
apparente causato dalla rotazione terrestre (fig. 1.3).
Fig. 1.3: la parabola VLBI
A seconda del funzionamento, può essere utilizzata avvalendosi anche di un
secondo specchio di forma iperbolica, detto specchio secondario o subriflettore ,
del diametro di 3.2 m (sistema ottico di tipo Cassegrain).
Quando lo specchio secondario è in funzione, le onde elettromagnetiche vengono
convogliate sul fuoco secondario, dove risiede il sistema di ricezione; in certi casi
è invece sufficiente un sistema ottico più semplice: il subriflettore viene spostato e
come sistema di ricezione viene utilizzato quello posto sul fuoco primario.
L’antenna può funzionare a frequenze comprese tra 1.4 GHz e 22 GHz, ovvero
per lunghezze d’onda comprese tra 21.5 cm e 1.37 cm.
Essa è coinvolta in diversi progetti, in rete o in single dish, che è la modalità
operativa in cui compie le sue osservazioni singolarmente, non cooperando con
radiotelescopi di altre nazioni; in particolare, come già accennato, l’antenna
parabolica di Medicina fa parte dell’European VLBI Network.
Capitolo 1 La stazione radioastronomica di Medicina
6
1.4 Il radiotelescopio “Croce del Nord” La “Croce del Nord” è un interferometro radioastronomico costituito da due serie
di antenne disposte a T secondo la direzione Est-Ovest (E-W) e Nord-Sud (N-S).
La sua costruzione è iniziata nel 1960, per poi concludersi nel 1967, sebbene in
una versione ridotta rispetto al progetto originario. Problemi tecnici alle antenne
hanno suggerito un parziale rifacimento dello strumento, oltre ad un suo
ammodernamento dal punto di vista elettronico e nel 1976 la “Croce del Nord”
ha iniziato una nuova fase di attività ([2], [3]).
Questo array di antenne è stato progettato per operare alla frequenza di 408 MHz
(λ = 73.5 cm) ed attualmente viene impiegata con una banda di circa 2.5 MHz.
Si tratta di uno strumento di transito, ovvero in grado di ricevere le onde
elettromagnetiche provenienti da un punto dello spazio quando questo, per effetto
della rotazione terrestre, si trova sul meridiano celeste locale; il sistema di
movimentazione elettromeccanica prevede, quindi, il solo puntamento in
declinazione.
La “Croce del Nord” ha un’area collettrice geometrica di più di 31025 m2 (quella
effettiva è di circa 20000 m2), tra le più vaste dell’emisfero settentrionale, ed è
noto per aver prodotto accurate mappe del cielo (B1, B2 e B3) alla frequenza di
408 MHz.
Essa è comunque sensibile alla sola polarizzazione del segnale incidente parallela
all’asse focale, per cui viene raccolta mediamente circa la metà della potenza della
radiazione in arrivo.
Il ramo E-W
Il ramo E-W è costituito da un’unica grande antenna con uno specchio di forma
cilindrico-parabolica lungo 564 m e largo 35 m (fig. 1.4). Lungo l’asse focale,
parallelo all’asse di rotazione e a distanza di circa 20 m da esso, si trovano 1536
dipoli, allineati ed equispaziati di circa 36 cm: essi trasformano le onde radio
incidenti in tensioni elettriche misurabili.
Capitolo 1 La stazione radioastronomica di Medicina
7
Fig. 1.4: il ramo E-W
Il profilo dello specchio è particolare, in quanto non contiene il vertice della
parabola, e questo permette di non avere lobi secondari dovuti al bloccaggio
dell’apertura.
In prossimità dei dipoli è inoltre stato posto uno specchio a forma d’angolo
(corner reflector, vedi fig. 1.5), realizzato con fili metallici, che, nonostante riduca
in parte l’efficienza d’antenna illuminando solo la porzione centrale dello
specchio, consente l’eliminazione del fenomeno di illuminazione oltre il bordo
(spill over), causa di ricezione di segnali spuri non provenienti dallo specchio.
Fig. 1.5: il corner reflector
corner reflector
Capitolo 1 La stazione radioastronomica di Medicina
8
Il ramo N-S
Il ramo N-S è costituito da un array di 64 antenne, anche queste di forma
cilindrico-parabolica, lunghe 23.5 m e larghe 7.5 m, disposte parallelamente a 10
m l’una dall’altra; sull’asse focale di ognuna di esse, posto a meno di 6 m da terra,
sono disposti, ad uguale distanza gli uni dagli altri, 64 dipoli a mezz’onda (36 cm)
per un totale di 4096 dipoli nel ramo complessivo (fig. 1.6).
Fig. 1.6: il ramo N-S
La forma cilindrico-parabolica per il riflettore delle antenne (fig. 1.7) è stata scelta
per unire la semplicità costruttiva della forma cilindrica alle proprietà
matematiche della parabola, che consentono di:
far convergere sul fuoco tutte e sole le onde radio provenienti da una
direzione ortogonale alla direttrice;
ottenere che tutti i punti del fronte d’onda (in fase), provenienti da tale
direzione, si trovino ancora in fase nel fuoco.
Capitolo 1 La stazione radioastronomica di Medicina
9
Fig. 1.7: schema esemplificativo del profilo parabolico del riflettore delle antenne, in cui vengono
evidenziati i parametri fondamentali e le proprietà della parabola.
La precisione meccanica della struttura non è da considerarsi in senso assoluto,
ma relativamente alla lunghezza d’onda alla quale lo strumento lavora (73.5 cm).
Se la forma del riflettore non differisce da un profilo parabolico per più di un
sedicesimo della lunghezza d’onda (tolleranza che comprende gli effetti di
deformazione meccanica, degli agenti atmosferici, etc.), si può ritenere che le
imperfezioni non influenzino in modo significativo il rendimento dello strumento.
Il riflettore è stato realizzato non a superficie completamente piena, ma con una
serie di fili d’acciaio di 0.5 mm di diametro, paralleli alla linea focale e distanziati
fra loro di circa 2 cm, per una lunghezza complessiva di circa 2000 Km (fig 1.8).
Fig. 1.8: particolare del riflettore di una delle antenne che compongono il ramo N-S
Capitolo 1 La stazione radioastronomica di Medicina
10
Alla lunghezza d’onda di lavoro il rendimento di riflessione cala in modo
ridottissimo, ma risultano molto più agevoli sia la costruzione, sia la
manutenzione e si è ottenuta una maggiore resistenza agli agenti esterni, quali il
clima e la gravità.
1.5 Principi di funzionamento della “Croce del Nord”
La conversione dell’energia elettromagnetica in tensione elettrica viene effettuata
ad opera dei dipoli. Tale segnale deve poi essere trasportato nella sala centrale di
elaborazione dei dati seguendo alcune specifiche:
1. limitare il più possibile l’attenuazione del segnale rispetto al rumore, cioè
amplificare il segnale fino a renderlo accettabile come input per
l’elettronica che dovrà elaborarlo, massimizzando quindi il rapporto
segnale-rumore;
2. fare in modo che i punti in fase di una superficie d’onda si trovino ancora
in fase, ma come tensione elettrica, all’ingresso della stanza di
elaborazione e in tutti i punti intermedi in cui vengono a sommarsi.
I 1536 dipoli del braccio E-W sono divisi in 6 sezioni da 256 dipoli ciascuna.
All’interno di ogni sezione si opera una somma progressiva dei segnali
raccolti con un sommatore detto ad albero di Natale (fig. 1.9), che permette di
passare da 256 segnali elementari ad un unico segnale, mantenendo le
specifiche citate in precedenza.
Fig. 1.9: schema del sommatore ad albero di Natale impiegato nel ramo E-W
Capitolo 1 La stazione radioastronomica di Medicina
11
All’interno di ogni sottosezione, costituita ognuna da 64 dipoli, il segnale elettrico
si muove lungo una linea cava di alluminio, mentre dalle sottosezioni fino alle
cabine si muove su cavo coassiale rigido. La prima parte è quella più critica, in
cui occorre mantenere possibilmente costanti le condizioni atmosferiche ed in
particolare l'umidità. Per questo motivo sia i dipoli sia il primo percorso in cava
originariamente erano racchiusi in un involucro in polietilene ad alta densità,
trasparente alla radiazione elettromagnetica, riempito di aria secca.
Il segnale radio a 408 (± 1.25) MHz viene convertito, giunto in cabina, a 30 (±
1.25) MHz per ridurre le perdite nel portare il segnale dalle cabine alla sala di
elaborazione: il trasporto su cavo, infatti, comporta delle perdite per effetto "pelle"
proporzionali alla radice quadrata della frequenza. I segnali a frequenza
intermedia giungono quindi alla stazione di elaborazione tramite cavi coassiali
interrati a circa 1.20 m di profondità, per sottrarli alle rapide variazioni termiche
giornaliere che potrebbero alterare le delicate relazioni di fase ed ampiezza fra i
segnali provenienti dalle 6 cabine (6 canali). Le variazioni termiche lente
(stagionali) non comportano causa di errore poichè vengono eliminate con le
calibrazioni giornaliere.
Le 64 antenne che costituiscono il braccio N-S sono divise in 8 sezioni che
raggruppano ciascuna 8 antenne. All’interno di ciascuna antenna si trovano 64
dipoli e, anche in questo caso, con lo stesso metodo ad albero di Natale, ma in
modo un po' meno rigoroso, i segnali dai dipoli vengono successivamente
sommati fino ad avere un singolo segnale per ogni antenna (fig. 1.10); questo allo
scopo di raggiungere un compromesso tra una buona efficienza ed un disegno
relativamente semplice dal punto di vista costruttivo.
Fig. 1.10: schema quasi ad albero di Natale impiegato nel ramo N-S
Capitolo 1 La stazione radioastronomica di Medicina
12
Si deve evidenziare come la situazione per il ramo N-S sia differente dal
caso E-W: come si vede dalla fig. 1.11, i punti equifase (P1, P2,….., P8) in genere
non arrivano in fase sulle singole antenne poiché sono differenti i percorsi in aria
(L1, L2,….., L8); si noti inoltre che tali percorsi variano con l’angolo di
puntamento δ.
Fig. 1.11: vengono mostrate le posizioni relative fra le antenne di una qualunque sezione del ramo
N-S ed il fronte d’onda elettromagnetico ricevuto per diversi valori dell’angolo di puntamento δ:
in a) si ha un puntamento allo zenith, il fronte d’onda arriva in fase su tutte le antenne; mentre in
b) e in c) si ha un puntamento a declinazioni differenti, con conseguenti differenti sfasamenti fra le
singole antenne.
Occorre quindi un sistema di rifasamento, variabile con l’angolo di puntamento δ,
per rifasare i segnali provenienti dalle singole antenne prima di sommarli a
formare il segnale singolo. Attualmente il rifasamento viene ottenuto impiegando
Capitolo 1 La stazione radioastronomica di Medicina
13
dei cavi coassiali riempiti parzialmente di kerosene. La lunghezza del tratto
riempito dal fluido, che, per via della maggiore costante dielettrica del mezzo,
determina una velocità di propagazione minore per il segnale che lo attraversa, è
controllato da un sistema elettro-idraulico: al variare dell’angolo di puntamento, il
sistema provvede automaticamente ad impostare il giusto livello di kerosene nei
cavi. Questo sistema è concettualmente semplice, seppur meccanicamente
elaborato, ma non consente di raggiungere la massima efficienza dello strumento.
Per tale motivo è in fase di studio presso l’istituto un nuovo sistema basato
sull’impiego di moderni e flessibili phase shifters.
Giunto in cabina, il segnale viene convertito alla media frequenza di 30 MHz
(analogamente a quanto accade per il braccio E-W) e tramite cavi coassiali viene
trasportato nella stanza di elaborazione.
Prima di essere analizzati, i 14 segnali (6 E-W + 8 N-S, si veda la fig. 1.12)
vengono fatti passare attraverso opportune linee di ritardo per equalizzare i diversi
percorsi tra le 14 cabine e la stanza di elaborazione.
Fig. 1.12: schema riassuntivo della composizione dei segnali forniti dalla “Croce del Nord”
singolo elemento (riflettore)
singolo canale N-S (8 riflettori per canale)
Capitolo 1 La stazione radioastronomica di Medicina
14
A questo punto tutto ciò che si è fatto è stato semplicemente convertire in tensioni
elettriche misurabili l’energia elettromagnetica proveniente da una zona di cielo e
concentrarla in 14 segnali distinti. Le cross-correlazioni tra questi 14 segnali
forniscono a loro volta 6×8 segnali indipendenti.
Sommando in fase i segnali provenienti dalle 6 sezioni del braccio E-W si ottiene
poi quello che viene chiamato fascio B. Ritardando progressivamente i segnali
elettrici che arrivano dalle 6 sezioni del braccio E-W, prima di sommarli, si
ottengono ulteriori fasci ed agli effetti pratici questa operazione equivale ad
osservare zone di cielo circostanti il meridiano locale: con un anticipo sul
meridiano si ottiene il fascio A, mentre con un ritardo si ottiene il fascio C.
Cosicché, per via di un semplice artificio di natura elettrica, è come disporre di tre
antenne puntate in direzioni progressive, invece di una singola antenna puntata
verso il meridiano (fig. 1.13). La sorgente, in moto apparente a causa della
rotazione terrestre, attraverserà prima il fascio A, poi il fascio B ed infine il C.
Un eventuale disturbo generato in prossimità del radiotelescopio (ovvero di
origine terrestre) entrerà invece contemporaneamente nei 3 fasci. In questo
metodo si può avere, oltre a 3 misure per ogni radiosorgente, anche un primo
criterio di separazione tra radiosorgenti e radiointerferenze.
Fig. 1.13: in alto – formazione dei 3 fasci del ramo E-W; come si vede, il fascio A risulta essere in
anticipo sul fascio B, mentre il fascio C risulta essere in ritardo. In basso – raffigurazione del
transito di una radiosorgente e della ricezione di una interferenza sui 3 fasci.
Capitolo 1 La stazione radioastronomica di Medicina
15
Analogamente si può operare con i segnali che arrivano dalle 8 sezioni N-S,
ottenendo così 5 fasci (F, G, H, I e J) puntati elettricamente in 5 direzioni
progressivamente spostate da Nord verso Sud (ma tutte alla stessa ascensione
retta, quella del meridiano). In questo caso l’artificio permette di esplorare
contemporaneamente una zona di cielo più estesa durante la stessa osservazione.
Una volta trasformato in segnale elettrico dai dipoli, quindi, il segnale
radioastronomico viene convogliato, dopo essere stato amplificato e ripulito
dalle eventuali interferenze radio-contigue alla banda, nella stanza del ricevitore
(fig. 1.14). Qui viene ulteriormente amplificato e filtrato per eliminare eventuali
residui di interferenze presenti in prossimità della banda operativa dello
strumento. Si equalizzano in fase ed ampiezza tutti i 14 contributi relativi ai 14
canali (6 per il ramo E-W e 8 per quello N-S) prima di elaborarli singolarmente od
effettuarne la cross-correlazione con un banco di 48 correlatori complessi.
Dopo l’elaborazione analogica i segnali vengono campionati ed acquisiti da un
calcolatore, che ne effettuerà la post-elaborazione e la relativa memorizzazione su
Hard Disk.
Fig. 1.14: La stanza del ricevitore della “Croce del Nord”: in essa convivono apparecchiature
realizzate negli anni ’60 e ’70 (lettore a carta, sistema di calibrazione,…) e nei giorni nostri
(spettrometro digitale, sistema PULSAR,…).
Capitolo 1 La stazione radioastronomica di Medicina
16
A seconda dell’utilizzo dei segnali, la “Croce del Nord” può essere fatta lavorare
in differenti modalità, riconducibili alle tecniche di indagine radioastronomia total
power e interferometrica.
Nella prima si sommano i vari segnali in modo da realizzare un’unica antenna
equivalente, la cui area di raccolta risulta pari alla somma delle superfici di
raccolta delle singole antenne. Questo viene fatto con i segnali dei tre fasci del
ramo E-W e dei cinque fasci del ramo N-S, presi singolarmente.
Svolgendo invece un’operazione di correlazione tra i segnali, cioè una
moltiplicazione ed una successiva integrazione, si può far lavorare lo strumento
come un interferometro a correlazione; i segnali correlati possono essere sia quelli
degli 8 fasci d’antenna, nella modalità cosiddetta “multifascio”, sia quelli di ogni
singola sezione dei due rami, nella modalità “interferometri sciolti”.
1.6 Il progetto LOFAR (LOw Frequency ARray)
1.6.1 Introduzione Sin dagli albori della radioastronomia si è sempre cercato di operare a frequenze
elevate, in modo da riuscire a realizzare antenne di dimensioni ragionevolmente
ridotte, mantenendo un potere risolutore e una sensibilità sufficientemente elevati.
Si ricordi a tal proposito (vedi paragrafo 1.2) che la capacità di risoluzione di
un’antenna è inversamente proporzionale al rapporto Dλ , dove λ è la lunghezza
d’onda d’osservazione e D il diametro dello specchio primario.
Da alcuni anni a questa parte molti enti, tra cui ASTRON (ASTRonomisch
Onderzolk in Nederland), si stanno impegnando per rivalutare la radioastronomia
a bassa frequenza, che risulta essere un campo non ancora esplorato e che può
fornire informazioni utili sull’origine dell’universo e non solo.
Infatti uno dei vantaggi legato ad operare a bassa frequenza è l’elevata intensità
della radiazione proveniente dalla maggioranza delle sorgenti celesti (dovuta a
meccanismi non termici), e alle buone caratteristiche in sensibilità dei ricevitori;
tuttavia si registrano gli svantaggi dovuti al limitato potere risolutivo dell’antenna,
Capitolo 1 La stazione radioastronomica di Medicina
17
che diminuisce all’aumentare della lunghezza d’onda operativa, e all’aumentata
possibilità di disturbi causati da radiointerferenze terrestri naturali (essenzialmente
di tipo atmosferico) ed artificiali (emissioni man-made).
Il problema relativo alla bassa risoluzione è stato superato grazie alla tecnica
interferometrica applicata, per esempio, agli attuali sistemi a grandissima base
(VLBI), di cui si è già discusso in precedenza. Grazie a questa tecnica si possono
realizzare virtualmente antenne di dimensioni enormi, con un elevato potere
risolutivo, grazie all’interazione tra più antenne, disposte in varie parti del globo
terrestre.
Un esempio di questa tipologia di sistema è LOFAR (LOw Frequency ARray), il
cui progetto, tra i più innovativi in campo radioastronomico, è attualmente in
corso di sviluppo.
LOFAR, seppur ancora in fase di costruzione ad opera dell’istituto di
radioastronomia olandese ASTRON, costituirà un nuovo potente radiotelescopio,
il quale, tramite le sue considerevoli prestazioni, dovrebbe consentire di osservare
il cosmo nella sua fase iniziale di evoluzione, offrendo la possibilità di effettuare
nuove sorprendenti scoperte. Inoltre dovrebbe fornire mappe dettagliate su come
si sono formate le prime stelle, e informazioni per comprendere meglio le
tempeste magnetiche che avvengono sul sole, il vento solare ed il loro effetto sul
clima terrestre.
I concetti tecnologico-costruttivi su cui si basa LOFAR rappresentano un punto di
rottura con il passato e si traducono in una consistente riduzione dei costi: i
radiotelescopi tradizionali, infatti, combinano i segnali elettronici raccolti da
enormi parabole mobili che risultano estremamente costose da costruire e,
comunque, troppo piccole per mettere a fuoco le elevate lunghezze d’onda
necessarie per osservare la formazione delle galassie. Più della metà dei costi
legati allo sviluppo di questi radiotelescopi è da attribuire alla struttura meccanica
per il sostegno e il puntamento meccanico. Se la stessa tecnologia fosse utilizzata
anche per LOFAR, i costi della sua realizzazione sarebbero enormi (decine di
miliardi di dollari).
Capitolo 1 La stazione radioastronomica di Medicina
18
LOFAR invece sfrutta una nuova tecnologia: esso è in grado di rilevare i segnali
provenienti dal cielo, utilizzando un array di semplici ed economiche antenne
omni-direzionali (in grado cioè di captare segnali provenienti da qualunque
direzione), ciascuna a forma di piramide cava e realizzata con stecche di metallo
(fig. 1.15).
Fig. 1.15: esempio di antenne impiegate nel sistema LOFAR
Per poter fornire una mappa dettagliata del cielo, tali antenne sono raggruppate in
clusters estesi su un’ area di 350 km di diametro.
Le onde elettromagnetiche ricevute vengono campionate ed inviate tramite
collegamenti digitali a larga banda (cavi in fibra ottica) ad un nuovo apposito
supercomputer, denominato IBM Blue Gene/L, che ha raggiunto la velocità di
calcolo di 70 TFlops/s, diventando il più potente elaboratore d’Europa, ed in
grado di sintetizzare immagini radio in tempo reale.
Il particolare disegno delle antenne, unitamente alle proprietà del concetto di
array, consente tanto di poter disporre di field of view multipli, cioè di poter
puntare contemporaneamente più punti nel cielo, tanto di poter utilizzare tecniche
di beamforming digitale adattativo per la soppressione di interferenze radio,
problema molto sentito a queste frequenze.
Capitolo 1 La stazione radioastronomica di Medicina
19
In poche parole, il sistema LOFAR (fig. 1.16) può essere considerato come una
rete estesa di antenne (array di sensori), distribuite geograficamente su larga
scala, connesse, tramite una rete indipendente (in parte wireless), basata su una
dorsale in fibra ottica ad altissima velocità, ad un supercomputer per formare
complessivamente un unico radiotelescopio (che non ha parti in movimento);
quest’ultimo opera in una banda di frequenze che va da 10 MHz a 250 MHz,
suddivisa in due sottobande: la prima va da 10 MHz a 80 MHz (“LOFAR basso”),
la seconda da 110 MHz a 250 MHz (“LOFAR alto”).
Fig. 1.16: rappresentazione di LOFAR realizzata mediante simulazione virtuale al calcolatore
Il suo costo è pertanto legato solo al costo delle apparecchiature elettroniche che,
come sappiamo, segue la legge di Moore e decresce sempre più con l’evoluzione
della tecnologia, permettendo di incrementare le dimensioni di questo nuovo
radiotelescopio.
Oltre a tali antenne il sistema LOFAR è dotato anche di piccoli sensori per il
monitoraggio atmosferico e del sottosuolo.
Il luogo adatto dove costruire il cuore del sistema LOFAR si trova nella provincia
olandese di Drenthe, in cui è già presente una piccola area di test costituita da un
centinaio di antenne, che rappresentano le basi per uno sviluppo futuro del
Capitolo 1 La stazione radioastronomica di Medicina
20
progetto. Tali antenne sono disposte lungo cinque bracci immaginari che si
dipartono dal nucleo centrale (fig. 1.17).
Fig. 1.17: collocazione del sistema LOFAR
1.6.2 Configurazione del sistema LOFAR Si è detto in precedenza che LOFAR rappresenta, seppur ancora in linea teorica,
un sistema in grado di svolgere molteplici funzioni: esplorazione dello spazio
profondo, monitoraggio del sottosuolo terrestre e analisi meteorologiche.
Il tutto avviene attraverso l’utilizzo di un ingente numero di piccoli sensori a
basso costo (antenne omni-direzionali, sensori di vibrazione e microbarometri).
I principali sottosistemi che costituiscono LOFAR sono:
• rete di sensori: piccoli, distribuiti in aree chiamate “stazioni remote” e in
un’area centrale chiamata “core”;
• rete a banda larga, per il trasporto dei dati e delle informazioni di
controllo;
Capitolo 1 La stazione radioastronomica di Medicina
21
• sistema centrale di elaborazione;
• sistema software, che include i software di controllo e le interfacce con
gli utenti.
LOFAR, nella sua prima fase di attività, è costituito da un nucleo centrale (core) e
da 45 stazioni remote. I sensori nelle stazioni remote e nel nucleo centrale sono
costituiti da 100 antenne caratterizzanti il cosiddetto “LOFAR alto”, 100 antenne
caratterizzanti il “LOFAR basso”, 13 sensori di vibrazione, 3 microbarometri e
parecchi altri sistemi ausiliari.
In definitiva è possibile classificare questi sensori in varie categorie:
- low band antennas: sono ottimizzate per operare in un range di
frequenze da 10 MHz a 80 MHz (vedi fig. 1.18 a sinistra);
- high band antennas: esse operano in una banda da 110 MHz a 250 MHz
(vedi fig. 1.18 a destra);
- sensori geofisici: sensori di vibrazione e microbarometri (fig. 1.19). I
sensori di vibrazione vengono piazzati a 10 m sotto la superficie terrestre;
i microbarometri vengono incapsulati in tubi da 0.5 m di diametro.
I segnali provenienti dalle due categorie di antenne (low e high) vengono rilevati
da un ricevitore a banda larga; ogni ricevitore è connesso a due antenne (una
appartenente al gruppo low e una appartenente al gruppo high), ma ne viene resa
attiva solo una per volta.
Il nucleo centrale ha un diametro di 2 Km ed è costituito da 3200 high band e da
3200 low band antennas dislocate in 32 sottostazioni.
Fig. 1.18: esempi di low band (sinistra) e high band antennas (destra).
Capitolo 1 La stazione radioastronomica di Medicina
22
Fig. 1.19: esempi di sensore di vibrazione (sinistra) e microbarometro (destra).
La rete che permette di connettere ogni stazione remota con il sistema di
elaborazione centrale ha una capacità di 10 Gbit/s.
Questo sistema di trasporto dati è basato su una comunicazione digitale a fibre
ottiche. Il metodo, con il quale i dati vengono codificati e trasmessi, è funzione
della capacità della rete, della distanza percorsa e delle caratteristiche
dell’infrastruttura a fibra ottica (fibra già esistente in commercio oppure
sviluppata per il progetto LOFAR).
Questa rete viene implementata utilizzando la tecnologia Ethernet a 10 Gb, che
rappresenta la scelta ottimale sino ad una distanza di 40 Km utilizzando solo una
coppia Tx/Rx, ma può essere estesa anche a distanze superiori senza enormi costi
aggiuntivi.
Il sistema di elaborazione centrale (CEP) combina ed elabora i segnali provenienti
dalla rete di sensori; esso è progettato per gestire un gran numero di dati in modo
semplice ed efficiente. Il cuore del sistema di elaborazione centrale è costituito dal
supercomputer Blue Gene/L sviluppato da IBM, di cui si è già parlato in
precedenza.
L’interfaccia tra gli utenti e il sistema LOFAR avviene attraverso un avanzato e
distribuito sistema di monitoraggio e controllo. LOFAR è dotato anche di un
sistema di gestione autonoma in grado di eseguire auto-diagnosi e, ove possibile,
anche auto-riparazioni. Il sistema produce un enorme quantitativo di dati,
specialmente nelle applicazioni astronomiche (6 Tb di dati grezzi per 8 beam in 4
Capitolo 1 La stazione radioastronomica di Medicina
23
ore di osservazioni); si pensi che un mese di osservazioni di questo tipo produce
un PetaByte di dati.
LOFAR adotta un sistema di elaborazione in cui i dati finali prodotti dalle
osservazioni di routine sono accessibili agli utenti in qualsiasi momento.
Il post-processing di LOFAR può avvenire sia dove si trova l’utente, sia
nell’elaboratore centrale. Il tutto vincolato ad una disponibilità di banda
sufficiente per il trasporto dei dati raccolti dall’elaboratore centrale all’utente.
Viceversa si può ricorrere ad ulteriori stadi di elaborazione e riduzione dei dati
sfruttando l’elaboratore centrale.
1.6.3 Applicazioni Risulta chiaro, dalla trattazione precedente, che LOFAR non è soltanto un
radiotelescopio adibito alle osservazioni astronomiche, ma un vero e proprio
sistema globale in grado di fornire molteplici informazioni anche in altri campi
come la geofisica. Infatti grazie a LOFAR potrà essere realizzato, per esempio, il
monitoraggio dell’attività sismica naturale collegando semplicemente i sensori di
vibrazione alla rete. Si potrà inoltre osservare anche la sismicità indotta da
eventuali operazioni prodotte dall’uomo, come ad esempio l’estrazione di gas dal
sottosuolo. Utilizzando sensori ad infrasuoni connessi al sistema LOFAR, si sarà
in grado di monitorare i processi che generano queste onde, quali ad esempio
eruzioni vulcaniche o esplosioni nucleari. Collegando microbarometri e sensori
termici alla rete si sarà in grado di rilevare la pressione e la temperatura in luoghi
critici, come ad esempio pozzi di trivellamento. Infine LOFAR permetterà di
risolvere il problema del controllo dell’innalzamento del livello delle acque
specialmente nei Paesi Bassi, ove il problema risulta critico.
L’istituto meteorologico olandese reale (KNMI) sta partecipando proprio
all’applicazione di LOFAR in quest’ambito.
Numerose, evidentemente, sono anche le applicazioni in ambito astronomico.
LOFAR rappresenterà il primo strumento capace di rilevare e forse anche di
tracciare la struttura dell’universo fin dall’ “Epoca di Re-ionizzazione”, la cui
conoscenza potrebbe risolvere le tante questioni sulla formazione del cosmo.
Capitolo 1 La stazione radioastronomica di Medicina
24
Infatti, in accordo con la presente visione dell’universo, la ricombinazione
dell’idrogeno al suo stato neutro avvenne circa mezzo milione di anni dopo il Big
Bang, quando la materia primordiale si raffreddò sino ad una temperatura di 3000
K. L’universo entrò poi in un periodo di "oscurità" in cui la sua temperatura andò
via via diminuendo a causa della sua espansione. Questa “Era Oscura” (Rees
1996) terminò molte centinaia di anni dopo quando si formarono le prime stelle.
La radiazione ionizzata proveniente da queste stelle iniziò a scaldare l'universo,
producendo radiazioni visibili. Quando un numero sufficiente di sorgenti si furono
create, la temperatura e la frazione ionizzata dell’universo aumentarono
rapidamente e la maggior parte dell’idrogeno neutro scomparve. Questo periodo,
in cui l’universo si portò in una fase in cui quasi tutto l’idrogeno neutro passò in
uno stato ionizzato, prende il nome di epoca di Re-ionizzazione.
Una delle più importanti applicazioni di LOFAR sarà legata all’esplorazione delle
radiosorgenti extragalattiche. Queste indagini si legano molto bene alle
caratteristiche di LOFAR e rappresentano uno dei punti cardine che hanno
caratterizzato l’inizio del progetto. L’esplorazione della volta celeste in un range
di frequenze molto ampio (LOFAR possiede infatti una banda maggiore di 4
ottave) permetterà di creare una mappa delle radiosorgenti per lo studio di
innumerevoli fenomeni come buchi neri, galassie ecc.; inoltre, siccome LOFAR
andrà a sondare lo spazio inesplorato, sarà in grado di scoprire nuove entità che
potranno essere studiate, come ad esempio la presenza di galassie al di fuori della
Via Lattea o la nascita di nuovi corpi celesti.
LOFAR contribuirà direttamente anche allo studio dei raggi cosmici, attraverso
una rilevazione efficiente dei raggi ed un’accurata determinazione della loro
direzione di provenienza e quindi della loro sorgente. I raggi cosmici sono
costituiti da un flusso di particelle provenienti dallo spazio, quasi tutte dotate di
carica elettrica. Si tratta per lo più di ioni di elementi leggeri (idrogeno, deuterio,
elio, litio, ecc..) ed elettroni, che si muovono a velocità altissime, prossime a
quella della luce. Essi possiedono energie molto superiori a quelle ottenibili
attraverso acceleratori di particelle sulla Terra. I raggi cosmici vengono emessi
dalle stelle durante alcuni fenomeni che liberano molta energia, come le
Capitolo 1 La stazione radioastronomica di Medicina
25
esplosioni di supernove. Alcuni hanno origine nel Sole, altri da sorgenti nella Via
Lattea, altri ancora da sorgenti esterne alla nostra galassia. Lo studio dei raggi
cosmici permetterà di indagare il cosmo attraverso segnali ad alta energia, di
studiare la fisica fondamentale ad energie irraggiungibili dagli acceleratori sulla
Terra, e di ottenere preziose indicazioni sulle prime fasi di evoluzione
dell’Universo.
Grazie ad un ampio lobo principale, LOFAR sarà in grado di monitorare un’ampia
porzione di cielo, permettendo un’indagine approfondita delle radiosorgenti in
transito nella volta celeste. Utilizzando una media dei dati ricavati, esso fornirà le
informazioni per una grande varietà di scale temporali, da pochi secondi a molti
giorni. La risoluzione raggiunta sarà sufficiente per l’operazione di identificazione
dei raggi X ed ottici.
1.6.4 Possibile realizzazione di una stazione LOFAR al
radiotelescopio “Croce del Nord” di Medicina Una volta completata la realizzazione della prima fase di LOFAR, si passerà
all’estensione geografica delle stazioni in maniera tale da poter ottenere una
baseline di un certo livello per migliorare sensibilmente le prestazioni dello
strumento in termini di potere risolutore.
A tal proposito anche il radiotelescopio “Croce del Nord” di Medicina ha deciso
di partecipare alla realizzazione di questo grande strumento, in quanto permetterà
di ottenere enormi vantaggi sotto il profilo della ricerca in campo europeo.
Il progetto italiano, in fase di elaborazione, prevede due fasi distinte, che
potrebbero essere tanto una successiva all’altra quanto portate avanti in parallelo.
La più semplice ed immediata è rappresentata dall’acquisto del kit di installazione
di una stazione LOFAR da attivare a Medicina, la seconda, più complessa ma dai
grandi ritorni in termini di prestazioni, prevede l’aggiornamento del ramo Est-
Ovest del radiotelescopio “Croce del Nord”, in modo che possa funzionare alle
frequenze di LOFAR.
Il consorzio LOFAR mette a disposizione la strumentazione necessaria per
l’installazione di una stazione remota. Si parla quindi dei sensori (200 antenne
Capitolo 1 La stazione radioastronomica di Medicina
26
complessivamente), dell’elettronica direttamente installata sulle antenne e della
rete di collegamento fra le stesse.
Per quanto riguarda il sito adatto dove collocare la stazione remota LOFAR, sito
che poi dovrebbe essere collegato attraverso link a larga banda alla rete di
trasporto dati nazionale, la stazione di Medicina presenta condizioni decisamente
favorevoli, dal momento che, essendo uno dei nodi della rete europea VLBI, è
collegata tramite rete a larga banda Gb Ethernet alle dorsali nazionali.
Questo rappresenta una grossa facilitazione per l’installazione della stazione
LOFAR, i cui dati potrebbero anch’essi viaggiare su questa struttura.
Inoltre la stazione di Medicina è proprietaria di un’ampia area di terreno attorno ai
radiotelescopi, area piatta e stabile, sufficientemente lontana da centri abitati e
linee dell’alta tensione, fonti di forti disturbi, quindi idonea ad ospitare la stazione
LOFAR. Sarebbe quindi sufficiente studiare un’adeguata rete di alimentazione e
di trasferimento dati fra il sito scelto e il nodo della rete ad alta velocità e la
stazione potrebbe essere immediatamente installata.
Un grosso salto da un punto di vista scientifico, per quanto riguarda la ricerca
radioastronomica, è rappresentato da quello che è stato battezzato “progetto
super-station”. Sfruttando le potenzialità offerte da una struttura importante come
quella della “Croce del Nord”, l’idea è quella di cercare di ottimizzare le capacità
dell’antenna (in particolare del ramo Est-Ovest), oltre che per il suo normale
range di frequenze di funzionamento (attorno a 408 MHz), anche per le frequenze
di osservazione di LOFAR.
Uno studio svolto di recente ha messo in evidenza le buone capacità in termini di
prestazioni di un’antenna cilindrico-parabolica, come la croce, per una banda che
va da 100 MHz a 700 MHz. Sarebbe ovviamente necessario sostituire i sensori,
che nella fattispecie sono dei dipoli a mezz’onda ottimizzati per i 408 MHz.
In sostanza, l’obiettivo potrebbe essere quello di aggiungere (previo studio
meccanico) dei sensori idonei alla parte alta della banda di osservazione di
LOFAR (120-240 MHz).
Sfruttando anche le tecnologie in fase di studio per il progetto BEST
(realizzazione di un dimostratore per SKA, di cui si parlerà in seguito),
Capitolo 1 La stazione radioastronomica di Medicina
27
attualmente in corso (collegamenti ottici analogici, elaborazione digitale dei dati
tramite poly-phase filter bank ecc..), si collegherebbero i ricevitori alla stanza di
elaborazione dati e si effettuerebbe la prima elaborazione dati in vista della
successiva in ambito LOFAR.
Le ragioni di effettuare un’opera di questo genere sono tanto semplici quanto
valide: si riuscirebbe ad ottenere un’antenna da inserire nella rete LOFAR con
un’area efficace estremamente superiore a quella di ogni stazione remota, area che
potrebbe arrivare vicino all’intera area del ramo Est-Ovest (20000 m2). Ciò
consentirebbe un notevole salto in termini di prestazioni (in particolare in termini
di sensibilità dello strumento).
Lo sforzo tecnologico-logistico, anche in questo caso, risulterebbe minimo se
comparato ai risultati ottenibili, sia per i ricercatori italiani, che si troverebbero a
disposizione uno strumento dalle prestazioni considerevoli, sia per il consorzio,
che di colpo avrebbe in un unico strumento l’area efficace che normalmente
potrebbe ottenere con ben 20 stazioni.
La prima fase di upgrade ipotizzata è quella di illuminare 5000 m2 geometrici del
cilindro parabolico per mezzo del fuoco primario (efficienza stimata del 40%),
che corrisponde a sostituire 6 linee focali, per un totale di circa 110 m di linea.
Le suddette linee da smontare e rimpiazzare con i nuovi sistemi sarebbero quelle
più esterne dell’E-W escludendo la prima e l’ultima linea (3+3), per minimizzare
l’effetto di spill-over del terreno e avere fra i due gruppi la massima distanza, al
fine di ottenere la più lunga baseline possibile (fig. 1.20).
Fig. 1.20: foto del ramo E-W con indicazione delle linee focali da sostituire
Capitolo 1 La stazione radioastronomica di Medicina
28
In tal caso, considerando la dimensione dell’illuminatore pari a circa 60 cm, sul
totale delle nuove linee focali verrebbero installati fino a 220 sistemi
illuminatore + LNA + TX ottico + fibra.
Un’ulteriore considerazione, anch’essa di estrema rilevanza, va fatta a proposito
dell’eventualità di installare tanto la stazione remota LOFAR quanto la super-
station. Utilizzando singolarmente uno strumento come il ramo Est-Ovest adattato
alle frequenze di LOFAR, ci si aspetta di ottenere un fascio di puntamento
piuttosto grande (circa 10 arcmin a 150 MHz). In questo modo lo strumento da
solo non sarebbe in grado di operare per le applicazioni astrofisiche standard nel
range di frequenze di LOFAR. Al contrario, installando anche la stazione remota
LOFAR, opportunamente collocata, sarebbe possibile ottenere una baseline di
circa 1.5-2 Km, sufficiente a ottenere uno strumento complessivo in grado di
portare a importanti e sorprendenti nuove scoperte astronomiche. Quindi, da un
lato con il ramo Est-Ovest (avente una baseline ridotta del complesso), dall’altro
con una o due stazioni LOFAR distanziate di 2.5 Km dalla croce, si otterrebbe
uno strumento dalle potenzialità considerevoli con un’area efficace complessiva
di circa 22000 m2, che, per fare un confronto, sarebbe circa 3-4 volte più grande
del Synthesis Radio Telescope di Westerbork.
1.7 Il progetto SKA (Square Kilometer Array)
Negli ultimi decenni in molte nazioni sono sorte diverse discussioni su quale fosse
il logico sviluppo della radioastronomia dopo la costruzione del telescopio ALMA
(Atacama Large Millimeter Array).
E’ così emersa l’intenzione di sviluppare il progetto di un radiotelescopio in grado
di fornire un incremento di due ordini di grandezza in sensibilità rispetto agli
strumenti esistenti, per lunghezze d’onda dal metro al centimetro.
Per raggiungere questo scopo occorre un radiotelescopio con un’area collettrice
molto elevata, di circa un chilometro quadrato, ovvero cento volte maggiore di
quella del radiotelescopio VLA (Very Large Array) situato in New Mexico (fig.
1.21).
Capitolo 1 La stazione radioastronomica di Medicina
29
Fig. 1.21: Very Large Array (VLA)
Questo progetto, concepito dalla comunità radioastronomica mondiale, è
comunemente identificato con l’acronimo SKA (Square Kilometer Array, vedi []),
che pone l’accento proprio sull’area efficace che dovrà avere questo
radiotelescopio, cioè circa (1 Km)2.
Grazie alla maggiore sensibilità potranno essere ricevuti segnali molto più deboli,
cioè emessi da oggetti celesti più distanti o di minore intensità; uno degli obiettivi
di SKA sarà addirittura ricevere segnali provenienti da oggetti così lontani da
poter essere temporalmente collocati in un’età primordiale dell’universo,
rispondendo così a domande fondamentali sull’origine e l’espansione dello stesso.
Tali segnali sono molto deboli e dunque richiedono, per essere rilevati, un
telescopio molto sensibile e perciò di dimensioni enormi.
Per fornire un’apertura di un milione di metri quadrati ad un costo accettabile, la
tecnologia di SKA sarà rivoluzionaria rispetto a quella degli attuali radiotelescopi;
in questi anni i diversi istituti che concorrono al progetto stanno ideando e
realizzando prototipi, a partire dai quali saranno determinate anche le tecnologie
di base da utilizzare; l’inizio della costruzione dello Square Kilometre Array è
previsto per il 2014 e si pensa possa essere completamente operativo intorno al
2020.
Il concetto di SKA a cui si è giunti prevede la sua realizzazione tramite una
schiera interferometrica di stazioni-array (fig. 1.22), ciascuna delle quali è in
pratica una schiera di antenne elementari, tra le quali sarà distribuita l’area
Capitolo 1 La stazione radioastronomica di Medicina
30
collettrice dell’ordine del chilometro quadrato; sono allo studio diverse
configurazioni, che includono un diverso numero di stazioni: ad esempio 150
stazioni ognuna con area pari a quella di un telescopio di 30 m di diametro
oppure 30 stazioni, ognuna equivalente ad un telescopio del diametro di 200 m.
Una singola stazione-array potrà consistere di un numero più o meno elevato di
antenne, disposte su una superficie di 100-200 m di diametro. Il numero delle
stazioni-array richieste, almeno 100 ma possibilmente fino a 1000 più piccole,
dipenderà dai risultati degli studi sulle configurazioni delle antenne e dalle risorse
finanziarie disponibili.
Fig. 1.22: immagine realizzata al computer di come potrebbe apparire una stazione-array
Si ritiene che approssimativamente il 50% dell’area collettrice sarà fornita da una
densa schiera interna e centrale di circa 5 Km di diametro, per disporre di
un’elevatissima sensibilità su una risoluzione dell’ordine dell’arcosecondo, il che
renderà possibile lo studio di deboli tracce di righe spettrali di strutture risalenti
alle origini dell’universo. Un altro 25% dell’area collettrice sarà collocato in un
diametro di 150 Km, e la parte rimanente al di fuori di esso, fino a una distanza
dal centro di 3000 Km e più.
Questa elevata accuratezza nella risoluzione angolare permetterà la rilevazione di
deboli emissioni dal mezzo interstellare di lontane galassie, così come l’indagine
della superficie delle stelle e dei nuclei attivi delle galassie.
Per quanto riguarda la tecnologia realizzativa delle singole antenne, si stanno
considerando sia strutture planari, sia riflettori; in ogni caso, la scelta dovrà anche
consentire di applicare tecniche di multibeaming, ovvero di osservazione
Capitolo 1 La stazione radioastronomica di Medicina
31
simultanea in più direzioni di ampie porzioni di cielo, con la possibilità di
selezionare certi campi di vista in modo indipendente.
Il technical concept di SKA è attualmente in fase di studio presso l’ATNF
(Australia Telescope National Facility) e ci sono varie candidature a livello
mondiale per ospitare SKA, la più forte delle quali, sia per caratteristiche
geografiche favorevoli, sia per la presenza di molte zone ove lo spettro è
abbastanza libero da segnali di origine terrestre (fonte di forte disturbo per le
osservazioni radioastronomiche), è l’Australia (fig. 1.23).
Fig. 1.23: immagine dell’Australia con un possibile schema della dislocazione delle stazioni; il
nucleo centrale si trova collocato presso il sito di Mileura, a circa 300 Km dalla costa occidentale
Tra i progetti più validi per la realizzazione delle antenne si può citare quello
americano, che nasce dalla collaborazione tra il SETI Institute e il Laboratorio di
Radioastronomia dell’Università di Berkeley e che prende il nome di ATA (Allen
Telescope Array): esso prevede l’utilizzo di antenne di tipo gregoriano, disassate
o classiche, con un riflettore primario parabolico di 6.1 m di diametro e un
subriflettore secondario ellittico di 2.4 m (fig. 1.24).
Fig. 1.24: antenne utilizzate nel progetto ATA
Capitolo 1 La stazione radioastronomica di Medicina
32
Un’altra proposta di elevata importanza è quella olandese, sostenuta
dall’ASTRON (ASTronomisch Onderzolk in Nederland), che ha portato alla
realizzazione del Phased Array THEA (THousand Element Array), costituito da
1024 antenne di tipo Vivaldi, distribuite su una griglia regolare di 16 metri
quadrati (fig. 1.25).
Fig. 1.25: Thousand Element Array
Esso è organizzato secondo una gerarchia a due livelli di beamforming; la sua
struttura consente di lavorare ad una frequenza compresa tra 750 MHz e 1500
MHz e di avere beam multipli guidati in modo digitale.
I benefici legati alla realizzazione dello Square Kilometer Array, comunque, non
sono soltanto legati al mondo della radioastronomia; essendo esso un progetto
estremamente innovativo, SKA porta infatti con sé notevoli vantaggi dovuti alla
ricerca e allo sviluppo di nuove tecnologie di larga applicazione nel mondo delle
telecomunicazioni, nell’information technology e nei settori attigui.
1.7.1 La “Croce del Nord” e SKA L’Istituto di RadioAstronomia costituisce uno degli organi istituzionali che
collaborano al progetto SKA.
Capitolo 1 La stazione radioastronomica di Medicina
33
Date le sue grandi dimensioni (564 m x 640 m) e l’elevato numero di dipoli
(5632) posti sulla sua linea focale, la “Croce del Nord” rappresenta il banco di
prova ideale per le tecnologie che dovranno essere sviluppate nell’ambito del
progetto SKA; avendo infatti un’area collettrice pari a circa quella di una
sottostazione SKA, può essere considerata come un “reduced scale SKA” ed
utilizzata per investigare molti punti cruciali nella definizione del progetto.
A questo proposito è attualmente sotto studio un upgrade globale della Croce, che
consenta di acquisire utile esperienza nel progetto di ricevitori a basso costo, nella
realizzazione di beamforming analogico e digitale e di multibeaming, nella
mitigazione delle interferenze e nella trasmissione di dati su fibra ottica, tutte
caratteristiche essenziali in un radiotelescopio di ultima generazione quale è
quello del progetto SKA.
Il primo passo di questo progetto consiste nell’implementare diverse centinaia di
ricevitori solo sul ramo Nord-Sud; in un secondo momento ne verranno installati
un certo numero anche sulla linea focale del ramo Est-Ovest.
Prima dell’upgrade complessivo, è attualmente allo studio un progetto di re-
ingegnerizzazione della “Croce del Nord” per trasformarla in un vero e proprio
dimostratore per SKA, che ha preso il nome di BEST (Basic Element for SKA
Training) e si suddivide in tre fasi:
BEST-1: prevede la re-ingegnerizzazione di un cilindro parabolico del
ramo Nord-Sud della “Croce del Nord”, tramite l’installazione di 4 Front
End sulla linea focale (1 ogni 16 dipoli) connessi via collegamenti ottici
analogici alla sala di elaborazione dati, dove il segnale verrà convertito ad
una frequenza media di 30 MHz, digitalizzato e filtrato tramite un banco di
filtri polifase implementato grazie ad una FPGA. L’elaborazione dei dati
così ottenuti avverrà in un cluster di PC. In questo modo sarà possibile
testare tecniche di beamforming e mitigazione delle interferenze (fig. 1.26)
BEST-2: prevede l’estensione del progetto a 8 cilindri del ramo Nord-Sud
per un totale di 32 ricevitori installati (fig. 1.27)
Capitolo 1 La stazione radioastronomica di Medicina
34
BEST-3: prevede l’installazione di 4 ricevitori su 14 cilindri del ramo
Nord-Sud e di 4 su 6 segmenti del ramo Est-Ovest, per un totale di 4×14
+ 4×6 = 80 ricevitori complessivi (fig. 1.28).
Fig. 1.26: schema di implementazione del progetto BEST-1
Fig. 1.27: schema di implementazione del progetto BEST-2
BEST-1
BEST-2
Capitolo 1 La stazione radioastronomica di Medicina
35
Fig. 1.28: schema di implementazione del progetto BEST-3
BEST-1
I 64 dipoli situati sulla linea focale del cilindro parabolico del sistema
sperimentale BEST-1 (fig. 1.29) non hanno subito modifiche; inoltre è stata
conservata la struttura originale (in guida cava) che realizza il raggruppamento dei
segnali.
Fig. 1.29: la linea focale con i 64 dipoli viene preparata per l’installazione dei LNA
Capitolo 1 La stazione radioastronomica di Medicina
36
I dipoli sono pertanto raggruppati a gruppi di 16, dando così origine ad un array di
sole 4 antenne spaziate di 8λ.
Come verrà illustrato in maniera approfondita nell’Appendice A, questa notevole
spaziatura tra i sensori genera problemi di non poco conto (equivocazione
spaziale con conseguenti lobi di grating) che rendono talune tecniche, ritenute
tradizionali nella teoria dell’array signal processing, difficili se non addirittura
impossibili da impiegare. A tal proposito si sta valutando la possibilità di adottare
una configurazione leggermente diversa: 8 antenne da 8 dipoli ciascuna con
spaziatura reciproca ridotta (4λ). Sebbene la situazione migliorerebbe dal punto di
vista del beamforming, si avrebbero anche una serie di svantaggi: un notevole
incremento dei costi in quanto occorrerebbe modificare la meccanica della guida
cava, un minor guadagno nei confronti del segnale radioastronomico (8 dipoli
anziché 16), una maggiore complessità hardware ed un maggiore afflusso di dati
da gestire.
I 4 segnali vengono immediatamente amplificati con dei LNA (Low Noise
Amplifier, vedi fig. 1.30) posti direttamente lungo la linea focale.
Fig. 1.30: uno dei 4 LNA di BEST-1. Questi amplificatori sono stati progettati e costruiti presso
l’Istituto di RadioAstronomia
Capitolo 1 La stazione radioastronomica di Medicina
37
Una volta amplificati, i segnali RF vengono trasportati direttamente nella stanza
del ricevitore mediante un link analogico in fibra ottica (Fig. 1.31).
Fig. 1.31: i 4 ricevitori analogici in fibra ottica ed i 4 mixer utilizzati per la conversione dei segnali
a frequenza intermedia
Il motivo di questa scelta risiede nella necessità di semplificare quanto più
possibile l’elettronica esterna, riducendo le probabilità di guasto e facilitando
l’assemblaggio e la manutenzione dell’impianto.
Diversamente sarebbe stato necessario dotare i singoli front-end di un oscillatore
locale (comune a tutti i mixer di conversione, per avere la coerenza di fase
necessaria al beamforming) ed, eventualmente, di stadi ADC (Analog to Digital
Converter) esterni per una trasmissione digitale. In questo modo, invece, nella
stanza di elaborazione giungono direttamente i segnali in banda base provenienti
dai 4 amplificatori, con perdite di trasmissione ridotte rispetto alla trasmissione su
cavo coassiale.
In seguito i segnali vengono convertiti ad una frequenza intermedia di 30 MHz,
per essere poi in parte elaborati dal sistema originario ed in parte campionati ad 80
MS/s da un nuovo sistema di acquisizione digitale (fig. 1.32), composto da 4 ADC
da 14 bit AD6645 (Analog Devices) e 4 DDC (Digital Down Converter) AD6634.
Capitolo 1 La stazione radioastronomica di Medicina
38
Fig. 1.32: Le evaluation board di Analog Device utilizzate per provare gli ADC ed i DDC
Questi ultimi effettuano una conversione digitale della banda utile nell’intorno
della frequenza nulla. Il segnale diviene così di natura complessa e, pertanto,
all’uscita ne vengono fornite le componenti in fase ed in quadratura I e Q. Inoltre i
DDC provvedono ad effettuare un filtraggio ed una decimazione del segnale
acquisito (fig. 1.33).
Fig. 1.33: schema a blocchi dello stadio DDC. Il segnale digitale viene demodulato numericamente
mediante un oscillatore numerico (NCO), il quale provvede a fornirne le componenti in fase ed in
quadratura. Segue un filtro passa-basso (LPF) ed un decimatore (↓M).
Capitolo 1 La stazione radioastronomica di Medicina
39
Il flusso dati viene acquisito mediante una scheda PCI7300A installata all’interno
di un calcolatore Xeon multiprocessore e, da questo punto in poi, ogni trattamento
del segnale viene condotto per via software.
E’ probabile che in futuro vengano installati sul front-end (in prossimità degli
LNA) dei phase shifters, allo scopo di sostituire il vecchio sistema di rifasamento
a kerosene adottato dalla “Croce del Nord” (vedi paragrafo 1.4) e consentire
contemporaneamente un beamforming a livello RF.
Si ritiene che l’upgrade, a cui verrà sottoposta la Croce, porterà quest’ultima ad un
livello operativo attualmente unico nell’osservazione radioastronomica a bassa
frequenza, e la farà diventare un punto fermo per la ricerca orientata a SKA;
verranno seguiti due filoni: da un lato saranno sfruttate le tecnologie già testate
per il progetto BEST per studiare algoritmi di mitigazione delle interferenze e
tecniche di beamforming, e dall’altro verranno ricercate nuove tecnologie a basso
costo che possano essere utilizzate nello SKA finale.
Poiché SKA è pensato per dare importanti risposte all’astrofisica di oggi e di
domani, si cerca di fare in modo che questa attività di sviluppo venga realizzata
attraverso la più vasta collaborazione possibile con altri istituti di ricerca
astrofisica internazionali e con le Università italiane ed estere, coinvolgendo
anche il settore industriale.
Capitolo 1 La stazione radioastronomica di Medicina
40
1.8 La tesi
Un aspetto di primaria importanza per entrambi i progetti (LOFAR e SKA) è
rappresentato dalle tecniche di beamforming e di mitigazione delle interferenze.
I segnali che si vogliono osservare in radioastronomia sono meno potenti di molti
ordini di grandezza rispetto a qualsiasi segnale di origine terrestre.
Ciò fa sì che anche segnali raccolti dai lobi secondari delle antenne, armoniche di
ordine superiore, intermodulazioni e quant’altro possa capitare alle frequenze di
un radiotelescopio, possano causare gravi danni all’osservazione, fino ad
invalidarla completamente. Tutto ciò era già fonte di problemi quando
generalmente si osservava a frequenze in bande riservate alla radioastronomia.
Le cose peggioreranno molto, da adesso in avanti, dal momento che, allargando
enormemente lo spettro di lavoro, si entrerà inevitabilmente “in casa d’altri”,
andando a scontrarsi con le moltitudini di segnali trasmessi dall’uomo (radio FM,
televisioni, ponti radio, radar ecc.). Allargare il range di frequenze di
osservazione è estremamente importante per un radioastronomo, perché gli
consente sia di poter effettuare un maggior numero di ricerche (in ambito
cosmologico significa caratterizzare la storia dell’universo), sia di ottenere una
migliore sensibilità dello strumento. Il tentativo sarebbe futile se non fossero state
concepite tecniche di mitigazione o annullamento dei segnali indesiderati.
Argomento già di estremo interesse in ambiti commerciali, come quello della
telefonia cellulare, diventa di primaria importanza in campo radioastronomico.
Il lavoro di questa tesi si inserisce proprio in questo contesto applicativo:
analizzare dal punto di vista teorico e poi testare sul campo algoritmi di
beamforming e tecniche di mitigazione, avendo a disposizione uno strumento
estremamente adatto a tal proposito come il radiotelescopio “Croce del Nord”.
In questo modo sarà possibile verificarne la validità in un ambiente decisamente
ostile e difficile, in modo da svilupparli verso un funzionamento ottimo.
Disporre di un numero così elevato di ricevitori rappresenta un ottimo banco di
prova per le tecniche di beamforming, ovvero le tecniche che consentono di
orientare il fascio di puntamento di una schiera di antenne, in modo tale da
Capitolo 1 La stazione radioastronomica di Medicina
41
posizionare, quando possibile, i nulli di ricezione in corrispondenza delle direzioni
da cui sono ricevuti i segnali interferenti (in maniera sia deterministica, quando la
statistica dei segnali sia nota a priori, che adattativa, quando invece non lo sia).
In pratica sono tecniche di filtraggio spaziale. E’ necessario implementare questi
algoritmi, testarli sul campo, verificarne l’efficacia pratica in ambito radio
astronomico ed eventualmente apportare delle modifiche per migliorarne il
funzionamento.
Lo stesso discorso può essere ripetuto per quanto riguarda le tecniche di
mitigazione delle interferenze, tecniche che entrano in gioco quando il
beamforming non possa da solo eliminare il problema dei segnali indesiderati.
Ne esistono di vari tipi; in ambito radioastronomico non esiste un metodo
universalmente adottabile: le tecniche diventano più o meno efficaci a seconda
della tipologia di osservazione. Anche questi metodi sono ancora da verificare sul
campo in questo tipo di applicazioni.
CAPITOLO 2
METODI DI BEAMFORMING
2.1 Generalità
Per introdurre efficacemente il concetto di beamforming, è opportuno descrivere
lo scenario in cui si trovano a dover lavorare gli apparati di ricezione nella
maggior parte delle applicazioni dei tradizionali sistemi di telecomunicazione
(comunicazioni radiomobili, sistemi radar, comunicazioni satellitari, ecc…), e
che coinvolge, in particolare, anche il mondo della radioastronomia.
Spesso, infatti, si è di fronte alla situazione in cui una molteplicità di segnali,
provenienti da direzioni spaziali distinte, ma sovrapposti tra loro sia nel tempo che
nella frequenza, viene ricevuta da una schiera (array) di sensori. L’obiettivo
naturalmente è stimare, il più accuratamente possibile, un determinato segnale
proveniente da una certa direzione dello spazio (segnale di interesse), il quale però
è immerso in vari segnali interferenti e nel rumore (fig. 2.1).
Fig 2.1: due segnali incidenti sull’array di sensori che provengono da direzioni diverse
Capitolo 2 Metodi di beamforming
44
Quando il segnale desiderato ed i segnali interferenti occupano
contemporaneamente la stessa banda di frequenze, non è certamente possibile
sfruttare il solo filtraggio temporale per isolare il segnale utile; tuttavia, dal
momento che il segnale voluto e quelli interferenti hanno solitamente origine da
regioni spaziali differenti, questa diversità spaziale può essere sfruttata per il
sopra citato scopo, utilizzando in questo modo un filtro spaziale in ricezione.
Con il termine beamforming si indica quindi la tecnica mediante la quale si
realizza di fatto una forma versatile di filtraggio spaziale, per separare segnali che
si sovrappongono spettralmente ma che provengono da direzioni diverse dello
spazio. La parola beamforming deriva dal fatto che, in origine, i filtri spaziali
venivano progettati per generare dei pencil beams, cioè dei diagrammi di
radiazione che ricevessero nel miglior modo possibile il segnale irradiato da un
punto specifico dello spazio, ed attenuassero il più possibile eventuali segnali
provenienti da altri punti (fig. 2.2).
Fig. 2.2: apertura spaziale continua di un’antenna a riflettore parabolico e relativo diagramma di
radiazione (di tipo “pencil beam”)
Anche se nella definizione precedente di beamforming si faceva riferimento
all’applicazione di questa tecnica solamente nell’ambito della ricezione dei
segnali, in realtà essa, come si può intuire dal nome stesso, può essere
equivalentemente definita per la trasmissione; in seguito, comunque, si parlerà
esclusivamente di beamforming come metodo di realizzazione del filtraggio
spaziale in ricezione.
Capitolo 2 Metodi di beamforming
45
Occorre a questo punto fare un’ulteriore precisazione: un beamformer è, in
generale, un sistema utilizzato in combinazione con una schiera di sensori che,
come si è detto, compie un filtraggio di tipo spaziale e può essere, a seconda di
come viene implementato, digitale o analogico; in questa trattazione ci si
occuperà solo di beamformers digitali.
Se da una parte l’implementazione di un filtro temporale richiede l’elaborazione
dei dati raccolti in una finestra temporale, dall’altra, in maniera del tutto analoga,
l’implementazione di un filtro spaziale richiede l’elaborazione dei dati raccolti in
una finestra spaziale.
Il sistema costituito dalla combinazione tra array di sensori e beamformer
presenta due vantaggi molto importanti, di cui verrà dato un breve accenno di
seguito.
E’ noto che la capacità di risoluzione spaziale di un’antenna migliora al crescere
delle dimensioni della sua apertura spaziale, in rapporto alla lunghezza d’onda.
Un’antenna singola (apertura spaziale continua), capace di fornire la richiesta
risoluzione, viene generalmente impiegata solo per frequenze molto elevate, dove
le lunghezze d’onda in gioco risultano essere sufficientemente piccole. Mentre,
quando si è interessati a segnali con frequenze minori, una schiera di sensori
riesce spesso a sintetizzare meglio un’apertura spaziale.
Un secondo grande vantaggio, questa volta valido ad ogni frequenza, è la
versatilità del filtraggio spaziale offerta dal campionamento spaziale discreto.
In molti settori applicativi è spesso necessario aggiornare la funzione di filtraggio
spaziale in tempo reale per mantenere efficace la soppressione dei segnali
interferenti. Questo aggiornamento può essere implementato facilmente in un
sistema campionato discretamente, cambiando semplicemente il modo in cui il
beamformer combina linearmente i dati provenienti dai sensori.
Non è invece possibile modificare la funzione di filtraggio spaziale di un’antenna
ad apertura continua.
Capitolo 2 Metodi di beamforming
46
2.2 Beamforming come filtraggio spaziale
Si consideri ora un generico beamformer tipicamente utilizzato per l’elaborazione
dei segnali a banda stretta, schematizzato in fig. 2.3.
Fig. 2.3: beamformer a banda stretta
L’array di sensori effettua un campionamento spaziale discreto dell’onda
incidente, producendo l’insieme [x1(k), x2(k), …, xN(k)] di dati provenienti dagli N
sensori all’istante temporale k. Questi campioni (spaziali) vengono poi combinati
linearmente dal beamformer, secondo i coefficienti ∗nw , ad ogni istante di tempo,
per cui l’uscita y risulta essere:
)(1
kxwy(k) n
N
nn∑
=
∗= (2.1)
dove (*) rappresenta l’operatore complesso coniugato. Sia i coefficienti sia i dati
sono numeri complessi, in quanto per ogni sensore viene utilizzato un ricevitore
in quadratura (demodulazione IQ).
Un classico beamformer tipicamente impiegato in presenza di segnali a larga
banda effettua un campionamento sia nello spazio che nel tempo (fig.2.4).
Capitolo 2 Metodi di beamforming
47
Fig. 2.4: beamformer a banda larga
In questo caso l’uscita y può essere espressa come:
)k(xw)k(y n
N
1n
1J
0,n ξ
ξξ −= ∑∑
=
−
=
∗ (2.2)
dove J-1 è il numero di blocchi di ritardo presenti in ognuno degli N sensori
(canali).
Dal momento che il segnale proveniente da ogni sensore altro non è che un
ingresso del beamformer, quest’ultimo può essere classificato come sistema
MISO (Multi Input Single Output).
E’ possibile riscrivere sia la 2.1 che la 2.2 in forma compatta:
)()( kky xw H= (2.3)
purché si definisca opportunamente un vettore dei coefficienti (pesi) w ed un
vettore di dati x(k).
Capitolo 2 Metodi di beamforming
48
Con H si indica l’operatore hermitiano (trasposto coniugato). Supponendo che w
e x(k) siano D-dimensionali, si ha che D = N quando ci si riferisce alla 2.1,
mentre D = N · J quando ci si riferisce alla 2.2.
Da qui in avanti l’indice temporale k verrà sottinteso, di conseguenza la 2.3 può
essere riscritta nella forma:
(2.4)
Molte delle tecniche di beamforming che verranno descritte in questo capitolo
sono applicabili, infatti, sia al caso tempo-continuo che al caso tempo-discreto.
Risulta naturale, a questo punto, domandarsi se esiste una relazione tra il
beamforming ed il ben noto filtraggio FIR (Finite Impulse Response).
Si ricordi che la risposta in frequenza di un filtro FIR, con coefficienti ∗nw per
Nn ≤≤1 ed un ritardo di T secondi per coefficiente, è data da:
)1(
1
*)( −−
=∑= nTj
N
nnewr ωω (2.5)
che in forma compatta diventa:
)()( ωω dw H=r (2.6)
dove
(2.7)
e
HTNjTjTj eee ]...1[)( )1()2()( ωωωω −=d (2.8)
xw H=y
]...[ **2
*1 Nwww=Hw
Capitolo 2 Metodi di beamforming
49
)(ωr rappresenta la risposta del filtro ad una sinusoide complessa di frequenza ω
mentre )(ωd è un vettore che descrive la fase della sinusoide complessa ad ogni
presa del filtro FIR, rispetto alla fase del coefficiente w1, che viene dunque
considerata come riferimento.
La risposta del beamformer alla sollecitazione di un’onda piana, d’altra parte, è
funzione della frequenza e della posizione dell’array rispetto alla sorgente
dell’onda. La posizione, in genere, è una grandezza tridimensionale, ma spesso si
ha a che fare con direzioni di arrivo (DOA, Direction Of Arrival: grandezza
angolare che esprime la direzione di provenienza di un segnale) di una o due
dimensioni; inoltre in questa trattazione non si terrà mai conto della distanza tra
array e sorgente.
Si assuma che il segnale incidente sull’array di sensori sia un’onda piana
complessa, con DOA θ e frequenza ω. Si prenda come riferimento a fase nulla il
segnale sul primo sensore. Questo implica che:
kj
1 e)k(x ω= (2.9)
Mentre:
[ ])(kj
nne)k(x θ∆ω −= (2.10)
per Nn2 ≤≤ . ∆n(θ ) rappresenta il ritardo temporale dovuto alla propagazione tra
il primo sensore e l’n-esimo.
Sostituendo rispettivamente nella 2.1 e nella 2.2, all’uscita del beamformer risulta
),(reewe)k(y kjN
1n
)(jn
kj n ωθωθ∆ωω == ∑=
−∗ (2.11)
[ ] ),(reewe)k(y kjN
1n
1J
0
)(j,n
kj n ωθω
ξ
ξθ∆ωξ
ω == ∑∑=
−
=
+−∗ (2.12)
Capitolo 2 Metodi di beamforming
50
dove in entrambi i casi ∆1(θ )=0. r(θ,ω) è la risposta del beamformer e può essere
espressa comodamente in forma vettoriale come:
),(),(r ωθωθ dw H= (2.13)
Gli elementi del vettore d(θ,ω) corrispondono, rispettivamente, agli esponenziali
complessi )(jne θ∆ω− (nella 2.11) e [ ]ξθ∆ω +− )(j ne (nella 2.12), che in genere hanno la
forma:
H)(j)(j)(j D32 eee1),( ][ θωτθωτθωτωθ K=d ( 2.14)
dove i τi(θ), per Di2 ≤≤ sono i ritardi temporali dovuti alla propagazione.
d(θ,ω) è il vettore risposta dell’array, denominato steering vector o vettore
direzionale.
Le caratteristiche non ideali dei sensori possono essere inglobate in d(θ,ω),
moltiplicando ogni salto di fase per una funzione ai(θ,ω) che descriva la risposta
del sensore associato, in funzione della direzione e della frequenza temporale.
E’ possibile definire il beampattern come:
2),(r ωθ (2.15)
Si osservi che ogni coefficiente di w incide sia sulla risposta temporale che su
quella spaziale del beamformer.
Esiste dunque una forte analogia tra un beamformer ed un filtro FIR: il primo
combina linearmente le sequenze temporali in uscita da ogni sensore (derivanti
dal campionamento spaziale) per ottenere in uscita una nuova sequenza
(temporale); il secondo combina linearmente i campioni temporali al suo ingresso.
Tuttavia la corrispondenza tra filtraggio FIR e beamforming è esatta solo quando
il beamformer è di tipo a banda stretta (opera ad una singola frequenza ω0), i
Capitolo 2 Metodi di beamforming
51
sensori sono omnidirezionali (non privilegiano nessuna direzione) e la geometria
dell’array è lineare ed equispaziata (fig. 2.5).
Fig. 2.5: illustrazione della corrispondenza tra un filtro FIR (a) ed un array lineare, equispaziato
con beamformer omnidirezionale e a banda stretta (b)
Ci si può rendere conto di questo anche intuitivamente: un’onda piana, che incide
sui sensori dell’array, risulta sfasata progressivamente (e in egual misura)
all’ingresso di ciascun moltiplicatore del beamformer, così come l’onda ricevuta
dal filtro FIR viene ritardata mano a mano che attraversa le linee di ritardo z-1.
Si consideri un array lineare; sia d la distanza reciproca tra i sensori, c la velocità
di propagazione e θ la DOA del segnale rispetto al versore normale alla direzione
di allineamento dei sensori.
(b)
(a)
Capitolo 2 Metodi di beamforming
52
Si ha che:
)sin(cd)1n()(n θθτ −= (2.16)
In questo caso identifichiamo la relazione tra la frequenza temporale ω in d(ω)
(filtro FIR) e la direzione d’ arrivo θ in d(θ,ω0) (beamformer) in:
)sin(cd
0 θωω = (2.17)
Pertanto la frequenza temporale in un filtro FIR corrisponde al seno della
direzione in un beamformer lineare, equispaziato e a banda stretta. Una completa
corrispondenza tra beamforming e metodi di filtraggio FIR è possibile solo per
questo caso particolare, definita la corrispondenza tra frequenza e direzione.
Esistono inoltre vari elementi che differenziano lo studio del filtraggio spaziale
attraverso la tecnica del beamforming dallo studio del filtraggio temporale FIR.
Per esempio, nel beamforming una sorgente di energia ha diversi parametri che la
possono caratterizzare: distanza, angoli di azimuth ed elevazione, polarizzazione,
contenuto spettrale. Segnali differenti, in genere, sono mutuamente correlati a
causa della propagazione a cammini multipli. Il campionamento spaziale è spesso
non uniforme e multidimensionale. Per di più bisogna includere incertezza nella
caratterizzazione della posizione e risposta dei singoli sensori. Queste
considerazioni portano a sviluppare tecniche robuste di beamforming e tecniche
di calibrazione degli array.
La notazione vettoriale introdotta nella 2.13 suggerisce un’interpretazione
geometrica per il beamforming; questo punto di vista è utile sia per l’analisi che
per la sintesi. Il vettore dei coefficienti w ed il vettore risposta dell’array d(θ,ω)
sono contenuti in uno spazio D-dimensionale. Gli angoli tra w e d(θ,ω)
determinano la risposta r(θ,ω). Per esempio, se per alcuni valori di (θ,ω) l’angolo
tra w e d(θ,ω) è 90° (cioè w risulta ortogonale a d(θ,ω)), allora la risposta è nulla.
Capitolo 2 Metodi di beamforming
53
Se l’angolo invece è prossimo a 0°, allora il modulo della risposta sarà
relativamente grande. L’abilità di risolvere spazialmente sorgenti a diverse
posizioni e/o frequenze, per esempio (θ1,ω1) e (θ2,ω2), dipende dall’angolo tra i
vettori risposta, d(θ1,ω1) e d(θ2,ω2).
L’equivocazione spaziale corrisponde ad una ambiguità nelle posizioni delle
sorgenti. Questo vuol dire che sorgenti a posizioni diverse generano lo stesso
vettore di risposta dell’array, cioè per sorgenti a banda stretta si ha:
d(θ1,ω0) = d(θ2,ω0) (2.18)
Questo può succedere se i sensori vengono posizionati ad una distanza reciproca
troppo elevata. D’altra parte, se i sensori sono troppo vicini, viene meno la
risoluzione spaziale per la minore apertura che ne consegue, il che equivale a dire
che i vettori risposta non sono ben distribuiti nello spazio vettoriale a
D-dimensioni. Un altro tipo di ambiguità si ha per segnali a banda larga, quando
una sorgente ad una certa posizione/frequenza non può essere distinta da una
sorgente a posizione/frequenza diversa, cioè quando:
d(θ1,ω1) = d(θ2,ω2) (2.19)
In un array lineare ed equispaziato, ad esempio, questo capita ogni qualvolta si ha:
ω1sin(θ1) = ω2 sin(θ2) (2.20)
Questa particolare ambiguità può essere risolta andando a considerare anche altri
campioni temporali.
Un punto fondamentale di questa trattazione è la sintesi della risposta del sistema
array di sensori e beamformer mediante la scelta di opportuni coefficienti,
sebbene la 2.13 affermi che la risposta è anche una funzione della geometria della
schiera considerata (e delle caratteristiche del sensore, qualora non sia più valido
il modello a sensore omnidirezionale ideale).
Capitolo 2 Metodi di beamforming
54
A differenza del filtraggio a canale unico dove i convertitori A/D forniscono un
campionamento uniforme nel tempo, non c’è una motivazione particolare per
pensare ad uno spaziamento uniforme tra i sensori. Anzi l’allocazione dei sensori
fornisce un ulteriore grado di libertà nella sintesi della risposta desiderata e può
essere sfruttata in modo tale che, in un range (θ,ω) di interesse, i vettori risposta
dell’array non siano ambigui e siano ben distribuiti nello spazio vettoriale
D-dimensionale. Lo sfruttamento di questo grado di libertà può diventare
complicato a causa della natura multidimensionale del campionamento spaziale e
della relazione non lineare tra r(θ,ω) e le posizioni dei sensori.
2.3 Operatori statistici del secondo ordine: richiami
La valutazione delle prestazioni di un beamformer generalmente coinvolge la
potenza o la varianza, pertanto gli operatori statistici del secondo ordine giocano
un ruolo fondamentale.
Si supponga, senza perdere di generalità, che i dati forniti dai sensori siano a
media nulla. La varianza (o potenza attesa) all’uscita del beamformer è data da:
[ ] [ ]wxxw HH EyE 2 = (2.21)
Se i dati sono stazionari in senso lato, la matrice di covarianza
[ ]Hx xxR E= (2.22)
è indipendente dal tempo.
Sebbene nella pratica si abbia frequentemente a che fare con fenomeni non
stazionari, l’ipotesi di stazionarietà in senso lato viene spesso adottata per
sviluppare beamformers ottimi in senso statistico (si veda a tal proposito il
paragrafo 2.7).
Capitolo 2 Metodi di beamforming
55
Si supponga che x rappresenti una sequenza di valori campionati uniformemente
nel tempo, avente densità spettrale di potenza S(ω) e che tale densità sia nulla
oltre la banda [ωa , ωb]. Rx può essere espressa in funzione della densità spettrale
di potenza dei dati mediante la trasformata di Fourier:
∫=b
a
d)()()(S21 ω
ω
ωωωωπ
Hx ddR (2.23)
con d(ω) definito come nella 2.8.
Supponendo che il vettore di dati x sia quello generato da una sorgente posta in
direzione θ, in modo analogo alle sequenze temporali possiamo ricavare la
matrice di covarianza del vettore di dati come:
∫=b
a
d),(),()(S21 ω
ω
ωωθωθωπ
Hx ddR (2.24)
Una sorgente si dice a banda stretta (e a frequenza ω0) se Rx può essere riscritta
come:
),(),( 002s ωθωθσ H
x ddR = (2.25)
dove 2sσ è la varianza (o la potenza) della sorgente.
Le condizioni sotto le quali una sorgente può essere considerata a banda stretta o
meno dipendono sia dalla banda della sorgente sia dalla durata temporale
dell’osservazione. Se l’estensione spettrale del segnale è piccola in rapporto alla
frequenza centrale (cioè se ha una banda relativa stretta) e gli intervalli temporali
nei quali il segnale viene osservato sono brevi rispetto all’inverso della banda del
segnale, ogni forma d’onda osservata avrà l’andamento di una sinusoide. Si
osservi che, se l’intervallo di osservazione temporale viene aumentato, la banda
del segnale deve diminuire per conservare l’aspetto sinusoidale.
Capitolo 2 Metodi di beamforming
56
Ne risulta che il prodotto tempo-banda (TBWP, Time BandWidth Product) è il
parametro fondamentale per capire quando una sorgente può essere considerata a
banda stretta o meno.
Un array fornisce un’efficace apertura temporale nella quale la sorgente viene
osservata. Chiaramente il TBWP dipende dalla DOA della sorgente. Un array
viene considerato a banda stretta (relativamente alle caratteristiche spettrali del
segnale proveniente da una sorgente) se la sorgente può considerarsi a banda
stretta per ogni sua possibile direzione di provenienza.
Il beamforming a banda stretta è concettualmente più semplice di quello a banda
larga, dal momento che è possibile ignorare la variabile frequenza temporale.
Questo fatto, in aggiunta all’interesse di certe applicazioni per la frequenza
temporale, ha motivato l’implementazione di beamformers a larga banda con una
struttura a scomposizione in sottobande, come illustrato in figura 2.6.
Fig. 2.6: schema di una possibile realizzazione di beamforming nel dominio delle frequenze (usato
per lo più quando si ha a che fare con segnali a larga banda).
La scomposizione in sottobande viene spesso realizzata prendendo la trasformata
discreta di Fourier (DFT) dei dati in uscita dai sensori.
Per ogni frequenza di interesse i dati dell’array vengono processati dal
beamformer corrispondente. Questo metodo viene spesso chiamato beamforming
in frequenza. Le uscite del beamformer in frequenza possono essere pensate
equivalenti alla DFT dell’uscita del beamformer a larga banda, schematizzato in
Capitolo 2 Metodi di beamforming
57
fig. 2.4, mediante una scelta opportuna dei coefficienti ed un’attenta ripartizione
dei dati. Questa equivalenza corrisponde all’implementazione dei filtri FIR
mediante convoluzione circolare con la DFT.
2.4 Classificazione dei beamformers
I beamformers possono essere classificati in base al criterio con cui vengono
calcolati i coefficienti w complessi. Si possono distinguere due grandi categorie:
• beamformers data-independent
• beamformers ottimi in senso statistico
In un beamformer data-independent i coefficienti non dipendono dai dati e
vengono scelti per presentare a priori una risposta dell’array all’intero scenario di
segnale + interferenze.
In un beamformer ottimo in senso statistico, invece, i coefficienti vengono scelti
in base alla statistica dei dati ricevuti, cercando di ottimizzare la risposta
dell’array. In genere un beamformer ad ottimo statistico piazza gli zeri della
funzione d(θ,ω) in direzione delle sorgenti di interferenze, nel tentativo di
massimizzare il rapporto segnale/rumore alla sua uscita.
Le tecniche di sintesi dei beamformers data-independent vengono poi spesso
usate nell’ambito del beamforming ad ottimo statistico.
In genere non è nota la statistica della sequenza dei dati ed oltretutto questa può
cambiare nel tempo, per cui, tipicamente, si impiegano algoritmi adattativi per la
scelta dei coefficienti.
L’algoritmo adattativo viene progettato affinché la risposta del beamformer
converga ad una soluzione statisticamente ottima.
I beamformers parzialmente adattativi riescono a ridurre il carico computazionale
degli algoritmi adattativi, a spese di una (piccola) perdita di ottimalità statistica.
Capitolo 2 Metodi di beamforming
58
2.5 Beamforming data-independent
In un beamformer data-independent i coefficienti vengono scelti affinché la
risposta del beamformer approssimi una risposta desiderata nota a priori,
indipendentemente dalla sequenza di dati o dalla statistica degli stessi. Questo
obiettivo progettuale è lo stesso che si incontra nella progettazione classica dei
filtri FIR. La prima parte di questo paragrafo tratta la costruzione di beams in
senso classico, cioè approssimando una risposta massima nella direzione
desiderata e nulla altrove; nella seconda parte vengono poi presentati metodi più
generali per la progettazione di beamformers aventi forme di risposta desiderata
del tutto arbitrarie. Entrambi i metodi che verranno presentati hanno il pregio di
adattarsi abbastanza bene alle applicazioni radioastronomiche, ma hanno come
grave difetto il fatto di consentire la realizzazione di beamformers solamente di
tipo deterministico: possono cioè essere utilizzati con buoni risultati solamente in
scenari statici, ossia quando si conoscono le direzioni di arrivo dei segnali e
queste sono fisse.
2.5.1 Beamforming classico Si consideri il problema di separare un segnale proveniente da una certa direzione
nota θ0 dagli altri segnali ricevuti. Se si suppone che il segnale sia a banda stretta
(a frequenza ω0), la risposta desiderata (idealmente) è unitaria per (θ0 , ω0) mentre
è nulla altrove. Una soluzione comune a questo problema consiste nel prendere il
vettore risposta dell’array d(θ0 , ω0) come vettore w. Si può dimostrare che questa
è la scelta ottima in termini di minimizzazione dell’errore quadratico tra la
risposta effettiva e quella ideale. La risposta effettiva è caratterizzata da un lobo
principale (main lobe), detto anche beam, e da molti lobi secondari (sidelobes).
Essa, in generale, è tanto migliore quanto più stretto è il beam e quanto più basso
è il livello dei lobi secondari.
L’array/beamformer che ne risulta viene detto array rifasato, dal momento che
l’uscita di ogni sensore viene sfasata prima della somma.
Capitolo 2 Metodi di beamforming
59
Dal momento che:
),( 00 ωθdw = (2.26)
ciascun elemento di w ha modulo unitario.
Di conseguenza è possibile finestrare il vettore w (modificando le ampiezze dei
suoi elementi) per ottenere il migliore compromesso tra i livelli del lobo
principale e dei lobi laterali; tuttavia questa operazione porta inevitabilmente ad
una certa perdita di risoluzione, riscontrabile da un lieve allargamento del beam.
In figura 2.7 viene mostrato come il finestramento può essere sfruttato per
controllare la forma della risposta del beamformer: a sinistra viene riportato un
esempio di beamformer a banda stretta ottenuto con un angolo di puntamento
elettronico del fascio pari a –50°; a destra è presente invece la risposta di un
beamformer a banda stretta puntato a +20° con finestramento di Hamming; in
entrambi i casi si sono considerati 16 sensori ideali omnidirezionali ed
equispaziati di λ/2, inoltre la frequenza temporale di funzionamento è stata fissata
a 400 MHz. Si noti come siano stati notevolmente abbassati e “livellati” i lobi
secondari grazie al finestramento del modulo dei coefficienti del vettore w
mediante l’algoritmo di Hamming, ma anche come ciò abbia portato ad un
leggero allargamento del lobo principale.
Fig. 2.7: andamento del beampattern per due diversi beamformers (con coefficienti scelti
utilizzando il criterio classico) a banda stretta; il modulo dei coefficienti del secondo beamformer
sono stati finestrati secondo l’algoritmo di Hamming.
Capitolo 2 Metodi di beamforming
60
2.5.2 Beamforming data-independent generalizzato I metodi che appartengono a questa categoria si applicano tipicamente alla
progettazione di beamformers in grado di approssimare una risposta desiderata
del tutto arbitraria. Questo è interessante per diversi aspetti: per esempio si
potrebbe desiderare di ricevere ogni segnale proveniente da un certo range di
direzioni, in tal caso la risposta desiderata sarebbe unitaria nell’intero range. In
aggiunta si potrebbe sapere a priori che è presente una forte sorgente di
interferenza che arriva da un certo range di direzioni, la risposta desiderata allora
sarebbe nulla nel range considerato.
Questi esempi sono analoghi al filtraggio FIR passa-banda ed elimina-banda.
Sebbene in questo caso non si tratti più esattamente di beamforming, è prassi
comune riferirsi ancora a questo tipo di filtraggio spaziale come ad un
beamforming.
Si consideri la scelta di w tale che la risposta effettiva:
),(),(r ωθωθ dw H= (2.27)
approssimi la risposta desiderata ),(rd ωθ . Per la scelta di w possono essere
impiegate tecniche ad hoc, simili a quelle impiegate nella progettazione dei filtri
FIR; tuttavia qui si prende in considerazione solo la scelta di w che minimizza la
norma pesata Lp:
( ) p1
pdp dd),(r),(rL ∫∫ −= ωθωθωθ (2.28)
della differenza tra la risposta desiderata e la risposta effettiva. L’approssimazione
a Lp pesata è utilizzata in diverse tecniche di progettazione dei filtri FIR. Le
norme più comunemente utilizzate sono L∞ (minmax) e L2 (Least Square).
Nell’ambito del beamforming, comunque, metodi basati su L∞ non sono
applicabili, mentre in genere è applicabile la procedura che minimizza la norma
Capitolo 2 Metodi di beamforming
61
L2, usando i minimi quadrati pesati linearmente con campionamento della risposta
in frequenza (con ω discreta).
Per illustrare la progettazione dei beamformers data-independent mediante
ottimizzazione di L2, si consideri il caso di dover minimizzare l’errore quadratico
tra la risposta effettiva e la risposta desiderata in P punti (θi , ωi), con Pi1 ≤≤ .
Se P > D, dove D si ricordi essere il numero delle dimensioni dello spazio
vettoriale che contiene i vettori w e d(θ,ω), allora otteniamo un problema ai
minimi quadrati sovradeterminato:
2
min dH
wrwA − (2.29)
dove: [ ]),(),(),( PP2211 ωθωθωθ dddA K= ;
[ ] HPPd22d11d ),(r),(r),(r ωθωθωθ K=dr
Purché AAH sia invertibile (cioè A abbia rango massimo), la soluzione della 2.29
è data da:
drAw += (2.30)
dove:
AAAA H 1)( −+ = (2.31)
è la pseudo-inversa di A.
2.5.3 Analogie e differenze tra i metodi classico e generalizzato Per entrambi questi due metodi (di tipo deterministico) si suppone che la
direzione di provenienza del segnale desiderato sia sempre nota a priori, ovvero
che si conosca sempre in che direzione puntare il main beam per osservare la
radiosorgente. Si suppone inoltre che tale informazione, espressa in forma
Capitolo 2 Metodi di beamforming
62
angolare, venga fornita dall’esterno, da un sistema di puntamento appositamente
concepito.
La caratteristica fondamentale che li differenzia risiede nel fatto che il metodo
generalizzato, diversamente dal metodo classico, richiede la conoscenza delle
DOA delle RFI principali. La tabella 2.1 riassume il confronto tra i due metodi
descritti sino ad ora.
METODO DOA NOTE FUNZIONAMENTO
CLASSICO segnale desiderato la fase dei coefficienti viene calcolata in modo che il main beam punti nella direzione voluta
GENERALIZZATO segnale desiderato + RFI i coefficienti vengono determinati affinché il beampattern presenti il suo massimo in direzione del segnale desiderato ed uno zero in direzione delle RFI
Tabella 2.1: schema riassuntivo dei beamformers data-independent
2.6 Beamforming ad ottimo statistico
Nel beamforming ad ottimo statistico i coefficienti sono scelti in base alla
statistica dei dati ricevuti dall’array. L’obiettivo è ottimizzare la risposta del
beamformer affinché l’uscita contenga il minimo contributo dovuto al rumore ed
ai segnali provenienti da direzioni diverse da quella del segnale desiderato. Per
tutto il paragrafo si farà l’ipotesi che i dati siano stazionari in senso lato e che i
corrispondenti descrittori statistici del secondo ordine siano noti. La
determinazione dei coefficienti quando la statistica dei dati non è nota a priori,
oppure è tempo-variante, viene discussa nel paragrafo successivo, dedicato agli
algoritmi adattativi.
Capitolo 2 Metodi di beamforming
63
2.6.1 Multiple Sidelobe Canceller (MSC) L’MSC dal punto di vista storico è il primo beamformer ad ottimo statistico.
Un MSC consiste in un canale principale ed uno o più canali ausiliari, come
schematizzato in figura 2.8 (a).
(b) (a)
Fig. 2.8: schema di principio del beamformer MSC (a) ed esempio di risposta all’ingresso di
segnale utile + interferenza (b).
Il canale principale può essere sia un’antenna singola ad alto guadagno che un
beamformer data-independent. Esso ha una risposta altamente direttiva puntata
nella direzione del segnale desiderato. Si suppone inoltre che i segnali interferenti
entrino attraverso i lobi laterali del canale principale ed attraverso i canali
ausiliari. L’obiettivo è scegliere i coefficienti wa da attribuire ai canali ausiliari in
modo tale da cancellare la componente interferente dal canale principale. Questo
implica che la risposta agli interferenti del canale principale e di una
combinazione lineare dei canali ausiliari deve essere identica. Un esempio di
risposta del sistema complessivo è rappresentata schematicamente in fig. 2.8 (b).
Capitolo 2 Metodi di beamforming
64
I coefficienti vengono generalmente scelti per minimizzare il valore atteso della
potenza complessiva in uscita. Questo criterio di scelta può causare una
cancellazione del segnale desiderato al crescere della potenza ad esso associata: in
questo caso, infatti, il segnale stesso contribuisce per una frazione sempre
maggiore alla potenza complessiva in uscita e, conseguentemente, la
cancellazione percentuale aumenta.
L’MSC è molto comodo nelle applicazioni dove il segnale desiderato è molto
debole (in rapporto alle interferenze), come in radioastronomia, dal momento che
verrà completamente ignorato dai coefficienti ottimi; oppure quando il segnale
desiderato è assente durante periodi di tempo noti: i coefficienti possono essere
adattati qualora è assente e usati poi durante la sua presenza.
2.6.2 Utilizzo di un segnale di riferimento (REF SIGNAL) e
massimizzazione del rapporto segnale/rumore (MAX
SNR) I due metodi in questione non sono applicabili in campo radioastronomico,
tuttavia si preferisce menzionarli per completezza, in quanto risultano interessanti
ed applicabili in ambiti ordinari.
Per certe applicazioni potrebbe essere sufficientemente nota l’informazione sul
segnale desiderato da generare un segnale che lo rappresenti piuttosto bene:
questo segnale è detto segnale di riferimento. I coefficienti vengono scelti per
minimizzare l’errore quadratico medio tra l’uscita del beamformer ed il segnale di
riferimento.
Il vettore dei coefficienti dipende dalla cross-covarianza tra il segnale desiderato
presente nei dati ricevuti ed il segnale di riferimento. Si ottengono prestazioni
accettabili purché quest’ultimo approssimi con se stesso la covarianza del segnale
desiderato (e non noto). Si assume inoltre che il segnale di riferimento sia
incorrelato con i segnali interferenti presenti nei dati ricevuti. Il fatto che non sia
necessario conoscere la direzione di arrivo del segnale desiderato è una
caratteristica che contraddistingue questo metodo.
Capitolo 2 Metodi di beamforming
65
Il beamformer che si basa sulla massimizzazione del rapporto segnale/rumore
sceglie i coefficienti appunto per massimizzare direttamente il rapporto SNR.
Una soluzione generale per il calcolo del vettore w dei coefficienti richiede la
conoscenza sia della matrice di covarianza del segnale Rs sia di quella del rumore
Rn. La disponibilità di questa informazione a priori dipende dall’applicazione in
esame e la natura incognita di Rs nel caso radioastronomico scoraggia l’uso di
questo metodo.
2.6.3 Linearly Constrained Minimum Variance (LCMV)
Beamforming In alcuni casi nessuno degli approcci visti in precedenza potrebbe risultare
soddisfacente. Il segnale desiderato, ad esempio, potrebbe essere sempre presente
o potrebbe essere di potenza sconosciuta: questo comporterebbe, rispettivamente,
una cancellazione del segnale nel MSC oppure una difficoltà nella stima delle
matrici di covarianza di segnale e rumore nel metodo del massimo SNR.
Questi limiti possono essere superati attraverso l’applicazione di vincoli lineari
sul vettore dei coefficienti. L’utilizzo di vincoli lineari è un approccio generale
che permette un controllo esteso sulla risposta adattata del beamformer.
L’idea alla base del LCMV beamforming consiste nell’esprimere dei vincoli sulla
risposta del beamformer, cosicché i segnali provenienti dalle direzioni volute
vengano lasciati passare con certe fasi e certi guadagni. I coefficienti vengono
scelti per minimizzare la potenza (o la varianza) in uscita, sotto certi vincoli della
risposta. Questo ha l’effetto di preservare il segnale desiderato e,
contemporaneamente, di minimizzare i contributi all’uscita dovuti al rumore ed ai
segnali interferenti, provenienti da direzioni diverse da quella di interesse.
Nel paragrafo 2.2 si è messo in evidenza che la risposta del beamformer ad una
sorgente con DOA θ e frequenza temporale ω è data dalla 2.13.
Vincolando linearmente i coefficienti a soddisfare:
g),( =ωθdw H (2.32)
Capitolo 2 Metodi di beamforming
66
dove g è una costante complessa, si garantisce che qualunque segnale,
proveniente da un angolo θ con frequenza ω, si ritrovi in uscita con risposta g.
La minimizzazione dei contributi delle interferenze, che hanno frequenza ω ma
non arrivano da θ, viene ottenuta scegliendo i coefficienti in modo tale da
minimizzare il valore atteso della potenza (o varianza) in uscita:
[ ] wRw xH=2yE (2.33)
Il problema LCMV per la scelta dei coefficienti viene pertanto ridefinito come la
ricerca del:
wRw xH
wmin (2.34)
sotto il vincolo:
∗= g),( wd H ωθ (2.35)
Per risolvere la 2.34 con la 2.35 si può usare il metodo dei moltiplicatori di
Lagrange, ottenendo il risultato fondamentale:
),(),(
),(g
ωθωθωθdRd
dRw 1-
xH
-1x∗= (2.36)
Si noti che, nella pratica, la presenza di rumore incorrelato assicura l’invertibilità
di Rx.
Se g = 1 la 2.36 corrisponde all’equazione per il calcolo del vettore dei
coefficienti del beamformer Minimum Variance Distortionless Response
(MVDR).
Il singolo vincolo lineare espresso in 2.35 può essere facilmente esteso a più
vincoli lineari per un maggiore controllo sul beampattern. Per esempio, se c’è una
Capitolo 2 Metodi di beamforming
67
sorgente di interferenza fissa ad una direzione nota φ , potrebbe essere
desiderabile forzare a zero il guadagno in quella direzione al fine di mantenere la
risposta g per il segnale desiderato. Questo si esprime dicendo:
⎥⎦
⎤⎢⎣
⎡=⎥
⎦
⎤⎢⎣
⎡ ∗
0g
),(),(
wdd
H
H
ωφωθ
(2.37)
Se ci sono L < D (D è sempre la dimensione dello spazio vettoriale che contiene i
vettori w e d) vincoli lineari su w, li scriviamo nella forma:
fwC H = (2.38)
dove la matrice C di LD× elementi ed il vettore f L-dimensionale vengono detti
matrice dei vincoli e vettore risposta. Si suppone che i vincoli siano linearmente
indipendenti, in modo tale che C abbia rango massimo L.
Progettazione dei vincoli
Si possono seguire diverse filosofie per la scelta della matrice dei vincoli e del
vettore risposta. Di seguito ne sono illustrate solo alcune. In molte applicazioni si
ricorre ad una combinazione di differenti tipi di vincoli per questioni pratiche.
Ogni vincolo lineare usa un grado di libertà nel vettore dei coefficienti, pertanto
con L vincoli restano solo LD − gradi di libertà per la minimizzazione della
varianza.
I vincoli puntuali condizionano la risposta del beamformer in specifiche
direzioni spaziali e frequenze temporali anch’esse puntuali. L’equazione 2.37
rappresenta un esempio di due vincoli puntuali su w. Il numero massimo di punti
nei quali la risposta può essere vincolata è limitato a D. Se si usano D vincoli
allora non restano ulteriori gradi di libertà per la minimizzazione della potenza e
si ricade nel caso di beamformer data-independent.
I vincoli derivativi vengono usati per influenzare la risposta in un insieme di
direzioni e/o frequenze forzando a zero la derivata della risposta del beamformer
in certe direzioni e frequenze. Solitamente vengono impiegati in combinazione
Capitolo 2 Metodi di beamforming
68
con i vincoli puntuali. Un esempio di quando i vincoli derivativi risultano utili si
ha quando la direzione del segnale desiderato è nota a priori solo in maniera
approssimativa: se il segnale proviene da una direzione prossima a quella che è
stata stimata (e per la quale potrebbe essere posto un vincolo puntuale), l’utilizzo
di un vincolo derivativo in quel punto, in realtà, cautela il beamformer dalla
sintesi di uno zero in direzione del segnale desiderato.
I vincoli sugli autovettori si basano sull’approssimazione ai minimi quadrati
della risposta desiderata e tipicamente vengono usati per controllare la risposta del
beamformer in un insieme di direzioni e frequenze.
Vincolando la risposta del beamformer (nel senso dei minimi quadrati) si assicura
che l’errore quadratico medio tra la risposta del beamformer desiderato e quello
effettivo, su una certa regione, venga minimizzato per un certo numero di vincoli.
In questo senso i vincoli sugli autovettori sono molto efficienti.
2.6.4 Generalised Sidelobe Canceller (GSC) Il GSC rappresenta una formulazione alternativa ma equivalente al problema
LCMV: esso trasforma un problema di minimo vincolato in un problema di
minimo assoluto. Questa tecnica è utile per l’analisi del beamformer e in taluni
casi può semplificare la sua implementazione mediante LCMV. Serve inoltre ad
illustrare meglio la relazione esistente tra beamforming MSC e beamforming
LCMV.
Si supponga di scomporre il vettore dei coefficienti w in due componenti
ortogonali w0 e –v (w = w0 – v) poste rispettivamente nello spazio delle colonne di
C e nel suo corrispondente spazio nullo in modo che questa scomposizione possa
essere usata per rappresentare qualunque w.
Dal momento che:
0=vC H (2.39)
deve essere:
Capitolo 2 Metodi di beamforming
69
fCCCw H0
1)( −= (2.40)
se w deve soddisfare i vincoli.
Il vettore v è una combinazione lineare delle colonne di una matrice Cn
(cioè v = Cn wn) di dimensioni )LD(D −× , purché le colonne di Cn formino una
base per lo spazio nullo di C.
Cn può essere ottenuta da C utilizzando una qualsiasi procedura di
ortogonalizzazione (ad esempio Gram-Schmidt, QR decomposition o SVD).
Il vettore dei coefficienti:
nn0 wCww −= (2.41)
è rappresentato in forma di diagramma a blocchi in figura 2.9.
Fig. 2.9: schema a blocchi semplificato del beamformer GSC.
La scelta di w0 e Cn implica che w soddisfi i vincoli indipendentemente da wn e
riduce il problema LCMV al problema senza vincoli:
( ) ( )[ ]nn0xnn0wwCwRwCw
n
−− Hmin (2.42)
la cui soluzione risulta essere:
( ) 0xHnnx
Hnn wRCCRCw 1−
= (2.43)
Capitolo 2 Metodi di beamforming
70
Il vantaggio principale che si ottiene da questa formulazione sta nel fatto che i
coefficienti wn sono svincolati e ciò permette di impiegare algoritmi adattativi
molto più semplici. Inoltre un beamformer w0 data-independent viene
implementato come parte integrante del beamformer adattativo e questo risulta
molto utile in situazioni dove si verifichi una cancellazione del segnale (si veda a
tal proposito il paragrafo successivo).
A titolo di esempio si faccia l’ipotesi che i vincoli dati siano come quelli in 2.35.
La 2.40 implica che:
[ ]),(),(),(gωθωθ
ωθdd
dw H0
∗
= (2.44)
Cn soddisfa la:
0),( =nH Cd ωθ (2.45)
cosicché ogni colonna [ ]inC per LDi1 −≤≤ può essere vista come un
beamformer data-independent con uno zero in direzione θ alla frequenza ω:
[ ] 0),( i =nH Cd ωθ . Perciò qualunque segnale a frequenza ω e direzione θ che
arrivi sull’array sarà bloccato o annullato dalla matrice Cn.
In genere se i vincoli sono progettati per presentare una certa risposta ai segnali
caratterizzati da un certo insieme di direzioni e frequenze, le colonne di Cn
bloccheranno tali segnali. Questa caratteristica ha portato alla definizione
dell’espressione matrice di blocco per Cn. I segnali sottoposti ai vincoli sono
processati quindi solo da w0 e, dato che w0 soddisfa i vincoli, sono presentati con
la risposta desiderata indipendente da wn. Segnali da direzioni e a frequenze sulle
quali la risposta non è vincolata passeranno attraverso entrambi i rami dello
schema di fig. 2.9; il ramo inferiore sceglie wn in modo tale che una combinazione
lineare dei dati all’uscita della matrice di blocco approssimi quanto meglio
possibile i segnali all’uscita di w0. Tale operazione è simile a quanto visto
Capitolo 2 Metodi di beamforming
71
nell’MSC, dove i coefficienti sono applicati all’uscita dei sensori ausiliari al fine
di stimare l’uscita del canale principale (vedi fig. 2.8 (a)).
2.6.5 La cancellazione del segnale desiderato nel
beamforming ad ottimo statistico Il beamforming ottimo in senso statistico richiede qualche informazione a priori
sul segnale desiderato, che può essere: la sua statistica (per i metodi del segnale di
riferimento e del massimo SNR), la sua direzione (per l’MSC) o il vettore risposta
dell’array ),( ωθd (nel caso di beamformer LCMV). Se l’informazione a priori
richiesta risulta non accurata, il beamformer ottimo attenua il segnale desiderato
come se si trattasse di un’interferenza. La cancellazione del segnale desiderato è
spesso significativa, specialmente se l’SNR del segnale stesso risulta elevato
(non è certo il caso della radioastronomia ma si preferisce riportare queste
considerazioni solo per completezza).
Una seconda possibile causa di cancellazione del segnale desiderato è la
correlazione che può esistere tra quest’ultimo ed uno o più segnali interferenti.
Ciò può accadere per esempio nel caso di propagazione a cammini multipli del
segnale desiderato (in radioastronomia questo non avviene mai).
Quando interferenze e segnale desiderato sono incorrelati, il beamformer attenua
gli interferenti per minimizzare la potenza in uscita. Tuttavia, con un’interferenza
correlata, il beamformer minimizza la potenza in uscita trattando il segnale
interferente in modo tale da cancellare il segnale desiderato. Se l’interferente è
parzialmente correlato con il segnale desiderato, allora il beamformer cancellerà
la sola porzione correlata all’interferenza.
2.7 Algoritmi adattativi per il beamforming
Le equazioni per il calcolo del vettore dei coefficienti nel caso dei beamformers
ottimi richiedono la conoscenza a priori dei descrittori statistici del secondo
ordine. Questi operatori in genere non sono noti ma, con l’ipotesi di ergodicità del
Capitolo 2 Metodi di beamforming
72
segnale, tali descrittori (e dunque i coefficienti ottimi) possono essere stimati dai
dati disponibili. Inoltre tali parametri possono variare nel tempo, ad esempio con
il moto delle sorgenti interferenti.
Per risolvere questi problemi i coefficienti, di solito, sono determinati mediante
algoritmi adattativi.
Fondamentalmente esistono due strategie:
1. adattività a blocchi dove i parametri statistici vengono prima stimati
da un blocco temporale di dati e poi vengono utilizzati nell’equazione
per il calcolo dei coefficienti ottimi;
2. adattività continua dove i coefficienti vengono aggiornati ad ogni
passo di campionamento affinché il risultante vettore dei coefficienti
converga alla soluzione ottima.
In caso di ambiente non stazionario si può utilizzare l’adattività a blocchi, purché
i coefficienti vengano ricalcolati periodicamente. L’adattività continua, invece, è
preferibile solitamente quando i parametri statistici sono tempo-varianti o, per
ragioni computazionali, quando il numero di coefficienti adattativi risulti
modesto.
Si consideri ora il problema standard del filtraggio adattativo, riportato in figura
2.10.
Fig. 2.10: configurazione standard del filtro adattativo.
Capitolo 2 Metodi di beamforming
73
I coefficienti vengono scelti per stimare il segnale desiderato dy da una
combinazione lineare degli elementi del vettore dati u. Scegliamo Mw per
minimizzare l’errore quadratico medio (Mean Squared Error, MSE):
MuHMM
Hudud
HM
HMM wRwwrrwuww +−−=⎥⎦
⎤⎢⎣⎡ −= 2
d
2
dyE)(J σ (2.46)
dove [ ]2d
2d yE=σ , [ ]∗= dyE urud e [ ]H
u uuR E= .
Si può dimostrare che la 2.46 è minimizzata da:
ud-1uopt rRw = (2.47)
E’ necessario precisare che il problema standard del filtraggio adattativo può
essere ricondotto ai problemi dei beamformers visti in precedenza, se si seguono
particolari accorgimenti.
L’approccio per blocchi risolve la 2.47 usando degli stimatori per uR e udr ,
formati da K campioni di u e dy : u(k), )k(yd , 1Kk0 −≤≤ .
Gli stimatori più comuni sono la matrice di covarianza campionaria:
∑−
=
=1K
0k
)k()k(K1ˆ H
u uuR (2.48)
e il vettore di cross-covarianza campionario:
∑−
=
∗=1K
0kd )k(y)k(
K1ˆ urud (2.49)
Gli algoritmi di adattività continua si sviluppano facilmente nei termini di fig.
2.10 e dell’equazione 2.46.
Si noti che )(J Mw è una forma quadratica che esprime l’errore.
Capitolo 2 Metodi di beamforming
74
Dal momento che l’Hessiano uR della superficie quadratica è la matrice di
covarianza dei dati affetti da rumore, questa è definita positiva. Ciò implica che la
superficie ha la forma di una valle. La forma a valle è determinata
dall’autostruttura di uR .
Il vettore dei coefficienti ottimi optw si ha in corrispondenza del fondo di tale
valle. Un’interpretazione del filtraggio adattativo consiste nell’immaginare un
punto sulla superficie che corrisponda al vettore attuale dei coefficienti )k(Mw .
Scegliamo il nuovo vettore dei coefficienti )1k( +Mw in modo da scendere lungo
la superficie.
Il vettore gradiente:
)k(Mw∇ )k(22)(J
)k(Muud
wwM
M wRrww
MM
+−=∂
∂=
=
(2.50)
esprime la direzione lungo la quale correggere il vettore dei coefficienti.
E’ il cosiddetto metodo del gradiente, che prevede la correzione del vettore dei
coefficienti nella direzione negativa del gradiente stesso e che porta all’algoritmo
adattativo dei minimi quadrati (Least Mean Square, LMS).
L’algoritmo LMS sostituisce )k(Mw∇ con un suo stimatore istantaneo:
[ ])k()k()k()k(y)k(2ˆd)k( M
Hw wuuu
M−−=∇ ∗ (2.51)
Indicando con )k()k()k(y)k(y d uw HM−= , si ottiene:
)k(y)k()k()1k( ∗+=+ uww MM µ (2.52)
La costante di guadagno µ controlla le caratteristiche di convergenza delle
sequenze di vettori casuali )k(Mw .
Capitolo 2 Metodi di beamforming
75
Il primo vantaggio che si ottiene dall’algoritmo LMS è la sua semplicità.
Le sue prestazioni sono accettabili in molte applicazioni; tuttavia le sue
caratteristiche di convergenza dipendono dalla forma della superficie e quindi
dall’autostruttura di uR . Quando gli autovalori sono fortemente dispersi, la
convergenza può essere lenta e dovrebbero essere presi in considerazione altri
algoritmi adattativi, con caratteristiche migliori di convergenza. In aggiunta agli
algoritmi basati sui minimi quadrati e al filtro di Kalman, sono state proposte
procedure alternative per la ricerca della superficie d’errore. In pratica questi
algoritmi cercano un compromesso tra i requisiti computazionali e la velocità di
convergenza per optw .
Un’alternativa all’LMS è l’algoritmo RLS (Recursive Least Square) a pesatura
esponenziale; al k-esimo passo, )k(Mw viene scelto per minimizzare una somma
pesata dei precedenti errori quadratici:
∑=
− −k
0i
2
dik
)k(w)i()i()i(ymin uw H
MM
λ (2.53)
λ è una costante positiva minore di uno che determina quanto velocemente
debbano essere smorzati i dati precedenti. L’algoritmo RLS si ottiene dalla 2.53
sviluppando il modulo quadro e applicando le proprietà delle matrici inverse.
2.8 Algoritmi di beamforming parzialmente
adattativi
Negli algoritmi adattativi il carico computazionale ad ogni aggiornamento può
essere proporzionale alle dimensioni M del vettore dei coefficienti o al suo
quadrato ( M2 ). Se M è grande, il carico è piuttosto considerevole e nella pratica,
per implementazioni in tempo reale, spesso è necessario ridurre M.
L’espressione “gradi di libertà” si riferisce al numero di coefficienti non vincolati,
cioè “liberi”. Per esempio un beamformer LCMV con L vincoli su D coefficienti
Capitolo 2 Metodi di beamforming
76
ha LD − gradi di libertà; l’implementazione GSC li distingue nel vettore dei
coefficienti svincolati nw ; ci sono M gradi di libertà nella struttura di fig. 2.10.
Un beamformer completamente adattativo usa tutti i gradi di libertà disponibili,
mentre un beamformer parzialmente adattativo ne sfrutta un insieme ridotto.
Se da un lato la riduzione dei gradi di libertà abbassa il carico computazionale e
spesso migliora il tempo di risposta adattativa, dall’altro c’è un prezzo da pagare
nelle prestazioni per il minor numero di gradi di libertà a disposizione: infatti un
beamformer parzialmente adattativo non può convergere alla stessa soluzione
ottima del caso di beamformer completamente adattativo. L’obiettivo nella
progettazione del beamformer parzialmente adattativo è la riduzione dei gradi di
libertà senza una degradazione significativa delle prestazioni: da qui nasce la
ricerca del compromesso migliore.
Quanto si vuole evidenziare in questa sezione è applicabile a diversi tipi di
beamformers, sebbene si utilizzi in modo predominante la notazione del GSC.
Si supponga che il beamformer sia descritto dalla struttura adattativa di fig. 2.10,
dove il segnale desiderato dy è ottenuto come:
xw H0=dy (2.54)
e il vettore dei dati u come:
xTu H= (2.55)
dove T rappresenta la matrice che stabilisce quanti gradi di libertà utilizzare
nell’algoritmo parzialmente adattativo tra i D totali.
Perciò l’uscita del beamformer è:
xw H=y (2.56)
Capitolo 2 Metodi di beamforming
77
dove:
M0 wTww −= (2.57)
Al fine di distinguere tra implementazioni completamente e parzialmente
adattative, scomponiamo T nel prodotto di due matrici: MnTCT = . La
definizione di nC dipende dal particolare beamformer, mentre MT rappresenta la
maschera che riduce i gradi di libertà.
L’MSC e il GSC si ottengono come caso particolare di questa rappresentazione.
Nell’MSC w0 è un vettore a D componenti che seleziona il sensore primario, nC
è una matrice )1D(D −× che seleziona i 1D − possibili sensori ausiliari
dall’insieme completo di D sensori e MT è una matrice M)1D( ×− che sceglie
gli M sensori utilizzati nella pratica. In termini di GSC, w0 e nC sono definiti
come nel paragrafo 2.6.4, mentre MT è una matrice M)LD( ×− che riduce i
gradi di libertà )LDM( −< .
2.8.1 Cancellazione delle radiointerferenze e gradi di libertà I risultati di questo sottoparagrafo dipendono da T ma sono indipendenti dai
singoli termini nC e MT . Supponiamo che il beamformer non cancelli il segnale
desiderato (vedi paragrafo 2.6.5) e che i coefficienti ottimi incidano solo sulle
interferenze e sul rumore incorrelato. Questo semplifica l’analisi permettendoci di
escludere considerazioni a priori sul segnale desiderato.
Si supponga di avere una sorgente di interferenza a banda stretta (a frequenza ω0)
che incida sull’array dalla direzione θ1. La risposta del ramo 0w è:
),(g 011 ωθdw H0= (2.58)
Capitolo 2 Metodi di beamforming
78
Una cancellazione perfetta di questa sorgente richiede 0),( 01 =ωθdw H , cosicché
dobbiamo scegliere Mw che soddisfi:
101H g),( =ωθdTw HM (2.59)
Si assuma che ),( 01 ωθdT H sia non nulla, la 2.59 rappresenta un sistema di una
equazione in M incognite (gli elementi di Mw ) per il quale esiste sempre almeno
una soluzione (ne esistono infinite). Per cancellare simultaneamente una seconda
interferenza nella direzione θ2, Mw deve soddisfare:
[ ] [ ]210201 gg),(),( =ωθωθ dTdTw HHHM (2.60)
dove ),(g 022 ωθdw H0= . Assumendo che ),( 01 ωθdT H e ),( 02 ωθdT H siano
linearmente indipendenti e non nulli e che 2M ≥ , allora esiste almeno un Mw
che soddisfa la 2.60. Estendendo questo ragionamento, si nota che Mw può essere
scelto per cancellare M interferenti a banda stretta (assumendo che i
),( 0i ωθdT H siano linearmente indipendenti e non nulli) e indipendenti da T.
La cancellazione totale si ha se Mw viene scelto in modo tale che la risposta di
MwT coincida esattamente con la risposta del ramo 0w agli interferenti.
Per quanto riguarda il rumore incorrelato, esso è sempre presente in ogni sistema
reale e contribuisce alla potenza totale in uscita. In un beamformer ottimo, come
si è detto, Mw è scelto per minimizzare la potenza complessiva in uscita. Si tenga
presente che la potenza in uscita dovuta al rumore incorrelato è proporzionale al
quadrato della norma L2 dell’intero vettore dei coefficienti w. La norma di w può
diventare elevata quando Mw viene scelto per fornire una cancellazione totale
delle interferenze, a seconda della scelta di T e della posizione degli interferenti.
Perciò, sebbene in principio sorgenti di energia puntuali in direzione e frequenza
possano essere cancellate completamente con un coefficiente per interferenza
Capitolo 2 Metodi di beamforming
79
indipendente da T, la presenza di rumore incorrelato risulta nel grado di
cancellazione essere dipendente dalla corrispondenza descritta da T.
Fino ad ora sono stati considerati solo interferenti puntiformi a banda stretta.
Si considerino ora interferenti che sono spazialmente puntuali ma a larga banda,
in un range di frequenze ba ωωω ≤≤ . La risposta del ramo 0w ad un interferente
a θ1 è espresso dalla 2.58. Per raggiungere la cancellazione totale, Mw deve
essere scelto tale da soddisfare:
ba11 )(g),( ωωωωωθ ≤≤=dTw HHM (2.61)
Si definisca la risposta di ogni colonna di T come:
[ ] Mi1),()(f 1Hii ≤≤= ωθω dT (2.62)
dove [ ] iT indica la i-esima colonna di T. La 2.62 richiede che )(g1 ω venga
espressa come una combinazione lineare di )(f i ω con Mi1 ≤≤ su
ba ωωω ≤≤ . In generale questo non è possibile, per cui escludiamo la
cancellazione di interferenti a larga banda, che quindi non può essere ottenuta.
La potenza in uscita dovuta all’interferente a larga banda può essere espressa
come l’integrale in frequenza del modulo quadro della differenza tra il ramo 0w e
le risposte dei rami adattativi pesate dallo spettro di potenza dell’interferente.
Il grado di cancellazione può variare drasticamente e dipende criticamente dalla
direzione dell’interferente, dal suo contenuto spettrale e dalla scelta di T.
Si può ottenere una buona cancellazione in certe situazioni, dove 1M = , mentre
in altre, anche grandi valori di M producono una scarsa cancellazione. Queste
conclusioni sono valide anche per sorgenti a banda stretta ma a largo range di
direzione (radiazione spazialmente distribuita).
Capitolo 2 Metodi di beamforming
80
2.9 Riassunto
Un beamformer è un sistema che forma alla sua uscita un segnale scalare come
una combinazione pesata dei dati ricevuti da una schiera di sensori.
I coefficienti (o pesi) determinano le caratteristiche di filtraggio spaziale del
beamformer e consentono la separazione di segnali sovrapposti spettralmente ma
provenienti da differenti posizioni spaziali.
I coefficienti in un beamformer data-independent vengono scelti per fornire una
risposta fissa del beamformer, indipendentemente dai dati ricevuti.
Nei beamformers ad ottimo statistico la scelta dei coefficienti è tale da ottimizzare
la risposta del beamformer in base alla statistica dei dati.
Spesso però la statistica dei dati non è nota a priori ed inoltre può essere
tempo-variante, di conseguenza vengono utilizzati algoritmi adattativi per
ottenere coefficienti che convergono alla soluzione statisticamente ottimale.
Considerazioni computazionali obbligano l’uso di beamformers parzialmente
adattativi, con schiere composte da un grande numero di sensori.
In tabella 2.2 vengono ricapitolate le varie tecniche di beamforming viste, accanto
alle quali vengono riportati vantaggi e svantaggi insieme alle loro principali
caratteristiche.
Capitolo 2 Metodi di beamforming
81
Metodo
Tipo
Criterio
VANTAGGI
SVANTAGGI
Applicabilità alla Radioastronomia
Classico
Deterministico
I pesi vengono scelti affinché la risposta del beamformer sia massima in direzione del segnale desiderato
Semplice - minimizza l’MSE tra risposta effettiva e quella ideale - finestrabile - si può estendere facilmente al caso 2 D
La risposta spaziale e quella temporale sono dipendenti - richiede la DOA del segnale desiderato
Buona a livello deterministico
Generalizzato
Deterministico
I pesi vengono scelti affinché la risposta del beamformer approssimi la risposta desiderata nota a priori (massima nella direzione del segnale desiderato e nulla in direzione delle RFI)
Soppressione efficace delle RFI - direzionalità programmabile -per array lineari equispaziati si possono usare le tecniche di progettazione dei filtri FIR
Può essere rumoroso - non sono disponibili criteri di progettazione per funzioni di pesatura degli errori - richiede le DOA del segnale desiderato e delle RFI
Molto buona a livello
deterministico
MSC
Deterministico e adattativo
I coefficienti adattativi vengono scelti sulla base di un canale ausiliario in modo da cancellare le RFI dal canale primario
Metodo consolidato - semplice - non sono necessarie le DOA - i coefficienti effettuano un filtraggio sul segnale ausiliario e non sul canale principale, dove invece si ha il transito del segnale radioastronomico
Talvolta può cancellare il segnale desiderato (quando di intensità elevata) - il segnale desiderato non deve entrare nel canale ausiliario
Buona
REF SIGNAL
Deterministico e adattativo
I coefficienti vengono scelti per massimizzare la verosimiglianza tra il segnale ricevuto ed un segnale dato, detto di riferimento
Non sono necessarie le DOA
Occorre generare un segnale di riferimento e le prestazioni dipendono fortemente dalla sua validità
Non applicabile
MAX SNR
Deterministico e adattativo
I coefficienti vengono scelti per massimizzare il rapporto segnale/rumore
Vera massimizzazione dell’SNR - non sono necessarie le DOA
Richiede la conoscenza delle matrici di autocorrelazione Rs e Rn – richiede la risoluzione di un problema agli autovalori
Scarsa
LCMV
Deterministico e adattativo
I coefficienti vengono scelti in modo da minimizzare la varianza del segnale in uscita sotto vincoli lineari
Flessibile - sperimentato - non sono necessarie a priori le DOA o le matrici di autocorrelazione - può gestire efficientemente le RFI con DOA nota - vincoli arbitrari
Pesante dal punto di vista computazionale
Buona
GSC
Deterministico e adattativo
Il vettore dei coefficienti viene scomposto in due componenti ortogonali riducendo il problema LCMV (minimo vincolato) in un problema di minimo assoluto (non vincolato)
Possibilità di impiegare algoritmi adattativi semplici - utile in situazioni dove si verifichi una cancellazione del segnale
Richiede una procedura di ortogonalizzazione della matrice C
Buona
Tabella 2.2: tabella riassuntiva delle varie tecniche di beamforming
CAPITOLO 3
ALGORITMO MVDR ADATTATIVO
In questo capitolo viene presentata un’ampia ed accurata trattazione di uno degli
algoritmi di beamforming più diffusi ed apprezzati nel mondo delle
telecomunicazioni, l’algoritmo MVDR, e, in particolare, si cerca di
caratterizzarne il funzionamento nell’ambito specifico delle applicazioni
radioastronomiche.
Dopo alcune brevi considerazioni, di carattere del tutto generale, sugli algoritmi
di beamforming adattativo, viene portato avanti uno studio analitico utile al
calcolo del vettore dei coefficienti relativamente ad un contesto di tipo
deterministico, ovvero nell’ipotesi in cui la statistica dei segnali in gioco sia
completamente nota a priori. Il caso adattativo, che è quello di maggior interesse,
viene preso in esame nella parte successiva.
Sono state condotte, inoltre, diverse simulazioni mediante MATLAB (MATLAB
versione 7.0.0.19920 (R14), ® - The MathWorks Inc.), in cui sono stati riprodotti
vari tipi di scenari, cambiando il numero ed il tipo di interferenti, per testare
l’efficacia del metodo nella soppressione dei segnali indesiderati.
In particolar modo all’inizio sono state considerate sorgenti di interferenza fisse
nello spazio, mentre in un secondo momento si è ipotizzato che queste fossero in
movimento: a tale scopo è stata impiegata Simulink, un’applicazione che si basa
Capitolo 3 Algoritmo MVDR adattativo
84
su MATLAB e che permette di creare dei modelli per simulare un sistema
dinamico (anche Simulink è un marchio registrato da The MathWorks, Inc.).
3.1 Algoritmi di beamforming adattativo
Nell’ambito delle telecomunicazioni tradizionali sono stati sviluppati diversi
algoritmi per il beamforming adattativo, ma la loro efficacia in campo
radioastronomico non è stata ancora del tutto chiarita. Un caso emblematico viene
offerto dai satelliti LEO (Low Earth Orbit) per telecomunicazioni (quelli, ad
esempio, dei sistemi Globalstar ed IRIDIUM), i quali talvolta operano su bande di
frequenze particolarmente interessanti per le osservazioni radioastronomiche:
sono satelliti artificiali caratterizzati da una quota orbitale media relativamente
bassa e dunque da un’elevata velocità angolare (per ulteriori approfondimenti si
consulti l’Appendice B). In questo caso le interferenze satellitari possono essere
più problematiche di quelle terrestri perché non hanno una direzione di
provenienza fissa e possono in breve tempo attraversare sia il main beam del
radiotelescopio, sia i suoi lobi laterali. Tali interferenze, in combinazione con
quelle terrestri, contribuiscono alla creazione di uno scenario non stazionario, che
pertanto richiede un approccio adattativo per un’efficace mitigazione.
A differenza delle telecomunicazioni tradizionali, la radioastronomia soffre di:
1. SNR estremamente bassi, anzi quasi sempre il segnale utile risulta essere
immerso (buried) nel rumore di sistema e, per essere rilevato, necessita di
lunghi periodi di integrazione (anche dell’ordine di diverse ore);
2. lobi di gratings dovuti all’eccessiva spaziatura (maggiore di λ/2) tra gli
elementi che compongono l’array;
3. elevata direttività dei sensori che compongono l’array, mentre la teoria del
beamforming ne richiede una certa omnidirezionalità;
Capitolo 3 Algoritmo MVDR adattativo
85
4. interferenze significative raccolte anche dai lobi secondari dell’antenna;
5. necessità di conoscere il guadagno assoluto del sistema ricevente
(calibrazione), al fine di certificare le misurazioni effettuate
(es. temperatura di brillanza di una radiosorgente o estensione angolare
della stessa).
Numerosi studi ([6],[7],[8],[9]) sono stati effettuati per capire quali algoritmi
potessero essere più consoni ad un uso in campo radioastronomico. I criteri di
selezione sono stati: la capacità di reiettare/mitigare le RFI ed il livello medio di
distorsione introdotto sul beam.
I principali algoritmi presi in considerazione sono stati:
1) MVDR (Minimum Variance Distortionless Response);
2) GSC (Generalised Sidelobe Canceller);
3) MSC (Multiple Sidelobe Canceller);
4) Max SNR (Max Signal to Noise Ratio).
Gli algoritmi MVDR e GSC pongono dei vincoli sulla risposta spaziale del
beamformer, in modo tale che i segnali provenienti dalle direzioni di interesse
vengano lasciati passare con determinati guadagni (e fasi, eventualmente). Gli
zeri del beampattern si formano dinamicamente, in corrispondenza dei segnali
interferenti che provengono da direzioni diverse da quelle specificate nei vincoli.
In particolare l’approccio del GSC consiste nel trasformare il problema di calcolo
di minimo vincolato del MVDR in un problema di calcolo di minimo assoluto.
In tal caso con un array da N elementi possono essere cancellati fino ad N-1
interferenti e non viene richiesto l’inseguimento meccanico (tracking) della
radiosorgente interferente. L’MSC invece usa un’antenna singola ad alto
guadagno per osservare la radiosorgente astronomica ed uno o più canali ausiliari
caratterizzati da un alto rapporto interferenza/segnale.
Tale metodo richiede che le antenne ausiliarie vengano orientate in direzione delle
RFI e ciò costituisce il principale limite di applicabilità di questo metodo, in
Capitolo 3 Algoritmo MVDR adattativo
86
particolare quando le DOA delle RFI non sono note a priori, sono di difficile
stima o, come nel caso dei satelliti LEO, risultano essere variabili.
Per tali ragioni, sebbene la tecnica MSC sia in grado di notevoli prestazioni
([10]), viene generalmente preferita una tecnica blind, come appunto l’MVDR.
In ultimo si distingue il metodo Max SNR, che però richiede la stima delle matrici
di covarianza del rumore (correlato e non) nini RRR +=+ e del segnale
radioastronomico sR . Tale stima potrebbe risultare particolarmente ardua o
richiedere delle ipotesi a priori non sempre corrette riguardo la natura dei segnali
in gioco.
Gli algoritmi sopra citati sono stati sottoposti a diverse simulazioni statistiche
([7]), nelle quali i dati riproducevano l’osservazione di una debole radiosorgente
che emetteva sulla riga dell’OH e veniva disturbata dal passaggio di un satellite
GLONASS. E’ stata usata una grande varietà di geometrie e di livelli di emissione
per le sorgenti di RFI per determinare quali algoritmi avessero le migliori
prestazioni in ogni situazione. La matrice di covarianza e gli altri parametri
statistici richiesti dagli algoritmi sono stati tutti stimati dai dati osservati.
In sintesi i risultati ottenuti in merito alle varie problematiche in gioco sono i
seguenti:
attenuazione delle RFI in prossimità dei lobi di grating. In tale condizione
porre uno zero in direzione dell’interferenza causa anche un’inevitabile
soppressione del segnale desiderato. Per affrontare tale tipologia di
problema, l’MSC ([10]) è risultato essere l’algoritmo migliore, in quanto è
quello che si lascia influenzare meno dai lobi di grating, mentre gli
algoritmi MVDR, GSC e Max SNR hanno riportato tutti praticamente le
stesse prestazioni. Questi ultimi tre algoritmi consentono un
miglioramento anche fino a 100 dB del SINR (Signal to Interference and
Noise Ratio) all’uscita del beamformer ma, come si può ben capire, non
sono in grado di apportare alcun miglioramento quando la direzione di
provenienza dell’RFI cade proprio in corrispondenza di un lobo di grating;
Capitolo 3 Algoritmo MVDR adattativo
87
sensibilità agli errori di calibrazione. Gli errori di calibrazione (sia di fase
che di guadagno) sono inevitabili. Algoritmi come l’MVDR ed il GSC
richiedono accurate condizioni di calibrazione per funzionare
correttamente; le ricerche hanno mostrato che, sebbene gli errori di
calibrazione possano compromettere il livello di attenuazione delle
interferenze, il miglioramento complessivo del SINR risulta comunque
notevole;
distorsione del lobo principale. Un punto essenziale per la
radioastronomia è la consistenza di forma del beam, al fine di evitare
polarizzazioni nelle misure. Con l’MVDR, il GSC ed il Max SNR la
forma del lobo principale può essere notevolmente distorta, se
l’interferenza entra dal beam stesso o da un lobo di grating. Questo
succede perché l’algoritmo tenta di porre uno zero sull’interferente,
ignorando il beampattern finale che se ne ottiene, affinché comunque il
SINR in uscita raggiunga il suo massimo.
L’algoritmo MSC sembra essere quello in grado di fornire le prestazioni migliori
in termini di reiezione alle RFI. Tuttavia, per via della sua necessità di possedere
un sistema di osservazione ausiliario costantemente puntato in direzione della
sorgente (o, peggio ancora, delle sorgenti) di RFI, ed eventualmente di un sistema
di tracking nel caso di sorgenti mobili, non risulta essere la soluzione più
conveniente. Il miglior compromesso in termini di costo/prestazione viene dunque
fornito dall’MVDR, che tuttavia richiede un’accurata calibrazione del complesso
ricevente.
Un buon algoritmo adattativo deve avere le seguenti proprietà:
1. guadagno costante nella direzione di osservazione 0θ ;
2. zeri orientati in direzione di tutti gli altri segnali interferenti 1θ ,
2θ ,…
Capitolo 3 Algoritmo MVDR adattativo
88
L’algoritmo MVDR non ha la capacità di reiettare le interferenze che hanno altri
metodi come l’MSC ma, in compenso, è semplice e diretto da implementare e
soddisfa i due requisiti espressi sopra.
Sono stati compiuti notevoli sforzi per cercare di risolvere il problema
dell’accuratezza della calibrazione. In [11] ed in [12] vengono descritte delle
versioni robuste di MVDR, che cercano di smorzare gli effetti dovuti agli errori di
puntamento ed alle perturbazioni casuali sui parametri dei sensori.
3.2 MVDR beamforming deterministico
Si consideri un array lineare composto da N sensori equispaziati a distanza d e sia
dn la distanza tra l’n-esimo sensore dell’array ed il primo, che quindi ha la
seguente forma:
d)1n(dn −= (3.1)
Una sorgente posta a grande distanza dalla schiera trasmette un segnale
monocromatico:
tf2j
000es)t(s π= (3.2)
la cui ampiezza 0s è una variabile aleatoria con varianza [ ] 20
20sE σ= .
Supponendo che la sorgente sia in campo lontano rispetto alla schiera, il fronte
d’onda alle antenne può essere assunto piano. Essendo la sorgente a grande
distanza e le antenne riceventi vicine tra loro, si può ritenere trascurabile la
differenza di ampiezza tra i segnali ricevuti alle singole antenne. Sotto queste
ipotesi, il segnale ricevuto dall’n-esimo sensore è uguale a quello ricevuto dal
primo (che viene preso come riferimento) a meno di un ritardo nτ , cioè a meno di
un tempo di propagazione:
Capitolo 3 Algoritmo MVDR adattativo
89
0
0n0nn f
sindc
sindλ
θθτ == (3.3)
dove 0θ rappresenta la DOA della radiosorgente (rispetto alla normale all’array) e
c la velocità della luce (fig. 3.1).
Fig. 3.1: schiera lineare uniforme composta da N sensori equispaziati ad una distanza pari a d
l’uno dall’altro.
In base a queste considerazioni, il segnale )t(xn ricevuto dall’n-esimo sensore
vale:
0n00
sind)1n(2j
0f2jtf2j
0n e)t(sees)t(xθ
λπτππ −
== (3.4)
Omettendo per semplicità l’indice temporale t e rappresentando con il vettore
[ ]TN21 xxx K=x i segnali ricevuti dagli N sensori, si ha:
0dx 0s= (3.5)
dove 0d rappresenta la risposta della schiera al segnale a banda stretta
proveniente dalla direzione 0θ (steering vector):
T
sind
)1N(2jsind
2j
000 ee1)(⎥⎥⎦
⎤
⎢⎢⎣
⎡==
− θλ
πθλ
πθ Kdd 0 (3.6)
Capitolo 3 Algoritmo MVDR adattativo
90
Nel beamforming di tipo MVDR il vettore dei coefficienti optw viene calcolato
allo scopo di minimizzare la potenza complessiva in uscita dal beamformer
( wRw H=yP ), sotto il vincolo lineare di guadagno unitario ( 1=0H dw ) nella
direzione del segnale desiderato ( )( 0θdd0 = ).
Ovvero si vuole risolvere il problema:
[ ] [ ] 1.v.s)(minarg)P(minarg y === 0HH
wwopt dwwRww (3.7)
con la solita notazione introdotta nei capitoli precedenti. Si tratta di un problema
di minimo vincolato che si risolve mediante i moltiplicatori di Lagrange:
[ ]{ })1(minarg −+= 0HH
wopt dwwRww λ (3.8)
Il punto di minimo si ricava uguagliando a zero le derivate parziali
dell’argomento della 3.8 rispetto a w e λ:
⎩⎨⎧
==+1
0
0H
0
dwdwR λ
(3.9)
da cui si ricava:
⎪⎩
⎪⎨⎧
=
=
01-H
0
0-1
dRd
dRw1λ
λ (3.10)
ottenendo dunque la soluzione:
0
1-H0
0-1
opt dRddR
w = (3.11)
Capitolo 3 Algoritmo MVDR adattativo
91
Si osservi che il termine al denominatore è un valore scalare che serve
semplicemente a soddisfare il vincolo 1=0H dw , cioè ad avere guadagno unitario
in direzione 0θ .
L’effetto del beamformer MVDR è una risposta unitaria in direzione della
radiosorgente 0θ ed un’attenuazione in corrispondenza degli interferenti kθ ,
Kk1 ≤≤ con K = n° di segnali interferenti.
3.3 MVDR beamforming adattativo
In questo paragrafo viene illustrata, in maniera dettagliata, la procedura necessaria
all’implementazione su elaboratore elettronico dell’algoritmo MVDR in regime
adattativo. I passi da seguire sono i seguenti:
1. Viene definita la direzione di osservazione 0θ (look direction) e si
recupera lo steering vector )( 0θd ad essa associato. Si noti come non a
caso sia stata utilizzata l’espressione “si recupera” in merito al calcolo
dello steering vector: infatti se l’array, come capita nella realtà, non è
composto da sensori ideali (cioè omnidirezionali) ma da sensori con una
propria risposta specifica, gli steering vectors effettivi differiscono da
quelli ideali, rappresentati per esempio dall’eq. 3.6. Il loro valore effettivo
può tuttavia essere stimato a partire dalla matrice di covarianza.
Per il momento si supponga che l’array sia composto da sensori ideali e
che dunque gli steering vectors effettivi coincidano con quelli ideali.
Ne consegue che:
T
sind)1N(2jsind2j
000 ee1)( ⎥⎦
⎤⎢⎣
⎡=
− θλ
πθλ
πθ Kd (3.12)
il cui significato è già stato ampiamente discusso precedentemente.
Capitolo 3 Algoritmo MVDR adattativo
92
2. Si definisce l’asse spaziale che costituisce il dominio “angolare”
(discreto) per la rappresentazione del beampattern, mediante la
costruzione del vettore:
[ ]maxmin thetatheta K=theta (3.13)
che contiene tutti gli angoli compresi nel range delimitato da mintheta e
maxtheta ed equispaziati gli uni dagli altri di un valore scelto
arbitrariamente steptheta . I valori scelti per tutte le simulazioni effettuate
sono stati:
- °−= 90thetamin ;
- °+= 90thetamax ;
- °= 05.0thetastep .
3. Si costruisce una matrice avente per colonne gli steering vectors associati
agli angoli contenuti nel vettore theta :
D =
D servirà in seguito per il calcolo del beampattern.
1 2 length(theta)
1 2
N
Capitolo 3 Algoritmo MVDR adattativo
93
4. I dati provenienti dall’array vengono raccolti in una matrice X, detta
appunto matrice dei dati grezzi, la cui struttura viene schematizzata in
figura 3.2.
Fig. 3.2: struttura della matrice X dei dati grezzi
Si tratta di una matrice rettangolare contenente i segnali ricevuti dalla
schiera dal tempo 1t al tempo osst ; le righe della matrice, cioè
[ ])t(x)t(x)t(x ossn2n1n K con Nn1 ≤≤ , sono i vettori dei segnali
analitici (in funzione del tempo) provenienti da ogni singolo sensore.
D’altra parte le colonne, cioè [ ]TiNi2i1 )t(x)t(x)t(x K con
ossi1 ≤≤ (dove oss è il numero totale dei campioni di dati presi in
considerazione durante l’osservazione), sono i vettori delle istantanee
(snapshots) delle uscite dei ricevitori in quadratura.
E’ interessante rendersi conto che aspetto può assumere tale matrice. In
figura 3.3 viene rappresentata una matrice dei dati grezzi contenente solo
rumore termico a varianza unitaria: la matrice è composta da valori
complessi ma in questo, come nei successivi grafici, viene riportata solo
la componente reale, dal momento che la componente immaginaria
assume un aspetto analogo.
1x
2x
Nx
1t 2t osst
Capitolo 3 Algoritmo MVDR adattativo
94
Il rumore presente può rappresentare indifferentemente due contributi:
quello dovuto al sistema e quello dovuto alla radiosorgente, per
distinguere i quali sono state sviluppate diverse tecniche.
Fig. 3.3: matrice dei dati grezzi per un’osservazione radioastronomica corretta (i dati
non sono affetti da alcun disturbo).
Questo esempio, che rappresenta il risultato di un’osservazione corretta, è
stato ottenuto con i seguenti dati: 12n =σ , N = 8,
2d λ= , oss = 1000.
In figura 3.4, invece, viene riportato il risultato di un’osservazione affetta
da un’interferenza a frequenza c1 f01.0f = (
2
cfc λ= è la frequenza di
campionamento spaziale, vedi Appendice A, par. A.1) con °= 301θ e
dB3INR += . Nella figura 3.5 viene aggiunta una seconda interferenza
che ha: c2 f10.0f = , °−= 602θ e dB9INR += . Anche in questi due casi
si hanno 12n =σ , N = 8,
2d λ= e oss = 1000. Come si può notare dalle
figure, la presenza di RFI si ripropone nella matrice dei dati grezzi con
Capitolo 3 Algoritmo MVDR adattativo
95
delle striature oblique di intensità proporzionali all’INR, pendenza legata
alla direzione di provenienza e periodicità legata alla frequenza.
Fig. 3.4: matrice dei dati grezzi per un’osservazione radioastronomica affetta da una
radiointerferenza
Fig. 3.5: matrice dei dati grezzi per un’osservazione radioastronomica affetta da due
radiointerferenze
Capitolo 3 Algoritmo MVDR adattativo
96
5. Viene stimata la matrice di covarianza R.
Se le DOA dei segnali ed i parametri di calibrazione dell’array restano
costanti su un intervallo di tempo di K campioni, allora R(t) è costante nel
tempo e può essere stimata mediante una media temporale:
∑=
==K
1kkk )t()t(ˆ HH xxXXR (3.14)
In pratica si sta facendo l’ipotesi di stazionarietà in senso lato dei segnali
e l’ergodicità degli stessi: in altre parole si suppone che, nell’intervallo di
tempo descritto da K campioni, le DOA delle RFI non varino in modo
significativo. Si tratta di un’ipotesi ragionevole, poiché, in genere, si
considerano intervalli di tempo relativamente brevi.
Per un array composto da N sensori, R̂ è una matrice quadrata
Hermitiana di ordine N.
6. Vengono calcolati i coefficienti w del beamformer:
)(ˆ)(
)(ˆ)(
00H
00 θθ
θθ
dRddR
w1-
-1
= (3.15)
Il calcolo della matrice inversa -1R̂ può presentare delle difficoltà (vedi
par. 3.3.2 ). In ogni caso per un’implementazione computazionalmente
efficiente, si consiglia di non ricorrere all’inversione diretta della matrice,
R̂ ma di utilizzare la decomposizione di Cholesky, descritta in [13].
7. Infine viene calcolato il beampattern complessivo secondo la già nota
relazione:
2
0 )( Dwnbeampatter HMVDR θ= (3.16)
Capitolo 3 Algoritmo MVDR adattativo
97
Esso andrà poi normalizzato rispetto al suo valore massimo.
Si ottiene perciò un vettore i cui elementi rappresentano ciascuno il
guadagno del beamformer corrispondentemente ad ogni elemento del
vettore theta : a partire da questi due vettori è possibile visualizzare
l’andamento del guadagno su tutto l’asse spaziale.
3.3.1 Velocità di convergenza della matrice di covarianza Un punto essenziale per l’algoritmo MVDR adattativo consiste nel capire quanti
punti (snapshots) debbano essere impiegati per la stima della matrice di
covarianza e degli steering vectors effettivi per un certo livello di accuratezza.
Un metodo per studiare la convergenza di R̂ consiste nell’osservare l’andamento
della varianza media della matrice, cioè della media delle varianze di ogni suo
elemento. Si osserva una convergenza asintotica di R̂ al crescere del numero K di
punti usati per la stima: quanto più K è alto, tanto meglio R̂ approssima R . La
velocità di convergenza, d’altra parte, si dimostra (vedi [14]) essere proporzionale
al fattore:
BK1 (3.17)
dove B è la banda del sistema.
Gli steering vectors sono legati alla matrice R̂ da una relazione lineare. Pertanto
anche le loro ampiezze e fasi convergono con una velocità proporzionale al
fattore 3.17. La forma esatta della convergenza degli steering vectors dipende dal
numero di sensori: un numero maggiore di sensori produrrà stime più accurate. Il
valore ottimo di K è da determinarsi sperimentalmente ma generalmente assume
valori che vanno da qualche decina a qualche centinaio.
Capitolo 3 Algoritmo MVDR adattativo
98
3.3.2 Iniezione di rumore artificiale e calcolo di -1R̂ Nel caso ideale in cui i segnali che incidono sull’array non siano affetti da
rumore, la matrice di covarianza è singolare e, pertanto, non invertibile.
Quindi in tal caso non è possibile calcolare l’espressione dei coefficienti ottimi
del beamformer, indicata dalla 3.15. Si tratta tuttavia di un caso puramente teorico
(per quanto paradossale nella pratica): in realtà il rumore, seppur basso, è sempre
presente e questo fa sì che R̂ non sia mai singolare e dunque sia sempre
invertibile. Tuttavia talvolta può capitare che R̂ risulti essere malcondizionata.
Si ricordi che una matrice si dice malcondizionata quando ha un elevato numero
di condizionamento. Tale numero esprime il rapporto tra l’autovalore massimo e
l’autovalore minimo della matrice stessa e, se risulta elevato, vuol dire che tale
matrice è prossima alla singolarità. In tal caso l’inversione può portare a dei
risultati poco accurati.
Nel caso in cui la matrice R̂ si dimostri essere malcondizionata, è possibile
ricondizionarla sommando alla matrice stessa un contributo di rumore artificiale
I2aσ . Un esempio di come può essere migliorato il condizionamento della
matrice (e quindi anche il beamforming risultante), mediante l’aggiunta di rumore
artificiale, viene fornito in figura 3.6. Per questa simulazione sono stati adottati i
parametri seguenti: 8N = , 2
d λ= , puntamento: °= 100θ , RFI: °+= 501θ e
°−= 302θ . Nel primo caso (a) il rumore è praticamente assente: la matrice R̂ è
fortemente malcondizionata ed il beamformer inaccurato (si noti l’evidente
distorsione del beam in confronto al beamformer classico), tale da non rendere
possibile un’osservazione radioastronomica corretta. Nel secondo caso (b) si può
apprezzare un notevole miglioramento in quanto ora il beam risulta puntare nella
direzione voluta 0θ . Questo risultato è stato ottenuto aggiungendo ad R̂ del
rumore artificiale I2aσ con 12
a =σ .
Capitolo 3 Algoritmo MVDR adattativo
99
(a)
(b)
Fig. 3.6: esempio di miglioramento del beamforming mediante l’aggiunta di rumore artificiale
Se da un lato l’aggiunta di rumore migliora il condizionamento della matrice,
dall’altro, al crescere di 2aσ , si perde sempre più profondità negli zeri e
risoluzione nel beam. Al limite per ∞→2aσ il beamformer MVDR coincide con
il beamformer classico.
Capitolo 3 Algoritmo MVDR adattativo
100
3.4 Creazione di un modello di simulazione dinamico
attraverso l’uso di Simulink
Per saggiare l’effettiva capacità dell’algoritmo di beamforming MVDR nel
cancellare le interferenze in regime non stazionario, si è deciso di ricorrere
all’utilizzo di Simulink. Quest’ultimo è l’ambiente di programmazione grafico
associato a MATLAB: è particolarmente indicato per costruire schemi a blocchi
di sistemi dinamici lineari e non lineari e per eseguire la loro simulazione.
Mette a disposizione inoltre una grande varietà di moduli predefiniti, con la
possibilità per l’utente di crearne dei nuovi, eventualmente anche programmati in
C o in FORTRAN.
Per avviare Simulink occorre digitare
simulink
nella finestra dei comandi di MATLAB oppure cliccare il bottone che si
trova nel menu dei comandi in alto a sinistra.
Sullo schermo apparirà la finestra Simulink Library Browser (fig. 3.7): i blocchi
di Simulink si trovano nelle librerie che appaiono sotto la voce “Simulink” della
finestra stessa. A seconda di quali prodotti Mathworks sono installati nel
computer (per una descrizione completa di tutti i prodotti si veda [15]), si possono
vedere altri elementi in questa finestra, come Communications Blockset e Control
System Toolbox. Questi prodotti includono altri blocchi addizionali di Simulink,
che possono essere visualizzati facendo clic sul segno più a sinistra dell’elemento.
Ogni volta che vengono create nuove versioni di Simulink, alcune librerie
possono cambiare nome e alcuni blocchi possono essere spostati in altre librerie,
quindi le librerie qui specificate potrebbero cambiare nelle versioni successive. Il
sistema migliore per trovare un blocco, noto il suo nome, consiste nel digitare il
nome nel pannello Find in alto nella finestra Simulink Library Browser. Quando
viene premuto Invio, Simulink visualizza una breve descrizione del blocco nel
riquadro sottostante il pannello Find.
Capitolo 3 Algoritmo MVDR adattativo
101
Fig. 3.7: la finestra Simulink Library Browser
L’obiettivo della presente trattazione non è tanto quello di fornire una guida
completa sull’utilizzo di Simulink: esistono infatti a tale scopo numerosi testi e
documenti facilmente reperibili ([16]), bensì spiegare in maniera chiara ed
essenziale i passi necessari alla costruzione del modello utilizzato nelle
simulazioni. Inoltre si vuole precisare che il percorso progettuale seguito non è
l’unico possibile, ma ne potrebbero esistere altri, anche meglio strutturati e più
ottimizzati. Oltretutto il modello creato, come si vedrà meglio più avanti, si basa
su alcune ipotesi semplificative che lo rendono non del tutto aderente al
complesso insieme di fenomeni che avvengono nelle situazioni reali. Si rimanda,
Capitolo 3 Algoritmo MVDR adattativo
102
quindi, a lavori futuri la ricerca di possibili miglioramenti ed eventuali
completamenti utili al perfezionamento dell’attività svolta.
3.4.1 Considerazioni introduttive Prima di entrare nel merito su come realizzare un modello di simulazione
dinamico mediante Simulink, è necessario svolgere alcune considerazioni sul
sistema che si intende ricostruire.
Il panorama delle comunicazioni via radio offre un vasto assortimento di esempi
di sorgenti in movimento che possono interferire con il segnale radioastronomico.
Basti pensare ai sistemi di telecomunicazioni satellitari, ai palloni sonda per
rilevamenti meteorologici, ai sistemi radar avionici e navali.
Fra tutti, sono comunque i numerosissimi satelliti lanciati in orbita attorno al
globo terrestre che costituiscono le maggiori fonti di disturbo per i radiotelescopi,
poiché capita frequentemente che i sistemi satellitari stessi vadano ad operare su
bande di frequenza già assegnate alla radioastronomia.
Il problema è destinato a crescere: infatti la tendenza è quella di aumentare
progressivamente le bande destinate alle osservazioni radio affinché queste diano
risultati più accurati e, nel contempo, affiancare i sistemi via satellite già esistenti
con altri più avanzati e sofisticati.
I satelliti geostazionari (GEO) non costituiscono un problema particolare, in
quanto, oltre ad essere ridotti in numero (ne bastano appena 3 per coprire quasi
tutto il pianeta, si veda l’Appendice B), si muovono di moto sincrono con la
rotazione terrestre. Essi, dunque, come suggerito dal nome stesso, appaiono, ad un
osservatore posto sulla Terra, in una posizione fissa nel cielo e possono così
essere assimilati a sorgenti interferenti immobili; per questa ragione non verranno
presi in considerazione nella presente trattazione.
Lo stesso non si può dire a proposito dei satelliti MEO (Medium Earth Orbit) e
LEO (Low Earth Orbit) che, al contrario, si muovono di moto relativo rispetto al
globo terrestre, rappresentando, questa volta, fonti di radiointerferenze in
movimento.
Capitolo 3 Algoritmo MVDR adattativo
103
Una delle differenze fondamentali tra questi due tipi di satelliti risiede nella quota
della loro orbita: i satelliti LEO gravitano attorno alla Terra ad un’altezza
inferiore a quella tipica dei satelliti MEO, di conseguenza, in accordo alle leggi di
Keplero, si spostano con una velocità angolare maggiore. Questa caratteristica li
rende potenzialmente più “dannosi” per le misurazioni radioastronomiche e,
perciò, è su di essi che verrà concentrata l’attenzione da qui in avanti.
Si prenda ora in esame un generico satellite appartenente alla costellazione del
sistema IRIDIUM (per servizi di comunicazione cellulare via satellite). Esso ruota
attorno alla Terra su un’orbita circolare a circa 780 Km da essa.
Poiché durante il moto del satellite la forza di gravità della Terra ha la funzione di
forza centripeta, per calcolare la velocità necessaria a rimanere su un’orbita
circolare intorno alla Terra è sufficiente eguagliare le espressioni delle due forze.
Si ricordi che la forza centripeta è quella forza che obbliga un oggetto a muoversi
su una circonferenza, altrimenti esso fuggirebbe per inerzia lungo la tangente.
Si ottiene dunque:
2Ts
2
s rmm
Gr
vm = (3.18)
dove sm è la massa del satellite, Tm la massa della Terra, v la velocità del
satellite (l’incognita), G la costante di gravitazione universale e r è il raggio
dell’orbita, cioè la distanza del satellite dal centro della Terra.
Risolvendo l’equazione precedente, si ottiene:
r
mGv T= (3.19)
Si osservi che nella formula non compare la massa del satellite: ciò significa che
la velocità necessaria per restare in orbita è la stessa per tutti i satelliti, non
importa se essi hanno massa grande o piccola.
Capitolo 3 Algoritmo MVDR adattativo
104
La velocità dipende invece dal raggio dell’orbita: quanto più è grande la distanza
r dal centro della Terra, tanto più v diventa piccolo.
Quindi, come si è già detto, più l’orbita è alta (cioè maggiore è r), più il satellite si
muove lentamente. Anche il periodo dell’orbita diventa sempre più grande, per
due ragioni: man mano che r aumenta, (1) l’orbita diventa sempre più lunga e (2)
viene percorsa sempre più lentamente.
Sapendo che:
⎥⎦
⎤⎢⎣
⎡ ⋅⋅= −
2
211
KgmN1067.6G
[ ]Kg1098.5m 24T ⋅=
[ ]m1016.71078.01038.6hrr 666T ⋅=⋅+⋅=+=
dove, evidentemente, Tr è il raggio della Terra e h è l’altezza del satellite dalla
superficie terrestre.
Dai calcoli si ottiene: ⎥⎦⎤
⎢⎣⎡=⎥⎦
⎤⎢⎣⎡=
hKm5.26869
sm75.7463v .
Si noti che quella appena calcolata rappresenta la velocità effettiva di un satellite
che percorre un’orbita circolare di raggio 61016.7 ⋅ metri intorno alla Terra. In
realtà un osservatore terrestre vede il satellite spostarsi ad una velocità diversa, a
causa del moto di rotazione della Terra stessa attorno al proprio asse. La velocità
percepita da terra dipende sia dal piano dell’orbita sia dal senso (orario o anti-
orario) di rivoluzione del satellite.
Si prenda, al solito, come esempio un satellite del sistema IRIDIUM; il piano
dell’orbita satellitare forma un angolo di 90° con il piano equatoriale (inclinazione
90°), come si può notare dalla fig. 3.8. Ciò significa che, da un qualunque punto
della superficie terrestre, il satellite sembrerà muoversi con una velocità
leggermente maggiore di quella calcolata in precedenza (a prescindere dal senso
di rivoluzione del satellite stesso). Dal momento che la differenza tra le velocità è
abbastanza piccola (si consideri che la Terra ruota attorno al proprio asse ad una
Capitolo 3 Algoritmo MVDR adattativo
105
velocità di circa ⎥⎦⎤
⎢⎣⎡
sm465 cioè 16 volte inferiore alla velocità effettiva di
rivoluzione del satellite), nel seguito si preferisce trascurarla.
Fig. 3.8: costellazione di satelliti del sistema IRIDIUM
Dalla formula della velocità del moto circolare uniforme:
T
r2v π= (3.20)
si può ricavare il periodo T dell’orbita:
v
r2T π= (3.21)
che in questo caso è: [ ] s5.27min40h1s5.6027T == .
Con una semplice relazione di proporzione si può ricavare che un satellite, con
tale periodo, in appena 1 minuto compie uno spostamento di 3.58°.
In precedenza si è detto che i satelliti non geostazionari possono essere assimilati
a sorgenti di RFI in movimento rispetto ad un utente sulla Terra: questo moto
relativo tra satellite e ricevitore è la causa dell’insorgere del cosiddetto effetto
Doppler. Esso si manifesta in uno scostamento di frequenza del segnale e, per
questo, condiziona in maniera significativa l’elaborazione dei segnali.
Capitolo 3 Algoritmo MVDR adattativo
106
In figura 3.9 è illustrata la situazione cui ci si trova di fronte: si supponga che il
satellite si trovi nel punto S e l’utente sia collocato in U. Lo spostamento di
frequenza per effetto Doppler (o Doppler Shift) è dovuto alla proiezione della
velocità del satellite sv sulla congiungente utente-satellite, vale a dire dv , che
può essere ricavata dalla relazione:
βsinvv sd ⋅= (3.22)
Fig. 3.9: schematizzazione della situazione in cui si origina l’effetto Doppler
Una volta calcolata la velocità Doppler dv , lo spostamento di frequenza dovuto a
tale effetto può essere valutato mediante la relazione:
cvf
f dcd
⋅= (3.23)
dove cf è la frequenza della portante mentre ⎥⎦⎤
⎢⎣⎡⋅=
sm1099792459.2c 8 è la
velocità della luce.
Capitolo 3 Algoritmo MVDR adattativo
107
Quando β assume i valori limite di °± 90 , dv raggiunge il suo valore massimo
sd vvmax
= , generando il massimo spostamento Doppler maxdf :
c
vff max
max
dcd
⋅= (3.24)
Nel modello di simulazione dinamico, che verrà illustrato nella sezione
successiva, non si terrà conto dell’effetto Doppler, in quanto la trattazione delle
contromisure da prendere per contrastare questo fenomeno non rientra nei limiti
preposti in questo lavoro.
3.4.2 Modello dinamico con Simulink Il modello che si intende realizzare deve rappresentare in maniera abbastanza
fedele (anche se, come si è visto, sono state introdotte alcune semplificazioni
pratiche) una sorgente di segnali in movimento, che nel caso in esame è un
satellite del sistema IRIDIUM.
Una volta avviato Simulink nel modo già spiegato precedentemente, occorre
creare un nuovo modello:
− o con un clic del mouse sull’icona che somiglia ad un foglio di carta
vuoto;
− oppure selezionando l’opzione New dal menu File del browser di
Simulink.
Si aprirà la finestra Untitled nella quale si può creare il nuovo modello. Nel
browser si selezioni la categoria di blocchi Sources (cliccando una volta): nella
parte destra della finestra saranno visualizzati i blocchi disponibili per la categoria
selezionata. Si clicchi sul nome o sull’icona del blocco Signal Builder e, tenendo
premuto il pulsante del mouse, si trascini il blocco nella finestra del nuovo
modello, infine si rilasci il pulsante del mouse.
Si noti che, quando si clicca sul nome di un blocco, nella parte superiore della
finestra del browser appare una breve descrizione della funzione svolta dal blocco
Capitolo 3 Algoritmo MVDR adattativo
108
selezionato. E’ inoltre possibile accedere alla guida on-line di un blocco, facendo
clic con il pulsante destro del mouse sul nome o sull’icona del blocco e
selezionando Help dal menu che appare sullo schermo.
Si clicchi due volte sul blocco Signal Builder che si trova nella finestra del nuovo
modello: apparirà una nuova schermata identificata dalla scritta “Signal Builder
(untitled/Signal Builder)” in cui viene rappresentato nel tempo un segnale di tipo
impulso rettangolare denominato “Signal 1”.
Si aggiunga al segnale presente di default un segnale costante: o si preme il
bottone nel menu generale dei comandi in alto a sinistra oppure bisogna
cliccare su Signal→New→Constant sempre nel suddetto menu.
Sotto a “Signal 1” si troverà un segnale che mantiene costantemente nel tempo un
valore pari a 0 e denominato “Signal 2”. Ora è possibile eliminare “Signal 1” che
non serve nel modello che si vuole creare: si posizioni il mouse all’interno del
grafico che rappresenta “Signal 1” e, dopo aver cliccato con il tasto destro del
mouse, si clicchi su Delete. In questo modo nella schermata del Signal Builder
sarà presente solo il segnale costante (“Signal 2”), che comunque si può
rinominare a piacimento (si clicchi una volta su Signal 2 (shown) in basso a destra
e si modifichi il nome nel campo Name in basso a sinistra).
E’ necessario a questo punto cambiare l’intervallo temporale (in secondi)
riportato sull’asse delle ascisse (Time (sec)), cliccando nel solito menu
Axes→Change time range.. e poi settando i valori corretti nei campi Min time e
Max time; nel caso in esame si è scelto di inserire Min time = 0 e Max time = 1000
in modo da poter definire successivamente l’andamento di un segnale nell’arco di
1000 secondi. In maniera simile si devono modificare i valori limite visualizzati
sull’asse delle ordinate: dopo aver premuto Axes→Set Y display limits.., si
possono settare i valori desiderati nei campi Minimum e Maximum; nel modello si
è considerato un range che va da -90 a +90.
Il segnale costante (precedentemente creato) può essere trasformato in un segnale
variabile linearmente nel tempo cambiando solo la posizione in ordinata dei suoi
punti estremi: questo si può fare cliccando il punto estremo che si vuole spostare
Capitolo 3 Algoritmo MVDR adattativo
109
e, tenendo premuto il pulsante del mouse, trascinandolo verticalmente nella
posizione desiderata. Nel modello si è preso in considerazione un segnale che
variasse tra -50 e 9.6667 in un tempo di 1000 secondi, come illustrato in fig. 3.10.
I valori in ordinata non sono stati scelti a caso: si consideri innanzitutto che il
segnale che si vuole generare nel modello deve rappresentare lo spostamento
continuo nel tempo di un satellite, in termini di variazione della DOA ( [°] ) del
segnale da esso emesso. La durata temporale del segnale creato nel modello è
stata stabilita arbitrariamente (1000 sec) e, ricordando la velocità di spostamento
di un satellite IRIDIUM, 3.58 °/min, si è calcolato che, in un tale intervallo
temporale (equivalente a 16 min e 40 sec), il satellite si spostasse di circa 60°; il
valore di partenza della DOA (-50°) è stato scelto anch’esso arbitrariamente.
Fig. 3.10: segnale che rappresenta la variazione lineare nel tempo della DOA del segnale di un
satellite IRIDIUM
Capitolo 3 Algoritmo MVDR adattativo
110
Per completare lo schema di simulazione, si segua questo procedimento, facendo
riferimento alla figura 3.11 (finestra del modello che si vuole creare):
Fig. 3.11: finestra del modello di Simulink
1. si selezioni e si inserisca il blocco Scope dalla libreria Sinks. Si
colleghi poi la porta di output del blocco Signal Builder alla porta di
input del blocco Scope. Per fare questo, si posizioni il cursore sulla
porta di input o di output; il cursore assumerà la forma di una freccia;
tenendo premuto il pulsante del mouse, si trascini il cursore sulla porta
dell’altro blocco. Simulink collegherà le porte con una freccia che
punta alla porta di input.
2. Si selezioni e si inserisca il blocco To Workspace dalla libreria Sinks e
il blocco Clock dalla libreria Sources.
3. Si selezioni e si inserisca il blocco Mux dalla libreria Signal Routing;
si faccia doppio clic su questo blocco e si imposti Number of inputs a
2; si faccia clic su Ok.
Capitolo 3 Algoritmo MVDR adattativo
111
4. Si colleghi la porta di input inferiore del blocco Mux alla porta di
output del blocco Clock e si colleghi la porta di input del blocco To
Workspace alla porta di output del blocco Mux. Per effettuare l’ultimo
collegamento, si posizioni il cursore sulla porta di input superiore del
blocco Mux e, tenendo premuto il pulsante del mouse, si trascini il
cursore sulla linea che collega il blocco Signal Builder al blocco
Scope. Il modello adesso dovrebbe essere simile a quello illustrato
nella figura 3.11.
5. Si clicchi 2 volte sul blocco To Workspace. Si può specificare
qualsiasi nome di variabile come output; la variabile di default è
simout. Si cambi il suo nome in y nel campo di testo Variable name. Si
specifichi Array come formato di salvataggio nello spazio Save
format. Si utilizzino i valori di default per gli altri parametri (che
devono essere inf, 1, -1, rispettivamente, per Limit data points to last,
Decimation e Sample time (-1 for inherited). Si faccia clic su Ok.
Tramite il blocco To Workspace si possono esportare i risultati della
simulazione nel workspace di Matlab, dove potranno essere utilizzati
come veri e propri dati di ingresso.
Prima di eseguire la simulazione è necessario impostare alcuni parametri.
Ciò che alla fine della simulazione interessa avere è un insieme discreto di valori
(raccolti poi in un array), ciascuno dei quali rappresenti l’angolo di arrivo del
segnale emesso dalla sorgente in movimento (in questo caso il satellite) in
corrispondenza di un insieme discreto di istanti di tempo.
La discretizzazione del segnale tempo continuo generato precedentemente
attraverso il blocco Signal Builder può essere raggiunta settando un determinato
valore in Sample time (dalla finestra del Signal Builder si clicchi in
File→Simulation options); nel modello sotto studio si è posto arbitrariamente un
Sample time pari a 20 [s].
Bisogna anche stabilire il tempo di inizio e il tempo di arresto della simulazione:
dalla finestra del modello si vada in Simulation→Configuration
Capitolo 3 Algoritmo MVDR adattativo
112
Parameters..→Solver e si settino i valori di Start time e Stop time. Si è stabilito di
fermare la simulazione ad un tempo di 980 s (Start time è ovviamente posto a 0),
in quanto si volevano avere 50 valori discreti di DOA (980/20 = 49 più il valore
all’istante 0). Inoltre vanno fissati alcuni altri parametri nella stessa finestra,
secondo l’indicazione di fig. 3.12.
Fig. 3.12: finestra in cui vengono settati i parametri del solutore numerico della simulazione
In generale, la variabile di output del blocco To Workspace sarà una matrice
avente tante righe quanti sono i passaggi della simulazione e tante colonne quanti
sono gli input del blocco.
La configurazione adottata per la simulazione da effettuare produrrà come uscita
del blocco To Workspace (la variabile di output y) una matrice con 2 colonne
(ciascuna colonna è un array di valori). La prima conterrà i valori discreti delle
DOAs (in questo caso sono 50 valori), la seconda i corrispondenti istanti di tempo.
Si noti che gli istanti di tempo presenti nella seconda colonna di y vengono
generati dal blocco Clock, che infatti è il secondo ingresso di To Workspace.
Clock ha un parametro: Decimation, che stabilisce ogni quanti step temporali
Capitolo 3 Algoritmo MVDR adattativo
113
della simulazione generare in output il tempo. Nel caso esaminato Decimation va
impostato a 20.
Ora è tutto pronto per avviare la simulazione: o cliccando su Simulation nella
finestra del modello e selezionando Start; oppure premendo il bottone nella
barra degli strumenti della stessa finestra.
La fine della simulazione sarà segnalata dal suono di una campana. Con un
doppio clic sul blocco Scope è possibile immediatamente rendersi conto se il
segnale prodotto è proprio quello cercato.
Dopo aver cliccato l’icona del binocolo di Scope per abilitare la scala automatica,
nel caso in esame si può osservare la seguente figura:
Fig. 3.13: visualizzazione, attraverso il blocco Scope, del segnale prodotto a seguito della
simulazione
Capitolo 3 Algoritmo MVDR adattativo
114
Aprendo la finestra del Workspace di Matlab, si può constatare la presenza
dell’array y, creato a seguito della simulazione e importato grazie al blocco To
Workspace del modello di Simulink; l’array stesso è direttamente visualizzabile
mediante un duplice clic: ciò che si ottiene è esattamente questo (fig. 3.14):
Fig. 3.14: visualizzazione dell’array y nel Workspace di Matlab
Qualunque programma di Matlab vede questo array come un dato di ingresso e,
perciò, può accedere agli elementi in esso contenuti.
Capitolo 3 Algoritmo MVDR adattativo
115
3.5 Simulazioni
In questo paragrafo vengono illustrate alcune simulazioni condotte in ambiente
MATLAB per saggiare le prestazioni dell’algoritmo MVDR adattativo in
situazioni emblematiche. Si introdurranno gradualmente prove di complessità
crescente aumentando il numero di interferenti, variando il numero di sensori e,
infine, valutando gli effetti prodotti dai lobi di grating nel caso particolare di
BEST-1.
3.5.1 Caso statico Per questo tipo di simulazioni verranno prese in considerazione solo sorgenti di
RFI in posizioni fissate dello spazio.
3.5.1.1 Esempio 1
Si faccia riferimento alla situazione riassunta in tab. 3.1
Tab. 3.1: valori assunti dai parametri principali nell’Esempio 1
Si hanno dunque 8 sensori ideali equispaziati ad una distanza di λ/2 in
corrispondenza della frequenza massima del segnale ( 2/ff cM = ).
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -50° -10° +50° Ampiezze RFI 2 4 3 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
116
L’osservazione dura complessivamente 1000 campioni e in figura 3.15 viene
visualizzata la matrice dei dati grezzi: si notano le striature oblique che indicano
la presenza di RFI.
Fig. 3.15: matrice dei dati grezzi per l’Esempio 1
In figura 3.16 viene visualizzato nel dominio del tempo il segnale in uscita dal
primo sensore dell’array: si vedono chiaramente i segnali sovrapposti al rumore di
sistema.
Fig. 3.16: segnale in uscita dal primo sensore (dominio del tempo) per l’Esempio 1
Capitolo 3 Algoritmo MVDR adattativo
117
Un quadro più chiaro dello scenario viene fornito in fig. 3.17, dove lo stesso
segnale di fig. 3.16 viene riportato nel dominio della frequenza. Si osservi la
presenza di 3 RFI nella banda di osservazione.
Fig. 3.17: segnale in uscita dal primo sensore (dominio della frequenza) per l’Esempio 1
I primi 200 campioni (contenuti nella matrice dei dati grezzi) vengono utilizzati
per effettuare una stima della matrice di covarianza (fig. 3.18).
Fig. 3.18: rappresentazione grafica della matrice di covarianza per l’Esempio 1
Capitolo 3 Algoritmo MVDR adattativo
118
Dal calcolo dei coefficienti ottimi, secondo la 3.15, risulta il beampattern di figura
3.19.
Fig. 3.19: beampattern ottenuto mediante MVDR adattativo per l’Esempio 1
3.5.1.2 Esempio 2
Si introduca una quarta interferenza nello scenario considerato nell’Esempio 1,
come specificato in tab. 3.2.
Tab. 3.2: valori assunti dai parametri principali nell’Esempio 2
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -50° -10° +50° +5° Ampiezze RFI 2 4 3 5 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf 0.40 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
119
Questa interferenza proviene comunque da una direzione che non cade all’interno
dell’apertura BWFN del main beam, che in questo caso è (si veda il paragrafo A.1
dell’appendice A):
[ ] °==⋅
=⋅
≅ 65.28rad5.0
218
2dN
2BWFNλ
(3.25)
Ciò è evidente dal momento che la “distanza angolare” che separa la DOA della
nuova interferenza dalla direzione di puntamento è maggiore di °= 32.142
BWBF .
La spaziatura esistente tra i due angoli di arrivo è tale da non generare problemi
nel puntamento della radiosorgente, come si può constatare dal beampattern
risultante (fig. 3.20).
Fig. 3.20: beampattern ottenuto mediante MVDR adattativo per l’Esempio 2
Se però la stessa interferenza proviene da una direzione che cade all’interno
dell’apertura BWFN del main beam, il beamformer MVDR adattativo porrà uno
zero in corrispondenza di tale DOA, producendo così gravi distorsioni al main
lobe. In questo caso non è possibile effettuare correttamente, mediante semplice
Capitolo 3 Algoritmo MVDR adattativo
120
filtraggio spaziale, un’osservazione astronomica senza che questa sia affetta da
disturbi. In fig. 3.21 viene riportato il beampattern che si ottiene qualora la DOA
della quarta interferenza passi da °+= 54θ a °+= 104θ e mantenendo le stesse
condizioni di prima.
Fig. 3.21: beampattern ottenuto mediante MVDR adattativo per l’Esempio 2 con °+= 104θ
Si noti dal dettaglio presente qui sotto (fig. 3.22) come il beam non risulti più
puntare la direzione voluta °+= 200θ .
Fig. 3.22: ingrandimento del beampattern di fig. 3.21
Capitolo 3 Algoritmo MVDR adattativo
121
La distorsione è tanto maggiore quanto più la DOA dell’interferenza si avvicina
alla direzione di puntamento (figg. 3.23 e 3.24 con °+= 154θ ).
Fig. 3.23: beampattern ottenuto mediante MVDR adattativo per l’Esempio 2 con °+= 154θ
Fig. 3.24: ingrandimento del beampattern di fig. 3.23
Confrontando le figg. 3.21 e 3.23 con la fig. 3.20, si può rilevare come
l’avvicinamento fra le due DOA produce anche un innalzamento dei lobi
Capitolo 3 Algoritmo MVDR adattativo
122
secondari, soprattutto per quanto riguarda quello a sinistra del lobo principale e
quelli agli estremi dell’asse spaziale.
3.5.1.3 Esempio 3
Nell’esempio precedente si è visto che, con N=8 sensori, si possono cancellare
quattro segnali interferenti senza alterare l’andamento del lobo principale, se
questi provengono da direzioni che non rientrano all’interno dell’apertura BWFN
del lobo stesso. Nasce spontaneo ora domandarsi quali siano gli effetti dovuti ad
un aumento del numero di RFI che giungono da direzioni esterne alla sopra citata
apertura (del beam).
Si considerino inizialmente cinque interferenze, come indicato in tab. 3.3.
Tab. 3.3: valori assunti dai parametri principali nell’Esempio 3
Dal beampattern che ne deriva (fig. 3.25) non si notano deformazioni del beam né
un particolare aumento di livello nei lobi secondari.
Aggiungendo un’altra RFI con angolo di arrivo °+= 806θ , ampiezza 2[V] e
frequenza cf35.0 , si ottiene il beampattern di fig. 3.26, in cui si comincia ad
osservare (vedi ingrandimento a fianco) un leggero spostamento del beam (poco
più di un grado).
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -50° -10° +50° -30° +40° Ampiezze RFI 2 4 3 5 4 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf 0.40 cf 0.20 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
123
Fig. 3.25: beampattern ottenuto mediante MVDR adattativo per l’Esempio 3
Fig. 3.26: beampattern ottenuto mediante MVDR adattativo per l’Esempio 3 con l’aggiunta di una
sesta interferenza con °+= 806θ , ampiezza 2[V], frequenza cf35.0 (sinistra) e relativo
ingrandimento (destra)
L’aumento progressivo di una e poi due sorgenti interferenti, allo scenario
considerato precedentemente, produce rispettivamente i seguenti risultati (fig.
3.27 e fig. 3.28). Nel primo caso è stata introdotta una RFI con °= 07θ , ampiezza
Capitolo 3 Algoritmo MVDR adattativo
124
1[V] e frequenza cf15.0 ; nel secondo, oltre a quest’ultima, ne è stata aggiunta
un’altra con °−= 708θ , ampiezza 3[V] e frequenza cf45.0 .
Fig. 3.27: beampattern ottenuto mediante MVDR adattativo per l’Esempio 3 con l’aggiunta di due
RFI con, rispettivamente, °+= 806θ , ampiezza 2[V], frequenza cf35.0 e °= 07θ , ampiezza 1[V],
frequenza cf15.0 (sinistra) e relativo ingrandimento (destra)
Fig. 3.28: beampattern ottenuto mediante MVDR adattativo per l’Esempio 3 con l’aggiunta di tre
RFI con, rispettivamente, °+= 806θ , ampiezza 2[V], frequenza cf35.0 , °= 07θ , ampiezza 1[V],
frequenza cf15.0 e °−= 708θ , ampiezza 3[V], frequenza cf45.0 (sinistra) e relativo
ingrandimento (destra)
Nel passaggio da 6 a 7 (lo stesso vale anche per 8) interferenti, si ha un lieve
peggioramento nell’andamento del lobo principale che si sposta di 2.5-3°.
Capitolo 3 Algoritmo MVDR adattativo
125
In ultima analisi, ci si può facilmente accorgere che, pur avendo ipotizzato di
avere 8 RFI all’ingresso del sistema, solamente 7 di queste vengono
effettivamente cancellate dal beamformer. Da questo si può dedurre che, con N
sensori, si possono eliminare fino a N-1 segnali interferenti; tale numero andrebbe
ridotto (N/2-N/2+1) se si vuole mantenere un allineamento perfetto del beam con
la direzione di puntamento.
3.5.1.4 Esempio 4
Quando la spaziatura tra i sensori è maggiore di 2λ , le DOA risultano essere
equivocate ed allo stesso steering vector possono essere associate più DOA
distinte. L’esempio che segue riproduce una di queste situazioni. In tab. 3.4
vengono riportati i parametri di simulazione.
Tab. 3.4: valori assunti dai parametri principali nell’Esempio 4
In questo esempio le DOA delle RFI ( °−= 331θ e °+= 142θ ) cadono all’esterno
dei lobi di grating e la soluzione si dimostra essere accettabile. In fig. 3.29 viene
mostrato il beampattern ottenuto dal calcolo dei coefficienti ottimi, assieme ai
suoi ingrandimenti in corrispondenza della DOA del segnale utile ( °+= 20θ ) e di
quelle delle radiointerferenze. Nei grafici degli ingrandimenti viene proposto
Parametro Valore
Numero sensori 4 Tipo sensore ideale Spaziatura sensori 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI -33° +14° Ampiezze RFI 2 4 Frequenze RFI 0.10 cf 0.25 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
126
anche il beampattern ottenuto mediante beamformer classico per meglio rendersi
conto dell’effettiva posizione degli zeri rispetto ai lobi di grating.
Fig. 3.29: beampattern ottenuto mediante MVDR adattativo per l’Esempio 4 e relativi dettagli
nell’intorno della direzione di osservazione ( °+= 20θ ) e di quelle di provenienza delle due RFI
( °−= 331θ e °+= 142θ )
Nel caso in cui una RFI dovesse avere una direzione di arrivo che rientra
nell’apertura BWFN di un lobo di grating, si verrebbe a ricreare la stessa
spiacevole situazione descritta nell’Esempio 2 (con °+= 104θ e °+= 154θ ): il
posizionamento di uno zero causa una distorsione del main lobe e ciò rende
inaccettabile il beamformer trovato.
In fig. 3.30 viene riportato il beampattern che si ottiene nelle stesse condizioni di
prima, con la sola differenza che °+= 162θ anziché °+= 142θ ; vengono proposti
a fianco anche i dettagli in corrispondenza delle direzioni 0θ , 1θ e 2θ .
Capitolo 3 Algoritmo MVDR adattativo
127
Fig. 3.30: beampattern ottenuto mediante MVDR adattativo per l’Esempio 4 con °+= 162θ
anziché °+= 142θ e relativi dettagli nell’intorno della direzione di osservazione ( °+= 20θ ) e di
quelle di provenienza delle due RFI ( °−= 331θ e °+= 162θ )
3.5.1.5 Esempio 5
L’ultimo esempio trattato è particolarmente interessante per la configurazione
adottata: N=4 antenne equispaziate di d=8λ, la stessa esistente nel caso BEST-1.
Sebbene nell’esempio siano state considerate antenne ideali, le considerazioni
fatte possono essere estese facilmente anche a BEST-1, dal momento che i
beampattern mostrati non sono altro che i fattori di gruppo per BEST-1 (vedi
paragrafo A.2 dell’appendice A). Per calcolare i beampattern complessivi,
dunque, occorre tenere in considerazione anche la direttività delle singole
antenne, le quali non sono affatto omnidirezionali.
Capitolo 3 Algoritmo MVDR adattativo
128
L’esempio che viene ora illustrato riporta i diversi effetti che possono essere
originati dalle antenne non ideali.
I parametri di simulazione sono indicati in tabella 3.5.
Tab. 3.5: valori assunti dai parametri principali nell’Esempio 5
Si osservi il segnale ricevuto dalla prima antenna nel dominio della frequenza
(fig. 3.31).
Fig. 3.31: segnale in uscita dalla prima antenna nel dominio della frequenza per l’Esempio 5
(BEST-1)
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +19° -50° +30° Ampiezze RFI 2 4 6 Frequenze RFI 0.05 cf 0.25 cf 0.15 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Capitolo 3 Algoritmo MVDR adattativo
129
Analizzando attentamente la figura di sopra si nota un’apparente anomalia: la
mancanza della terza interferenza, quella di maggiore intensità, a frequenza
0.15 cf . Questo fatto si spiega facilmente, andando ad osservare la sua DOA
( °+= 303θ ) ed il diagramma di direttività di una singola antenna di BEST-1 (fig.
3.32, per maggiori dettagli si rimanda ancora una volta all’appendice A).
Fig. 3.32: beampattern di una singola antenna dell’array di BEST-1
L’interferenza cade proprio in prossimità di uno zero naturale del beampattern
dell’antenna e, pertanto, viene abbattuta. E’ possibile fare anche un’altra
considerazione sempre osservando la fig. 3.31: l’interferenza di maggiore
intensità non è più la seconda ma la prima, infatti quest’ultima gode
maggiormente del guadagno offerto dall’antenna in direzione 1θ .
Dal calcolo dei coefficienti ottimi risulta il fattore di gruppo riportato in fig. 3.33,
in cui, attraverso opportuni ingrandimenti, si osserva il corretto puntamento del
beam a °+= 20θ ed il posizionamento degli zeri in °+= 191θ , °−= 502θ ed in
tutte le corrispondenti direzioni spaziali equivocate.
Il beampattern finale che se ne ricava, tenendo conto della direttività delle
antenne, è quello riportato in fig. 3.34 (a fianco sono presenti, come al solito, i
dettagli relativi alla DOA del segnale utile e a quelle delle RFI).
Capitolo 3 Algoritmo MVDR adattativo
130
Fig. 3.33: fattore di gruppo e relativi ingrandimenti ottenuti per l’Esempio 5 (caso BEST-1)
Fig. 3.34: beampattern finale e relativi ingrandimenti ottenuti per l’Esempio 5 (caso BEST-1)
Capitolo 3 Algoritmo MVDR adattativo
131
3.5.1.6 Esempio 6
Si consideri il caso schematizzato in tab. 3.6.
Tab. 3.6: valori assunti dai parametri principali nell’Esempio 6
In questo esempio un’interferenza risulta provenire da °+= 242θ , proprio in
corrispondenza di un lobo di grating del fattore di gruppo dell’array (fig. 3.35).
Il beamformer MVDR adattativo pone uno zero in corrispondenza di 2θ , ma
questo viene replicato anche nel main beam ( °+= 20θ ), il quale, esattamente
come nell’Esempio 4 (con °+= 162θ ), viene fortemente distorto (fig. 3.36),
rendendo impossibile un’osservazione radioastronomica corretta mediante sole
tecniche di filtraggio spaziale.
Si tenga presente che la coincidenza tra la DOA di un’interferenza e un lobo di
grating si può presentare tanto più frequentemente quanto maggiore è la
spaziatura tra i sensori.
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +12° +24° Ampiezze RFI 2 4 Frequenze RFI 0.05 cf 0.25 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Parametro Valore
Capitolo 3 Algoritmo MVDR adattativo
132
Fig. 3.35: dettaglio del fattore di gruppo per l’Esempio 6 (BEST-1)
Fig. 3.36: dettaglio del beampattern per l’Esempio 6 (BEST-1)
3.5.1.7 Esempio 7
Nell’ultima prova di simulazione in ambito statico, si desidera mostrare come
risponde l’algoritmo MVDR adattativo, in una situazione con tre segnali
interferenti (ciascuno dei quali proviene da una DOA esterna ai lobi di grating del
fattore di gruppo dell’array) e ancora nella stessa configurazione propria
dell’array BEST-1 (tab. 3.7).
Capitolo 3 Algoritmo MVDR adattativo
133
Tab. 3.7: valori assunti dai parametri principali nell’Esempio 7
Come si può verificare dalla figura 3.37, la presenza di 3 RFI causa un piccolo
spostamento (≈ 0.2°) del beam.
Fig. 3.37: beampattern e corrispondente dettaglio per l’Esempio 7 (BEST-1)
Se al set di valori relativi ai parametri dell’Esempio 7 si sostituisce °+= 272θ al
posto di °+= 282θ , quello che si ricava è rappresentato in fig. 3.38: la variazione
di un solo grado nella DOA di un interferente è causa di un’ulteriore traslazione
del beam (≈ 0.3°).
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +6° +28° -2° Ampiezze RFI 2 4 6 Frequenze RFI 0.05 cf 0.25 cf 0.15 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Capitolo 3 Algoritmo MVDR adattativo
134
Questo fa capire quanto il sistema BEST-1 sia sensibile anche ai più piccoli
spostamenti degli angoli di arrivo dei segnali interferenti verso i più volte citati
lobi di grating del fattore di gruppo.
Fig. 3.38: beampattern e corrispondente dettaglio per l’Esempio 7 con °+= 272θ (BEST-1)
3.5.2 Caso dinamico
Le simulazioni che verranno da qui in avanti effettuate hanno come obiettivo
principale quello di testare e valutare le proprietà di adattività dell’algoritmo
MVDR in condizioni dinamiche: verranno prese in esame, infatti, nel contempo
sorgenti di RFI sia fisse che in movimento. Per poter rappresentare
realisticamente queste ultime, ci si appoggerà ad un modello di simulazione
dinamico realizzato mediante Simulink, come già riferito nel paragrafo 3.4.
3.5.2.1 Esempio 8
La prima prova eseguita fa riferimento allo scenario descritto in tab. 3.8.
Si è ipotizzato di avere 8 sensori ideali equidistanziati l’uno dall’altro di λ/2 alla
frequenza Mf e si è impostato un tempo di osservazione complessivo di 100000
campioni. D’altra parte, come già spiegato nella sezione 3.4.2, si è stabilito di
considerare, nel modello di Simulink, un tempo di simulazione pari a 1000 sec:
questo implica una velocità di campionamento di 100 campioni/sec.
Capitolo 3 Algoritmo MVDR adattativo
135
A due RFI in posizioni fissate dello spazio (rispettivamente con DOA di valore
°−= 801θ e °−= 602θ ), si è deciso di affiancare una sorgente di interferenza
mobile, delle cui caratteristiche si è già ampiamente discusso nella sezione 3.4.1.
Tab. 3.8: valori assunti dai parametri principali nell’Esempio 8
Inoltre si è scelto di utilizzare 2000 campioni per la stima della matrice R.
Di conseguenza, ricordando l’ipotesi di stazionarietà in senso lato dei segnali in
gioco nell’intervallo di tempo in cui R̂ viene calcolata (vedi paragrafo 3.3), si è
supposto implicitamente che il sistema ricevente non percepisse lo spostamento
angolare della terza RFI nell’arco temporale definito da 2000 campioni
(equivalente a 20 sec). Questa supposizione è peraltro ragionevole se si tiene
conto che in 20 sec un satellite di quelli considerati nel modello si sposta di
appena 1.19° .
Durante la simulazione, al termine di ogni iterazione in cui viene ricalcolata la
matrice R̂ , viene generato un grafico che rappresenta il beampattern complessivo
del sistema. Ciascun grafico mostra chiaramente come il beamformer MVDR si
adatti dinamicamente allo spostamento nel tempo della terza RFI, ponendo uno
zero proprio in corrispondenza della DOA da cui progressivamente essa proviene.
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +30° DOA RFI -80° -60° [-50° 9.6667°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
136
Per ovvi motivi, di seguito (fig. 3.39) si riporta solamente un numero limitato di
grafici, quanto basta comunque per accertare l’adattività dell’algoritmo in
questione.
Fig. 3.39: sequenza dei beampattern dell’algoritmo MVDR adattativo per l’Esempio 8
Per evidenziare la notevole precisione con cui l’algoritmo insegue il terzo segnale
interferente, si fornisce il confronto tra i valori assunti dalla DOA di quest’ultimo
Capitolo 3 Algoritmo MVDR adattativo
137
(tab. 3.9), determinati attraverso calcoli analitici, e la posizione dello zero
corrispondente, via via piazzato dall’algoritmo, al variare del tempo (fig. 3.40).
1 10 20 30 40 50 -50 -39.26 -27.327 -15.393 -3.46 8.4733 0 180 380 580 780 980
Tab. 3.9: valori assunti dalla DOA del terzo segnale interferente in corrispondenza delle iterazioni
considerate
Fig. 3.40: ingrandimenti dei beampattern di fig. 3.39 in corrispondenza delle DOA di tab. 3.9
Iterazione n° DOA [°] Istante temporale [sec]
Capitolo 3 Algoritmo MVDR adattativo
138
3.5.2.2 Esempio 9
Una simulazione del tutto analoga a quella dell’esempio precedente può essere
compiuta nel caso di BEST-1.
Ai parametri principali di simulazione vengono attribuiti i valori indicati in tab.
3.10.
Tab. 3.10: valori assunti dai parametri principali nell’Esempio 9
Siccome il sistema BEST-1 è sottoposto al vincolo °≤ 59.30θ , per il puntamento
si è scelto un angolo di 2°. Inoltre, per la DOA del secondo segnale interferente
(quello in movimento), si è stabilito [-70° -10.3333°] come range di variabilità, in
modo tale che le direzioni di provenienza del segnale utile e dell’interferenza non
si andassero a sovrapporre tra loro. Il primo segnale interferente ha una direzione
di arrivo che non crea problemi al beam, in quanto non cade all’interno di un lobo
di grating del fattore di gruppo dell’array di antenne. Anche in questo caso si
mostrano i risultati della simulazione per un n° limitato di iterazioni (tab. 3.11).
Tab. 3.11: valori assunti dalla DOA del 2° segnale interferente per le iter. considerate nell’Es. 9
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +2° DOA RFI +6° [-70° -10.3333°] Ampiezze RFI 2 4 Frequenze RFI 0.05 cf 0.25 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Iterazione n° DOA [°] Istante temporale [sec]
1 10 20 30 40 50 -70 -59.26 -47.33 -35.393 -23.46 -11.53 0 180 380 580 780 980
Capitolo 3 Algoritmo MVDR adattativo
139
Di seguito vengono riportati i grafici dei beampattern ottenuti
corrispondentemente alle iterazioni considerate; ognuno è associato al proprio
ingrandimento nell’intorno del beam, per rendere più evidente la sua
deformazione durante lo spostamento dell’interferente (figg. 3.41 e 3.42).
Fig. 3.41: beampattern e relativi ingrandimenti nell’intorno del beam per le prime 3 iterazioni
considerate nell’Esempio 9 (BEST-1)
Capitolo 3 Algoritmo MVDR adattativo
140
Fig. 3.42: beampattern e relativi ingrandimenti nell’intorno del beam per le ultime 3 iterazioni
considerate nell’Esempio 9 (BEST-1)
3.5.2.3 Esempio 10
Attraverso quest’ultima simulazione si vuole mettere alla prova l’algoritmo
adattativo, in presenza di un segnale interferente caratterizzato da una velocità di
spostamento angolare maggiore rispetto a quella considerata in precedenza.
Capitolo 3 Algoritmo MVDR adattativo
141
Si prenda, ad esempio, una velocità pari a 4.77°/min (anziché 3.58°/min); questa
volta, mantenendo sempre valida l’ipotesi che spostamenti inferiori a 1.19° non
sono rilevati dal sistema ricevente, è necessario ricalcolare periodicamente R̂
ogni 1500 campioni (o, equivalentemente, 15 sec). Con tale velocità, la sorgente
di RFI in movimento compie, in un tempo di osservazione ancora di 100000
campioni (1000 sec), un’escursione d’angolo di circa 80°.
Si utilizzino i valori indicati in tabella 3.12 per i principali parametri di
simulazione.
Tab. 3.12: valori assunti dai parametri principali nell’Esempio 10
I risultati conseguiti al termine della simulazione (fig. 3.43) dimostrano che il
beamformer MVDR adattativo non viene messo in crisi da una sorgente di RFI
con tale velocità di spostamento, dando prova di ottima capacità di reiezione di
RFI, anche in ambiente dinamico; a tal proposito si confrontino i valori in tab.
3.13 con i grafici in fig. 3.44.
Tuttavia, analizzando l’insieme dei beampattern ottenuti, si può notare un leggero
scostamento del lobo principale dalla DOA del segnale utile, al termine di alcune
iterazioni della simulazione, soprattutto nella parte iniziale.
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 1500 DOA puntamento +50° DOA RFI -80° -60° [-50° 29.556°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 3 Algoritmo MVDR adattativo
142
Fig. 3.43: sequenza dei beampattern dell’algoritmo MVDR adattativo per l’Esempio 10
Capitolo 3 Algoritmo MVDR adattativo
143
Tab. 3.13: valori assunti dalla DOA del 3° segnale interferente per le iter. considerate nell’Es. 10
Fig. 3.44: ingrandimenti dei beampattern di fig. 3.43 in corrispondenza delle DOA di tab. 3.13
Iterazione n°
DOA [°]
Istante temporale [sec]
1 10 20 30 40 50 60 66
-50 -39.26 -27.327 -15.393 -3.46 8.4733 20.407 27.567
0 135 285 435 585 735 885 975
CAPITOLO 4
ALGORITMO LCMV ADATTATIVO NEL
DOMINIO DELLA FREQUENZA
L’argomento di questo capitolo riguarda l’analisi di un algoritmo di beamforming
adattativo che si basa sulla minimizzazione della varianza associata
all’applicazione di vincoli lineari sul vettore dei coefficienti (LCMV);
l’implementazione dell’algoritmo stesso è stata effettuata nel dominio della
frequenza poiché ricerche approfondite [17] hanno dimostrato che, in questo
modo, è possibile ridurre la complessità computazionale a scapito di una
diminuzione della velocità di convergenza.
Nella prima parte si focalizza l’attenzione sulla descrizione analitica del metodo
in esame, dapprima tracciando le linee guida per la formulazione del problema
generale LCMV nel dominio del tempo, per poi passare alla formulazione in
frequenza dell’algoritmo considerato; in seguito viene studiata la sua
implementazione su elaboratore elettronico mediante simulazioni con MATLAB.
Come per l’algoritmo del capitolo precedente, le prime simulazioni sono state
effettuate in un contesto deterministico, cioè con sorgenti di intereferenza fisse,
mentre in un secondo momento è stato preso in considerazione il caso adattativo
(con un interferente in movimento), grazie all’utilizzo di Simulink.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
146
4.1 Formulazione nel dominio del tempo
Un beamformer di tipo LCMV (Linearly Constrained Minimum Variance)
realizza la minimizzazione della varianza del segnale di uscita in accordo con
alcuni vincoli spettrali e spaziali assegnati.
Si consideri un array lineare composto da N sensori equispaziati a distanza d ed
un beamformer a larga banda del tipo già discusso nel capitolo 2 e rappresentato
in fig. 2.4. Per ragioni di comodità si preferisce riportarlo di nuovo qui di seguito
(fig. 4.1).
Fig. 4.1: beamformer a banda larga con N sensori
Sulla base delle considerazioni generali già effettuate nel capitolo precedente e
mantenendo la stessa notazione di prima, si può esprimere il segnale )t(x ,n ξ ,
ricevuto dall’n-esimo sensore dopo che ha superato ξ blocchi di ritardo, come:
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
147
]csind)1n[(2j
0f2jf2jtf2j
0,n0
0n00 e)t(seees)t(xξ
λθ
λπξπτππ
ξ
+−== (4.1)
dove Nn1 ≤≤ e 1J0 −≤≤ ξ .
Per mantenere la stessa notazione assunta nel capitolo 2, si indichi da qui in avanti
l’indice temporale discreto con k.
L’uscita del beamformer y(k), come si è già visto, è espressa come:
)()( kky xw H= (4.2)
con: [ ]TTN
T2
T1 wwww K=
[ ] T1J,n1,n0,n www −= Knw
[ ]T)k()k()k()k( TN
T2
T1 xxxx K=
[ ] Tnnn )1Jk(x)1k(x)k(x)k( +−−= Knx
Il problema LCMV può essere formulato come:
wRw xH
wmin soggetto ai vincoli linearmente indipendenti fwC H = (4.3)
dove: [ ]Hx xxR E= è la matrice di covarianza;
rNJ ×∈CC è la matrice dei vincoli;
rC∈f è il vettore risposta;
r è il numero di vincoli linearmente indipendenti che sono stati sfruttati;
C è il campo complesso.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
148
4.2 Formulazione nel dominio della frequenza
In questo paragrafo verrà adottata la seguente notazione: i vettori e le matrici nel
dominio della frequenza sono sottolineati, rispettivamente, una volta e due volte
per poterli distinguere dalle corrispondenti grandezze nel dominio del tempo.
Raccogliendo le uscite y*( kJ ), y*( kJ+1 ), …, y*( kJ+J-1 ) in un vettore )kJ(y ,
dove k rappresenta l’indice discreto dei blocchi di J campioni d’ingresso, si
ottiene:
∑=
=N
1n
H )kJ()kJ( nn wXy (4.4)
dove:
[ ])1JkJ()1kJ()kJ()kJ( −++= nnnn xxxX K (4.5)
Si possono sviluppare le matrici convoluzionali )kJ(nX in una forma
equivalente (“circulant”) ed esprimere l’uscita del beamformer come:
⎥⎦
⎤⎢⎣
⎡⋅⎥
⎦
⎤⎢⎣
⎡=⎥
⎦
⎤⎢⎣
⎡ ∑= 0
wXXXX
yv n
Hn
Hn
Hn
Hn
N
1n )kJ(~)kJ()kJ()kJ(~
)kJ( (4.6)
dove: v è un vettore arbitrario composto da J elementi;
nX~ è una matrice di Toeplitz costruita usando gli elementi della matrice
nX eccetto per un elemento arbitrario lungo la diagonale principale.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
149
Si definisca un vettore errore nel dominio della frequenza J2)kJ( C∈e
attraverso la trasformazione discreta di Fourier (DFT, Discrete Fourier
Transform) utilizzando la matrice di trasformazione T, di dimensioni J2J2 × :
wYGwYG
0w
TTXXXX
TG
yv
TTI000
Ty0
Te
N
1nnn
nHN
1nHnn
Hn
Hn
n
H
JJJJ
JJJJ
n
)kJ()kJ(
)kJ(~)kJ()kJ()kJ(~
)kJ(
H
==
=⎥⎦
⎤⎢⎣
⎡⋅⎥
⎦
⎤⎢⎣
⎡=
=⎥⎦
⎤⎢⎣
⎡⋅⎥
⎦
⎤⎢⎣
⎡=⎥
⎦
⎤⎢⎣
⎡=
∑
∑
=
=
××
××
(4.7)
dove: H
JJJJ
JJJJ TI000
TG ⎥⎦
⎤⎢⎣
⎡=
××
×× ;
HHn
Hn
Hn
Hn
n TXXXX
TY ⎥⎦
⎤⎢⎣
⎡=
)kJ(~)kJ()kJ()kJ(~
)kJ( ;
⎥⎦
⎤⎢⎣
⎡=
0w
Tw nn .
Si ottengono in questo modo matrici diagonali )kJ(nY , i cui elementi sulla
diagonale principale non sono altro che le trasformate di Fourier degli elementi
appartenenti alla prima colonna delle corrispondenti matrici in forma “circulant”.
Si consideri ora l’equazione che esprime i vincoli lineari. Nel dominio del tempo i
vincoli sono espressi come:
fwCwCN
1nn
Hn
H =⋅= ∑=
(4.8)
dove si è messo in evidenza come l’equazione originaria può essere scomposta in
N componenti additivi.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
150
Si noti che rJ ×∈CnC ha una forma arbitraria (in particolare non di Toeplitz).
Per passare al dominio della frequenza si effettuino i seguenti passaggi:
[ ] f0
w0C n
JrHn =⎥
⎦
⎤⎢⎣
⎡∑=
×
N
1n (4.9)
oppure:
[ ] fwCwT0C nH
JrHn ==∑
=×
HN
1n (4.10)
in cui rJN2 ×∈CC è la nuova matrice dei vincoli, la cui espressione è:
HHH
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡=
××
H
rJ
NH
rJ
1 T0C
T0C
C K (4.11)
e che viene applicata al vettore dei coefficienti nel dominio della frequenza w .
L’uscita quadratica media del beamformer nel dominio della frequenza è data da:
[ ] wRwee HH )kJ()kJ(E = (4.12)
dove [ ] [ ])kJ()kJ(E)kJ()kJ(E HH YGYYGGYR H == .
In questo modo la formulazione LCMV nel dominio della frequenza diventa:
wRww
Hmin soggetta ai vincoli fwC =H (4.13)
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
151
4.3 Algoritmo adattativo vincolato nel dominio della
frequenza (Frequency Domain-LCMV, FD-LCMV)
Giunti a questo punto, l’obiettivo che ci si prefigge di raggiungere è quello di
ottenere un’equazione di aggiornamento iterativa del vettore dei coefficienti nel
dominio della frequenza, partendo dall’espressione 4.13.
Si applichi il metodo dei moltiplicatori di Lagrange per formare la nuova funzione
obiettivo )( wΦ :
)()()( TTHHH ∗∗ −+−+= fwCfwCwRww λλΦ (4.14)
dove rC∈λ è un vettore con moltiplicatori di Lagrange indeterminati.
Derivando la funzione )( wΦ rispetto a ∗w , si ha:
λcwRw
w+=
∂∂
∗
)(Φ (4.15)
Il passo successivo per arrivare all’algoritmo voluto è inizializzare il vettore dei
pesi: si imposta q)J1( ww =⋅ , con fCCCw H 1q )( −= in modo che soddisfi i
vincoli espressi nella 4.10.
Ad ogni iterazione il vettore w è aggiornato nella direzione del gradiente
negativo, espresso nella 4.15, con un passo proporzionale ad un fattore di scala µ
in accordo a:
[ ])kJ()kJ()kJ()JkJ( λcwRww +−=+ µ (4.16)
Poiché )JkJ( +w deve soddisfare i vincoli, si può sostituire l’espressione 4.16
nella 4.10 e risolverla rispetto ai moltiplicatori di Lagrange )kJ(λ .
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
152
Sostituendo poi )kJ(λ nell’equazione dell’iterazione 4.16 si trova che:
[ ][ ])kJ()(
)kJ()()kJ()JkJ(H1H
H1H
wcfCCC
wrcCCCIww
−+
+−−=+−
−µ (4.17)
Ponendo H1H )( CCCCIP −−= , la 4.17 può essere riscritta nel seguente modo:
[ ])kJ()kJ()JkJ( q wRwPww µ−+=+ (4.18)
Dal momento che non si conosce a priori la statistica del secondo ordine di R, la
matrice di covarianza può essere calcolata attraverso la sua semplice
approssimazione: )kJ()kJ(~ H YGYR = . Questo conduce alla minimizzazione
dell’uscita quadratica istantanea anziché di quella media, arrivando infine
all’equazione di aggiornamento cercata:
[ ])kJ()kJ()kJ()JkJ( Hq eYwPww µ−+=+ (4.19)
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
153
Riassumendo, i passi fondamentali che portano alla realizzazione dell’algoritmo
considerato sono riportati sinteticamente nella tabella seguente (tab. 4.1):
Inizializzazione: fCCCww H 1
q )()J1( −==⋅ ;
H1H )( CCCCIP −−= ;
Iterazione per ogni blocco di J campioni d’ingresso:
1. [ ]{ }H)kJ()JkJ(diag)kJ( Tn
Tnn xxTY += ;
2. )kJ()kJ()kJ( wYGe = ;
3. )kJ()kJ(H eYµ ;
4. [ ])kJ()kJ()kJ( H eYwP µ− .
Tab. 4.1: passi necessari per arrivare all’equazione di aggiornamento iterativa del vettore dei
coefficienti (nel dominio della frequenza).
4.4 Implementazione dell’algoritmo su calcolatore
Viene ora illustrata passo per passo la procedura necessaria all’implementazione
dell’algoritmo adattativo FD-LCMV su elaboratore elettronico mediante il
software di simulazione MATLAB. Alcune operazioni sono del tutto analoghe a
quelle già descritte nel capitolo precedente, in merito all’algoritmo MVDR e, di
conseguenza, si ritiene opportuno semplicemente citarle senza scendere di nuovo
nei particolari, in quanto sarebbe inutile e ripetitivo.
I passaggi fondamentali da effettuare sono:
1. si costruisce T, la matrice DFT a 2J punti. Infatti, la trasformazione
discreta di Fourier (DFT) può anche essere rappresentata come
un’operazione matriciale. Si prenda ad esempio un generico vettore
colonna v di 2J elementi, l’i-esimo dei quali viene identificato con v(i).
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
154
L’espressione generale della DFT:
∑∑−
=
−
=⎟⎠⎞
⎜⎝⎛−⎟
⎠⎞
⎜⎝⎛=
1J2
0i
1J2
0i J2ik2sin)i(vj
J2ik2cos)i(v)k(v ππ (4.20)
con k = 0, 1, 2 , …, 2J-1
può essere formulata equivalentemente attraverso l’operazione matriciale:
vTv ⋅= (4.21)
In forma estesa essa si scrive nel seguente modo:
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
−
⋅
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
=
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
− −⋅−⋅−⋅−
−⋅⋅⋅
−⋅⋅⋅
)1J2(v
)1(v)0(v
TTT
TTTTTT
)1J2(v
)1(v)0(v
)1J2()1J2(1)1J2(0)1J2(
)1J2(11101
)1J2(01000
M
K
MMMM
K
K
M (4.22)
in cui il generico elemento )k(v può essere ricavato così:
∑−
=
⋅=1J2
0i
ik )i(vT)k(v (4.23)
e dove:
J2eT
J22j π
−
= (4.24)
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
155
Il fattore di normalizzazione J2
1 non fa parte della definizione di
matrice DFT, ma viene comunemente impiegato al fine di rendere la
matrice T una matrice unitaria, cioè tale per cui ITT H = .
2. L’asse spaziale, necessario per la rappresentazione del beampattern, viene
definito in maniera del tutto analoga a quanto già visto in merito
all’algoritmo MVDR (paragrafo 3.3, passo n°2).
3. A differenza dell’algoritmo MVDR stesso però, in questo caso la matrice
degli steering vectors, utilizzata per il calcolo del beampattern, viene
costruita in modo diverso. Si parte innanzitutto con il vettore:
T
)1J(c))i(theta(sind)1n(2jc))i(theta(sind)1n(2j))i(theta(sind)1n(2jeee
⎥⎥⎦
⎤
⎢⎢⎣
⎡=
⎥⎦⎤
⎢⎣⎡ −+−⎥⎦
⎤⎢⎣⎡ +−⎥⎦
⎤⎢⎣⎡ −
λλπ
λλπ
λπ
Kd_1
(4.25)
con N,,2,1n K= e )(length,,2,1i thetaK= . theta = vett. asse spaziale.
Poi si passa alla trasformazione in frequenza di questo vettore mediante la
matrice DFT T:
⎥⎦
⎤⎢⎣
⎡=
×1J0d_1
Td_2 (4.26)
d_2 è dunque un vettore che appartiene a 12J ×C . Si arriva infine alla
matrice cercata:
ripetendo il calcolo del vettore d_2 per N,,2,1n K= (con l’indice
i fissato) e disponendo progressivamente questi vettori (via via
calcolati) in colonna. In questo modo si ottiene una generica
colonna della matrice.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
156
Il procedimento appena descritto va poi ripetuto facendo variare
l’indice di colonna i (della matrice) da 1 a length(theta).
La matrice degli steering vectors nel dominio della frequenza risulta
essere così strutturata:
D_2 =
4. Si raccolgono i dati provenienti dall’array in una matrice (X) nello stesso
modo descritto nel capitolo precedente (paragrafo 3.3); la matrice
risultante, chiamata ancora matrice dei dati grezzi, ha una struttura uguale
a quella riportata in figura 3.2.
5. Si definisce un vettore, DOA, che contiene le direzioni di arrivo dei
segnali su cui si vogliono porre i vincoli lineari. Le direzioni di arrivo
sono angoli compresi nell’intervallo [ ]°+°− 9090 . Il primo elemento di
questo vettore è l’angolo di arrivo del segnale desiderato, che in
radioastronomia è sempre noto. Gli altri elementi sono un ristretto
numero fra le direzioni di provenienza conosciute dei segnali interferenti.
Si parla di “ristretto numero” dal momento che esiste un numero di
vincoli massimo che è possibile sfruttare e che dipende dal numero di
sensori a disposizione N. Volendo mantenere la stessa notazione del
1 2 length(theta)
1 2
)J2(N ⋅
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
157
paragrafo 4.1, da qui in avanti verranno considerati r vincoli lineari sul
vettore dei coefficienti. Il vettore DOA risulta avere la seguente forma:
[ ])r(DOA)2(DOA)1(DOA K=DOA (4.27)
6. Per poter applicare i vincoli lineari bisogna inizialmente costruire la
matrice dei vincoli nel dominio del tempo. Dal vettore c così definito:
T
)1J(c))i(DOA(sind)1n(2jc))i(DOA(sind)1n(2j))i(DOA(sind)1n(2jeee
⎥⎥⎦
⎤
⎢⎢⎣
⎡=
⎥⎦⎤
⎢⎣⎡ −+−⎥⎦
⎤⎢⎣⎡ +−⎥⎦
⎤⎢⎣⎡ −
λλπ
λλπ
λπ
Kc
(4.28)
con N,,2,1n K= e r,,2,1i K= , si crea la generica colonna della matrice
in questione disponendo in colonna i vettori c ottenuti al variare di n da 1
a N e con i fissato.
Iterando le stesse operazioni sopra esposte al variare di i da 1 a r, si
ottiene la matrice dei vincoli:
C =
Per il fatto che 0)1(DOA θ= (direzione di arrivo del segnale utile), la
prima colonna di C esprime il vincolo sul segnale radioastronomico; le
1 2 r
1 2
JN ⋅
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
158
altre colonne (identificate dall’indice di colonna r,,3,2i K= )
corrispondono invece ai vincoli imposti agli 1r − segnali interferenti
presi in considerazione.
7. La matrice dei vincoli nel tempo C appena costruita va poi trasformata
nel dominio della frequenza tramite la matrice DFT T seguendo il
procedimento già illustrato nella 4.11 e che viene qui sotto riportato:
HHH
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡=
××
H
rJ
NH
rJ
1 T0C
T0C
C K (4.29)
dove nC con N,,2,1n K= è una sottomatrice della matrice dei vincoli
nel dominio del tempo C che ne racchiude tutte le colonne ma solo le
righe comprese tra la ( )[ ]1J1n +⋅− -esima e la Jn ⋅ -esima.
8. Si costruisce un vettore colonna (di dimensione 1r × ) che costituisce il
vettore risposta f dell’equazione 4.10. Esso infatti presenta come primo
elemento la risposta del beamformer al segnale desiderato (tipicamente
viene fissata ad 1). Gli altri elementi del vettore sono le risposte ai segnali
interferenti considerati e vengono settati a 0, in quanto si vuole forzare a
zero il guadagno verso le direzioni indesiderate.
9. Si procede all’inizializzazione dell’algoritmo eseguendo le stesse
operazioni matriciali riportate in tabella 4.1.
10. Si eseguono le iterazioni, ciascuna per ogni blocco di J campioni
d’ingresso, schematizzate sempre in tabella 4.1.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
159
Importante è capire come formare la matrice )kJ(Y ad ogni iterazione k
( ⎟⎠⎞
⎜⎝⎛ −= 1
Jt
,,2,1k ossK ) dell’algoritmo. Si consideri la generica iterazione
k-esima e si prendano i due seguenti vettori:
[ ] Tnnn )1JkJ(x)1kJ(x)kJ(x)kJ( +−−= Knx
[ ] Tnnn ))1J(JkJ(x)1JkJ(x)JkJ(x)JkJ( −−+−++=+ Knx
(4.30)
con N,,2,1n K= , che contengono elementi appartenenti alla matrice dei
dati grezzi. Se si effettua la seguente moltiplicazione matriciale:
⎥⎦
⎤⎢⎣
⎡ +⋅
)kJ()JkJ(
n
n
xx
T (4.31)
ed il risultato, un vettore colonna di dimensione 1J2 × , lo si utilizzi
come diagonale principale di una matrice diagonale J2J2 × , si ottiene la
matrice )kJ(nY . Ripetendo lo stesso procedimento appena visto per
N,,2,1n K= e disponendo le matrici )kJ(nY , di volta in volta calcolate,
una di fianco all’altra, si trova la matrice )kJ(Y , cioè:
[ ])kJ()kJ()kJ()kJ( N21 YYYY K= (4.32)
Dopo la costruzione di questa matrice e il calcolo del vettore errore nel
dominio della frequenza:
)kJ()kJ()kJ( wYGe = (4.33)
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
160
dove G si ricava a partire dalla formula sotto la 4.7, si può esprimere
finalmente l’equazione iterativa di aggiornamento del vettore dei
coefficienti:
[ ])kJ()kJ()kJ()JkJ( Hq eYwPww µ−+=+ (4.34)
11. Analogamente al caso dell’algoritmo MVDR (cap. 3), il beampattern
complessivo viene definito dalla relazione:
2H )kJ( D_2wnbeampatter LCMV-FD = (4.35)
Esso, prima di essere impiegato per graficare l’andamento del guadagno
su tutto l’asse spaziale, viene normalizzato rispetto al suo valore
massimo.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
161
4.5 Esempi numerici mediante MATLAB
Giunti a questo punto, non rimane che sottoporre l’algoritmo FD-LCMV ad
alcune prove di simulazione, per stabilire se quest’ultimo è effettivamente idoneo
al beamforming adattativo in ambito radioastronomico.
Proprio come è stato fatto nel capitolo 3, a proposito dell’algoritmo MVDR,
anche nel presente paragrafo verranno esaminati alcuni esempi ritenuti
significativi, proponendo costantemente il confronto con l’algoritmo già studiato.
Dapprima saranno considerate situazioni con sorgenti di interferenza posizionate
in punti fissi dello spazio, successivamente verranno casi più complicati con
interferenti sia fissi che mobili.
4.5.1 Caso statico Per questo tipo di simulazioni verranno prese in considerazione solo sorgenti di
RFI in posizioni fissate dello spazio.
4.5.1.1 Esempio 1
Si cominci con il considerare la situazione schematizzata in tabella 4.2.
La configurazione di riferimento è ancora quella che veniva presa in esame nei
primi esempi del capitolo 3, caratterizzata cioè da 8 sensori ideali, equispaziati di
λ/2 alla frequenza Mf . L’implementazione di questo algoritmo comporta
l’introduzione di due nuovi parametri: la lunghezza temporale delle linee di
ritardo J ( [sec] ) e la dimensione del passo di aggiornamento dei coefficienti µ .
Per quanto concerne il primo, è stato scelto il valore 10 in maniera arbitraria: ci si
è comunque orientati su una quantità che si mantenesse entro lo stesso ordine di
grandezza di quelle utilizzate nelle prove sperimentali di [17]; si tenga presente
che valori di ordini di grandezza superiori comportano un carico, a livello
computazionale, più elevato.
Riguardo al secondo parametro, µ , si è mantenuto lo stesso valore indicato in
[17], in cui, a seguito di varie prove, è stato determinato empiricamente.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
162
Tab. 4.2: valori assunti dai parametri principali nell’Esempio 1
Con i tre segnali interferenti di tab. 4.2, il beamformer FD-LCMV produce il
seguente andamento del guadagno (fig. 4.2).
Fig. 4.2: beampatterns ottenuti attraverso gli algoritmi FD-LCMV e MVDR per l’Esempio 1
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -50° -10° +50° Ampiezze RFI 2 4 3 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
163
Dal confronto tra i beamformers FD-LCMV e MVDR, è evidente come il
beampattern si mantenga pressoché immutato, seppur con qualche lieve
differenza nei lobi secondari; si noti come, nel caso FD-LCMV, gli zeri abbiano
una profondità maggiore, dovuta all’imposizione dei vincoli lineari sul vettore dei
coefficienti per cancellare i segnali interferenti.
Si proceda ora all’aggiunta progressiva di due RFI: la prima è contraddistinta da
°−= 304θ , ampiezza 5 [V] e frequenza 0.40 cf ; la seconda invece da °+= 405θ ,
ampiezza 4 [V] e frequenza 0.20 cf .
Mano a mano che vengono introdotte queste due interferenze, si ottengono i
risultati di fig. 4.3 (a fianco di ciascun beampattern viene mostrato
l’ingrandimento del relativo beam).
Fig. 4.3: beampatterns, e ingrandimenti dei relativi beams, ottenuti aggiungendo in sequenza 2 RFI
con: 1) °−= 304θ , amp. 5[V] e freq. 0.40 cf ; 2) °+= 405θ , amp. 4[V] e freq. 0.20 cf per l’Es 1
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
164
In entrambi i casi, i beampatterns, prodotti dai due algoritmi, presentano
andamenti molto vicini fra loro in prossimità del puntamento; si osserva invece un
discreto scostamento in corrispondenza dei lobi alle due estremità dei grafici.
Continuando ad aggiungere altre due interferenze (sempre in sequenza),
caratterizzate da: °+= 806θ , ampiezza 2 [V], frequenza 0.35 cf e °= 07θ ,
ampiezza 1 [V], frequenza 0.15 cf , i beampatterns risultanti (da FD-LCMV e
MVDR), per tutte e due le situazioni considerate, assumono un aspetto
praticamente identico fra loro su tutto l’asse spaziale (fig. 4.4).
Fig. 4.4: beampatterns, e ingrandimenti dei relativi beams, ottenuti aggiungendo in sequenza altre
due RFI con: 1) °+= 806θ , ampiezza 2 [V], frequenza 0.35 cf ; 2) °= 07θ , ampiezza 1 [V],
frequenza 0.15 cf , oltre a quelle già aggiunte in fig. 4.3, per l’Es 1
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
165
4.5.1.2 Esempio 2
Proprio come è stato fatto nell’Esempio 2 del capitolo 3 (par. 3.5.1.2), si vuole
controllare come viene distorto il lobo principale a causa di una RFI che proviene
da una DOA vicina a quella del segnale desiderato. Inizialmente vengono
considerate 4 interferenze che arrivano tutte da direzioni esterne all’apertura
BWFN del beam, come riportato in tab. 4.3.
Tab. 4.3: valori assunti dai parametri principali nell’Esempio 2
Dai grafici ottenuti (fig. 4.5), si rileva una notevole vicinanza tra i beampatterns
dei due algoritmi, sebbene il beamformer FD-LCMV presenti una maggiore
capacità nel cancellare le interferenze, per il motivo già menzionato.
Fig. 4.5: beampatterns (e ingrandimento dei relativi beams) ottenuti con i 2 algoritmi per l’Es. 2
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -50° -10° +50° +5° Ampiezze RFI 2 4 3 5 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf 0.40 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Parametro Valore
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
166
Successivamente, la quarta interferenza, indicata in tab. 4.3, viene sostituita prima
da una con DOA °+= 104θ (ha comunque stessa ampiezza e frequenza) e poi da
un’altra con DOA °+= 154θ (i risultati conseguiti a seguito di queste due
sostituzioni sono presenti in fig. 4.6).
Fig. 4.6: beampatterns, e ingrandimenti dei relativi beams, ottenuti sostituendo la quarta RFI di
tab. 4.3 con, dapprima, una avente °+= 104θ e poi con un’altra avente °+= 154θ , per l’Es 2
Innanzitutto, analogamente a quanto accadeva nel caso dell’algoritmo MVDR, si
riscontra, anche per il beamformer FD-LCMV, uno spostamento laterale del beam
di pari misura. Inoltre si può rimarcare, nel beampattern dell’algoritmo FD-
LCMV, un, seppur molto leggero, abbassamento dei lobi laterali in certi tratti
dell’asse spaziale, rispetto a quelli dell’algoritmo MVDR.
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
167
I prossimi 3 esempi, che verranno presi in esame, ricalcano lo stesso modus
operandi seguito nel capitolo 3, rispettivamente negli esempi 5, 6, 7, per
analizzare e caratterizzare il comportamento del beamformer FD-LCMV nel
contesto specifico del sistema BEST-1, in varie situazioni particolari.
4.5.1.3 Esempio 3
I parametri di simulazione sono indicati in tabella 4.4.
Tab. 4.4: valori assunti dai parametri principali nell’Esempio 3
In fig. 4.7 è riportato il confronto tra i beampattern complessivi ottenuti tramite
l’algoritmo FD-LCMV e l’MVDR.
In generale non si evidenziano particolari differenze nei due casi; l’ingrandimento
presente in figura 4.7 mostra un livello del beam leggermente più alto per quel
che riguarda l’MVDR.
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +19° -50° +30° Ampiezze RFI 2 4 6 Frequenze RFI 0.05 cf 0.25 cf 0.15 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
168
Fig. 4.7: beampatterns (e ingrandimento dei relativi beams) ottenuti con i 2 algoritmi per l’Es. 3
4.5.1.4 Esempio 4
Si consideri il caso schematizzato in tab. 4.5.
Tab. 4.5: valori assunti dai parametri principali nell’Esempio 4
In questo esempio l’interferenza che risulta provenire da °+= 242θ , proprio in
corrispondenza di un lobo di grating del fattore di gruppo dell’array, causa una
forte distorsione del lobo principale (di ugual misura) nei beampattern di entrambi
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +12° +24° Ampiezze RFI 2 4 Frequenze RFI 0.05 cf 0.25 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
169
i metodi esaminati: per essi è impossibile un’osservazione radioastronomica
corretta mediante sole tecniche di filtraggio spaziale.
4.5.1.5 Esempio 5
Si vuol mostrare ora come rispondono i due algoritmi adattativi, in una situazione
con tre segnali interferenti (ciascuno dei quali proviene da una DOA esterna ai
lobi di grating del fattore di gruppo dell’array) e ancora nella stessa
configurazione propria dell’array BEST-1 (tab. 4.6).
Tab. 4.6: valori assunti dai parametri principali nell’Esempio 5
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +6° +28° -2° Ampiezze RFI 2 4 6 Frequenze RFI 0.05 cf 0.25 cf 0.15 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
170
Come si può verificare dalla figura 4.8, la presenza di 3 RFI causa un piccolo
spostamento (≈ 0.2°) del main lobe nei beampattern di entrambi gli algoritmi.
Fig. 4.8: beampatterns (e ingrandimento dei relativi beams) ottenuti con i 2 algoritmi per l’Es. 5
Cambiando la seconda interferenza con una dotata di DOA °= 272θ (al posto di
°= 282θ ) e mantenendo gli stessi valori degli altri parametri elencati in tab. 4.6,
ciò che si ottiene è presentato in fig. 4.9.
Fig. 4.9: beampatterns (e ingrandimento dei relativi beams) ottenuti con i 2 algoritmi per
l’Esempio 5, dopo la sostituzione della seconda interferenza con una avente °= 272θ
La variazione di un solo grado nella DOA di un interferente è causa di
un’ulteriore traslazione del beam (≈ 0.3°), sia per quanto riguarda il metodo FD-
LCMV che per l’MVDR..
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
171
4.5.2 Caso dinamico In questa categoria di simulazioni verranno considerate radiointerferenze sia fisse
che in movimento.
4.5.2.1 Esempio 6
Questa prova fa riferimento allo scenario descritto in tab. 4.7.
Tab. 4.7: valori assunti dai parametri principali nell’Esempio 6
Con i parametri riportati in tab. 4.7, è stata avviata una simulazione che però non
ha dato i risultati attesi, in quanto ci si è accorti che l’algoritmo non era in grado
di convergere alla soluzione statisticamente ottima. Infatti, nell’arco dell’intera
simulazione, l’interferente in movimento non veniva dinamicamente cancellato,
dal momento che i nulli di ricezione rimanevano nelle stesse posizioni dal primo
all’ultimo istante della prova.
Più precisamente, ci si è accorti che, fin dalle prime iterazioni, il termine additivo
di aggiornamento dei coefficienti (si veda la formula 4.34) assumeva valori molto
prossimi a 0, rendendo di fatto inutile il calcolo ciclico dei coefficienti, i quali
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Lunghezza linee di ritardo [sec] 10 Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +30° DOA RFI -80° -60° [-50° 9.6667°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Passo di aggiornamento coefficienti 6109.5 −⋅ Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 4 Algoritmo LCMV adattativo nel dominio della frequenza
172
rimanevano pressoché inalterati al termine di ogni iterazione. Purtroppo a nulla
sono valsi notevoli sforzi profusi per correggere questo problema.
Quindi ci si è trovati costretti a scartare questo algoritmo e a considerarlo come
non idoneo per il beamforming adattativo in ambito radioastronomico.
CAPITOLO 5
ANALISI AGLI AUTOVALORI ED
AUTOVETTORI DELLA MATRICE DI
COVARIANZA
L’obiettivo principale di questo capitolo è quello di stabilire se ed, eventualmente,
in quale misura gli autovalori ed autovettori della matrice di covarianza R
possono essere sfruttati nel contesto del filtraggio spaziale.
La ragione che ha spinto a portare avanti questo tipo di indagine è nata dal
desiderio di sapere se esistono le condizioni per l’applicazione della trasformata
KLT (Karhunen-Loève Transform) anche al caso particolare del beamforming.
Sulla KLT, assieme al legame tra quest’ultima ed autovalori, autovettori, si
discuterà ampiamente nel capitolo seguente; inoltre, si precisa che (anche di
questo se ne parlerà diffusamente nel capitolo 6) attualmente la KLT viene
impiegata con ottimi risultati nel campo del filtraggio spettrale del segnale (anche
se ancora oggi è argomento di studio).
Dopo aver brevemente introdotto, dal punto di vista teorico, alcune proprietà della
matrice di covarianza, vengono riportate alcune prove significative che
testimoniano quanto sia importante analizzare gli autovalori ed autovettori di
quest’ultima. In seguito vengono proposti due metodi adattativi di beamforming
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
174
che si basano sulle informazioni fornite dall’analisi agli autovalori ed autovettori
della matrice di covarianza.
5.1 Autostruttura della matrice di covarianza
In questo paragrafo viene spiegato il significato degli autovalori ed autovettori
della matrice di covarianza R.
Gli elementi jir , (con N,,2,1j,i K= ) della matrice di covarianza rappresentano
le uscite dei correlatori per le coppie di antenne i e j. Dal momento che ∗= i,jj,i rr ,
la matrice è Hermitiana. I valori della diagonale principale rappresentano le uscite
total power. Per lunghi periodi di osservazione R deve essere determinata
ripetutamente mediando i valori dei dati ricevuti su intervalli di tempo
sufficientemente brevi da pensare che le DOA delle interferenze non abbiano
subito variazioni notevoli (si ricordi la formula 3.14); nella pratica questo
intervallo di tempo ha un valore compreso tra pochi millisecondi e pochi secondi.
La matrice R può essere scomposta, tramite SVD (Singular Value
Decomposition), nel seguente modo ([13], [22]):
HUUR Λ= (5.1)
dove U è una matrice delle stesse dimensioni di R ( NN × ), le cui colonne sono
gli autovettori di R, mentre Λ è una matrice diagonale che ne contiene gli
autovalori, disposti in ordine decrescente. Si assume che, su intervalli di tempo
così brevi, i segnali astronomici all’uscita dei correlatori siano piccoli in rapporto
al livello RMS (Root Mean Square, valore quadratico medio) di rumore. Pertanto,
gli autovettori corrispondenti agli autovalori maggiori del livello RMS di rumore
rappresentano le interferenze. In teoria si potrebbe anche fare distinzione tra
interferenze e segnali astronomici mediante l’angolo di incidenza: ogni
autovettore, infatti, rappresenta una componente da una distinta direzione
spaziale.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
175
E’ chiaro che questo criterio, che stabilisce la corrispondenza tra autovettori e
interferenze o segnale astronomico (rumore), è valido fintanto che il numero delle
sorgenti interferenti rimane inferiore ad N.
Poiché R è Hermitiana, gli autovettori sono ortogonali tra loro e possono essere
estratti, formando in tal modo degli zeri nelle direzioni corrispondenti alle
sorgenti di segnale. Eliminando le colonne di U corrispondenti agli autovalori
maggiori del livello RMS del rumore, è possibile costruire una matrice NU . Le
colonne della matrice HNNUU descrivono il sottospazio occupato dal rumore e dai
segnali astronomici. Si può così ricavare una versione filtrata della matrice di
covarianza:
HNN
HNNN UURUUR = (5.2)
dalla quale sono state estratte le interferenze. Le stime di NR , ottenute su brevi
intervalli di tempo, includono i dati liberi dalle interferenze, dai quali può essere
ricavata l’immagine astronomica (imaging). Dal momento che, però, ogni
elemento di NR viene ottenuto da una combinazione lineare degli elementi di R,
non c’è più una semplice relazione di trasformata di Fourier tra NR e l’immagine
richiesta. Tuttavia i coefficienti della combinazione lineare sono noti e, pertanto,
sono ancora possibili delle procedure di imaging. Per ulteriori approfondimenti a
riguardo, si consultino i testi indicati in bibliografia ([18], [19], [20], [21]).
5.2 Prove su autovalori ed autovettori
In precedenza si è accennato al fatto che esiste una stretta relazione tra autovalori,
autovettori e le componenti del segnale ricevuto dovute a sorgenti dislocate in
punti diversi dello spazio (interferenze, rumore di sistema, sorgenti
astronomiche). Questo è possibile verificarlo direttamente attraverso qualche
semplice simulazione con MATLAB.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
176
5.2.1 Esempio 1
La situazione per l’Esempio 1 viene riassunta in tabella 5.1.
Tab. 5.1: valori assunti dai parametri principali nell’Esempio 1
L’array si compone di 8 sensori ideali (omnidirezionali) distanziati fra loro di λ/2
alla frequenza Mf . L’osservazione dura complessivamente 1000 campioni;
inoltre R viene stimata, attraverso una media temporale sui dati ricevuti (vedi cap.
3, eq. 3.14), utilizzando finestre (temporali) di 200 campioni.
Una volta che è stata calcolata la matrice R̂ , quest’ultima viene sottoposta ad una
decomposizione di tipo SVD ([22]), tramite cui si è in grado di risalire ai suoi
autovalori ed autovettori.
In figura 5.1 viene rappresentato l’andamento degli autovalori di R̂ , i cui valori
esatti, per maggior chiarezza, sono elencati in tabella 5.2.
Tab. 5.2: valori corrispondenti agli autovalori della matrice R̂ per l’Esempio 1
Come anticipato prima, gli autovalori, che si trovano lungo la diagonale
principale della matrice (diagonale) Λ , sono ordinati in modo decrescente.
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI 0° -20° +40° -40° Ampiezze RFI 2 5 3 4 Frequenze RFI 0.10 cf 0.25 cf 0.30 cf 0.40 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Autovalore n°
Valore corrispond.
1 2 3 4 5 6 7 8
42154 24076 14456 5707.6 0.26076 0.2211 0.21241 0.19814
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
177
Fig. 5.1: andamento degli autovalori di R̂ per l’Esempio 1
Dalla figura di sopra appare evidente che vi siano tanti autovalori dominanti (di
valore molto superiore a quello degli altri) quante sono le RFI presenti, cioè 4.
Questo risultato assume ancor più rilevanza, se si osservano anche gli andamenti
degli autovettori corrispondenti ai primi 4 autovalori (dominanti) (figg. 5.2, 5.3,
5.4, 5.5).
Fig. 5.2: andamento del 1° autovettore di R̂ per l’Esempio 1
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
178
Fig. 5.3: andamento del 2° autovettore di R̂ per l’Esempio 1
Fig. 5.4: andamento del 3° autovettore di R̂ per l’Esempio 1
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
179
Fig. 5.5: andamento del 4° autovettore di R̂ per l’Esempio 1
Ogni autovettore dominante, proiettato sull’asse spaziale, presenta un profilo che
assume il proprio massimo assoluto in corrispondenza di una direzione angolare
ben precisa, quella di provenienza di una delle RFI.
In particolare, ad autovalori maggiori sono associati autovettori con massimo
assoluto in corrispondenza dell’angolo di arrivo di radiointerferenze tanto più
intense. In altre parole, un autovalore dominante è tanto maggiore quanto più
intensa è l’RFI legata ad esso. Grazie alla perfetta corrispondenza autovalore
(autovettore) dominante ↔ RFI, dall’analisi agli autovalori (autovettori) della
matrice R̂ , è possibile stimare (in generale senza ambiguità) la direzione di
provenienza delle RFI stesse.
La fig. 5.2 mostra l’andamento del primo autovettore che, essendo associato
all’autovalore maggiore, è anche quello che punta alla DOA dell’RFI più intensa
( °−= 202θ ). Un risultato analogo si ha anche per il 2°, il 3° e il 4° autovettore
(figg. 5.3, 5.4, 5.5), che “puntano”, rispettivamente, a °−= 404θ , °+= 403θ e
°= 01θ .
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
180
Gli autovettori rimanenti (fig. 5.6) non descrivono lo spazio occupato dalle RFI,
ma dal rumore astronomico e di sistema: ad essi non viene attribuito un
significato particolare in termini di RFI.
Fig. 5.6: andamento del: 5°, 6°, 7° e 8° autovettore della matrice R̂ per l’Es. 1
5.2.2 Esempio 2
Come secondo esempio, viene riproposto il caso di 4 sensori ideali equispaziati di
8λ alla frequenza Mf : di fatto si è nuovamente di fronte al noto problema
dell’equivocazione spaziale. Con i parametri di simulazione presentati in tabella
5.3, si ottengono i seguenti autovalori di R̂ (tab. 5.4 e fig. 5.7).
Tab. 5.4: valori corrispondenti agli autovalori della matrice R̂ per l’Esempio 2
1 2 3 4 13004 2997.4 0.23186 0.20695
Autovalore n° Valore corrispondente
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
181
Tab. 5.3: valori assunti dai parametri principali nell’Esempio 2
Fig. 5.7: andamento degli autovalori di R̂ per l’Esempio 2
Ancora una volta si registrano tanti autovalori dominanti quante sono le RFI
presenti nello scenario considerato, cioè 2.
Un’importante osservazione può essere fatta guardando gli andamenti degli
autovettori corrispondenti agli autovalori dominanti (si veda la fig. 5.8, in cui, a
Numero sensori 4 Tipo sensore ideale Spaziatura sensori 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI -33° +14° Ampiezze RFI 2 4 Frequenze RFI 0.10 cf 0.25 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Parametro Valore
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
182
fianco della rappresentazione di ciascun autovettore, viene riportato il relativo
ingrandimento in prossimità della DOA dell’interferenza associata).
Fig. 5.8: andamento dei primi 2 autovettori (dominanti) della matrice R̂ e loro ingrandimento
nell’intorno di °+= 142θ e °−= 331θ (DOA delle RFI ad essi associati), per l’Esempio 2
Quando la spaziatura tra i sensori è maggiore di λ/2, l’equivocazione spaziale si
rispecchia anche negli autovettori: ad uno stesso autovettore possono essere
associate più DOA distinte. In altri termini, si ha equivocazione (ambiguità) nella
determinazione della DOA delle RFI. Nel caso preso in esame, il primo
autovettore risulta puntare in direzione della RFI di maggiore intensità
( °+= 142θ ), ma anche in tutte le direzioni equivocate; questo vale, in maniera del
tutto analoga, anche per il secondo autovettore.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
183
5.2.3 Esempio 3
Quale ultimo esempio, si consideri quello che fa riferimento alla ben nota
configurazione caratteristica del sistema BEST-1 (tabella 5.4).
Tab. 5.4: valori assunti dai parametri principali nell’Esempio 3
La terza radiointerferenza, con direzione di arrivo °+= 303θ , viene cancellata
automaticamente, grazie ad uno zero naturale del beampattern della singola
antenna dell’array (fig. a.6 in appendice A; se ne aveva già parlato nell’Es. 5 del
cap. 3).
Di questo fatto ci si può rendere conto anche mediante una analisi agli autovalori
ed autovettori della matrice di covarianza. Infatti gli autovalori dominanti non
risultano essere 3, bensì due, come suggerito dalla tabella 5.5 e dalla figura 5.9.
Tab. 5.5: valori corrispondenti agli autovalori della matrice R̂ per l’Esempio 3
L’autovettore corrispondente all’autovalore maggiore è legato strettamente
all’RFI che si dimostra essere di intensità maggiore, anche in relazione
all’andamento del guadagno della singola antenna dell’array. Nel caso in esame,
per esempio, l’interferenza di maggiore intensità non è più la seconda ma la
Parametro Valore
Numero antenne 4 Tipo antenna array di 16 dipoli equispaziati di λ/2 Spaziatura antenne 8λ @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +2° DOA RFI +10° -23° +30° Ampiezze RFI 2 4 6 Frequenze RFI 0.05 cf 0.25 cf 0.15 cf Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.01
Autovalore n° Valore corrispondente
1 2 3 4 145.46 17.791 0.31667 0.27267
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
184
prima, la quale gode maggiormente del guadagno offerto dall’antenna in direzione
°+= 101θ .
Fig. 5.9: andamento degli autovalori di R̂ per l’Esempio 3
Tutto ciò trova conferma in fig. 5.10, dove il primo autovettore punta in direzione
°+= 101θ e nelle corrispondenti DOA equivoche, il secondo in direzione
°−= 232θ e nelle corrispondenti DOA equivoche.
Fig. 5.10: andamento dei primi 2 autovettori (dominanti) della matrice R̂ e loro ingrandimento
nell’intorno di, rispett., °+= 101θ e °−= 232θ (DOA delle RFI ad essi associati), per l’Es. 3
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
185
Il terzo autovettore, ad ulteriore dimostrazione che la 3ª RFI è stata abbattuta, non
risulta puntare verso °+= 303θ (fig. 5.11).
Fig. 5.11: andamento del terzo autovettore della matrice R̂ e suo ingrandimento nell’intorno di
°+= 303θ (DOA della RFI ad esso associata), per l’Esempio 3
5.3 Null steering beamforming adattativo
I risultati ottenuti mediante le prove di simulazione descritte nel paragrafo
precedente hanno messo in evidenza come, da una analisi agli autovalori ed
autovettori della matrice di covarianza, si possano stimare, ad eccezione di alcuni
casi specifici, le DOA delle RFI con buona precisione.
Più precisamente, si è visto che ciò è possibile grazie alla stretta relazione che
lega gli autovalori (autovettori) dominanti con le RFI: gli autovettori dominanti
contengono ciascuno al proprio interno l’informazione sulla direzione di arrivo di
una RFI. L’esatta corrispondenza tra autovettore dominante e DOA della
radiointerferenza viene stabilita, come si è visto, dall’autovalore (dominante)
corrispondente.
Da questa constatazione si è pensato di progettare un beamformer che, a partire da
una analisi agli autovalori ed autovettori della matrice di covarianza, sfruttasse gli
autovettori dominanti per imporre vincoli sulle DOA delle RFI.
Usando altri termini, l’idea è quella di trattare gli autovettori dominanti alla stessa
stregua degli steering vector relativi alle RFI, potendo in questo modo generare
vincoli di annullamento della risposta del beamformer in corrispondenza delle
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
186
direzioni di arrivo delle interferenze stesse; questi vincoli vanno poi associati a
quello legato alla DOA del segnale utile, per assicurare sempre il guadagno
massimo nella direzione voluta.
Questo tipo di beamformer è di tipo blind, in quanto non richiede alcuna
informazione a priori circa la provenienza delle RFI.
L’adattività dell’algoritmo è garantita dal fatto che la matrice di covarianza viene
periodicamente stimata (dalla matrice dei dati grezzi) e successivamente
sottoposta all’analisi agli autovalori ed autovettori: questo permette di tenere
costantemente sotto controllo la situazione, per quel che riguarda le RFI presenti,
e quindi di inseguire eventuali interferenze che si spostano.
5.3.1 Implementazione Sinteticamente, i passi fondamentali necessari all’implementazione dell’algoritmo
su calcolatore sono i seguenti:
1. si eseguono esattamente nello stesso modo i primi 5 step riportati nel cap.
3 (par. 3.3) a proposito dell’algoritmo MVDR adattativi.
2. Occorre definire un valore di soglia opportuno per identificare
esattamente quali sono gli autovalori relativi alle RFI; questo valore serve
quindi per separare gli autovalori dominanti dagli altri.
Negli esempi che verranno mostrati successivamente la soglia sarà
determinata empiricamente.
Impostando un’operazione di confronto tra ciascun autovalore e questa
soglia, vengono considerati come dominanti solo quegli autovalori che si
dimostrano essere maggiori di essa.
3. Una volta stabiliti quali sono gli autovalori legati alle RFI, cioè
dominanti, si deve costruire una matrice C (matrice dei vincoli) così
strutturata: la prima colonna è costituita dallo steering vector associato
alla direzione di arrivo del segnale utile )( 0θdd0 = , le altre colonne sono
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
187
invece formate dagli autovettori corrispondenti a quegli autovalori che
sono stati precedentemente associati alle RFI, a seguito del confronto con
la soglia.
4. Si deve costruire un vettore colonna f (vettore risposta) avente come 1
primo elemento e tanti 0 quanti sono gli autovettori legati alle
interferenze.
5. Vengono calcolati i coefficienti w del beamformer:
( ) fCCCw H ⋅⋅=−1 (5.3)
6. Infine viene calcolato il beampattern complessivo secondo la già nota
relazione:
2
Dwnbeampatter HSTEERING-NULL = (5.4)
Dopo averlo normalizzato rispetto al suo valore massimo, è possibile
visualizzare l’andamento del guadagno su tutto l’asse spaziale.
5.3.2 Esempio di simulazione in ambiente statico In questa parte viene presentato un esempio che dimostra quali risultati si possono
ottenere in ambiente statico con l’utilizzo di questo algoritmo.
Si prenda in esame la situazione riassunta in tab. 5.6.
Per il caso considerato è stato assunto un valore di soglia pari a 1, che, come già
detto, è stato determinato empiricamente: infatti, a seguito di varie prove, tale
valore si è dimostrato utile ai fini preposti.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
188
Tab. 5.6: valori assunti dai parametri principali nell’Esempio 5.3.2
In fig. 5.12 sono mostrati i risultati che si ottengono sia mediante Null Steering
adattativo che con MVDR adattativo, adottando in entrambi i casi i parametri di
simulazione di tab. 5.6.
Fig. 5.12: confronto tra i beampattern ottenuti mediante Null Steering adattativo e MVDR
adattativo per l’Esempio 5.3.2
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -10° -50° +50° +60° Ampiezze RFI 2 4 3 5 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf 0.10 cf Soglia 1 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
189
Osservando la fig. 5.12 non si rilevano particolari differenze nei profili dei due
beampattern: si fa notare solamente come, per il caso MVDR, i lobi secondari
siano leggermente più alti, specie alle due estremità laterali del grafico e fra gli
angoli 50° - 60°; mentre si osserva un lievissimo allargamento del lobo principale
per quanto riguarda il Null Steering adattativo.
Se a quest’ultimo algoritmo si applica, peraltro senza grandi difficoltà,
un’operazione di “finestramento” dei coefficienti (per es. secondo l’algoritmo di
Hanning), ciò che si riesce ad avere è raffigurato qui di seguito (fig. 5.13).
Fig. 5.13: confronto tra i beampattern ottenuti mediante Null Steering adattativo, al quale è stata
applicata un’operazione di finestramento dei coefficienti secondo l’algoritmo di Hanning, e
MVDR adattativo per l’Esempio 5.3.2
Come era lecito aspettarsi, il finestramento causa un considerevole allargamento
del lobo principale nel beampattern del Null Steering adattativo, ma nel contempo
consente di abbassare notevolmente i lobi secondari, in certi casi anche di oltre 20
dB (es. -20°).
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
190
5.3.3 Esempio di simulazione in ambiente dinamico Si cambi lo scenario di applicazione e si passi ad un ambiente di funzionamento
dinamico, che vede dunque la presenza di interferenti in movimento (tab. 5.7).
Tab. 5.7: valori assunti dai parametri principali nell’Esempio 5.3.3
La situazione presa in considerazione è la stessa di quella presentata nell’Esempio
8 del cap. 3 (par. 3.5.2.1). Va sottolineato il fatto che, per il caso qui analizzato, è
stato impiegato un valore di soglia pari a 10; esso è stato ricavato ancora una volta
per via empirica in seguito a varie prove di simulazione.
Si riportano in fig. 5.14 i confronti dei beampattern relativi agli algoritmi Null
Steering adattativo ed MVDR adattativo per alcune iterazioni significative
eseguite dai sopra citati metodi.
E’ stato effettuato anche un semplice confronto fra le tempistiche di calcolo
richieste dai due algoritmi comparati nelle condizioni espresse in tab. 5.7.
I tempi valutati (fanno riferimento ad una CPU Intel Pentium 4, 3.00 GHz, 1.00
GB di RAM) sono risultati essere molto vicini fra loro (tab. 5.8):
NULL STEERING ADATTATIVO MVDR ADATTATIVO
8.6094 sec 8.5781 sec
Tab. 5.8: confronto dei tempi di calcolo richiesti da Null St. adatt. ed MVDR adatt. per l’Es. 5.3.3
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +30° DOA RFI -80° -60° [-50° 9.6667°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Soglia 10 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Parametro Valore
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
191
Fig. 5.14: sequenza dei confronti fra i beampattern ottenuti mediante Null Steering adattativo ed
MVDR adattativo per l’Esempio 5.3.3
Dalla fig. 5.14 si vede come non vi siano differenze sostanziali tra i beampattern
ottenuti con i due algoritmi confrontati: entrambi i beamformer inseguono molto
bene l’interferenza che si sposta nel tempo, posizionando un nullo di ricezione in
corrispondenza della sua direzione di arrivo.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
192
5.4 LCMV beamforming adattativo
Lo stesso principio che regola il funzionamento del beamformer descritto
precedentemente può essere applicato per realizzare un beamformer di tipo
LCMV adattativo. Come prima infatti, partendo dalla corrispondenza biunivoca
tra autovalori (autovettori) dominanti ↔ RFI, si può costruire una matrice dei
vincoli ed un vettore risposta per forzare una risposta desiderata in corrispondenza
di angoli di arrivo ben precisi. A differenza del null steering beamforming, questo
algoritmo sceglie il vettore dei coefficienti non solo sulla base di vincoli lineari,
ma anche effettuando la minimizzazione del valore atteso della potenza (o
varianza) in uscita.
Anche questo, come il precedente, è un beamformer di tipo blind, la cui adattività
è raggiunta attraverso il calcolo ciclico di R̂ .
Per la sua implementazione bisogna seguire gli stessi passi indicati nel par. 5.3.1
(riguardo al null steering adattativo): cambia, come già detto, solamente il criterio
per il calcolo dei coefficienti ottimi, cioè il passo n° 5:
5. vengono calcolati i coefficienti w del beamformer:
fCRC
CRw1-H
-1
⋅= ˆˆ
(5.5)
Si ritrova il problema dell’inversione della matrice -1R̂ , che si era già
incontrato nel cap. 3 per l’algoritmo MVDR. Anche in questa sede si
consiglia di non ricorrere all’inversione diretta della matrice, R̂ ma di
utilizzare la decomposizione di Cholesky, descritta in [13].
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
193
5.4.1 Esempio di simulazione in ambiente statico I parametri di simulazione sono riportati in tab. 5.9.
Tab. 5.9: valori assunti dai parametri principali nell’Esempio 5.4.1
Con tali valori dei parametri è stata eseguita una simulazione che confrontasse gli
andamenti dei beampattern relativi agli algoritmi LCMV adattativo ed MVDR
adattativo. Il risultato conseguito è riportato in fig. 5.15.
Fig. 5.15: confronto tra i beampattern ottenuti mediante LCMV adattativo ed MVDR adattativo
per l’Esempio 5.4.1
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -10° -50° +50° +60° Ampiezze RFI 2 4 3 5 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf 0.10 cf Soglia 1 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
194
L’esito della simulazione, apparentemente assurdo, in realtà non deve
sorprendere: infatti il principio di fondo che sta alla base del funzionamento dei
due algoritmi in esame è lo stesso. Precisamente, entrambi si avvalgono di
un’operazione di minimizzazione della varianza del segnale in uscita; l’unica
differenza risiede nel fatto che l’algoritmo LCMV sfrutta anche vincoli lineari sul
vettore dei coefficienti, per annullare la risposta in corrispondenza delle DOA
delle RFI. Questo evidentemente non porta a differenze osservabili dal grafico
riportato, ma solo un ingrandimento dello stesso può evidenziarle (fig. 5.16).
Fig. 5.16: ingrandimento della fig. 5.15 in corrispondenza della DOA del segnale desiderato
°+= 200θ per l’Esempio 5.4.1
Anche per quanto riguarda questo algoritmo si possono “finestrare” i coefficienti
(utilizzando ancora l’algoritmo di Hanning), ottenendo l’andamento del
beampattern rappresentato in fig. 5.17.
Tale strategia non porta però a sostanziali miglioramenti per quel che concerne i
lobi secondari, pur causando sempre un consistente allargamento del lobo
principale. A conclusione di questa prova non si consiglia di sottoporre questo
metodo ad alcuna operazione di finestramento.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
195
Fig. 5.17: confronto tra i beampattern ottenuti mediante LCMV adattativo, al quale è stata
applicata un’operazione di finestramento dei coefficienti secondo l’algoritmo di Hanning, e
MVDR adattativo per l’Esempio 5.4.1
5.4.2 Esempio di simulazione in ambiente dinamico Anche l’algoritmo LCMV adattativo è stato testato in condizioni di
funzionamento non stazionarie, analogamente a quanto fatto per il metodo Null
Steering adattativo. Lo scenario di simulazione è lo stesso di quello considerato
nell’Esempio 5.3.3 (tab. 5.10).
Tab. 5.10: valori assunti dai parametri principali nell’Esempio 5.4.2
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +30° DOA RFI -80° -60° [-50° 9.6667°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Soglia 10 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
196
La simulazione pertanto fornisce i seguenti risultati (fig. 5.18).
Fig. 5.18: sequenza dei confronti fra i beampattern ottenuti mediante LCMV adattativo ed MVDR
adattativo per l’Esempio 5.4.2
Come ci si poteva aspettare, anche dalla simulazione in un contesto tempo-
variante i due beamformer posti a confronto presentano un comportamento
pressoché identico, ad ulteriore conferma di quanto rilevato nel caso statico.
Capitolo 5 Analisi agli autovalori ed autovettori della matrice di covarianza
197
Per completezza, anche nel presente esempio viene eseguito un raffronto dal
punto di vista dei tempi di calcolo fra i due algoritmi analizzati. (tab. 5.11).
LCMV ADATTATIVO MVDR ADATTATIVO
9.125 sec 9.3125 sec
Tab. 5.11: confronto dei i tempi di calcolo richiesti da LCMV adattativo ed MVDR adattativo per
l’Esempio 5.4.2
I tempi, come riscontrato anche nell’Esempio 5.3.3 a proposito di Null Steering
ed MVDR, differiscono di pochi decimi di secondo.
CAPITOLO 6
KLT E BEAMFORMING Le prove descritte nel capitolo precedente hanno dimostrato che, attraverso
l’analisi agli autovalori ed autovettori della matrice di covarianza R, si è in grado,
tranne in certi casi particolari, di pervenire alla conoscenza degli angoli di arrivo
delle radiointerferenze, pur non avendo alcuna informazione a priori su queste
ultime. Questo importante riscontro costituisce di fatto il primo passo verso lo
studio dell’applicabilità della trasformata di Karhunen-Loève (KLT) al
beamforming.
Nel presente capitolo si cercherà proprio di capire se il principio basilare su cui
poggia la formulazione della trasformata possa condurre ad un modo alternativo
di realizzare il filtraggio spaziale. Questo tipo di ricerca verrà portata avanti anche
seguendo la traccia del KLT signal processing ([23]), dal momento che esiste una
forte analogia tra filtraggio spaziale e filtraggio spettrale.
Nella prima parte verrà introdotta la KLT da un punto di vista puramente
concettuale, successivamente si passerà ad una breve descrizione analitica, infine
verrà proposto un possibile metodo per la realizzazione di un beamformer.
Capitolo 6 KLT e beamforming
200
6.1 Considerazioni introduttive
La KLT si inserisce fra le numerose tecniche di analisi dei segnali tuttora
conosciute: la trasformata di Fourier (FT), la trasformata Wavelet (WT), la
Discrete Cosine Transform (DCT), la Walsh Transform, la Hadamard Tranform
(HT), per citarne alcune.
La sua scoperta risale all’anno 1946 per opera di due matematici, il finlandese
Kari Karhunen e il francese-americano Maurice Loève, i quali vi giunsero
indipendentemente l’uno dall’altro ma quasi in contemporanea.
Nonostante la KLT fosse nota già a metà del secolo scorso, fino a pochi anni fa i
campi di applicazione di tale trasformata erano pochi se non addirittura nulli, per
il fatto che essa ha un costo computazionale molto elevato.
Da alcuni anni a questa parte, però, l’incremento della potenza di calcolo dei
moderni elaboratori elettronici ha reso di nuovo la KLT un argomento di estremo
interesse negli ambienti di ricerca.
L’ambito in cui oggi, mediante questo metodo, si stanno ottenendo i risultati più
brillanti è quello che riguarda la compressione dati (in particolare immagini).
Ulteriori studi di applicazione della trasformata riguardano l’estrazione di
caratteristiche da un oggetto preso in esame, in modo da poterlo riconoscere e
quindi classificare (pattern recognition).
Negli esempi appena accennati non si hanno vincoli temporali: una volta
memorizzata l’informazione da elaborare, non importa quanto tempo sia
necessario per il calcolo della trasformata.
Diversamente, alcuni contesti applicativi come la radioastronomia, soggetti a
ristretti vincoli sul tempo (operazioni in real time), richiedono l’utilizzo di
“trasformate veloci” nelle complesse elaborazioni dei segnali.
Per questo motivo la trasformata di Fourier è una delle più usate (non solo in
campo radioastronomico), per merito dell’algoritmo che la calcola in maniera
efficiente e veloce, la FFT (Fast Fourier Transform).
Capitolo 6 KLT e beamforming
201
La FT permette una analisi molto accurata dei segnali periodici, quelli cioè che
possono essere rappresentati come somma di sinusoidi, ma lo stesso non si può
dire se viene a mancare questa condizione: infatti, quando si ha di fronte un
segnale non periodico, la FT può portare ad una sua approssimazione imprecisa.
Per contro, la KLT non risente di questa restrizione: essa è in grado di estrarre dal
segnale basi ortogonali che sono in generale non periodiche (sono periodiche se il
segnale stesso è periodico). In questo risiede tutta la potenza e l’efficienza di
questa trasformata.
Il discorso che segue esula per certi aspetti dall’argomento affrontato sin qui, ma
è utile per capire qual è il concetto di base su cui si fonda la KLT.
Si consideri un oggetto, per esempio un libro, e un sistema di riferimento
composto dai tre assi cartesiani nello spazio. Per la meccanica classica, tutte le
proprietà del libro relative alla dinamica di rotazione possono essere descritte
mediante una matrice simmetrica 33× , chiamata “matrice d’inerzia”, i cui
elementi sono in generale diversi da zero. Gestire una matrice i cui elementi sono
diversi da zero è ovviamente più complicato che gestire una matrice in cui gli
unici elementi diversi da zero sono disposti sulla diagonale principale.
Quindi sorge quasi spontanea la domanda se esiste una qualsiasi trasformazione,
che cambia la matrice di inerzia in una matrice diagonale.
La meccanica classica aiuta in questo senso, dando prova che esiste un solo
sistema di orientamento privilegiato rispetto al libro. Il sistema a cui si sta
facendo riferimento è formato da quegli assi paralleli ai lati dell’oggetto in analisi,
in questo caso il libro; tali assi sono proprio gli autovettori della matrice di
inerzia. In altre parole, ciascun oggetto possiede un proprio sistema privilegiato
che descrive nel modo migliore la sua dinamica rotazionale.
Si torni nell’ambito dell’elaborazione dei segnali; è noto che l’analisi
dell’autocorrelazione conduce ad una buona tecnica per estrarre il segnale dal
rumore (si veda la sezione successiva, per ulteriori approfondimenti si rimanda a
[23],[24],[25],[26],[27]). Se, infine, si considera l’autocorrelazione come il libro
del precedente esempio, allora si possono cercare gli autovettori della matrice di
Capitolo 6 KLT e beamforming
202
autocorrelazione, per trovare la più semplice rappresentazione dei dati. Questa è
l’idea chiave del KLT signal processing.
Un’ulteriore proprietà che rende questa trasformata così interessante riguarda la
compressione. Si consideri una generica funzione f; si può dire che esistono
infinite serie che la decompongono in somma pesata di vettori: la serie di Fourier
e la serie (o espansione) di Karhunen-Loève (KL) (vedi 6.1) sono solamente due
esempi. Si supponga di voler approssimare la funzione f utilizzando solo i primi k
termini di una serie qualsiasi. Ebbene, la serie di KL è quella che, a parità di
termini considerati, restituisce la miglior approssimazione della funzione f
originale. Quest’ultima affermazione va a confermare quanto si era detto in
precedenza, a proposito dell’applicazione della KLT alla compressione dati.
Se fino a poco tempo fa la KLT non veniva quasi considerata in campo
radioastronomico, di recente ha cominciato a trovare posto anche in questo
settore. Infatti è stato da poco sviluppato, presso la stazione radioastronomica di
Medicina, un algoritmo per il calcolo della KLT di segnali stazionari ([25],[28]).
Lo studio che ha condotto all’implementazione di questo algoritmo è stato
supportato dal progetto SETI (Search for ExtraTerrestrial Intelligence) Italia, il
quale, come suggerisce il nome stesso, è il programma che si occupa della ricerca
di eventuali segnali radio artificiali provenienti da civiltà extraterrestri.
L’algoritmo adottato per il calcolo della KLT (fig. 6.1) consente di ottenere una
buona approssimazione di un insieme ridotto di autovalori (quelli dominanti)
della matrice di autocorrelazione del segnale. Questa sua peculiarità, grazie anche
alla disponibilità di un sistema di elaborazione dati altamente potente (sistema
modulare multi-nodo MEDALT-1), porta ad una sensibile riduzione dei tempi di
calcolo. Sebbene dal punto di vista computazionale sia comunque più
svantaggioso rispetto alla FFT, l’algoritmo che implementa la KLT riesce a
rilevare segnali assai più deboli di quelli rilevati tramite FFT e indipendentemente
dalla larghezza di banda (la FFT si limita invece ad estrarre segnali a banda
stretta). Si può concludere asserendo che la KLT è di molto superiore alla FFT in
ambito SETI per la rilevazione di possibili segnali candidati ET.
Capitolo 6 KLT e beamforming
203
Fig. 6.1: diagramma a blocchi in cui viene schematizzato l’algoritmo che calcola la KLT per
processi stocastici stazionari, sviluppato a Medicina per SETI-Italia
6.2 Approccio analitico
Si consideri una funzione aleatoria (o processo stocastico) X(t) su un intervallo di
tempo finito Tt ≤≤0 ; essa può essere espressa sotto forma di combinazione
lineare di un insieme infinito di funzioni ortonormali ϕn(t):
)t(Z)t(X n1n
nϕ∑∞
=
= per Tt ≤≤0 (6.1)
Questa è la cosiddetta espansione di Karhunen-Loève (KL) di X(t) sull’intervallo
di tempo finito Tt ≤≤0 .
Le funzioni del tempo ϕn(t) soddisfano la condizione di ortonormalità espressa da:
mnn
T
0m dt)t()t( δϕϕ =∫ (6.2)
dove δmn è il simbolo di Kronecker.
Capitolo 6 KLT e beamforming
204
I coefficienti dell’espansione Zn sono variabili aleatorie (che quindi non
dipendono dal tempo).
Dunque si può affermare che l’espansione KL permette di esprimere la funzione
aleatoria X(t) come una quantità formata da due parti: la prima, rappresentata
dalle funzioni ortonormali ϕn(t), si riferisce al suo comportamento nel tempo; la
seconda, rappresentata dalle variabili aleatorie Zn, si riferisce al suo
comportamento dal punto di vista probabilistico.
Si supponga che la funzione aleatoria X(t) abbia media nulla (questa ipotesi non fa
perdere di generalità le considerazioni successive), cioè:
0)t(X ≡ (6.3)
Dal momento che si ha:
)t(Z)t(X n1n
n ϕ∑∞
=
= (6.4)
risulta immediatamente che:
0Zn ≡ (6.5)
Si ricordi che tutto ciò è valido per Tt ≤≤0 .
Poiché 0Zn ≡ , ne consegue che:
2n
2Z Z
n=σ (6.6)
Capitolo 6 KLT e beamforming
205
Se ora viene introdotta una nuova sequenza di numeri positivi λn, tali che ognuno
di essi sia proprio la varianza della corrispondente variabile aleatoria Zn:
0Z 2nn
2Zn
>== λσ (6.7)
è possibile, di conseguenza, dimostrare che le variabili aleatorie soddisfano la
seguente equazione:
mnnmn ZZ δλ= (6.8)
Si può quindi concludere che le variabili aleatorie sono statisticamente incorrelate
fra loro.
Per riassumere, attraverso l’espansione KL si è ottenuta una importante
generalizzazione delle serie di Fourier per segnali non deterministici.
Più precisamente, l’espansione KL può essere definita come l’unica possibile
espansione statistica in cui tutti i termini sono incorrelati gli uni dagli altri.
Si tenga presente la definizione di cross-correlazione tra due funzioni aleatorie del
tempo:
)t(Y)t(X)t,t(R 2121XY = (6.9)
In particolare, l’autocorrelazione di una singola funzione aleatoria X(t) è definita
come:
)t(X)t(X)t,t(R)t,t(R 2121X21XX == (6.10)
Dal momento che vale 0)( ≡tX per Tt ≤≤0 , allora:
)t,t(R)t(X)t(X)t(X X22
)t(X ===σ (6.11)
Capitolo 6 KLT e beamforming
206
Può essere dimostrato ([24], [27]) che le variabili aleatorie dell’espansione Zn,
che, come si è detto, sono incorrelate (per costruzione), sono anche
statisticamente indipendenti solamente se hanno una distribuzione di tipo
gaussiano.
Si trova inoltre, attraverso vari passaggi matematici ([24], [27]), che le funzioni
ortonormali del tempo ϕn(t) sono le autofunzioni dell’autocorrelazione
)t(X)t(X)t,t(R 2121X = e che i λn sono i corrispondenti autovalori.
Concettualmente, dato un generico processo stocastico (es. segnale+rumore),
quest’ultimo può essere descritto attraverso l’autocorrelazione, la cui matrice
assume quindi il ruolo di matrice descrittiva del processo stocastico rispetto ad un
generico “sistema di riferimento”. Se di questa matrice di autocorrelazione si
trovano gli autovettori e questi ultimi vengono utilizzati come nuovo sistema di
riferimento, allora si ottiene la migliore descrizione possibile del processo
stocastico.
In questo senso le autofunzioni ϕn(t), che formano una base ortonormale in quello
che viene comunemente chiamato spazio di Hilbert o spazio delle funzioni di
quadrato sommabile, rappresentano realmente la migliore base possibile per
descrivere il processo stocastico, molto più adatta, in particolare, della base
classica di Fourier composta solo da seni e coseni.
Matematicamente si può ricavare la seguente equazione integrale ([24], [27]):
)t(dt)t()t(X)t(X 2nn11
T
0n21 ϕλϕ =∫ (6.12)
Una volta nota l’autocorrelazione di X(t), da questa equazione integrale, la cui
soluzione è molto spesso complicata, si ottengono gli autovalori λn e le
corrispondenti autofunzioni ϕn(t2).
Successivamente si devono ordinare gli autovalori λn in ordine decrescente di
grandezza e, corrispondentemente, anche le autofunzioni associate ad essi, in
modo tale che ogni autofunzione si mantenga in corrispondenza del suo proprio
Capitolo 6 KLT e beamforming
207
autovalore. I primi autovalori, i più grandi, vengono solitamente chiamati
“dominanti”.
La KLT (Karhunen-Loève Transform) consiste proprio nel passare al nuovo
insieme di “auto-assi” per descrivere il processo X(t). Applicare la KLT diretta ad
un processo stocastico X(t) (rappresentato da un generico insieme di assi)
significa quindi rappresentare il processo stesso con questo nuovo insieme di
“auto-assi”; in altre parole la KLT non è altro che una trasformazione lineare di
assi. Concludendo, la KLT ha l’importantissima proprietà di adattarsi molto bene
alla forma del processo stocastico in esame, qualunque comportamento nel tempo
esso abbia, adottando, come nuovo sistema di riferimento nello spazio di Hilbert,
la base generata dalle autofunzioni dell’autocorrelazione di X(t).
Finora si è sempre fatto riferimento alla variabile temporale t continua; se però
questa variabile temporale è discreta, l’equazione integrale diventa un sistema di
equazioni algebriche di primo grado che possono essere sempre risolte. Il
problema è che questo sistema di equazioni lineari è spesso di dimensioni
elevatissime, poiché, per le applicazioni più comuni (elaborazione del segnale,
compressione di immagini, ecc…), la matrice di autocorrelazione è enorme. La
KLT sarebbe dunque impossibile da applicare numericamente, se non si facesse
ricorso ad alcune operazioni semplificative.
Tornando al significato statistico della KLT, bisogna sottolineare il fatto che,
riordinando in ordine decrescente di grandezza gli autovalori
dell’autocorrelazione λn, vengono automaticamente riordinati, in ordine
decrescente secondo la loro importanza statistica, anche gli auto-assi.
In pratica, quindi, il primo auto-asse è quello attorno al quale si concentra la
varianza più grande, il secondo auto-asse è quello con la seconda varianza più
grande e così via.
Di conseguenza più auto-assi si prendono in considerazione, maggiore è la parte
statisticamente significativa dei dati di cui si sta tenendo conto. Ma, dal momento
che le varianze attorno agli assi decrescono mano a mano che se ne prendono in
considerazione, si ottengono corrispondentemente parti, del set di dati sotto
esame, sempre meno significative dal punto di vista statistico.
Capitolo 6 KLT e beamforming
208
Diventa allora evidente come sia possibile applicare il filtraggio del rumore sui
dati iniziali applicando la KLT: questo procedimento è noto come “KLT noise
filtering”.
Infatti il filtraggio KLT consiste proprio nel considerare semplicemente un
numero ridotto di auto-assi dominanti dal loro insieme infinito, e poi trattare la
parte dei dati ottenuta come la parte statisticamente più significativa, con al suo
interno quindi il “segnale utile”. Il rumore invece lo si considera automaticamente
contenuto all’interno della parte dei dati che è stata “tagliata”.
Infine, per poter estrarre il segnale dal rumore è necessario semplicemente
applicare la trasformata KLT inversa (operazione ancora una volta lineare) sulla
parte dei dati statisticamente più significativa.
Dal confronto tra la trasformata classica di Fourier e la KLT emergono alcuni
vantaggi di quest’ultima:
è applicabile sia a segnali a larga banda sia a quelli a banda stretta,
mentre la FT è applicabile rigorosamente solo a segnali a banda
stretta;
è adatta sia a processi stocastici stazionari che non-stazionari, mentre
la FT può essere applicata teoricamente solo a processi stazionari;
non è condizionata da problemi di “finestramento” come la FT,
poiché la KLT è definita su un intervallo temporale finito Tt0 ≤≤ .
La KLT ha però uno svantaggio fondamentale: essa comporta una complessità
computazionale molto più elevata rispetto alla FFT.
Precisamente, se la matrice di autocorrelazione dei dati a disposizione ha
dimensioni NN × , allora la complessità di calcolo per trovare gli autovalori ed
autovettori cresce come 2N , mentre nel caso FFT si ha un carico computazionale
proporzionale a )Nlog(N ⋅ .
Purtroppo non c’è modo, in linea generale, di trovare un algoritmo di Fast KLT
(che cresca come )Nlog(N ⋅ ), dal momento che il nucleo della KLT non è
separabile.
Capitolo 6 KLT e beamforming
209
Infatti per un generico processo stocastico X(t) vale:
)t(X)t(X)t(X)t(X 2121 ≠ (6.13)
e non si ha mai:
)t(X)t(X)t(X)t(X 2121 = (6.14)
Esiste comunque un’eccezione, nel caso in cui X(t) abbia un’autocorrelazione
esponenziale del tipo:
12 tt21 Ce)t(X)t(X −= (6.15)
dove C è una costante. In questo caso l’autocorrelazione può essere calcolata
come il prodotto dei due termini: )t(X)t(X 21 e quindi si ha un notevole
abbassamento dei calcoli richiesti, analogamente alla FFT ( )Nlog(N ⋅ ).
6.3 Progetto del beamformer
A seguito delle prove riportate nel cap. 5, si è arrivati ad una importante
conclusione: alcuni autovettori della matrice di covarianza hanno un legame
particolare con le radiointerferenze, in un certo senso sono rappresentativi di
queste ultime; questi autovettori contengono infatti al loro interno l’elemento che
meglio di ogni altro le caratterizza nel dominio spaziale: cioè la direzione di
arrivo. Ma se alcuni autovettori portano con sé l’informazione spaziale relativa
alle RFI, è lecito pensare che gli altri autovettori siano rappresentativi (sempre dal
punto di vista spaziale) del segnale utile sommato al rumore di fondo.
Viene allora da domandarsi se si è in grado di formare un beam d’antenna che
punti la direzione voluta e cancelli il segnale prodotto dalle sorgenti interferenti,
Capitolo 6 KLT e beamforming
210
utilizzando solamente gli autovettori legati a segnale utile + rumore ed escludendo
quelli “dovuti” alle RFI.
Tenendo presente la teoria della KLT, sembra che questo interrogativo trovi
risposta affermativa: infatti, partendo dal set di autovettori della matrice di
covarianza e trascurando quelli legati alle RFI, si dovrebbe ottenere la migliore
stima statistica (dal punto di vista spaziale) del segnale + rumore.
Ma come utilizzare gli autovettori non associati alle RFI per rappresentare al
meglio (sempre dal punto di vista spaziale) il segnale utile immerso nel rumore?
Seguendo anche le indicazioni tratte dallo studio del KLT signal processing, è
ragionevole pensare di combinare linearmente questi autovettori (non legati alle
RFI). Rimane da stabilire in che modo. L’idea che è sembrata più fondata è stata
quella di utilizzare come pesi della combinazione lineare i prodotti scalari tra
ciascun autovettore (fra quelli che non sono in relazione con le RFI) e lo steering
vector dell’array relativo alla direzione del segnale utile. Concettualmente ciò
equivale a proiettare ortogonalmente ogni autovettore sullo steering vector d0 in
modo tale da stabilire in quale misura essi puntano in direzione 0θ .
6.3.1 Implementazione Per l’implementazione dell’algoritmo si effettuino questi passaggi:
1. si ripetano le stesse operazioni riferite ai passi 1 e 2 del par. 5.3.1 (cap. 5)
a proposito del beamformer null steering adattativi.
2. Una volta noti gli autovettori legati al segnale utile + rumore, si esegua
per ciascuno di essi il prodotto riga×colonna con )( 0θdd0 = . In tal
modo si ottengono tanti valori scalari quanti sono gli autovettori utilizzati
nei prodotti;
3. Si calcoli il vettore w dei coefficienti del beamformer, come
combinazione lineare degli autovettori relativi a segnale utile + rumore,
Capitolo 6 KLT e beamforming
211
impiegando come pesi della sommatoria i valori scalari trovati al passo
precedente.
4. Infine si calcola il beampattern complessivo con l’espressione più volte
riportata e presente anche al passo 6 del paragrafo 5.3.1 (cap. 3).
6.3.2 Prove di simulazione Sono state svolte alcune prove di simulazione per verificare l’attendibilità delle
precedenti considerazioni teoriche.
Ricalcando lo stesso modo di procedere sin qui adottato, dapprima sono stati presi
in esame scenari con sorgenti di interferenza fisse, successivamente si è passati
alla valutazione di situazioni più complesse, con interferenti mobili.
Da qui in avanti ci si riferirà all’algoritmo proposto con il nome di KLT
beamformer semplicemente per motivi di praticità d’uso, sebbene forse non sia un
nome strettamente appropriato.
6.3.2.1 Esempio di simulazione in ambiente statico
I parametri di simulazione sono stati impostati con i seguenti valori (tab. 6.1).
Tab. 6.1: valori assunti dai parametri principali nell’Esempio 6.3.2.1
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 1000 Campioni usati per R̂ 200 DOA puntamento +20° DOA RFI -10° -50° +50° +60° Ampiezze RFI 2 4 3 5 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf 0.10 cf Soglia 1 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 6 KLT e beamforming
212
La prima simulazione effettuata (fig. 6.2) ha consentito di accertare i
ragionamenti teorici sintetizzati nel par. 6.3.
Fig. 6.2: confronto tra i beampattern ottenuti mediante KLT adattativo ed MVDR adattativo per
l’Esempio 6.3.2.1
Come già notato a proposito del beamformer Null Steering adattativo, anche in
questo caso si osservano lobi laterali leggermente più bassi nel beampattern del
metodo KLT rispetto a quello del MVDR; come prima, inoltre, il lobo principale
ottenuto con il metodo MVDR risulta di poco più stretto rispetto a quello ottenuto
con KLT.
Si sono voluti così confrontare fra loro Null Steering adattativo e metodo KLT
(fig. 6.3).
Fig. 6.3: confronto tra i beampattern ottenuti mediante KLT adattativo e Null Steering adattativo
per l’Esempio 6.3.2.1
Capitolo 6 KLT e beamforming
213
La fig. 6.3 sembra mostrare un risultato apparentemente sconcertante: in realtà
dimostra che, per arrivare al beampattern finale, i due metodi seguono lo stesso
procedimento ma eseguendo le operazioni in ordine diverso; per questo motivo si
ottengono gli stessi risultati. Più precisamente, il metodo KLT modella il beam
d’antenna escludendo gli autovettori legati alle RFI: questo, concettualmente,
equivale ad imporre uno zero di ricezione in corrispondenza delle DOA associate
a questi stessi autovettori (metodo Null Steering).
6.3.2.2 Esempio di simulazione in ambiente dinamico
Quest’ultimo test, eseguito in un contesto dinamico, fa riferimento ai parametri di
simulazione di tab. 6.2.
Tab. 6.2: valori assunti dai parametri principali nell’Esempio 6.3.2.2
Parametro Valore
Numero sensori 8 Tipo sensore ideale Spaziatura sensori λ/2 @ Mf Tempo di osservazione [campioni] 100000 Campioni usati per R̂ 2000 DOA puntamento +30° DOA RFI -80° -60° [-50° 9.6667°] Ampiezze RFI 2 4 3 Frequenze RFI 0.05 cf 0.25 cf 0.30 cf Soglia 10 Varianza rumore naturale 2
nσ 0.001
Varianza rumore artificiale 2aσ 0.001
Capitolo 6 KLT e beamforming
214
La fig. 6.4 rappresenta il confronto tra il beampattern ottenuto con l’algoritmo
KLT e quello ottenuto con l’algoritmo MVDR per alcune iterazioni significative.
Fig. 6.4: sequenza dei confronti fra i beampattern ottenuti mediante metodo KLT adattativo ed
MVDR adattativo per l’Esempio 6.3.2.2
Capitolo 6 KLT e beamforming
215
L’andamento del beampattern relativo al metodo KLT adattativo si avvicina
molto a quello prodotto dall’algoritmo MVDR adattativo, come già sottolineato
per il caso stazionario.
Analogamente a quanto fatto negli esempi del cap. 5 riguardo ai metodi Null
Steering e LCMV, anche nella situazione qui considerata viene svolta una
valutazione sui tempi di calcolo richiesti dai due algoritmi confrontati per le
elaborazioni (tab. 6.3).
Tab. 6.3: confronto tra il tempo di calcolo richiesto dal metodo KLT adattativo e quello richiesto
dal metodo MVDR adattativo per l’Esempio 6.3.2.2
A conclusione di questo duplice raffronto in termini di andamento della risposta e
tempi richiesti per i calcoli, non risultano esserci evidenti differenze tra i metodi
esaminati.
Ma si rifletta su questo: il funzionamento del metodo KLT, per come è stato
implementato, si basa su una analisi agli autovalori ed autovettori della matrice di
covarianza, che quindi vengono calcolati.
In aggiunta, si consideri anche che la tecnica del beamforming rappresenta
solamente un primo stadio di elaborazione del segnale, ad essa seguiranno poi
ulteriori operazioni e trasformazioni al fine di estrarre l’informazione utile dai dati
ricevuti e scartare il rumore.
Questa operazione di “ricostruzione” del segnale utile è possibile, come insegnato
dalla teoria della KLT, partendo proprio dalla conoscenza di autovalori ed
autovettori.
Quindi, dal momento che il metodo di beamforming descritto in questa sezione
(indicato con il nome KLT) calcola già direttamente gli autovalori ed autovettori,
l’utilizzo di quest’ultimo rende di fatto non più necessario il calcolo di questi
autovalori ed autovettori nella fase successiva di ricostruzione del segnale.
KLT ADATTATIVO MVDR ADATTATIVO
9.0313 sec 9.1406 sec
Capitolo 6 KLT e beamforming
216
Questo tipo di ragionamento, frutto di valutazioni ad ampio raggio, assieme alle
considerazioni già svolte in merito al confronto di prestazioni, rendono
l’algoritmo studiato preferibile rispetto al metodo MVDR.
CONCLUSIONI E SVILUPPI FUTURI
Attraverso questo lavoro di tesi è stato affrontato l’importante e delicato
argomento del beamforming, che grande rilevanza assume nel contesto delle
applicazioni radioastronomiche. Le tematiche sviluppate e riportate in questa
dissertazione di laurea si inseriscono nell’ambito di due progetti (LOFAR e SKA),
avviati dalla comunità radioastronomica mondiale, ai quali partecipa attivamente
anche il radiotelescopio “Croce del Nord” di Medicina (BO).
Inizialmente è stato preso in esame un algoritmo di beamforming (MVDR,
Minimum Variance Distortionless Response), già noto nel mondo delle
telecomunicazioni tradizionali, che era già stato studiato in un lavoro precedente
solamente in scenari deterministici. Di conseguenza è stata portata avanti
un’accurata analisi che ne mettesse in evidenza le proprietà di adattività in
condizioni di funzionamento dinamiche. In particolare, sono state effettuate
numerose prove, mediante il software di simulazione MATLAB, in cui venivano
riprodotte, in maniera quanto più aderente possibile alla realtà, situazioni che
prevedevano la presenza di sorgenti di segnale sia fisse che in movimento.
Si è potuto così constatare che tale algoritmo si prestava molto bene a cancellare
radiointerferenze con direzione di arrivo variabile nel tempo.
A questa è seguita una lunga ed intensa fase di ricerca bibliografica mirata a
trovare e poi selezionare nuovi algoritmi di beamforming particolarmente adatti
ad un utilizzo in campo radioastronomico. A tal proposito sono stati esaminati
numerosi papers reperiti sia dal web che dall’archivio delle pubblicazioni
dell’istituto IEEE. Una di queste letture ha suscitato l’interesse verso un
particolare algoritmo, di tipo LCMV (Linearly Constrained Minimum Variance)
nel dominio della frequenza. A seguito della sua implementazione su calcolatore,
Conclusioni e sviluppi futuri
250
varie simulazioni hanno permesso di metterlo alla prova in vari tipi di scenari,
caratterizzati ciascuno da un diverso numero di interferenti sia fissi che mobili.
I risultati ottenuti hanno mostrato che questo algoritmo offre buone prestazioni in
condizioni statiche, in taluni casi anche migliori del MVDR, ma viene messo in
crisi non appena si trova di fronte sorgenti di RFI che si spostano. Infatti è stato
verificato che l’algoritmo in questione non riusciva a convergere alla soluzione
statisticamente ottima nel corso delle iterazioni da esso prodotte. A questo
problema, anche dopo molteplici tentativi, non si è riusciti a porre rimedio.
L’esito di tali simulazioni hanno convinto a giudicare negativamente questo
algoritmo e a considerarlo non idoneo alle applicazioni radioastronomiche.
In seguito si è passati allo studio dell’implementazione di una tecnica di
beamforming che si avvalesse di un principio di funzionamento analogo a quello
alla base del KLT signal processing. Una prima attività di apprendimento e ricerca
è stata necessaria per capire le nozioni di base della teoria generale della KLT
(Karhunen-Loève Transform). A ciò è seguita una serie di prove di simulazione
riguardo al significato intrinseco degli autovalori ed autovettori della matrice di
covarianza. Le conclusioni a cui si è arrivati hanno portato alla formulazione di
due algoritmi di beamforming adattativi, le cui prestazioni poco si discostano da
quelle fornite dall’algoritmo MVDR. Si è potuto osservare infatti che, oltre ad
avere risposte nel dominio spaziale pressoché identiche (sia in ambiente statico
che stazionario), anche i tempi di calcolo rimangono praticamente equivalenti.
Essi inoltre ben si prestano ad un’operazione di finestramento dei coefficienti,
grazie alla quale si raggiunge, come prevedibile, un notevole abbassamento dei
lobi secondari del diagramma di radiazione, a scapito di un certo allargamento del
lobo principale.
Infine si è proposto un possibile metodo per la realizzazione di un beamformer,
che segue le indicazioni tratte dalla teoria della KLT.
Anche per questo tipo di beamformer sono state riscontrate prestazioni
perfettamente in linea con quelle offerte dal metodo MVDR, sia dal punto di vista
della cancellazione dei segnali interferenti (in scenari statici e non), che da quello
dei tempi richiesti per le operazioni computazionali.
Conclusioni e sviluppi futuri
251
Una valutazione più completa, che tiene conto anche delle operazioni necessarie a
filtrare il segnale dal rumore, ha spinto a considerare con interesse questo
algoritmo, anche come valida alternativa al più volte citato MVDR.
Questo lavoro, incentrato su un argomento complesso ed al tempo stesso in
continua evoluzione, è ben lungi dal voler essere considerato fine a se stesso, ma
vuole costituire un punto di partenza per ulteriori sviluppi futuri e
approfondimenti. A riguardo si segnala la possibilità di estendere le prove
effettuate con gli algoritmi presi in considerazione anche al caso di array planare.
In aggiunta va senza dubbio portato avanti lo studio della relazione tra KLT e
beamforming, che potrebbe portare in futuro a soluzioni ed idee innovative.
APPENDICE A
IL SISTEMA BEST-1
La prima fase del progetto BEST, tramite cui si vuole rendere la “Croce Del
Nord” un valido dimostratore per SKA, ha portato alla realizzazione del sistema
BEST-1. Esso prevede l’upgrade (ammodernamento) di un cilindro parabolico del
ramo Nord-Sud (vedi figura a.1) tramite l’installazione, sulla linea focale, di 4
ricevitori equidistanziati di 162λ⋅ l’uno dall’altro alla frequenza di 408 MHz.
Ogni blocco di ricezione si compone essenzialmente di: un’antenna costituita da
16 dipoli disposti in parallelo e distanziati tra loro di 2λ , un front-end tri-stadio,
dei filtri ed un link analogico in fibra ottica (tramite cui il segnale arriva alla
stanza del ricevitore).
Fig. a.1: cilindro parabolico del ramo N-S impiegato nell’ambito del progetto BEST-1
Appendice A Il sistema BEST-1
218
I parametri fisici di BEST-1 implicano delle considerazioni di non poco conto sui
limiti del suo beampattern, che sarà l’oggetto di studio in questa appendice.
Più precisamente verrà approfondito il già citato problema dei lobi di grating
(vedi cap.1) che, in certe situazioni, condiziona in modo estremamente negativo la
risposta del beamformer.
Per meglio analizzare le caratteristiche dei diagrammi di radiazione delle antenne,
verranno introdotti semplici esempi numerici grazie all’ausilio di MATLAB.
A.1 Equivocazione spaziale e lobi di grating
In via preliminare si ritiene opportuno riportare, sebbene in forma semplificata, il
principio enunciato dal teorema del campionamento spaziale: una spaziatura tra i
sensori pari a 2λ è la distanza massima alla quale questi ultimi possono essere
collocati senza che avvenga equivocazione spaziale (sarà chiarito più avanti il
significato di equivocazione spaziale); si noti una stretta analogia con il più noto
teorema del campionamento temporale.
Comunque nulla vieta di posizionare i sensori anche ad una distanza minore, che,
nel caso del campionamento temporale, è equivalente ad utilizzare una frequenza
di campionamento maggiore di quella minima. Tuttavia è sempre più vantaggioso
che l’array possieda la massima apertura possibile, perché a tale apertura
corrisponde anche la massima risoluzione spaziale.
Ma cosa succede al beampattern quando la spaziatura tra i sensori è maggiore di
2λ ? Questo caso è particolarmente interessante, in quanto è proprio quello che si
ha in BEST-1.
In maniera del tutto analoga al caso del campionamento temporale, si ha un
fenomeno di aliasing, anche se ora si tratta esclusivamente di aliasing spaziale e
non spettrale: in altre parole le DOA risultano ambigue, cioè a DOA differenti
vengono associati gli stessi steering vectors.
Questo è quello che si intende per equivocazione spaziale.
Appendice A Il sistema BEST-1
219
Al fine di illustrare meglio questi concetti, verranno proposti qui di seguito alcuni
esempi, ottenuti applicando il metodo di beamforming classico (beamforming
deterministico), ma risultati del tutto analoghi si possono ottenere anche con altri
metodi. In figura a.2 si vogliono valutare gli effetti generati da spaziature
differenti tra 4 sensori omnidirezionali, sul beampattern.
Fig. a.2: effetti della spaziatura di d = 1λ, 2λ, 4λ, 8λ sul beampattern di 4 sensori omnidirezionali
Nel primo caso i sensori vengono distanziati di 1λ: il beam raddoppia ed appare
un nuovo beam (ghost beam) a ±90°, frutto del sottocampionamento spaziale.
Segnali provenienti da 0° risultano assolutamente indistinguibili da segnali
provenienti da ±90°. Nel secondo caso la distanza tra i sensori è 2λ ed il beam si
quadruplica.
Risultati analoghi si hanno anche per il terzo ed il quarto caso. L’ultimo esempio è
anche quello più interessante, poiché è proprio il caso di BEST-1, in cui si hanno
4 sensori distanziati di 162λ⋅ : il main beam risulta essere equivocato ben 16 volte.
Appendice A Il sistema BEST-1
220
La figura a.3 analizza in modo più approfondito l’ultimo caso, andando a vedere
cosa succede per diversi angoli di puntamento.
Fig. a.3: effetti della spaziatura di 8λ sul beampattern di 4 sensori omnidirezionali per DOA = 20°,
40°, 60°, 80°. Si noti che si tratta del fattore di gruppo di BEST-1
Si osservi che, per via dell’equivocazione spaziale, le direzioni di puntamento
disponibili risultano essere effettivamente ridotte.
Le repliche equivocate del beam prendono il nome di lobi di grating e si può
dimostrare (vedi [28]) che, per una distanza tra i sensori pari a λd ( λd esprime la
distanza in [λ], quindi è una grandezza adimensionale), esse risultano essere
equispaziate di:
[ ]radd1arcsinG ⎟⎟⎠
⎞⎜⎜⎝
⎛=
λ
φ (a.1)
Appendice A Il sistema BEST-1
221
Se 1d >>λ vale l’approssimazione:
[ ]radd1
Gλ
φ ≅ (a.2)
Inoltre i lobi principali si restringono e l’apertura del fascio a metà potenza
(HPBW, Half Power BeamWidth) si riduce a circa:
[ ]raddN
1HPBWλ⋅
≅ (a.3)
mentre la distanza tra i primi due zeri (BWFN, BeamWidth between First Nulls) a
circa:
[ ]raddN
2BWFNλ⋅
≅ (a.4)
dove N è al solito il numero di sensori che compone l’array.
A.2 Caratterizzazione del beampattern del sistema
BEST-1
Si è detto in precedenza che il sistema BEST-1 è composto da un array lineare e
uniforme di antenne. Una descrizione del suo diagramma di radiazione può essere
affrontata partendo dallo studio dei singoli elementi che compongono questa
schiera. Infatti, come insegna la teoria dei sistemi d’antenna (vedi [29]), la
funzione di radiazione di un array può essere ricavata dal prodotto tra la funzione
di radiazione del singolo elemento e la funzione di radiazione di gruppo (o fattore
di gruppo, che tiene conto degli effetti della composizione di un numero anche
Appendice A Il sistema BEST-1
222
elevato di antenne semplici): questo principio è più comunemente noto come
pattern multiplication.
Quindi si ha:
),(f),(f),(f grel φθφθφθ ⋅= (a.5)
Si osservi che, quando il numero degli elementi che compongono un array è
sufficientemente elevato, la funzione di radiazione totale è approssimabile con la
funzione di radiazione di gruppo:
),(f),(f gr φθφθ ≅ per 1N >> (a.6)
In termini ingegneristici questo equivale a dire che, al crescere di N, il
comportamento di un array di antenne diventa sempre più indipendente dalle
caratteristiche dei singoli elementi che lo compongono.
Da qui in avanti i concetti del tutto generali finora esposti verranno applicati più
approfonditamente al caso di BEST-1.
A.2.1 Beampattern del singolo dipolo di BEST-1 Gli elementi di base che costituiscono una singola antenna dell’array sono dei
dipoli a mezz’onda. Si ricordi che la loro funzione di radiazione (vedi ad es. [29])
vale:
2
el cos
sin2
cos),(f
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡⎟⎠⎞
⎜⎝⎛
=θ
θπ
φθ (a.7)
Appendice A Il sistema BEST-1
223
In figura a.4 viene riportato il diagramma polare della funzione di radiazione di un
dipolo a 2λ . In realtà si tratta di solo mezzo diagramma per via della presenza del
piano riflettore. La presenza di quest’ultimo altera la funzione di radiazione del
dipolo stesso ma, per quanto verrà detto successivamente, ciò influisce poco sulla
risposta complessiva del sistema.
Fig. a.4: beampattern polare del singolo dipolo che compone un’antenna della schiera di BEST-1
In figura a.5 è presente lo stesso beampattern, questa volta però in forma
cartesiana: è una rappresentazione meno comune ma più consona all’analisi della
direttività di BEST-1.
Fig. a.5: beampattern cartesiano del singolo dipolo che compone un’antenna della schiera di
BEST-1
Appendice A Il sistema BEST-1
224
Si noti che entrambi i grafici sono stati normalizzati al guadagno massimo.
A.2.2 Beampattern di una singola antenna della schiera di
BEST-1 Una volta noto il beampattern del singolo dipolo, si è in grado di ottenere il
beampattern della singola antenna dell’array mediante l’espressione a.5 (vedi
figura a.6).
Fig. a.6: beampattern di una singola antenna dell’array di BEST-1
Il lobo principale ha un’apertura a metà potenza pari a circa:
°==≅ 18.7rad125.0D1HPBWλ
(a.8)
dove λD è l’apertura complessiva dell’antenna, espressa in lunghezze d’onda.
Il beampattern possiede 151N =− zeri: infatti, per via dell’equivocazione
spaziale, gli zeri posti in corrispondenza di °± 90 coincidono.
Si può dimostrare che (si veda ad es. [10]) in generale questi si trovano in:
K,2,1kN2ksinarcsin 0k ±±=⎟⎠⎞
⎜⎝⎛ ⋅+= θθ (a.9)
Appendice A Il sistema BEST-1
225
dove 0θ è la direzione di osservazione.
In questo caso, essendo 00 =θ e 16N = , si ha che gli zeri del beampattern
risultano essere posizionati in:
(a.10)
e dunque l’apertura BWFN risulta essere:
°≅ 36.14BWFN (a.11)
A.2.3 Beampattern di BEST-1 Il ragionamento effettuato per calcolare il beampattern di una sola antenna può
essere ripetuto anche per calcolare il beampattern dell’array complessivo. Questa
volta si considera come funzione di radiazione dell’elemento quella della singola
antenna costituita da 16 dipoli (il cui diagramma di radiazione è rappresentato in
fig. a.6) mentre la funzione di radiazione di gruppo dipende dai 4 coefficienti di
beamforming. Nell’ipotesi che questi siano a fase nulla (ciò equivale ad un
puntamento di 0°), la direttività di gruppo è quella riportata in fig. a.7 (nello stesso
grafico viene ripresentato in linea tratteggiata il beampattern dell’antenna).
E’ immediato riconoscere la presenza dei lobi di grating dovuti alla spaziatura tra
le antenne di 162λ⋅ . Nel caso di BEST-1 per °= 00θ i lobi di grating si trovano
in:
(a.12)
°±°±°±°±°±
°±°±°±=⎟⎠⎞
⎜⎝⎛=
90,04.61,59.48,68.38,30
,02.22,48.14,18.78karcsinkθ
°±°±°±°±°±
°±°±°±=⎟⎠⎞
⎜⎝⎛=
90,04.61,59.48,68.38,30
,02.22,48.14,18.78karcsinkθ
Appendice A Il sistema BEST-1
226
cioè coincidono con la posizione degli zeri dell’antenna (equazione a.10) ed il
beampattern complessivo è quello riportato in figura a.8.
Fig. a.7: beampattern di gruppo per BEST-1 nel caso di coefficienti a fase nulla (puntamento 0°).
In linea tratteggiata è presente il beampattern di un’antenna dell’array
Fig. a.8: beampattern complessivo per BEST-1 nel caso di coefficienti a fase nulla (puntamento
0°). Ancora una volta in linea tratteggiata viene riportato il beampattern di un’antenna dell’array
Appendice A Il sistema BEST-1
227
L’ultimo grafico mostra chiaramente come i lobi di grating siano stati
efficacemente cancellati; purtroppo ciò non avviene sempre, ma si ha solo quando
la direzione di osservazione di gruppo coincide con la direzione di osservazione
dell’antenna (cioè quando le equazioni a.1 e a.9 coincidono). Siccome le antenne
hanno un puntamento fisso di 0°, questo accade solo per angoli di osservazione di
0°. Per altri valori dei coefficienti, cioè per altri angoli di puntamento, la
cancellazione dei lobi di grating in genere non si verifica (fig. a.9).
Fig. a.9: beampattern complessivo per BEST-1 nel caso di coefficienti calcolati su DOA
rispettivamente di 20°, 40°, 60°, 80°
Il beam di BEST-1 avrà un’apertura che risulterà essere circa 41 di quella
dell’antenna singola:
°≅⋅
≅− 79.1DN
1HPBW 1BESTλ
(a.13)
Appendice A Il sistema BEST-1
228
dove al solito N è il numero di antenne dell’array, λD è l’apertura dell’antenna
espressa in λ e, dunque, λDN ⋅ è l’apertura complessiva dell’array.
Si osservi tuttavia che l’apertura del beam, come la distanza tra i primi due zeri,
varia con l’angolo di puntamento, in modo conforme alla (a.9).
Il problema fondamentale del sistema BEST-1 è costituito dal fatto che, per via
dell’equivocazione spaziale, il beam può essere direzionato solo all’interno del
Field Of View (FOV, angolo di vista di un’antenna) di una singola antenna
dell’array (equazione a.8):
°≤ 59.30θ (a.14)
Quest’ultimo risultato si può comprendere anche intuitivamente dal momento che,
per una DOA del segnale desiderato maggiore in valore assoluto di tale angolo, il
beam si troverebbe al di sotto del livello a metà potenza della singola antenna.
Conseguentemente si otterrebbe un puntamento errato del beam, riscontrabile per
esempio dalla figura a.9.
Significativo è il caso in cui il sistema viene direzionato verso l’angolo massimo,
cioè 3.59° (figura a.10):
Fig. a.10: beampattern di BEST-1 per il massimo angolo di puntamento °= 59.30θ
Appendice A Il sistema BEST-1
229
Si può osservare come il beam risulti equivocato a causa di un lobo di grating,
posizionato simmetricamente rispetto all’origine ed esattamente di pari livello,
come si può constatare meglio dal dettaglio riportato in figura a.11:
Fig. a.11: dettaglio del beampattern di BEST-1 per il massimo angolo di puntamento °= 59.30θ
La seguente figura (ottenuta questa volta per °= 30θ ) evidenzia che il beam non
risulta perfettamente orientato in 0θ :
Fig. a.12: ingrandimento del beampattern di BEST-1 ottenuto con un angolo di puntamento pari a
°= 30θ
Appendice A Il sistema BEST-1
230
Questo leggero fenomeno di disallineamento si deve alla non idealità delle
antenne dell’array. Infatti se le antenne fossero veramente omnidirezionali la loro
funzione di radiazione sarebbe unitaria sull’intero angolo θ . In realtà, nella
moltiplicazione tra il fattore di gruppo e la funzione di radiazione dell’antenna,
viene allineato in direzione di 0θ il punto di tangenza tra il beam dell’antenna ed
il beam complessivo e non il beam stesso. Questo disallineamento si traduce in un
leggero calo di direttività del beamformer, la quale a sua volta si concretizza in
una perdita di sensibilità del radiotelescopio. Nel caso di fig. a.12 il beam risulta
disallineato di circa 12’ con una conseguente diminuzione di sensibilità pari a
circa 0.2 dB. Tale perdita, comunque, non pregiudica le prestazioni complessive
del sistema.
Volendo raffinare il sistema di puntamento, è possibile sviluppare una procedura
di compensazione di 0θ (pre-puntamento) prima del calcolo dei coefficienti del
beamformer.
Il problema dei lobi di grating, già incontrato a proposito del controllo del beam,
si ripropone anche per quel che concerne il posizionamento degli zeri del
beampattern in corrispondenza delle DOA delle RFI.
Più precisamente, gli zeri possono essere applicati ovunque purché le loro repliche
equivocate risultino esterne al HPBW del lobo principale (circa 1.79° per un
puntamento °= 00θ ). Diversamente si otterrà una distorsione del beam ed ancora
una volta l’effetto complessivo sarà un puntamento errato del beam stesso.
Quanto si è appena esposto trova conferma nei due esempi sotto riportati,
realizzati tramite l’applicazione del metodo di beamforming generalizzato.
In figura a.13 si ha °= 20θ e °= 271θ : lo zero è posto fuori dal beam della
singola antenna. Il beampattern complessivo presenta quindi uno zero in 27°, ma,
per via dell’equivocazione spaziale, viene ripetuto anche all’interno del beam
dell’antenna. Tuttavia la replica (che si trova a circa 4.5°) in questo caso non cade
nel beam dell’array e, pertanto, la soluzione è accettabile (fig. a.14).
Appendice A Il sistema BEST-1
231
Fig. a.13: beampattern complessivo per BEST-1 con °= 20θ e °= 271θ
Fig. a.14: ingrandimento del beampattern complessivo per BEST-1 con °= 20θ e °= 271θ
Nel secondo esempio (fig. a.15) si ha ancora °= 20θ ma °= 411θ : il beampattern
complessivo presenta lo zero in 41°, ma questa volta la replica dello stesso
all’interno del beam dell’antenna cade nel main beam dell’array, causandone una
forte deformazione e la soluzione chiaramente non risulta essere accettabile (fig.
a.16).
Appendice A Il sistema BEST-1
232
Fig. a.15: beampattern complessivo per BEST-1 con °= 20θ e °= 411θ
Fig. a.16: ingrandimento del beampattern complessivo per BEST-1 con °= 20θ e °= 411θ
APPENDICE B
COMUNICAZIONI SATELLITARI
L’utilizzo dei satelliti artificiali per telecomunicazioni risulta indispensabile per il
collegamento di utenti posti a grande distanza, nel caso in cui la connessione via
cavo risulti tecnicamente non realizzabile (zone impervie), oppure antieconomica
(zone remote, rurali o paesi in via di sviluppo), nonchè nel caso di utenza mobile
su una regione piuttosto ampia (con particolare riferimento a comunicazioni
aeronautiche e marittime). I sistemi satellitari ([30], [31]) consentono una rapida
messa in opera del servizio su vaste aree di copertura a costi contenuti e con
terminali con caratteristiche comparabili a quelle dei terminali usati per i sistemi
terrestri. Inoltre offrono la possibilità di servire in modo efficiente traffico non
uniformemente distribuito e asimmetrico, grazie alla flessibilità ottenuta con
coperture a fasci multipli e ripuntabili e grazie alla capacità di riconfigurazione
dinamica delle risorse. A tutto ciò si aggiunga che, grazie all'evoluzione dalla
fornitura di servizi fissi punto-punto, alla fornitura di servizi diretti all'utente, i
sistemi satellitari risultano molto utilizzati per garantire mobilità a largo raggio
(aeronautica e marittima) ed estendere le coperture delle reti terrestri sia fisse che
mobili. Oggi notevoli aspettative sono riposte anche nell'utilizzo del satellite per
l'accesso ad Internet, nonostante i limiti intrinseci di prestazioni derivanti dalle
caratteristiche "delay sensitive" proprie dei protocolli TCP, su cui le applicazioni
Internet si basano.
Appendice B Comunicazioni satellitari
234
A questo proposito si consideri che, per una tipica connessione Internet, è
necessario attraversare in media 17-20 nodi di rete mentre, nel caso di utilizzo di
un satellite, un solo salto consente di connettere punti a distanze notevoli (anche
su continenti diversi). In base a questi dati, è stato pianificato che la quantità di
capacità satellitare utilizzata per l'accesso ad Internet crescerà notevolmente nei
prossimi anni. Altri servizi tipicamente offerti dai sistemi satellitari riguardano la
telefonia e la diffusione, sia televisiva che radiofonica, per la quale risultano
particolarmente adatti. I sistemi attualmente in fase di sviluppo mirano all'offerta
di un'ampia gamma di servizi multimediali, che vanno dalla messaggistica e
trasmissione voce a basso ritmo, alle trasmissioni di immagini e video ad alta
definizione, per applicazioni tipo telemedicina e videoconferenza, nonché accesso
a larga banda alle basi di dati. L'UMTS/IMT2000 è il primo sistema di
telecomunicazioni concepito con il segmento satellitare perfettamente integrato
con la componente terrestre.
Esistono anche altre aree di applicazione dei sistemi satellitari, oltre alle già citate
telecomunicazioni (telefonate intercontinentali, tv via satellite, telefoni cellulari,
internet, ...). Esse principalmente sono:
meteorologia (studio dell’atmosfera terrestre, del tempo e del clima);
telerilevamento (tracciabilità della navigazione stradale);
navigazione (indicando alle navi e agli aerei le giuste rotte da seguire);
scopi militari (satelliti spia, sistemi antisatellite, …);
scopi scientifici (telescopi spaziali, …).
Il posizionamento dei satelliti è stabilito in relazione a due fattori:
− periodo orbitale;
− fasce di Van Allen.
Secondo quanto asserito dalla terza legge di Keplero, il periodo orbitale di un
satellite varia in base al raggio della sua orbita elevato alla potenza 3/2: più è alto
il satellite e più aumenta la lunghezza del suo periodo.
Appendice B Comunicazioni satellitari
235
Essa fornisce una precisa relazione tra la velocità con cui il satellite percorre in
ogni istante la sua orbita e la distanza del satellite stesso dalla Terra. In
particolare, i satelliti che sono più vicini alla terra si muovono molto più
velocemente dei satelliti che si trovano lontano da essa.
I satelliti in orbite circolari viaggiano ad una velocità sempre costante in ogni
punto della loro orbita, mentre i satelliti situati su orbite non circolari si muovono
più velocemente quando sono vicini alla Terra e più lentamente quando sono
lontani dalla Terra.
Nella scelta dell’orbita di un satellite si tiene anche conto della presenza delle
cosiddette “fasce di Van Allen”, zone altamente ionizzate che contengono
particelle molto cariche intrappolate nell’atmosfera terrestre e che, se attraversate,
comportano notevoli disturbi alle apparecchiature elettroniche di bordo.
Queste fasce (fig. b.1) sono localizzate in intervalli ad altitudini tra 1500-5000
Km (fascia interna o inferiore) e 15000-20000 Km (fascia esterna o superiore).
Fig. b.1: fasce di Van Allen
Le orbite dei satelliti possono essere classificate secondo due diversi criteri: il
primo si basa sulla loro geometria spaziale e le distingue in:
− orbite circolari (con il centro posto al centro della terra);
− orbite ellittiche (con uno dei fuochi posto al centro della terra).
Il secondo utilizza come metro di distinzione la quota dei satelliti:
− LEO (Low Earth Orbit): orbite circolari ad un’altezza variabile tra
200-1500 Km;
− MEO (Medium Earth Orbit) o ICO (Intermediate Circular Orbit):
orbite circolari ad un’altezza variabile tra 5000-22000 Km;
Appendice B Comunicazioni satellitari
236
− HEO (Highly Elliptical Orbit): orbite ellittiche con apogeo (punto più
lontano di un’orbita ellittica attorno alla terra) fino a 50000 Km di
altitudine;
− GEO (Geostationary Earth Orbit): orbite circolari equatoriali con
periodo uguale al periodo terrestre.
Non è facile per un satellite mantenere un’orbita circolare a causa di vari fattori,
quali la gravità solare, lunare e planetaria, che tendono ad allontanarli dall’orbita
prefissata, ma la dotazione di sistemi di correzione coadiuvati da motori a razzo
contrasta queste forze, realizzando l’attività di station keeping, che consente al
satellite di preservare gli orientamenti prestabiliti.
I satelliti geostazionari (GEO) sono posizionati su un’orbita a circa 35786 Km
dalla superficie terrestre e la loro rivoluzione è sincrona con il moto di rotazione
della terra. In pratica, da un osservatore situato sulla Terra, essi risultano in una
posizione fissa nel cielo.
L’elevata distanza dei satelliti GEO dal globo terrestre rende possibile un’ampia
copertura: essi hanno tipicamente una grande footprint (impronta del diagramma
di radiazione del satellite sulla superficie terrestre, si veda la fig. b.2), che può
arrivare addirittura fino al 34% della superficie terrestre. E’ chiaro, d’altra parte,
che questo rende più problematica l’operazione di riuso delle frequenze contro le
interferenze.
Fig. b.2: raffigurazione della footprint di un satellite con indicato il significato del termine
“elevazione”
Appendice B Comunicazioni satellitari
237
Con appena tre satelliti di questo tipo si riesce a coprire la quasi totalità della
superficie del pianeta; in realtà le calotte polari non possono essere raggiunte, a
causa della posizione dei satelliti fissata sul piano equatoriale. Già su aree con
latitudini sopra i 60° (angoli di elevazione piccoli) si cominciano ad avere effetti
di indebolimento del segnale.
Sono sistemi che richiedono apparati riceventi a terra estremamente semplici:
infatti, una volta stabilita la direzione di puntamento dell’antenna, la sua
posizione non deve essere più variata. Inoltre, sempre grazie al sincronismo tra
l’orbita GEO e la Terra, le comunicazioni tra satelliti e stazioni di terra non sono
interessate dall’effetto doppler, e l’orientazione del fascio di illuminazione del
satellite è fissato.
Data la notevole estensione della tratta, i segnali scambiati nelle comunicazioni
con satelliti geostazionari subiscono una forte attenuazione durante la loro
propagazione; si pensi che ad una distanza di 36000 Km l’attenuazione isotropica
è superiore ai 200 dB. Questo comporta necessariamente l’impiego di elevate
potenze in trasmissione. Per lo stesso motivo i segnali risultano anche molto
ritardati: tipicamente si registra un RTT (Round Trip Time, tempo che occorre per
compiere il tragitto satellite-Terra e viceversa) di circa 0.5 s, ritardo peraltro non
tollerabile nel caso di una normale conversazione telefonica full-duplex.
Accanto ad una configurazione spaziale tutto sommato semplice che non richiede
un sistema di controllo estremamente complesso (dai costi quindi piuttosto
contenuti), sono necessarie, per la messa in orbita dei satelliti, operazioni
altamente dispendiose.
Numerosi sono i settori in cui i satelliti geostazionari trovano applicazione, i più
importanti dei quali sono il broadcasting televisivo (fig. b.3) e radiofonico, il
servizio meteorologico, il servizio telefonico mobile marittimo ed il servizio
Internet.
Una delle aziende leader nel mondo per i servizi di telecomunicazioni via satellite
è senza dubbio Eutelsat s.p.a.; i suoi satelliti vengono utilizzati per trasmettere
canali televisivi e stazioni radio, inoltre soddisfano i requisiti di una vasta gamma
di servizi fissi e mobili per le telecomunicazioni, dalla trasmissione di contributi
Appendice B Comunicazioni satellitari
238
video agli studi televisivi, alla trasmissione dati per reti aziendali, oltre ad un
buon numero di applicazioni in banda larga per la connettività alla dorsale
Internet, per le comunicazioni terrestri e per le comunicazioni mobili, stradali
marittime e aeree.
Fig. b.3: schema semplificato del funzionamento della TV satellitare
Esempi di satelliti geostazionari utilizzati in campo meteorologico sono: i satelliti
europei Meteosat (attualmente ne sono attivi 4), i satelliti di costruzione
statunitense GOES (Geostationary Operational Environment Satellites), i
giapponesi GMS, ecc…(fig.b.4).
Fig. b.4: satelliti meteorologici
Appendice B Comunicazioni satellitari
239
I satelliti Meteosat sono posti in orbita geostazionaria sopra il Golfo di Guinea,
all'intersezione del meridiano di Greenwich (grado 0 di longitudine) con
l'equatore. La copertura è quasi emisferica e centrata sul punto sotto il satellite e
comprende quindi l'Europa, il Medio Oriente, l'Africa e l'Oceano Atlantico.
Questi satelliti funzionano anche da ripetitori delle immagini trasmesse da altri
satelliti geostazionari ed in tal modo è possibile disporre delle immagini di
qualsiasi zona della terra.
Interessante è il caso della combinazione delle proiezioni dei satelliti GOES e
Meteosat che genera una visione complessiva dello stato delle nubi, dagli Stati
Uniti all’Europa (fig. b.5).
Fig. b.5: immagine ottenuta dalla combinazione delle osservazioni di Meteosat + GOES
I satelliti caratterizzati da un’orbita ellittica (HEO) non sono molto diffusi; il loro
utilizzo si rende necessario qualora i sistemi ad orbita geostazionaria non
soddisfino i requirements di certe applicazioni. Ad esempio, con i satelliti HEO è
possibile coprire le calotte polari, che altrimenti non verrebbero raggiunte. Il costo
del lancio, in questo caso, è ridotto: infatti è sufficiente condurre il razzo vettore
Appendice B Comunicazioni satellitari
240
sul perigeo (punto più vicino di un’orbita ellittica attorno alla terra), che
tipicamente non si trova ad una distanza molto elevata, per far entrare in orbita il
satellite.
I satelliti che gravitano su orbite medie (MEO) sono collocati tra le due fasce di
Van Allen, hanno un tempo di visibilità massimo di circa un’ora e, mediamente,
per compiere un’intera rivoluzione attorno alla Terra impiegano circa 6 ore:
quindi per assicurare una copertura globale del pianeta bastano una decina di
satelliti.
I satelliti su orbite LEO, i più vicini alla superficie terrestre, rimangono in
visibilità radio per circa 20 minuti e hanno un periodo orbitale di 1.5 - 2 ore: per
garantire una copertura totale sono necessarie, questa volta, costellazioni molto
più ricche, di almeno 30 satelliti.
Da quanto si è detto finora, quindi, entrambe le categorie di satelliti LEO e MEO
non hanno orbite geostazionarie: questo fatto implica che questi satelliti risultano
in movimento relativo rispetto ad un utente che si trova fermo sulla Terra. Sono
perciò richiesti metodi di hand-over, affinché il terminale terrestre possa
effettuare, quando richiesto, uno switch della comunicazione tra un satellite ed un
altro, oppure tra un beam ed un altro dello stesso satellite.
Inoltre, nelle comunicazioni con satelliti di questo tipo entrano in gioco fenomeni
di effetto doppler, in maniera decisamente più marcata, come è logico attendersi,
nel caso dei satelliti LEO. Di conseguenza sono necessarie misure opportune che
contrastino questi effetti.
I satelliti LEO e MEO presentano comunque alcuni vantaggi: i segnali trasmessi
nei collegamenti con tali satelliti sono molto meno ritardati ed attenuati rispetto al
caso geostazionario (orbita LEO→RTT < 20 ms; orbita MEO→RTT < 50 ms).
Inoltre i costi relativi al lancio in orbita dei satelliti sono più bassi.
Le peculiarità specifiche dei sistemi satellitari ad orbite basse e medie rendono
ciascuno di questi più adatto ad un certo scenario applicativo.
I satelliti MEO sono utilizzati principalmente per servizi di telefonia mobile e di
posizionamento/navigazione, mentre i satelliti LEO trovano impiego soprattutto
nei servizi di trasferimento dati (“Little LEO”), di telefonia mobile (“Big LEO”) e
Appendice B Comunicazioni satellitari
241
di telecomunicazioni di dati ad alta velocità e larga banda, ad es. videoconferenze
(“Broadband LEO”).
Fra le costellazioni MEO attualmente in orbita attorno alla Terra, meritano una
particolare attenzione i sistemi GPS, GLONASS e Galileo (quest’ultimo ancora in
fase di progetto).
Il sistema GPS (Global Positioning System), avviato dagli U.S.A. a partire dagli
anni ‘70 e completato nel 1993, è stato realizzato per motivi principalmente
militari, per rispondere all’esigenza del Ministero della difesa degli Stati Uniti di
seguire il percorso di mezzi militari sulla terraferma ed in mare in modo da
localizzarne la posizione in ogni momento e consentirne eventuali operazioni di
supporto e di salvataggio.
Esso è un sistema di radiolocalizzazione globale che utilizza 24 satelliti artificiali,
divisi in gruppi di quattro (6 × 4 = 24) che ruotano attorno alla terra alla quota di
circa 20200 Km in orbite distanti fra loro di un angolo di 60° (6 × 60°=360°) e
formanti un angolo di 55° rispetto al piano equatoriale (fig. b.6 a sin.).
Di questi satelliti, 21 sono attivi, mentre tre sono di scorta, cioè sono in attesa di
entrare in funzione quando qualcuno dei 21 cesserà di essere attivo.
Il sistema GPS consente di determinare la propria posizione sulla superficie
terrestre, ed anche la quota se si è in aereo, ed è attivo oggi in qualunque punto
della terra, dall’equatore ai poli ed in qualunque punto sperduto dei deserti o delle
grandi città.
E’ necessario disporre con sé di un ricevitore GPS, il quale intercetta a terra il
segnale a microonde generato dai satelliti in orbita che, a turno, transitano nella
volta celeste. Visto il numero, l’orbita ed il periodo di rotazione dei satelliti, di cui
si è già parlato, risulta che, in ogni istante, sono in visibilità radio in media da
cinque ad otto satelliti che si alternano in quota.
I satelliti GPS generano due diversi segnali di tipo numerico, che vengono
chiamati L1 ed L2, alle frequenze rispettivamente di 1.5 e 1.2 GHz circa, modulati
in PSK: il primo serve per la localizzazione grossolana, quella di tipo civile, il
secondo per la localizzazione più precisa, di tipo militare.
Appendice B Comunicazioni satellitari
242
Il primo segnale consente la determinazione della propria posizione con un errore
di circa 100 metri; il secondo, invece, permette misurazioni con errori che vanno
da 10 a 50 cm. Mentre il primo segnale è trasmesso in chiaro, il secondo, invece, è
trasmesso in codice segreto e non è accessibile se non al Ministero della difesa
degli Stati Uniti che lo utilizza esclusivamente per la propria sicurezza e non lo
rende noto a tutti per evitare che possa essere utilizzato contro gli interessi degli
Stati Uniti da criminali o da stati nemici.
I ricevitori GPS commerciali, oggi dal costo molto contenuto, consentono di
sintonizzarsi automaticamente sulle frequenze dei suddetti satelliti; dopo un
tempo di ricerca e di elaborazione dei dati ricevuti dell’ordine di pochi minuti,
sono in grado, individuando la distanza di almeno quattro satelliti (fig. b.6 a
destra), di determinare la propria posizione geografica sulla superficie terrestre in
termini di latitudine e longitudine, comprendendo eventualmente la quota se si è
in montagna o in aereo.
Fig. b.6: costellazione del sistema GPS (sin.) e rilevazione della posizione di un punto mediante i
segnali ricevuti da 4 satelliti (destra)
Il GLONASS (GLObal NAvigation Satellite System) è un sistema satellitare di
posizionamento globale realizzato dall’Ex Unione Sovietica più o meno in
concomitanza con il GPS americano. Il primo lancio di satelliti risale al 12 ottobre
1982, la costellazione si è completata con 24 satelliti nel 1997.
Negli anni la Russia non ha avuto la forza economica per mantenere attiva l'intera
costellazione. Ma nel 2002 è stato dato il via al programma di rilancio del sistema
Appendice B Comunicazioni satellitari
243
satellitare GLONASS, che prevede 18 satelliti entro il 2007, e dovrà raggiungere
nuovamente il numero di 24 satelliti entro il 2010. Il programma prevede il lancio
di due o tre razzi l'anno, ciascuno dei quali porterà nello spazio due o tre satelliti.
GPS e GLONASS sono sistemi molto simili, ma alcune differenze sono
significative:
1) il GLONASS non ha nessun degrado della precisione (anche se il suo
grado di accuratezza rimane al di sotto di quello del GPS) né
crittografia dei segnali (è totalmente in chiaro);
2) i satelliti GLONASS ruotano su 3 piani separati da un angolo di 120°,
con 8 satelliti per ogni piano, separati tra di loro da un angolo di 45°;
3) l’inclinazione dei piani orbitali rispetto al piano dell'equatore è di:
64.8°;
4) l'altitudine è di 19140 Km e ogni satellite completa un'orbita in 11 h e
15 m;
5) ogni satellite GLONASS ha proprie frequenze, determinate in base ad
un fattore variabile (comunque anche in questo caso ogni satellite
trasmette sia L1 che L2).
Nonostante le considerevoli differenze tecniche fra i due sistemi, esistono alcuni
fra i migliori ricevitori GPS che possono ricevere sia l’uno che l’altro sistema ed
ottenere una precisione complessiva simile a quella del sistema codificato militare
americano, cioè di quasi mezzo metro, risparmiando notevolmente nei tempi di
acquisizione.
Allo statunitense GPS e al russo GLONASS si affiancherà Galileo, un altro
sistema di radiolocalizzazione satellitare, frutto di un accordo siglato tra l’Unione
Europea e l’Agenzia Spaziale Europea (ESA) e a cui stanno aderendo anche altri
paesi extraeuropei.
La sua entrata in servizio è prevista per il 2008 ma è molto probabile uno
slittamento al 2010, e conterà su 30 satelliti orbitanti attorno alla Terra, ad una
distanza di circa 23616 Km da essa, su piani orbitali inclinati di circa 56° rispetto
all’equatore (fig. b.7).
Appendice B Comunicazioni satellitari
244
Fig. b.7: rappresentazioni artistiche della costellazione (sin.) e di un satellite (destra) del futuro
sistema Galileo
Di questi, 27 saranno operativi e 3 saranno disponibili per la sostituzione in caso
di necessità.
Ad oggi sono previsti dei lanci di alcuni satelliti per effettuare i primi test.
I principali scopi di Galileo sono:
• una maggior precisione a tutti gli utenti rispetto a quella attuale;
• una migliorata copertura dei segnali dai satelliti, soprattutto per le
regioni a più alte latitudini;
• un sistema di posizionamento globale che possa sempre funzionare
anche in tempi di guerra.
Diversamente dal sistema GPS, sviluppato dal Dipartimento della Difesa degli
Stati Uniti d'America (che si riserva il diritto di ridurre la copertura del segnale,
l’accuratezza o sospendere del tutto il servizio in qualunque momento), Galileo è
rivolto al settore civile-commerciale. Il sistema europeo sarà quindi sempre
disponibile sia ai civili che ai militari con la massima accuratezza. Un ritorno
economico per le industrie europee si avrà anche con la produzione dei ricevitori,
mentre ora con il GPS il mercato è esclusivamente americano.
Accanto alle applicazioni dei sistemi satellitari nei servizi di
posizionamento/navigazione, rivestono enorme importanza anche quelle nei
servizi di telefonia mobile satellitare.
Appendice B Comunicazioni satellitari
245
Sebbene questi ultimi possano essere offerti con successo da entrambi i sistemi
MEO e LEO, senza dubbio l’orbita bassa caratteristica dei satelliti LEO rende
questi ultimi maggiormente adatti a tali applicazioni: infatti la maggiore vicinanza
alla superficie terrestre permette di ottenere fasci di trasmissione maggiormente
focalizzati e quindi comunicazioni molto più chiare e forti.
Il sistema IRIDIUM, per esempio, è stato concepito proprio per comunicazioni
cellulari con copertura globale, al fine di permettere qualsiasi tipo di trasmissione
(voce, messaggi, fax, dati) in qualunque luogo sulla Terra e a qualsiasi condizione
ambientale.
La copertura globale viene fornita da una costellazione di 66 satelliti a bassa quota
(inizialmente erano 77) a 780 Km dalla superficie terrestre, che offrono la stessa
qualità di trasmissione dei network cellulari terrestri, eliminando il ritardo tipico
dei satelliti geostazionari. I satelliti sono posizionati su 6 orbite polari circolari (i
piani orbitali sono inclinati di 86° rispetto all’equatore) ed ogni piano orbitale
contiene 11 satelliti operativi ed 1 satellite di riserva (fig. b.8).
Fig. b.8: rappresentazione della distribuzione orbitale della costellazione del sistema IRIDIUM
I satelliti IRIDIUM sono stati costruiti nella divisione SATCOM di Motorola in
Arizona utilizzando un processo di produzione di massa potendo cosi costruire tre
satelliti in appena tre settimane, invece dei tre anni necessari con le tecnologie
precedenti.
Il sistema IRIDIUM utilizza la tradizionale rete GSM laddove è presente, mentre
fa uso dei propri satelliti in aree non coperte da tale rete. Uno degli aspetti più
avveniristici consisteva nel fatto che non appena questo tipo di cellulare veniva
Appendice B Comunicazioni satellitari
246
accesso il satellite determinava immediatamente la posizione e la disponibilità di
reti alternative a quella satellitare. Perciò se non è disponibile una rete tradizionale
GSM il cellulare comunica direttamente con il satellite che trasmette la chiamata
di satellite in satellite fino a raggiungere la sua destinazione, sia questa un altro
telefono IRIDIUM oppure un gateway di collegamento terrestre.
Tra tutte le reti satellitari presenti, il sistema IRIDIUM è il più costoso ed il più
sofisticato, principalmente per la caratteristica propria dell’ISL (InterSatellite
Link). L'utilizzo di questa funzionalità ha incrementato la complessità del network
rendendo necessari ulteriori apparecchi a bordo dei satelliti, che hanno aumentato
il consumo di energia a bordo, rendendo necessarie maggiori risorse. Le ampie
dimensioni di questi satelliti hanno richiesto anche maggiori investimenti per il
posizionamento in orbita e le successive manovre di posizionamento.
Le conversazioni degli abbonati di IRIDIUM vengono fatturate secondo le tariffe
di telefonia cellulare del proprio gestore GSM, quando si è collegati col network
terrestre e secondo le tariffe di IRIDIUM quando si effettua il roaming nella
costellazione satellitare.
Il sistema IRIDIUM continua inoltre a fornire il servizio anche in caso di
terremoti, uragani, inondazioni e disastri naturali, anche se una o più stazioni di
terra (gateway) venissero distrutte; la continuità del servizio è garantita dall’ISL
con cui è possibile instradare le chiamate attraverso i satelliti verso un qualunque
altro gateway. Questa caratteristica insieme al fatto che le comunicazioni non
sono influenzate dalle condizioni atmosferiche, rende l’IRIDIUM un importante
mezzo di soccorso in caso di calamità o disastri.
Sull’esempio di IRIDIUM sono nati altri sistemi satellitari in grado di offrire
servizi di radiotelefonia, anche se molti non hanno riscosso il dovuto successo
commerciale.
Ad esempio Globalstar (fig. b.9 a sinistra) è un sistema di telecomunicazione a
tecnologia numerica, supportato da 48 satelliti orbitanti a bassa quota (1410 Km),
che per primo è riuscito a integrarsi perfettamente con le reti di telecomunicazione
terrestre, offrendo servizi simili a quelli delle reti GSM, attraverso un telefono
palmare a tecnologia satellitare.
Appendice B Comunicazioni satellitari
247
Questi servizi sono utilizzati da coloro che hanno la necessità di contattare le
proprie unità nel territorio, come per esempio un’azienda di trasporti o una flotta
mercantile, ma anche dalle stesse forze armate.
I telefoni fissi Globalstar guideranno le telecomunicazioni nei paesi con economie
in via di sviluppo, in quanto non richiedono sul luogo di utilizzo di grandi
infrastrutture.
Il segnale inviato da terra raggiunge il satellite che lo reindirizza nei gateway
locali (cioè terrestri, a differenza di quanto accade nel sistema IRIDIUM),
offrendo così un servizio ad alta economicità e consentendo di fare e ricevere
telefonate con la stessa facilità di un normale telefono cellulare.
Il sistema si evidenzia per due peculiarità uniche: la path diversity assieme al soft
hand-off impediscono la caduta della linea in quanto l’utente è coperto
contemporaneamente da 2 o 3 satelliti. Questo sistema permette continuamente di
passare da un satellite all’altro senza perdere la linea e senza provocare
interruzioni o rallentamenti.
Degno di menzione è il progetto (Teledesic), concepito nel 1993 da Craig
McCaw, pioniere della comunicazione cellulare, e da Bill Gates, fondatore di
Microsoft, di creare una rete di 840 satelliti LEO, in grado di consentire non solo
collegamenti telefonici satellitari, ma anche trasmissioni di dati multimediali e
soprattutto accesso alla rete Internet ad alta velocità (fig. b.9 a destra).
Era una proposta molto ambiziosa e dai costi proibitivi (si era prevista una spesa
complessiva intorno ai 9 miliardi di dollari), tanto da essere duramente criticata e,
conseguentemente, non è stata presa in considerazione.
Fig. b.9: raffigurazione della distribuzione orbitale delle costellazioni Globalstar (sin.) e Teledesic
(destra)
253
BIBLIOGRAFIA
[1] G. Sinigaglia, “Elementi di tecnica radioastronomica”, ed. CeC, 1983
[2] http://www.med.ira.cnr.it/
[3] http://www.ira.cnr.it/Medicinaweb/Nc/HOME%20PAGE%20CROCE
%20DEL%20NORD.htm
[4] http://www.lofar.org
[5] http://www.skatelescope.org
[6] Cecilia Barnbaum and Richard F. Bradley, “A new approach to
interference excision in radioastronomy: real-time adaptive
cancellation”, The Astronomical Journal, 1115:2598-2614, 1998
November
[7] Lisha Li and Brian D. Jeffs, “Analysis of adaptive array algorithm
performance for satellite interference cancellation in radio
astronomy”, Brighm Young University, Department of Electrical and
Computer Engineering 459 CB, Provo, UT 84602, USA, e-mail:
[8] Mal Goris, “The adaptive beamformer of the SKAI adaptive antenna
demonstrator”, November 6, 1997
Bibliografia
254
[9] G. Hampson, M. Goris, A. Joseph and F. Smits, “The adaptive antenna
demonstrator”, Published in 1998 IEEE Digital Signal Processing
Workshop, Bryce Canyon, Utah, USA
[10] D. Caliendo, “Studio di algoritmi di beamforming, tecniche di
mitigazione delle radiointerferenze e procedure di calibrazione
applicabili ai radiotelescopi di nuova generazione (SKA: Square
Kilometer Array)”, Relatore Prof. Gian Guido Gentili, Facoltà di
Ingegneria delle Telecomunicazioni, Politecnico di Milano, A.A.
2003/2004
[11] Zhi Tian, Member IEEE; Pristine L. Bell, Member IEEE; Harry L.
Van Trees, Life Fellow IEEE, “A recursive least square
implementation for LCMP beamforming under quadratic constraint”,
IEEE Transactions on Signal Processing, Vol. 49, N. 6, June 2001
[12] R. Lorenz and S. Boyd, “Robust Minimum Variance Beamforming”,
Information Systems Laboratory, Stanford University, Stanford, CA
94305-9510, e-mail: [email protected], [email protected]
[13] William H. Press, Saul A. Teukolsky, William T. Vetterling, Brian P.
Flannery, “Numerical Recipes in C – The Art of Scientific Computing”,
ISBN 0-521-43108-5, Cambridge University Press, 2nd edition, 1988-
1992
oppure
http://www.library.cornell.edu/nr/bookcpdf.html
[14] John D. Kraus, “Radio Astronomy”, ISBN I-882484-00-2, Cygnus-
Quasar Books, 2nd edition, 1986
Bibliografia
255
[15] http://www.mathworks.com/products/
[16] William J. Palm III, “MATLAB 7 per l’ingegneria e le scienze”, ISBN
88-386-6070-0, McGraw-Hill, 2005
oppure
http://www.mathworks.com/access/helpdesk/help/toolbox/simulink/
[17] Wei Liu, Choo Leng Koh, Stephan Weiss, “Constrained adaptive
broadband beamforming algorithm in frequency domain”,
Communication Research Group, School of Electronics & Computer
Science, University of Southampton, U.K., 0-7803-8545-4 /04/$ 20.00
© 2004 IEEE
[18] A. Leshem and A. J. Van der Veen, “Introduction to interference
mitigation techniques in radio astronomy”, Perspective in Radio
Astronomy – Technologies for Large Antenna Arrays, A. B. Smolders
and M. P. van Haarlem, eds., Netherlands Foundation for Radio
Astronomy, May 2000
[19] A. Leshem and A. J. Van der Veen, “The effect of adaptive
interference suppression on radio astronomical image formation”,
Radio Telescopes, H. R. Butcher, Ed., Proc. S.P.I.E., 4015, 341-352,
2000
Bibliografia
256
[20] A. Leshem, A. J. Van der Veen and A. J. Boonstra, “Multichannel
interference mitigation techniques in radio astronomy”, Astrophys. J.
Suppl., 131, 355-373, 2000
[21] P. A. Fridman e W. Baan, “RFI mitigation methods in radio
astronomy”, Astron. Astrophys., 378, 327-344, 2001
[22] Gene H. Golub, Charles F. Van Loan, “Matrix computations (3rd
edition)”, The Johns Hopkins University Press, ISBN 0-8018-5414-8,
1996
[23] P. Pari, “Rilevazione di segnali tramite trasformata KLT nel progetto
SETI”, Relatore Prof. Enzo Gandolfi, Facoltà di Matematica, Fisica e
Scienze Naturali, Università degli Studi di Bologna, A. A. 2002/2003
[24] C. Maccone, “Innovative SETI by the KLT”, Pešek Lecture 2003 and
paper #IAA.9.1.01, Session IAA.9.1, “SETI 1: Science and
Technology”, International Astronautical Congress, Bremen, 2003
[25] C. B. Cosmovici, C. Maccone, S. Montebugnoli, J. Monari, S. Righini,
“The ITASEL project (ITAlian Search for Extraterrestrial Life)”, IAC-
05-A4.1.10
Bibliografia
257
[26] D. Caliendo, “Progetto di una procedura C/Unix per la stima empirica
dei tempi di calcolo della matrice di autocorrelazione di un segnale
casuale discreto, reale e stazionario in senso lato”, Milano, 23
Settembre 2001, e-mail: [email protected]
[27] C. Maccone, “Telecommunication, KLT and Relativity”, IPI Press,
Colorado, 1994
[28] John D. Kraus, “Antennas – 2nd edition”, McGraw - Hill, 1988
[29] V. Rizzoli, D. Masotti, “Lezioni di sistemi d’antenna”, Progetto
Leonardo, Società Editrice Esculapio s.r.l., Bologna, 2004
[30] R. Verdone, “Sistemi via satellite – Appunti dal corso di Sistemi Radio
L-S”, Università degli Studi di Bologna, 2004
[31] A. S. Tanenbaum, “Reti di calcolatori – Quarta edizione”, Pearson
Education Italia Srl, ISBN 88-7192-182-8, 2003
Top Related