L. Pandolfi Politecnico di Torino Dipartimento di...

309
L. Pandolfi Politecnico di Torino Dipartimento di Matematica Corso di Analisi Funzionale

Transcript of L. Pandolfi Politecnico di Torino Dipartimento di...

Page 1: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

L. Pandolfi

Politecnico di Torino

Dipartimento di Matematica

Corso di Analisi Funzionale

Page 2: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

i

Le abbreviazioni usate in questo testo sono di immediata comprensione:

• “s.successione” per “sottosuccessione

• “s.insieme” oer “sottinsieme”

• “s.spazio” per “sottospazio”

• “s.spazi” per “sottospazi”

• “s.l.n.” per “spazio lineare normato”

• “s.l.n-ti” per “spazi lineari normati”.

Page 3: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

ii

Page 4: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

Indice

1 Introduzione all’analisi funzionale 31.0.1 L’equazione Ax = ϕ . . . . . . . . . . . . . . . . . . . . 41.0.2 L’equazione λx− Ax = y . . . . . . . . . . . . . . . . . 71.0.3 L’equazione di Fredholm di seconda specie con nucleo

degenere . . . . . . . . . . . . . . . . . . . . . . . . . . 81.0.4 L’equazione di Fredholm di prima specie . . . . . . . . 101.0.5 Ricapitolazione . . . . . . . . . . . . . . . . . . . . . . 11

2 Gli spazi di Banach 132.1 Spazi lineari normati . . . . . . . . . . . . . . . . . . . . . . . 13

2.1.1 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 192.2 Spazi prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . 222.3 Gli esempi principali di spazi di Banach . . . . . . . . . . . . . 24

2.3.1 Gli esempi di spazi lineari normati . . . . . . . . . . . 252.3.2 Le dimostrazioni della completezza . . . . . . . . . . . 312.3.3 Teorema del doppio limite . . . . . . . . . . . . . . . . 38

2.4 Sottospazi di spazi lineari normati . . . . . . . . . . . . . . . . 402.4.1 Identita approssimate e dimostrazione del teorema di

Weierstrass . . . . . . . . . . . . . . . . . . . . . . . . 422.4.2 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 47

2.5 La compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . 492.5.1 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 51

2.6 Operatori lineari . . . . . . . . . . . . . . . . . . . . . . . . . 552.6.1 Proprieta geometriche degli operatori lineari . . . . . . 562.6.2 La continuita degli operatori lineari . . . . . . . . . . . 592.6.3 Funzionali lineari continui ed iperpiani . . . . . . . . . 632.6.4 Lo spazio L(X,Y ) . . . . . . . . . . . . . . . . . . . . 66

2.7 Esempi di spazi duali . . . . . . . . . . . . . . . . . . . . . . . 722.8 Il teorema di Baire e le sue conseguenze . . . . . . . . . . . . 82

2.8.1 Proiezioni . . . . . . . . . . . . . . . . . . . . . . . . . 86

iii

Page 5: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

iv INDICE

2.8.2 Appendice: Applicazioni . . . . . . . . . . . . . . . . . 892.8.3 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 94

2.9 Lo spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . 982.9.1 Applicazioni: Insiemi convessi . . . . . . . . . . . . . . 1012.9.2 Applicazioni: Funzioni convesse . . . . . . . . . . . . . 1052.9.3 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 108

2.10 Convergenza debole e debole stella . . . . . . . . . . . . . . . 1162.10.1 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 1242.10.2 Relazione tra le convergenze debole e debole stella . . . 125

2.11 Inversi di un operatore . . . . . . . . . . . . . . . . . . . . . . 1262.12 Lo spettro di un operatore . . . . . . . . . . . . . . . . . . . . 131

2.12.1 Proiezioni spettrali . . . . . . . . . . . . . . . . . . . . 1392.13 Trasformazioni non lineari . . . . . . . . . . . . . . . . . . . . 145

2.13.1 Teorema delle contrazioni e applicazioni . . . . . . . . 1452.13.2 I differenziali . . . . . . . . . . . . . . . . . . . . . . . 149

3 Spazi di Hilbert 1533.1 Prodotto interno e norma . . . . . . . . . . . . . . . . . . . . 153

3.1.1 Esempi di prodotti interni e di spazi di Hilbert . . . . . 1573.1.2 Uno spazio di Hilbert non separabile . . . . . . . . . . 159

3.2 Teorema delle proiezioni . . . . . . . . . . . . . . . . . . . . . 1603.3 Complementi ortogonali e proiezioni ortogonali . . . . . . . . . 164

3.3.1 Sistemi ortonormali e calcolo di proiezioni . . . . . . . 1683.3.2 Serie di Fourier astratte . . . . . . . . . . . . . . . . . 172

3.4 Esempi di sistemi ortogonali massimali . . . . . . . . . . . . . 1733.4.1 Sviluppi in serie di Fourier . . . . . . . . . . . . . . . . 1733.4.2 Una conseguenza dell’identita di Parseval . . . . . . . . 1773.4.3 Polinomi di Legendre, Laguerre ed Hermite . . . . . . . 1793.4.4 Sviluppi in serie di Fourier-Bessel . . . . . . . . . . . . 1923.4.5 Ulteriori proprieta delle funzioni di Bessel . . . . . . . 1983.4.6 Le soluzioni dell’equazione di Bessel . . . . . . . . . . . 200

3.5 Il duale di uno spazio di Hilbert . . . . . . . . . . . . . . . . . 2023.6 L’operatore aggiunto . . . . . . . . . . . . . . . . . . . . . . . 204

3.6.1 L’aggiunto di un operatore continuo . . . . . . . . . . . 2053.6.2 Operatori aggiunti ed operatori chiusi . . . . . . . . . . 2073.6.3 Operatori aggiunti e spettro . . . . . . . . . . . . . . . 2093.6.4 Risolvente di operatori chiusi . . . . . . . . . . . . . . 2133.6.5 Spazi di Sobolev ed operatori aggiunti . . . . . . . . . 2143.6.6 Ortogonalita ed operatori aggiunti . . . . . . . . . . . . 2153.6.7 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 218

Page 6: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

INDICE v

3.7 Convergenza debole in spazi di Hilbert . . . . . . . . . . . . . 2223.8 Operatori compatti . . . . . . . . . . . . . . . . . . . . . . . . 227

3.8.1 Lo spettro degli operatori compatti . . . . . . . . . . . 2313.8.2 Operatori compatti tra spazi diversi. Valori singolari . 2333.8.3 Proprieta geometriche degli autovalori e valori singolari 2363.8.4 Operatori compatti ed equazioni integrali di Fredholm 2393.8.5 Dimostrazioni posposte . . . . . . . . . . . . . . . . . . 240

4 Distribuzioni e Trasformata di Fourier 2534.1 Le distribuzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 253

4.1.1 Lo spazio D(IRn) delle funzioni test . . . . . . . . . . . 2554.1.2 Le distribuzioni . . . . . . . . . . . . . . . . . . . . . . 2574.1.3 Lo spazio (D(IRn))′ . . . . . . . . . . . . . . . . . . . . 2584.1.4 Il supporto di una distribuzione . . . . . . . . . . . . . 266

4.2 La trasformata di Fourier di funzioni . . . . . . . . . . . . . . 2694.2.1 Le proprieta della trasformata di Fourier . . . . . . . . 2714.2.2 Il teorema di Riemann-Lebesgue . . . . . . . . . . . . . 2724.2.3 L’antitrasformata di Fourier . . . . . . . . . . . . . . . 2754.2.4 La trasformata di Fourier su L2(IR) . . . . . . . . . . . 278

4.3 Distribuzioni temperate . . . . . . . . . . . . . . . . . . . . . 2814.3.1 Lo spazio S e il suo duale . . . . . . . . . . . . . . . . 2814.3.2 Distribuzioni e distribuzioni temperate . . . . . . . . 2854.3.3 La trasformata di Fourier su S ′ . . . . . . . . . . . . . 2874.3.4 Le operazioni sulle distribuzioni . . . . . . . . . . . . . 2914.3.5 Operazioni e trasformata di Fourier . . . . . . . . . . . 2944.3.6 Convoluzione di distribuzioni . . . . . . . . . . . . . . 2954.3.7 Treno d’impulsi e formula di Poisson . . . . . . . . . . 2984.3.8 Avvertenza finale e ricapitolazione . . . . . . . . . . . . 302

Page 7: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

1

Page 8: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2

Page 9: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

Capitolo 1

Introduzione all’analisifunzionale

L’Analisi funzionale e nata quando, tra la fine del XIX e il primo trentennio delXX secolo, sono stati raccolti in un’unica teoria molti risultati provenienti davarie parti dell’analisi matematica; in particolare, dalla teoria delle equazioniintegrali della forma

x(s) = µ∫ b

aK(s, ξ)x(ξ) dξ + y(s) , s ∈ [a, b] (1.1)

ove µ e un parametro e K(s, ξ), y(s) sono funzioni note mentre la funzionex(s) e incognita.

L’intervallo [a, b] e limitato. Equazioni di questo tipo si chiamano equa-zioni di Fredholm di seconda specie e si incontrano per esempio nellasoluzione di problemi di elasticita (problemi che hanno stimolato i primi studidi Fredholm).

La funzione K(s, ξ) si chiama il nucleo dell’equazione di Fredholm.Si chiama equazione di Fredholm di prima specie l’equazione∫ b

aK(s, ξ)x(ξ) dξ = y(s) , s ∈ [a, b] (1.2)

che pure si incontra nelle applicazioni, ma che ha una teoria sostanzialmentepiu delicata, per una ragione che vedremo.

Come introduzione all’analisi funzionale, vediamo come sia possibile trat-tare l’equazione di Fredholm (di prima o di seconda specie) quando il nucleoe degenere, ossia quando

K(s, ξ) =m∑i=1

ai(s)bi(ξ) , s , ξ ∈ [a, b] . (1.3)

3

Page 10: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4 CAPITOLO 1. INTRODUZIONE ALL’ANALISI FUNZIONALE

Per semplicita supporremo che le funzioni a(s) e b(ξ) siano continue su [a, b].Nel caso del nucleo degenere la soluzione dell’equazione di Fredholm si

riduce ad un problema di algebra lineare e quindi richiamiamo alcune nozioniche dovremo usare.

1.0.1 L’equazione Ax = ϕ

Ricordiamo che IC indica l’insieme dei numeri complessi e che IC n indica ilprodotto cartesiano di n copie di IC . In IC n esistono infinite basi, ciascuna din elementi. Si chiama base canonica la base e1 , . . . , en, avendo indicatocon ei il vettore le cui componenti sono tutte nulle, salvo la i–ma, che vale 1.

Se x e un vettore di IC n, scriveremo

x = col[x1 . . . xn

]=

n∑i=1

xiei .

Affermazioni del tutto analoghe valgono per ICm. Per evitare ambiguita,indicheremo con ϵ1 , . . . , ϵm la sua base canonica. Anzi, per chiarezza in-dicheremo con lettere romane i vettori di IC n e con lettere greche quelli diICm.

Sia A una matrice m× n,

A =

a11 a12 . . . a1na21 a22 . . . a2n...am1 am2 . . . amn

.

L’espressione Ax = ϕ si usa per rappresentare in modo compatto il sistema dim equazioni in n incognite

a11x1 + a12x2 + · · · + a1nxn = ϕ1

a21x1 + a22x2 + · · · + a2nxn = ϕ2...

am1x1 + am2x2 + · · · + amnxn = ϕm .

(1.4)

Vogliamo ricordare le condizioni, note dai corsi precedenti, perche:

1. L’equazione Ax = ϕ ammetta al piu una soluzione;

2. L’equazione Ax = ϕ ammetta almeno una soluzione;

3. L’equazione Ax = ϕ ammetta esattamente una soluzione per ogni ϕ ∈ICm.

Page 11: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

5

Consideriamo prima di tutto il problema 1), unicita di soluzione. Si noti laformulazione del problema di unicita: non si richiede che una soluzione debbaesistere per ogni ϕ; Si richiede che se una soluzione esiste allora questa siaunica.

Se per la medesima ϕ si hanno due soluzioni x′ ed x′′ tra loro diverse, alloray = x′ − x′′ verifica

Ay = A(x′ − x′′) = Ax′ − Ax′′ = ϕ− ϕ = 0 .

Dunque, se per una ϕ la soluzione non e unica, allora esiste y = 0 e tale cheAy = 0. E viceversa:

Teorema 1 Se per una ϕ il problema (1.4) ammette soluzione e questa eunica, allora

Ax = 0 solo se x = 0.

Viceversa, se Ax si annulla solo per x = 0 allora il problema (1.4) ammettesoluzione unica per ogni ϕ.

Osservazione 2 Si noti che il problema dell’unicita, come e stato enunciato,sembra dipendere dalla scelta di ϕ. Ossia, si potrebbe pensare che la soluzionedi (1.4) sia unica per alcune ϕ ma non per altre. Invece, il teorema precedentemostra che si ha unicita di soluzione per ogni ϕ se e solo se si ha unicita disoluzione per una ϕ.

L’insiemekerA = x | Ax = 0

si chiama il nucleo di A.Passiamo ora a studiare il problema dell’esistenza di soluzioni. Chiamiamo

immagine di A l’insieme

imA = Ax | x ∈ IC n .

Dunque, imA e esattamente l’insieme dei vettori ϕ per i quali l’equazione (1.4)e risolubile.

Si ricordi che imA e un s.spazio di ICm. Ora un generico s.spazio V di ICm

puo caratterizzarsi descrivendone gli elementi; e cio abbiamo fatto per definireimA; ma puo anche identificarsi per mezzo del suo s.spazio ortogonale V ⊥.

Definitione 3 Un vettore ψ ∈ ICm si dice ortogonale a V quando e ortogonalea tutti gli elementi di V ; e V ⊥ e il s.spazio di tutti i vettori ψ ortogonali aV .

Page 12: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

6 CAPITOLO 1. INTRODUZIONE ALL’ANALISI FUNZIONALE

Indicando col simbolo ⟨ϕ, ψ⟩ il prodotto interno dei vettori ϕ e ψ,

V ⊥ = ψ | ⟨ϕ, ψ⟩ = 0 ∀ϕ ∈ V .

Ricordiamo che vale V ⊥ = 0 se e solo se V e uguale a ICm.Quando V = imA, e facile identificare V ⊥. Introduciamo per questo la

matrice A∗, aggiunta di A. Si sa che A∗ verifica

⟨Ax, ϕ⟩ = ⟨x,A∗ϕ⟩ . (1.5)

Teorema 4 si ha

(imA)⊥ = kerA∗ , imA = (kerA∗)⊥ .

Dim. Se ϕ ⊥ imA allora per ogni x vale

⟨Ax, ϕ⟩ = 0 ossia ⟨x,A∗ϕ⟩ = 0 ∀x ∈ IC n ;

e quindi A∗ϕ = 0. Viceversa, se A∗ϕ = 0 allora per ogni x ∈ ICn vale

0 = ⟨x,A∗ϕ⟩ = ⟨Ax, ϕ⟩ ∀x ∈ IC n

e quindi ϕ ⊥ imA. Cio prova la prima uguaglianza. La seconda si puo provarein modo analogo, ma puo anche dedursi dalla prima, ricordando che (A∗)∗ = A

e che(V ⊥

)⊥= V per ogni s.spazio di ICm.

Usando ancora le uguaglianze (A∗)∗ = A e (V ⊥)⊥ = V si trova:

Corollario 5 Vale:

kerA = (imA∗)⊥ , imA∗ = (kerA)⊥ .

Inoltre, kerA = 0 se e solo se (imA∗)⊥ = 0, ossia se A∗ e suriettiva.

Torniamo ora all’equazione (1.4). I risultati precedenti mostrano che:

Teorema 6 L’equazione (1.4) e risolubile se e solo se ϕ ⊥ (kerA∗) .

Questo teorema assume un aspetto particolarmente semplice se vogliamoche l’equazione (1.4) sia risolubile per ogni ϕ:

Teorema 7 L’equazione (1.4) e risolubile per ogni ϕ se e solo se kerA∗ = 0.

Si puo dunque enunciare:

Page 13: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

7

Teorema 8 (alternativa di Fredholm) La matrice A identifica una tra-sformazione iniettiva se e solo se la matrice A∗ identifica una trasformazionesuriettiva; La matrice A identifica una trasformazione suriettiva se e solo sela matrice A∗ identifica una trasformazione iniettiva.

Osservazione 9 L’alternativa di Fredholm per le matrici e utile perche in pra-tica e assai piu semplice verificare l’unicita di soluzione piuttosto che l’esistenzadi soluzione.

L’alternativa di Fredholm si incontra anche in situazioni piu generali dellostudio di sistemi di n equazioni in m incognite. Pero, nel caso particolare delproblema (1.4) si puo essere anche piu precisi e notare che se kerA = 0 einoltre A e suriettiva, allora deve essere n = m.

Si ricordi che una trasformazione A da IRn in se e suriettiva ed iniettivaquando, fissata una base, e diverso da zero il determinante della matrice adessa corrispondente.

1.0.2 L’equazione λx− Ax = y

Sia ora n = m e quindi A sia una matrice quadrata, e studiamo l’equazione

λx− Ax = y , ossia (λI − A)x = y (1.6)

ove I indica la matrice identita. Naturalmente quest’equazione e un casoparticolare di (1.4) e quindi si tratta di adattare a questo caso particolare irisultati gia trovati. In particolare:

Teorema 10 L’equazione (1.6) ammette una e una sola una soluzione perogni y se e solo se l’equazione

(λI − A∗)ψ = ϕ

ammette esattamente una soluzione. Cio avviene se e solo se

det(λI − A) = 0 . (1.7)

L’insieme dei numeri λ per cui vale l’unicita di soluzione si chiama l’in-sieme risolvente della matrice A e si indica col simbolo ρ(A); il suo com-plementare si chiama lo spettro della matrice e si indica col simbolo σ(A).Gli elementi di σ(A) si chiamano gli autovalori di A.

Si noti chedet(λI − A)

Page 14: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

8 CAPITOLO 1. INTRODUZIONE ALL’ANALISI FUNZIONALE

e un polinomio di grado n ≥ 1; e quindi lo spettro di una matrice non e vuoto.Gli autovalori sono in generale numeri complessi, anche se la matrice A

e reale. Si ricordi che se la matrice A e reale allora λ ∈ σ(A) se e solo seλ ∈ σ(A).

In generale si ha che se λ ∈ σ(A) allora λ ∈ σ(A∗).Si lascia per esercizio di enunciare risultati analoghi per l’equazione

x = µAx+ y . (1.8)

Notiamo pero che quest’equazione e risolubile in modo banale quando µ = 0perche in tal caso essa si riduce a x = y.

1.0.3 L’equazione di Fredholm di seconda specie connucleo degenere

Studiamo ora l’equazione (1.1) nel caso particolare in cui il nucleo ha for-ma (1.3), ossia nel caso del nucleo degenere.

Il parametro µ moltiplica l’integrale, cosı che l’equazione di Fredholm cosıscritta viene ad essere di seconda specie per ogni valore di µ. Avessimo invecescritto

λx(s) =∫ b

aK(s, ξ)x(ξ) dξ + y(s) , s ∈ [a, b]

per λ = 0 avremmo trovato un’equazione di prima specie.L’equazione (1.1) si scrive

x(s) = µm∑r=1

ar(s)∫ b

abr(ξ)x(ξ) dξ + y(s) (1.9)

ossia

x(s) = µm∑r=1

ar(s)xr + y(s) , xr =∫ b

abr(ξ)x(ξ) dξ .

I numeri xi dipendono dalla funzione incognita x(s) e quindi non sono noti;pero, moltiplicando i due membri dell’uguaglianza per bi(s) e integrando da aa b, si trova che essi risolvono

xi = µm∑r=1

kirxr + yi ,

kir =

∫ ba bi(s)ar(s) ds

yi =∫ ba bi(s)y(s) ds .

(1.10)

Dunque, i numeri xi risolvono un sistema della forma (1.8). Introduciamoallora la matrice K i cui elementi sono kir e i vettori x e y, i cui elementi sonorispettivamente i numeri xi e yi e scriviamo il sistema (1.10) come

(I − µK)x = y . (1.11)

Page 15: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

9

Dunque ogni soluzione dell’equazione di Fredholm (1.9) identifica una soluzionex di (1.11) e si vede anche che vale il viceversa: se x risolve (1.11) allora

x(s) = µm∑r=1

ar(s)xr + y(s)

risolve l’equazione (1.9). Mostriamo infatti che questa funzione, sostituita adestra ed a sinistra di (1.9), verifica l’uguaglianza. A sinistra si trova

µm∑r=1

ar(s)xr + y(s)

mentre sostituendo a destra e tenendo conto di (1.10) (e scambiando il nomedegli indici) si trova

µm∑r=1

ar(s)∫ b

abr(ξ)

µ

m∑i=1

ai(ξ)xi + y(ξ)

dξ + y(s)

= µm∑r=1

ar(s)

µ

m∑i=1

krixi + yr

+ y(s) = µ

m∑r=1

ar(s)xr + y(s) ,

come si voleva.Possiamo quindi trasferire all’equazione integrale di Fredholm i risultati

che abbiamo enunciato per i sistemi di equazioni lineari:

Teorema 11 L’equazione di Fredholm (1.1) con nucleo degenere ammette alpiu una soluzione se e solo se l’equazione

ψ = µK∗ψ + ϕ (1.12)

e risolubile per ogni ϕ; l’equazione di Fredholm con nucleo degenere e risolu-bile per ogni funzione y(x) se e solo se l’equazione (1.12) ammette unicita disoluzione.

Il teorema precedente da una specie di “alternativa di Fredholm” per l’e-quazione integrale, ma trascritta mediante le matrici. E’ pero facile vedere chel’equazione (1.12) corrisponde all’equazione integrale

ψ(ξ) = µ∫ b

aK(ξ, s)ψ(ξ) dξ + ϕ(ξ) , (1.13)

equazione che si chiama aggiunta della (1.1). Possiamo quindi enunciarel’alternativa di Fredholm per le equazioni integrali di Fredholm a nucleodegenere:

Page 16: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

10 CAPITOLO 1. INTRODUZIONE ALL’ANALISI FUNZIONALE

Teorema 12 Quando il nucleo e degenere, la (1.1) ammette unicita di solu-zione se la sua aggiunta (1.13) e risolubile per ogni ϕ(s); la (1.1) e risolubileper ogni y(s) se la sua aggiunta (1.13) ammette unicita di soluzione.

Ancora, e assai piu facile verificare l’unicita piuttosto che l’esistenza disoluzioni, e cio spiega l’interesse di questo teorema.

1.0.4 L’equazione di Fredholm di prima specie

Le considerazioni precedenti possono tutte ripetersi nel caso dell’equazione diprima specie (1.2). In tal caso, invece della (1.10) si trova l’equazione

m∑r=1

kirxr = yi

ossiaKx = y . (1.14)

Per vedere la differenza tra questa e l’equazione (1.11), esaminiamo il casoparticolare in cui

kir =∫ b

abi(ξ)ar(ξ) dξ =

0 se i = rkii = 0 se i = r .

In tal caso la (1.11) e la (1.14) divengono rispettivamente(1− µk11)

(1− µk22). . .

(1− µkmm)

x1x2...xm

=

y1y2...ym

,k11

k22. . .

kmm

x1x2...xm

=

y1y2...ym

.

Ambedue queste equazioni sono, in principio, facilmente risolubili e le soluzionisono, rispettivamente,

y1/[1− µk11]y2/[1− µk22]

...ym/[1− µkmm]

,

y1/k11y2/k22

...ym/kmm

.

Page 17: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

11

In generale, al crescere dell’indice i, i numeri kii divengono “velocemente”piccoli e quindi nel caso dell’equazione di prima specie, gli errori commessinella misura di y(s), e quindi nel calcolo degli yi, si amplificano velocemente.Cio non accade per il caso dell’equazione di seconda specie, salvo nel caso incui 1/µ e circa uguale ad uno dei numeri kii; e anche in questo caso la solacomponente i–ma puo provocare dei problemi numerici.

Queste considerazioni mostrano che, almeno nel caso del nucleo degenere,la soluzione delle equazioni integrali di prima specie e assai piu delicata dellasoluzione di quelle di seconda specie.

1.0.5 Ricapitolazione

Ora poniamoci alcuni problemi, la cui soluzione guidera la scelta degli argo-menti di analisi funzionale che studieremo. Il primo e questo: tutti i nucleiespressi mediante polinomi sono degeneri. Ma per esempio

k(t, s) = esξ

non e un nucleo degenere. Quindi possiamo chiedere se sia possibili approssi-mare nuclei abbastanza regolari mediante nuclei degeneri. A questo problemarispondera il teorema di Weierstrass, teorema 46.

Per applicare il teorema 12 e necessario ricondursi alla situazione matri-ciale del teorema 11. In tal caso l’unicita di soluzione si ha quando 1/µ non eun’autovalore della matrice A. Se pero il nucleo non e degenere, cio certamentenon puo farsi; e allora ci si chiede se l’alternativa di Fredholm, opportunamen-te reinterpretata, continui a valere e, in caso affermativo, come sia possibileverificare l’unicita di soluzione.

Vorremo infine capire se anche nel caso dei nuclei non degeneri l’equazionedi prima specie sia piu delicata di quella di seconda, e chiarire la ragione dicio.

Fatte queste premesse, passiamo ad uno studio sistematico dell’AnalisiFunzionale.

Page 18: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

12 CAPITOLO 1. INTRODUZIONE ALL’ANALISI FUNZIONALE

Page 19: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

Capitolo 2

Gli spazi di Banach

2.1 Spazi lineari normati

Richiamiamo, dai corsi precedenti, le definizioni di spazio lineare e di norma.In questo corso gli spazi lineari avranno sempre, come campo scalare, il campoIR o, piu frequentemente, IC . Per indicare genericamente uno di questi duecampi useremo il simbolo Φ, specificando, se necessario, quando si intendeΦ = IR oppure Φ = IC.

Gli elementi di Φ si chiamano gli scalari.

Definitione 13 (di spazio lineare) Si dice che X e uno spazio lineare suΦ quando e un gruppo commutativo (rispetto ad un’operazione usualmenteindicata col segno +) ed inoltre esiste un’operazione (usualmente indicata connotazione moltiplicativa) che ad ogni coppia (α, x) ∈ Φ×X associa un elementodi X e che verifica le seguenti proprieta:

α(x+ y) = αx+ αy ∀α ∈ Φ , ∀x , y ∈ X

(α + β)x = αx+ βx ∀α , β ∈ Φ , ∀x ∈ X

1x = x ∀x ∈ X .

Regole di calcolo che discendono dalla precedente definizione sono:

0x = 0 ∀x ∈ X

(−αx) = −(αx) ∀α ∈ Φ , ∀x ∈ X

α0 = 0 ∀α ∈ Φ .

Ricordiamo alcuni esempi di spazi lineari.

13

Page 20: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

14 CAPITOLO 2. GLI SPAZI DI BANACH

Esempio 14 Gli spazi IRn e IC n sono esempi di spazi lineari rispettivamentesu IR e su IC . (lo spazio IC n e anche uno spazio lineare su IR). Gli spazi deipolinomi, delle funzioni continue, delle funzioni integrabili secondo Riemann;lo spazio delle successioni; o quello delle successioni convergenti; o quello dellesuccessioni limitate; o quello delle successioni convergenti a zero sono sonospazi lineari su IR oppure su IC .

Sia X uno spazio lineare su Φ e sia G un suo s.insieme finito o meno. Sidice che G e un insieme di generatori se per ogni x ∈ X esistono un numeronaturale n; elementi g1 , . . . , gn di G; scalari α1 , . . . , αn, tali che

x =n∑i=1

αigi .

Se in X esiste un insieme G finito di generatori, si dice che X ha dimensionefinita; si dice che ha dimensione infinita altrimenti.

La dimensione di X e il numero degli elementi di uno dei generatori diX che ha il minimo numero di elementi.

Gli spazi IRn hanno dimensione n; lo spazio IC n ha dimensione n su IC edimensione 2n su IR.

Ha dimensione finita lo spazio dei polinomi di grado al piu n. Se comecampo scalare si prende il campo cui appartengono i coefficienti, la dimensionee n+ 1. Nonostante questi esempi importanti, in questo corso noi studieremosolamente spazi lineari di dimensione infinita.

Ricordiamo ora la definizione di norma.

Definitione 15 Sia X uno spazio lineare su Φ. Si chiama norma su X unafunzione, che si indica col simbolo ||x||, da X in IR (anche quando il camposcalare e IC), che soddisfa:

1) ||x|| ≥ 0 ∀x ∈ X

2) ||x|| = 0 se e solo se x = 0

3) ||αx|| = |α| · ||x|| ∀α ∈ Φ , ∀x ∈ X

4) ||x+ y|| ≤ ||x||+ ||y|| ∀x , y ∈ X .

L’ultima proprieta della norma si chiama disuguaglianza triangola-re.

Quando ci sia possibilita di confusione, si scrive || · ||X per la norma dellospazio X.

Uno spazio lineare dotato di norma si chiama uno spazio lineare nor-mato e da ora in poi scriveremo semplicemente s.l.n.

Page 21: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.1. SPAZI LINEARI NORMATI 15

Osservazione 16 E’ curioso notare che la definizione di norma e ridondante.Ovviamente, la terza proprieta con α = 0 implica che

||0x|| = |0| · ||x|| = 0

e 0x = 0, l’elemento nullo di X. Dunque una delle due implicazioni in 2)discende da 3).

Anche la proprieta 1) discende da 2) e da 3). Infatti, essendo ||0|| = 0 siha anche, per ogni x ∈ X,

0 = ||x− x|| ≤ ||x||+ || − x|| = ||x||+ | − 1| · ||x|| = 2||x|| .

Se X e uno s.l.n., la funzione

d(x, y) = ||x− y||

e una distanza per la quale

d(x+ z, y + z) = d(x, y) ;

ossia, e una distanza invariante per traslazioni.L’introduzione di una norma su X permette di definire:

1. gli intorni B(x0, ϵ) = x | ||x− x0|| < ϵ, con ϵ > 0;

2. gli insiemi aperti di X, e quindi una topologia su X: A ⊆ X eaperto se esso contiene un intorno di ciascun suo punto;

3. gli insiemi limitati: un insieme si dice limitato quando e contenuto inun intorno di 0;

4. la convergenza di successioni: si dice che la successione (xn) convergead x0,

limxn = x0 ,

se per ogni ϵ > 0 esiste Nϵ tale che da n > Nϵ segue

||xn − x0|| < ϵ ossia xn ∈ B(x0, ϵ).

In modo del tutto analogo si definiscono limiti e continuita di funzioni cheoperano tra s.l.n-ti: per esempio f(·) da X in Y e continua nel punto x0 ∈ Xse e ivi definita e se per ogni ϵ > 0 esiste δ > 0 tale che

||x− x0||X < δ , x ∈ domf(·) , segue ||f(x)− f(x0)||Y < ϵ .

Esattamente come nel caso dei valori assoluti e dei moduli dei numericomplessi, si prova:

Page 22: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

16 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 17 Vale: ∣∣∣∣ ||x|| − ||y||∣∣∣∣ ≤ ||x− y|| (2.1)

Dim. Va provato che:

−||x− y|| ≤ ||x|| − ||y|| ≤ ||x− y|| . (2.2)

Usando la disuguaglianza triangolare si vede che

||x|| ≤ ||x− y||+ ||y|| ed anche ||y|| ≤ ||y − x||+ ||x|| ,

ossia la (2.2).

E’ conseguenza della (2.1):

Teorema 18 La norma, come trasformazione dallo s.l.n. X a IR, e unifor-memente continua.

Inoltre:

Teorema 19 Sia f(x) una funzione da uno s.l.n. X ad uno s.l.n. Y . Siequivalgono le condizioni

limx→x0

f(x) = 0 e limx→x0

||f(x)||Y = 0

Introduciamo ora la seguente definizione:

Definitione 20 Una successione (xn) di elementi di X e fondamentalequando per ogni ϵ > 0 esiste un indice Nϵ tale che

n , m > Nϵ =⇒ ||xn − xm|| < ϵ .

Con la stesa dimostrazione che si conosce per le successioni di numeri reali,si prova che ogni successione convergente e fondamentale.

Lo s.l.n. X si dice completo se ogni successione fondamentale e conver-gente.

Si vede facilmente che tutte le regole di calcolo dei limiti che valgono in IRn

o in IC n valgono in qualunque s.l.n. (ma ovviamente il teorema della funzionemonotona, che dipende dalla relazione di ordine, non ha corrispondente). Im-portanti eccezioni sono le seguenti: si sa che sia IRn che IC n sono spazi completi.Invece:

Teorema 21 Esistono s.l.n-ti non completi.

Page 23: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.1. SPAZI LINEARI NORMATI 17

Questo teorema suggerisce:

Definitione 22 Uno spazio lineare normato e completo si chiama spazio diBanach.

Vedremo in seguito esempi di spazi di Banach. Dovrebbe essere noto, comeconseguenza del teorema dei limiti, che lo spazio lineare C(a, b) e completo.Per una dimostrazione si veda il paragrafo 2.3.2.

Si sa che esistono successioni (qn) la cui immagine e densa in IRn o in IC n.Invece:

Teorema 23 Esistono s.l.n-ti nei quali nessuna successione ha immagine den-sa.

L’ultimo teorema suggerisce la seguente definizione:

Definitione 24 Sia X uno s.l.n. Se esiste una successione (xn) a valori in Xla cui immagine e densa in X, lo spazio X si dice separabile.

Il teorema 23 puo quindi enunciarsi dicendo che esistono s.l.n-ti non sepa-rabili.

Per concludere quest’introduzione, ricordiamo che sul medesimo s.l.n. Xpossono introdursi piu norme. Per esempio su IC n sono norme tra loro diversele seguenti. Se x = col

[x1 . . . xn

]:

||x||p =[n∑i=1

|xi|p]1/p

, (se p ≥ 1) ||x||∞ = max|xi| , i = 1 . . . , n .

(E’ facile provare che || · ||1 e || · ||∞ sono norme. Gli altri casi sono piu difficili.Si noti pero che || · ||2 e l’usuale norma euclidea).

Tuttavia, su IC n, la proprieta

limxn = x0 (2.3)

e indipendente dalla particolare norma che si usa per verificarla.Invece:

Teorema 25 Esistono s.l.n-ti X sui quali si possono definire due diversenorme, || · ||1 e || · ||2, tali che la (2.3) valga per una norma, ma non perl’altra.

Questo teorema suggerisce di definire:

Page 24: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

18 CAPITOLO 2. GLI SPAZI DI BANACH

Definitione 26 Siano || · ||1 e || · ||2 due norme sul medesimo s.l.n. X. Si diceche le due norme sono equivalenti se la condizione

lim ||xn − x0||1 = 0 per ogni x0

implica la condizione

lim ||xn − x0||2 = 0 per ogni x0,

e viceversa.

E’ importante poter decidere se due norme sono equivalenti. Il teoremaseguente da un test utile:

Teorema 27 Sia X uno s.l.n. e siano || · ||1 e || · ||2 due norme su X. Essesono equivalenti se e solo se esistono due numeri m ed M tali che

m > 0 , e inoltre m||x||1 ≤ ||x||2 ≤M ||x||1 . (2.4)

Osservazione 28 Si ricordi che i chiusi nella topologia di uno spazio metricosono tutti e soli gli insiemi sequenzialmente chiusi. Dunque, le due norme sonoequivalenti quando subordinano la stessa topologia.

Abbiamo notato che esistono spazi lineari normati e non completi. E’ benesapere:

Teorema 29 Sia X uno s.l.n. Si costruisce uno s.l.n. X con queste proprieta:

• X e completo;

• un s.spazio X0 di X, denso in X, e isometricamente isomorfo ad X.

L’ultima affermazione vuol dire che esiste un isomorfismo J tra X ed X0 taleche

x ∈ X , x = Jx , x ∈ X0 ⊆ X =⇒ ||x||X = ||x||X .

Page 25: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.1. SPAZI LINEARI NORMATI 19

2.1.1 Dimostrazioni posposte

Passiamo ora alla dimostrazione dei teoremi che abbiamo enunciato.

Dimostrazione del TEOREMA 21. Un esempio di spazio lineare normato noncompleto si costruisce come segue: i suoi elementi sono le funzioni x(·) continuesu [−1, 1] con l’usuale struttura lineare. La norma e

||x(·)|| =∫ 1

−1|x(s)| ds .

E’ facile vedere che la successione (xn):

xn(t) =

−1 se −1 ≤ t ≤ − 1

n

nt se − 1n≤ t ≤ 1

n

1 se 1n≤ t ≤ 1

e fondamentale. Per ogni t, la successione numerica (xn(t)) converge al numerosgn(t). Essendo la successione (xn) limitata, segue che

lim∫ 1

−1|xn(s)− sgn(s)| ds = 0 .

Se fosse anche limxn(·) = ϕ(·) nello spazio in cui stiamo lavorando, ossia conϕ(·) continua avremmo∫ 1

−1|ϕ(s)− sgn(s)| ds ≤ lim ||ϕ− xn||+ lim

∫ 1

−1|xn(s)− sgn(s)| ds = 0 ;

ossia, ϕ(t) = sgn(t) q.o. t ∈ [−1, 1]. Cio non puo aversi perche ϕ(·) dovrebbeessere continua mentre la funzione segno ha un salto.

Dimostrazione del TEOREMA 23. Un esempio di s.l.n. non separabile e ilseguente, che si indica col simbolo l∞ : i suoi elementi sono le successioni (xn)limitate e la norma e

||(xn)||∞ = sup |xn| .Sia S una successione di elementi di l∞, S = (x(n)). Notiamo che per ogni n

il simbolo x(n) indica un elemento di l∞, ossia una successione (x(n)k ) di indice

k. Mostriamo che l’immagine di S non e densa in l∞ costruendo un elementoy = (yk) ∈ l∞ che dista almeno 1 da ciascun elemento x(n) della successione S.Costruiamo y specificandone gli elementi yk. Per scegliere y1, primo elementodella successione y, si guarda il primo elemento della successione x(1) e si pone:

y1 =

0 se |x(1)1 | > 12 altrimenti .

Page 26: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

20 CAPITOLO 2. GLI SPAZI DI BANACH

In questo modo, qualunque siano i successivi elementi di y, si ha

||y − x(1)|| ≥ 1 .

Per scegliere yk si guarda la k-ma successione x(k) e si pone

yk =

0 se |x(k)k | > 12 altrimenti .

Indipendentemente dai valori degli yr con r = k, ||y − x(k)|| ≥ 1. Dunque, lasuccessione y ∈ l∞ che abbiamo costruita verifica

||y − x(k)|| ≥ 1

per ogni k; e quindi la successione S non e densa in l∞.

Si veda il Teorema 36 per un secondo esempio di s.l.n. non separabile.

Dimostrazione del TEOREMA 25. Si consideri lo spazio lineare che indi-chiamo con X, i cui elementi sono funzioni continue su [−1, 1], con le duenorme

||x||1 =∫ 1

−1|x(s)| ds , ||x||∞ = max

[−1,1]|x(t)| .

La norma || · ||∞ corrisponde alla convergenza uniforme.Sia (xn) una successione in X. Se essa converge ad x0 per || · ||∞, ossia se

converge uniformemente, allora vale anche

lim∫ 1

−1|xn(t)− x0(t)| dt = 0

e quindi anche lim ||xn − x0||1 = 0. Esitono pero successioni convergenti in|| · ||1 ma non nella norma della convergenza uniforme. Sia xn(·) la funzione ilcui grafico e disegnato in figura 2.1:

xn(t) =

0 t < − 1n

n(t+ 1

n

)− 1n≤ t ≤ 0

−n(t− 1

n

)0 ≤ t ≤ 1

n

0 t > 1n.

L’area del triangolo tende a zero, e quindi lim xn = 0 in ||·||1; ma la successione(xn) non e fondamentale in || · ||∞.

Dimostrazione del TEOREMA 27. Proviamo la condizione sufficiente. Si sap-pia che xn → x0 in || · ||2, ossia si sappia che

||xn − x0||2 → 0 .

Page 27: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.1. SPAZI LINEARI NORMATI 21

Figura 2.1:

−1.5 −1 −0.5 0 0.5 1 1.5−0.5

0

0.5

1

1.5

Dalla prima disuguaglianza in (2.4) segue

m||xn − x0||1 ≤ ||xn − x0||2 → 0 ,

ossia xn → x0 in || · ||1 perche m > 0.

Se si sa che xn → x0 in || · ||1, segue la convergenza in || · ||2 dalla secondadelle (2.4).

Proviamo il viceversa. Si sappia che ogni successione convergente in || · ||2converge, ed ha il medesimo limite, anche in || · ||1; ma supponiamo per assurdoche la prima disuguaglianza in (2.4) non valga per nessuna scelta di m > 0.In tal caso, per ogni n esiste xn tale che

||xn||2 = 1 e ||xn||1 > n .

Definiamo yn = xn/n. E’ ovvio che (yn) tenda a zero in || · ||2 mentre invece||yn||1 ≥ 1 per ogni n; e quindi (yn) non converge a zero rispetto a || · ||1.Questo non si da, per ipotesi, e quindi esiste m > 0 per cui vale la primadiseguaglianza in (2.4).

Analogamente si vede che se la convergenza in || · ||1 implica la convergenzain || · ||2 allora vale la seconda diseguaglianza in (2.4) per un certo M .

Dimostrazione del TEOREMA 29. La costruzione di X e del tutto simile al-la costruzione di Cantor dei numeri reali, e viene solamente accennata. Si

Page 28: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

22 CAPITOLO 2. GLI SPAZI DI BANACH

considera l’insieme delle successioni fondamentali in X e in questo insieme sistabilisce la relazione di equivalenza

(xn) ∼ (yn) se lim(xn − yn) = 0 .

Si vede facilmente che questa e una relazione di equivalenza. Indichiamo con[(xn)] la classe di equivalenza cui (xn) appartiene. Si vede facilmente chel’insieme delle classi di equivalenza diviene uno spazio lineare se dotato delleoperazioni

[(xn)] + [(yn)] = [(xn + yn)] , α[(xn)] = [(αxn)] .

In questo spazio, che indichiamo con X, si introduce la norma

|| [(xn)] || = lim ||xn|| .

Questa definizione ha senso perche se (xn) e fondamentale allora (||xn||) e unasuccessione fondamentale di numeri, come si vede facilmente dal Teorema 17.Si vede inoltre che la norma cosı definita dipende dalla classe di equivalenza enon dal rappresentante, ed ha effettivamente le proprieta di una norma su X.

Lo spazioX0 e quelo delle classi di equivalenza che hanno un rappresentantecostante. E’ immediato verificare che X0 ed X sono isometrici.

Notiamo ora che X0 e denso in X perche ogni elemento [(xn)] di X siapprossima mediante la successione ( [(yn)]r ) cosı costruita: yn = xn se n < r;altrimenti yn = xr.

2.2 Spazi prodotto

Ricordiamo che il prodotto cartesiano X × Y di due insiemi X ed Y el’insieme delle coppie ordinate (x, y), il cui primo elemento e in X ed ilsecondo in Y . Come casi particolari, si possono considerare i casi

Y = X oppure X = Φ .

Se X ed Y sono spazi lineari, si puo rendere X × Y uno spazio linearedefinendo

(x1, y1) + (x2, y2) = (x1 + x2, y1 + y2) , α(x, y) = (αx, αy) .

Se inoltre X ed Y sono dotati di norma, rispettivamente || · ||X e || · ||Y , sipossono definire norme su X × Y . Per esempio

||(x, y)||p = [||x||pX + ||y||pY ]1/p ∀p ≥ 1 , ||(x, y)||∞ = max||x||X+||y||Y .

Page 29: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.2. SPAZI PRODOTTO 23

E’ un fatto che non proviamo, il seguente: le norme precedenti su X × Ysono equivalenti.

Proviamo ora:

Teorema 30 Le due trasformazioni

(x, y) → x+ y da X ×X → X

(α, x) → αx da Φ×X → X

sono continue.

Dim. Per provare la prima affermazione, si fissa (x0, y0) e si nota che, lavorandocon || · ||1 su X × Y , la disuguaglianza triangolare implica

||(x+ y)− (x0 + y0)||X = ||(x− x0) + (y − y0)||X ≤ ||x− x0||X + ||y − y0||X= ||(x− x0, y − y0)||1 = ||(x, y)− (x0, y0)||1 . (2.5)

Segue da qui la continuita della trasformazione (x, y) → x+ y.Per provare la continuita del prodotto, fissiamo (α0, x0) con α0 = 0 e

valutiamo:

||αx− α0x0||X = ||(α− α0)x+ α0(x− x0)||X≤ |α− α0| · ||x||X + |α0| · ||x− x0||X .

Si ha quindi||αx− α0x0||X < ϵ

se si sceglie||x− x0||X ≤ ϵ/2α0

(e quindi anche ||x||X ≤ ||x0||X + ϵ/2α0) ed anche

|α− α0| <ϵ

2[||x0||X + ϵ/2α0].

In particolare quindi se si sceglie la coppia (α, x) in un intorno di (α0, x0) lacui esplicita determinazione si lascia al lettore.

Il caso α0 = 0 si lascia per esercizio.

Osservazione 31 Si noti la stretta somiglianza della dimostrazione del teo-rema precedente con le usuali dimostrazioni sui limiti della somma e del pro-dotto di funzioni di una variabile; e si noti, da (2.5), che la somma e ancheuniformemente continua; una proprieta che invece non vale per il prodotto.

Il teorema precedente implica che in particolare sono continue le trasfor-mazioni

x −→ x0 + x , x −→ α0x

(con x0 ed α0 fissati) dette rispettivamente traslazioni ed omotetie.

Page 30: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

24 CAPITOLO 2. GLI SPAZI DI BANACH

2.3 Gli esempi principali di spazi di Banach

Mostriamo ora gli esempi di spazi lineari normati che sono piu importantiper le applicazioni. Essi sono tutti spazi completi, ossia spazi di Banach. Ladimostrazione della completezza viene vista successivamente.

Sottolineiamo da subito che gli spazi che si incontrano nelle applicazionihanno un simbolo standard, che indica sia lo spazio vettoriale che la norma suesso.

Prima di elencare gli esempi piu importanti di spazi di Banach, richiamiamole disuguaglianze seguenti, che verranno frequentemente usate in futuro.

Disuguaglianza di Holder, rispettivamente per le serie e gli integrali.Sia p > 1. Si definisce1 esponente coniugato di p il numero

q =p

p− 1.

Siano (am) (bm) successioni, rispettivamente siano f(x) e g(x) funzioni misu-rabili su Ω. Vale rispettivamente:

+∞∑n=0

|anbn| ≤[+∞∑n=0

|an|p]1/p [+∞∑

n=0

|bn|q]1/q

,

∫Ω|f(x)g(x)| dx ≤

[∫Ω|f(x)|p dx

]1/p [∫Ω|g(x)|q dx

]1/q.

Si noti che l’esponente coniugato di p = 2 e q = 2. La disuguaglianza diHolder con p = 2 si chiama Disuguaglianza di Schwarz.

Disuguaglianza di Minkowski, rispettivamente per le serie e gli integrali.Sia p ≥ 1 e siano (am) (bm) successioni, rispettivamente siano f(x) e g(x)funzioni misurabili su Ω. Vale

+∞∑n=0

|an + bn|p1/p

+∞∑n=0

|an|p1/p

+

+∞∑n=0

|bn|p1/p

,

∫Ω|f(x) + g(x)|p dx

1/p

≤∫

Ω|f(x)|p dx

1/p

+∫

Ω|g(x)|p dx

1/p

.

Si noti una conseguenza importante della disuguaglianza di Minkowski: seambedue le serie o gli integrali a destra sono finiti anche il membro sinistro efinito.

1in seguito si estendera la definizione, includendo anche p = 1.

Page 31: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 25

La disuguaglianza di Minkowski puo estendersi ad ogni somma finita, edanche alle serie. Infatti se ∫

Ω|fk(x)|p < +∞

per ogni k e se la serie+∞∑k=1

fk(x)

converge q.o. su Ω, allora si ha:

[∫Ω

∣∣∣∣∣+∞∑k=1

fk(s)

∣∣∣∣∣p

ds

]1/p≤

+∞∑k=1

[∫Ω|fk(s)|p ds

]1/p.

Analoga estensione vale se invece di funzioni fk(x) si hanno successioni.

2.3.1 Gli esempi di spazi lineari normati

Introduciamo ora gli esempi piu importanti di s.l.n. con i simboli comunementeusati per indicarli.

• Il simbolo C([a, b]) (piu semplicemente C(a, b)).

Questo simbolo indica lo s.l.n. i cui elementi sono le funzioni continue sull’in-tervallo [a, b] chiuso e limitato. La struttura lineare e quella usuale e la normae quella della convergenza uniforme:

||x|| = max[a,b]

|x(t)| .

In generale, se K e un compatto di Φn, con C(K) si intende lo spazio dellefunzioni continue su K, con norma maxK |x(t)|.

I valori assunti dalla funzione sono numeri o vettori; talvolta sono matrici.

Osservazione 32 Sottolineiamo nuovamente che ciascuno dei simboli seguen-ti indica uno spazio lineare con la norma che e ad esso associata nella defini-zione corrispondente. Quindi, per esempio, non useremo il simbolo C(a, b) perindicare lo spazio delle funzioni continue con una norma integrale, per esempioquella introdotta nella dimostrazione del Teorema 25. Per questo, in quelladimostrazione abbiamo indicato genericamente con X tale s.l.n.

• I simboli lp, 1 ≤ p ≤ +∞.

Page 32: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

26 CAPITOLO 2. GLI SPAZI DI BANACH

Questi simboli indicano spazi di successioni. Gli elementi sono le successioni(xn) tali che:

∑ |xn|p < +∞ se 1 ≤ p < +∞, ||(xn)||p =[∑ |xn|p

]1/psup |xn| < +∞ se p = +∞, ||(xn)||∞ = sup |xn| .

E’ immediato verificare che gli spazi di successioni appena descritti sonos.l.n-ti rispetto alle usuali operazioni di somma elemento per elemento e diprodotto α(xn) = (αxn). La verifica e diretta se p = 1 oppure p = +∞ mentrefa uso della disuguaglianza di Minkovski per le serie se 1 < p < +∞.

• Il simbolo c0.

Si usa per per indicare lo s.l.n. delle successioni (xn) tali che limxn = 0. Lanorma in c0 e

||(xn)|| = sup |xn| .Dunque c0 e un s.spazio di l∞.

E’ facile verificare che sia c0 che gli spazi lp con p < +∞ sono separabilimentre abbiamo visto, nel corso della dimostrazione del Teorema 23, che l∞

non e separabile.

• I simboli Lp(a, b) ed Lp(a, b), 1 ≤ p ≤ +∞.

Il simbolo Lp(a, b) si usa per indicare gli s.l.n-ti i cui elementi sono le funzionif(·) tali che, rispettivamente,2∫ b

a |f(x)|p dx < +∞ se 1 ≤ p < +∞ ,sup |f(x)| < +∞ se p = +∞ .

E’ immediato vedere che Lp(a, b) con p = 1 e p = +∞ sono spazi linea-ri3. Anche gli spazi Lp(a, b) con 1 < p < +∞ sono spazi lineari, grazie alladisuguaglianza di Minkowski.

Pero le funzioni

f(·) →[∫ b

a|f(x)|p dx

]1/pnon sono norme su questi spazi: una funzione nulla in tutti i punti salvouno ha integrale nullo. L’estremo superiore e invece una norma ma ben poco

2gli integrali vanno intesi nel senso di Lebesgue. Si ricordi che una funzione f(x) eintegrabile nel senso di Lebesgue se e solo se |f(x)| lo e.

3come notazione, si scrive L∞(a, b), rispettivamente L∞(a, b), invece di L+∞(a, b) oL+∞(a, b)

Page 33: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 27

significativa se si vuol considerare applicata a classi di funzioni integrabili. Sirimedia a questo problema definendo una relazione di equivalenza, f ∼ g, con

f ∼ g ⇐⇒ f(t) = g(t) q.o. t ∈ (a, b).

E’ chiaro che due funzioni equivalenti hanno i medesimi integrali, finiti o meno.Generalmente non hanno il medesimo estremo superiore. Per questa ragionesi definisce l’estremo superiore essenziale come segue. Ad ogni r ≥ 0 siassocia l’insieme Ar,

Ar = t | f(t) > r .Per definizione,

ess sup |f(t)| = supr | λ(Ar) > 0dove λ denota la misura di Lebesgue.

Chiaramente, se f ∼ g allora le due funzioni f e g hanno il medesimoestremo superiore essenziale.

Si definisce una struttura lineare sull’insieme delle classi di equivalenzaponendo

[f ] + [g] = [f + g] , α[f ] = [αf ]

(e facile vedere che questa definizione dipende solo dalle classi di equivalenzae non dai rappresentanti scelti per definire le operazioni). Quindi, per 1 ≤p ≤ +∞, si definiscono i simboli Lp(a, b) come gli spazi lineari delle classi diequivalenza di elementi di Lp(a, b) (stesso esponente p), dotati delle norme

|| [f ] ||p =[∫ b

a|f(x)|p dx

]1/p1 ≤ p < +∞ , || [f ] ||∞ = ess sup |f(t)| .

Come si e notato, queste norme dipendono solo dalla classe di equivalenza enon dai rappresentanti usati per calcolarle.

Osserviamo nuovamente che gli spazi sopra introdotti sono s.l.n-ti (graziealla disuguaglianza di Minkowski per gli integrali se 1 < p < +∞).

Notiamo infine le due disuguaglianze∫ b

a|f(x)g(x)| dx ≤ (ess sup |g|)

∫ b

a|f(x)| dx ,

ess sup |f + g| ≤ ess sup |f |+ ess sup |g| ,

che estendono le disuguaglianze di Hoelder e Minkovski al caso di “esponenti”+∞. Queste suggeriscono di definire come esponente coniugato di p = 1l’“esponente” q = +∞.

Definizioni analoghe si danno per funzioni di piu variabili. Se queste sonodefinite su un insieme K il simbolo che si usa e Lp(K).

Page 34: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

28 CAPITOLO 2. GLI SPAZI DI BANACH

Osservazione 33 Mentre nella definizione di C(K) l’insieme K deve esserecompatto, tale condizione non e richiesta nella definizione di Lp(K).

Bisogna sapere:

Teorema 34 Esistono successioni (xn(·)) di funzioni misurabili e limitate suun intervallo [a, b] e tali che: 1) la successione di numeri (xn(t)) non convergeper nessun valore di t; ma 2) esiste una funzione integrabile x0 tale che

limn

∫ b

a|xn(t)− x0(t)| dt = 0 .

Dim. Mostriamo un esempio di successione di funzioni con le proprieta delteorema, e con x0(t) ≡ 0. Sia [a, b] = [0, 1].

Costruiamo la successione in due passi; e quindi le funzioni verranno adipendere da due indici n ed r. Ovviamente sara possibile riscrivere la succes-sione in modo da farla dipendere da un solo indice.

Al passo n dividiamo l’intervallo [0, 1] in n intervalli uguali, In0 , In1 ,. . . ,

In−1n . definiamo quindi le funzioni xn,r, 0 ≤ r ≤ (n− 1) come segue:

xn,r(t) = (−1)n

(−1)r se t ∈ Inr0 altrimenti.

L’integrale di |xn,r| vale 1/n, e quindi vale la proprieta 2) con x0 = 0; e si vedeimmediatamente che in ogni punto t infinite funzioni prendono il valore +1,infinite altre prendono il valore −1; e quindi vale anche la proprieta 1).

Osservazione 35 Nonostante il teorema 34, nel seguito sempre confonderemole funzioni con le loro classi di equivalenza, e quindi scriveremo f per indicarela classe di equivalenza [f ] di cui f e un rappresentante.

Se una successione di funzioni (fn(x)) converge in Lp(Ω), si dice che lasuccessione converge in media di ordine p. Mostriamo ora:

Teorema 36 Lo spazio L∞(a, b) non e separabile.

Dim. E’ sufficiente mostrare un insieme di elementi di L∞(a, b) distanti 1 l’unodall’altro e che non e numerabile.

Fissiamo s ∈ (a, b) e sia

xs(t) =

1 se t < s0 se t ≥ s .

Page 35: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 29

Se s = s′ si ha

supt∈(a,b)

|xs(t)− xs′(t)| = 1

e la famiglia di questi elementi di L∞(a, b) non e numerabile perche l’insiemedei reali non e numerabile.

Invece, vedremo che gli spazi Lp(a, b) con p < +∞ sono separabili, si vedail Teorema 48.

• Il simbolo W k,p(Ω) (spazi di Sobolev).

Sia Ω ⊆ IRn un aperto (limitato o meno). Si usa il simbolo W 1,p(Ω) perindicare lo spazio delle (classi di equivalenza di) funzioni u(·) ∈ Lp(Ω) tali cheesistono funzioni (ossia, classi di equivalenza) g1, g2,. . . , gn in Lp(Ω), tali che∫

Ωu(x)∇ϕ(x) dx =

∫Ω

[g1(x) . . . gn(x)

]ϕ(x) dx

per ogni funzione ϕ di classe C∞ a supporto compatto in Ω.La funzione gi si chiama la i-ma derivata parziale debole di u.Lo spazio W 1,p(Ω) si dota della norma

||u|| =

∫Ω|u(x)|p dx+

n∑j=1

∫Ω|gj(x)|p dx

1/p

oppure della norma ad essa equivalente

||u||Lp(Ω) +n∑j=1

||gj||Lp(Ω) .

Se n = 1 allora esiste una sola derivata parziale debole e vale il seguenteteorema, che non proviamo:

Teorema 37 Se n = 1 ed Ω = (a, b), ogni funzione u ∈ W 1,p(a, b) e asso-lutamente continua; e la sua derivata debole coincide con la derivata usuale,calcolata q.o.

Se n = 1 una norma equivalente alle precedenti ed un po’ piu comoda dausare e [

|u(a)|p +∫ b

a|u′(x)|p dx

]1/p.

Page 36: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

30 CAPITOLO 2. GLI SPAZI DI BANACH

Osservazione 38 Se n > 1 l’esistenza di tutte le derivate deboli non implicala continuita della funzione.

Le derivate parziali seconde, in senso debole, si definiscono come derivateprime delle derivate prime; e, analogamente, si definiscono le derivate parzialidi ogni ordine, in senso debole. Ovviamente, in generale una funzione avraderivate parziali fino ad un ordine k ≥ 0 al piu (ricordiamo che la derivata diordine 0 di una funzione e la funzione stessa).

Lo spazio lineare delle funzioni di classe Lp(Ω) che hanno tutte le derivateparziali fino all’ordine k, in senso debole, risulta essere uno spazio di Banachquando si doti della norma ottenuta sommando le norme Lp(Ω) di tutte lederivate parziali fino a quelle di ordine k incluso. Questo spazio si indica colsimbolo W k,p(Ω).

Quando p = 2, si usa anche il simbolo H1(Ω), invece di W 1,2(Ω). Questosimbolo non va confuso con quello che si usa per denotare gli spazi di Hardy,che ora definiamo.

• I simboli Hp(D) (spazi di Hardy)

Col simbolo D indichiamo il disco D = z | |z| < 1 del piano complesso. Colsimbolo Hp(D), 1 ≤ p < +∞, si indica lo spazio lineare i cui elementi sono lefunzioni olomorfe ϕ(z) tali che

supr<1

∫ 2π

0|ϕ(reit)|p dt < +∞ con ||ϕ|| = sup

r<1

[1

∫ 2π

0|ϕ(reit)|p dt

]1/p.

Col simbolo H∞(D) si indica lo spazio delle funzioni olomorfe limitate su D enorma ||ϕ|| = supD |ϕ(z)|.

Definizioni analoghe si danno sostituendo a D il semipiano Π+,

Π+ = z | ℜe z > 0 .

In questo caso l’integrazione sulla circonferenza si sostituisce con l’integrazio-ne sulle rette parallele all’asse immaginario: gli elementi di Hp(Π+) sono lefunzioni olomorfe in Π+ per le quali, se p < +∞, e finita la norma4

||f ||Hp = supx>0

[∫ +∞

−∞|ϕ(x+ iy)|p dy

]1/p.

4e piu comune vedere usata la norma equivalente

supx>0

[1

∫ +∞

−∞|ϕ(x+ iy)|p dy

]1/p.

Ci sono buone ragioni, legate alla teoria della trasformata di Fourier, per privilegiare questascelta.

Page 37: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 31

Invece, la norma di H∞(Π+) e

||ϕ||H∞(Π+) = supx>0

|ϕ(x+ iy)| .

2.3.2 Le dimostrazioni della completezza

Ricordiamo che si chiama Spazio di Banach uno s.l.n. che e anche completoe che esistono s.l.n-ti che non sono completi, si veda il Teorema 21. Inoltre, alparagrafo 2.3.1 abbiamo presentato numerosi esempi di s.l.n-ti.

Vale:

Teorema 39 Tutti gli s.l.n-ti presentati al paragrafo 2.3.1 sono completi.

Per provare questo teorema dovremo esaminare separatamente i vari spazidel par. 2.3.1, fissare l’attenzione su una generica successione (xn) fondamen-tale e associarle in qualche modo un elemento x0 dello spazio, che intuiamoessere il limite della successione. Dobbiamo quindi provare che effettivamentex0 = lim xn; ossia dobbiamo provare:

a) la funzione x0 appartiene a X;

b) la funzione x0 e limite di (xn) nella norma di X.

Questo richiedera dimostrazioni diverse a seconda dello spazio che consideria-mo.

Prima di studiare le singole dimostrazioni, ricordiamo:

Lemma 40 Sia X uno s.l.n. e sia (xn) una successione fondamentale in X.La successione (xn) e limitata, ossia esiste M tale che

||xn|| < M ∀n .

Completezza degli spazi l∞, c0, L∞(Ω) e C(K)

Si ricordi che l’insieme K del simbolo C(K) e un compatto di Φn mentrenessuna condizione si impone all’insieme Ω che compare nel simbolo L∞(Ω); enotiamo che sia l∞ che c0 sono spazi di funzioni sull’insieme Ω = IN.

Le dimostrazioni della completezza di questi spazi sono tra loro simili,basate sul Teorema del doppio limite, provato in appendice.

Indichiamo con X uno degli spazi che stiamo considerando e sia (xn) unasuccessione fondamentale. Gli spazi che stiamo considerando sono accomunatida questo: sono spazi di funzioni su un certo insieme (indicheremo con t i suoi

Page 38: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

32 CAPITOLO 2. GLI SPAZI DI BANACH

elementi) e la norma e definita in modo tale che se (xn) e fondamentale alloraciascuna delle funzioni (xn(t)) e una successione fondamentale di numeri; equindi converge. Questa affermazione si interpreta se X = L∞(Ω) in questomodo: gli elementi della successione sono classi di equivalenza [xn] di funzioni.Si fissa un rappresentante, che ancora indichiamo xn, in ciascuna classe. Illimite della successione di numeri (xn(t)) esiste q.o. su Ω.

Dunque, per ogni valore di t (o q.o. su Ω se X = L∞(Ω)) si puo definire

y(t) = lim xn(t) :

una funzione che si spera appartenga allo spazio che stiamo considerando eche sia limite di (xn). Proviamo:

a) la funzione y appartiene ad X.

Questo e facile se X non e ne C(K) ne c0. Infatti in tal caso basta notareche y e una funzione limitata come limite puntuale di una successione (xn)che, essendo fondamentale, e limitata: |xn(t)| < M per ogni t e per ogni n.Inoltre, se X = L∞(Ω), la funzione y puo costruirsi a partire da un qualsiasirappresentante delle classi di funzioni [xn], e ne e limite puntuale q.o.; e dunquee misurabile.

Se X = C(K) allora la continuita di y seguira dalla convergenza uniformedella successione di funzioni continue (xn), che proveremo al punto b), grazieal Corollario 43.

Sia X = c0. In questo caso ciascuna delle successioni xn = xn(k) tende azero per k → +∞, e, come proveremo al punto b), la successione stessa con-verge uniformemente ad y = (y(k)). Il Teorema del doppio limite, teorema 42,mostra che limk y(k) = 0, ossia che y ∈ c0.

Proviamo ora

b) la funzione y e limite della successione (xn).

La funzione y e stata costruita come limite puntuale di xn(t). Mostriamoche in realta il limite e nel senso della norma. Per questo fissiamo ϵ > 0 edun numero Nϵ tale che se n, m sono maggiori di Nϵ allora valga

||xn − xm|| < ϵ .

Valutiamo ora |y(t)− xn(t)| per n > Nϵ come segue:

|y(t)−xn(t)| ≤ |y(t)−xn+r(t)|+ |xn+r(t)−xn(t)| ≤ |y(t)−xn+r(t)|+ ϵ . (2.6)

Page 39: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 33

Questa disuguaglianza vale per ogni t e per ogni r > 0. Esiste r (dipendenteda t) tale che |y(t) − xn+r(t)| < ϵ. Il numero r esiste perche y(t) (per ilvalore fissato di t) e limite della successione di numeri (xn+r(t)) (l’argomentoprecedente vale q.o. su Ω se X = L∞(Ω)).

Dunque,

|y(t)− xn(t)| ≤ infr|y(t)− xn+r(t)|+ ϵ < 2ϵ .

Completezza dello spazio H∞(D)

Se (xn) e una successione fondamentale inH∞(D), essa e anche una successionefondamentale in L∞(D) e quindi converge in L∞(D) ad una funzione x0, chee limitata. Per provare la completezza di H∞(D) basta mostrare che x0 eolomorfa. Cio discende dal Teorema di Weierstrass sulla convergenza, uniformesui compatti, di successioni di funzioni olomorfe.

Cio prova che x0 ∈ H∞, x0 = lim xn, come si voleva.Non proveremo la completezza degli spazi Hp(D), proprieta che vale per

ogni p ∈ [1,+∞].

Completezza degli spazi lp con 1 ≤ p < +∞

Indichiamo col simbolo (xn) = (xn(k)) una successione di elementi di lp. Siaessa fondamentale. Da

|xn(k)− xm(k)| =[+∞∑r=0

|xn(r)− xm(r)|p]1/p

segue che per ogni k la successione numerica (xn(k)) e fondamentale e quindiconvergente. Cio induce a definire la successione x0 con

x0(k) = limnxn(k) .

Proviamo ora

a) la successione x0 appartiene ad lp.

Notiamo per questo che la successione (xn) di lp, essendo fondamentale, e

limitata: esiste M indipendente da n e tale che

[+∞∑k=0

|xn(k)|p]1/p

≤M .

Page 40: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

34 CAPITOLO 2. GLI SPAZI DI BANACH

Segue che per ogni ν vale[ν∑k=0

|x0(k)|p]1/p

= limn

[

ν∑k=0

|xn(k)|p]1/p ≤M .

Passando al limite rispetto a ν, si vede che x0 ∈ lp.

b) vale x0 = limxn in lp.

Si fissi ϵ > 0 e sia N = N(ϵ) tale che se n, m superano N allora vale

||xn − xm|| < ϵ .

Per n, m maggiori di Nϵ e per ogni ν vale

[ν∑r=0

|xn(r)− xm(r)|p]1/p

≤[+∞∑r=0

|xn(r)− xm(r)|p]1/p

< ϵ .

Tenendo fermi ν ed n, si passi al limite per m→ +∞. Si trova:[ν∑r=0

|xn(r)− x0(r)|p]1/p

≤ ϵ

e questa disuguaglianza vale per ogni ν. Prendendo l’estremo superiore rispettoa ν si vede che, quando n > N(ϵ), vale

||xn − x0||lp ≤ ϵ .

Questo volevamo provare.

Completezza degli spazi Lp(Ω), p < +∞

In questa parte conviene distinguere tra gli elementi [x] di Lp(Ω), ossia le classidi equivalenza, e i loro rappresentanti.

Sia ([xn]) una successione fondamentale di Lp(Ω). Il primo passo per mo-strarne la convergenza e di costruire una funzione x0, la cui classe di equivalen-za e candidata ad essere limite di ([xn]). Gli esempi precedenti suggerisconodi costruire x0 calcolando il limite puntuale dei valori di opportuni rappre-sentanti delle classi [xn]. Questo metodo pero non puo applicarsi nel caso diLp(Ω) perche si sa che una successione di funzioni che converge in media puonon convergere in nessun punto, si veda il Teorema 34. Usiamo quindi unastrategia diversa.

Page 41: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 35

Ricordiamo una proprieta generale delle successioni fondamentali: una suc-cessione fondamentale che ha una s.successione convergente e essa stessa con-vergente. Consideriamo una successione ([xn]) di elementi di Lp(Ω) e per ogniclasse fissiamo un rappresentante che indichiamo xn. In questo modo si trovauna successione (xn) di funzioni definite q.o. su Ω, e tali che per ogni ϵ > 0esiste N = N(ϵ) con questa proprieta:

n > Nϵ =⇒[∫

Ω|xn(s)− xn+m(s)|p ds

]1/p< ϵ . (2.7)

Facciamo vedere che una successione di funzioni (xn) con tale proprieta am-mette una sottosuccessione convergente q.o.

Ricordando la definizione di Nϵ in (2.7), la sottosuccessione si costruiscecon la regola seguente:

• si fissa ϵ = 1 ed il numero N(1). Si sceglie n1 = N(1) + 1;

• si fissa ϵ = 1/2 e si sceglie n2 = N(1/2) + 1;

• in generale, con ϵ = 1/2k, si sceglie nk = N(1/2k) + 1.

Si considera quindi la sottosuccessione (yk) = (xN(k)+1).La successione (yk) gode della seguente proprieta:

||yr − yr+1||Lp(Ω) ≤1

2r.

Proviamo che la successione di funzioni (yk) converge q.o. E’ strumentalea cio introdurre la serie telescopica

∞∑k=1

zk , zk = yk+1 − yk . (2.8)

Essendom∑k=1

zk = ym+1 − y1 , (2.9)

per provare la convergenza della successione, basta provare quella della serie.La costruzione della successione (yk) implica la convergenza assoluta della

serie numerica∑+∞k=1 ∥zk∥Lp(Ω). Infatti:

∞∑k=1

[∫Ω|zk(s)|p ds

]1/p=

+∞∑n=1

∥yk+1 − yk∥Lp(Ω) ≤∞∑k=1

1

2k= 1 . (2.10)

Page 42: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

36 CAPITOLO 2. GLI SPAZI DI BANACH

Consideriamo la successione di funzioni

gn(s) =n∑k=1

|zk(s)| .

Ciascuna delle funzioni gn(s) e non negativa e la successione gn(s) e mono-tona crescente e quindi esiste

g(s) = lim gn(s) =+∞∑k=1

|zk(s)| ≥ 0 .

Inoltre, dalla disuguaglianza di Minkowski,[∫Ω|gn(s)|p dx

]1/p≤

n∑k=1

[∫Ω|zk(s)|p dx

]1/p<

+∞∑k=1

1

2k= 1 .

Dunque, dal teorema della convergenza monotona, g(s)p e integrabile suΩ. Questo implica che la funzione g(s) e finita q.o. su Ω. Dunque, per q.o.x ∈ Ω, la serie numerica

+∞∑k=1

|zk(s)|

converge; e dunque anche la serie numerica

+∞∑k=1

zk(s)

converge q.o. su Ω. Cio mostra che la successione (ym(s)) converge q.o. su Ωe permette di definire una funzione

x0(s) = lim ym(s) =+∞∑k=1

zk(s) + y1(s) .

La (2.10) mostra che x0 ∈ Lp(Ω). In particolare,

+∞∑k=1

zk(s) = x0(s)− y1(s) ∈ Lp(Ω) .

Ricordiamo il nostro scopo, che era di trovare una funzione in Lp(Ω), limitedi ym in norma Lp(Ω). Proviamo che la funzione x0(s) ha questa proprieta.Valutiamo per questo:

[∫Ω

∣∣∣∣∣x0(s)−(

n∑k=1

zk(s) + y1(s)

)∣∣∣∣∣p

ds

]1/p=

∫Ω

∣∣∣∣∣∣+∞∑

k=n+1

zk(s)

∣∣∣∣∣∣p

ds

1/p .

Page 43: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 37

Va provato che l’ultimo integrale e finito, e che per ogni ϵ > 0 esiste N = Nϵ

tale che esso e minore di ϵ se n > Nϵ. Cio segue dalla disuguaglianza diMinkowski, perche∫

Ω

∣∣∣∣∣∣+∞∑

k=n+1

zk(s)

∣∣∣∣∣∣p

ds

1/p ≤ +∞∑k=n+1

[∫Ω|zk(s)|p ds

]1/p≤

+∞∑k=n+1

1

2k→ 0 .

Osserviamo che, in particolare, abbiamo anche provato un teorema sullaconvergenza in media:

Teorema 41 Sia 1 ≤ p < +∞. Se una successione di funzioni (xn) in Lp(Ω)converge in media di ordine p ad x0 allora esiste una sottosuccessione della(xn) che converge ad x0 q.o. su Ω.

Completezza degli spazi di Sobolev

Ricordiamo: sia Ω e un aperto di IRn e siano u ∈ Lp(Ω) una funzione a valoriscalari e v ∈ Lp(Ω) una funzione a valori vettori n–dimensionali. Si dice che

v = ∇u

se per ogni ϕ di classe C∞ ed a supporto compatto in Ω vale∫Ωu(s)∇ϕ(s) ds = −

∫Ωv(s)ϕ(s) ds .

In questo caso si dice che u ∈ W 1,p(Ω) e

||u||W 1,p(Ω) =[∫

Ω|u(s)|p ds+

∫Ω|v(s)|p ds

]1/p.

Dunque, se (un) e fondamentale in W 1,p(Ω), le due successioni (un) e (vn) =(∇un) sono fondamentali in norma Lp(Ω); e dunque convergenti,

un → u0 , vn → v0 .

Passando al limite si trova quindi

−∫Ωv0(s)ϕ(s) ds = − lim

∫Ω∇un(s)ϕ(s) ds

= lim∫Ωun(s)∇ϕ(s) ds =

∫Ωu0(s)∇ϕ(s) ds

per ogni funzione ϕ di classe C∞(Ω), a supporto compatto.Dunque u0 ∈ W 1,p(Ω) ha per gradiente v0, ed (un) converge ad u0 in

W 1,p(Ω).Cio prova la completezza di W 1,p(Ω).

Page 44: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

38 CAPITOLO 2. GLI SPAZI DI BANACH

2.3.3 Teorema del doppio limite

Il Teorema del doppio limite riguarda una successione di funzioni (xn), definitesu un qualsiasi insieme Ω. Per esempio, per ogni n la xn puo essere una suc-cessione (xn(k)), oppure puo essere una funzione xn(t) definita su un intervallo[a, b].

Indichiamo genericamente con t gli elementi di Ω.Le funzioni prendono valori in uno spazio completo.Supponiamo che per ogni n esista

limtxn(t) = Ln .

In questa scrittura puo essere t→ t0 oppure t→ +∞, |t| → +∞ e simili. Persottolineare questo, scriviamo genericamente

limt→α

xn(t) = Ln . (2.11)

Vale allora:

Teorema 42 (del doppio limite) Per ogni n, esista finito il limite Ln in (2.11).Se (xn) converge ad x0 uniformemente su Ω allora esiste finito

limt→α

x0(t) = L0

e vale

L0 = limnLn ;

ossia vale

limn

[limt→α

xn(t)]= lim

t→α

[limnxn(t)

].

Dim. Proviamo prima di tutto che L0 = limt→α x0(t) esiste finito. Un teoremadovuto a Cauchy5 da una condizione necessaria e sufficiente per l’esistenza dellimite finito:

limt→α

x0(t) = L0 ∈ IR

se e solo se per ogni ϵ > 0 esiste un intorno6 Iϵ di α tale che:

t′ , t′′ ∈ Iϵ =⇒ |x0(t′)− x0(t′′)| < ϵ .

5analogo a quello che correla le successioni fondamentali e le successioni convergenti.6ovvia interpretazione del termine “intorno” quando per esempio x ∈ IR e α = +∞. In

tal caso l’intorno e una semiretta (rϵ,+∞).

Page 45: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.3. GLI ESEMPI PRINCIPALI DI SPAZI DI BANACH 39

Useremo la parte sufficiente di questa condizione per provare l’esistenzadi L0 e, nel corso della dimostrazione, applicheremo la parte necessaria delteorema a ciascuna delle xn(t), grazie al fatto che l’esistenza dei limiti finitiin (2.11) e nota per ipotesi.

Per provare l’esistenza di L0, valutiamo |x0(t′)− x0(t′′)| come segue:

|x0(t′)− x0(t′′)| ≤ |x0(t′)− xn(t

′)|+ |xn(t′)− xn(t′′)|+ |xn(t′′)− x0(t

′′)| .

Usando la convergenza uniforme, si scelga n cosı grande da avere, per ogni t,

|x0(t)− xn(t)| < ϵ .

Non abbiamo ancora scelto ne t′ ne t′′ ma, comunque essi saranno scelti,certamente avremo

|x0(t′)− xn(t′)| < ϵ , |xn(t′′)− x0(t

′′)| < ϵ .

Con questo valore di n ormai fissato, si usi l’esistenza del limite finito

limt→α

xn(t) = Ln .

Il teorema di Cauchy implica l’esistenza di un intorno Iϵ di α tale che se t′ ∈ Iϵ,t′′ ∈ Iϵ, allora

|xn(t′)− xn(t′′)| < ϵ .

Si noti che Iϵ dipende anche da n ormai fissato e dipendente a sua voltadal solo ϵ.

Ricapitoliamo quanto abbiamo visto fin’ora: per ogni ϵ > 0 esiste unintorno Iϵ di α tale che per ogni coppia di punti t′ e t′′ in Iϵ si ha

|x0(t′)− x0(t′′)| ≤ |x0(t′)− xn(t

′)|+ |xn(t′)− xn(t′′)|+ |xn(t′′)− x0(t

′′)| < 3ϵ .

Il teorema di Cauchy permette di concludere che esiste finito

L0 = limt→α

x0(t) .

Proviamo ora che

L0 = limnLn .

Valutiamo |L0 − Ln| come segue:

|L0 − Ln| ≤ |L0 − x0(t)|+ |x0(t)− xn(t)|+ |xn(t)− Ln| . (2.12)

Page 46: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

40 CAPITOLO 2. GLI SPAZI DI BANACH

Sia ϵ > 0 fissato. Esiste un intorno Iϵ di α tale che

t ∈ Iϵ =⇒ |L0 − x0(t)| < ϵ .

Grazie alla convergenza uniforme, esiste un numero Nϵ tale che per ogni tvale

n > Nϵ =⇒ |x0(t)− xn(t)| < ϵ .

Scegliamo come numero n in (2.12) il numero Nϵ + 1.Dunque, per t ∈ Iϵ vale

|L0 − Ln| < 2ϵ+ |xNϵ+1(t)− LNϵ+1| .

Il membro sinistro non dipende da t e quindi si ha anche

|L0 − Ln| ≤ 2ϵ+ limt→α

|xNϵ+1(t)− LNϵ+1| = 2ϵ .

Cio e quanto dovevamo provare.

In particolare si ha:

Corollario 43 Una successione (xn) di funzioni continue definite su un qua-lunque insieme Ω ivi converga uniformemente alla funzione x0. Allora x0 econtinua su Ω.

2.4 Sottospazi di spazi lineari normati

Sia X uno s.l.n., la cui norma indicheremo col simbolo || · ||. Sia Y un s.spaziodi X. Ricordiamo che questo significa

∀y1 , y2 ∈ Y , ∀α , β ∈ Φ =⇒ αy1 + βy2 ∈ Y .

In particolare, Y stesso e uno spazio lineare e viene ad essere uno s.l.n. sead Y si restringe la funzione norma definita su X. In tal caso diremo cheY e un s.spazio dello s.l.n. X e diremo che la norma su Y e quella indottadalla norma di X. Notiamo che talvolta potra essere necessario considerare suY una norma diversa da quella indotta da X. Cio va sempre esplicitamentespecificato per evitare ambiguita. In caso contrario assumeremo che la normasu Y sia quella indotta dalla norma di X.

Quando X ha dimensione finita, i sottospazi sono le controimmagini di 0sotto l’azione di trasformazioni lineari; e si sa che:

Teorema 44 In dimensione finita, tutte le trasformazioni lineari sono conti-nue; e quindi tutti i s.spazi sono chiusi.

Page 47: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.4. SOTTOSPAZI DI SPAZI LINEARI NORMATI 41

Invece, se X ha dimensione infinita, esso ammette sia s.spazi chiusi chenon chiusi. Esempi di s.spazi chiusi sono ovviamente 0 edX stesso. Vediamoun esempio di s.spazio non chiuso.

Esempio 45 Si considera lo spazio C(a, b) ed in esso il s.spazio Y dei polino-mi. E’ chiaro che Y non e chiuso perche la restrizione ad [a, b] della funzioneesponenziale e limite uniforme di polinomi. Infatti, la serie di Taylor

+∞∑k=0

tk

k!= et

converge uniformemente sui compatti.

E’ importante sapere che non soltanto funzioni “regolari” possono appros-simarsi uniformemente con polinomi:

Teorema 46 (di Weierstrass) Sia f una funzione continua su un inter-vallo limitato e chiuso [a, b], a valori reali. Esiste una successioni pn dipolinomi a coefficienti reali che converge ad f , uniformemente su [a, b].

La dimostrazione di questo teorema e importantissima perche permettedi introdurre il concetto di “identita approssimata”. Ad essa e dedicato ilparagrafo 2.4.1.

Come conseguenza del Teorema 46 proveremo:

Teorema 47 Lo spazio C(a, b) e separabile.

Come sempre, nella notazione C(a, b) e implicito che si lavori su un in-tervallo compatto [a, b]. Invece, nel seguente teorema, ancora conseguenza delTeorema 46, ne la limitatezza ne la chiusura e richiesta.

Teorema 48 Sia 1 ≤ p < +∞ e sia (a, b) un intervallo limitato o meno. Siha che:

1. i polinomi sono densi in Lp(a, b);

2. lo spazio Lp(a, b) con p < +∞ e separabile.

Le dimostrazioni dei teoremi precedenti7 sono posposte.Una ulteriore proprieta puramente algebrica degli spazi lineari e la seguen-

te: ogni loro s.spazio ammette complementare. Ricordiamo che un spazio

7che potrebbe essere estese al caso di spazi C(K) ed Lp(K) con K ⊆ IRn anche con n > 1

Page 48: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

42 CAPITOLO 2. GLI SPAZI DI BANACH

lineare Z e un complementare di un spazio lineare Y (ambedue s.spazi di X)se:

Z ∩ Y = 0 , Z + Y = X ;

equivalentemente, se ogni elemento x di X si rappresenta in modo unico comesomma di un elemento di Z e di uno di Y .

Quando si lavora con spazi normati, e naturale chiedere se tutti i s.spazichiusi ammettano complementare, anch’esso chiuso. In dimensione finita larisposta e affermativa. Invece:

Teorema 49 Esistono s.l.n-ti X, completi, dotati di s.spazi chiusi i quali sonoprivi di complementare chiuso.

Quando un s.spazio Y e dotato di complementare Z, la dimensione (finitao meno) di Z si chiama la codimensione di Y .

Particolarmente importanti sono i sottospazi chiusi di codimensione 1, eanche i s.insiemi della forma

x0 +H ,

con H sottospazio chiuso di codimensione 1. Si chiamano tali s.insiemi gliiperpiani di X.

La dimostrazione del Teorema 49 consiste nella esplicita costruzione di uns.spazio chiuso privo di complementare, per esempio di lp, con 1 ≤ p < 2oppure con p > 2. La costruzione e alquanto macchinosa e viene omessa.

Osservazione 50 E’ bene ricordare che gli spazi lp, 1 ≤ p ≤ +∞, sonocompleti. Si veda il paragrafo 2.3.2 per la dimostrazione. E’ anche bene sapereche ogni s.spazio chiuso di l2 ammette complementare. Si veda il paragrafo 215per la dimostrazione.

2.4.1 Identita approssimate e dimostrazione del teore-ma di Weierstrass

Una famiglia di funzioni hν(s) che gode delle proprieta 0–3 seguenti sichiama identita approssimata. Le proprieta richieste sono:

0. per ciascun valore di ν, la funzione s→ hν(s) e integrabile su IR;

1. hν(s) ≥ 0 per ogni s;

2.∫+∞−∞ hν(s) ds = 1 per ogni ν > 0;

Page 49: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.4. SOTTOSPAZI DI SPAZI LINEARI NORMATI 43

3. per ogni ϵ > 0 si ha:

limν→0+

∫ −ϵ

−∞hν(s) ds = 0 , lim

ν→0+

∫ +∞

+ϵhν(s) ds = 0 .

La ragione del termine “identita approssimata” e espressa dal teorema se-guente, che prova che la famiglia hν “approssima” l’identita rispetto allaconvoluzione. Per una giustificazione piu precisa si veda il paragrafo 4.3.6.

Teorema 51 Sia hν(s) un’identita approssimata e sia f(x) una funzioneuniformemente continua e limitata su IR. Sia u(ν, x) la funzione

u(ν, x) =∫ +∞

−∞hν(x− s)f(s) ds =

∫ +∞

−∞hν(s)f(x− s) ds .

Vale:

limν→0+

u(ν, x) = f(x) .

Il limite e uniforme su IR.

Dim. La proprieta 1. dice che l’integrale di hν(s) vale 1. Dunque, si puoscrivere

u(ν, x)− f(x) =∫ +∞

−∞hν(s)[f(x− s)− f(x)] ds

=∫ −ϵ

−∞hν(s)[f(x− s)− f(x)] ds+

∫ +∞

ϵhν(s)[f(x− s)− f(x)] ds

+∫ +ϵ

−ϵhν(s)[f(x− s)− f(x)] ds .

Il numero ϵ deve ancora determinarsi.

Si fissa un numero σ e si usa l’uniforme continuita di f su IR per scegliereϵ = ϵσ in modo tale che

|f(x− s)− f(x)| < σ s ∈ (−ϵ, ϵ) .

Le proprieta 1. e 2. implicano che l’integrale su (−ϵ, ϵ) ha modulo minore diσ per ogni ν > 0.

Fissato tale numero ϵσ si usino le proprieta 1. e 3. e la limitatezza di f suIR per trovare νσ tale che, se ν ∈ (0, νσ), ciascuno degli integrali rimanenti siain modulo minore di σ.

Page 50: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

44 CAPITOLO 2. GLI SPAZI DI BANACH

Le identita approssimate che si incontrano piu spesso in pratica si costrui-scono come segue: si assegna una funzione integrabile h(s), non negativa.Dividendola per il suo integrale, si puo assumere∫ +∞

−∞h(s) ds = 1 .

L’identita approssimata si ottiene ponendo

hν(s) =1

νh(s/ν) .

La figura 2.2 mostra i grafici di alcune delle funzioni hν(s) cosı ottenute apartire dalla funzione

1

π(1 + s2)(sinistra)

e−s2

√π

(destra).

Figura 2.2: Esempi di identita approssimate

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2−0.2

0

0.2

0.4

0.6

0.8

1

1.2

1.4

s

y

ν=1

ν=.5

ν=.3

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2−0.2

0

0.2

0.4

0.6

0.8

1

s

y

ν=1

ν=.5

ν=.3

Osservazione 52 Implicitamente abbiamo supposto che ν sia un parametrocontinuo. Talvolta ν prende valori naturali, e l’identita approssimata e unasuccessione di funzioni. In questo caso il limite per ν → 0+ si sostituisce collimite per ν → +∞.

Diciamo infine che, cosı come si introducono le identita approssimate suIR, si possono anche introdurre le proprieta approssimate su IRn. Le modifichealla definizione (e alla costruzione a partire da una data funzione positiva)sono ovvie e vengono lasciate al lettore.

Page 51: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.4. SOTTOSPAZI DI SPAZI LINEARI NORMATI 45

Veniamo ora alla dimostrazione del teorema 46.La dimostrazione del Teorema di Weierstrass e suggerita da certe conside-

razioni sull’equazione del calore, che conducono ad introdurre gli integrali

1√4πt

∫ +∞

−∞e−s

2/4tf(x− s) ds = u(t, x) . (2.13)

Come si e notato, la famiglia delle funzioni

1√4πt

e−s2/4t

e un’identita approssimata (il cui parametro si indica con t perche nelle appli-cazioni all’equazione del calore indica il tempo. Ovviamente 4t ha ora il ruolodi ν) ottenuta a partire dalla funzione

h(s) =1√πe−s

2

: ht(s) =1√4πt

h

(s2

4t

).

Si veda la figura 2.2, a destra.Sia ora f una funzione continua su [a, b]. Estendiamola in modo qualsiasi

ad una funzione continua su IR, nulla per x < a−1 e per x > b+1. Indichiamoancora con f la funzione cosı estesa.

E’ chiaro che la funzione f e uniformemente continua su IR. Sia u(t, x) lafunzione definita in (2.13). Si vede facilmente che questa funzione e continuaper t > 0 ed x ∈ IR.

Applichiamo il Teorema 51, ottenendo

f(x) = limt→0+

u(t, x) = limt→0+

1√4πt

∫ +∞

−∞e−(x−s)2/4tf(s) ds .

Ora facciamo intervenire la condizione che f e nulla per s < a − 1 e pers > b+ 1. Si ha cosı

u(t, x) =1√4πt

∫ b+1

a−1e−

(x−s)2

4t f(s) ds .

Si fissi σ > 0 e tσ tale che

|u(tσ, x)− f(x)| < σ/2 . (2.14)

Il numero tσ esiste, grazie al Teorema 51.

Page 52: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

46 CAPITOLO 2. GLI SPAZI DI BANACH

La disuguaglianza (2.14) vale per ogni x ∈ IR. Limitiamoci pero a consi-derare i valori di x in [a− 1, b+ 1]. Si rappresenti

e−s2

4tσ =+∞∑k=0

1

k!

(− s2

4tσ

)k

e la convergenza e uniforme su [a− 1, b+ 1]. Dunque, esiste Nσ tale che∣∣∣∣∣∣e− s2

4tσ −Nσ∑k=0

1

k!

(− s2

4tσ

)k∣∣∣∣∣∣ < σ√4πtσ

4(b− a)M, s ∈ [a− b− 1, b− a+ 1]

con M = max |f |.Si ha quindi:∣∣∣∣∣∣u(tσ, x)− 1√

4πtσ

∫ b+1

a−1

Nσ∑k=0

1

k!

(−(x− s)2

4tσ

)kf(s) ds

∣∣∣∣∣∣=

1√4πtσ

∣∣∣∣∣∣∫ b+1

a−1

e− (x−s)2

4tσ −Nσ∑k=0

1

k!

(−(x− s)2

4tσ

)k f(s) ds∣∣∣∣∣∣

=1√4πtσ

∣∣∣∣∣∣∫ x−a+1

x−b−1

e− r2

4tσ −Nσ∑k=0

1

k!

(− r2

4tσ

)k f(x− r) dr

∣∣∣∣∣∣ < σ/2 .

Combinando questa disuguaglianza con (2.14) si vede che la funzione f(x) siapprossima uniformemente su [a, b] mediante i polinomi

1√4πtσ

∫ b+

a−1

Nσ∑k=0

1

k!

(−(x− s)2

4tσ

)kf(s) ds .

Il teorema si estende a funzioni di n variabili, sostanzialmente con lamedesima dimostrazione. Si ricorre per questo al seguente risultato:

Teorema 53 (di Tietze) Ogni funzione continua su un compatto di IR n

ammette estensione uniformemente continua e limitata ad IR n.

Si fa quindi uso dell’identita approssimata

ht(x) =1

(4πt)n/2e

|x|24t . (2.15)

Si noti che troncando la serie della funzione e|x|nsi trovano polinomi in |x|.

Page 53: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.4. SOTTOSPAZI DI SPAZI LINEARI NORMATI 47

Osservazione 54 I punti x ∈ IR2 si possono anche leggere come punti x+ iydel piano complesso e gli argomenti precedenti possono adattarsi al caso dellefunzioni a valori complessi. Pero, gli approssimanti che si ottengono troncandola serie di Taylor dell’identita approssimata (2.15) sono polinomi in x2 + y2 enon in z = x+ iy. Non si trova quindi un’approssimazione mediante polinomidella variabile complessa z.

2.4.2 Dimostrazioni posposte

In questo paragrafo proviamo i Teoremi 47 e 48.

Dimostrazione del TEOREMA 47. Abbiamo provato che l’insieme di tutti ipolinomi e denso in C(a, b). Quest’insieme non e numerabile. Infatti i polinomisono parametrizzati dai loro coefficienti, che sono numeri reali. Consideriamopero i soli polinomi che hanno numeri razionali come coefficienti.

Ogni polinomio si approssima in modo uniforme mediante polinomi a coef-ficienti razionali; e quindi anche l’insieme dei polinomi a coefficienti razionalie denso in C(a, b). Per concludere la dimostrazione, basta notare che l’insiemedei polinomi a coefficienti razionali e numerabile come unione della famiglianumerabile di insiemi Pn, ciascuno numerabile,

Pn = polinomi di grado n e coefficienti razionali .

Dimostrazione del TEOREMA 48.Abbiamo bisogno di alcune proprieta delle funzioni integrabili secondo

Lebesgue.Sia f ∈ L1(a, b) e si definisca

g(x) =∫ x

cf(s) ds

con c ∈ [a, b]. Si prova che la funzione g(x) e continua e q.o. derivabile, conderivata q.o. uguale ad f(x).

Cio vale sia su intervalli limitati che illimitati.Supponiamo ora che (a, b) sia un intervallo limitato e che f(x) sia limitata,

|f(x)| < M .

Al variare di h, consideriamo i rapporti incrementali8

Φh(x) =g(x+ h)− g(x)

h=

1

h

∫ x+h

xf(s) ds .

8Ovviamente interessa il caso |h| piccolo. Per poter definire il rapporto incrementale perogni x ∈ (a, b), supponiamo di aver esteso f(x) ad un intervallo un po’ piu grande, peresempio estendendola con zero.

Page 54: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

48 CAPITOLO 2. GLI SPAZI DI BANACH

E’ immediato verificare che|Φh(x)| < M

e, come si e gia detto,

limh→0

Φh(x) = f(x) q.o. x ∈ (a, b) .

Dunque,limh→0

Φh(x) = f(x)

vale nella norma di Lp(a, b), per ogni p ∈ [0,+∞).Fatta questa premessa, proviamo il teorema 48.Ricordiamo che (a, b) puo non essere limitato e che f(x) puo non essere

limitata. Premettiamo

Lemma 55 Sia (a, b) un intervallo limitato e sia f ∈ Lp(a, b), 1 ≤ p < +∞.Esiste una successione (pn(x)) di polinomi che converge ad f(x) in Lp(a, b).

Dim. Fissato il numero naturale n, mostriamo come costruire il polinomiopn(x).

Se la funzione f(x) non e limitata, si determini k in modo tale che ||f(x)−f(x)||Lp(a,b) < 1/3n, con

f(x) =

f(x) se |f(x)| < kk altrimenti.

Se f(x) e limitata, sia f(x) = f(x).Introduciamo ora i rapporti incrementali

Φh(x) =1

h

∫ x+h

xf(s) ds .

Da quanto detto sopra si deduce che per ogni n esiste un valore hn di htale che

||f(x)− Φhn(x)||Lp(a,b) <1

3n.

Per ogni h la funzione Φhn(x) e continua su [a, b] (limitato e chiuso). Peril Teorema di Weierstass, esiste un polinomio pn(x) tale che

max[a,b]

|pn(x)− Φhn(x)| <1

3n(b− a)1/p

e quindi tale che

||pn(x)− Φhn(x)||Lp(a,b) <1

2n.

Page 55: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.5. LA COMPATTEZZA 49

Per questo polinomio si ha

||pn(x)− f(x)||Lp(a,b) ≤ ||pn(x)− Φhn(x)||Lp(a,b)

+||Φhn(x)− f(x)||Lp(a,b) + ||f(x)− f(x)||Lp(a,b) <1

n.

Cio completa la dimostrazione.

Torniamo ora alla dimostrazione del Teorema 48. Procediamo per gradinella dimostrazione. Introduciamo ϵ > 0 e un numero R > 0. Definiamoquindi

fR(x) =

f(x) se |x| < R0 altrimenti.

Si sa che si puo trovare R tale da avere

||f − fR||Lp(a,b) < ϵ/2 .

Fissato questo valore per R, e questa funzione fR, basta usare il Lemma 55per dedurre l’esistenza di un polinomio p(x) tale che

||fR(x)− p(x)||Lp(−R,R) < ϵ/2 .

La f(x) e quindi approssimata a meno di ϵ dalla funzionep(x) se |x| < R0 altrimenti.

Per concludere la dimostrazione e ora sufficiente imporre ad R di pren-dere valori interi e quindi approssimare i polinomi p(x) mediante polinomi acoefficienti razionali, come nella dimostrazione del Teorema 47.

2.5 La compattezza

Ricordiamo che un s.insieme K dello s.l.n. X si dice relativamente com-patto quando ogni successione (xn) a valori in K ammette s.successioni (xnk

)convergenti. L’insieme K si dice compatto quando e relativamente compattoe chiuso. Il teorema di Bolzano-Weierstrass puo riformularsi dicendo che seΦ = IR oppure Φ = IC allora ogni s.insieme limitato e chiuso di Φn e compatto.Si ricordi che questa proprieta e cruciale per la dimostrazione del teorema diWeierstrass sull’esistenza di massimi e minimo.

Sfortunatamente, l’analogo del Teorema di Bolzano-Weierstrass non valein spazi di Banach di dimensione infinita; anzi:

Page 56: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

50 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 56 Sia X uno spazio normato. Se una sfera

x | |x− x0| = ϵ

e compatta allora lo spazio ha dimensione finita.

Il Teorema 56 implica in particolare:

Corollario 57 Sia dimX = +∞. Se K e relativamente compatto, allora Knon ha punti interni.

Infatti, se K contiene punti interni esso contiene una sfera chiusa, che deveessere compatta perche ogni s.insieme chiuso di un compatto e esso stessocompatto. Cio non puo darsi se dimX = +∞.

E’ pero vero che:

Teorema 58 Se il s.insieme K di X e compatto, allora esso e limitato.

Infatti, se K e illimitato esso contiene l’immagine di una successione (xn)tale che ||xn|| → +∞; e si vede facilmente che (xn) non ammette s.successioniconvergenti.

Ricapitolando, in dimensione infinita gli insiemi compatti (rispetto allatopologia della norma) sono pochi (e cio avra conseguenze nefaste nei problemidi ottimizzazione) e difficili da caratterizzare. Di conseguenza i teoremi checaratterizzano gli insiemi compatti sono importanti. Il prototipo ed il piuutile di essi e il Teorema di Ascoli-Arzela, che caratterizza gli insiemi compattidi C(a, b) (ricordiamo che con questo simbolo si intende in particolare chel’intervallo [a, b] e limitato e chiuso).

Sia K compatto contenuto in C(a, b). Abbiamo gia notato, nel Teorema 58che K deve essere limitato; ossia deve esistere R > 0 tale che

||x|| = max[a,b]

|x(t)| < R ∀x ∈ K .

Trattandosi di limitatezza nella norma della convergenza uniforme, usa anchedire che K e uniformemente limitato.

Ricordiamo che ogni funzione x ∈ C(a, b) e uniformemente continua perche[a, b] e limitato e chiuso; ossia, per ogni ϵ > 0 esiste un numero δ, che dipendeda ϵ e dalla funzione x, tale che

|x(t′)− x(t′′)| < ϵ , ∀t′ t′′ ∈ [a, b] per cui |t′ − t′′| < δ.

Si dice che l’insieme K e equicontinuo quando δ si puo scegliere dipendente daϵ ma non dall’elemento x ∈ K; ossia:

Page 57: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.5. LA COMPATTEZZA 51

Definitione 59 Si dice che l’insieme K e equicontinuo quando per ogni

ϵ > 0 esiste δ > 0 tale che per ogni x ∈ K e per ogni t′, t′′ in [a, b] tali che|t′ − t′′| < δ si ha:

|x(t′)− x(t′′)| < ϵ .

Ovviamente, ogni insieme finito di funzioni continue e equicontinuo.Vale:

Teorema 60 (di Ascoli-Arzela) Gli insiemi relativamente compatti di C(a, b)sono tutti e soli quelli uniformemente limitati ed equicontinui.

2.5.1 Dimostrazioni posposte

Proviamo i teoremi enunciati.

Dimostrazione del TEOREMA 56. Basta mostrare una successione di elemen-ti di norma 1 priva di sottosuccessioni fondamentali. Notiamo il seguentelemma (di immediata dimostrazione) che verra utile anche in seguito:

Lemma 61 Sia (xn) una successione tale che ||xn − xm|| ≥ σ > 0 per ognicoppia n ed m. La successione (xn) non ha s.successioni fondamentali.

Per costruire una successione (xn) con le proprieta richieste dal lemma,facciamo intervenire:

Lemma 62 (di Riesz) Sia M un s.spazio chiuso di X, diverso da X. Perogni ϵ > 0, esiste un elemento x ∈ X di norma 1, che dista da M piu di 1− ϵ.

Dim. Ricordiamo che la distanza d(x,M) di x da M e

d(x,M) = inf||x−m|| | m ∈M .

Essendo M = X, ed M chiuso, esiste x1 =M a distanza positiva da M :

d(x1,M) = d > 0 .

La definizione di distanza mostra che per ogni σ > 0 esiste vσ ∈M tale che

||x1 − vσ|| < d(1 + σ) .

Siay = x1 − vσ .

Ovviamente,δ = ||y|| = ||x1 − vσ|| ≤ d(1 + σ)

Page 58: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

52 CAPITOLO 2. GLI SPAZI DI BANACH

e inoltre d(y,M) = d(x1,M) perche vσ ∈M ; ossia

d(y,M) = d(x1,M) = d ≥ 1

1 + σ||x1 − vσ|| =

1

1 + σ||y|| .

In particolare,||y|| ≤ d(1 + σ) . (2.16)

Scegliamo ora

x0 =y

||y||e notiamo che

d(x0,M) = d

(y

||y||,M

)= inf

∣∣∣∣∣∣∣∣∣∣ y||y|| −m

∣∣∣∣∣∣∣∣∣∣ | m ∈M

= inf 1

||y||||y − (m||y||) || | m ∈M = inf 1

||y||||x1 − (vσ +m||y||) || | m ∈M

= inf 1

||y||||x1 −m|| | m ∈M =

d

||y||>

1

1 + σ.

L’ultima disuguaglianza discende da (2.16).L’asserto segue se si e preventivamente scelto σ tale che 1

1+σ> 1− ϵ.

E’ ora facile costruire una successione di elementi di norma 1, priva dis.successioni convergenti: si sceglie x1 = 0 qualsiasi e si definisce

M1 = spanx1 = tx1 | t ∈ Φ .

Si sceglie quindi x2, di norma 1, con

d(x2,M1) >1

2.

In particolare vale ||x2 − x1|| > 1/2.Definiti x1,. . . , xk, si sceglie xk+1 di norma 1, distante almeno 1/2 dallo

spazio generato dai vettori x1,. . . , xk.Essendo dimX = +∞, X = span x1 , . . . xk e quindi questa costruzione

conduce ad una successione (xn) i cui elementi distano due a due almeno 1/2,e quindi priva di s.successioni convergenti.

Dimostrazione del TEOREMA 58. La dimostrazione e analoga a quella chevale in dimensione finita: se A non e limitato, per ogni n esiste an ∈ A, con||an|| > n. La successione (an) e priva di s.successioni convergenti.

Dimostrazione del TEOREMA 60. Proviamo la parte necessaria. Si e giadetto che se K e compatto allora deve essere limitato. Proviamo che se ecompatto in C(a, b) allora esso e anche equicontinuo. Si usa il lemma seguente:

Page 59: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.5. LA COMPATTEZZA 53

Lemma 63 Sia K compatto in uno spazio di Banach X e sia ϵ > 0. Esisteun insieme finito di elementi k1,. . .ks di K, tali che

K ⊆∪B(ki, ϵ) , B(ki, ϵ) = x ∈ X | ||x− ki|| < ϵ .

Dim. per assurdo sia K compatto e sia ϵ0 > 0 un numero tale che la proprietanon valga. Scelto un qualsiasi x1 ∈ K, B(x1, ϵ0) non copre K; e quindi esistex2 ∈ K che dista da x1 piu di ϵ0. Ancora perche ϵ0 non soddisfa alla proprietadetta nel lemma, B(x1, ϵ0) ∪ B(x2, ϵ0) non copre K. Dunque esiste x3 in Kche dista piu di ϵ0 sia da x1 che da x2.

Iterando questo procedimento, si trova una successione (xn) i cui puntidistano l’uno dall’altro almeno ϵ0, e quindi priva di s.successioni convergenti.Cio contrasta con la compattezza di K.

Proviamo ora che l’insieme K, compatto in X = C(a, b), e equicontinuo.Si fissi ϵ > 0 e si fissino k1, . . . , kr tali che

K ⊆∪B(ki, ϵ) .

Ciascuna delle funzioni ki e una funzione uniformemente continua e quindil’insieme delle ki, che sono in numero finito, e equicontinuo: esiste δ > 0 taleche se |t′ − t′′| < δ allora |ki(t′)− ki(t

′′)| < ϵ per ogni i.Sia ora x ∈ K qualsiasi e ki0 una funzione dell’insieme k1 , . . . , kr che

dista da x meno di ϵ. Valutiamo:

|x(t′)− x(t′′)| ≤ |x(t′)− ki0(t′)|+ |ki0(t′)− ki0(t

′′)|+ |ki0(t′′)− x(t′′)| < 3ϵ .

Questa disuguaglianza vale per |t′ − t′′| < δ e per ogni x ∈ K. Notando che δnon dipende da x ∈ K segue l’equicontinuita.

Proviamo ora la condizione sufficiente: proviamo che se K ⊆ C(a, b) e sialimitato che equicontinuo allora K e relativamente compatto. Per questo, sce-gliamo una qualsiasi successione (xn) in K e diamo un metodo per costruirneuna s.successione convergente. Per fare cio, fissiamo prima di tutto una suc-cessione iniettiva (tn) la cui immagine e densa in [a, b]. Procediamo ora perpassi: consideriamo la successione di numeri (xn(t1)). Questa e una successio-ne di numeri limitata perche K e limitato. Dunque ammette una s.successioneconvergente. Indichiamo col simbolo x(1)n (t1) questa successione di numeri econsideriamo la successione di funzioni (x(1)n ). Valutiamo queste funzioni nelpunto t2 ottenendo la successione di numeri (x(1)n (t2)). Estraiamo da questauna successione convergente, che indichiamo col simbolo (x(2)n (t2)). Consideria-mo quindi la successione di funzioni (x(2)n ) e la successione di numeri (x(2)n (t3)).Iteriamo il procedimento.

Page 60: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

54 CAPITOLO 2. GLI SPAZI DI BANACH

In questo modo si definiscono induttivamente le successioni di funzioni(x(1)n ), (x(2)n ),. . . , ciascuna delle quali e s.successione delle precedenti. Dunque,la successione (x(k)n (tr)) e una successione di numeri che converge per ognir ≤ k. Inoltre, (x(1)n ) e s.successione della (xn).

Consideriamo ora la tabella seguente:

x(1)1 x

(1)2 x

(1)3 x

(1)4 x

(1)5 . . .

x(2)1 x

(2)2 x

(2)3 x

(2)4 x

(2)5 . . .

x(3)1 x

(3)2 x

(3)3 x

(3)4 x

(3)5 . . .

x(4)1 x

(4)2 x

(4)3 x

(4)4 x

(4)5 . . .

......

......

...

Si ha:

• in ogni casella compare una delle funzioni della successione;

• gli elementi della prima riga costituiscono una s.successione della (xn);

• ciascuna delle successive righe contiene gli elementi di una s.successionedi quella che compare alla riga precedente;

• se si calcolano gli elementi della riga i–ma per t = tj, con j ≤ i, si trovauna successione di numeri che converge.

Queste proprieta implicano che la successione diagonale (x(n)n ) e una suc-cessione di funzioni con questa proprieta: le successioni di numeri (x(n)n (tk))convergono, per ogni k.

Notiamo che per ora abbiamo usato la sola limitatezza dell’insieme K.Usiamo ora l’equicontinuita per provare che la successione diagonale e fonda-mentale (e quindi convergente in C(a, b) che, come si e detto, e uno spaziocompleto).

Sia ϵ > 0. Si vuol provare l’esistenza di Nϵ tale che se n, m sono maggioridi Nϵ allora vale

||xn − xm|| < 3ϵ ossia |xn(t)− xm(t)| < 3ϵ ∀t ∈ [a, b].

Si fissi δ > 0 tale che se |t′ − t′′| < δ allora ogni x ∈ K verifica

|x(t′)− x(t′′)| < ϵ .

Page 61: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 55

Rappresentiamo l’intervallo [a, b], che e limitato, come unione finita di intervallidi lunghezza minore di δ:

[a, b] =ν∪s=1

[as, bs] , bs − as < δ .

Per ciascun intervallo [as, bs], fissiamo uno dei punti della successione (tn) chegli appartiene. Indichiamolo col simbolo ts.

Sia t ∈ [a, b] qualsiasi e sia s tale che t ∈ [as, bs]. Valutiamo, usandol’equicontinuita,

|x(n)n (t)− x(m)m (t)| ≤ |x(n)n (t)− x(n)n (ts)|+ |x(n)n (ts)− x(m)

m (ts)|+|x(m)

m (ts)− x(m)m (t)| ≤ 2ϵ+ |x(n)n (ts)− x(m)

m (ts)| .

Per ogni s, esiste Ns tale che, se n, m sono maggiori di Ns, vale

|x(n)n (ts)− x(m)m (ts)| < ϵ

ed i punti ts sono in numero finito e non dipendono dal punto t. Dunque, ladimostrazione si completa scegliendo Nϵ = maxN1 , . . . , Nν.

Il procedimento di estrarre la successione diagonale, dovuto a Cantor, vasotto il nome di metodo diagonale di Cantor.

2.6 Operatori lineari

Siano X ed Y due s.l.n-ti e sia f una trasformazione da X in Y . Non si richiedeche il dominio di f sia tutto X. Per dire che f opera tra due s.l.n-ti, si diceche f e un operatore.

Si chiamano funzionali le trasformazioni che operano da X, s.l.n. sulcampo scalare Φ, nel campo scalare Φ stesso.

Siano ora X ed Y due spazi lineari sul medesimo campo scalare. Si diceche f e un operatore lineare da X in Y quando

• domf e un sottospazio (non si richiede chiuso) di X;

• vale f(αx + βy) = αf(x) + βf(y) per ogni x, y in X e per ogni α, β inΦ.

Quando si lavora con operatori lineari, invece della notazione f(x) usaindicare l’operatore con una lettera maiuscola, per esempio F , A; e scrivereFx, Ax invece di F (x), A(x); ossia si usa la “notazione moltiplicativa” notadall’Algebra lineare.

Studiamo ora le proprieta degli operatori lineari.

Page 62: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

56 CAPITOLO 2. GLI SPAZI DI BANACH

2.6.1 Proprieta geometriche degli operatori lineari

Si ricordi che il grafico di una trasformazione y = f(x) da un insieme X adun insieme Y e l’insieme delle coppie

(x, y) | y = f(x) .

Invece, l’immagine ed il nucleo9 sono rispettivamente

im f = y | y = f(x) ⊆ Y , ker f = x | f(x) = 0 ⊆ X .

Si provi per esercizio:

Teorema 64 Siano X ed Y due s.l.n-ti e sia f una trasformazione da X inY . Vale:

• la trasformazione f e lineare se e solo se il suo grafico e un s.spazio diX × Y ;

• se f e lineare sia la sua immagine che il suo nucleo sono s.spazi.

Notiamo ora:

Teorema 65 Un operatore lineare da X in Y che ha immagine limitata eidenticamente zero.

Dim. Infatti, l’immagine di un operatore lineare e un sottospazio: questo elimitato se e solo se e il sottospazio 0.

Col simbolo B(x0, r) indichiamo la palla

B(x0, r) = x | ||x− x0|| ≤ r .

Lemma 66 Sia x0 ∈ domA. Vale

B(x0, r) ∩ (domA) = x0 +B(0, r) ∩ (domA) .

Dim. Infatti, con L = domA,

B(x0, r) ∩ L = x ∈ L | ||x− x0|| < r .9il termine “nucleo” per indicare l’insieme degli zeri di una funzione si usa solamente se

la funzione e lineare.

Page 63: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 57

Sia x ∈ B(x0, r) ∩ L. Essendo x0, x nel sottospazio L, y = x − x0 e in L everifica ||y|| < r; ossia,

x = x0 + y , y ∈ B(0, r) ∩ L .

Dunque, B(x0, r)∩L ⊆ x0+B(0, r)∩L. L’inclusione opposta si vede in modoanalogo.

Siano x0 ed x1 due punti di uno s.l.n. X. Il segmento di estremi x0 ed x1e per definizione l’insieme dei punti

x = tx0 + (1− t)x1 , t ∈ [0, 1] .

Sia K ⊆ X un insieme. Si dice che K e convesso quando il segmento cheunisce due qualsiasi punti di K e contenuto in K; ossia quando

x0 , x1 ∈ K , t ∈ [0, 1] =⇒ tx0 + (1− t)x1 ∈ K .

Ovviamente, ogni palla e un insieme convesso. Invece, la superficie sferica

S(x0, r) = x | ||x− x0|| = r

non e convessa.Gli insiemi convessi di IR sono tutti e soli gli intervalli (limitati o meno).Il risultato seguente e di ovvia dimostrazione:

Teorema 67 Sia A lineare da X in Y . Se K ⊆ domA e convesso in X, alloraAK e convesso in Y .

Le palle centrate in 0 sono insiemi convessi che hanno in piu una proprietadi simmetria: se x ∈ B(0, r) allora αx ∈ B(0, r) per ogni α tale che |α| ≤ 1.

In generale, un insieme K si dice equilibrato se

|α| ≤ 1 , x ∈ K =⇒ αx ∈ K .

Si dice che K e equilibrato rispetto ad un suo punto x0 se

K = x0 +K , con K insieme equilibrato.

Si vede immediatamente:

• un insieme di IC equilibrato rispetto a z0 e che contiene z′ contiene anche

il disco di centro z0 e raggio |z′ − z0|. Affermazione analoga vale per gliinsiemi equilibrati di IR, sostituendo i dischi con gli intervalli simmetricirispetto a z0. In particolare:

Page 64: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

58 CAPITOLO 2. GLI SPAZI DI BANACH

Lemma 68 Un insieme equilibrato di IR oppure di IC che e illimitato euguale, rispettivamente, a IR oppure a IC.

• Se A e un operatore lineare da X in Y e se K e equilibrato in X, alloraAK e equilibrato in Y ; se K e equilibrato rispetto ad x0 allora AK eequilibrato rispetto ad Ax0.

Torniamo a considerare un operatore lineare A da uno s.l.n. X in un s.l.n.Y e consideriamo le palle B(0, 1), B(0, r′) e B(x0, r) di X. Supponiamo disapere che x0 ∈ domA. Si ha:

AB(0, r) = r(AB(0, 1)) , AB(x0, r) = Ax0 + r(AB(0, 1)) .

Di conseguenza,

Lemma 69 Un operatore lineare A che e limitato su una palla e limitato suogni altra palla.

D’altra parte, con S(0, 1) = x | ||x|| = 1,

se x ∈ B(0, r) allora x = ||x||(

x||x||

)con x

||x|| ∈ S(0, 1).

Dunque:

Lemma 70 Vale:

sup||x||X≤1

||Ax||Y = sup||x||X=1

||Ax||Y .

In particolare, un operatore lineare A e limitato su una palla se e solo se elimitato sulla sfera S(0, 1).

Un operatore lineare che e limitato su una palla, non puo “crescere troppovelocemente”. Infatti:

Teorema 71 Sia A lineare da X in Y e sia

MA = sup||x||X≤1

||Ax||Y < +∞ .

Per ogni x ∈ X vale||Ax||Y ≤MA||x||X . (2.17)

Viceversa, se esiste M tale che ||Ax||Y ≤M ||x||X allora l’operatore lineare Ae limitato su ogni palla.

Page 65: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 59

Dim. Il viceversa e ovvio e quindi basta provare che se A e limitato su B(0, 1),allora vale la disuguaglianza (2.17). Basta considerare il caso x = 0. Se x = 0,x/||x|| ∈ B(0, 1) e quindi

1

||x||||Ax|| =

∣∣∣∣∣∣∣∣∣∣A x

||x||

∣∣∣∣∣∣∣∣∣∣ ≤MA .

Questa e la disuguaglianza cercata.

Dunque, se A e limitato su una palla, per esso vale

lim||x||X→0

||Ax||Y = 0

ed e quindi continuo in 0. Viceversa, il teorema della limitatezza locale (ap-plicato alla funzione a valori reali x → ||Ax||) mostra che se A e continuoin 0 allora e limitato su una palla B(0, r), e quindi su ogni altra palla. Valedunque:

Teorema 72 Un operatore lineare A da X in Y e continuo in 0 se e solo se elimitato su una qualsiasi palla; equivalentemente, se e solo se esiste un numeroM per cui vale

||Ax||Y ≤M ||x||X .

Cio suggerisce un punto di partenza per lo studio della continuita deglioperatori lineari. Prima di fare cio, ricordiamo, dal Teorema 65 che l’unicooperatore lineare e limitato da X in Y e quello identicamente zero; e quindi iltermine “limitato” riferito ad operatori lineari rimane libero, e puo essere usatocon un significato diverso. Chiamiamo quindi operatore lineare limitatoun operatore lineare che e limitato su una (qualsiasi) palla; ossia uno per ilquale vale la disuguaglianza (2.17). Dunque:

Teorema 73 Un operatore lineare A da X in Y e continuo in 0 se e solo see limitato.

2.6.2 La continuita degli operatori lineari

E’ noto:

Teorema 74 Se dimX < +∞ e se la trasformazione A e lineare da X in Yallora A e continua.

Gli esempi seguenti mostrano che, se X ha dimensione infinita, allora esi-stono sia operatori lineari continui che non continui. Un esempio banale dioperatore lineare continuo e quello che ad ogni elemento di X associa lo 0 diY , ossia il funzionale nullo. Un esempio meno banale e il seguente:

Page 66: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

60 CAPITOLO 2. GLI SPAZI DI BANACH

Esempio 75 Sia X = C(a, b), Y = Φ e sia

domA = X , Ax = x(a) .

Essendo||Ax− Ay||Φ = |x(a)− y(a)| ≤ ||x− y||X

si vede che A e addirittura uniformemente continuo.

Mostriamo ora un esempio di funzionale lineare non continuo.

Esempio 76 Su C(−1, 1) si consideri l’operatore lineare Ψ definito da

domΨ = x derivabili in 1 , Ψx = x′(1) .

Quest’operatore, chiaramente lineare, non e continuo. Per mostrare cio siconsideri la successione delle funzioni xn

xn(t) = tn/n .

Da ||xn|| < 1/n segue che

limxn = x0 = 0

mentre per ogni n si ha:Ψxn = 1 ;

ossia,limΨxn = Ψx0

e quindi Ψ non e continuo.

Si noti che l’esempio precedente mostra che anche funzionali lineari im-portanti per le applicazioni possono essere discontinui; e, l’esempio specificospiega perche il problema della derivazione numerica e assai delicato.

Esempi di operatori lineari, rispettivamente continui e non continui, tras.l.n-ti ambedue di dimensione infinita sono i seguenti:

Esempio 77 Sia X = Y = C(a, b) e sia A con dominio uguale ad X,

(Ax)(t) =∫ t

ax(s) ds .

E’

||Ax− Ay||Y = max[a,b]

∣∣∣∣∫ t

a[x(s)− y(s)] ds

∣∣∣∣ ≤ (b− a) · ||x− y||X ;

Page 67: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 61

e nuovamente si vede che l’operatore A e uniformemente continuo.Un esempio di operatore lineare discontinuo e il seguente:Sia X = L2(0, 1), Y = C([0, 1]). Il dominio di A sia lo spazio lineare delle

classi di equivalenza dotate di rappresentante continuo. Sia

Ax = y , y(t) ≡ x(1) .

Le (classi di equivalenza delle) funzioni

xn(t) = tn

costituiscono una successione in L2(0, 1), convergente a 0; mentre, per ogni x,

Axn ≡ 1 .

Passiamo ora a studiare le proprieta degli operatori lineari che sono anchecontinui. Abbiamo notato che gli operatori lineari continui degli esempi pre-cedenti sono anche uniformemente continui. Come ora vedremo, e questo unfatto generale.

Teorema 78 siano X ed Y due s.l.n-ti e sia A lineare da X in Y . Vale:

• l’operatore A e continuo in ciascun punto del suo dominio se e solo se econtinuo in un punto;

• l’operatore A e continuo se e solo se e uniformemente continuo;

• l’operatore A e continuo se e solo se e limitato.

Dim. Proviamo che se A e continuo in un punto x0 allora esso e continuo inqualunque altro punto x1. Ovviamente, sia x0 che x1 devono appartenere aldominio di A. Sia ϵ > 0 e sia B(x0, δ) tale che

x ∈ B(x0, δ) ∩ domA =⇒ ||Ax− Ax0|| < ϵ . (2.18)

Sia ora x ∈ B(x1, δ) ∩ domA. Usando il Lemma 66 si vede che x puorappresentarsi come

x = x1 + (x′ − x0) , con x′ = (x− x1) + x0 ∈ domA ∩B(x0, δ) .

Dunque,

||Ax−Ax1|| = ||A(x1− (x′−x0))−Ax1|| = ||A(x′−x0)|| = ||Ax′−Ax0|| < ϵ .

Page 68: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

62 CAPITOLO 2. GLI SPAZI DI BANACH

L’ultima disuguaglianza segue da (2.18).Cio prova la continuita in x1 e prova anche che il numero δ nel punto x1 e

il medesimo usato in x0. Essendo x1 arbitrario, si ha la continuita uniforme.In particolare, la continuita in un qualsiasi punto x0 equivale alla continuita

in 0, e quindi alla limitatezza, si veda il Teorema 73.

Frequentemente conviene verificare la continuita di un operatore verifican-do direttamente che e limitato.

Come si e visto, l’operatore lineare A e continuo se e solo se

MA = sup||x||X≤1

||Ax||Y < +∞ .

Ci si puo chiedere se l’estremo superiore sia in realta un massimo. E’ facileimmaginare che l’estremo superiore non sara un massimo se il dominio di Anon e chiuso. Pero:

Teorema 79 Esistono s.l.n-ti completi X ed operatori lineari continui A condominio uguale ad X e tali che

max||Ax||Y | ||x||X ≤ 1

non esiste.

Dim. Si scelga X = L1(0, 1) ed il funzionale

Lx =∫ 1

0sx(s) ds .

E’ immediato verificare che questo funzionale e continuo e che

||x|| ≤ 1 =⇒ |Lx| ≤ 1 ;

anzi, si vede chesup||Lx||Y , | ||x||X ≤ 1 = 1 .

Infatti, se

xn(t) =

0 se 0 ≤ t ≤ 1− 1/nn se 1− 1

n≤ t ≤ 1

allora:limLxn = 1 .

Mostriamo che se ||x||L1(0,1) ≤ 1 allora non vale Lx = 1. Sia infatti x tale cheLx = 1. In questo caso x non e zero q.o. e quindi esiste δ ∈ (0, 1) tale che∫ δ

0|x(s)| ds = α > 0 .

Page 69: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 63

sottolineiamo che il numero δ si puo scegliere minore di 1. Si scriva ora:

1 =∫ 1

0sx(s) ds =

∫ δ

0sx(s) ds+

∫ 1

δsx(s) ds

≤ δ∫ δ

0|x(s)| ds+

∫ 1

δ|x(s)| ds

=∫ 1

0|x(s)| ds− (1− δ)

∫ δ

0|x(s)| ds

ossia ∫ 1

0|x(s)| ds ≥ 1 + (1− δ)α .

Dunque, per tale funzione x si ha ||x|| > 1 e quindi il massimo sull’insiemex | ||x|| ≤ 1 non viene raggiunto.

Infine, introduciamo due operatori particolari, ed i loro simboli: col simbolo0, riferito ad operatori che operano daX in Y , si intende l’operatore nullo,ossia quello che associa ad ogni x ∈ X l’elemento 0 di Y . Col simbolo I,riferito ad operatori da X in X, si intende l’operatore identita, ossiaquell’operatore che ad ogni x di X associa se stesso:

Ix = x .

Osservazione 80 I punti che non appartengono al dominio di un operato-re non influiscono sulla proprieta di continuita. Quindi, sostituendo X condomA, avremmo potuto assumere che l’operatore A fosse definito su tutto lospazio, evitando alcune complicazioni. Abbiamo preferito la via precedenteperche di fatto molti degli operatori che si incontrano in pratica hanno sola-mente dominio denso e talvolta e effettivamente necessario tenere conto di cio,si veda il Teorema 86.

2.6.3 Funzionali lineari continui ed iperpiani

Proviamo:

Teorema 81 Sia Ψ un funzionale lineare definito su X non identicamentenullo, continuo o meno. Il suo nucleo ammette complementare di dimensio-ne 1.

Dim. Sia x0 tale che Ψx0 = 0. Si noti che per ogni x ∈ X

nx = x− x0Ψx

Ψx0∈ kerΨ .

Page 70: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

64 CAPITOLO 2. GLI SPAZI DI BANACH

Ogni x ∈ X si rappresenta come

x = nx + αxx0 , αx =Ψx

Ψx0.

Questa rappresentazione e unica perche se si ha anche

x = n′x + α′

xx0

allora sottraendo si trova

0 = (nx − n′x) + (αx − α′

x)x0 .

Applicando il funzionale Ψ ai due membri si trova

0 = (αx − α′x)Ψx0

e quindi αx = α′x, perche Ψx0 = 0. E dunque si ha anche nx = n′

x.Cio prova che βx , β ∈ IC e uno spazio complementare di kerΨ.

Osservazione 82 Il teorema precedente non richiede la completezza di X enemmeno richiede la chiusura di kerΨ. Cio nonostante, asserisce che kerΨ haun complementare di dimensione 1, e quindi chiuso. Mostriamo su un esempiola costruzione di tale complementare, nel caso in cui kerΨ non sia chiuso. SiaX lo s.l.n. delle funzioni continue su [−1, 1] e derivabili su (−1, 1), dotato dellanorma del massimo. Questo spazio non e completo. Sia

Ψx = x′(0) .

Il funzionale Ψ e ovunque definito, e non e continuo, come facilmente si vederiadattando gli argomenti presentati nell’esempio 76.

Il nucleo di Ψ e l’insieme delle funzioni di C1(−1, 1) la cui derivata e nullain 0. Non e difficile mostrare che questo spazio lineare e denso in C(−1, 1) equindi in X.

Essendo kerΨ = 0, segue che kerΨ non e denso in X. Cio nonostanteammette complementare chiuso: ogni x ∈ X si rappresenta in modo unicocome

x(t) = [x(t)− x′(0)t] + x′(0)t

somma di un elemento di kerΨ e di un multiplo di x0, x0(t) = t /∈ kerΨ.

Se Ψ e una qualsiasi trasformazione continua tra s.l.n-ti X ed Y , l’insie-me degli zeri di Ψ e chiuso, come controimmagine continua di un chiuso. Ilviceversa vale nel caso particolare dei funzionali lineari:

Page 71: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 65

Teorema 83 Sia Ψ un funzionale lineare su uno s.l.n. X. Esso e continuo see solo se il suo nucleo e chiuso.

Dim. Se il nucleo di Ψ e tutto X allora Ψ e costante e quindi continuo.Altrimenti, sia x0 /∈ kerΨ. Dato che kerΨ e chiuso e diverso da X, esisteδ > 0 tale che

δ = dist(x0, kerΨ) = inf||x− x0|| , x ∈ kerΨ .

Sia B(x0, δ/2) = x | ||x−x0|| < δ/2. L’immagine ΨB(x0, δ/2) di B(x0, δ/2)e un insieme equilibrato (rispetto a Ψ(x0)) in IR oppure in IC , che non contiene0, perche B(x0, δ/2) non interseca kerΨ. Per il Lemma 68, ΨB(x0, δ/2) elimitato, e quindi Ψ e continuo.

Si chiamano iperpiani i sottospazi chiusi di codimensione 1 e gli insiemiche si ottengono da essi per traslazione. Dunque:

Teorema 84 Gli iperpiani sono tutti e soli gli insiemi della forma

H = x | Ψx = c

ove Ψ e un funzionale lineare e continuo.

Dim. Se ψ e un funzionale lineare continuo, il suo nucleo e chiuso, comecontrimmagine dell’insieme chiuso 0.

Viceversa, sia N un spazio lineare chiuso di codimensione 1. Costruiamoun funzionale lineare Ψ che ha N per nucleo, e che quindi e continuo per ilTeorema 83.

Essendo N di codimensione 1, esiste x0 /∈ N tale che ogni elemento di Xsi rappresenta in modo unico come

x = nx + αxx0 , n ∈ N .

Il funzionale cercato e quello che ad x associa il numero αx.

Ossia, gli iperpiani sono gli insiemi di livello di funzionali lineari e continui.Se Ψ e un funzionale lineare continuo, definiamo i due semispazi

H+ = x | Ψ(x) > c , H− = x | Ψ(x) < c .

I due semispazi H+ ed H− sono ovviamente disgiunti (perche le disugua-glianze sono strette). Le loro chiusure, che si chiamano anche semispazi chiusi,hanno in comune i punti dell’iperpiano x | Ψ(x) = c.

Page 72: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

66 CAPITOLO 2. GLI SPAZI DI BANACH

E’ opportuno notare che le notazioni H+ ed H− non hanno significato in-trinseco. Infatti, il funzionale Ψ che il teorema 84 associa ad H non e unico.Se, per esempio, c = 0, allora si identifica lo stesso iperpiano H sia col funzio-nale Ψ che col funzionale −Ψ; e lo scambio di Ψ con −Ψ scambia tra di loro idue semispazi.

Notiamo infine che il teorema 83 vale per i funzionali. Non vale per genericioperatori lineari, come mostra l’esempio seguente.

Esempio 85 Sia X = Y = C(0, 1) e sia

domA = C1(0, 1) , Ax = x′ .

Argomenti analoghi a quelli visti all’esempio 76 mostrano che A non e continuo.Il suo nucleo e il s.spazio i cui elementi sono le funzioni costanti, e quindi echiuso nonostante che l’operatore A non sia continuo.

Notazioni

In pratica quando Ψ e un funzionale lineare e continuo su X, invece di scrivereΨ(x) per indicare il valore preso da Ψ nel punto x, si scrive

⟨⟨Ψ, x⟩⟩

ossia⟨⟨Ψ, x⟩⟩ = Ψ(x) .

Avremo modo di vedere la comodita di questa notazione. Va notato esplici-tamente che il simbolo del funzionale lineare viene scritto sulla sinistra, cosıcome sulla sinistra compare nella notazione Ψ(x). Insistiamo su questo perchein alcuni libri esso si trova scritto sulla destra, ossia si trova scritto ⟨⟨x,Ψ⟩⟩invece di ⟨⟨Ψ, x⟩⟩. Ci sono buone ragioni per l’uso di ambedue le notazioni10.

Lo spazio lineare di tutti i funzionali lineari e continui definiti su X sichiama lo spazio duale di X, e si indica col simbolo X∗ oppure X ′.

2.6.4 Lo spazio L(X,Y )

Siano X ed Y due s.l.n-ti ed A, B due operatori lineari da X in Y . Definendo

dom(A+B) = (domA) ∩ (domB) , (A+B)x = Ax+Bx ,

10In realta la notazione comunemente usata e ⟨·, ·⟩. Noi usiamo la notazione ⟨⟨·, ·⟩⟩ perchela notazione ⟨·, ·⟩ si usa anche per indicare i “prodotti interni” nel contesto degli spazi diHilbert. Dato che vedremo una relazione tra funzionali lineari e prodotti interni, e opportunoessere precisi nel distinguere gli uni dagli altri.

Page 73: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 67

si ottiene chiaramente un operatore lineare A+B; ma in generale dom(A+B),domA e domB sono diversi e quindi non e possibile dare una struttura dispazio lineare all’insieme di tutti gli operatori lineari da X in Y . Per esempio,B+(−B) non e in generale l’operatore 0, perche l’operatore 0 e definito su Xmentre B + (−B) e solo definito su domB; e quindi A + B + (−B) non e, ingenerale, l’operatore A. Se pero ci si limita a considerare soltanto gli operatorilineari e continui si puo ottenere di piu. Vale infatti:

Teorema 86 Sia A un operatore lineare e continuo da X in Y . Se Y e com-pleto allora l’operatore A ammette un’unica estensione continua alla chiusuradel suo dominio.

Dim. Presentiamo i punti salienti della dimostrazione (del tutto analoga aquella che si usa per costruire l’estensione per continuita di funzioni reali), permostrare il ruolo della completezza di Y .

Se x0 e un punto della chiusura del dominio di A, esiste una successione(xn) convergente ad x0, xn ∈ domA (si noti che se x0 ∈ domA allora si puoscegliere xn = x0 per ogni n).

Per la continuita di A si ottiene

||Axn − Axm||Y = ||A(xn − xm)||Y ≤M ||xn − xm||X . (2.19)

La successione (xn) e fondamentale in X, essendo per ipotesi convergente.Dunque, anche la successione (yn), yn = Axn e fondamentale, pero nello spazioY . Essendo Y completo, si ha

limAxn = y0 .

Si definisce quindiAx0 = y0.

Se (x′n) e una seconda successione convergente ad x0, vale

||Axn − Ax′n||Y ≤M ||xn − x′n||X → 0

e quindilimAxn = limAx′n ;

ossia il valore y0 dipende solo da x0, e non dalla particolare successione (conver-gente ad x0) scelta per calcolarlo. Dunque l’operatore A che abbiamo costruitoe un operatore univoco.

Ovviamente, A estende A: se x0 ∈ domA, scegliendo xn = x0 per ogni n sivede che

Ax0 = Ax0 .

Page 74: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

68 CAPITOLO 2. GLI SPAZI DI BANACH

Si prova facilmente che l’operatore A e lineare, ed e limitato.Lasciamo per esercizio la dimostrazione della linearita e proviamo la limi-

tatezza: se xn → x0 ed Axn → y0,

||Ax0||Y = lim ||Axn||Y ≤M lim ||xn||X =M · ||x0||X (2.20)

(si ricordi che la norma e continua).

Ricapitolando, A e (l’unica) estensione continua di A alla chiusura del suodominio. In particolare, se il dominio di A e denso in X, allora A e definitosu X.

Naturalmente, in pratica identificheremo A con A (usando il simbolo piusemplice A per ambedue gli operatori).

Da ora in poi, lavorando con operatori lineari e continui, assumeremo diaverli estesi per continuita alla chiusura del dominio; e se non diversamentedetto, assumeremo che il dominio sia X. Lavorando con operatori definiti suX, sia A+B che αA (definito da (αA)x = α(Ax) per ogni x) hanno dominioX e sono continui. Dunque, l’insieme degli operatori lineari continui su X euno spazio lineare. Cio che e piu importante, esso puo essere dotato di norma,come segue:

||A|| = sup||x||X≤1

||Ax||Y . (2.21)

Si lascia al lettore la facile verifica che quella appena definita e una norma.Conviene notare una conseguenza utile della definizione (2.21):

Corollario 87 Per ogni x ∈ X vale:

||Ax||Y ≤ ||A|| · ||x||X . (2.22)

Se anche Z e uno s.l.n. completo, e B e lineare e continuo da Y a Z, alloravale

||BA|| ≤ ||B|| · ||A|| . (2.23)

Dim. Infatti, se ||ξ||X ≤ 1, allora vale ||Aξ||Y ≤ ||A||. Se x = 0 alloraξ = x/||x||X ha norma 1 e quindi

||A|| ≥ ||Aξ||Y =1

||x||X· ||Ax||Y

ossia la (2.22).La (2.22) mostra che:

||BAx|| ≤ ||B|| · ||Ax||Y ≤ ||B|| · ||A|| · ||x||X .

Page 75: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 69

Prendendo l’estremo superiore per ||x||X ≤ 1, si trova la (2.23).

La disuguaglianza (2.23) nel caso in cui Z = Y = X mostra

||A2|| ≤ ||A||2

e, piu in generale,||An|| ≤ ||A||n .

Conviene mostrare subito un modo equivalente per il calcolo di ||A||:

Teorema 88 Vale:

||A|| = minM | ||Ax||Y ≤M ||x|| . (2.24)

Dim. Indichiamo con M0 il numero

M0 = infM | ||Ax||Y ≤M ||x||

e proviamo che M0 = ||A||, ossia che

M0 = sup||x||X≤1

||Ax||Y .

Cio in particolare mostra che l’estremo inferiore e un minimo.La (2.22) implica che M0 ≤ ||A||. Per mostrare la disuguaglianza opposta,

fissiamo δ > 0 arbitrario. Vale, per ogni x,

||Ax||Y ≤ (M0 + δ) · ||x||X

e quindi, se ||x||X ≤ 1,

||Ax||Y ≤ (M0 + δ) · ||x||X ≤M0 + δ .

Dunque, la disuguaglianza||A|| ≤M0 + δ

vale per ogni δ > 0. Passando all’estremo inferiore rispetto a δ si trova

||A|| ≤M0 (2.25)

e quindi l’uguaglianza (2.24).

Possiamo ora tornare a considerare la diseguaglianza (2.20). Essa puo orascriversi

||Ax0|| ≤M ||x0|| M = sup||x||≤1 x∈domA

||Ax||

ossia||A|| ≤M .

Pero, A estende A e quindi ||A|| ≥M . dunque:

Page 76: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

70 CAPITOLO 2. GLI SPAZI DI BANACH

Corollario 89 La norma dell’operatore A, estensione per continuita di A (siveda il Teorema 86), e uguale alla norma di A:

||A|| = sup||x||≤1

||Ax|| = sup||x||≤1 x∈domA

||Ax|| = ||A|| .

Ossia, il calcolo della norma di un operatore lineare continuo definito su Xpuo effettuarsi a partire da una sua restrizione ad un sottospazio denso in X.

Si lascia per esercizio di provare la seguente ulteriore caratterizzazione di||A||:

Teorema 90 Vale:

||A|| = sup||x||=1

||Ax||Y = supx =0

||Ax||Y||x||X

.

Quando sia X che Y sono s.l.n-ti completi, ossia spazi di Banach, lo spaziodegli operatori lineari e continui da X in Y , normato nel modo che abbiamo

appena introdotto, si indica col simbolo L(X,Y ) oppure B(X, Y ) . Due casi

sono di uso particolarmente frequente e ad essi si riservano simboli speciali: ilcaso in cui X = Y ed il caso, importantissimo, X = Φ. Nel primo caso si usa

il simbolo L(X) invece di L(X,X); nel secondo caso, come si e gia detto, si

usa il simbolo X∗ o X ′ invece di L(X,Φ). Lo spazio X∗ si chiama lo spazioduale di X.

Infine, esaminiamo il problema della completezza dello spazio L(X, Y ). Ladimostrazione del teorema seguente usa la completezza dello spazio Y ma nonquella dello spazio X. Per questa dimostrazione abbiamo bisogno di ricordareche una successione fondamentale e anche limitata; e che la successione (An) elimitata in L(X, Y ) quando esiste un numero M , indipendente da n, tale che

||An|| < M .

Teorema 91 Lo spazio L(X,Y ) e completo.

Dim. Dobbiamo mostrare che ogni successione (An) fondamentale in L(X, Y )e anche convergente. Sia allora (An) fondamentale. Per definizione di normain L(X, Y ), per ogni ϵ > 0 esiste Nϵ tale che per n, m maggiori di Nϵ vale

||An − Am|| ≤ ϵ ossia sup||x||X≤1

||(An − Am)x||Y ≤ ϵ . (2.26)

Segue che la successione (Anx) di elementi di Y e fondamentale per ogni x dinorma minore o uguale ad 1; e quindi per ogni x ∈ X. Cio permette di definirel’operatore B dato da

Bx = limAnx .

Page 77: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.6. OPERATORI LINEARI 71

Proviamo la linearita e la continuita di B e poi proviamo che limAn = B.

Da

B(αx+ βy) = limAn(αx+ βy) = lim αAnx+ βAny = αBx+ βBy

segue la linearita. La continuita segue perche, se ||x|| ≤ 1,

||Bx|| = || limAnx|| = lim ||Anx|| ≤M ||x||

con M indipendente da n perche la successione (An), essendo fondamentale, elimitata11.

Mostriamo ora che B = limAn, ossia che

lim ||B − An|| = 0 . (2.27)

E’:

||B − An|| = sup||x||≤1

||(B − An)x||Y .

Sia ϵ > 0 e sia Nϵ tale che, per n, m maggiori di Nϵ, valga (2.26). Fissatox con ||x|| < 1, scriviamo

||Bx−Anx||Y = ||(B −Am)x+ (Am−An)x||Y ≤ ||(B −Am)x||Y + ϵ . (2.28)

Notiamo che questa disuguaglianza vale per ogni x con ||x|| ≤ 1 e per tuttigli m > Nϵ.

La definizione di B mostra l’esistenza di un opportunom > Nϵ (dipendentesia da x che da ϵ) per cui vale anche

||(B − Am)x|| < ϵ .

Dunque, la (2.28) da:

||Bx− Anx||Y ≤ infm||(B − Am)x||Y + ϵ ≤ 2ϵ ∀n > Nϵ .

Cio prova (2.27).

11si noti che in questa dimostrazione si usa anche la continuita della norma.

Page 78: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

72 CAPITOLO 2. GLI SPAZI DI BANACH

2.7 Esempi di spazi duali

Sia X uno spazio di Banach. Per definizione, X∗ e lo spazio (di Banach per ilTeorema 91) dei funzionali lineari e continui su X. Il problema che vogliamostudiare ora e il seguente: se X e uno spazio “particolare”, per esempio unospazio di funzioni o di successioni, vogliamo vedere se esiste un altro spazio“particolare” Y che e isometricamente isomorfo ad X∗; ossia tale che esistauna trasformazione L da Y in X∗ che e 1) suriettiva; 2) isometrica; 3) lineare(se Φ = IR) oppure antilineare (se Φ = IC).12 Ricordiamo che la trasformazioneL e isometrica quando

||Ly||X∗ = ||y||Y .

E quindi una trasformazione isometrica e necessariamente iniettiva.

In questo caso, Y viene ad avere tutte le proprieta topologiche di X∗.Si dice allora che Y e una realizzazione di X∗ e, frequentemente, non sidistingue tra Y ed X∗.

Un esempio particolare e ben noto: se X = l2(n), lo spazio euclideo n-dimensionale, allora una realizzazione del duale e lo spazio stesso.

Non sempre e possibile trovare delle realizzazioni concrete (e comode) diuno spazio duale; e d’altra parte esistono spazi di Banach che non sono iso-metricamente isomorfi a nessuno spazio duale. Per questo conviene elencarealcuni casi particolarmente importanti. Prima di presentare le dimostrazioni,raccogliamo i risultati nella tabella seguente:

spazio duale

l1 l∞

lp , p < +∞ lp′, p′ = p/(p− 1)

c0 l1

L1(Ω) L∞(Ω)

Lp(Ω) , p < +∞ Lp′(Ω) , p′ = p/(p− 1)

C(a, b) NV (a, b)

Lo spazio NV (a, b) e definito in seguito.

Non abbiamo inserito nella tabella precedente gli spazi l∞ ed L∞(Ω). Rea-lizzazioni dei loro duali sono note, ma per descriverle avremmo bisogno diconoscenze di teoria della misura che non abbiamo presentato.

12Una trasformazione L si dice antilineare se vale L(αx+ βy) = αLx+ βLy.

Page 79: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.7. ESEMPI DI SPAZI DUALI 73

Il duale di lp, 1 ≤ p < +∞

Per caratterizzare il duale di lp ed anche di c0 abbiamo bisogno di una parti-colare successione di elementi dello spazio lp stesso, che indichiamo con (e(n)).Dunque, ciascun e(n) e a sua volta una successione di numeri. Per definizione,

e(n)i =

1 se i = n0 altrimenti.

(2.29)

Notiamo che ||e(n)||p = 1 per ogni p, 1 ≤ p ≤ +∞ e che lo spazio linearegenerato dagli elementi e(n) e denso in lp per ogni p, 1 ≤ p < +∞. Non einvece denso in l∞.

Sia X = lp con 1 ≤ p < +∞. In questo caso una realizzazione di X∗ e

lp′

con p′ =

+∞ se p = 1pp−1

se p > 1 .(2.30)

Proviamo cio prima di tutto nel caso p = 1. Sia (yn) ∈ L∞. Si vedeimmediatamente che il funzionale lineare x∗, dipendente da (yn),

⟨⟨x∗, x⟩⟩ =+∞∑n=0

ynxn (2.31)

e lineare, ed e continuo perche

|⟨⟨x∗, x⟩⟩| = |+∞∑n=0

ynxn| ≤ supn|yn| · ||x||1 .

Inoltre, la trasformazione y = (yn) → x∗ e antilineare e si vede facilmente chee isometrica (e quindi anche iniettiva). Infatti, la disuguaglianza precedentemostra che

||x∗|| = sup||x||1=1

⟨⟨x∗, x⟩⟩ ≤ ||y||∞ . (2.32)

Per vedere che vale anche la disuguaglianza inversa, e quindi l’uguaglianza, siscelga la successione x(N) definita da

x(N)r =

yr|yr| se r = N e yr = 0

0 altrimenti.

Ovviamente, ||x(N)||1 ≤ 1 e

supN

⟨⟨x∗, x(N)⟩⟩ = supN

|yN | = ||y||∞

Page 80: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

74 CAPITOLO 2. GLI SPAZI DI BANACH

e quindi in (2.32) vale l’uguaglianza.Per completare la dimostrazione, dobbiamo far vedere che la trasformazione

che ad y ∈ l∞ associa x∗ ∈ (l1)∗ data da (2.31) e suriettiva; ossia dobbiamoassegnare un qualsiasi x∗ ∈ (l1)∗ ed associargli un opportuno y ∈ l∞, in modoche valga (2.31). Per costruire y consideriamo la successione e(n) in (2.29).Definiamo y ponendo

yn = ⟨⟨x∗, e(n)⟩⟩ .

Da|yn| ≤ ||x∗||

segue che y ∈ l∞.Sia ora x ∈ l1. Associamogli la successione x(N) definita come segue:

x(N) =N∑k=0

xke(k) ossia x

(N)k =

xk se k ≤ N0 altrimenti.

Si ha

⟨⟨x∗, x⟩⟩ = limN⟨⟨x∗, x(N)⟩⟩ = lim

N⟨⟨x∗,

N∑k=0

xke(k)⟩⟩

= limN

N∑k=0

xk⟨⟨x∗, e(k)⟩⟩ = limN

N∑k=0

ykxk =+∞∑k=0

ykxk .

Si noti che l’ultima uguaglianza si giustifica perche gia sappiamo che y ∈ l∞ egia sappiamo che, in tal caso,

x→+∞∑k=0

ykxk

e continua su l1.Cio completa l’analisi del caso p = 1.In modo analogo trattiamo il caso 1 < p < +∞.Siano x = (xn) ∈ lp ed y = (yn) ∈ lp

′. Dalla disuguaglianza di Holder si

vede che:+∞∑k=0

ynxn ≤ ||(yn)||p′ · ||(xn)||p = ||y||p′ · ||x||p .

Cio mostra che la trasformazione lineare

x→+∞∑k=0

ykxk

Page 81: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.7. ESEMPI DI SPAZI DUALI 75

e continua su lp e suggerisce di considerare la trasformazione L da Y = lp′in

X∗:

(Ly)(x) =+∞∑k=0

ynxn ,

che e chiaramente iniettiva e inoltre

||Ly||X∗ ≤ ||y||p′ .

Si vede che vale l’uguaglianza. Infatti, sia

xn =

(|yn|p

′/p yn|yn|

)1

||y||(p′/p)

p′

se yn = 0, xn = 0 altrimenti.

Si vede facilmente che x = (xn) e un elemento di X = lp di norma 1. Per essovale

(Ly)(x) =1

||y||p′/pp′

||y||p′

p′ = ||y||p′ .

In questo modo si e trovata una trasformazione antilineare L che e isometrica(e quindi anche iniettiva) da lp

′in (lp)∗.

Per concludere, basta mostrare che L e suriettiva, ossia che ogni elementodi (lp)∗ si rappresenta come in (2.30). Sia allora x∗ ∈ (lp)∗. Dobbiamo primadi tutto trovare una successione da associare a x∗. Per questo usiamo ancorala successione e(n) definita in (2.29) e definiamo

yi = ⟨⟨x∗, e(i)⟩⟩ .

In questo modo si costruisce una successione y = (yi).Proviamo prima di tutto che y ∈ lp

′, ||y|| ≤ ||x∗||. Proveremo infine che

⟨⟨x∗, x⟩⟩ =+∞∑i=1

yixi . (2.33)

Introduciamo la successione x(n) ∈ lp definita da

x(n) = x(n)i con x

(n)i =

|yi|p

′−1 yi|yi| se i ≤ n e yi = 0

0 altrimenti.

Ovviamente, x(n) ∈ lp per ogni n e

⟨⟨x∗, x(n)⟩⟩ ≤ ||x∗|| · ||x(n)||p

Page 82: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

76 CAPITOLO 2. GLI SPAZI DI BANACH

e, d’altra parte,

⟨⟨x∗, x(n)⟩⟩ =n∑i=1

|yi|p′.

Passando al limite rispetto ad n si trova

||y||p′ ≤ ||x∗|| .

Dunque, y ∈ lp′e ||y|| ≤ ||x∗||.

Proviamo ora che vale la (2.33). Fissato l’elemento x ∈ lp, consideriamo lasuccessione x(n) di elementi di lp,

x(n) =n∑i=0

xiei , ossia x(n)r =

xr se r ≤ n0 se r > n .

Si vede che, se p < +∞,

x = limr→+∞

x(n) .

Questo limite si calcola nella norma di lp. Dunque, essendo x∗ continuo,

limn⟨⟨x∗, x(n)⟩⟩ = ⟨⟨x∗, x⟩⟩ .

Inoltre,

limn⟨⟨x∗, x(n)⟩⟩ = lim

+∞∑r=0

yrx(r)n = lim

n∑r=0

yrxn =+∞∑i=0

yrxr

perche si e gia provato che y ∈ lp′e quindi che x→ ∑+∞

i=0 yrxr e un funzionalecontinuo. Si trova cosı che vale la rappresentazione

⟨⟨x∗, x⟩⟩ =+∞∑i=0

yrxr .

Osservazione 92 Nel caso particolare p = 2, una realizzazione del duale dil2 e lo spazio stesso.

Il duale di c0

Ricordiamo che il simbolo c0 indica il s.spazio di l∞ i cui elementi sono lesuccessioni che convergono a zero. Proviamo che il duale di c0 e realizzato dal1. Per provare questo notiamo che se (ξk) ∈ l1 allora la trasformazione

x→+∞∑k=1

ξkxk (2.34)

Page 83: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.7. ESEMPI DI SPAZI DUALI 77

e lineare e continua su l∞ e che la trasformazione da ξ ∈ l1 al funzionaledefinito da (2.34) e isometrica e antilineare. Queste proprieta si conservanosostituendo l∞ con c0.

Dobbiamo provare che ogni x∗ ∈ (c0)∗ ammette la rappresentazione (2.34).

Notiamo prima di tutto che ogni lp, p < +∞, e un sottospazio di c0 e chel’immersione di lp in c0 e continua. Dunque, ogni funzionale lineare continuosu c0 e anche un funzionale lineare continuo su lp, per ogni p < +∞. Ciosuggerisce di porre ancora

ξi = ⟨⟨x∗, e(i)⟩⟩ .Si trova cosı un vettore ξ = (ξi), candidato ad essere un rappresentante di x∗.

Come si e detto, il vettore ξ e nel duale lp′di lp per ogni p < +∞. In

particolare quindi e in l∞. Proviamo che inoltre tale vettore e anche in l1.Scegliamo per questo la seguente successione x(n) in c0:

x(n)r =

ξr|ξr| se r ≤ n e ξr = 0

0 altrimenti=

∑r≤nξr =0

ξr|ξr|

e(r) .

Dato che (ξn) ∈ l∞, la successione (x(n)) e una successione limitata in c0.Esiste quindi un numero M tale che∣∣∣⟨⟨x∗, x(n)⟩⟩∣∣∣ =∑

|ξr| < M

per ogni n. Cio prova che (ξr) ∈ l1.Ora, per ogni x ∈ c0, x = (xi), vale:

⟨⟨x∗, x⟩⟩ = limN⟨⟨x∗,

N∑i=0

xiei⟩⟩ = limN

N∑i=0

ξixi =+∞∑i=0

ξixi .

Cio completa la dimostrazione.

Osservazione 93 Notiamo nuovamente che nella dimostrazione si usa la den-sita in c0 della successione e(i). Questa successione e densa in lp per 1 ≤ p <+∞ e anche in c0; ma non in l∞.

Il duale di Lp(Ω), 1 ≤ p < +∞

In questo caso X∗ e isometricamente isomorfo a Lp′(Ω), con

p′ =p

p− 1se p > 1; L∞(Ω) se p = 1.

Cio vale con Ω ⊆ IRn, limitato o meno.

Page 84: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

78 CAPITOLO 2. GLI SPAZI DI BANACH

Accenniamo alla dimostrazione nel caso p = 1 e Ω = (a, b).E’ ovvio che per ogni ξ ∈ L∞(a, b), il funzionale su L1(a, b) definito da

x→∫ b

aξ(s)x(s) ds

e continuo, di norma minore o uguale a ||ξ||∞ e in realta si vede che valel’uguaglianza.

Viceversa, sia x∗ un funzionale lineare e continuo su L1(a, b). Dobbiamoassociargli una funzione ξ(s) ∈ L∞(a, b) tale che

⟨⟨x∗, x⟩⟩ =∫ b

aξ(s)x(s) ds .

Introduciamo la famiglia delle funzioni χt(s), una funzione per ogni t ∈(a, b),

χt(s) =

1 se a < t < s0 altrimenti

(2.35)

e studiamo i valori che x∗ assume su queste funzioni. La ragione di cio e chele funzioni a costanti a tratti sono dense in L1(a, b).

Associamo ad x∗ ∈ (L1(a, b))∗ la funzione

g(t) = ⟨⟨x∗, χt⟩⟩

E’:

|g(t)− g(t′)| = |⟨⟨x∗, χt − χt′⟩⟩ ≤ ||x∗|| · ||χt − χt′ ||1 = ||x∗|| · |t− t′| .

Dunque la funzione g(t) e lipschitziana e quindi e assolutamente continua. Peressa vale

g(t) =∫ t

aξ(s) ds

e inoltre ξ(s) e q.o. la derivata di g(t). Dunque ξ ∈ L∞(a, b) perche il rapportoincrementale di g e limitato.

Notiamo che

⟨⟨x∗, χt⟩⟩ = g(t) =∫ t

aξ(s) ds =

∫ b

aξ(s)χt(s) ds .

Una qualunque funzione a scala si rappresenta come combinazione lineare difunzioni χt:

ψ(t) =n∑i=1

ψiχti(s)

Page 85: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.7. ESEMPI DI SPAZI DUALI 79

e quindi

⟨⟨x∗, ψ⟩⟩ =n∑i=1

ψi

∫ b

aξ(s)χti(s) ds =

∫ b

aξ(s)ψ(s) ds .

Abbiamo gia notato che il funzionale

x→∫ b

aξ(s)x(s) ds

e continuo.Sia ora x ∈ L1(a, b). Esiste una successione di funzioni a scala ψn conver-

gente ad x in L1(a, b). Allora,

⟨⟨x∗, x⟩⟩ = limN⟨⟨x∗, ψN⟩⟩ = lim

N

∫ b

aξ(s)ψN(s) ds =

∫ b

aξ(s)x(s) ds .

Cio e quanto volevamo provare.

Osservazione 94 Una dimostrazione del tutto analoga porta ad identificareil duale di Lp(Ω), per ogni p < +∞. Invece gli argomenti precedenti non siestendono al caso L∞(Ω) perche le funzioni costanti a tratti non sono densein L∞(Ω).

Il duale di C(a, b)

La costruzione di un rappresentante per il duale di C(a, b) e menoelementare delle costruzioni precedenti, e richiede la conoscenza delteorema di Hahn-Banach, si veda il Teorema 113: Sia X uno s.l.n. esia Y un suo s.spazio. Sia L0 un funzionale lineare continuo su Y .Esiste un’estensione di L ad X tale che

||L||X∗ = sup|Ly| | y ∈ Y , ||y||X = 1 .

Introduciamo ora una realizzazione del duale di C(a, b), lo spazio di Banachdelle funzioni continue sull’intervallo limitato e chiuso [a, b], con la normadell’estremo superiore. Fissiamo un elemento x∗ del duale. Per rappresentarlo,procediamo in tre passi:

PASSO 1) Introduciamo lo spazio lineare di tutte le funzioni limitate su [a, b],continue o meno, dotato della norma dell’estremo superiore. Si trova uno s.l.n.che indicheremo col generico simbolo B.

Page 86: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

80 CAPITOLO 2. GLI SPAZI DI BANACH

C(a, b) essendo un s.spazio di B, il funzionale lineare e continuo x∗, de-finito su C([a, b]), si estende ad in funzionale lineare continuo su B, con lastessa norma, per il Teorema di Hahn-Banach. Tale estensione non e unica.Fissiamone una, che indichiamo col simbolo x∗.

Per ogni t ∈ [a, b], introduciamo le funzioni definite come in (2.35) e lafunzione

v(t) = ⟨⟨x∗, χt⟩⟩ .Sia ora f ∈ C(a, b). Essendo [a, b] compatto, la funzione f e uniformemente

continua e quindi si approssima in modo uniforme con funzioni costanti a tratti.Queste possono costruirsi scegliendo un insieme finito tini=1 di punti di [a, b],abbastanza fitto, e quindi definendo

zn(t) = f(ti−1) ∀t ∈ [ti−1, ti)

ossia

zn(t) =n∑i=1

f(ti−1)[χti(s)− χti−1(s)] .

Si ha quindi

⟨⟨x∗, f⟩⟩ = ⟨⟨x∗, f⟩⟩ = lim⟨⟨x∗, zn⟩⟩ = limn∑i=1

f(ti−1)[⟨⟨x∗, χti(s)⟩⟩ − ⟨⟨x∗, χti−1(s)⟩⟩]

= limn∑i=1

f(ti−1)[vti(s)− vti−1(s)] .

Si noti che nel caso particolare in cui v(t) = t, tale limite e∫ ba f(s) ds.

PASSO 2) Introduciamo un simbolo per indicare il limite precedente,∫ b

af dv = lim

n∑i=1

f(ti−1)[vti(s)− vti−1(s)] (2.36)

(ovviamente, il limite non dipende dalla partizione scelta per definirlo, datoche esso deve essere ⟨⟨x∗, f⟩⟩).

Il particolare integrale definito da (2.36) si chiama integrale di Stilt-jes.

Si osservi che la rappresentazione di x∗ come integrale di Stiltjes usa lacontinuita uniforme di f ; e quindi in generale x∗ non avra tale rappresentazio-ne.

PASSO 3) Ricapitolando, abbiamo rappresentato ogni elemento del duale diC(a, b) come un integrale di Stiltjes. Dobbiamo ora studiare le proprieta ditale integrale, per trovare uno spazio di Banach che realizzi [C(a, b)]∗.

Page 87: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.7. ESEMPI DI SPAZI DUALI 81

Si han∑i=1

|v(ti)− v(ti−1)| =n∑i=1

sgn [v(ti)− v(ti−1)][v(ti)− v(ti−1)]

n∑i=1

⟨x∗,sgn [v(ti)− v(ti−1)][χti − χti−1

]⟩⟩

= ⟨x∗,n∑i=1

sgn [v(ti)− v(ti−1)][χti − χti−1

]⟩⟩

≤ ||x∗|| sups

n∑i=1

|χti(s)− χti−1(s)| = ||x∗|| = ||x∗||

perche la differenza |χti(s)− χti−1(s)| vale 1 oppure 0.

Questa disuguaglianza vale per ogni suddivisione dell’intervallo [a, b] in unnumero finito di punti e quindi esiste un numero M , M = ||x∗||, tale che

V ba v = sup

ti

∑|v(ti)− v(ti−1)| < M .

Funzioni v con questa proprieta si dicono a variazione limitata.La struttura delle funzioni a variazione limitata e stata studiata con estre-

ma precisione. Si prova in particolare che ogni funzione a variazione limitata edifferenza di due funzioni monotone e che, quindi, i suoi punti di discontinuitasono salti. Si prova inoltre che

sup||f ||<1

∫ b

af dv = V b

a v

e questo suggerisce di scegliere come spazio per rappresentare [C(a, b)]∗ unospazio di funzioni a variazione limitata. Bisogna pero notare che puo aversi∫ b

af dv =

∫ b

af dv′ ∀f ∈ C(a, b)

anche con v = v′. E quindi la rappresentazione che abbiamo trovato per x∗ none unica. Si prova pero che l’uguaglianza puo aversi, per ogni f , solo se v e v′

differiscono per il valore che assumono in un punto di salto oppure nell’estremosinistro a dell’intervallo. Cio suggerisce di definire

NV (a, b)

lo spazio delle funzioni a variazione limitata normalizzate su [a, b],ossia continue a sinistra e nulle in a, dotato della norma

V ba (v) .

Si prova che questo spazio e di Banach e che vale:

Page 88: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

82 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 95 (di Riesz) Lo spazio NV (a, b) e una realizzazione del duale di[C(a, b)]∗ e ogni x∗ ∈ [C(a, b)]∗ si rappresenta (in modo unico) come

⟨⟨x∗, f⟩⟩ =∫ b

af dv , v ∈ NV (a, b) .

Il duale di C(K)

Ricordiamo che simbolo C(K) l’insieme K e compatto.Non abbiamo gli strumenti per studiare il duale di C(K). Possiamo pero

descrivere come si rappresenta l’azione su C(K) di un elemento x∗ del suoduale. Per ogni x∗ ∈ (C(K))′ si trovano una misura di Borelm ed una funzioneψ(s) misurabile secondo Borel su K e tale che

|ψ(s)| = 1 q.o. s ∈ K

e per la quale vale

⟨⟨x∗, x⟩⟩ =∫Kψ(s)x(s) dm

2.8 Il teorema di Baire e le sue conseguenze

Una semplice osservazione che vale in IR2 e la seguente: gli iperpiani per 0in questo caso sono rette di equazione y = mx oppure x = 0. Esse sonoparametrizzate dal punto in cui intersecano la circonferenza x2 + y2 = 1.Dunque IR2 non e unione di una famiglia numerabile di rette per 0; e questaosservazione si generalizza a rette qualsiasi, ed a dimensione n > 2. Vediamocome questo risultato si estende ad un generico spazio di Banach.

Proveremo il teorema seguente, non ovvio nemmeno in dimensione finita:

Teorema 96 (di Baire) Sia X uno spazio di Banach e sia (An) una succes-sione di s.insiemi di X, ciascuno dei quali e chiuso e privo di punti interni.Allora, ∪

An = X .

Rimandando alla fine di questo paragrafo la dimostrazione, illustriamovarie conseguenze importanti di questo teorema.

Notiamo prima di tutto che un s.spazio di X, diverso da X stesso, non hapunti interni. Dunque vale in un generico spazio di Banach la proprieta cheabbiamo notato sopra per IR2, che conviene enunciare come segue:

Teorema 97 Sia (Xn) una successione di s.spazi di uno spazio di Banach X.Se X = ∪Xn allora esiste n0 tale che X = Xn0.

Page 89: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 83

Il Teorema di Baire e un potente strumento per lo studio delle proprietadegli operatori lineari tra due spazi di Banach X ed Y . Esso talvolta si usadirettamente; piu spesso interviene grazie ai quattro teoremi seguenti. Il pri-mo che presentiamo va sotto il nome di Teorema di Banach-Steinhaus.Esso concerne s.insiemi A di L(X, Y ). Ricordiamo che L(X, Y ) e uno spazionormato e quindi ha senso investigare quando A e un s.insieme limitato diL(X, Y ). Cio avviene se esiste M tale che ||A|| ≤M per ogni A ∈ A.

Fissiamo ora un qualsiasi elemento x ∈ X e consideriamo l’insieme dei“valori Ax, A ∈ A. Questo e un s.insieme di Y che e limitato se l’insieme A elimitato in L(X, Y ). Infatti, ||Ax||Y ≤ ||A|| · ||x|| ≤ M · ||x|| per ogni A ∈ A.Il teorema di Banach-Steinhaus permette di invertire questa proprieta:

Teorema 98 (di Banach-Steinhaus) Sia A un s.insieme di L(X, Y ). Sup-poniamo che per ogni x ∈ X esista un numero Mx tale che

||Ax|| ≤Mx ∀A ∈ A . (2.37)

(Sottolineiamo: Mx indipendente da A ∈ A). In questo caso A e un s.insiemelimitato di L(X,Y ).

Dim. Indichiamo con Xn ⊆ X l’insieme

Xn = x | ||Ax|| ≤ n ∀A ∈ A .

La condizione (2.37) mostra che ∪Xn = X .

Consideriamo ora un operatoreA ∈ A. EssendoA continuo, l’insieme x | ||Ax|| ≤n e chiuso e quindi

Xn =∩A∈A

x | ||Ax|| ≤ n

e esso stesso chiuso. Abbiamo quindi una famiglia di chiusi la cui unione e X.Per il Teorema di Baire, uno almeno deve avere punti interni. Sia esso XN .Esiste x0 ∈ XN ed esiste ϵ > 0 per cui

x0 + x | ||x|| ≤ ϵ ⊆ XN .

Dunque, se ||x|| < ϵ si ha

||Ax|| ≤ ||A(x+ x0)||+ ||Ax0|| ≤ N + ||Ax0|| = N +Mx0 =M ,

conM indipendente daA. Cio prova la limitatezza del s.insiemeA di L(X, Y ).

Page 90: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

84 CAPITOLO 2. GLI SPAZI DI BANACH

Il Teorema di Banach-Steinhaus permette di passare da un’informazionepuntuale, la limitatezza dell’insieme dei valori assunti in ciascun punto x, aduna limitatezza uniforme sulla sfera x | ||x|| ≤ 1. Per questo esso va anchesotto il nome di Teorema della limitatezza uniforme.

In dimensione finita una trasformazione lineare invertibile non puo “schiac-ciare un aperto trasformandolo in un s.insieme di un s.spazio proprio. Si ricordiil ruolo importante di questa proprieta nella dimostrazione del teorema dellafunzione inversa e della funzione implicita.

Una proprieta analoga vale anche in spazi di Banach:

Teorema 99 (della mappa aperta) Siano X ed Y spazi di Banach e siaA ∈ L(X,Y ). Se A e suriettiva allora l’immagine di ogni aperto di X e unaperto di Y .

Posponiamo la dimostrazione presentando invece due conseguenze del Teo-rema di Baire che si provano piu facilmente mediante il teorema della Mappaaperta. Esse riguardano questo problema: abbiamo visto che gli operatori li-neari tra X ed Y possono essere discontinui se X ha dimensione infinita. Gliesempi che abbiamo visto di operatori discontinui sono pero esempi di opera-tori il cui dominio non e tutto X. Ci chiediamo se quando il dominio e tuttolo spazio allora l’operatore debba essere continuo. La risposta e negativa:

Teorema 100 Siano X ed Y spazi di Banach. Esistono operatori lineari daX in Y , definiti su X e non continui.

Si veda l’osservazione 135.Pero:

Teorema 101 (di Banach) Siano X ed Y spazi di Banach e sia A ∈ L(X,Y )una trasformazione lineare iniettiva da X in Y . Se l’immagine di A e chiusaallora la trasformazione lineare A−1 (definita su imA) e continua.

Dim. Ricordiamo che, per definizione di L(X,Y ), un operatore A ∈ L(X, Y )ha dominio uguale ad X.

L’immagine di una trasformazione lineare e un s.spazio e in questo ca-so l’immagine e chiusa; dunque l’immagine di A e essa stessa uno spazio diBanach. Sostituendo Y con imA, possiamo supporre che A sia anche suriettiva.

La trasformazione inversa di A−1, che e A, e suriettiva: per il teorema dellamappa aperta, A = (A−1)

−1 ∈ L(X,Y ) trasforma aperti in aperti; e quindiA−1 e continua.

Diamo infine un test importante per provare la continuita direttamente diun operatore (e non del suo operatore inverso).

Page 91: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 85

Si prova facilmente che se A ∈ L(X, Y ) (e quindi domA = X) allora ilgrafico di A e chiuso in X × Y .

Vale anche l’implicazione opposta:

Teorema 102 (del grafico chiuso) Siano X ed Y spazi di Banach e siaA un operatore lineare da X in Y , con dominio uguale ad X. Se il grafico diA e chiuso allora A e continuo.

Dim. Indichiamo con G il grafico di A. Per ipotesi, G e un s.spazio chiusodello spazio di Banach X × Y ; e quindi e esso stesso uno spazio di Banach.

Introduciamo i due operatori, ovviamente lineari e continui:

P : G→ Y , P (x,Ax) = Ax

Π : G→ X , Π(x,Ax) = x .

Oltre che continuo, l’operatore Π e suriettivo, perche domA = X per ipotesi;ed e iniettivo perche se Ax1 = Ax2 allora x1 = x2. Dunque esiste Π−1 e, peril Teorema di Banach, Π−1 e continuo. Dunque,

Ax = P (Π−1x)

e continua.

Bisogna notare che esistono anche operatori lineari il cui grafico e chiusoma che non sono continui. Naturalmente, il loro dominio non sara tutto lospazio. Definiamo quindi:

Definitione 103 Sia A uno operatore lineare tra due spazi di Banach X edY . L’operaore A si dice chiuso quando il suo grafico e chiuso in X × Y .

L’esempio seguente mostra che operatore chiusi ma non continui non soloesistono ma sono anche importanti per le applicazioni:

Esempio 104 Sia X = Y = C(0, 1) e sia

domA = C1(0, 1) , Ax = x′ .

Se x ∈ domA, vale

x(t) = x(0) +∫ t

0x′(s) ds .

Come si verifica facilmente, l’operatore A non e continuo. Proviamo che ilsuo grafico e chiuso. Consideriamo quindi una successione nel grafico che econvergente e mostriamo che essa converge ad un punto del grafico. Sia quindi

(xn, Axn) → (x0, y0) .

Page 92: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

86 CAPITOLO 2. GLI SPAZI DI BANACH

Dobbiamo provare che x0 ∈ domA e che Ax0 = y0.Si noti che y0 e limite uniforme delle funzioni continue Axn e quindi y0 e

una funzione continua. Dunque dobbiamo provare che si puo scrivere

x0(t) = x0(0) +∫ t

0y0(s) ds .

Questa uguaglianza segue da

xn(t) = xn(0) +∫ t

0x′n(s) ds

e da xn → x0 uniformemente su [0, 1]x′n → y0 uniformemente su [0, 1].

Osserviamo infine:

Corollario 105 Siano X, Y e Z tre spazi di Banach. Sia A ∈ L(X, Y ) e siaB un operatore lineare chiuso da Y in Z. Se

imA ⊆ domB

allora l’operatore composto BA e continuo.

Dim. Si vede facilmente che BA e definito su X, ed e chiuso. Dunque econtinuo.

2.8.1 Proiezioni

Un operatore P ∈ L(X) si dice una proiezione se

P 2 = P .

Si noti che le proiezioni vengono sempre a coppie. Infatti,

Teorema 106 L’operatore P e una proiezione se e solo se l’operatore I − Pe una proiezione. Inoltre, imP ∩ im(I − P ) = 0.Dim. Infatti,

(I − P )(I − P ) = I − P − P + P 2 = I − P

se e solo se P 2 = P ossia se e solo se P e una proiezione.Se x = Px′ = (I − P )x′′ allora

Px′ = x′′ − Px′′ da cui Px′ = Px′′ − P 2x′′ = Px′′ − Px′′ = 0

e quindi x = Px′ = 0.

Inoltre:

Page 93: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 87

Teorema 107 L’immagine di una proiezione e un s.spazio chiuso di X.

Dim. Sia infatti (Pxn) una successione in imP , Pxn → y0. Dobbiamo provareche y0 ∈ imP .

Poniamo yn = Pxn e notiamo che

Pyn = P 2xn = Pxn → y0

e d’altra parte, essendo P continua, Pyn = P 2yn → Py0. Dunque, y0 = Py0 ∈imP .

Di conseguenza, ogni proiezione identifica sempre una coppia di s.spazichiusi: l’immagine di P e quella di (I − P ). Questi s.spazi hanno in comunesolo l’elemento 0. Inoltre, ogni x si rappresenta come

x = Px+ (I − P )x .

Questa formula suggerisce un legame tra operatori di proiezione e complemen-tare. Vale infatti:

Teorema 108 L’immagine di una proiezione P e un s.spazio chiuso di X,dotato di complementare chiuso. Viceversa, sia X1 un s.spazio di X chiuso edotato di complementare chiuso X2. Esiste una proiezione P la cui immaginee X1.

Dim. Sia P una proiezione ed X1 = imP . Definiamo

X2 = im(I − P ) .

Si e gia visto che X1 ∩X2 = 0 e

X1 +X2 = Px+ (I − P )y | x ∈ X , y ∈ Y = X .

Dunque, l’immagine di P e un s.spazio dotato di complementare.Viceversa, sia

X = X1 ⊕X2 ,

somma diretta di due s.spazi chiusi. Questo vuol dire che per ogni x esistonox1 ed x2 unici e tali che

x = x1 + x2 . (2.38)

Si definisca Px = x1 = x1 + 0. Segue da qui che P (Px) = x1.L’operatore P e lineare perche se x′ = x′1 + x′2, x

′′ = x′′1 + x′′2, alloraαx′ + βx′′ = α(x′1 + x′2) + β(x′′1 + x′′2) = (αx′1 + βx′2) + (αx′′1 + βx′′2); e quindi

Page 94: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

88 CAPITOLO 2. GLI SPAZI DI BANACH

P (αx′+βx′′) = (αx′1+βx′2) = αPx′+βPx′′. Se possiamo provare la continuita

di P , abbiamo che P e una proiezione.L’operatore P e definito su X e quindi, per provare che e continuo, basta

provare che e chiuso. Sia quindi (xn) una successione convergente ad x0 e siayn = Pxn. Supponiamo che (yn) converga ad y0.

L’uguaglianza (2.38) mostra l’esistenza di un elemento zn ∈ X2 tale che

xn = Pxn + zn = yn + zn .

Di conseguenza, anche la successione (zn) converge, a z0 = x0 − y0.I s.spazi essendo chiusi, vale y0 ∈ X1, z0 ∈ X2. Essendo inoltre

x0 = y0 + z0 , si ha Px0 = y0 .

Segue da qui che l’operatore P e chiuso e quindi continuo; dunque e unaproiezione.

Si consideri ora un esempio.

Esempio 109 Sia X = IR2 normato dalla usuale norma

||(ξ, η)|| =√ξ2 + η2

e siano

X1 = (ξ, 0) | ξ ∈ IR , X2 = r(cos θ, sin θ) | r ∈ IR

ove θ ∈ (0, π/2) e fissato. Dunque, X2 e una retta per l’origine, non coincidentecon X1.

Ogni punto x = (ξ, η) puo rappresentarsi nella forma

x = (ξ − η

sin θcos θ, 0) +

η

sin θ(cos θ, sin θ) ,

si veda la figura seguente.L’operatore P :

P (ξ, η) = (ξ − η

sin θcos θ, 0)

e una proiezione.L’operatore P dipende dalla scelta di θ, P = Pθ.La norma di Pθ e

maxξ2+η2=1

∣∣∣ξ − ηsin θ

cos θ∣∣∣

√ξ2 + η2

≥ |cotg θ| .

Dunque,limθ→0

||Pθ|| = +∞ .

Page 95: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 89

Figura 2.3:

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

x

x

P

P’

P’’

2.8.2 Appendice: Applicazioni

Il Teorema di Baire e le sue conseguenze sono strumenti potenti per provarel’esistenza di oggetti dalle proprieta “strane. Mostriamo due esempi.

Si costruiscono “esplicitamente, come somma di serie uniformemente con-vergenti di funzioni continue, delle funzioni che, pur essendo continue, non han-no derivata in nessun punto. Una dimostrazione, dovuta a Banach, dell’esistenzadi tali funzioni si basa sul Teorema di Baire.

Teorema 110 Esistono funzioni continue su un intervallo [a, b], ovunque pri-ve di derivata.

Dim. Consideriamo in C(0, 1) il s.insieme An i cui elementi sono funzioni fcon questa proprieta: esiste x ∈ [0, 1− 1

n] ed esiste h ∈ (0, 1− x) tale che

|f(x+ h)− f(x)| ≤ nh .

Si prova che:

• L’insieme An e chiuso e privo di punti interni.

Accettando queste proprieta che proveremo piu avanti, il Teorema di Bairemostra che esiste una funzione continua f(x) che non appartiene a ∪An.

Se f /∈ ∪An allora per ogni x e per ogni h vale

|f(x+ h)− f(x)| > nh

Page 96: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

90 CAPITOLO 2. GLI SPAZI DI BANACH

e cio per ogni n; ossia il rapporti incrementale e illimitato e quindi la derivataf ′(x) non esiste, e cio per ogni x.

Per completare la dimostrazione, mostriamo che gli insiemi An sono chiusie privi di punti interni.

Proviamo prima di tutto che An e chiuso. Sia per questo fk → f (uni-formemente su [0, 1]), con fk ∈ An. Dunque, esiste xk ∈ [0, 1 − 1/n] taleche

|fk(xk + h)− fk(xk)| ≤ nh .

Passando ad una s.successione, si puo assumere xk → x0 ∈ [0, 1− 1/n]. Vale:

|f(x0 + h)− f(x0)|≤ |f(x0 + h)− fk(x0 + h)| (2.39)

+|fk(x0 + h)− fk(xk + h)| (2.40)

+|fk(xk + h)− fk(xk)| (2.41)

+|fk(xk)− fk(x0)| (2.42)

+|fk(x0)− f(x0)| . (2.43)

Il termine (2.41) verifica

|fk(xk + h)− fk(xk)| ≤ nh

Essendo f limite uniforme di fk, per k sufficientemente grande i due ad-dendi (2.39) ed (2.43) sono minori di un prefissato ϵ > 0.

Usiamo ora il Teorema di Ascoli-Arzela: essendo convergente, la successio-ne (fk) e equicontinua e: ||(x0 + h) − (xk + h)|| → 0. Dunque, per k grande,anche gli addendi (2.40) e (2.42) sono minori di ϵ.

Ricapitolando, la funzione f verifica, per ogni ϵ > 0,

|f(x0+h)−f(x0)| ≤ nh+4ϵ e, essendo ϵ arbitrario, |f(x0+h)−f(x0)| ≤ nh .

Cio prova che ciascuno degli insiemi An e chiuso. Proviamo ora che ciascunodi essi e privo di punti interni. Fissato n ed f ∈ An, proviamo che per ogniϵ > 0 esiste ζ /∈ An che dista da f meno di ϵ.

Si sa che esistono funzioni g continue e lineari a tratti tali che

||f − g|| < ϵ/2 .

Basta quindi provare che data una qualunque g continua e lineare a tratti sipuo costruire ζ /∈ An, che dista meno di ϵ/2 da g. Sia per questo

ϕ(x) = distanza di x dall’intero piu vicino.

Page 97: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 91

Figura 2.4:

0 1 2 3 4 5 6 7 8 9 10−0.1

0

0.1

0.2

0.3

0.4

0.5

0.6

x

Il grafico di ϕ(x) e in figura 2.4:Fissiamo quindi una funzione g lineare a tratti. Essa e lipschitziana e

quindi soddisfa |g(x)−g(x′)| < r|x−x′| per un r opportuno. Sia ζ la funzione

ζ(x) = g(x) + ϵϕ(mx) .

Chiaramente, per ogni m, ||g − ζ|| ≤ ϵ/2. Vogliamo mostrare che, per un’op-portuna scelta di m, ζ /∈ An. Notiamo

|ζ(x)− ζ(x′)| ≥∣∣∣∣ ϵ|ϕ(mx)− ϕ(mx′)| − |g(x)− g(x′)|

∣∣∣∣=∣∣∣∣ ϵm|x− x′| − |g(x)− g(x′)|

∣∣∣∣ ≥ (ϵm− r)|x− x′|

se m > r/ϵ, con x′ tale che |x − x′| < 1/2m. Se ora m verifica anche m >(n+ r)/ϵ, allora ζ /∈ An. Cio completa la dimostrazione.

Sia ora f(x) una funzione continua su [−π, π]. Si associ ad essa la serie

+∞∑n=−∞

fneinx , fn =

1

∫ +π

−πf(s)e−ins ds

che si chiama la serie di Fourier della funzione f(x). Sotto ipotesi diregolarita, per esempio se la funzione f(x) e di classe C1 e inoltre f(−π) =f(π), la serie converge ad f(x) e questa condizione puo indebolirsi, ma nonfino alla sola continuita. Infatti:

Page 98: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

92 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 111 Sia x0 ∈ [−π, π]. Esiste una funzione f continua su [−π, π]tale che f(0) = f(2π) e tale che inoltre la serie di Fourier ad essa associatanon converge in x0.

Dim. Indichiamo con CP (−π, π) il s.spazio di C(−π, π) i cui elementi sonofunzioni continue che verificano

f(−π) = f(π) .

Si vede facilmente che questo e un s.spazio chiuso di C(−π, π), e quindi essostesso uno spazio di Banach.

Studiamo le somme parziali della serie di Fourier. Indichiamo per questocon FN l’operatore definito su CP (−π, π) da

(FNf)(x) =N∑

n=−Nfne

inx =1

∫ π

−πf(s)

N∑n=−N

ein(x−s) ds .

Si provera alla fine di questo paragrafo che

DN(x) =

2N + 1 se x = 0∑Nn=−N e

inx = sin(N+1/2)xsinx/2

se x = 0 .(2.44)

La funzione DN(x) si chiama nucleo di Dirichlet.Dunque,

(FNf)(x) =1

∫ π

−πf(s)

sin[(N + 1/2)(x− s)]

sin[(x− s)/2]ds .

Facciamo vedere che esiste una funzione f ∈ CP (−π, π) tale che

supN

|(FN f)(x0)| = +∞ .

Cio vuol dire che la serie di Fourier di questa funzione f non converge in x0.Per completare la dimostrazione basta quindi provare l’esistenza di f . Sup-

poniamo che tale funzione f non esista. Allora, per ogni f ∈ CP (−π, π) siha:

supN

|(FNf)(x0)| < +∞ .

In tal caso per ogni f ∈ CP (−π, π) esiste Mf per cui

|(FNf)(x0)| < Mf

Page 99: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 93

per ogni N . E quindi, per il teorema di Banach–Steinhaus, esisteM =M(x0),indipendente da N , tale che

|(FNf)(x0)| < M(x0)||f ||CP (−π,π) .

Indicando con Fx0,N il funzionale che ad f ∈ CP (−π, π) associa (FNf)(x0),la disuguaglianza precedente si scrive

||Fx0,N || < M(x0) ; (2.45)

ossia, la famiglia dei funzionali lineari e continui Fx0,N e limitata. Calcoliamoesplicitamente la norma del funzionale Fx0,N e mostriamo che cio non vale.

Per semplicita limitiamoci a fare il calcolo con x0 = 0. In questo caso

F0,Nf =1

∫ π

−πDN(t)f(t) dt .

e

|F0,Nf | ≤1

∫ π

−π|DN(t)f(t)| dt ≤

(1

∫ π

−π|DN(t)| dt

)||f ||CP (−π,π)

cosı che

||F0,N || ≤1

∫ π

−π|DN(t)| dt . (2.46)

In realta vedremo che vale l’uguaglianza. Accettando cio,

||F0,N || =1

∫ π

−π|DN(t)| dt =

1

∫ π

−π

∣∣∣∣∣sin[(N + 1/2)t]

sin t/2dt

∣∣∣∣∣>

1

π

∫ π

−π

∣∣∣∣∣sin[(N + 1/2)t]

t

∣∣∣∣∣ dt = 2

π

∫ (N+1/2)π

0

| sin t|t

dt

≥ 2

π

N−1∑k=0

∫ (k+1)π

| sin t|t

dt ≥N−1∑k=0

2

(k + 1)π2

∫ (k+1)π

kπ| sin t| dt

=4

π2

2n∑k=0

1

(k + 1)−→ +∞ .

Cio contrasta con la (2.45) e mostra che la funzione f esiste.Accenniamo ora alla dimostrazione del fatto che l’uguaglianza vale nel-

la formula (2.46). Per mostrare cio e sufficiente trovare una successione difunzioni (fk) di norma al piu uguale ad 1 e tale che

limk

|F0,Nfk| =1

∫ π

−π|DN(t)| dt (2.47)

Page 100: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

94 CAPITOLO 2. GLI SPAZI DI BANACH

Introduciamo per questo la funzione

y(x) = signDN(x)

e una successione (fk) di funzioni continue convergente puntualmente ad ye inoltre limitata da 1. L’uguaglianza (2.47) vale per questa successione difunzioni.

Cio completa la dimostrazione, a parte il fatto che dobbiamo ancora veri-ficare l’uguaglianza (2.44), cosa che facciamo ora.

L’uguaglianza e ovvia se x e multiplo di 2π. Altrimenti, usando la formulaper la somma di una progressione geometrica, si ha:

DN(x) =N∑

k=−Neikx =

−1∑k=−N

eikx +N∑k=0

eikx =N∑k=1

e−ikx +N∑k=0

eikx

=

[1− e−i(N+1)x

1− e−ix− 1

]+

1− ei(N+1)x

1− eix

=e−ix − e−iNxe−ix

1− e−ix+

1− ei(N+1)x

1− eix

=

[e−ix − e−iNxe−ix

](1− eix) +

[1− ei(N+1)x

](1− e−ix)

(1− cos x)2 + sin2 x

=e−iNx (1− e−ix) + eiNx (1− eix)

2− 2 cos x=

2ℜe[e−iNx (1− e−ix)

]2− 2 cos x

=cosNx− cosNx cosx+ sin x sinNx

2 sin2(x/2)

=cosNx− cos(N + 1)x

2 sin2(x/2)=

2 sin(x/2) sin 12(2N + 1)x

2 sin2(x/2)

=sin

(N + 1

2

)x

sin x2

.

Nel penultimo passaggio si sono usate le formule di prostaferesi.

2.8.3 Dimostrazioni posposte

Dimostrazione del TEOREMA 96, Teorema di Baire.Premettiamo un’osservazione: Sia Bn una successione di palle contenuta

ciascuna nella precedente:

Bn = x | ||x− xn|| < ϵn ⊆ x | ||x− xn−1|| < ϵn−1 = Bn−1

Page 101: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 95

cosı che||xn − xn+m|| < ϵn .

Sia lim ϵn = 0. Da||xn − xn+m|| < ϵn

si vede che la successione (xn) e fondamentale ossia convergente,

limxn = x .

Il punto x appartiene alla chiusura di Bn per ogni n e quindi si ha anche

x ∈∩n

clBn .

Sia ora (An) una successione di insiemi chiusi e (Bn) una successione dipalle con le proprieta appena dette e tali che, inoltre,

(clBn) ∩ An = ∅ . (2.48)

Allora, x non appartiene a An per nessun n, grazie alla (2.48):

x /∈∪An .

Infatti, se x ∈ ∪An allora x ∈ An0 per almeno un indice n0. D’altra parte, sisa anche che x ∈ clBn0 e cio non puo essere perche gli insiemi An0 e clBn0

sono disgiunti.Per provare il Teorema di Baire, costruiamo una successione di palle Bn

che ha le proprieta dette sopra rispetto alla successione di insiemi (An), chiusie privi di punti interni. Cio portera a trovare che x /∈ ∪An e quindi ∪AN = X.Scegliamo x1 /∈ A1 e una palla B1 di centro x1 e raggio minore di 1, tale che(clB1) ∩ A1 = ∅. Sia ϵ1 > 0 il suo raggio. Non e restrittivo assumere ϵ1 < 1.

La palla B1 esiste perche A1 e chiuso e, essendo privo di punti interni, none uguale ad X.

La palla B1 non e contenuta in A2 perche A2 non ha punti interni. Dunquein B1 esite un punto x2 /∈ A2 e quindi interno al complementare dell’insiemechiuso A2. Possiamo quindi scegliere una palla B2 di centro x2, contenuta inB1 e di raggio minore di ϵ1/2 < 1/2, tale che (clB2) ∩ A2 = ∅.

Sia ϵ2 > 0 il raggio di B2.Procedendo per induzione, scelti i punti x1, . . . , xk e le corrispondenti palle

B1, . . . , Bk, scegliamo in Bk un punto xk+1 /∈ Ak+1 e una sfera di centro xk+1

e raggio minore di ϵk/2 < 1/2k, tale che (clBk+1) ∩ Ak+1 = ∅. Sia ϵk+1 > 0 ilraggio di questa sfera.

Page 102: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

96 CAPITOLO 2. GLI SPAZI DI BANACH

La costruzione dei punti xk e delle palle Bk puo farsi perche gli Ak nonhanno punti interni e sono chiusi.

Dato che ϵk → 0, esiste x = lim xk e x ∈ ∩nclBn. Per quanto osservatosopra, x /∈ ∪An, ossia ∪

An = X ,

come si voleva provare.

Dimostrazione del TEOREMA 99, Teorema della mappa aperta.In questa dimostrazione interverra la “differenza algebrica di insiemi C, D

di Y :

C −D = c− d | c ∈ C , d ∈ D =∪d∈D

(C − d) .

Si noti che C − C = ∅ (e anche che C − C = 0, salvo nel caso in cui C ha ununico elemento).

Se C ha interno non vuoto anche

C −D =∪d∈D

(C − d)

ha interno non vuoto grazie alla continuita delle traslazioni, per ogni insiemeD (e quindi anche per D = C).

Inoltre, se C contiene punti interni, allora (clC)−(clC) contiene un intornodi 0.

Proviamo ora il teorema 99. Ricordiamo che per definizione, un operatoreA ∈ L(X, Y ) ha dominio uguale ad X.

Per provare che l’operatore A, suriettivo, trasforma aperti in aperti, esufficiente mostrare che l’immagine di una palla

BX,r = x ∈ X | ||x|| < r

contiene una palla BY,σ,

BY,σ = y ∈ Y | ||y|| < σ .

Cio prova che A0 e interno ad imA e, per traslazione, si trova che Ax0 e internoad imA per ogni x0 (nuovamente, si usa la continuita delle traslazioni).

Precisamente, proveremo che esiste un intornoW di 0 in Y che e contenutoin A(BX,2). Useremo per questo l’inclusione seguente, che vale per ogni r > 0ed r′ > 0:

BX,r −BX,r′ ⊆ BX,r+r′ . (2.49)

Page 103: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.8. IL TEOREMA DI BAIRE E LE SUE CONSEGUENZE 97

Consideriamo le palle

BX,2n = x ∈ X | ||x|| < 2n .

Dato cheX =

∪n

BX,2n

e che A e suriettivo, si trova

Y =∪n

cl (A(BX,2n))

e quindi, per il teorema di Baire almeno uno degli insiemi cl (A(BX,2n)) ha pun-ti interni. Moltiplicando per numeri positivi si vede che ciascuno degli insiemicl (A(BX,r)) contiene punti interni, grazie alla continuita della moltiplicazioneper scalari.

Da (2.49) si ha che

clA(BX,r)− clA(BX,r) ⊆ cl [A(BX,r)− A(BX,r)] ⊆ clA(BX,2r)

e quindi ciascun insieme clA(BX,2r) contiene un intorno di 0. Naturalmente,r e arbitrario: ogni insieme clA(BX,r) contiene un opportuno intorno di 0.

Rimane da provare che A(BX,r) stesso contiene un intorno di 0. Sia W unintorno di 0 contenuto in clA(BX,1). Completiamo la dimostrazione mostrandoche W ⊆ A(BX,2). Per questo basta provare

clA(BX,1) ⊆ A(BX , 2) .

Cio mostriamo ora. Sia per questo y ∈ clA(BX,1). Mostriamo che y ∈ A(BX,2).Si sa che clA(BX,1/2) contiene un intorno di 0. Dunque esiste x1 ∈ BX,1 taleche ||y − Ax1|| e cosı piccolo da aversi y − Ax1 ∈ clA(BX,1/2).

In modo analogo, clABX,1/4 contiene un intorno di 0 e quindi esiste x2 ∈BX,1/2 per cui (y − Ax1)− Ax2 ∈ clA(BX,1/4). Iterando questo procedimentoper ogni n si trova

x1 ∈ BX,1 tale che y −Ax1 ∈ clA(BX,1/2) cioe ||y −Ax1|| ≤ 1/2x2 ∈ BX,1/2 tale che (y −Ax1)−Ax2 ∈ clA(BX,1/4) cioe ||(y −Ax1)−Ax2|| ≤ 1/4...xn ∈ BX,1/2n tale che y −

∑nk=1 Axn ∈ clA(BX,1/2n) cioe ||y −

∑nk=1 Axn|| ≤ 1/2n .

Sia ora

x =+∞∑i=1

xi cosı che ||x|| ≤+∞∑i=1

1

2n< 2 .

Page 104: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

98 CAPITOLO 2. GLI SPAZI DI BANACH

Per questo vettore x vale

||y − Ax|| = lim ||y − Axn|| ≤ lim1

2n= 0 , ossia y = Ax con ||x|| < 2 .

Cio mostra che ogni y ∈ clA(BX1) e anche in A(BX,2) e conclude la dimostra-zione.

2.9 Lo spazio duale

Abbiamo gia visto la relazione tra i funzionali lineari e continui su X e lanozione geometrica di iperpiano. Cio suggerisce di studiare piu a fondo ifunzionali lineari continui, sia singolarmente che nel loro insieme, studiando leproprieta dello spazio di Banach X∗.

E’ ovvio che il funzionale 0, quello che ad ogni elemento di X associal’elemento nullo del campo scalare, e in X∗. Non e affatto ovvio che esistanoaltri elementi di X∗. Infatti:

Teorema 112 Esistono spazi lineari X, dotati di una metrica rispetto allaquale le operazioni di somma e moltiplicazioni per scalari sono continue e sucui nessun funzionale lineare diverso da 0 e continuo.

Ossia, in tal caso, nello spazio X non si trovano iperpiani.La dimostrazione e posposta.E’ quindi estremamente importante sapere che se X e uno spazio di Banach

allora X∗ ha “molti elementi. Cio e conseguenza del teorema seguente:

Teorema 113 (di Hahn-Banach) Sia X uno s.l.n. e sia Y un suo s.spazio.Sia L0 un funzionale lineare continuo su Y . Esiste un’estensione di L ad Xtale che

||L||X∗ = sup|Ly| | y ∈ Y , ||y||X = 1 .

Ossia, ogni funzionale lineare e continuo su Y puo estendersi ad X senzaalterarne la norma.

Si noti che nell’enunciato precedente si puo assumere che Y sia chiuso,perche l’operatore L0 si puo estendere per continuita alla chiusura del suodominio.

Per certe applicazioni (allo studio degli insiemi convessi, si veda il paragra-fo 2.9.1) e necessario provare una versione un po’ piu generale del Teorema 113;ossia e necessario provare i due teoremi seguente:

Teorema 114 Sia X uno spazio lineare su IR. Esista una funzione p: X → IR

Page 105: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 99

1. positivamente omogenea, ossia tale che p(tx) = tp(x) per ogni x eper ogni t ≥ 0;

2. subadditiva, ossia tale che p(x+ y) ≤ p(x) + p(y) per ogni x, y in X.

Sia Y un s.spazio di X e sia L0 un funzionale lineare definito su Y , tale che

L0x ≤ p(x) ∀x ∈ Y .

Esiste un’estensione L di L0 ad X che verifica

Lx ≤ p(x) ∀x ∈ X .

Teorema 115 Sia X uno spazio lineare su IC e sia p da X in IR una funzionetale che:

1. p(tx) = |t| · p(x) per ogni x in X e per ogni t ∈ IC;

2. p(x+ y) ≤ p(x) + p(y).

Sia Y un s.spazio di X e sia L0 un funzionale lineare definito su Y , tale che

|L0x| ≤ p(x) ∀x ∈ Y . (2.50)

Esiste un’estensione L di L0 ad X che verifica

|Lx| ≤ p(x) ∀x ∈ X .

Posponiamo le dimostrazioni, notando che la dimostrazione del Teore-ma 115 si ridurra, con un opportuno artificio, a quella del Teorema 114.

Dimostrazione del TEOREMA 113. La dimostrazione discende im-mediatamente dai Teoremi 114 e 115. Sia

M = sup|L0x| | x ∈ Y , ||x|| = 1 , p(x) =M ||x|| .

Nel caso reale, dal Teorema 114 si vede l’esistenza di L, funzionale lineare suX, che estende L0 e tale che

Lx ≤M ||x||

e quindi anche−Lx = L(−x) ≤M || − x|| =M ||x||

ossia|Lx| ≤M ||x|| . (2.51)

Nel caso complesso la disuguaglianza (2.51) figura direttamente nell’enun-ciato del Teorema 115. Dunque il Teorema 113 vale.

Mostriamo ora alcune conseguenze importanti. La prima e che X∗, dualedi X, ha “molti elementi. Piu precisamente,

Page 106: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

100 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 116 Per ogni x0 = 0 in X ed ogni m ∈ Φ, esiste L ∈ X∗ tale che

Lx0 = m, ||L|| = m

||x0||. (2.52)

Dim. Si sceglie come spazio Y la retta per 0 ed x0,

Y = λx0 | λ ∈ Φ .

Il s.spazio ha dimensione 1 e su esso e facile definire

L0(λx0) = λm .

Il funzionale L0 verifica (2.52) sui soli elementi di Y . Si usa quindi il Teoremadi Hahn-Banach per estendere L ad X.

In particolare si puo segliere m = 1 oppure m = ||x0|| oppure m = ||x0||2.In particolare, con quest’ultima scelta si trova

||L|| = ||x0|| .

Invece, scegliendo m = ||x0||, si trova

Corollario 117 Sia x0 ∈ X. Vale:

||x0|| = max||L||X∗=1

|Lx0| .

Dim. Si fissi x0 = 0 in X. Per ogni L ∈ X∗ di norma 1 si ha:

|Lx0| ≤ ||x0|| , ossia sup||L||X∗=1

||Lx0|| ≤ ||x0|| .

Il funzionale definito in (2.52) con m = ||x0|| ha norma 1 e per esso

|Lx0| = ||x0|| .

Osservazione 118 L’asserto del corollario precedente somiglia alla definizio-ne della norma di un funzionale,

||L|| = sup||x||=1

|Lx| (2.53)

Ma abbiamo provato che In generale, l’estremo superiore in 2.53 non e unmassimo, si veda il teorema 79.

Cio mostra una prima differenza importante tra uno spazio ed il suo duale,che commenteremo in seguito nel contesto del Teorema di Banach-Alaoglu,Teorema 152.

Page 107: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 101

Il Teorema 116 in particolare afferma che se un elemento x0 e diverso da0 allora esiste un funzionale L di X∗ che “lo vede non nullo; e, traslando, sex1 = x0, esiste un L ∈ X∗ tale che

Lx1 = Lx0 .

Dunque, X∗ ha cosı tanti elementi da distinguere quelli di X. Geometrica-mente, abbiamo provato l’esistenza di un iperpiano che non contiene ambeduegli elementi x0 ed x1. Questa osservazione puo essere estesa fino a “separaremediante iperpiani due insiemi convessi tra loro disgiunti. Prima di studiaregli insiemi convessi conviene pero introdurre una notazione comoda per indi-care l’azione degli elementi di X∗ su X. Invece di scrivere Lx, Ax ecc, usascrivere13

⟨⟨f, x⟩⟩per indicare il valore che il funzionale f ∈ X∗ assume sull’elemento x ∈ X (sinoti: l’elemento di X∗ e scritto prima di quello di X. In altri testi si trovascritto dopo). Inoltre, per distinguere immediatamente gli elementi di X daquelli di X∗, usa indicare questi ultimi con lettere greche, o con simboli deltipo x∗, y∗ ecc. se i simboli x, y,. . . si riservano agli elementi di X.

2.9.1 Applicazioni: Insiemi convessi

Per semplicita supponiamo che il campo scalare sia IR.Ricordiamo che un insieme A non vuoto si dice convesso quando ogni

segmento di estremi in A e tutto contenuto in A; ossia quando

x , y ∈ A =⇒ tx+ (1− t)y ∈ A ∀t ∈ [0, 1] .

Si verifica facilmente che gli iperpiani ed i semispazi sono insiemi convessie che l’intersezione di una qualsiasi famiglia di insiemi convessi e un insiemeche, se non e vuoto, e convesso.

Siano ora A e B due insiemi e sia x∗ ∈ X∗. Si dice che l’iperpiano

x | ⟨⟨x∗, x⟩⟩ = α

separa i due insiemi A e B se

A ⊆ x | ⟨⟨x∗, x⟩⟩ ≤ α , B ⊆ x | ⟨⟨x∗, x⟩⟩ ≥ α .13In realta la notazione comunemente usata e ⟨·, ·⟩. Noi usiamo la notazione ⟨⟨·, ·⟩⟩ perche la

notazione ⟨·, ·⟩ si usa anche per indicare i “prodotti interni nel contesto degli spazi di Hilbert.Dato che vedremo una relazione tra funzionali lineari e prodotti interni, e opportuno essereprecisi nel distinguere gli uni dagli altri.

Page 108: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

102 CAPITOLO 2. GLI SPAZI DI BANACH

Si dice che la separazione e stretta se esiste ϵ > 0 tale che

A ⊆ x | ⟨⟨x∗, x⟩⟩ ≤ α− ϵ , B ⊆ x | ⟨⟨x∗, x⟩⟩ ≥ α .

E’ ovvio che in generale due insiemi disgiunti non possono essere separatida iperpiani, si veda la figura 2.5 a sinistra. Per avere buoni risultati diseparazione dovremo lavorare con insiemi convessi. La figura 2.5 a destramostra che insiemi convessi e disgiunti non possono, in generale, separarsistrettamente.

Figura 2.5:

y

x

−0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5−3

−2

−1

0

1

2

3

y

x

Valgono pero i due teoremi seguenti, la cui dimostrazione viene posposta:

Teorema 119 Sia A ⊆ X un convesso aperto. Se x0 /∈ A allora esiste uniperpiano che separa x0 da A; ossia esiste x∗ ∈ X∗ tale che

⟨⟨x∗, x⟩⟩ ≤ ⟨⟨x∗, x0⟩⟩ ∀x ∈ A .

e

Teorema 120 Siano A, B convessi e disgiunti. Si ha:

• Se A e aperto, esiste un iperpiano che separa A e B;

• se A e chiuso e B e compatto allora esiste un iperpiano che separastrettamente A e B.

Di conseguenza:

Teorema 121 Sia H un s.spazio chiuso dello spazio di Banach X. Vale H =X se e solo se esiste x∗ ∈ X∗, x∗ = 0, tale che

H ⊆ kerx∗ .

Page 109: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 103

Dim. Se H = X, esiste x0 /∈ H e quindi per la seconda affermazione delTeorema 120, x0 si separa strettamente da H: esistono ϵ > 0 ed x∗ tale che

⟨⟨x∗, x0⟩⟩ ≤ α− ϵ , ⟨⟨x∗, h⟩⟩ ≥ α , ∀h ∈ H .

Essendo H un s.spazio, segue

α ≤ ⟨⟨x∗,−h⟩⟩ = −⟨⟨x∗, h⟩⟩ .

Dunque, ⟨⟨x∗, h⟩⟩ = α per ogni h ∈ H. Essendo H un s.spazio, 0 appartienead H e quindi ⟨⟨x∗, 0⟩⟩ = α, ossia α = 0. Si ha dunque

⟨⟨x∗, h⟩⟩ = 0 ∀h ∈ H ,

come volevamo.Il viceversa e ovvio.

Inoltre,

Teorema 122 Se X∗ e separabile, anche X lo e.

Dim. Sia x∗n un s.insieme denso in X∗. Si scelgano elementi xn ∈ X dinorma 1 e tali che ∣∣∣∣⟨⟨x∗n, xn⟩⟩∣∣∣∣ ≥ 1

2λn , λn = ||x∗n|| .

Combinando linearmente gli xn, con coefficienti razionali, si trova un s.insiemeA numerabile di X. Procedendo per assurdo, mostriamo che A e denso in X,che pertanto e separabile.

Se A non fosse denso in X, la sua chiusura sarebbe un s.spazio H di Xdiverso da X. Dunque, per il Teorema 121, si potrebbe trovare ϕ∗ ∈ X∗ taleche

A ⊆ H ⊆ kerϕ∗ .

Si sa che ϕ∗ = lim x∗nkper una opportuna successione (x∗nk

) cosı che

0 = lim ||ϕ∗ − x∗nk||X∗ ≥ lim

∣∣∣∣⟨⟨ϕ∗ − x∗nk, xnk

⟩⟩∣∣∣∣

= lim∣∣∣∣⟨⟨x∗nk

, xnk⟩⟩∣∣∣∣ ≥ lim

1

2λn

e quindi limλn = 0. D’altra parte, mentre

0 = ||ϕ∗||X∗ = lim ||x∗nk||X∗ = limλnk

.

La contraddizione trovata completa la dimostrazione.

Page 110: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

104 CAPITOLO 2. GLI SPAZI DI BANACH

Osservazione 123 Invece, il duale di uno spazio separabile puo non essereseparabile. Mostreremo infatti che l∞ e isometricamente isomorfo al duale dil1. Si sa gia che l∞ non e separabile mentre e facile verificare che l1 lo e.

Un’ulteriore conseguenza importante del Teorema 120 e la seguente: ogniinsieme A, anche non convesso, e contenuto nell’intersezione dei semispazi chelo contengono. Se A e convesso vale:

Teorema 124 Un insieme A non vuoto e convesso e chiuso se e solo se eintersezione dei semispazi chiusi che lo contengono.

Dim. L’intersezione di una famiglia di chiusi e un chiuso e l’intersezione diuna famiglia di convessi e un convesso. Dunque, se l’insieme non vuoto A eintersezione dei semispazi chiusi che lo contengono, A e convesso e chiuso.

Viceversa, sia B l’intersezione dei semispazi chiusi che contengono l’insiemeA. In generale, B ⊇ A. Dobbiamo provare che se l’insieme non vuoto A econvesso e chiuso allora vale l’uguaglianza. Per questo basta notare che sex0 /∈ A allora, per il Teorema 120, esiste un iperpiano che separa strettamenteA da x0. E quindi x0 non appartiene nemmeno a B.

Si chiamano iperpiani di supporto all’insieme convesso e chiuso A quelliche godono della seguente proprieta: esiste x0 ∈ clA tale che

A ⊆ x | ⟨⟨x∗, x⟩⟩ ≤ ⟨⟨x∗, x0⟩⟩ .

Piu precisamente, in questo caso si dice che l’iperpiano e di supporto nel puntox0.

Naturalmente, se esiste un iperpiano di supporto ad A in x0 allora x0 none interno ad A. Piu precisamente:

Teorema 125 Sia A un convesso con interno non vuoto. Per ogni x0 ∈ ∂A,esiste almeno un iperpiano di supporto ad A in x0.

Dim. Usiamo la proprieta seguente degli insiemi convessi, che non proviamo:se A e convesso ed il suo interno e non vuoto allora l’interno di A e convessoe denso in A.

Dunque intA e un aperto convesso, ovviamente separato da x0 ∈ ∂A: peril Teorema 119, esiste x∗ tale che

⟨⟨x∗, x⟩⟩ < ⟨⟨x∗, x0⟩⟩ ∀x ∈ intA

e la disuguaglianza, non stretta, si estende per continuita ad A.L’iperpiano di supporto e

x | ⟨⟨x∗, x⟩⟩ = ⟨⟨x∗, x0⟩⟩ .

Page 111: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 105

Osservazione 126 • Il teorema precedente puo anche estendersi al casoin cui l’interno di A e vuoto. Essendo A convesso, si prova l’esistenzadi un piu piccolo s.spazio (traslato) contenente A. Il teorema si puoenunciare in tale s.spazio. Non insistiamo su cio.

• La figura 2.6 mostra che uno stesso iperpiano puo essere di supportoin infiniti punti, e che in un punto si possono avere infiniti iperpiani disupporto.

Figura 2.6:

−4 −3 −2 −1 0 1 2 3 4−4

−3

−2

−1

0

1

2

3

4

Abbiamo dunque due modi di descrivere un insieme convesso e chiuso,tra loro equivalenti: il primo consiste nell’elencare i punti dell’insieme ed ilsecondo consiste nell’elencare gli iperpiani di supporto all’insieme. Questosecondo modo assume un aspetto particolare nel caso in cui l’insieme A el’epigrafo di una funzione, caso che ora andiamo a studiare.

2.9.2 Applicazioni: Funzioni convesse

Ancora, supponiamo di lavorare in spazi lineari su IR e studiamo certe pro-prieta delle funzioni convesse definite su uno spazio di Banach X. Per sempli-cita supporremo che esse siano definite su insiemi, ovviamente convessi, dotatidi punti interni.

Page 112: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

106 CAPITOLO 2. GLI SPAZI DI BANACH

Ricordiamo che si chiama epigrafo di una funzione f definita su X, avalori reali, l’insieme

Epi(f) = (x, t) | t ≥ f(x) ⊆ X × IR .

E’ facile provare:

Teorema 127 La funzione f e convessa se e solo se il suo epigrafo e uninsieme convesso.

Un iperpiano di supporto in (x0, t0) alla chiusura dell’epigrafo di f e rap-presentato da una coppia (x∗, ϕ) ∈ X∗ × IR tale che, per ogni punto (x, t)dell’epigrafo, valga

⟨⟨x∗, x⟩⟩+ ϕ · t ≤ ⟨⟨x∗, x0⟩⟩+ ϕ · t0

ossia⟨⟨x∗, (x− x0)⟩⟩ ≤ (−ϕ) · (t− t0) . (2.54)

Notiamo che se ϕ = 0 si ha

⟨⟨x∗, x⟩⟩ ≤ ⟨⟨x∗, x0⟩⟩ ∀x ∈ domf .

In questo caso x0 deve appartenere alla frontiera di domf . Supponendo dilavorare in punti interni al dominio, avremo ϕ = 0 e si ha −ϕ > 0. Infatti: sex∗ = 0 allora deve essere

0 ≤ (−ϕ)(t− t0) ∀t ≥ t0 ossia −ϕ > 0.

Dunque non e restrittivo assumere −ϕ = 1 perche dividendo i due membri per−ϕ si vede che la (2.54) puo scriversi

⟨⟨x∗, x− x0⟩⟩ ≤ t− t0 .

Supponiamo ora che l’epigrafo di f sia chiuso. In questo caso t0 = f(x0)mentre t ≥ f(x). Dunque:

Teorema 128 Se l’epigrafo di f e chiuso allora il funzionale (x∗, 1) ∈ X∗×IRe di supporto all’epigrafo di f in (x0, f(x0)) se e solo se

⟨⟨x∗, x− x0⟩⟩ ≤ f(x)− f(x0) ∀x ∈ domf . (2.55)

La (2.55) si scrive anche

f(x) ≥ ⟨⟨x∗, x− x0⟩⟩+ f(x0)

e quindi, se f(x) e convessa,

Page 113: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 107

• il grafico e sopra a tutti gli iperpiani di supporto;

• il numero f(x) e l’estremo superiore dei valori delle funzioni lineari affiniil cui grafico e sotto quello di f . L’estremo superiore e un massimo, inogni punto x, se l’epigrafo e chiuso.

La (2.55) e la pratica con i grafici delle funzioni da IR in IR suggerisce:

Definitione 129 Un funzionale x∗ che verifica (2.55) si chiama un sottodif-ferenziale di f in x0.

L’insieme dei sottodifferenziali di f in x0 si chiama il sottodifferen-ziale di f in x0.

Il sottodifferenziale di f in x0 si indica col simbolo ∂f(x0).

Osserviamo che il sottodifferenziale puo essere l’insieme vuoto ma, come sie gia notato, in tal caso il punto x0 deve appartenere alla frontiera del dominiodi f :

Esempio 130 Sia X = IR e sia domf = [0,+∞), f(x) = −√x. Si vede

facilmente che ∂f(0) = ∅.

Invece, come si e notato il sottodifferenziale e non vuoto nei punti internial dominio di f .

La proprieta di avere epigrafo chiuso e ovviamente importante nei problemidi ottimizzazione e merita una definizione specifica:

Definitione 131 Una funzione (anche non convessa) con epigrafo chiuso sichiama semicontinua inferiormente. Una funzione f si dice semicontinuasuperiormente se −f e semicontinua inferiormente.

E’ facile immaginare che il sottodifferenziale sia uno strumento utile per ilcalcolo dei minimi. Infatti,

Teorema 132 Sia f convessa e sia non vuoto il suo sottodifferenziale in x0.Il punto x0 e punto di minimo se e solo se 0 ∈ ∂f(x0).

Dim. Immediate, leggendo la (2.55) con x∗ = 0.

Page 114: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

108 CAPITOLO 2. GLI SPAZI DI BANACH

2.9.3 Dimostrazioni posposte

Dimostrazione del TEOREMA 112.Indichiamo con X l’insieme delle (classi di equivalenza di) funzioni f(x)

definite su (0, 1) e tali che ∫ 1

0

√|f(x)| dx < +∞ .

La disuguaglianza√a+ b ≤

√a+

√b ∀a ≥ 0 , b ≥ 0 (2.56)

permette di provare che X e uno spazio vettoriale e che

d(f, g) =∫ 1

0

√|f(x)− g(x)| dx

e una distanza invariante per traslazioni su X (per provare la disuguaglianzatriangolare si usa la (2.56)).

Si puo provare che lo spazio X e completo.Lo spazio X ha una proprieta curiosa: l’unico convesso (non vuoto) di X

che e anche aperto e X stesso. Accettando questa proprieta, che proveremo inseguito, si vede che l’unico funzionale L lineare e continuo su X e quello nullo.Infatti, per ogni ϵ > 0, l’insieme L−1(−ϵ, ϵ) non e vuoto, perche contiene 0; econvesso perche L e lineare e, se L e anche continuo, e aperto; e quindi e tuttolo spazio X. Dunque,

LX ⊆∩ϵ>0

(−ϵ, ϵ) = 0 ;

ossia, L e il funzionale nullo.Per completare la dimostrazione, consideriamo un aperto V di X, non

vuoto e convesso e proviamo che V = X. A meno di traslazioni, si puosupporre 0 ∈ V . Dunque puo trovarsi r > 0 tale che

B(0, r) = x | d(x, 0) < r ⊆ V .

Fissiamo una qualsiasi f ∈ X e sia n tale che

1√nd(f, 0) < r .

Consideriamo ora la funzione integrale

F (x) =∫ x

0

√|f(s)| ds .

Page 115: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 109

Vale F (0) = 0 ed F (1) = d(f, 0). La continuita di F implica l’esistenza di unprimo punto x1 tale che

F (x1) =∫ x1

0

√|f(s)| ds = 1

nd(f, 0) ;

di un primo punto x2 tale che∫ x2

x1

√|f(s)| ds = 1

nd(f, 0) .

Analogamente, si trovano esattamente n punti xi tali che∫ xi

xi−1

√|f(s)| ds = 1

nd(f, 0) (ove x0 = 0).

Per 1 ≤ i ≤ n definiamo le funzioni

gi(s) =

nf(s) se xi−1 < s < xi0 altrimenti.

In questo modo,

d(gi, 0) =

√n

nd(f, 0) =

1√nd(f, 0) < r ,

ossia gi ∈ B(0, r) ⊆ V . Inoltre,

nf =n∑i=1

gi ossia f =1

n

n∑i=1

gi .

L’ultima uguaglianza mostra che anche f appartiene al convesso V .L’arbitrarieta di f implica che V = X.

Dimostrazione del TEOREMA 114.La dimostrazione del Teorema 114 fa uso del Lemma di Zorn, che ora

enunciamo. Sia F un insieme parzialmente ordinato. Chiamiamo catenaogni s.insieme di F che e totalmente ordinato.

Sia M un qualsiasi s.insieme di F e sia z ∈ F . Diciamo che z e unmaggiorante di M se per ogni m ∈ M vale m ≤ z; diciamo che z0 e unelemento massimale di M se z0 ∈M e se, inoltre, le condizioni m ∈M edm ≥ z0 implicano m = z0.

Un elemento massimale di M confrontabile con tutti gli elementi di M sichiama un massimo.

Page 116: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

110 CAPITOLO 2. GLI SPAZI DI BANACH

Si noti che un elemento massimale z0 puo non essere un massimo percheM puo contenere elementi non confrontabili con z0. E quindi un insiemeM parzialmente ordinato puo avere piu elementi massimali, ma ha al piu unmassimo.

Invece, una catena ha al piu un solo elemento massimale che e anche il suomassimo.

Il Lemma di Zorn si enuncia come segue:

Lemma 133 (di Zorn) Sia F parzialmente ordinato. Se ogni catena di Fammette maggioranti, allora esiste in F un elemento massimale.

Osservazione 134 Si noti che l’enunciato del Lemma di Zorn non richiedeche ogni catena debba avere massimo; ossia, nell’applicare il Lemma di Zorn,basta mostrare l’esistenza in F di maggioranti delle singole catene.

Possiamo ora provare il Teorema 114. In questo caso Φ = IR.Notiamo che l’enunciato del teorema non fa alcun riferimento alla presenza

di norme su X; e quindi nessuna considerazione topologica puo usarsi nelladimostrazione.

L’idea della dimostrazione del Teorema 114 e la seguente: si prova che seY = X allora esiste un’estensione lineare propria L1 di L0 e che L1, definito sulsottospazio Y1 propriamente contenente Y0, soddisfa ancora alla disuguaglianza

L1x ≤ p(x) ∀x ∈ Y1 .

Per indicare che vale questa disuguaglianza, diremo che L1 e dominata da p.Questa e la parte tecnica della dimostrazione, che vedremo in seguito. Ac-

cettando cio, si indichi con F la famiglia di tutte le estensioni di L0 dominateda p; ossia, L ∈ F se L estende L0 ed Lx ≤ p(x) per ogni x nel dominio di L.

In F si introduce una relazioni d’ordine parziale ponendo

L1 ≤ L2 se L2 estende L1.

Si vede immediatamente che ogni catena C in F ammette come maggiorantequell’elemento L ∈ F il cui dominio e l’unione dei domini di tutti gli elementidella catena C e cosı definito: se x ∈ domL allora esiste L′ ∈ C (non unico) ilcui dominio contiene x. Si definisce

Lx = L′x .

Si e detto che L′ non e unico; ma l’essere C una catena prova che la trasfor-mazione L appena definita e univoca e lineare.

Page 117: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 111

E’ ovvio che L e dominato da p.Discende dal Lemma di Zorn che F ha un elemento massimale L: un’esten-

sione L di L0, dominata da p, non ulteriormente estendible, e quindi condominio X.

Proviamo ora la parte tecnica della dimostrazione, consistente nella costru-zione dell’estensione L1. Prima pero notiamo:

Osservazione 135 Sia X uno spazio di Banach di dimensione infinita e siaen un sistema linearmente indipendente di elementi, tutti di norma 1. Defi-niamo

L0en = n

e quindi estendiamo L0 a

span en = ∑finita

αiei .

L’argomento precedente basato sul lemma di Zorn puo ripetersi anche senzafar intervenire la funzione p(x) e conduce a provare l’esistenza di un funzionaleL definito su X e che estende L0. Cio mostra che esistono funzionali linearinon continui, il cui dominio e tutto lo spazio X.

Veniamo ora a costruire una opportuna estensione L1 di L0, dominata dap.

Essendo Y0 = X, esiste x0 /∈ Y0. Scegliamo per Y1 lo spazio lineare generatoda Y0 e dal x0,

Y1 = y + tx0 | y ∈ Y0 , t ∈ IR .Se vogliamo che L1 sia un’estensione lineare di L0, dovra essere

L1(y + tx0) = L1y + tL1x0 = L0y + tL1x0

e il problema si riduce a trovare un valore ξ per L1x0, in modo tale che L1 siadominato da p. Si vuole cioe che valga

L0y + tξ ≤ p(y + tx0) , ∀y ∈ Y0 , t ∈ IR .

Distinguiamo i due casi t > 0 e t < 0. Se t > 0 allora si richiede

L0y

t+ ξ ≤ p(

y

t+ x0) ossia ξ ≤ p(

y

t+ x0)− L0

y

t; (2.57)

Se t < 0 si richiede

L0y

t+ ξ ≥ − 1

−tp(y + tx0) = −p(−y

t− x0) ,

Page 118: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

112 CAPITOLO 2. GLI SPAZI DI BANACH

ossiaξ ≥ −L0

y0t− p(−y

t− x0) . (2.58)

Dunque e da provare l’esistenza di un numero ξ che verifica la (2.57) per t > 0e la (2.58) per t < 0.

Notiamo che, essendo y arbitrario in Y0, anche y/t, t > 0 e −y/t, t < 0sono arbitrari elementi di Y0. Dunque, le (2.57), (2.58) equivalgono a

supy∈Y0

−L0y − p(−y − x0) ≤ ξ ≤ infy∈Y0

p(y + x0)− L0y .

Dunque. il numero ξ esiste se si puo provare che

−L0y − p(−y − x0) ≤ −L0y + p(y + x0) ∀y , y ∈ Y0 .

Quest’eguaglianza equivale a

L0(y − y) ≤ p(y + x0) + p(−y − x0)

e questa vale certamente perche, per ipotesi, L0 e dominato da p. Dunque siha:

L0(y − y) ≤ p(y − y) = p(y + x0 − x0 − y) ≤ p(y + x0) + p(−x0 − y) .

Cio completa la dimostrazione nel caso in cui Φ = IR.

Dimostrazione del TEOREMA 115.Il caso Φ = IC si fa discendere dal precedente, procedendo come segue.Si nota che se X e uno spazio lineare complesso, allora esso e anche uno

spazio lineare reale. Indichiamo allora con i simboli X(R) ed Y0,(R) gli spazilineari reali i cui elementi sono quelli diX e di Y0. Sia inoltre L0,(R) il funzionalelineare definito su Y0,(R) da

L0,(R)x = ℜeL0x .

La (2.50) mostra che L0,(R) e dominato da p e quindi che esiste un’estensioneL(R) di L0,(R) ad X(R), ancora dominata da p. Inoltre, essendo LRx ≤ p(x) perogni x ∈ X, vale anche

L(R)(−x) ≤ p(−x) = p(x)

ossia,−p(−x) ≤ L(R)(x) ≤ p(x) . (2.59)

Page 119: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 113

Definiamo ora l’operatore

Lx = L(R)x− iL(R)(ix) .

Si verifica immediatamente che quest’operatore e lineare su X (con Φ = IC).Inoltre, se x ∈ Y0, vale

Lx = ℜeL0x− iℜe [iL0x] = ℜeL0x− iℜe iℜeL0x− ImL0x = L0x .

Dunque, L estende L0 e inoltre vale |Lx| ≤ p(x) per ogni x ∈ X. Infatti se cionon fosse potrebbe trovarsi x0 tale che

|Lx0| > p(x0) .

Con θ = argLx0 avremmo

LRx0 = ℜeLx0 = |eiθLx0| = |Lx0| > p(x0) .

Cio contrasta con (2.59).La dimostrazione e ora completa.

Dimostrazione del TEOREMA 119.Ricordiamo che si e supposto Φ = IR.Sia A convesso aperto e non vuoto. A meno di una traslazione, si puo

supporre 0 ∈ A. Definiamo il seguente funzionale pA su X:

pA(x) = inft > 0 | x ∈ tA

dove con tA si intende l’insieme ty | y ∈ A.E’ chiaro che il funzionale pA e non negativo, positivamente omogeneo.

Inoltre, esso e subadditivo. Infatti, sia ϵ > 0 e siano t1 = pA(x) + ϵ, t2 =pA(y) + ϵ. Vale quindi

(x+ y) ∈ [pA(x) + ϵ]A+ [pA(y) + ϵ]A = [pA(x) + pA(y) + 2ϵ]A .

Dunque, per ogni ϵ > 0 vale pA(x+ y) ≤ pA(x) + pA(y) + 2ϵ. La subadditivitasegue dall’arbitrarieta di ϵ.

Consideriamo ora un punto x0 /∈ A ed il s.spazio

X0 = sx0 | s ∈ IR .

La convessita di A implica la convessita di A∩X0 e quindi l’insieme s | sx0 ∈A e un segmento a cui non appartiene 1. Si definisca il funzionale lineare L0

su X0,L0(sx) = s .

Page 120: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

114 CAPITOLO 2. GLI SPAZI DI BANACH

Questo funzionale verifica

L0(x0) = 1 , L0(sx0) ≤ pA(sx0) .

La prima proprieta e immediata e la seconda e ovvia se s ≤ 0. Che essa valgaanche se s > 0 si vede notando che pA(x0) ≥ 1 e quindi

L0(sx0) = s ≤ spA(x0) = pA(sx0) .

Notato cio, il Teorema di Hahn–Banach, mostra che il funzionale L0 siestende ad un funzionale L lineare e continuo suX, che ancora verifica ⟨⟨L, x⟩⟩ ≤pA(x) e quindi

⟨⟨L, x⟩⟩ ≤ pA(x) ≤ 1 ∀x ∈ A , ⟨⟨L, x0⟩⟩ = 1 .

Il funzionale pA si chiama il finzionale di Minkowski del convesso A.

Dimostrazione del TEOREMA 120.Il Teorema 120 e immediata conseguenza del Teorema 119. Studiamo prima

il caso in cui A e aperto. Fissiamo a0 ∈ A e b0 ∈ B e sia x0 = a0 − b0. Siainoltre

C = A−B = a− b | a ∈ A , b ∈ B =∪b∈B

(A− b) .

E’ facile vedere che C e aperto (anche se B non lo e); e che x0 ∈ C. Dunque,0 ∈ D = C − x0 mentre x0 /∈ D. Infatti, se fosse x0 ∈ D, esisterebbero a ∈ A,b ∈ B per cui

x0 = a− b− x0 ossia a = b

mentre per ipotesi A e B sono disgiunti.Dunque, per il Teorema 119, x0 si separa da D con un funzionale x∗:

⟨⟨x∗, d⟩⟩ ≤ ⟨⟨x∗, x0⟩⟩ ∀d ∈ D .

Dunque,

⟨⟨x∗, (a− b+ x0)⟩⟩ < ⟨⟨x∗, x0⟩⟩ ∀a ∈ A , b ∈ B ;

Ossia,⟨⟨x∗, a⟩⟩ < ⟨⟨x∗, b⟩⟩ .

Cio prova la prima parte del teorema.La dimostrazione della seconda parte si riconduce a quella della prima,

grazie al lemma seguente:

Page 121: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.9. LO SPAZIO DUALE 115

Lemma 136 Siano K e C due s.insiemi di X, K compatto non vuoto e Cchiuso. Se K ∩ C = ∅, allora esiste una sfera B di X tale che

(K +B) ∩ C = ∅ .

Dim. Per ogni k ∈ K esiste una opportuna sfera Bϵ(k) tale che k + 2Bϵ(k) ∩(C + Bϵ(k)) = ∅. L’unione degli aperti ki + 2Bϵ(k) copre K e quindi esistonoki, in numero finito, diciamo n, tali che

K ⊆n∪i=1

(ki + 2Bϵ(ki)

).

Sia B la sfera di minimo raggio tra le sfere Bϵ(ki). Allora,∪(

ki + 2Bϵ(ki)

)non

interseca C +B e quindi vale anche:

K +B ⊆+∞∪i=1

(ki +Bϵ(ki) +B

)⊆

n∪i=1

(ki +Bϵ(ki) +Bϵ(ki)

)e quest’insieme non interseca C.

E’ ora facile provare la seconda parte del Teorema 115. Sia Bϵ una sferatale che A1 = A+Bϵ non intersechi B. Gli insiemi A1 e B verificano le ipotesidella prima parte del teorema e quindi esiste x∗ tale che

sup⟨⟨x∗, a⟩⟩ | a ∈ A1 ≤ inf⟨⟨x∗, b⟩⟩ | b ∈ B .

Cio prova che x∗ separa A e B. Proviamo ora che la separazione e stretta.Notiamo che

⟨⟨x∗, A1⟩⟩ = ⟨⟨x∗, x⟩⟩ | x ∈ A1

e un intervallo aperto di IR. Infatti, sia α = ⟨⟨x∗a0⟩⟩ ∈ ⟨⟨x∗, A1⟩⟩ e Bσ =x | ||x|| < σ una sfera tale che a0 + Bσ ∈ A1. Allora, ⟨⟨x∗, (a0 + Bσ)⟩⟩e un intervallo non ridotto ad un sol punto perche il funzionale x∗ non ezero; e dunque α e interno ad ⟨⟨x∗, A1⟩⟩. D’altra parte, ⟨⟨x∗, A⟩⟩ e compattoe contenuto nell’aperto ⟨⟨x∗, A1⟩⟩ e quindi ha distanza positiva dall’insieme⟨⟨x∗, B⟩⟩, che non interseca ⟨⟨x∗, A1⟩⟩. Cio prova che la separazione e stretta.

Osservazione 137 Abbiamo enunciato i teoremi di separazione assumendoΦ = IR per semplicita. Tali teoremi possono estendersi al caso Φ = IC. Inquesto caso le diseguaglianze valgono tra le parti reali. Si hanno cioe condizionidel tipo

supℜeLa | a ∈ A ≤ infℜeLb | b ∈ B .

Page 122: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

116 CAPITOLO 2. GLI SPAZI DI BANACH

2.10 Convergenza debole e debole stella

Si e visto che in uno spazio di Banach di dimensione infinita i compatti sono“rari. D’altra parte, si sa dai corsi precedenti che la proprieta di compattezzae cruciale nello studio dei problemi di minimo. Infatti:

Teorema 138 (di Weierstrass) Una funzione f continua su un insiemecompatto K ammette sia minimo che massimo.

Accenniamo alla dimostrazione, che dovrebbe essere nota: per provare l’e-sistenza del minimo, si costruisce una successione minimizzante (kn) in K,ossia una successione tale che

lim f(kn) = inff(k) | k ∈ K .

Si usa la compattezza di K per estrarre una sottosuccessione (knr) convergentea k0 ∈ K; e la continuita di f per concludere

f(k0) = lim f(knr) = inff(k) | k ∈ K . (2.60)

Cio prova che k0 e punto di minimo.

Osservazione 139 Alla medesima conclusione si giunge se la funzione f , in-vece di essere continua, ha soltanto epigrafo chiuso, ossia e semicontinuainferiormente. Infatti in tal caso da knr → k0, f(knr) → inff(k) | k ∈ K.Se l’epigrafo e chiuso si ha

(k0, inff(k) | k ∈ K) ∈ Epif ;

ossia, invece della (2.60), vale

f(k0) ≤ lim f(knr) = inff(k) | k ∈ K .

Ovviamente la disuguaglianza stretta non puo valere, e quindi, nella sola ipo-tesi di semicontinuita inferiore, segue la (2.60); ossia segue che k0 e punto diminimo.

E’ facile vedere che:

• se un insieme e compatto in una topologia, tale rimane anche in topologiemeno fini;

• se una funzione e continua oppure semicontinua inferiormente rispettoad una topologia, tale rimane anche in topologie piu fini.

Page 123: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.10. CONVERGENZA DEBOLE E DEBOLE STELLA 117

Dunque in uno spazio di Banach conviene introdurre topologie meno fini diquella della norma, in modo da avere piu insiemi compatti; ma sufficientementefini in modo tale che almeno opportune classi di funzioni continue rimangano,se non continue, almeno semicontinue inferiormente.

Noi ci limiteremo ad introdurre concetti di convergenza per topologie menofini di quella della norma. Non descriveremo invece la topologia.

Definitione 140 Sia (xn) una successione in uno spazio di Banach X. Dicia-mo che (xn) converge debolmente ad x0 se

lim⟨⟨x∗, xn⟩⟩ = ⟨⟨x∗, x0⟩⟩ ∀x∗ ∈ X∗ .

Per indicare la convergenza debole si usa uno dei due simboli

w− limxn = x0 oppure xn x0 .

La definizione stessa di convergenza debole mostra che:

Teorema 141 Ogni x∗ ∈ X∗ e continuo rispetto alla convergenza debole disuccessioni di X.

Supponiamo ora di sapere che stiamo lavorando nello spazio di BanachX∗, duale dello spazio di Banach X. In X∗ si puo definire la convergenzadebole, come sopra, facendo intervenire il suo duale; ma si puo anche definirela convergenza debole stella, come segue:

Definitione 142 Sia (x∗n) una successione in X∗. Diciamo che (x∗n) conver-ge in senso debole stella ad x∗0 se

lim⟨⟨x∗n, x⟩⟩ = ⟨⟨x∗0, x⟩⟩ ∀x ∈ X .

Per indicare la convergenza debole stella si usa uno dei due simboli

w∗− limx∗n = x0 oppure x∗n x0 .

(la notazione con la mezza freccia e la stessa per la convergenza debole e laconvergenza debole stella. Il contesto evita ambiguita).

E’ facile vedere che la convergenza in norma implica la convergenza debole,rispettivamente debole stella. Il viceversa, in dimensione infinita, non vale.

Esempio 143 Sia X = L2(0, 2π). Vedremo che (L2(0, 2π))∗ e isometricamen-te isomorfo ad L2(0, 2π) stesso. In particolare ogni g ∈ L2(0, 2π) si interpretacome elemento di (L2(0, 2π))∗, quell’elemento definito da

f −→∫ 2π

0g(x)f(x) dx .

Page 124: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

118 CAPITOLO 2. GLI SPAZI DI BANACH

Si sa, dalla teoria della serie di Fourier, che ogni f ∈ L2(0, 2π) si rappre-senta

f(x) =k=+∞∑k=−∞

fkeikx , fk =

1√2π

∫ 2π

0f(x)e−ikx dx = ⟨⟨ek, f⟩⟩

con ek = eikx. Si sa, dalla teoria della serie di Fourier, che

lim fk = 0 .

Questo vuol dire che,w∗− lim ek = 0 .

Ma,||ek||2 =

√2π

e quindi la successione (ek) non tende a zero in norma.

Vale pero:

Teorema 144 Il teorema di unicita del limite vale sia per la convergenzadebole che per la convergenza debole stella.

Dim. Sew− lim xn = x0 ed anche w− lim xn = y0

allora si ha

⟨⟨x∗, (x0 − y0)⟩⟩ = lim⟨⟨x∗, xn⟩⟩ − ⟨⟨x∗, xn⟩⟩ = 0

per ogni x∗ ∈ X∗. Dunque x0 ed y0 sono indistinguibili da elementi di X∗. E’conseguenza del Teorema di Hahn-Banach che x0 = y0.

L’asserto relativo alla convergenza debole stella e invece elementare: sia

w∗− limx∗n = x∗0 ed anche w∗− limx∗n = y∗0 .

Si ha⟨⟨[x∗0 − y∗0], x⟩⟩ = lim⟨⟨x∗n, x⟩⟩ − ⟨⟨x∗n, x⟩⟩ = 0

per ogni x ∈ X. E quindi x∗ = y∗.

Esistono alcune relazioni importanti tra la convergenza debole, oppuredebole stella, e le proprieta che valgono in norma. Tra queste:

Teorema 145 Ogni successione convergente in senso debole stella e limitatanella norma di X∗.

Page 125: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.10. CONVERGENZA DEBOLE E DEBOLE STELLA 119

Dim. Sia x ∈ X. Se w∗− limx∗n = x∗ allora

lim⟨⟨x∗n, x⟩⟩ = ⟨⟨x∗, x⟩⟩ .

Dunque, per ogni x ∈ X esiste un numero Mx, dipendente da x, tale che

|⟨⟨x∗n, x⟩⟩| < Mx .

Il teorema di Banach-Steinhaus mostra che l’insieme dei funzionali x∗n e limi-tato nella norma di X∗.

Un asserto analogo vale anche per la convergenza debole, ed anzi il risultatorelativo alla convergenza debole e un corollario del precedente. Per provarlo,abbiamo bisogno di una premessa. Ogni x ∈ X si puo vedere come funzionalelineare continuo su X∗. Basta associare ad esso il funzionale

x∗ → ⟨⟨x∗, x⟩⟩ . (2.61)

Dunque, ogni elemento x ∈ X si puo porre in corrispondenza con un elementojx ∈ (X∗)∗, duale di X∗.

Lo spazio (X∗)∗ si chiama il biduale di X e si indica col simbolo X∗∗.Vale:

Teorema 146 La trasformazione j da X in X∗∗ definita in (2.61) e isome-trica.

Dim. Dobbiamo provare che

||x||X = ||jx||X∗∗ ,

ossia:||x||X = sup

||x∗||X∗|⟨⟨x∗, x⟩⟩| .

Questo e l’asserto del Corollario (117).

Osservazione 147 In particolare segue che j e una trasformazione iniettiva.Vedremo che, in generale, essa non e suriettiva.

Possiamo ora provare:

Corollario 148 Ogni successione debolmente convergente in X e limitata innorma.

Page 126: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

120 CAPITOLO 2. GLI SPAZI DI BANACH

Dim. Sia (xn) una successione in X, debolmente convergente ad x0. Cio vuoldire che

lim⟨⟨x∗, xn⟩⟩ = ⟨⟨x∗, x0⟩⟩ ∀x∗ ∈ X∗ ,

ossialim⟨⟨jxn, x∗⟩⟩ = ⟨⟨jx0, x∗⟩⟩ ∀x∗ ∈ X∗ .

Dunque, la successione (jxn) converge in X∗∗ a jx0, nel senso debole stella ed

e quindi limitata in X∗∗. Il Teorema 146 implica che (xn) e limitata in X.

Osservando con attenzione la dimostrazione del Teorema 145 si vede che:

Teorema 149 vale:

• se w− limxn = x0 allora lim inf ||xn||X ≥ ||x0||X ;

• se w∗ − limx∗n = x∗0 allora lim inf ||x∗n||X∗ ≥ ||x∗0||X∗.

Dim. Proviamo l’asserto relativo alla convergenza debole stella.Per ogni x, con ||x||X ≤ 1, vale

⟨⟨x∗n, x⟩⟩ ≤ ||x∗n||X∗

e dunque⟨⟨x∗0, x⟩⟩ = lim⟨⟨x∗n, x⟩⟩ ≤ lim inf ||x∗n||X∗ .

Da qui:

||x∗0||X∗ = sup||x||X=1

⟨⟨x∗0, x⟩⟩ = sup||x||X=1

lim⟨⟨x∗n, x⟩⟩ ≤ lim inf ||x∗n||X∗ .

L’asserto relativo alla convergenza debole si deduce dall’asserto relativoalla convergenza debole stella mediante il Teorema 146:

||x0||X = sup||x∗||X∗=1

⟨⟨x∗, x0⟩⟩ = sup||x∗||X∗=1

lim⟨⟨x∗, xn⟩⟩ = sup||x∗||X∗=1

lim⟨⟨jxn, x∗⟩⟩ ≤

sup||x∗||X∗=1

lim inf ||jxn||X∗∗ ||x∗||X∗ = lim inf ||jxn||X∗∗ = lim inf ||xn||X .

Il Teorema 149 puo riformularsi dicendo che la norma di X e debolmentesemicontinua inferiormente e la norma di X∗ e debolmente stella semicontinuainferiormente.

Grazie al Teorema di Weierstrass, segue che la norma ammette minimosugli insiemi che sono compatti rispetto alla convergenza debole oppure debolestella.

Proviamo ora:

Page 127: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.10. CONVERGENZA DEBOLE E DEBOLE STELLA 121

Teorema 150 Sia A un insieme sequenzialmente debolmente chiuso in X.Allora, A e anche chiuso in norma. Se A e sequenzialmente debolmente stellachiuso in X∗, esso e anche chiuso nella norma di X∗.

Dim. Sia A chiuso rispetto alla convergenza debole. Sia (xn) una successionein A, che converge in norma ad un x0.

La convergenza in norma implica la convergenza debole, e quindi (xn)converge debolmente ad x0. Dato che A e debolmente chiuso, si ha x0 ∈ A; equindi A e chiuso in norma. L’assero relativo alla convergenza debole stella siprova in modo analogo.

L’esempio 143 mostra che la superficie di una sfera di L2(0, 2π), pur es-sendo chiusa in norma, non e debolmente chiusa. Combinando questo colteorema precedente si vede che che la topologia della convergenza debole eeffettivamente meno fine di quella della norma.

Vale:

Teorema 151 Sia A un sottoinsieme di uno spazio di Banach X. Sia Aconvesso e chiuso rispetto alla norma. L’insieme A e anche chiuso rispettoalla convergenza debole.

Dim. Sia (xn) una successione a valori in A, debolmente convergente ad x0.Dobbiamo provare che x0 appartiene ad A. Cio discende dai teoremi di se-parazione: se x0 /∈ A, allora esiste x∗ ∈ X∗ che separa x0 da A. Inoltre, laseparazione e stretta perche l’insieme A e chiuso in norma e l’insieme costituitodal solo punto x0 e compatto. Dunque, esiste ϵ > 0 tale che

⟨⟨x∗, x0⟩⟩+ ϵ < inf ⟨⟨x∗, x⟩⟩ | x ∈ A ≤ inf⟨⟨x∗, xn⟩⟩ .

Cio contrasta con l’ipotesi che (xn) converge debolmente ad x0.

E’ bene notare esplicitamente che l’asserto analogo per la topologia debolestella non vale. Pero nella topologia debole stella successioni compatte siidentificano facilmente:

Teorema 152 (di Alaoglu) Ogni successione limitata in X∗ ammette s.successioniconvergenti in senso debole stella.

La dimostrazione e posposta.L’asserto analogo non vale inX e cio suggerisce di dare un nome particolare

agli spazi X tali che jX = X∗∗.

Definitione 153 Se uno spazio X e isometrico al suo biduale, lo spazio X sidice riflessivo.

Page 128: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

122 CAPITOLO 2. GLI SPAZI DI BANACH

In uno spazio riflessivo, la convergenza debole equivale alla debole stella equindi:

Teorema 154 Ogni successione limitata in uno spazio riflessivo ammette s.suc-cessioni debolmente convergenti.

Il Teorema 151 ha un corollario che bene illustra la geometria della conver-genza debole:

Corollario 155 (di Mazur) Sia (xn) una successione debolmente conver-gente ad x0. Esiste una successione (sn) in X, tale che:

• sn =∑nk=1 λkxk per opportuni numeri λk ∈ [0, 1] tali che

∑nk=1 λk = 1;

• la successione (sn) converge ad x0 in norma.

Ossia, x0 e limite in norma di una successione ottenuta da combinazioniconvesse degli xn.

Dim. Sia A = coxn, il piu piccolo convesso chiuso contenente gli xn. Per ilTeorema 151, x0 appartiene ad A. Da qui segue l’asserto.

Applichiamo ora il Teorema 151 allo spazio X× IR. Sia A l’epigrafo di unafunzione convessa e continua su X. L’insieme A e convesso e chiuso e quindisequenzialmente chiuso. Dunque vale:

Teorema 156 Una funzione convessa e continua in norma e anche semicon-tinua inferiormente rispetto alla convergenza debole.

Questo teorema ed il Teorema di Alaoglu mostrano che il Teorema diWeierstrass puo applicarsi alla minimizzazione di funzionali convessi su in-siemi limitati e chiusi su spazi riflessivi; e cio e importantissimo nella teoriadell’ottimizzazione.

Per completare queste considerazioni, mostriamo che, in contrasto con l’as-serto del Teorema di Alaoglu, in un generico spazio di Banach esistono suc-cessioni limitate che non ammettono s.successioni convergenti nella topologiadebole; e quindi che esistono spazi di Banach che non sono riflessivi. Infatti:

Teorema 157 Esistono successioni limitate in L1(0, 1), prive di s.successionidebolmente convergenti; e quindi L1(0, 1) non e riflessivo.

Dim. Si e visto al Teorema 141 che ogni elemento x∗ ∈ X∗ e continuo rispettoalla convergenza debole in X. Se ogni successione limitata avesse s.successioni

Page 129: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.10. CONVERGENZA DEBOLE E DEBOLE STELLA 123

debolmente convergenti, allora, per il Teorema di Bolzano-Weierstrass, ognielemento di X∗ raggiungerebbe massimo su

x |∫ 1

0|x(s)| ds ≤ 1

.

L’esempio riportato al Teorema 79 mostra che cio non accade.

Osservazione 158 Cio mostra una profonda differenza tra lo spazio L1(a, b)e gli spazi Lp(a, b) con 1 < p < +∞. Vedremo infatti che questi ultimi spazisono riflessivi e quindi tutte le successioni limitate in Lp(0, 1), con 1 < p < +∞ammettono s.successioni debolmente convergenti.

Nel Capitolo 3 introdurremo una particolare classe di spazi di Banach, chesi chiamano spazi di Hilbert. Proveremo, al Par. 3.7:

Teorema 159 Ogni spazio di Hilbert e riflessivo.

Continuita e continuita debole di operatori lineari

Fa parte della definizione di convergenza debole che ogni elemento di X∗, ossiaogni funzionale lineare suX che e continuo in norma, e anche continuo rispettoalla convergenza debole. E’ importante sapere che gli elementi di X∗ sono tuttii funzionali lineari su X, continui rispetto alla convergenza debole:

Teorema 160 Sia ϕ un funzionale lineare su X. Esso e continuo rispetto allaconvergenza debole se e solo se e continuo in norma.

Dim. Se ϕ e continuo rispetto alla convergenza debole lo e anche in normaperche ogni successione convergente in norma converge anche debolmente, almedesimo limite. Il viceversa e provato al Teorema 141.

Un asserto analogo vale in realta per generici operatori lineari, ma ladimostrazione e piu profonda:

Teorema 161 Siano X ed Y due spazi di Banach e sia A un operatore lineareda X in Y , con dominio uguale ad X e debolmente continuo, ossia tale che

se xn x0 in X allora Axn Ax0 in Y .

In tal caso, l’operatore A e continuo in norma.

Page 130: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

124 CAPITOLO 2. GLI SPAZI DI BANACH

Dim. Proviamo che nelle ipotesi del teorema, l’operatore lineare A, definitosu X, e chiuso.

Sia xn → x0 tale che Axn → y0 (rispettivamente nelle norme di X e di Y ).Allora, xn x0 e quindi, per le ipotesi, Axn Ax0; D’altra parte, Axn → yimplica Axn y. Per l’unicita del limite debole, y = Ax0 ossia la successionedi punti ( (xn, Axn) ) se converge, converge ad un punto del grafico, che quindie chiuso.

Cio prova che l’operatore lineareA e chiuso e quindi, avendo dominio ugualead X, continuo.

Si osservi che la dimostrazione precedente fa uso sia del teorema di Hahn-Banach che del Teorema di Baire.

2.10.1 Dimostrazioni posposte

Dimostrazione del TEOREMA 152.Il teorema vale in qualsiasi spazio duale. Pero la dimostrazione che pre-

sentiamo usa un’ipotesi ulteriore, non richiesta dal teorema: presentiamo ladimostrazione nel caso in cui lo spazio X e separabile. Dunque supponiamol’esistenza di una successione (xn) la cui immagine e densa in X. Se vale que-st’ipotesi, la dimostrazione si ottiene usando il procedimento diagonaledi Cantor.

Sia (y∗n) una successione limitata in X∗, ||y∗n|| < α. Vogliamo estrarne unas.successione convergente.

Consideriamo la successione numerica (⟨⟨y∗n, x1⟩⟩). Questa e limitata e quin-di ammette una s.successione convergente. Indichiamola (⟨⟨y∗n,1, x1⟩⟩). Consi-deriamo quindi (⟨⟨y∗n,1, x2⟩⟩). Anche questa successione e limitata e quindi se neestrae una s.successione convergente, che indichiamo (⟨⟨y∗n,2, x2⟩⟩). Procedendoin questo modo si costruisce la tavola seguente:

⟨⟨y∗1,1, x1⟩⟩ ⟨⟨y∗2,1, x1⟩⟩ ⟨⟨y∗3,1, x1⟩⟩ ⟨⟨y∗4,1, x1⟩⟩ . . .

⟨⟨y∗1,2, x2⟩⟩ ⟨⟨y∗2,2, x2⟩⟩ ⟨⟨y∗3,2, x2⟩⟩ ⟨⟨y∗4,2, x2⟩⟩ . . ....⟨⟨y∗1,k, xk⟩⟩ ⟨⟨y∗2,k, xk⟩⟩ ⟨⟨y∗3,k, xk⟩⟩ ⟨⟨y∗4,k, xk⟩⟩ . . ....

la successione (y∗n,k) che figura su ciascuna riga e s.successione di tutte lesuccessioni y∗n,r, con r < k; e quindi (⟨⟨y∗n,k, xr⟩⟩) converge, per ogni r ≤ k.

Page 131: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.10. CONVERGENZA DEBOLE E DEBOLE STELLA 125

Dunque, la successione diagonale (y∗n,n) ha la proprieta che (⟨⟨y∗n,n, xr⟩⟩)converge per ogni r.

Proviamo che in realta la successione (⟨⟨y∗n,n, x0⟩⟩) converge per ogni x0 ∈ X.Basta provare che essa e fondamentale, dato che essa prende valori in Φ.

Si fissi per questo ϵ > 0 ed x0 ∈ X, qualsiasi. Sia N tale che

||x0 − xN || < ϵ/(3α) .

Si noti che N dipende da x0. Si stimi quindi

|⟨⟨y∗m,m, x0⟩⟩ − ⟨⟨y∗n,n, x0⟩⟩|≤ |⟨⟨y∗m,m, x0 − xN⟩⟩|+ |⟨⟨y∗m,m − y∗n,n, xN⟩⟩+ |⟨⟨y∗n,n, xN − x0⟩⟩| .

Il primo e l’ultimo addendo sono minori di ϵ/3, per la scelta fatta di xN .L’addendo intermedio e minore di ϵ/3 se m, n superano un numero N , chedipende da ϵ e da N ossia da ϵ e da x0. Cio prova la convergenza dellasuccessione di numeri (⟨⟨y∗n,n, x⟩⟩), per ogni x ∈ X.

Si costruisce ora un funzionale y∗0 su X ponendo

⟨⟨y∗0, x⟩⟩ = lim⟨⟨y∗n,n, x⟩⟩ .

E’ immediato verificare che y∗0 e lineare. Inoltre, y∗0 e continuo perche lasuccesione (y∗n) e limitata, ||y∗n||X∗ < α per ogni n cosı che per ||x||X < 1,∣∣∣∣⟨⟨y∗0, x⟩⟩∣∣∣∣ = lim

∣∣∣∣⟨⟨y∗n,n, x⟩⟩∣∣∣∣ ≤ α .

Dunque y∗0 e continuo. E quindi, y∗0 = w∗− lim y∗n,n. Cio e quanto volevamoprovare.

Osservazione 162 Nel caso in cui il duale X∗ di X sia separabile, puo sem-brare possibile applicare il ragionamento precedente ad una successione (xn) diX, arrivando a provare un analogo del teorema di Alaoglu in X. Ci si convincache cio e falso esaminando bene la dimostrazione e notando che, tentando diripetere la dimostrazione, NON si proverebbe la convergenza debole di (xn) inX, ma la convergenza debole stella di (jxn) in X

∗∗.

2.10.2 Relazione tra le convergenze debole e debole stel-la

Avendo a disposizione gli esempi precedenti, possiamo chiarire meglio le re-lazioni tra le convergenze debole e debole stella, quando queste si possano

Page 132: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

126 CAPITOLO 2. GLI SPAZI DI BANACH

definire sul medesimo spazio, che in tal caso e lo spazio X∗ duale di uno spaziodi Banach X.

Queste due nozioni di convergenza non sono indipendenti. Infatti:

Teorema 163 Sia x∗n una successione in X∗. Se essa converge debolmente adx∗0, allora essa converge anche debole stella al medesimo x0.

Dim. Cio discende dal fatto che si e gia notato che X e isometrico ad uns.spazio di X∗∗.

L’esempio seguente mostra che non vale l’implicazione inversa.

Esempio 164 Sia X = c0, X∗ = l1 ed X∗∗ = l∞.

In X∗ = l1 si consideri la successione e(n) definiti da (2.29).Se x ∈ c0, x = (xn) allora

⟨⟨x, e(n)⟩⟩ = xn → 0 e quindi w∗− lim e(n) = 0 .

Invece, se x ∈ l∞ = X∗∗ e la successione ogni cui elemento vale 1,

⟨⟨x, e(n)⟩⟩ = 1 e quindi la successione (e(n)) non converge debolmente a 0.

seguente:

2.11 Inversi di un operatore

In dimensione finita, l’equazione

Ax = y , x , y ∈ IC n

con x, y vettori ed A trasformazione lineare, e risolubile per ogni y se e solo se

kerA = 0

ed in tal caso esiste l’operatore inverso A−1 di A che e lineare e che verificaambedue le condizioni

AA−1 = IA−1A = I ;

anzi, se un operatore indicato con A−1 soddisfa una delle due uguaglianzeprecedenti esso soddisfa anche la seconda ed e l’operatore inverso di A, si vedail paragrafo (1.0.2)14. La situazione e piu complessa in dimensione infinita.Infatti:

14si ricordi che x ed y appartengono ambedue a IC n. Se essi appartengono a spazi diversiallora l’ultima affermazione e falsa.

Page 133: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.11. INVERSI DI UN OPERATORE 127

Esempio 165 • Un operatore puo avere nucleo nullo senza essere suriet-tivo. Per esempio, sia X = Y = l2. Un operatore con tali proprieta el’operatore S dato da:

Sx = S(x1, x2, x3, . . .) = (0, x1, x2, x3, . . .) .

• Un operatore puo avere nucleo non nullo ed essere suriettivo: per esem-pio, ancora conX = Y = l2, Un operatore con tali proprieta e l’operatoreT dato da:

Tx = T (x1, x2, x3, . . .) = (x2, x3, . . .) .

• Con S l’operatore del caso precedente, si ha kerS = 0, si puo defi-nire un operatore A inverso di S, con domA = imS (si noti che, inquest’esempio particolare, A e la restrizione di T ad im S). Dunque, Averifica

ASx = x ∀x ∈ l2

ma non verifica SAx = x per ogni x di l2.

• L’operatore T e quello definito sopra. Si verifica facilmente l’esistenza diun operatore lineare B che verifica TBx = x per ogni x ∈ l2. Non valepero BTx = x per ogni x ∈ l2 nonostante che si stiano considerandotrasformazioni da l2 in se.

Queste considerazioni suggeriscono la seguente definizione:

Definitione 166 Sia K un operatore lineare, limitato o meno, da X in Y . Seun operatore A, con dominio imK, verifica

AKx = x ∀x ∈ X ,

allora l’operatore A si chiama inverso sinistro diK. Se un operatore lineareB verifica

KBy = y ∀y ∈ Y

allora l’operatore B si chiama inverso destro di K.Un operatore che e sia inverso destro che sinistro di K si chiama inverso

di K e si indica col simbolo K−1.

Si noti che la definizione di linearita e stata esplicitamente richiesta nelladefinizione di inverso destro, ma non in quella di inverso sinistro. Cio perche:

Page 134: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

128 CAPITOLO 2. GLI SPAZI DI BANACH

Teorema 167 Un operatore lineare K da X in Y ammette inverso sinistrose e solo se kerK = 0. In tal caso l’inverso sinistro e unico, ed e lineare.

Dim. Se esiste l’inverso sinistro A di K allora per ogni x ∈ domK vale:

x = AKx

e quindi se Kx = 0 si ha anche x = 0. Dunque, l’esistenza dell’inverso sinistroimplica kerK = 0, ossia che K e iniettivo.

Viceversa, sia kerK = 0. Allora K, essendo lineare, e (univoco e)iniettivo. Il suo inverso sinistro e l’operatore che a Kx associa x.

La definizione di inverso sinistro mostra che il suo grafico in Y × X el’insieme (Kx, x) | x ∈ X. Questo e un s.spazio perce l’operatore K elineare; e quindi anche l’inverso sinistro, avendo per grafico un s.spazio, elineare, si veda il teorema 64.

Per contrasto si noti che l’inverso destro non e unico e che possono ancheesistere operatori B non lineari che verificano l’uguaglianza KBy = y per ogniy:

Esempio 168 Sia X = Y = l2. Sia T l’operatore introdotto nell’esempio 165.Per ogni numero naturale n e per ogni numero reale α, definiamo Bn,α ponendo

Bn,α(y1, y2, y3, . . .) = (αyn1 , y1, y2, y3, . . .) .

L’operatore Bn,α e non lineare se n > 1 ed e lineare se n = 1. Per ogni sceltadi n e di α si ha: TBn,αy = y per ogni y ∈ l2.

In particolare si vede la non unicita dell’inverso destro perfino con lacondizione che esso debba essere lineare.

Le considerazioni precedenti suggeriscono di privilegiare lo studio dell’in-verso sinistro. Approfondendo tale studio, notiamo che non c’e relazione tracontinuita di un operatore e continuita del suo inverso sinistro, come oravediamo:

Esempio 169 Mostriamo l’esempio di un operatore continuo ed invertibile,con inverso sinistro non continuo.

Sia X = Y = l2 e sia A l’operatore definito da

A(x1, x2, x3, x4, . . .) = (x1,1

2x2,

1

3x3,

1

4x4, . . .) .

E’ facile vedere che l’operatore A e continuo e iniettivo, e che il suo inversosinistro, definito su imA, e l’operatore non continuo B:

B(y1, y2, y3, . . .) = (y1, 2y2, 3y3, . . .) .

Page 135: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.11. INVERSI DI UN OPERATORE 129

Per avere un esempio di operatore illimitato il cui inverso e limitato, siscambino i ruoli degli operatori A e B appena introdotti.

E’ facile dare un test per la limitatezza dell’inverso sinistro: sia B inversosinistro di A. Per definizione, l’operatore B e limitato se e solo se esiste ρ > 0tale che

||By||X ≤ ρ||y||Y ∀y ∈ domB .

Un elemento y e in domB se e solo se esiste x per cui y = Ax e quindi ladisuguaglianza precedente equivale a

m||x||X ≤ ||Ax||Y (2.62)

(con m = 1/ρ > 0). Questa condizione implica anche che kerA = 0.Dunque:

Teorema 170 L’operatore A ammette inverso sinistro continuo se e solo seesiste m > 0 (disuguaglianza stretta!) per cui vale (2.62).

La condizione (2.62) non e di facile verifica ed in generale non e facilecostruire l’espressione esplicita dell’inverso. Un caso semplice ed importante eil seguente:

Teorema 171 Sia A ∈ L(X), con ||A|| < 1 (disuguaglianza stretta!) e siconsideri l’operatore I − A. L’operatore I − A e iniettivo e suriettivo, ossiainvertibile, ed e

(I − A)−1 =+∞∑k=0

Ak ∈ L(X) . (2.63)

Dim. Sia q < 1 tale che ||A|| < q, ossia tale che ||Ax|| ≤ q||x|| per ogni x.Vale:

||(I − A)x|| = ||x− Ax|| ≥∣∣∣∣ ||x|| − ||Ax||

∣∣∣∣ = ||x|| − ||Ax|| ≥ (1− q)||x|| .

Dunque, l’operatore I − A ammette l’inverso sinistro continuo, per il Teore-ma 170. Per trovare un’espressione per l’inverso sinistro consideriamo la seriein (2.63) (suggerita dalla serie geometrica!) Mostriamo prima di tutto che essaconverge in L(X). Per questo consideriamo la successione delle somme parziali

Sn =n∑k=1

Ak .

Page 136: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

130 CAPITOLO 2. GLI SPAZI DI BANACH

Si ha:

||Sn − Sn+m|| =

∣∣∣∣∣∣∣∣∣∣∣∣n+m∑k=n+1

Ak

∣∣∣∣∣∣∣∣∣∣∣∣ ≤

n+m∑k=n+1

||Ak|| ≤n+m∑k=n+1

qk .

Essendo q ∈ [0, 1) si ha che la successione delle somme parziali e fondamentalee quindi convergente in L(X).

Notiamo che, in particolare,

||Ak|| ≤ ||A||k ≤ qk cosı che limkAk = 0 .

Per definizione(+∞∑k=1

Ak)x =

(limk

n∑k=1

Ak)x = lim

k

(n∑k=1

Akx

)=

+∞∑k=1

Akx .

Dunque:

(+∞∑k=0

Ak)(I − A)x =

+∞∑k=0

Akx−+∞∑k=0

Ak+1x

= lim

n∑k=0

Akx−n∑k=0

Ak+1x

= limx− Ak+1x = x

e quindi la serie in (2.63) rappresenta l’inverso sinistro di (I −A). Con calcolianaloghi si vede che e anche inverso destro, e quindi inverso. In particolaresegue che I − A e suriettivo.

La serie (2.63) si chiama serie di von Neumann.Sottolineiamo ora che un operatore ammette inverso quando ammette sia

inverso destro che sinistro; in particolare quando e sia iniettivo che suriettivo.Conviene indebolire un po’ questa definizione.

Definitione 172 Sia A lineare da X in Y con dominio denso in X e conimmagine densa in Y . Sia A iniettivo. L’inverso sinistro di A, definito suimA ed a valori in domA, si chiama inverso di A.

Il simbolo A−1 si usa anche per indicare l’inverso di A, nel senso generaliz-zato che abbiamo ora definito.

Notiamo infine:

Teorema 173 Siano A e B operatori lineari ambedue invertibili con

imB ⊆ domA .

Siano continui gli operatori inversi A−1 e B−1. Allora (AB)−1 esiste e vale

(AB)−1 = B−1A−1 .

Page 137: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 131

Dim. Immediato, notando che domAB = domB e che

B−1A−1ABx = x ∀x ∈ domA .

2.12 Lo spettro di un operatore

Per leggere questo paragrafo e necessario conoscere l’enunciato del Teo-rema 116: un elemento x di uno spazio di Banach X e non nullo se esolo se esiste x∗ ∈ X∗ tale che ⟨⟨x∗, x⟩⟩ = 0. Si esprime a parole questaproprieta dicendo che lo spazio duale distingue i punti di X.

Se X ha dimensione finita e noto che molte informazioni si ottengono stu-diando gli autovalori della trasformazione, i quali hanno spesso interpretazionifisiche importanti. Vogliamo ora estendere questo tipo di studio a genericispazi di Banach.

Si sa che, anche in dimensione finita, autovalori ed autovettori possonosolo trovarsi se il campo scalare e quello dei numeri complessi. Per questosupporremo di lavorare con spazi lineari su IC .

In dimensione finita, un numero complesso z0 si dice un autovalore di A se

(z0I − A)x = y

non e risolubile per ogni y; equivalentemente, se la soluzione x, quando esiste,non e unica. L’esempio seguente mostra che la non risolubilita per ogni y indimensione infinita non equivale alla non unicita.

Esempio 174 Sia X = lp, per un qualsiasi p ∈ [1,+∞] e siano T ed S definitida

S[x0 x1 x2 . . .

]=[0 x0 x1 . . .

]T[x0 x1 x2 . . .

]=[x1 x2 x3 . . .

].

(2.64)

E’ chiaro che

kerS = 0 e imS = X ,

kerT = 0 e imT = X .

Page 138: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

132 CAPITOLO 2. GLI SPAZI DI BANACH

I due operatori precedenti sono particolarmente importanti. In particola-re, l’operatore S si chiama operatore di traslazione (sottinteso, versodestra).

Ricordiamo inoltre che se l’equazione

(zI − A)x = y (2.65)

e risolubile in modo unico allora (zI − A) ammette inverso, definito sulla suaimmagine e questo e un operatore lineare. Ma, in generale, l’inverso non econtinuo.

Queste considerazioni suggeriscono la definizione seguente, che si applicaad ogni operatore lineare A da X in X, anche non continuo ma con dominiodenso:

Definitione 175 Sia A lineare da X in X, con dominio denso. Si chiamainsieme risolvente di A l’insieme dei numeri complessi z per cui la (2.65)ammette un’unica soluzione x per ogni y in un s.insieme denso di X e inoltrel’inverso (zI − A)−1 e continuo.

Se z appartiene all’insieme risolvente di A, l’operatore (zI−A)−1 si chiamal’operatore risolvente di A.

L’insieme risolvente si indica col simbolo ρ(A). Il suo complementare siindica col simbolo σ(A) e si chiama lo spettro dell’operatore A.

Da un punto di vista logico, z ∈ σ(A) se si verifica uno dei casi seguenti,mutuamente incompatibili:

i) ker(zI − A) = 0;

ii) ker(zI − A) = 0 ma im (zI − A) non denso in X;

iii) ker(zI−A) = 0, im (zI−A) denso in X ma (zI−A)−1 non continuo.

Definiamo quindi:

• spettro di punti l’insieme dei numeri z per i quali si verifica il caso i);

• spettro residuo l’insieme dei punti per i quali si verifica il caso ii);

• spettro continuo l’insieme dei punti per i quali si verifica il caso iii).

Gli elementi dello spettro di punti si chiamano autovalori dell’operatoreA.

Page 139: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 133

Abbiamo definito una partizione dello spettro di A in tre s.insiemi. Essi siindicano rispettivamente con i simboli

σp(A) , σr(A) , σc(A) .

In dimensione finita solo il caso i) puo verificarsi. Mostriamo che, invece,in dimensione infinita anche gli altri casi possono verificarsi.

Esempio 176 Sia S l’operatore definito in (2.64). Si vede facilmente che0 ∈ σr(S) (invece, 0 ∈ σp(T )).

Mostriamo un operatore con spettro continuo non vuoto. Sia X = l2 e siaA definito come segue:

A[x0 x1 x2 . . . xn . . .

]=[x0

12x1

13x2 . . . 1

n+1xn . . .

].

L’equazione Ax = y e risolubile per ogni successione (yn) definitivamente nulla,ossia per ogni y in un s.spazio denso di X = l2, ed e[

x0 x1 x2 . . . xn . . .]=[y0 2y1 3y2 . . . (n+ 1)yn . . .

].

Dunque, l’inverso non e continuo.

Grazie al teorema fondamentale dell’algebra, si sa che in dimensione finitalo spettro non e mai vuoto ed e un insieme finito. Mostriamo invece cheesistono operatori lineari su spazi di Banach, con spettro vuoto ed operatoricon risolvente vuoto.

Esempio 177 Sia X = L2(0, 1) e siano A e B definiti come segue:

domA = x ∈ C(0, 1) | x′ ∈ L2(0, 1) , Ax = x′ ,

domB = x ∈ C(0, 1) | x′ ∈ L2(0, 1) , x(0) = 0 , Bx = x′ .

Allora σ(A) = σp(A) = IC perche per ogni z vale (z−A)χz = 0, con χz(t) = ezt.Invece, σ(B) = ∅ perche

(zI −B)x = y ⇐⇒x′ = zx− yx(0) = 0 .

Dunque x e dato da

x(t) = −∫ t

0ez(t−s)y(s) ds

cosı che l’operatore (zI −B)−1 e continuo.

Page 140: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

134 CAPITOLO 2. GLI SPAZI DI BANACH

Nell’esempio precedente intervengono, vedremo non per caso, operatori chenon sono continui; ma anche lo spettro di operatori continui puo avere unastruttura piuttosto complessa:

Esempio 178 Sia X = l2 e sia T l’operatore definito in (2.64). Risolvendo

(zI − T )x = 0

si trova come soluzione:

x = q[1 z z2 z3 . . .

]con q ∈ IC qualsiasi. Questa successione appartiene ad l2 per ogni z di modulominore di 1. Dunque, σp(T ) ⊇ z | |z| < 1.

Nonostante questi esempi, spettro e risolvente non possono essere insiemiqualsiasi. Infatti:

Teorema 179 Se A e continuo, σ(A) ⊆ z | |z| ≤ ||A||.

Dim. Supponiamo che A sia continuo e che sia |z| > ||A||. Vogliamo provareche in tal caso z ∈ ρ(A). Scriviamo per questo

(zI − A) = z(I −K) , K =1

zA cosı che ||K|| < 1 .

Dunque,

(zI − A)−1 =1

z

+∞∑n=0

Kn =1

z

+∞∑n=0

An

zn. (2.66)

Quest’operatore e continuo, dato che ||K|| = ||A/z|| < 1; e quindi z ∈ ρ(A).

Lo spettro non puo essere un insieme qualsiasi nemmeno se l’operatore Anon e continuo. Infatti:

Teorema 180 Il risolvente e sempre un insieme aperto e quindi lo spettro echiuso.

Dim. Sia A qualsiasi, anche non continuo. Proviamo che il suo risolvente eaperto. Se esso e vuoto niente va provato. Dunque supponiamo che esista unnumero z0 ∈ ρ(A) e mostriamo che esso e interno al risolvente; ossia proviamol’esistenza di ϵ > 0 (che dipende sia da z0 che da A) tale che se |z| < ϵ alloraz + z0 ∈ ρ(A). Per questo scriviamo

(z + z0)I − A = zI + (z0I − A) = (z0I − A)[I + z(z0I − A)−1

]. (2.67)

Page 141: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 135

Per il Teorema 179, l’operatore[I + z(z0I − A)−1

]e invertibile se

|z| < ϵ =1

||(z0I − A)−1||e in tal caso (z + z0)I −A e invertibile con inverso limitato, essendo composi-zione di operatori invertibili ciascuno con inverso limitato.

La (2.67) permette anche di trovare un’espressione per [(z + z0)I − A]−1:

[(z + z0)I − A]−1 =

+∞∑k=0

zn[(z0I − A)−1

]n(z0I − A)−1

=+∞∑k=0

zn[(z0I − A)−1

]n+1.

(2.68)

Dunque, fissato z0 ∈ ρ(A), la funzione [(z + z0)I −A]−1 si esprime come seriedi potenze di z, a coefficienti operatori limitati.

Chiameremo funzioni olomorfe a valori operatori quelle funzioni diz ∈ IC che si esprimono localmente, in un opportuno intorno di ogni punto z0del loro dominio, mediante serie

+∞∑n=0

Kn(z − z0)n

convergenti (nella norma di L(X)). Dunque:

Corollario 181 Se l’operatore A ha risolvente non vuoto, la funzione z →(zI − A)−1 e olomorfa su ρ(A).

Osservazione 182 Combinando il calcolo dell’esempio 178 con i teoremi 179e 180, si vede che

σ(T ) = z | |z| ≤ 1 .

Torniamo ora a considerare un operatore continuo A. Si e detto che il suorisolvente non e vuoto, e anzi contiene l’esterno del disco z | |z| ≤ ||A||.Naturalmente, esso puo anche estendersi all’interno di tale disco; ma non puoriempirlo. Infatti:

Teorema 183 Sia A ∈ L(X). Lo spettro di A non e vuoto.

Page 142: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

136 CAPITOLO 2. GLI SPAZI DI BANACH

Dim. La dimostrazione procede per assurdo, e va confrontata con la dimo-strazione del teorema fondamentale dell’algebra.

Dal Corollario 181 si sa che, se σ(A) = ∅, la funzione (zI−A)−1 e olomorfasu IC . Dunque, per ogni x ∈ X, y∗ ∈ X∗, la funzione

z → f(z) = ⟨⟨y∗, (zI − A)−1x⟩⟩

e una funzione intera.Dalla (2.68) si vede che per |z| → +∞, la funzione f(z) tende a zero; e

quindi f(z) e una funzione intera e limitata, e quindi costante. Dato che unsuo limite e nullo, essa deve essere identicamente zero.

Dunque, abbiamo provato che

⟨⟨y∗, (zI − A)−1x⟩⟩ ≡ 0 ∀x ∈ X , ∀y∗ ∈ X∗ .

Dato che X∗ distingue punti di X, deve essere

(zI − A)−1x ≡ 0

per ogni x ∈ X. Cio non puo darsi perche (zI − A)(zI − A)−1x = x per ognix ∈ X.

La contraddizione trovata prova il teorema.

Nonostante che lo spettro di un operatore continuo non possa essere vuoto,puo essere che esso sia un insieme molto piu piccolo del disco di raggio ||A||.Per esempio, in dimensione 2, la trasformazione lineare la cui matrice e[

0 10 0

]

ha norma 1 ed il solo autovalore 0. E’ un utile esercizio vedere che un casoanalogo puo darsi anche in dimensione infinita.

Esempio 184 Sia X = L2(0, 1) e sia

(Ax)(t) =∫ t

0x(s) ds .

Si sa che A e continuo e si vede immediatamente che 0 ∈ σ(A), dato che A−1

e l’operatore di derivazione, A−1y = y′, che non e continuo.Mostriamo che ogni altro numero z appartiene al risolvente. Per questo

risolviamo

(zI − A)x = y ossia zx(t)−∫ t

0x(s) ds = y(t) .

Page 143: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 137

Dividendo per z si trova

x(t)− 1

zy(t) =

1

z

∫ t

0x(s) ds =

1

z

∫ t

0

[x(s)− 1

zy(s)

]ds+

∫ t

0

1

z2y(s) ds .

Quest’uguaglianza mostra che la funzione

ξ(t) = x(t)− 1

zy(t)

e derivabile quasi ovunque, che ξ(0) = 0 e che

ξ′(t) =1

zξ(t)− 1

z2y(t) ossia ξ(t) = − 1

z2

∫ t

0e

1z(t−s)y(s) ds .

Da qui,

x(t) =1

zy(t)− 1

z2

∫ t

0e

1z(t−s)y(s) ds .

La trasformazione da y ad x e, per ogni fissato z = 0, lineare e continua.Dunque, σ(A) = 0.

Questi esempi suggeriscono di chiamare raggio spettrale r(A) il nu-mero

r(A) = max|z| | z ∈ σ(A) .

Il raggio spettrale di un operatore continuo si esprime in modo che richiamala formula per il raggio di convergenza di una serie di potenze:

Teorema 185 Sia A ∈ L(X). Vale:

r(A) = lim n

√||An|| .

Dim. Si prova, esattamente come nel caso scalare, che una serie di potenze avalori operatori converge in un disco di centro z0, che si chiama ancora discodi convergenza,. Questo disco coincide col disco di convergenza della seriedi potenze

+∞∑n=0

||An||(z − z0)n .

Applicando questo alla serie (2.66) si vede che

r(A) = lim sup n

√||An|| .

Page 144: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

138 CAPITOLO 2. GLI SPAZI DI BANACH

Si deve ora provare che in realta esiste

lim n

√||An|| .

Risulta piu semplice provare l’esistenza del limite

lim1

nlog ||An|| .

Notiamo che

log ||An+m|| ≤ log ||An|| · ||Am|| ≤ log ||An||+ log ||Am|| .

Una successione di numeri (an), tutti positivi, che verificano

an+m ≤ an + am

si dice subadditiva. La dimostrazione del Teorema 185 si completa usandoil lemma seguente:

Lemma 186 Se la successione (an) e subadditiva allora esiste

lim1

nan .

Dim. Si fissa un numero naturale m e si studiano i quozienti an/n con n > m.Notiamo che si puo scrivere

n = md+ r , 0 ≤ r < m

e quindian = amd+r ≤ dam + ar .

Dividiamo per n e passiamo al limite per n→ +∞.Il numero ar e funzione di n limitata al variare di n perche prende valori

nell’insieme finito a1,. . . , am−1. Dunque lim ar/n = 0.Ancora perche r prende un numero finito di valori,

d

n=n− r

nm=

1

m− r

nm→ 1

m.

Dunque,

lim supann

≤ amm

∀m.

E quindi

lim supann

≤ lim infann.

Cio prova l’esistenza del limite.

Page 145: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 139

Esempio 187 Su IR2 (riferito alla base canonica) consideriamo la trasforma-zione lineare descritta mediante la matrice

A =

[0 21 0

].

Per calcolare il raggio spettrale mediante la formula (185) bisogna prima ditutto calcolare le potenze di A:

A2n = 2nI , A2n+1 = 2nA .

E’ immediatamente evidente che ||A|| = 2 e quindi

||A2n||1/2n =√2 , ||A2n+1||1/(2n+1) = [

√2](2n+2)/(2n+1) .

Dunque, il raggio spettrale e√2. Si noti che la successione (||An||1/n) non e

monotona.

Osservazione 188 Osserviamo che la definizione di risolvente non e del tuttosoddisfacente perche a rigore per definire l’inverso di un operatore si dovrebbesupporre che l’operatore sia suriettivo : l’inverso che figura nella definizione dirisolvente e in realta l’inverso sinistro. Al paragrafo 3.6.4 vedremo una classeimportante di operatori per i quali questa discrepanza scompare.

2.12.1 Proiezioni spettrali

Sia X uno spazio di Banach e sia A un operatore, anche non continuo, da Xin se, con dominio denso.

Abbiamo notato che il risolvente e una funzione analitica e cio suggerisce distudiare l’analogo, scritto per gli operatori, della formula integrale di Cauchy:

1

2πi

∫γf(z)(zI − A)−1 dz (2.69)

ove γ e una curva semplice e chiusa15 il cui sostegno e contenuto in ρ(A). Lafunzione f(z) e olomorfa.

Naturalmente, dovremo dare un senso all’integrale. Dato che la funzione avalori in L(X)

z → f(z)(zI − A)−1

15come al solito, orientata in verso positivo, ossia antiorario.

Page 146: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

140 CAPITOLO 2. GLI SPAZI DI BANACH

e uniformemente continua sul sostegno di γ, l’integrale si definisce coll’usualemetodo di Riemann, come “limite” delle somme di Riemann. Lasciamo allettore i semplici dettagli.

Nonostante che la (2.69) abbia senso per ogni operatore lineare A da X inse, purche il sostegno di γ sia contenuto in ρ(A), noi ci limiteremo a considerareil cao degli operatori A continui.

Per interpretare la (2.69), consideriamo la funzione

f(z) =+∞∑n=0

fnzn

e la serie corrispondente+∞∑n=0

fnAn . (2.70)

Nel caso particolare in cui f(z) = p(z) sia un polinomio, la serie (2.70) e unasomma finita e definisce un operatore che, ovviamente, si indica col simbolop(A). Per esempio, se p(z) = z2, allora p(A) = A2. Se f(z) e una genericafunzione analitica la cui serie converge in un intorno di 0, la serie (2.70) ingenerale non converge, ma certamente converge in L(X) se

||A|| < R

con R raggio di convergenza della serie di potenze di f(z). Infatti in tal caso∣∣∣∣∣∣∣∣∣∣m∑n=k

fnAn

∣∣∣∣∣∣∣∣∣∣ ≤

m∑n=k

fn||A||n ≤m∑n=k

fnrn , r < R ,

e la convergenza si vede dal test di Cauchy per la convergenza delle serie.Ricapitolando, se ||A|| < R, la serie (2.70) definisce un operatore di L(X),

che indicheremo col simbolof(A) .

Ricordiamo ora che i coefficienti fn si rappresentano come

fn =1

2πi

∫γ

f(ζ)

ζn+1dζ

con γ curva semplice e chiusa orientata positivamente, il cui sostegno e conte-nuto nel disco di convergenza di f(z).

Supponiamo che la curva γ racchiuda il disco z | |z| < r, con

||A|| < r < R . (2.71)

Page 147: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 141

In tal caso si trova

f(A) =+∞∑n=0

fnAn =

1

2πi

+∞∑n=0

∫γf(ζ)

An

ζn+1dζ

=1

2πi

∫γf(ζ)

(+∞∑n=0

An

ζn+1

)dζ =

1

2πi

∫γf(ζ)(ζI − A)−1 dζ .

Si noti che questo calcolo vale grazie alla condizione (2.71) e, se vale (2.71),allora si ha anche

σ(A) ⊆ z | |z| < R .

Osservazione 189 Si noti che l’integrale (2.69) ha senso anche se γ, di so-stegno in ρ(A), racchiude solo una parte dello spettro di A. Pero in tal casonon useremo la notazione f(A) per indicarlo.

In un caso particolare e facile calcolare l’integrale (2.69): supponiamo cheρ(A) contenga una regione di Jordan Ω e supponiamo che il sostegno di γappartenga a Ω. In questo caso un argomento analogo a quello usato nelladimostrazione del teorema 183 (basato sul fatto che il duale distingue gli ele-menti dello spazio di Banach) prova che l’integrale e nullo. Ossia, il Teoremadi Cauchy per le funzioni olomorfe vale anche per integrali della forma (2.69).Dunque, i casi interessanti saranno quelli nei quali γ “gira” intorno a punti diσ(A). Per intuire cosa dobbiamo attenderci, consideriamo l’esempio seguente.

Ricordiamo che un operatore lineare P da uno spazio lineare X in se stes-so si chiama proiezione quando P 2 = P . Nel caso di operatori tra spazidi Banach, sottintenderemo sempre che le “proiezioni” devono anche essereoperatori continui.

Esempio 190 Sia X = IC 3 a sia

A =

0 1 00 0 00 0 2

cosı che (zI − A)−1 =

1/z 1/z2 00 1/z 00 0 1/(z − 2)

.Sia γ una curva semplice e chiusa che racchiude 0 e che lascia fuori 2. Si calcolaimmediatamente che

1

2πi

∫γ(zI − A)−1 dz =

1 0 00 1 00 0 0

.Si trova cosı la proiezione sull’autospazio generalizzato dell’autovalore 0.

Page 148: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

142 CAPITOLO 2. GLI SPAZI DI BANACH

Operando in modo analogo con una curva che racchiude 2 e lascia fuori 0si trova la proiezione sull’altro autospazio.

Abbiamo cosı calcolato l’integrale nel caso della funzione f(z) = 1. Sef(z) = z un calcolo analogo da 0 1 0

0 0 00 0 0

, 0 0 00 0 00 0 2

rispettivamente, a seconda della scelta della curva. Queste sono le restrizionidi A ai due autospazi. Si trova cosı una “diagonalizzazione a blocchi” dellamatrice A.

Senza trattare l’integrale (2.69) in generale, vogliamo limitarci a conside-rare i due casi f(z) = 1 ed f(z) = z, che sono particolarmente importanti perle applicazioni, e che verranno usati nel paragrafo 3.8.5.

Generalizzando l’esempio (190), supponiamo che σ(A) = σ1(A) ∪ σ2(A) eche una regione di Jordan Ω contenga σ1(A) e lasci fuori σ2(A). Sia γ unacurva semplice e chiusa col sostegno in Ω, che gira intorno a σ1(A), come nellafigura 2.7, a sinistra:

Figura 2.7:

−4 −3 −2 −1 0 1 2 3 4−6

−4

−2

0

2

4

6

γ σ

1(A)

σ2(A)

−4 −3 −2 −1 0 1 2 3 4−6

−4

−2

0

2

4

6

γ σ

1(A)

σ2(A)

γ’

In tal caso:

Teorema 191 Valgano le condizioni appena dette. L’operatore

P =1

2πi

∫γ(zI − A)−1 dz

e una proiezione.

Page 149: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.12. LO SPETTRO DI UN OPERATORE 143

Dim. Ricordiamo che vale il teorema di Cauchy. Da cio si deduce che duecurve γ e γ′ semplici e chiuse in Ω, che ambedue racchiudono σ1(A) e lascianofuori σ2(A) (come in figura 2.7, a destra) definiscono il medesimo operatore P :

P =1

2πi

∫γ(zI − A)−1 dz =

1

2πi

∫γ′(ζI − A)−1 dζ .

Dunque,

P 2 =

1

2πi

∫γ(zI − A)−1 dz

1

2πi

∫γ′(ζI − A)−1 dζ

=

1

2πi· 1

2πi

∫γ

[∫γ′(zI − A)−1(ζI − A)−1

]dζ dz .

Non e restrittivo supporre che la curva γ racchiuda la curva γ′, come nellafigura 2.7, a destra. A questo punto usiamo una formula16 che si chiama primaformula del risolvente e che e di verifica immediata:

(zI − A)−1(ζI − A)−1 =1

ζ − z

[(zI − A)−1 − (ζI − A)−1

].

Usando questa formula, si trova

P 2 =1

2πi

∫γ

[1

2πi

∫γ′

1

ζ − z(zI − A)−1 dζ − 1

2πi

∫γ′

1

ζ − z(ζI − A)−1 dζ

]dz .

Ora, dal Teorema di Cauchy,

1

2πi

∫γ′

1

ζ − z(zI − A)−1 dζ = 0

perche il punto z, che e sulla curva γ, e nella regione esterna a γ′.Dunque rimane

P 2 = − 1

2πi

∫γ

[1

2πi

∫γ′

1

ζ − z(ζI − A)−1 dζ

]dz

=1

2πi

∫γ′

[−1

2πi

∫γ

1

ζ − zdz

](ζI − A)−1 dζ .

16si noti che questa formula estende l’uguaglianza, valida tra numeri,

1

(z − a)(ζ − a)=

1

ζ − z

[1

z − a− 1

ζ − a

].

Page 150: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

144 CAPITOLO 2. GLI SPAZI DI BANACH

L’integrando

z → 1

z − ζ

ha ζ per polo semplice, perche la curva γ′ e racchiusa dalla curva γ. Dunque

−1

2πi

∫γ

1

ζ − zdz =

1

2πi

∫γ

1

z − ζdz = 1

e quindi

P 2 =1

2πi

∫γ′(ζI − A)−1 dζ = P .

Supponiamo ora che σ1 e σ2 sino due s.insiemi limitati di σ(A), appartenentialla regione interna rispettivamente di γ1 e di γ2, curve di Jordan di sostegnoin ρ(A) ed esterne l’una all’altra come in figura 2.8.

Figura 2.8:

−4 −3 −2 −1 0 1 2 3 4−6

−4

−2

0

2

4

6

σ1(A)

σ2(A)

γ1

γ2

Poniamo

P1 =1

2πi

∫γ1(zI − A)−1 dz , P2 =

1

2πi

∫γ2(zI − A)−1 dz .

Una dimostrazione analoga a quella del teorema precedente porta a:

Teorema 192 Nelle ipotesi dette, si ha: P1P2 = P2P1 = 0. Inoltre X1 =imP1 ed X2 = imP2 sono spazi lineari invarianti per A e lo spettro dellarestrizione di A ad imPi e l’insieme σi. Tale restrizione e data da

Ax =1

2πi

∫γiz(zI − A)−1x dz , ∀x ∈ Xi .

Page 151: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.13. TRASFORMAZIONI NON LINEARI 145

Omettiamo i dettagli della dimostrazione di questo teorema, che e analogaa quella del teorema 191.

Si noti che il Teorema 192 mostra una “diagonalizzazione a blocchi” del-l’operatore A, analoga a quella vista nell’Esempio 190.

2.13 Trasformazioni non lineari

Fino ad ora abbiamo trattato soltanto di operatori lineari. Vogliamo ora pre-sentare alcune considerazioni riguardanti i funzionali non lineari. Proviamoprima di tutto un teorema di punto fisso, ossia diamo una condizione perl’esistenza di soluzioni di un’equazione del tipo

f(x) = x .

In seguito, mostreremo come sia possibile estendere a funzioni tra spazi diBanach le definizioni di derivata e la prima formula degli incrementi finiti.

2.13.1 Teorema delle contrazioni e applicazioni

Supponiamo che f sia una trasformazione da uno spazio di Banach X in sestesso, non necessariamente lineare. Si dice che f(x) e una contrazione seesiste un numero α ∈ [0, 1) tale che

||f(x)− f(x′)|| ≤ α||x− x′|| .

Una contrazione e lipschitziana e quindi continua.Se f e una qualsiasi trasformazione da X in se, un punto x0 ∈ X si chiama

punto fisso di f sef(x) = x .

Vale:

Teorema 193 (delle contrazioni) Sia K un insieme chiuso dello spazio diBanach X che e invariante per la contrazione f(x). Esiste uno ed un solopunto fisso di f(x) che appartiene a K.

Dim. Proviamo prima di tutto che il punto fisso, se esiste, e unico. Siano perquesto x ed y due punti fissi. Vale per essi

||x− y|| = ||f(x)− f(y)|| ≤ α||x− y||

ove α e strettamente minore di 1, per definizione di contrazione; e quindi ladisuguaglianza precedente puo solo valere se x = y.

Page 152: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

146 CAPITOLO 2. GLI SPAZI DI BANACH

Proviamo ora l’esistenza del punto fisso.Fissiamo k0 ∈ K e costruiamo la successione

k1 = f(k0) , . . . , kn = f(kn−1) .

Si noti che kn ∈ K per ogni n, perche f(K) ⊆ K.Proveremo che (kn) e una successione fondamentale e quindi convergente

dato che lo spazio X e completo. Essendo K chiuso, il limite x0 di (kn) e inK. Passando al limite nei due membri dell’uguaglianza

kn = f(kn−1)

si trovax0 = f(x0)

e quindi x0 e punto fisso di f .Per completare la dimostrazione, basta mostrare che (kn) e una successione

fondamentale.Stimiamo prima di tutto

||kn − kn−1|| = ||f(kn−1)− f(kn−2)|| ≤ α||kn−1 − kn−2|| .

Iterando si vede che

||kn − kn−1|| ≤ αn−1||k1 − k0|| .

Valutiamo ora

||kn+m − kn|| ≤ ||kn+m − kn+m−1||+ ||kn+m−1 − kn+m−2||+ · · ·+ ||kn+1 − kn||

≤ αn+m−1 + αn+m−2 + · · ·+ αn||k1 − k0|| ≤αn

1− α||k1 − k0|| .

Cio prova che la successione (kn) e fondamentale e completa la dimostrazione.

Osservazione 194 Sottolineiamo che la successione (kn) costruita nella dimo-strazione del teorema converge al punto fisso per ogni scelta del valore inizialek0.

Presentiamo ora una semplice modifica del teorema 193 che e spesso utile.Indichiamo con f (n) la funzione su X ottenuta componendo f con se stessan–volte:

f (1)(x) = f(x) , f (k)(x) = f(f (k−1)(x)

).

Puo accadere che f non sia una contrazione, ma che esista un numero ν percui f (ν) e una contrazione. Vale:

Page 153: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.13. TRASFORMAZIONI NON LINEARI 147

Corollario 195 Se f e continua e se f (ν) e una contrazione su un s.insiemeK chiuso di X tale che f(K) ⊆ K, allora f(x) ammette un punto fisso in Ke questo e unico.

Dim. Notiamo che se f(x0) = x0 allora vale anche

f(f(x0)) = f(x0) = x0

e quindi x0 e anche punto fisso di f (2). Iterando questo procedimento, si vedeche x0 e anche punto fisso della contrazione f (ν). Cio mostra l’unicita delpunto fisso. Proviamone ora l’esistenza.

Si sa che esiste il punto fisso x0 di f (ν):

x0 = f (ν)(x0) .

Applicando f ai due membri dell’uguaglianza si vede che

f(x0) = f(f (ν)(x0)) = f (ν)(f(x0))

ossia, anche f(x0) e punto fisso della contrazione f (ν). L’unicita del punto fissoimplica che

f(x0) = x0 .

Osservazione 196 Osserviamo che la ricerca dei punti fissi conduce anchealla ricerca di zeri di funzioni: il funto x0 verifica f(x0) = 0 se e solo se x0 epunto fisso di F (x) = x− f(x).

Applicazioni: il metodo delle tangenti

E’ noto il metodo delle tangenti per la determinazioni di zeri di funzioni con-vesse di variabile reale. Mostriamo come tale metodo si ritrovi mediante ilteorema delle contrazioni. Sia per questo f(x) convessa su IR e di classe C2.Supponiamo che la derivata prima non si annulli e supponiamo che sia∣∣∣∣∣f(x)f ′′(x)

f ′(x)2

∣∣∣∣∣ ≤ α < 1 .

La funzione

F (x) = x− f(x)

f ′(x)

ha un punto fisso x0 se e solo se f(x0) = 0 e viceversa (si ricordi che la derivatanon si annulla).

Page 154: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

148 CAPITOLO 2. GLI SPAZI DI BANACH

Si calcola immediatamente che

F ′(x) =f(x)f ′′(x)

f ′(x)2

e quindi, nelle ipotesi fatte, F e una contrazione. Ha quindi un punto fisso chesi costruisce come segue: fissato un qualsiasi x0, il punto x1 e

x1 = F (x0) = x0 −f(x0)

f ′(x0),

punto nel quale la tangente in (x0, f(x0)) al grafico di f ,

y = f(x0) + f ′(x0)(x− x0) ,

taglia l’asse delle ascisse.Cio e l’interpretazione geometrica del punto x1 e quindi anche dei successivi

punti xn che approssimano lo zero di f(x).

Equazioni integrali di Fredholm ed equazioni differenziali ordinarie

Sia K(t, s, x) una funzione a valori reali continua su [a, b]× [a, b]× IR, lipschit-ziana nella terza variabile, uniformemente rispetto alla prima e alla seconda:

|K(t, s, x)−K(t, s, x′)| ≤M |x− x′|

conM indipendente da t e da s. Consideriamo la trasformazione Tµ da C(a, b)in se definita da

(Tµx)(t) = µ∫ b

aK(t, s, x(s)) ds+ f(t)

con f(t) funzione continua fissata. E’ chiaro che

|(Tµx)(t)− (Tµx′)(t)| ≤ µ

∫ b

aM |x(s)− x′(s)| ds ≤ µM(b− a)||x− x′||

e quindi la trasformazione T e una contrazione se

µM(b− a) < 1 . (2.72)

Dunque:

Teorema 197 Se µM(b− a) < 1, l’equazione di Fredholm

x(t) = µ∫ b

aK(t, s, x(s)) ds+ f(t) (2.73)

ammette soluzione e questa e unica.

Page 155: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.13. TRASFORMAZIONI NON LINEARI 149

Si noti che la condizione (2.72) puo realizzarsi o con [a, b] fissato, prendendoµ piccolo, o con µ fissato, spesso µ = 1, prendendo b− a piccolo.

Le ipotesi di questo teorema possono indebolirsi e in particolare si vede cheanche l’operatore

(Tµx)(t) = µ∫ t

aK(t, s, x(s)) ds+ f(t)

e una contrazione se K(t, s, x) e continua per a ≤ s ≤ t ≤ b ed uniformementelipschitziana in x ∈ IR. Nel caso particolare in cui f(t) = x0, costante, eµK(t, s, x) = K(s, x), l’equazione (2.73) equivale a

x′(t) = K(t, x(t)) , x(a) = x0 . (2.74)

Dunque,

Teorema 198 Sia K(t, x) continua in t, x ed uniformemente lipschitziana inx. Il problema di Cauchy (2.74) ammette soluzione su (a, b), con b abbastanzapiccolo, e tale soluzione e unica.

2.13.2 I differenziali

Sia f(x) una trasformazione da uno spazio di Banach X in uno spazio diBanach Y . Supponiamo che x0 sia un punto interno al suo dominio.

Nel caso in cui X = IRn si sa che si possono definire le “derivate direzionali”in x0 e la “matrice jacobiana”, che rappresenta il “differenziale”. Vogliamoestendere queste definizioni al caso in cui X e un generico spazio di Banach.

Sia v un qualsiasi elemento di X. Consideriamo il limite

limt→0

f(x0 + tv)− f(x0)

t.

Questo limite puo esistere o meno. Se esiste si indica col simbolo

Dvf(x0)

e si chiama la derivata secondo il vettore v. Se ||v|| = 1 la derivatasecondo il vettore v si chiama la derivata direzionale nella direzione v.

La derivata direzionale puo esistere in una direzione e non esistere in altredirezioni; e, se anche esiste in ogni direzione, la trasformazione

v −→ Dvf(x0) (2.75)

e in generale non lineare, come prova l’esempio seguente.

Page 156: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

150 CAPITOLO 2. GLI SPAZI DI BANACH

Esempio 199 Si definisce una funzione f(x, y) su IR2 come segue: prima ditutto si fissa una successione di punti (xk, yk) due a due distinti, tutti di norma1, ossia tutti appartenenti alla circonferenza

C = (x, y) | x2 + y2 = 1 .

Fissato un qualsiasi punto (x, y) di IR2 si considera il punto

(x, y)

||(x, y)||.

Questo puo essere uno dei punti (xk, yk) o meno. Se non e uno di tali punti,si pone f(x, y) = 0. Se invece esiste un indice k per cui

(x, y)

||(x, y)||= (xk, yk)

allora si definiscef(x, y) = k||(x, y)|| = k

√x2 + y2 .

In particolare, f(0, 0) = 0.Fissata una qualsiasi direzione v = (x, y), consideriamo i rapporti incre-

mentalif(tv)

t=f(tx, ty)

t.

Se v/||v|| non e uno dei punti (xk, yk), il valore del rapporto incrementale ezero per ogni t; e quindi

limt→0

f(tv)

t= 0 .

Altrimenti, se esiste un indice kv per cui

v

||v||= kv(xkv , ykv)

allora

limt→0

f(tv)

t= lim

t→0

tkv||v||t

= kv||v|| .

Dunque, df(x0, v) esiste per ogni vettore v, ma non e funzione lineare di v.

Quando invece l’operatore

v −→ df(x0, v) ,

Page 157: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

2.13. TRASFORMAZIONI NON LINEARI 151

e lineare, questo si chiama il differenziale di Gateaux di f in x0.Se esiste il differenziale di Gateaux di f in x0 allora, per ogni v fissato, si

ha

limt→0

∣∣∣∣∣∣∣∣∣∣f(x0 + tv)− f(x0)

t− df(x0, v)

∣∣∣∣∣∣∣∣∣∣ = 0 (2.76)

e quindif(x0 + tv)− f(x0)

t= df(x0, v) + o(t; x0, v)

ove o(t;x0, v) indica una funzione della variabile reale t a valori in X e taleche

limt→0

o(t;x0, v)

t= 0 .

Si noti pero che il limite non e generalmente uniforme rispetto a v. Si consideriinfatti l’esempio seguente:

Esempio 200 Sia X = IR2 e sia

f(x, y) =

1 se x2 < x < x4

0 altrimenti.

Si vede facilmente che il differenziale di Gateaux di questa funzione in (0, 0)esiste e vale 0. Pero, il limite (2.76) non e uniforme rispetto alla direzione.Infatti, sulla retta

x = t , y = mt

la disuguaglianza ∣∣∣∣∣f(t,mt)t

∣∣∣∣∣ < ϵ

vale quando 0 ≤ t ≤ 3√m. Dunque, non per 0 < t < δ per un valore δ

indipendente da m.Si osservi che la funzione f(x, y), pur essendo differenziabile secondo Gateaux

in (0, 0), non e continua.

Si dice che una funzione f(x) e differenziabile secondo Frechet nelpunto x0 quando esiste un funzionale lineare L per cui

f(x0 + v)− f(x0) = Lv + o(v; x0) .

Col simbolo o(v; x0) si intende una funzione, questa volta da X in se, tale che

lim||v||→0

o(v;x0)

||v||= 0 .

Page 158: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

152 CAPITOLO 2. GLI SPAZI DI BANACH

Si richiede cioe che L verifichi

lim||v||→0

||f(x0 + v)− f(x0)− Lv||||v||

= 0 .

Il funzionale lineare L si chiama il differenziale di Frechet della funzione f inx0, e si indica col simbolo

df(x0)v .

E’ facile provare:

• Se esiste il differenziale di Frechet in un punto x0 allora esiste anchequello di Gateaux, e questi coincidono;

• se esiste il differenziale di Frechet nel punto x0 allora la funzione econtinua in x0.

La formulaf(x0 + v)− f(x0) = df(x0)v + o(v;x0)

generalizza la prima formula degli incrementi finiti.Se esiste, df(x0) e un elemento di L(X,Y ).Quando il differenziale di Frechet esiste in ogni punto di un intorno di x0,

la funzionex→ df(x)

si indica col simbolo f ′(x) e si chiama la funzione derivata secondoFrechet di f(x). Questa funzione e generalmente non lineare, da X aL(X, Y ). Puo ben essere che questa sia a sua volta differenziabile secondoFrechet nei punti di un intorno di x0. Si puo quindi definire la derivata secondadi f in x0.

Procedendo analogamente, si definiscono anche le derivate successive.

Page 159: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

Capitolo 3

Spazi di Hilbert

3.1 Prodotto interno e norma

Gli spazi di Hilbert sono particolari spazi di Banach, che generalizzano IRn

o IC n con l’usuale distanza euclidea.Conviene introdurre prima di tutto la definizione di prodotto interno.

SiaX uno spazio lineare. Si chiama prodotto interno suX una funzione f(x, y)su X ×X, a valori nel campo scalare, con queste proprieta:

• per ogni fissato y, la funzione x→ f(x, y) e lineare:

f(αx+ βx′, y) = αf(x, y) + βf(x′, y) .

• per ogni x ed y vale f(x, y) = f(y, x). Questa proprieta implica inparticolare che la parte immaginaria di f(x, x) e nulla per ogni x.

• vale f(x, x) > 0 per ogni x = 0.

La prima proprieta mostra che

f(0, 0) = f(r · 0, 0) = rf(0, 0)

per ogni numero r; e quindi, scegliendo r = 0,

f(0, 0) = 0 .

Si noti che la funzione f(x, y) non e lineare rispetto ad y ma, per ognifissato x, vale

f(x, αy + βy′) = f(αy + βy′, x) = αf(y, x) + βf(y′, x)

= αf(x, y) + βf(x, y′) . (3.1)

153

Page 160: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

154 CAPITOLO 3. SPAZI DI HILBERT

Le proprieta (3.1) si chiama antilinearita.Se accade che Φ = IR allora gli scalari sono reali e quindi si ha linearita

anche nella seconda componente.In pratica per indicare il prodotto interno di x ed y si usa il simbolo ⟨x, y⟩

(o simboli analoghi, per esempio ⟨x|y⟩). Si osservi la somiglianza col simbolo⟨⟨x∗, x⟩⟩ usato per rappresentare l’azione del funzionale lineare x∗ su x. Si notipero che ⟨⟨x∗, x⟩⟩ e lineare sia rispetto alla prima che alla seconda variabile,anche quando Φ = IC.

Due vettori x ed y si dicono ortogonali quando il loro prodotto internoe nullo:

x ⊥ y ⇐⇒ ⟨x, y⟩ = 0 .

Proviamo che per i prodotti interni vale la disuguaglianza di Schwarz:

Teorema 201 Per ogni x, y vale

|⟨x, y⟩|2 ≤ ⟨x, x⟩⟨y, y⟩ .

L’uguaglianza vale se e solo se i vettori x ed y sono colineari, ossia se e solose x = αy, α ∈ Φ.

Dim. Se ⟨x, y⟩ = 0 allora la disuguaglianza e ovvia. Supponiamo quindiesplicitamente ⟨x, y⟩ = 0 e introduciamo

a =⟨x, y⟩|⟨x, y⟩|

.

Consideriamo quindi che per ogni t (reale o complesso) vale

0 ≤ ⟨ax+ ty, ax+ ty⟩ .

Scegliamo t reale e introduciamo in quest’espressione la definizione di a. Sitrova

0 ≤ ⟨ax+ ty, ax+ ty⟩ = ⟨y, y⟩t2 + 2|⟨x, y⟩|t+ ⟨x, x⟩ . (3.2)

Questo e un polinomio in t, a coefficienti reali. Il segno di questo polinomio ecostante e quindi il suo discriminante e negativo, ossia:

|⟨x, y⟩|2 ≤ ⟨x, x⟩⟨y, y⟩ . (3.3)

Questa e la disuguaglianza che volevamo provare.Se in (3.3) vale l’uguaglianza, allora il polinomio (3.2) e un quadrato:

⟨ax+ ty, ax+ ty⟩ = (mt+ n)2

Page 161: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.1. PRODOTTO INTERNO E NORMA 155

per certi numeri m ed n. E’ quindi nullo per t = −n/m, ossia

⟨ax+ (−n/m)y, ax+ (−n/m)y⟩ = 0 e dunque ax+ (−n/m)y = 0 ,

cosı che i vettori x ed y sono colineari.

Teorema 202 La funzione definita su X da

x→√⟨x, x⟩

e una norma su X.

Dim. Usando la disuguaglianza di Schwarz, proviamo che vale la disuguaglian-za triangolare:

⟨x+ y, x+ y⟩ = ⟨x, x⟩+ ⟨x, y⟩+ ⟨y, x⟩+ ⟨y, y⟩= ⟨x, x⟩+ 2ℜe ⟨x, y⟩+ ⟨y, y⟩≤ ⟨x, x⟩+ 2|⟨x, y⟩|+ ⟨y, y⟩ (usando la disuguaglianza di Schwarz)

≤ ⟨x, x⟩+ 2 (⟨x, x⟩)1/2 (⟨y, y⟩)1/2 + ⟨y, y⟩ =[⟨x, x⟩1/2 + ⟨y, y⟩1/2

]2.

Si ha quindi √⟨x+ y, x+ y⟩ ≤

√⟨x, x⟩+

√⟨y, y⟩ .

Questa e la disuguaglianza triangolare. Le altre proprieta della norma sonoimmediate. Si noti che la proprieta ||x|| > 0 per x = 0 vale perche ⟨x, x⟩ = 0per x = 0.

Naturalmente scriveremo

||x|| =√⟨x, x⟩ . (3.4)

Con questa notazione, la disuguaglianza di Schwarz si scrive

|⟨x, y⟩ ≤ ||x|| · ||y|| .

E’ conseguenza della disuguaglianza di Schwarz e della definizione di normal’asserto seguente:

Corollario 203 Per ogni y ∈ X fissato, il funzionale lineare

x→ ⟨x, y⟩

e continuo sullo s.l.n. X, dotato della norma (3.4)

Page 162: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

156 CAPITOLO 3. SPAZI DI HILBERT

Dim. Infatti, dalla disuguaglianza di Schwarz,

|⟨x, y⟩| ≤M ||x|| , con M = ||y|| .

Le norme che discendono da un prodotto interno godono di una proprietabene particolare:

Teorema 204 Sia ||x|| =√⟨x, x⟩. Questa particolare norma verifica l’ugua-

glianza

||x+ y||2 + ||x− y||2 = 2(||x||2 + ||y||2

)(3.5)

Dim. Si calcola immediatamente

||x+ y||2 + ||x− y||2 = ⟨x+ y, x+ y⟩+ ⟨x− y, x− y⟩= ||x||2 + ⟨x, y⟩+ ⟨y, x⟩+ ||y||2 + ||x||2 − ⟨x, y⟩ − ⟨y, x⟩+ ||y||2

= 2(||x||2 + ||y||2

).

L’uguaglianza (3.5) si chiama identita del parallelogramma. Nellageometria piana essa si enuncia dicendo che la somma dei quadrati costruiti sul-le diagonali di un parallelogramma e uguale alla somma dei quadrati costruitisui lati.

E’ importante sapere che non tutte le norme discendono da un prodottointerno. Infatti vale:

Esempio 205 Si doti IR2 della norma

||(ξ, η)|| = max|ξ| , |η| .

Si provi che l’identita del parallelogramma non vale per la coppia dei vettorix = (1, 0) ed y = (0, 1).

Quest’osservazione suggerisce di dare un nome particolare agli s.l.n-ti lacui norma proviene da un prodotto interno. Questi si chiamano spazi pre-hilbertiani e, se sono anche completi, si chiamano spazi di Hilbert.

Lavoreremo ora esclusivamente con spazi di Hilbert, che indicheremo ge-nericamente col simbolo H.

E’ chiaro che ogni spazio di Hilbert e anche uno speciale spazio di Banach.Vedremo che le sue proprieta sono particolarmente importanti per le applica-zioni. Per esempio, possiamo notare subito che in spazi prehilbertiani vale ilteorema di Pitagora:

Page 163: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.1. PRODOTTO INTERNO E NORMA 157

Teorema 206 Siano h, k due elementi tra loro ortogonali di uno spazio diprehilbertiano H. Vale:

||h+ k||2 = ||h||2 + ||k||2 .

Dim. Si calcola immediatamente

||h+ k||2 = ⟨h+ k, h+ k⟩ = ||h||2 + ⟨h, k⟩+ ⟨k, h⟩+ ||k||2 = ||h||2 + ||k||2

perche h ⊥ k.

3.1.1 Esempi di prodotti interni e di spazi di Hilbert

Elenchiamo gli spazi di Hilbert di uso piu comune. Naturalmente essi si sonogia incontrati come particolari spazi di Banach.

Il paragrafo 2.7 riporta un elenco di spazi di Banach e ne rappresentain modo “concreto” i duali. Puo essere opportuno, ma non e indi-spensabile, conoscere queste rappresentazioni per la lettura di questoparagrafo.

Lo spazio euclideo ad n dimensioni

e uno spazio di Hilbert, con prodotto interno

⟨h, k⟩ =n∑i=1

kihi se h = col [hi] , k = col [ki] .

Lo spazio l2

e uno spazio di Hilbert, dotato del prodotto interno

⟨(hi), (ki)⟩ =+∞∑i=i

kihi .

La convergenza della serie, quando hi e ki sono in l2, e stata provata nelparagrafo 2.7. Possiamo ora notare che la convergenza segue applicando ladisuguaglianza di Schwarz alle somme finite, e passando al limite.

Si ricordi che il duale di l2 e isometrico a l2 stesso.

Page 164: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

158 CAPITOLO 3. SPAZI DI HILBERT

lo spazio L2(K)

e uno spazio di Hilbert, il cui prodotto interno e

⟨f, g⟩ =∫Kf(x)g(x) dx .

L’integrale dipende dagli elementi di L2(K), ossia dalle classi di equivalenza, enon dai rappresentanti delle classi stesse, e converge grazie alla disuguaglianzadi Schwarz per gli integrali.

Si ricordi, dal paragrafo 2.7, che anche in questo caso lo spazio e unarealizzazione del suo duale.

Lo spazio H2

e uno spazio di Hilbert. Il prodotto interno nel caso di H2(D) e1

⟨f, g⟩ = supr∈(0,1)

[∫ 2π

0f(reit)g(reit) dt

].

Nel caso di H2(Π) il prodotto interno e

⟨f, g⟩ = supx>0

[∫ +∞

−∞f(x+ iy)g(x+ iy) dy

].

Lo spazio W 12(K)

e uno spazio di Hilbert dotato del prodotto interno

⟨f, g⟩ =∫Kg(x)f(x) dx+

∫K∇f(x) · ∇g(x) dx .

Nel caso in cui K = [a, b], un prodotto interno che conduce ad una normaequivalente e

⟨f, g⟩ = g(a)f(a) +∫ b

ag′(x)f ′(x) dx .

Spazi L2 ed l2 “con peso”

Sia ρ(x) una funzione misurabile non negativa definita su un insieme misurabileΩ. Indichiamo con L2(K; ρ) l’insieme delle funzioni misurabili f(x) tali che∫

Ωρ(x)|f(x)|2 dx < +∞ .

1ricordiamo che frequentemente la norma si definisce premettendo un fattore 1/2πall’integrale.

Page 165: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.1. PRODOTTO INTERNO E NORMA 159

La disuguaglianza di Minkowski mostra che questo e uno spazio lineare. In-troducendo la relazione di equivalenza

f ∼ g se∫Ωρ(x)|f(x)− g(x)|2 dx = 0

si vede facilmente che lo spazio quoziente puo essere dotato della struttura dispazio di Hilbert, esattamente come si fa quando si introduce lo spazio L2(Ω)che, con queste notazioni, e niente altro che L2(Ω; ρ) con ρ(x) ≡ 1.2

La norma di f ∈ L2(Ω; ρ) e data da

||f ||2 =∫Ωρ(x)|f(x)|2 dx

(si noti che ρ(x) non e elevata al quadrato).In questo contesto la funzione ρ(x) si chiama funzione peso e lo spazio

L2(Ω, ρ) si chiama spazio “L2 con peso ρ”.Si noti che la funzione ρ(x) potrebbe tendere a zero, o addirittura essere

identicamente zero su un s.insieme di Ω, e potrebbe essere illimitata.Si vede facilmente che se esistono costanti m ed M per cui

0 < m ≤ ρ(x) ≤M

allora lo spazio L2(Ω; ρ) ha gli stessi elementi di L2(Ω), e le norme di L2(Ω; ρ)e di L2(Ω) si equivalgono.

In modo analogo si puo definire lo spazio l2 “con peso ρ”. In questo casoρ = (ρn) e una successione e gli elementi di tale spazio sono ora le successioni(xn) tali che

||(xn)||2 =+∞∑n=0

ρn|xn|2 < +∞ .

3.1.2 Uno spazio di Hilbert non separabile

Tutti gli esempi precedenti sono esempi di spazi di Hilbert separabili. Mo-striamo un esempio di spazio di Hilbert non separabile. Osserviamo che se||x|| = ||y|| = 1 e se x ⊥ y, allora

||x− y||2 = 2 ,

ossia x dista√2 da y. Dunque, se in uno spazio di Hilbert si trova una

famiglia non numerabile di vettori a due a due ortogonali, questo spazio none separabile.

2Naturalmente, procedendo in modo analogo, si potrebbero introdurre gli spazi di BanachLp(Ω, ρ) per ogni p ≥ 1.

Page 166: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

160 CAPITOLO 3. SPAZI DI HILBERT

Consideriamo le funzioni

t→ eist , t ∈ IR

dove s e un parametro reale.Consideriamo lo spazio lineare generato da queste funzioni e su esso il

prodotto interno

⟨f, g⟩ = limT→+∞

1

2T

∫ T

−Tg(t)f(t) dt .

Lo spazio che si ottiene e uno spazio prehilbertiano. Il suo completamento,introdotto nel teorema 29, e quindi uno spazio di Hilbert che non e separabileperche se f(t) = eist, g(t) = eirt, s = r, allora

⟨f, g⟩ = limT→+∞

1

2T

∫ T

−Tei(s−r)t dt = lim

T→+∞

ei(s−r)T − e−i(s−r)T

2T (s− r)= 0 .

Dunque in questo spazio c’e un sistema non numerabile di vettori due a dueortogonali. Come si e detto, cio basta a mostrare che lo spazio non e separabile.

3.2 Teorema delle proiezioni

Gli spazi di Hilbert, come si e notato, sono particolari spazi di Banach, dotatidi proprieta speciali, utili per le applicazioni. Essenzialmente esse discendo-no tutte dal teorema delle proiezioni, che e in realta un complesso diaffermazioni che e bene studiare separatamente. In particolare e bene esse-re precisi, distinguendo le affermazioni che valgono in spazi prehilbertiani daquelle che richiedono la completezza.

Sia H uno spazio prehilbertiano e sia X un suo s.spazio. Sia h ∈ H. Unpunto x0 ∈ X si chiama proiezione ortogonale di h su X se

h− x0 ⊥ x ∀x ∈ X .

Per indicare che h − x0 e perpendicolare ad ogni elemento di X, scriveremoanche

h− x0 ⊥ X .

Si noti che se h ∈ X allora h e proiezione di se stesso su X, h = x0.In un generico spazio di Banach, una definizione analoga non puo darsi

perche l’ortogonalita non e definita. Anche in spazi di Hilbert pero non eaffatto ovvio che, dato h, la sua proiezione x0 su X debba esistere. Se peroessa esiste allora si puo scrivere

h = (h− x0) + x0

Page 167: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.2. TEOREMA DELLE PROIEZIONI 161

e h−x0, essendo perpendicolare adX, e in particolare perpendicolare a x0 ∈ X.Dunque, usando il teorema di Pitagora, si ha

Teorema 207 Sia h ∈ H, H uno spazio prehilbertiano, ed esista la proiezionex0 di h su X. Vale:

||h||2 = ||h− x0||2 + ||x0||2 .

In particolare,

||x0|| ≤ ||h|| , ||h− x0|| ≤ ||h|| .

Abbiamo detto che l’esistenza della proiezione non e ovvia. Possiamo peroimmediatamente provare che, se la proiezione esiste, essa e unica:

Teorema 208 Sia h un elemento dello spazio prehilbertiano H. Sia X uns.spazio di H. Se esiste, la proiezione di h su X e unica.

Dim. Siano infatti x0 ed x1 due proiezioni di h su X. In tal caso,

⟨h− x0, x⟩ = 0 , ⟨h− x1, x⟩ = 0 ∀x ∈ X .

Usando la linearita della prima componente del prodotto interno si trova

⟨x1 − x0, x⟩ = 0 ∀x ∈ X .

Ora, X e uno spazio lineare a cui appartengono sia x0 che x1 e quindi anchex1 − x0 ∈ X. Scegliendo x = x1 − x0 si trova

0 = ⟨x1 − x0, x1 − x0⟩ = ||x1 − x0||2

e quindi x1 = x0.

Il problema della proiezione e uno dei problemi che si studiano nella geo-metria euclidea e si sa che, in tale contesto, la proiezione x0 di h e anche ilpunto di X che ha minima distanza da h. Questa proprieta vale anche in spaziprehilbertiani:

Teorema 209 Sia H uno spazio prehilbertiano e sia X un suo sottospazio.Un punto x0 ∈ X e proiezione su X di h ∈ H se e solo se

||h− x0|| ≤ ||h− x|| ∀x ∈ X .

Page 168: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

162 CAPITOLO 3. SPAZI DI HILBERT

Dim. Sia x0 la proiezione di h su X e sia x ∈ X qualsiasi. Si scriva

h− x = (h− x0) + (x0 − x) .

Essendo (h− x0) ⊥ (x− x0), dal teorema di Pitagora se gue

||h− x||2 = ||h− x0||2 + ||x− x0||2 ≥ ||h− x0||2 .

Cio prova che x0 e punto di minima distanza.Viceversa, sia

||h− x0|| ≤ ||h− x|| ∀x ∈ X .

Mostriamo che x0 e proiezione di h su X, ossia che

⟨h− x0, x⟩ = 0 ∀x ∈ X . (3.6)

Si fissi un qualsiasi x ∈ X e si consideri la funzione

t→ ||(h− x0 + tx||2 = ||h− x0||2 + t(2ℜe ⟨h− x0, x⟩) + t2||x||2 .

Questa e un polinomio nella variabile reale t, che ha minimo per t = 0. Se ilcampo scalare e IR, uguagliando a zero la derivata prima calcolata per t = 0si trova la (3.6). Se il campo scalare e IC , si trova

ℜe ⟨h− x0, x⟩ = 0 .

Si noti pero che x ∈ X e qualsiasi e quindi la precedente vale anche sostituendox con ix. Cosı facendo si trova che vale anche

Im ⟨h− x0, x⟩ = 0 .

La (3.6) segue combinando queste due.

Osservazione 210 Si osservi che la proprieta di minima distanza puo ancheintrodursi in un generico spazio di Banach. Pero in generale il punto di X chemeno dista da h, se H non e uno spazio di Hilbert, ne esiste ne e unico.

Rinunciamo a presentare un esempio che mostra la non esistenza e mo-striamo la non unicita. Sia per questo H lo spazio IR2, ma dotato dellanorma

||x|| = ||(ξ, η)|| = max|ξ| , |η| .

Sia X = (ξ, 0) | ξ ∈ IR l’asse delle ascisse e sia h = (0, 1). Si vede facilmenteche

||h− x|| = 1 ∀x = (ξ, 0) , ξ ∈ [−1, 1] .

Page 169: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.2. TEOREMA DELLE PROIEZIONI 163

Se invece x = (ξ, 0) con |ξ| > 1 allora

||h− x|| = |ξ| > 1 .

Dunque, il punto dell’asse delle ascisse che ha minima distanza da h non eunico e i punti di minima distanza sono quelli del segmento [−1, 1].

Esaminiamo ora il problema di minimo

min||h− x|| | x ∈ X .

In generale, un problema di minimo non ha soluzione, ma si possono semprecostruire “successioni minimizzanti”. Nel caso nostro, sia

d = inf||h− x|| x ∈ X

e, per ogni n, sia xn tale che

d ≤ ||h− xn|| < d+ 1/n . (3.7)

Proviamo:

Teorema 211 Sia H uno spazio prehilbertiano. La successione (xn) e fonda-mentale.

Dim. Fissati n ed m, si deve valutare ||xn− xm||. Per semplicita valutiamoneil quadrato. Usiamo l’identita del parallelogramma per scrivere

||xn − xm||2 = ||(xn − h) + (h− xm)||2

= 2[||xn − h||2 + ||h− xm||2

]− ||(xn − h)− (h− xm)||2

= 2[||xn − h||2 + ||h− xm||2

]− 4||xn + xm

2− h||2 .

E’1

2(xn + xm) ∈ X

e quindi

||xn + xm2

− h||2 > d2 .

Dalla definizione di (xn), assegnato ϵ > 0, segue l’esistenza di Nϵ tale che, sen, m sono maggiori di Nϵ, si ha

||xn − h||2 < d2 + ϵ/4 , ||xm − h||2 < d2 + ϵ/4 .

Page 170: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

164 CAPITOLO 3. SPAZI DI HILBERT

Dunque, per n, m maggiori di Nϵ vale anche

||xn − xm||2 < 2[2d2 +

ϵ

2

]− 4||xn + xm

2− h||2 ≤ 4d2 + ϵ− 4d2 = ϵ .

La successione (xn) e quindi fondamentale.

Di conseguenza:

Teorema 212 Sia H uno spazio di Hilbert e sia X un suo s.spazio chiuso.Per ogni h ∈ H esiste x0, proiezione di h su X.

Dim. Si costruisce la successione (xn), definita da (3.7). Si sa che questa e unasuccessione fondamentale in H, e quindi convergente, perche H e completo.

Siax0 = limxn .

Per ogni n, si ha xn ∈ X e quindi x0 ∈ X perche X e chiuso.Da (3.7) si ha

d = lim ||h− xn|| .

D’altra parte la continuita della norma mostra che

||h− x0|| = lim ||h− xn||

e quindi x0 e punto di minima distanza; e quindi e la proiezione di h su X.

3.3 Complementi ortogonali e proiezioni orto-

gonali

Sia A un qualsiasi sottoinsieme di uno spazio di Hilbert H. Definiamo

A⊥ = h | h ⊥ A = h | ⟨h, a⟩ = 0 ∀a ∈ A .

Ovviamente:

Lemma 213 Per ogni insieme A vale

A ∩ A⊥ = 0 .

Dim. Se infatti a ∈ A ∩ A⊥ allora ⟨a, a⟩ = 0 e quindi a = 0.

Vale:

Page 171: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.3. COMPLEMENTI ORTOGONALI E PROIEZIONI ORTOGONALI165

Teorema 214 L’insieme A⊥ e un s.spazio chiuso di H. Se A e denso in Hallora A⊥ = 0.

Se A⊥ = 0 e se A e un s.spazio, allora A e denso in H.

Dim. Siano x, y elementi di A⊥ e siano α e β scalari. Per ogni a ∈ A vale

⟨αx+ βy, a⟩ = α⟨x, a⟩+ β⟨y, α⟩ = 0 .

Cio prova che A⊥ e un s.spazio (anche se A non lo e.)Per provare che A⊥ e chiuso, sia (xn) una successione di elementi di A⊥

e supponiamo che essa converga ad x0. Dobbiamo provare che x0 ∈ A⊥. Lacontinuita del prodotto interno mostra che, per ogni a ∈ A,

⟨x0, a⟩ = lim⟨xn, a⟩ = 0 .

Dunque, x0 ∈ A⊥, come volevamo.Sia ora A denso in H e sia x ∈ A⊥. Mostriamo che

⟨x, h⟩ = 0 (3.8)

per ogni h ∈ H. Da cio, scegliendo in particolare h = x, seguira x = 0.Proviamo quindi che vale (3.8). Se accade che h ∈ A, allora vale (3.8). Seh /∈ A, essendo A denso, esiste una successione (an) in A, convergente ad h.Dunque, ancora per la continuita del prodotto interno,

⟨x, h⟩ = lim⟨x, an⟩ = 0 .

Ricapitolando, abbiamo provato che se A e denso in H allora A⊥ = 0.Viceversa sia A⊥ = 0 e sia inoltre A un s.spazio (anche non chiuso).

Mostriamo che A e denso in H. Procedendo per assurdo, se il s.spazio A none denso in H, la sua chiusura X e un s.spazio chiuso che non contiene unelemento h ∈ H. Sia x0 la proiezione di h su X. Il vettore h− x0 e non nullo,ed ortogonale ad X e quindi anche ad A.

Consideriamo ora un s.spazio chiuso X di H, ed il suo ortogonale X⊥.Associamo ad ogni h ∈ H la sua proiezione su X, che indichiamo col simboloPh. Dunque P indica un operatore da H in se. Studieremo piu avanti leproprieta dell’operatore P . Per ora scriviamo x nella forma

x = (Px) + (x− Px) = x+ y cosı che y = x− Px ⊥ X . (3.9)

Vale:

Page 172: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

166 CAPITOLO 3. SPAZI DI HILBERT

Teorema 215 Se X e un s.spazio chiuso di H, si ha:

H = X ⊕X⊥ .

Dim. Abbiamo gia notato che X ∩ X⊥ = 0. La (3.9) mostra che ognielemento di H e somma di un elemento di X e di uno di X⊥.

Osservazione 216 Grazie a quest’osservazione, la dimostrazione del teoremadi Hahn-Banach in spazi di Hilbert si fa in modo elementare. Se L0 e unfunzionale lineare e continuo sul s.spazio chiuso X0 di H, esso si estende ad Hdefinendolo nullo su X⊥ e ponendo quindi

L(Px+ (x− Px) ) = L0x .

Ovviamente, ||L|| = ||L0||.

Infine, esaminiamo le proprieta di [A⊥]⊥. E’ chiaro che

A ⊆ [A⊥]⊥ (3.10)

e generalmente l’inclusione e propria perche [A⊥]⊥ e un s.spazio chiuso, mentreA generalmente non lo e. Pero:

Teorema 217 Se X e un s.spazio chiuso allora

X = [X⊥]⊥ .

Dim. Per assurdo, l’inclusione sia propria, esista cioe ξ ∈ [X⊥]⊥, che nonappartiene ad X. Sia ξ0 la proiezione ortogonale di ξ su X. In tal casoξ − ξ0 ⊥ X, ossia ξ − ξ0 ∈ X⊥ ed anche ξ − ξ0 ∈ [X⊥]⊥, dato che sia ξ che ξ0sono in [X⊥]⊥. E quindi ξ− ξ0 appartiene sia ad X⊥ che al suo ortogonale. E’dunque nullo, ossia ξ = ξ0 ∈ X.

Studiamo ora le proprieta dell’operatore P , proiezione ortogonale di Hsul suo s.spazio chiuso X. L’operatore P e ovviamente una proiezione, ed enaturalmente associato alla proiezione su X⊥, che e data da Q = I −P , ove Ie l’operatore identita. Dal teorema di Pitagora, per ogni h ∈ H vale

||h||2 = ||Ph+ (I − P )h||2 = ||Ph||2 + ||(I − P )h||2 .

Dunque,||P || ≤ 1 , ||(I − P )|| ≤ 1 . (3.11)

Page 173: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.3. COMPLEMENTI ORTOGONALI E PROIEZIONI ORTOGONALI167

L’operatore P ha un’ulteriore proprieta interessante. Vale

⟨Ph, k⟩ = ⟨h, Pk⟩ h , k ∈ H . (3.12)

Infatti,⟨Ph, k⟩ = ⟨Ph, Pk + (I − P )k⟩ = ⟨Ph, Pk⟩

perche P (I − P ) = 0. Per questa stessa ragione,

⟨h, Pk⟩ = ⟨Ph+ (I − P )h, Pk⟩ = ⟨Ph, Pk⟩

e quindi vale (3.12).

Seguendo la terminologia nota dalla dimensione finita, un operatore linearecontinuo per cui vale la (3.12) si dice simmetrico. Dunque, ogni proiezioneortogonale e un operatore simmetrico. Si vede facilmente che vale anche ilvicevera:

Teorema 218 Sia P ∈ L(H) una proiezione. L’operatore P e la proiezioneortogonale sul s.spazio X = PH se e solo se e simmetrico.

Dim. Basta mostrare che se P ∈ L(H) e un operatore di proiezione che eanche simmetrico allora P e proiezione ortogonale. Sia per questo X = imP .Mostriamo prima di tutto che X e un s.spazio chiuso. Sia per questo (xn) unasuccessione in X, convergente ad un h ∈ H. Dobbiamo provare che h ∈ X.

Essendo xn ∈ X, si haxn = Pxn .

Passando al limite, grazie alla continuita di P , si trova

h = limxn = limPxn = Ph ∈ imP = X .

Cio prova che X e chiuso.Sia ora h ∈ H. Mostriamo che

h− Ph ⊥ X ,

cosı che Ph e effettivamente la proiezione ortogonale di h su X. Sia per questox un generico element di X, ossia un generico elemento Pk dell’immagine diP . Si ha

⟨h− Ph, x⟩ = ⟨h− Ph, Pk⟩ = ⟨P (h− Ph), k⟩ = ⟨Ph− Ph, k⟩ = 0

(si noti che in questo calcolo si e usato il fatto che P e sia una proiezione cheun operatore simmetrico.)

Cio e quanto volevamo provare.

Proviamo infine:

Page 174: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

168 CAPITOLO 3. SPAZI DI HILBERT

Teorema 219 Sia P ∈ L(H) una proiezione. l’operatore P e proiezioneortogonale se e solo se

[imP ]⊥ = im (I − P ) .

Dim. Ogni h ∈ H puo rappresentarsi scrivendo

h = Ph+ (I − P )h .

Essendo P una proiezione, si ha

(imP ) ∩ (im (I − P )) = 0

perche se Ph = (I − P )h, applicando P ai due membri e ricordando P 2 = Psi trova Ph = Ph− Ph = 0. Dunque, se P e una proiezione,

H = imP ⊕ im (I − P ) .

Se imP ⊥ im (I −P ) allora Ph e, per definizione, la proiezione ortogonaledi h su imP .

Viceversa, sia P proiezione ortogonale di H su un s.spazio X = imP . Siak un qualsiasi elemento di H e proviamo che k−Pk ⊥ Ph. Per vedere questosi usa il fatto che P , essendo proiezione ortogonale, e simmetrico, si veda ilTeorema 218. Usando questa proprieta,

⟨k − Pk, Ph⟩ = ⟨P (k − Pk), h⟩ = ⟨Pk − Pk, h⟩ = 0 .

3.3.1 Sistemi ortonormali e calcolo di proiezioni

Un insieme S di vettori di uno spazio di Hilbert si chiama ortogonale se

x , y ∈ S , x = y =⇒ x ⊥ y .

Se ogni elemento di S ha norma 1, l’insieme S si chiama ortonormale.Ovviamente, un sistema ortogonale che non contiene 0 e linearmente indi-

pendente, e quindi un sistema ortonormale e linearmente indipendente.Esponiamo un metodo, detto metodo di Gram–Schmidt che permet-

te di costruire sistemi ortonormali a partire da un qualsiasi insieme nume-rabile X ⊆ H. Supponiamo per semplicita che X = xn sia linearmenteindipendente. In tal caso, in particolare, ciascun suo elemento e non nullo.

Associamo a x1 l’elemento

e1 =x1

||x1||.

Page 175: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.3. COMPLEMENTI ORTOGONALI E PROIEZIONI ORTOGONALI169

Ad x2 associamo

e2 =z2

||z2||ove z2 = x2 − ⟨x2, e1⟩e1 .

Scelti e1 ,. . . , en−1 definiamo

en =zn

||zn||ove zn = xn −

n−1∑k=1

⟨xn, ek⟩ek .

E’ immediato vedere che gli ei sono due a due ortogonali ed ovviamente dinorma 1. Inoltre,

Teorema 220 Per ogni n vale

span e1 , . . . , en = span x1 , . . . , xn .

Osservazione 221 Abbiamo visto che la sfera di uno spazio di Banach didimensione infinita non e compatta. Ovviamente cio vale in particolare per glispazi di Hilbert. Pero nel caso degli spazi di Hilbert si puo dare una dimostra-zione elementare: col metodo precedente si costruisce un sistema numerabileed ortonormale en. Si nota quindi che la successione (en) non ha s.successioniconvergenti. Infatti, per n = m si ha

||en − em||2 = 2 .

Mostriamo ora come i sistemi ortonormali numerabili si possano usare per ilcalcolo di proiezioni. Consideriamo prima di tutto il caso in cui X sia uns.spazio di H, di dimensione finita k.

Siae1 , . . . , ek

una base ortonormale di X.In tal caso la proiezione x0 di h su X e data da

x0 =k∑i=1

αiei

perche ogni elemento di X ha questa forma.I numeri αi si calcolano facilmente:

⟨h, er⟩ = ⟨k∑i=1

αiei, er⟩ = αr ,

Page 176: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

170 CAPITOLO 3. SPAZI DI HILBERT

con un calcolo del tutto analogo a quello noto in dimensione finita. Dunque,

x0 =k∑i=1

⟨h, ei⟩ei .

E’ utile calcolare ora

||x0||2 = ⟨k∑i=1

αiei,k∑j=1

αjej⟩ =n∑

i,j=1

αiαj⟨ei, ej⟩ =n∑i=1

|αi|2

perche i vettori ei sono due a due ortogonali e di norma 1.Ricordando l’espressione di αi e la (3.11) si trova

n∑i=1

|⟨h, ei⟩|2 = ||x0||2 ≤ ||h||2 . (3.13)

Sia ora S = ei un sistema ortonormale numerabile. Il s.spazio di H

spanS = n∑i=1

αiei αi ∈ IC , n ∈ IN

non e chiuso. Indichiamo con X la sua chiusura. Vogliamo rappresentare x0,la proiezione su X di un generico elemento h ∈ H.

Notiamo prima di tutto:

Lemma 222 Vale ∣∣∣∣∣∣∣∣∣∣+∞∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

=+∞∑i=1

|αi|2

Dim. La somma di una serie e il limite della successione delle somme parziali,

+∞∑i=1

αiei = limn

n∑i=1

αiei

e, per la continuita della norma,∣∣∣∣∣∣∣∣∣∣+∞∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

=

∣∣∣∣∣∣∣∣∣∣limn

n∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

= limn

∣∣∣∣∣∣∣∣∣∣n∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

.

L’asserto segue dall’uguaglianza∣∣∣∣∣∣∣∣∣∣n∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

=n∑i=1

|αi|2 .

Inoltre

Page 177: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.3. COMPLEMENTI ORTOGONALI E PROIEZIONI ORTOGONALI171

Teorema 223 (di Riesz–Fischer) Sia S = ei un sistema ortonormalenumerabile. La serie

n∑i=1

αiei

converge in H se e solo se la successione (αn) e in l2.

Dim. Dal Lemma 222, se la serie converge in H si ha

+∞∑i=1

|αi|2 =∣∣∣∣∣∣∣∣∣∣+∞∑i=1

αiei

∣∣∣∣∣∣∣∣∣∣2

< +∞ .

Il viceversa segue notando che se (αn) ∈ l2 allora la successione delle sommeparziali e fondamentale. Infatti,

∣∣∣∣∣∣∣∣∣∣m∑i=n

αiei

∣∣∣∣∣∣∣∣∣∣2

=m∑i=n

|αi|2

e, per ipotesi, la successione (αn) e in l2.

Indichiamo ora con Xn lo spazio lineare (di dimensione finita) generato daivettori e1 ,. . . , en. Come si e visto, la proiezione xn di h su Xn e

xn =n∑i=1

⟨h, ei⟩ei

e, dalla (3.13), per ogni n vale

n∑i=1

|αi|2 =n∑i=1

|⟨h, ei⟩|2 ≤ ||h||2 .

Dunque la successione (αi) e in l2 e quindi

x0 =+∞∑i=1

⟨h, ei⟩ei (3.14)

converge in H. E’ facile immaginare che valga:

Teorema 224 Il vettore x0 definito in (3.14) e la proiezione ortogonale di hsu X.

Page 178: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

172 CAPITOLO 3. SPAZI DI HILBERT

Dim. Per mostrare cio si prova che h − x0 e ortogonale ad ogni elemento diX. Ricordiamo che per definizione ogni x ∈ X e limite di una successione (sn)in spanS e, per la continuita del prodotto interno,

⟨x, h− x0⟩ = ⟨lim sn, h− x0⟩ = lim⟨sn, h− x0⟩ .

Dunque basta provare che h − x0 e ortogonale a spanS e per questo bastaprovare che e ortogonale ad ogni elemento ek. Cio si vede immediatamenteperche3

⟨h− x0, ek⟩ = ⟨h, ek⟩ − ⟨+∞∑i=1

⟨h, ei⟩ei, ek⟩

= ⟨h, ek⟩ −+∞∑i=1

⟨⟨h, ei⟩ei, ek⟩ = ⟨h, ek⟩ − ⟨h, ek⟩ = 0 .

Abbiamo cosı identificato la proiezione x0 di h su X,

x0 =+∞∑i=1

⟨h, ei⟩ei .

Dalla (3.13), vale+∞∑i=1

|⟨h, ei⟩|2 ≤ ||h||2 .

Questa disuguaglianza si chiama disuguaglianza di Bessel.

3.3.2 Serie di Fourier astratte

Le considerazioni svolte al paragrafo precedente si possono interpretare comesegue: in uno spazio di Hilbert H e dato un s.spazio X separabile, generatoda un sistema ortonormale S = ei (niente vieta che sia X = H. In talcaso S si chiama un sistema ortonormale massimale o completo.)Si vuole sviluppare un elemento h di H in serie degli ei. Questi problemisono stati studiati prima di tutto nel caso concreto in cui H = L2(−π, π) eS = cosnt√

π, sinnt√

π e quindi si parla in generale di serie di Fourier astratte

per riferirsi allo sviluppo di h in serie degli ei.E’ possibile provare, usando il lemma di Zorn, che ogni spazio di Hilbert

ha un sistema ortonormale massimale, e che questo e numerabile se e solo seH e separabile. E’ utile conoscere alcuni test utili per verificare se un sistemaortonormale numerabile in uno spazio di Hilbert e massimale o meno. Vale:

3si noti l’uso della linearita e continuita della prima componente del prodotto interno,per scambiare i segni di serie e di prodotto interno.

Page 179: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 173

Teorema 225 Sia S = ei un sistema ortonormale finito o numerabile inuno spazio di Hilbert H. Si equivalgono le affermazioni seguenti:

i) il sistema S e massimale;

ii) ogni h ∈ H si sviluppa in serie degli ei,

h =∑

αiei ;

iii) per ogni h ∈ H vale l’uguaglianza

||h||2 =+∞∑i=1

|⟨h, ei⟩|2 ; (3.15)

iv) se ⟨h, ei⟩ = 0 per ogni i allora h = 0.

Dim. Si e gia visto che i) implica ii) e quindi iii) vale per il lemma 222.In particolare, se ⟨h, ei⟩ = 0 per ogni i allora h = 0, ossia vale iv). Ladimostrazione si completa provando che se vale iv) allora S e massimale.

La condizione iv) significa

[spanS]⊥ = 0

Si sa, dal teorema 214 che in tal caso spanS e denso in H. Dunque, S emassimale.

L’uguaglianza (3.15) si chiama identita di Parseval.

3.4 Esempi di sistemi ortogonali massimali

In questa parte consideriamo esplicitamente alcuni esempi di sviluppi in seriedi funzioni ortogonali che sono maggiormente importanti per le applicazioni.Ovviamente, il piu importante e quello delle serie di Fourier, ma altrisono gli sviluppi in serie di polinomi ortogonali e gli sviluppi in serie diFourier-Bessel.

3.4.1 Sviluppi in serie di Fourier

Consideriamo lo spazio di Hilbert L2(−π, π). Una verifica immediata e che ilsistema di funzioni

1√2πeinx (3.16)

e un sistema ortonormale. Vogliamo provare

Page 180: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

174 CAPITOLO 3. SPAZI DI HILBERT

Teorema 226 Il sistema (3.16), al variare di n tra i numeri interi, e completoin L2(−π, π).

Dim. E’ sufficiente mostrare che lo spazio lineare generato da queste funzionie denso in L2(−π, π) e per questo basta mostrare che ogni funzione di unopportuno s.spazio denso in L2(−π, π) e approssimabile in norma quadraticamediante combinazioni lineari delle funzioni in (3.16).

Un s.spazio denso in L2(−π, π) si e gia trovato, ed e quello dei polinomi, siveda il Teorema 48.

E’ immediatamente evidente che ogni polinomio puo approssimarsi nellanorma di L2(−π, π) mediante una successione di funzioni f(x) con questeproprieta:

• la funzione f(x) e di classe C2;

• vale f(−π) = f(π), f ′(−π) = f ′(π), f ′′(−π) = f ′′(π).

Chiameremo queste le funzioni “periodiche di classe C2” perche si possonoestendere a funzioni periodiche (definite su IR) e di classe C2. Parleremo di“funzioni periodiche di classe C1” se la condizione sulla derivata seconda nonviene richiesta.

Ricapitolando, l’insieme delle funzioni periodiche di classe C2 e denso inL2(−π, π).

Proveremo che ogni funzione periodica di classe C2 e limite uniforme (equindi anche in norma L2(−π, π)) della propria serie di Fourier:

f(x) = limNsN(x) , sN(x) =

+N∑n=−N

fneinx (3.17)

dove

fn =1

∫ +π

−πf(ξ)e−inξ dξ .

Cio e sufficiente per provare il teorema.Servono per questo tre osservazioni:

• per ogni N ≥ 0 vale

1

∫ π

−π

N∑n=−N

ein(x−ξ) dξ = 1 +N∑

n=−N ; n =0

1

in

[ein(x+π) − ein(x−π)

]= 1

percheein(x−π) = ein(x+π) .

Page 181: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 175

• se ϕx(ξ) e una famiglia di funzioni periodiche di classe C1, dipendentedal parametro x e con derivate (rispetto a ξ) limitate uniformemente alvariare di x,

|ϕ′x(ξ)| < M ∀x , ξ

allora4

limn

∫ π

−πϕx(ξ)e

in(x−ξ) dξ = 0 . (3.18)

Il limite e uniforme rispetto ad x.

Questa proprieta si vede notando che

ein(x−ξ) = (i/n)d

dξ(ein(x−ξ)) .

Integrando per parti:∣∣∣∣∫ π

−πϕx(ξ)e

in(x−ξ) dξ∣∣∣∣ = ∣∣∣∣ in

[ϕx(ξ)e

in(x−ξ)]+πξ=−π

+i

n

∫ π

−πϕ′x(ξ)e

in(x−ξ) dξ∣∣∣∣ = 1

n

∣∣∣∣∫ π

−πϕ′x(ξ)e

in(x−ξ) dξ∣∣∣∣ < 2πM

n→ 0

per n → +∞. In particolare, prendendo le parti reali ed immaginariein (3.18), si vede che vale anche

limn

∫ π−π ϕx(ξ) sin[n(x− ξ)] dξ = 0 ,

limn

∫ π−π ϕx(ξ) cos[n(x− ξ)] dξ = 0

(3.19)

e il limite e uniforme rispetto ad x.

• Vale5

DN(x) =N∑

k=−Neikx =

2N + 1

se x = 0oppure x = 2π

sin[ 2N+12

x]sin(x/2)

altrimenti.

(3.20)

Proviamo ora la (3.17). Ricordiamo che f(x) e periodica di classe C2 escriviamo

f(x)− sN(x) = f(x) · 1− sN(x)

4Si noti che questa e una versione semplicissima del Teorema di Riemann-Lebesgue,Teorema 359.

5si veda la fine della dimostrazione del Teorema 111.

Page 182: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

176 CAPITOLO 3. SPAZI DI HILBERT

=1

∫ +π

−π[f(x)− f(ξ)]

+N∑n=−N

[e−inξeinx

]dξ

=1

∫ +π

−π[f(x)− f(ξ)]

sin[(2N + 1)(x− ξ)/2]

sin[(x− ξ)/2]dξ =

1

∫ +π

−πsin[(2N + 1)(x− ξ)/2]

f(x)− f(ξ)

sin[(x− ξ)/2]dξ

=1

∫ π

−π[sinN(x− ξ)]

f(x)− f(ξ)

tan[(x− ξ)/2]dξ (3.21)

+1

∫ π

−π[cosN(x− ξ)] f(x)− f(ξ) dξ . (3.22)

L’integrale in (3.22) tende a zero per N → +∞, grazie a (3.19) con ϕx(ξ) =f(x) − f(ξ). Mostriamo che la proprieta in (3.19) puo applicarsi anche al-l’integrale in (3.21). Essendo tan t periodica di periodo π, ciascuna dellefunzioni

ξ → ϕx(ξ) =f(x)− f(ξ)

tan[(x− ξ)/2]

e periodica di periodo 2π. Proviamo che la funzione ξ → ϕx(ξ) e periodica diclasse C1 con derivata uniformemente limitata rispetto ad x e ξ.

Essendo f(ξ) differenziabile, f(x) − f(ξ) = o(x − ξ), si ha che ξ → ϕx(ξ)ammette estensione continua a ξ = x. Mostriamo che la sua derivata e periodi-ca e continua anche per ξ = x, e che c’e una limitazione della derivata uniformerispetto ad x e ξ, grazie al fatto che f(ξ) ammette due derivate continue.

La derivata ddξϕx(ξ) e:

−f ′(ξ) tan[(x− ξ)/2] + (1/2)[f(x)− f(ξ)] 1/ cos2[(x− ξ)/2]tan2[(x− ξ)/2]

=f(x)− f(ξ)− f ′(ξ) sin(x− ξ)

2 sin2[(x− ξ)/2].

Questa funzione e periodica di periodo 2π. Per mostrare la regolarita si scriveil numeratore come

f(x)− f(ξ)− f ′(ξ)(x− ξ)+ f ′(ξ) (x− ξ)− sin(x− ξ) .

La limitatezza della derivata ( d/ dξ)ϕx(ξ) segue usando la continuita delladerivata seconda di f(ξ) e scrivendo la formula di Taylor arrestata al secondoordine con resto in forma di Lagrange di ciascuno dei termini in parentesigraffa.

Page 183: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 177

Osservazione 227 Abbiamo provato che le somme parziali delle serie di Fou-rier di f(x) convergono uniformemente ad f(x) se f(x) e periodica e di classeC2. E’ facile immaginare che le condizioni di regolarita possano indebolirsi, esi potrebbe congetturare che sia sufficiente la sola continuita di f(x). Si sa,dal teorema 111, che questa congettura e falsa.

Come si e detto, la successione di funzioni (Dk(x)) si chiama nucleo diDirichlet e non e un’identita approssimata (il grafico diD10(x) e in figura (3.1))dato che le funzioni DN(x) non hanno segno costante. Cio mostra che la con-vergenza della serie di Fourier dipende dalla compensazione di valori negativie positivi e quindi e un fenomeno piuttosto delicato.

Figura 3.1:

−1 0 1 2 3 4 5 6 7−5

0

5

10

15

20

25

30

y

x π

3.4.2 Una conseguenza dell’identita di Parseval

Sia f(x) una funzione a quadrato integrabile su [−π, π]. La funzione dellavariabile reale ω definita da

f(ω) =∫ π

−πe−iωtf(t) dt

Page 184: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

178 CAPITOLO 3. SPAZI DI HILBERT

si chiama6 trasformata di Fourier di f .

Consideriamo ora la base ortonormale en con

en =1√2πeint .

Allora,

f(n) =√2π⟨f, en⟩ .

Dunque, dall’identita di Parseval, si trova:

||f ||2L2(−π,π) =1

n=+∞∑n=−∞

|f(n)|2 . (3.23)

Quest’espressione si puo scrivere in un modo piu generale. Fissiamo unqualsiasi numero reale T e consideriamo la funzione

g(t) = e−iT tf(t) .

Si calcola facilmente che

g(ω) = f(ω + T ) .

Leggiamo questa con ω = n, numero intero, e notiamo che se T e reale si ha

||f ||L2(−π,π) = ||g||L2(−π,π) .

D’altra parte, anche per g vale

⟨g, en⟩ =1√2πg(n) .

Applicando l’identita (3.23) alla funzione g si trova:

||g||2L2(−π,π) = ||f ||2L2(−π,π) =1

n=+∞∑n=−∞

|f(n+ T )|2 .

Si noti che quest’uguaglianza vale per ogni T .

6vedremo piu avanti che questa definizione e un caso particolare di una definizione piugenerale.

Page 185: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 179

3.4.3 Polinomi di Legendre, Laguerre ed Hermite

Senza ancora specificare lo spazio in cui si lavora, consideriamo l’operatore chead una funzione y(x) associa

(Ay) (x) = σ(x)y′′(x) + τ(x)y′(x) . (3.24)

Accade frequentemente di dover calcolare numeri λ in corrispondenza dei qualiesistono polinomi y(x) che risolvono l’equazione

Ay = λy

ossiaσ(x)y′′(x) + τ(x)y′(x) = λy(x) (3.25)

Ovviamente, dopo aver specificato lo spazio in cui si intende lavorare, questosara un problema di calcolo di autovalori ed autofunzioni.

Osservazione 228 Quando si lavora con equazioni differenziali, e pratica co-mune non indicare esplicitamente la variabile indipendente della funzione in-cognita. Noi seguiremo questa pratica e quindi, per esempio, invece di (3.25),scriveremo

σ(x)y′′ + τ(x)y′ = λy .

Notiamo subito una forma diversa sotto cui si puo porre questo problema:sia ρ(x) soluzione non nulla di

(σ(x)ρ)′ = τ(x)ρ .

Moltiplicando per ρ i due membri di (3.25) si vede che risolvere la (3.25)equivale a risolvere

(ρ(x)σ(x)y′)′ = λρ(x)y . (3.26)

Si noti inoltre che ρ(x), essendo una soluzione non nulla di un’equazionedifferenziale lineare del primo ordine, non ha zeri. Non e quindi restrittivoassumere

ρ(x) ≥ 0 ,

come da ora in poi faremo.Diciamo subito che troveremo successioni di autovalori e successioni di au-

tofunzioni che sono polinomi, in uno spazio che ora specificheremo. Con lescelte particolari di σ(x) e di τ(x) che ora vedremo, questi si chiamano i poli-nomi ortogonali classici. E precisamente, con le scelte particolari nellaTabella 3.1, si parla di polinomi di Legendre, polinomi di Laguerre e

Page 186: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

180 CAPITOLO 3. SPAZI DI HILBERT

Tabella 3.1: Polinomi ortogonali classici

Legendre: Pn(x) Laguerre: Ln(x) Hermite: Hn(x)σ(x) (1− x2) x 1τ(x) −2x −x+ 1 −2x

ρ(x) 1 e−x e−x2

λn −n(n+ 1) −n −2nH L2(−1, 1) L2(0,+∞; ρ) L2(−∞,+∞; ρ)

polinomi di Hermite. La tabella riporta σ(x), τ(x), ρ(x) e gli autovalorinei tre casi. La prima riga riporta i simboli standard che si usano per indicaretali polinomi e l’ultima riga riporta lo spazio di Hilbert in cui, come vedremo,questi sono un sistema ortogonale completo.

Le informazioni nella tabella 3.1 sono ripetute, e completate, nella tabel-la 3.2.

Osservazione 229 Si osservi che gli autovalori sono negativi. Talvolta invecedi usare l’espressione (3.25), si studia il problema

σ(x)y′′ + τ(x)y′ + λy = 0 .

E’ chiaro che in tal caso il segno dei λn va cambiato.

In questo paragrafo studieremo le proprieta principali dei polinomi orto-gonali classici, in modo unificato. Per questo indicheremo genericamente conpn(x) uno di tali polinomi, che leggeremo nello spazio di Hilbert detto nellatabella, e che indicheremo con H.

Osservazione 230 La proprieta principale delle funzioni σ(x) e τ(x) e diessere polinomi rispettivamente di grado al piu 2 ed al piu 1 e tali che se p(x)ha grado n allora (Ap) (x) ha ancora grado n. Inoltre, in ciascuno dei trecasi, τ ′(0) < 0.

La proprieta principale degli spazi H e che essi contengono tutti i polinomi.Anzi, una dimostrazione analoga a quella del Teorema 48 mostra che l’insiemedei polinomi e denso in H.

Page 187: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 181

Come si e detto, vogliamo provare l’esistenza di autovalori e di autovettoriche sono polinomi. Introduciamo per questo lo spazio lineare Pn dei polinomidi grado n al piu. La dimensione di Pn e n + 1 e, come si e notato nell’os-servazione 230, l’operatore A trasforma ciascuno spazio Pn in se. Essendo lospazio Pn di dimensione finita, l’operatore A ammette almeno un autovaloreλ ed un autovettore, che e quindi un polinomio di grado n al piu, in ciascunodegli spazi Pn.

Notiamo che un autovettore che appartiene a Pn e anche un autovettoreche appartiene a Pk per ogni k > n.

Consideriamo ora lo spazio P0, i cui elementi sono le costanti. E’ chiaroche ciscuna di esse e un autovettore di A, di autovalore uguale a 0.

Consideriamo ora lo spazio P1 i cui elementi sono i polinomi delle formaax + b con a e b reali. Mostriamo che in P1 esistono due autovettori di A, digradi 0 e 1.

L’esistenza di autovettori di grado 0 si e gia notata: sono i polinomicostanti.

Notiamo che se si vuole che y(x) risolva (3.25) e se inoltre y(x) deve essereun polinomio di grado 1, allora y(x) risolve

τ(x)y′ = λy .

Mostriamo che quest’equazione, per un opportuno valore di λ, ha effettiva-mente una soluzione di forma

y(x) = x+ b .

Ricordiamo per questo che τ ′(0) = 0.Sostituendo ed uguagliando i coefficienti dello stesso grado si trova che λ e

b sono dati da λ = τ ′(0)

b = τ(0)λ

= τ(0)τ ′(0)

.

Si noti che λ < 0 perche τ ′(0) < 0.Quest’osservazione si puo generalizzare procedendo per induzione.Supponiamo di aver trovato autovalori

λ0 = 0, λ1 = τ ′(0), λ2, . . . , λn

e corrispondenti autovettori

p0(x), p1(x), p2(x), . . . , pn(x)

Page 188: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

182 CAPITOLO 3. SPAZI DI HILBERT

in Pn. Supponiamo inoltre che il polinomio pk(x) abbia grado k e che l’espres-sione per λk sia

λk = k

[σ′′(0)

2(k − 1) + τ ′(0)

].

Proviamo che si trova un numero λn+1 e un polinomio pn+1(x) di gradon+ 1 e tali che

(Apn+1) (x) = λn+1pn+1(x) , λn+1 = (n+ 1)

[σ′′(0)

2n+ τ ′(0)

].

Si noti che ogni polinomio r(x) di grado n al piu, puo rappresentarsi comecombinazione lineare dei pk(x), con k ≤ n, perche pk(x) ha grado k.

Costruiamo un ulteriore autovettore q(x) di grado n+1. Ricerchiamo q(x)nella forma

q(x) = xn+1 +n∑j=0

αjpj(x) .

Notiamo che il polinomio xn+1 viene trasformato da A nel polinomio

(n+ 1)nσ(x)xn−1 + (n+ 1)τ(x)xn

= (n+ 1)n

[σ(0) + xσ′(0) +

x2

2σ′′(0)

]xn−1 + (n+ 1) [τ(0) + xτ ′(0)]xn .

Imponendo

Aq(x) = µq(x)

si trova

(n+ 1)n

[σ(0) + xσ′(0) +

x2

2σ′′(0)

]xn−1

+(n+ 1) [τ(0) + xτ ′(0)]xn +n∑j=0

λjαjpj(x) = µxn+1 +n∑j=0

µαjpj(x) .

Uguagliando i coefficienti dei termini di grado massimo nei due membri, sitrova

µ = (n+ 1)

[σ′′(0)

2n+ τ ′(0)

].

Si noti che µ non coincide con nessuno dei λk, k ≤ n.

Page 189: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 183

A questo punto, per verificare l’uguaglianza, basta determinare i coefficientiαj in modo da avere

n∑j=0

[µ− λj]αjpj(x) = (n+ 1)n[σ(0) + σ′(0)x]xn−1 + (n+ 1)τ(0)xn .

Cio puo farsi perche il grado di pj(x) e j e inoltre [µ− λj] = 0 per ogni j cosıche (µ− λj)pj(x) e un sistema linearmente indipendente in Pn.

Osservazione 231 Si noti quindi che A ha esattamente n + 1 autovettoridistinti nello spazio Pn, di dimensione n+ 1.

Nel calcolo precedente abbiamo anche specificato l’espressione dei λn. Cisi potrebbe chiedere se esistano valori λ diversi da questi in corrispondenza deiquali la (3.24) ammetta soluzioni polinomiali. La risposta e negativa: se cioaccadesse, per un certo valore di n, l’operatore A avrebbe in Pn piu di n + 1autovettori linearmente indipendenti e cio non puo aversi perche lo spazio hadimensione n+ 1.

Il polinomio pn(x) e soluzione dell’equazione (3.25) con λ = λn. Essendoquesta un’equazione differenziale lineare del secondo ordine, essa ammette unseconda soluzione, linearmente indipendente da pn(x). Per quanto detto sopra,questa non e un polinomio e si potrebbe provare che questa funzione nonappartiene ad H.

Mostriamo ora:

Teorema 232 La successione pn(x) e un sistema ortogonale massimale inH.

Dim. Indichiamo con (a, b) l’intervallo, eventualmente illimitato, su cui lefunzioni di H si considerano, si veda la Tabella 3.1. Proviamo che se n = mallora

⟨pn, pm⟩H =∫ b

apn(x)ρ(x)pm(x) dx = 0 .

Ricordiamo che λn = λm e quindi, da

d

dx[σ(x)ρ(x)p′n] = λnρ(x)pn ,

d

dx[σ(x)ρ(x)p′m] = λmρ(x)pm ,

si trova

(λn − λm)⟨pn, pm⟩H

=∫ b

a

d

dx[σ(x)ρ(x)p′n(x)] pm(x)− pn(x)

d

dx[σ(x)ρ(x)p′m(x)]

dx

[σ(x)ρ(x)p′n(x)]pm(x)∣∣∣∣ba− pn(x)[σ(x)ρ(x)p′m(x)]

∣∣∣∣ba= 0

Page 190: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

184 CAPITOLO 3. SPAZI DI HILBERT

tenendo conto dei limiti di ρ(x) e di σ(x) per x tendente agli estremi di (a, b).Come si e detto, ogni polinomio e combinazione lineare dei pn(x); e l’insie-

me di tutti i polinomi e denso in H, si veda l’osservazione 230. Cio prova cheil sistema ortonormale dei pn(x) e massimale in H.

Sviluppi in serie di polinomi ortogonali

Dividendo ciascuno dei polinomi pn(x) per la sua norma nel corrispondentespazio H, si trova una successione ortonormale massimale in H; e quindi ognif ∈ H si rappresenta come

f(x) =+∞∑n=0

[⟨f, pn⟩H ] pn(x)

dove il prodotto interno e quello di H e la serie converge nella norma di H.Tutto cio che si e detto per gli sviluppi di Fourier astratti si applica in questocaso particolare. Per esempio, vale l’identita di Parseval,

||f ||2H =+∞∑n=0

|⟨f, pn⟩H |2 .

Consideriamo ora questo problema: abbiamo costruito un sistema ortonor-male massimale di polinomi in L2(a, b; ρ). E’ ovvio che questo sistema non siaunico: moltiplicando tali polinomi per costanti di modulo 1, si trova ancora unsistema ortonormale massimale in L2(a, b; ρ). Mostriamo che pero questo e l’u-nico modo per costruire un altro sistema di polinomi ortonormale e massimalein L2(a, b; ρ): Notiamo prima di tutto che se qn(x) deve essere completo, perogni n ≥ 0, intero, uno almeno dei polinomi deve avere grado n.

Teorema 233 Sia qn(x) un secondo sistema di polinomi ortonormali e mas-simale in L2(a, b; ρ). Sia qk(x) uno di tali polinomi, e questo abbia grado k.Esiste una costante αk di modulo 1 tale che

qk(x) = αkpk(x) .

Dim. Rappresentiamo

qk(x) =k∑i=0

αipi(x) , αi =∫ b

aρ(x)q(x)pi(x) dx . (3.27)

Si sa che per ogni m < i si ha∫ b

axmρ(x)pi(x) dx = 0 .

Page 191: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 185

Si fissi ora un indice i0. Se m < i0 allora qm ⊥ qi0 . Se k < i0 allora

xk ∈ span q0, . . . , qk

e quindi xk ⊥ qi0 . Dunque anche pk ⊥ qi0 . Da (3.27),

αi0 =∫ b

aρ(x)qk(x)pi0(x) dx = 0

per ogni i0 < k; e quindi,qk(x) = αkpk(x) .

Il modulo di αk e 1 perche sia pk(x) che qk(x) hanno norma 1.

Questo teorema prova che, assegnato ρ(x), esiste sostanzialmente un so-lo sistema ortonormale massimale in L2(a, b; ρ). Di conseguenza, i polinomipk(x) sono proporzionali a quelli che si ottengono ortogonalizzando, col me-todo di Gram-Schmidt, i polinomi xk. Il metodo di Gram-Schmidt applicatoalla succesisone xk da polinomi a coefficienti reali e quindi non e restrittivoassumere che i polinomi pk(x) stessi abbiano coefficienti reali.

Il calcolo dei polinomi ortogonali

Il calcolo dei polinomi ortogonali a partire dall’equazione differenziale e diffi-cile. Fortunatamente, esiste una formula compatta per rappresentarli, a menodi una costante moltiplicativa:

Teorema 234 Per ogni n, esiste una costante Bn tale che

pn(x) = Bn1

ρ(x)

dn

dxn[ρ(x)σn(x)] . (3.28)

Dim. Consideriamo una generica soluzione y(x), non necessariamente polino-miale, dell’equazione (3.25), che riscriviamo:

σ(x)y′′ + τ(x)y′ = λy (3.29)

Consideriamo la funzione v(1)(x) = y′(x). Questa verifica

σ(x)v′′(1) + τ(1)(x)v′(1) = λ(1)v1

conτ(1)(x) = τ(x) + σ′(x) , λ(1)(x) = λ− τ ′(x)

(si noti che τ(x) ha grado 1 e quindi λ(1) e costante. Non si confonda λ(1) conλ1 ne i numeri λ(k) che ora introdurremo con λk).

Page 192: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

186 CAPITOLO 3. SPAZI DI HILBERT

In modo analogo, se v(k)(x) = y(k)(x), si vede che v(k)(x) risolve

σ(x)v′′(k) + τ(k)(x)v(k) = λ(k)v(k) , (3.30)

τ(k)(x) = τ(x) + kσ′(x) , λ(k) = λ− kτ ′(x)− k(k − 1)

2σ′′(x)

(si noti che λ(k) e costante perche sono costanti sia τ ′(x) che σ′′(x)).Si sa che, introducendo ρ(x) > 0 soluzione di

(σ(x)ρ)′ = τ(x)ρ , (3.31)

la (3.29) si scrive nella forma

(ρ(x)σ(x)y′)′ = λρ(x)y .

Analogamente, sia ρ(k)(x) soluzione di

(σ(x)ρ(k))′ = τ(k)(x)ρ(k) . (3.32)

La v(k)(x) risolve(σ(x)ρ(k)(x)v

′(k))

′ = λ(k)ρ(k)v(k) . (3.33)

Mostriamo una relazione tra ρ(x) e ρ(k)(x). Scrivendo esplicitamente lederivate del prodotto e dividendo rispettivamente per σ(x)ρ(x) e σ(x)ρ(k)(x) idue membri di (3.31) e di (3.32) si vede che

ρ′(x)

ρ(x)= −σ

′(x)

σ(x)+τ(x)

σ(x)

ρ′(k)(x)

ρ(k)(x)= −σ

′(x)

σ(x)+τ(k)(x)

σ(x)= −σ

′(x)

σ(x)+τ(x)

σ(x)+ k

σ′(x)

σ(x)

e quindiρ′(k)(x)

ρ(k)(x)=ρ′(x)

ρ(x)+ k

σ′(x)

σ(x).

Ricordiamo che le funzioni ρ(x) e ρ(k)(x), ambedue positive, sono definitea meno di una costante e quindi, prendendo le primitive dei due membri eponendo uguale a 0 la costante additiva, si trova

ρ(k)(x) = ρ(x)σk(x)

e quindi ancheρ(k)(x) = σ(x)ρ(k−1)(x) .

Page 193: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 187

Combinando la (3.33) con queste relazioni, e posto v(0)(x) = y(x), ρ(0)(x) =ρ(x) e λ(0) = λ, si vede che per ogni k ≥ 0 vale

λ(k)ρ(k)(x)v(k)(x) =d

dx

[σ(x)ρ(k)(x)v

′(k)(x)

]=

d

dx

[ρ(k+1)(x)v

′(k)(x)

].

Ricordando che, per definizione, v′(k)(x) = v(k+1)(x) si trova

λ(k)ρ(k)(x)v(k)(x) =d

dx

[ρ(k+1)(x)v(k+1)(x)

].

Partendo ora da k = 0 e iterando si vede che

ρ(x)y(x) = ρ(0)(x)v(0)(x) =1

λ[ρ(1)(x)v(1)(x)]

′ =1

λ

[1

λ(1)ρ(2)(x)v

′(2)(x)

]′

e, iterando ulteriormente,

ρ(x)y(x) =1

λ(0) · λ(1) · λ(2) · · ·λ(k−1)

dk

dxk

[ρ(k)(x)v(k)(x)

]=

1

λ(0) · λ(1) · λ(2) · · ·λ(k−1)

dk

dxk

[ρ(x)σk(x)v(k)(x)

].

Ripetiamo che questa relazione vale per ciascuna soluzione y(x) della (3.25).Se pero in particolare y(x) e un polinomio di grado n, la sua n–ma derivata,ossia v(n)(x), e costante. Quindi, scrivendo la relazione precedente con k = n,si trova la (3.28).

La formula (3.28) si chiama formula di Rodriguez.Usa scegliere reale la costante moltiplicativa cosı che, come si e gia notato,

i polinomi ortogonali classici sono polinomi a coefficienti reali.Inoltre,

Teorema 235 I polinomi di Legendre ed Hermite di grado pari sono funzionipari; quelli di grado dispari sono funzioni dispari.

Dim. Nel caso dei polinomi di Legendre e di Hermite l’intervallo (a, b) =(−a, a), a = 1 oppure a = +∞, e un intervallo simmetrico rispetto a 0 e ilpeso e una funzione pari. Quindi, se m < n,

0 =∫ a

−apn(x)ρ(x)x

m dx = (−1)m∫ a

−apn(−x)ρ(x)xm dx

e quindi pn(−x) e ortogonale a tutti i polinomi di grado inferiore.

Page 194: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

188 CAPITOLO 3. SPAZI DI HILBERT

Il Teorema 233 mostra che pn(−x) e multiplo di pn(x):

pn(−x) = Cnpn(x) .

Identificando i coefficienti dei termini di grado piu alto, si vede che Cn = (−1)n.Usiamo ora il principio di identita dei polinomi ed uguagliamo i coefficienti

dei termini dello stesso grado a destra ed a sinistra. Si vede che per averel’uguaglianza con n pari devono essere nulli i coefficienti degli addendi di gradodispari; se n e dispari devono essere nulli i coefficienti degli addendi di gradopari.

La formula di Rodriguez da un modo per il calcolo dei polinomi ortogonali,a meno di una costante di normalizzazione, che fa intervenire il calcolo diderivate. Se invece di richiedere ai polinomi di avere norma 1 richiediamo chesiano “monici”, ossia che il coefficiente del termine del grado maggiore sia 1,allora la costante nella formula di Rodriguez e uguale ad 1.

Il modo piu efficiente per calcolare la successione dei polinomi ortogonali“monici” e di usare la formula di Rodriguez per calcolarne i primi, e per isuccessivi usare invece la relazione di ricorrenza che ora vediamo.

Il polinomio xpn(x) ha grado n + 1, e quindi e combinazione lineare deipolinomi di grado minore od uguale a n+ 1:

xpn(x) =n+1∑r=0

cr,npr(x) . (3.34)

Ricordiamo che un qualsiasi pj(x) e ortogonale a tutti i polinomi che hannogrado strettamente minore. Quindi,

cr,n = ⟨xpn(x), pr(x)⟩ = ⟨pn(x), xpr(x)⟩ = 0 se r < n− 1.

Quindi l’uguaglianza (3.34) si riduce a

cn+1,npn+1(x) = xpn(x)− cn,npn(x)− cn−1,npn−1(x) , (3.35)

dove si intende p−1(x) = 0 e anche c−1,1 = 0. D’altra parte, abbiamo dettodi lavorare con polinomi monici. Confrontando i termini di grado piu alto neidue membri, si vede che

cn+1,n = 1

e quindi rimane

pn+1(x) = xpn(x)− cn,npn(x)− cn−1,npn−1(x) . (3.36)

Page 195: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 189

Mostriamo ora che i coefficienti cn,n e cn−1,n si possono calcolare se sononoti i polinomi di grado al piu n. Basta per questo prendere il prodotto scalaredei due membri prima con pn(x) e poi con pn−1(x) per trovare

cn,n =⟨xpn(x), pn(x)⟩

||pn||2, cn−1,n =

⟨xpn(x), pn−1(x)⟩||pn−1||2

.

Quindi, noti p0(x) e p1(x), polinomi “monici”, si hanno tutte le informazio-ni necessarie per calcolare il polinomio monico p2(x); calcolato p2(x) si hannotutte le informazioni per il calcolo di p3(x) ecc.

Noti i polinomi in forma “monica” e quindi anche le loro norme, si puocalcolare la successione dei polinomi ortonormali.

Nella formula (3.36) compaiono due successioni, an = cn,n e bn = cn−1,n.Ricordando che si e posto p−1(x) = 0 e b1 = c−1,1 = 0, Il modo piu sempliceper ricordarla e di osservare che:

Teorema 236 Sia pn una successione di polinomi monici due a due orto-gonali. Esistono due successioni an e bn di numeri reali, con b1 = 0, taliche

xpn(x) = pn+1(x) + anpn(x) + bnpn−1(x) .

In questa formula si intende p−1(x) = 0.Le due successioni possono calcolarsi in modo ricorsivo.

La formula ricorsiva assume un aspetto particolarmente semplice nel caso deipolinomi di Legendre quando essi si scelgano in modo da avere Pn(1) = 1 (equindi non necessariamente normalizzati e nemmeno monici). Usiamo la (3.35)che vale anche se i polinomi non sono monici e ricordiamo che i polinomi diLegendre di grado pari sono funzioni pari e quelli di grado dispari sono funzionidispari. E quindi

cn,n = 0

ossia la (3.35) si scrive ora:

cn+1,nPn+1(x) = xPn(x)− cn−1,nPn−1(x) . (3.37)

Ricordiamo inoltre che Pn(x) verifica

(1− x2)P ′′n (x)− 2xP ′

n(x) = −n(n+ 1)Pn(x)

e quindi, posto x = 1,

2P ′n(1) = n(n+ 1)Pn(1) .

Page 196: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

190 CAPITOLO 3. SPAZI DI HILBERT

Invece di scegliere polinomi normalizzati oppure monici, decidiamo ora diimporre la condizione Pn(1) = 1 per ogni n.

Poniamo ora x = 1 in (3.37) e nella sua derivata. Usando l’identitaprecedente si trova

cn+1,n+ cn−1,n = 1 , cn+1,n(n+ 1)(n+ 2)

2+ cn−1,n

n(n− 1)

2= 1+

n(n+ 1)

2

e quindi

cn+1,n = 1− n

2n+ 1=

n+ 1

2n+ 1, cn−1,n =

n

2n+ 1.

Si trova cosı la formula ricorsiva seguente, valida per i soli polinomi cherisolvono l’equazione di Legendre e che verificano Pn(1) = 1:

Pn+1(x) =2n+ 1

n+ 1xPn(x)−

n

n+ 1Pn−1(x) .

Gli zeri dei polinomi ortogonali classici

Gli zeri dei polinomi ortogonali classici hanno varie proprieta interessanti. Inparticolare:

Teorema 237 Gli zeri dei polinomi ortogonali classici sono tutti reali, sem-plici ed appartengono all’intervallo (a, b).

Dim. Gli zeri sono semplici perche una soluzione di un’equazione differenzialedel secondo ordine che ha uno zero multiplo e identicamente nulla.

Si consideri il polinomio pn(x) e siano xi, 0 ≤ i ≤ k i suoi zeri in (a, b).Sia, per assurdo, k < n.

Essendo gli zeri tutti semplici, il polinomio cambia segno quando si annulla.Sia quindi

q(x) = Πki=0(x− xi) .

Il polinomiop(x)q(x)

ha segno costante.D’altra parte, se k < n, pn(x) e ortogonale a q(x) e quindi

0 =∫ b

apn(x)q(x)ρ(x) dx ,

in contrasto con la positivita dell’integrando.

Consideriamo ora le relazioni tra gli zeri di pn(x) e quelle di pk(x), conk > n.

Page 197: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 191

Teorema 238 Siano α e β due zeri consecutivi di pn(x). Il polinomio pk(x)si annulla nell’intervallo aperto (α, β).

Dim. Per ipotesi, il polinomio pn(x) non si annulla, e quindi ha segno costante,in (α, β). Eventualmente cambiandone il segno, si puo supporre che esso siapositivo.

Essendo soluzione di un’equazione differenziale del secondo ordine, i suoizeri sono semplici e quindi pn(x) cambia segno in α ed in β. Di conseguenza,

p′n(α) > 0 , p′n(β) < 0 .

Sia k > n cosı cheλk < λn

(si ricordi la negativita degli autovalori). Supponiamo per assurdo che pk(x)non si annulli in (α, β). Se necessario si puo cambiare il segno di pk(x) esupporre pk(x) > 0 in (α, β).

Ricordiamo le uguaglianze

(σ(x)ρ(x)p′n)′ = λnρ(x)pn , (σ(x)ρ(x)p′k)

′ = λkρ(x)pk

e introduciamo la funzione

W (x) = pn(x)[σ(x)ρ(x)p′k(x)]− [σ(x)ρ(x)p′n(x)]pk(x) .

Calcolandone la derivata si trova

W ′(x) = [λk − λn]pk(x)pn(x)ρ(x) < 0 .

Dunque,

W (β)−W (α) < 0 . (3.38)

D’altra parte, direttamente dalla definizione di W (x),

W (β)−W (α) = − [σ(β)ρ(β)p′n(β)] pk(β) + [σ(α)ρ(α)p′n(α)] pk(α) . (3.39)

Per quanto si e detto sopra sui segni dei polinomi e delle derivate di pn(x), siha la somma di due addendi non negativi. La contraddizione trovata mostrache pk(x) deve avere almeno uno zero nell’intervallo (α, β).

In realta si puo anche essere un po’ piu precisi:

Corollario 239 Siano α e β zeri consecutivi di pk(x) e sia k > n. Il polinomiopk(x) e diverso da zero sia in α che in β.

Dim. Infatti, se pk(α) = 0 e/o pk(β) = 0, la (3.38) contrasta con la (3.39).

La tabella 3.2 completa la tabella 3.1, introducendo due righe che riportanole equazioni differenziali e le formule di Rodriguez relativa alle tre classi dipolinomi ortogonali.

Page 198: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

192 CAPITOLO 3. SPAZI DI HILBERT

Tabella 3.2: Polinomi ortogonali classici ed equazioni differenziali

Legendre: Pn(x) Laguerre: Ln(x) Hermite: Hn(x)σ(x) (1− x2) x 1τ(x) −2x −x+ 1 −2x

ρ(x) 1 e−x e−x2

λn −n(n+ 1) −n −2n

Eq. Diff.(1 − x2)y′′ − 2xy′ =−n(n+ 1)y

xy′′+(1−x)y′ = −ny y′′ − 2xy′ = −2ny

Rodriguez dn

dxn (x2 − 1)n ex dn

dxn [e−xxn] ex2 dn

dxn [e−2x]

H L2(−1, 1) L2(0,+∞; ρ) L2(−∞,+∞; ρ)

3.4.4 Sviluppi in serie di Fourier-Bessel

Senza ancora specificare lo spazio in cui si opera, chiamiamo operatore diBessel di indice n l’operatore

y(·) −→ (Bny)(x) =1

x

d

dx[xy′(x)]− n2

x2y(x) .

In certe applicazioni l’indice n e un qualsiasi numero complesso. Noi pero cilimiteremo a considerare il caso degli indici interi; e dato che n figura elevatoal quadrato, considereremo il caso degli indici n che sono numeri interi nonnegativi.

Siano y(x) ed z(x) due autofunzioni corrispondenti ad autovalori −λ e −µtra loro diversi (il segno meno e introdotto solamente per conservare la nota-zione piu comune in letteratura). Procediamo in modo formale a verificarneuna proprieta di ortogonalita. Diciamo che stiamo operando “in modo forma-le” perche ancora non abbiamo specificato lo spazio in cui si intende lavoraree nemmeno il dominio dell’operatore Bn. D’altra parte, le equazioni per gliautovalori sono

d

dx[xy′(x)]− n2

xy(x) = −λxy(x)

d

dx[xz′(x)]− n2

xz(x) = −µxz(x) .

Page 199: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 193

Queste equazioni del secondo ordine hanno certamente soluzioni in ogni in-tervallo che non contiene 0. Dato che i coefficienti non sono regolari in zero,niente possiamo dire del comportamento delle soluzioni per x tendente a zero.Cio nonostante, moltiplichiamo la prima per z(x) e moltiplichiamo per y(x) laconiugata della seconda. Integriamo si [0, 1] e sottraiamo gli integrali. Notia-mo che anche questo e un passaggio formale, che poi andra giustificato, perchenon sappiamo se gli integrali sono finiti.

Integrando per parti si trova l’uguaglianza

(λ− µ)∫ 1

0xy(x)z(x) dx = [xy(x)z′(x)− y′(x)xz(x)]

10 .

Un procedimento analogo e nella dimostrazione del Teorema 232. Pero e op-portuno vedere esplicitamente il calcolo per sottolineare il ruolo di n. Consi-deriamo il primo integrale (il calcolo del secondo e analogo).

0 =∫ 1

0

z(x)

d

dx[xy′(x)]− n2

xz(x)y(x) + λxz(x)y(x)

dx

= [xz(x)y′(x)]10 −

∫ 1

0xz′(x)y′(x) dx− n2

∫ 1

0

1

xz(x)y(x) dx

+λ∫ 1

0xz(x)y(x) dx .

Si vede da qui una differenza tra il caso n = 0 ed il caso n > 0: se n > 0, perdare senso a quest’uguaglianza, bisogna esplicitamente richiedere l’integrabilitadi z(x)y(x)/x.

Le funzioni y(x) e z(x) sono regolari per x = 1 ma potrebbero non esserloper x = 0. L’uguaglianza precedente pero mostra che, se i passaggi formalipossono giustificarsi; se [xz(x)y′(x)]10 = 0 e se µ = λ, allora y(x) e z(x) sonoortogonali in L2(0, 1; ρ), con ρ(x) = x.

I passaggi precedenti sono giustificati se si richiede che le “autofunzioni”y(x) e z(x) appartengano al s.spazio delle funzioni ϕ(x) ∈ L2(0, 1; ρ), ρ(x) = x,che verificano alle proprieta seguenti:

ϕ(x) ∈ W 2,2(ϵ, 1) per ogni ϵ > 0 , ϕ(1) = 0 ,lim supx→0+ |ϕ(x)| < +∞ , lim supx→0+ |ϕ′(x)| < +∞ ,Bnϕ ∈ L2(0, 1; ρ) ,1√xϕ(x) ∈ L2(0, 1) , proprieta da richiedere solo se n > 0.

(3.40)

Queste considerazioni suggeriscono di studiare gli operatori Bn nello spazioX = L2(0, 1; ρ), ρ(x) = x, attribuendo loro come dominio le funzioni cheverificano le proprieta in (3.40).

Page 200: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

194 CAPITOLO 3. SPAZI DI HILBERT

Si ricordi che se una funzione di una variabile ha derivata (in senso debole)che e integrabile, essa e continua e quindi ha senso richiedere che il suo valorein 1 sia nullo. Niente possiamo dire per ora del valore in 0 perche la condizioneϕ′′(x) ∈ L2(ϵ, 1) per ogni ϵ > 0 non implica l’integrabilita di ϕ′′(x) in un intornodi 0.

Si osservi che l’equazione per l’autovalore λ puo anche scriversi come

x2y′′ + xy′ − (n2 − λx2)y = 0 . (3.41)

Andiamo ora a provare l’esistenza degli autovalori e delle autofunzioni, eda giustificare i passaggi formali visti sopra. Conviene per questo introdurrel’equazione seguente, che si chiama equazione di Bessel di ordine n:

1

x

d

dx[xy′(x)]−

(n2

x2− 1

)y(x) = 0 ossia x2y′′ + xy′ − (n2 − x2)y = 0 .

(3.42)Questa e l’equazione degli autovalori scritta con λ = 1, ma non stiamo af-

fermando che λ = 1 debba essere un autovalore. E’ pero vero che la conoscenzadelle soluzioni dell’equazione di Bessel e dei loro zeri conduce ad identificaretutti gli autovalori e le corrispondenti autofunzioni di Bn. Mostriamo cio nelcaso n > 0 lasciando al lettore le considerazioni analoghe nel caso n = 0.

Supponiamo di poter trovare una soluzione y(x) di (3.42), che verificalimx→0+ x|y(x)| = 0 , limx→0+ |y′(x)| < +∞ ,1√xy(x) ∈ L2(0, 1) .

Supponiamo inoltre che questa soluzione si annulli in un punto c > 0. Intal caso, e immediato trovare una autofunzione di Bn: posto ϕ(x) = y(cx), echiaro che ϕ(x) appartiena a domBn. Inoltre, scrivendo l’uguaglianza (3.42)nel punto cx si trova

c2x2y′′(cx) + cxy′(cx)− (n2 − c2x2)y(cx) = 0 .

Essendo

ϕ′(x) = cy′(cx) , ϕ′′(x) = c2y′′(cx) ,

si vede che ϕ(x) risolve l’equazione (3.41) degli autovalori, con λ = c2.Vale anche il viceversa: sia ϕ(x) un’autofunzione che corrisponde ad un au-

tovalore c > 0. Si noti che la ϕ(x) e certamente prolungabile a (0,+∞) perchex = 0 e l’unico punto nell’intorno del quale l’equazione non si puo scrivere in

Page 201: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 195

forma normale. Posto y0(x) = ϕ(x/c) si trova una soluzione di (3.42), con leproprieta dette sopra; e quindi possiamo concludere che lo studio delle solu-zioni dell’equazione di Bessel (3.42), e dei loro zeri, conduce ad identificaretutte le autofunzioni di Bn.

Va osservata pero una difficolta che e questa: due autofunzioni ϕ(x) e ψ(x)del medesimo autovalore c potrebbero condurre a soluzioni y0(x;ϕ) e y0(x;ψ)di (3.42) del tutto indipendenti l’una dall’altra. Vedremo invece che non e cosıe che infatti y0(x;ϕ) e y0(x;ψ) sono tra loro proporzionali. Cio e conseguenzadel teorema seguente.

Teorema 240 Le soluzioni dell’equazione di Bessel di ordine n che sono li-mitate per x→ 0+ sono tutte e sole i multipli della funzione

Jn(x) =+∞∑k=0

(−1)k1

k!(n+ k)!

(x

2

)2k+n

.

Le funzioni Jn(x) sono di classe C∞(IR) e inoltre:Jn(0) = 1 se n = 0Jn(0) = 0 , J ′

n(0) = 0 se n > 0 .

La dimostrazione si trova nel paragrafo 3.4.6.E’ immediata conseguenza di questo:

Corollario 241 Se ϕ(x) e ψ(x) sono autofunzioni di Bn col medesimo auto-valore, allora y0(x;ϕ) ed y0(x;ψ) sono tra loro proporzionali.

E’ cosı visto che lo studio degli autovalori ed autofunzioni dell’operatoreBn si riduce allo studio degli zeri della funzione Jn(x).

La funzione Jn(x) si chiama funzione di Bessel di ordine n (e di “primaspecie”. Le funzioni di Bessel “di seconda specie”, che non tratteremo, sonoparticolari soluzioni illimitate dell’equazione di Bessel. Va notato pero cheesse verificano lim supx→0

√x|y(x)| = +∞ e quindi non possono usarsi per

giustificare i calcoli che conducono all’ortogonalita).Per quello che sappiamo fino ad ora, l’operatore Bn potrebbe non avere

autovalori, od averne un numero finito. Mostriamo invece l’esistenza di unasuccessione di autovalori mostrando l’esistenza di una successione di zeri diciascuna delle funzioni di Bessel. Premettiamo un’osservazione. Sia y(x) unaqualsiasi soluzione dell’equazione di Bessel di ordine n e sia

u(x) =√xy(x) ossia y(x) =

1√xu(x) .

Page 202: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

196 CAPITOLO 3. SPAZI DI HILBERT

E’ chiaro che y(x) ed u(x) hanno i medesimi zeri positivi. E’:

y′(x) = −1

2x−3/2u(x) + x−1/2u′(x)

y′′(x) =3

4x−5/2u(x)− x−3/2u′(x) + x−1/2u′′(x) .

Sostituendo nell’equazione di Bessel si vede che u(x) soddisfa l’equazione

u′′ + q(x)u = 0 , q(x) =

[1 +

1− 4n2

4x2

]. (3.43)

Mostriamo:

Teorema 242 Ogni soluzione u(x) di (3.43), e quindi ogni soluzione y(x)di (3.42), ha una successione (ck) di zeri, ck → +∞.

Dim. Essendo u(x) soluzione di un’equazione differenziale del secondo ordinedi cui x = 0 e l’unico punto “singolare”, gli zeri di u(x) o sono in numerofinito, o sono un insieme infinito. Se l’insieme degli zeri e infinito, esso puoessere superiormente illimitato e eventualmente avere 0 come unico punto diaccumulazione. L’asserto del teorema richiede solamente di mostrare l’esisten-za di una successione divergente di zeri (mostreremo alla fine di questa partela ragione per cui anche le soluzioni dell’equazione di Bessel che sono illimitateper x→ 0 non hanno zeri che si accumulano a zero). La proprieta cruciale cheusiamo per questo e

q(x) >1

2per x sufficientemente grande.

Sia x0 tale che q(x) > 1/2 per x ≥ x0.Notiamo che una soluzione non nulla di (3.43) cambia segno in ciascuno dei

suoi zeri c > 0. Infatti, se si annullasse senza cambiare segno dovrebbe essereu(c) = 0 e anche u′(c) = 0; dunque, per il Teorema di Cauchy sulle equazionidifferenziali ordinarie, si avrebbe u(x) = 0 per ogni x.

Supponiamo per assurdo che sia u(x) una soluzione non nulla che noncambia segno per x sufficientemente grande, diciamo per x ≥ x0. Per fissarele idee sia u(x) ≥ 0 per x > x0. Allora, per x ≥ x0, si ha u

′′(x) ≤ 0 e quindiu′(x) decresce. Vogliamo provare che da qui segue la contraddizione seguente:la funzione u(x) prende valori negativi. Per questo, introduciamo la funzione

v(x) =u′(x)

u(x).

Page 203: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 197

Questa funzione e ben definita per x ≥ x0 perche abbiamo supposto che u(x)non si annulli. Si vede immediatamente che verifica

v′(x) = −q(x)− v2(x) ≤ −q(x) .

Dunque,

v(x) ≤ v(x0)−∫ x

x0q(s) ds ≤ v(x0)−

1

2(x− x0) → −∞ per x→ +∞ .

Dunque, v(x) e negativa per x abbastanza grande, diciamo per x ≥ x1, perchesi e supposta la positivita di u(x). E quindi u′(x) < 0 per x > x1; e ricordiamoche u′(x) decresce.

Dunque si trova la contraddizione

u(x) = u(2x1)+∫ x

2x1u′(s) ds ≤ u(2x1)+(x−2x1)u

′(2x1) → −∞ per x→ +∞ .

Cio prova che la u(x) deve annullarsi in un punto x0 > x0 e quindi prenderevalori negativi a destra di x0.

Un argomento analogo al precedente mostra pero che non puo rimanerepermanentemente negativa; ossia che x0 non e l’ultimo degli zeri di u(x).

Si osservi che il teorema precedente si applica a ciascuna soluzione dell’e-quazione di Bessel; anche alle soluzioni che non sono regolari per x→ 0+. Lefunzioni Jn(x) essendo analitiche in x = 0 non hanno una successione di zeriche tende a zero. Cio vale anche per le soluzioni che non sono regolari in 0,anche se la dimostrazione precedente non permette di dedurlo.

Quindi

Corollario 243 Esiste una successione (λk, ϕk) di autovalori e autofunzionidell’operatore Bn, con λk reale e ϕk(x) a valori reali. Inoltre, ϕk e ortogonalea ϕr nello spazio L2(0, 1; ρ), ρ(x) = x, se k = r.

Le funzioni ϕk(x) sono date da

ϕk(x) = Jn(ckx) essendo (ck) la successione degli zeri di Jn(x).

Si noti che le funzioni ϕk(x) cosı costruite non hanno norma unitaria in X =L2(0, 1; ρ), ρ(x) = x; essendo pero ortogonali due a due, ogni f ∈ X apparte-nente allo spazio lineare che esse generano potra scriversi nella forma

f(x) =+∞∑k=0

fkϕk(x) =+∞∑k=0

fkJn(ckx) , fk =1

||ϕk||2⟨f, ϕk⟩ (3.44)

(norma e prodotto interno essendo quelli di X).Serie di questo tipo si chiamano serie di Fourier-Bessel.E’ importante conoscere il seguente risultato, che non proviamo:

Page 204: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

198 CAPITOLO 3. SPAZI DI HILBERT

Teorema 244 Le autofunzioni di Bn sono un sistema completo in L2(0, 1; ρ),con ρ(x) = x; e quindi ogni funzione f(x) in tale spazio ammette uno sviluppoin serie di Fourier-Bessel.

Da questo risultato segue l’importanza di conoscere le funzioni di Besseled i loro zeri, che sono tabulati con grande precisione.

Osservazione 245 Gli sviluppi di Fourier-Bessel a prima vista sembrano ave-re un’aspetto inusuale. Notiamo che anche gli sviluppi di Fourier di soli seni,o di soli coseni, hanno questo stesso aspetto. Sia infatti f(x) una funzionea quadrato integrabile su (0, 1). Come e noto, estendendola in modo dispariall’intervallo (−1, 1), si prova che essa e somma della serie di Fourier di soliseni

f(x) =+∞∑k=1

fk sin kπx =+∞∑k=0

fkF (ckx)

ove F (x) = sin x risolve

F ′′ + F = 0 , F (0) = 0

e i numeri ck = kπ sono gli zeri non negativi di F (x). Il primo di essi e nulloe cio mostra che il primo termine della serie e nullo.

3.4.5 Ulteriori proprieta delle funzioni di Bessel

Le funzioni di Bessel, e gli sviluppi di Fourier-Bessel, si incontrano nello studiodei fenomeni oscillatori, come le funzioni eikx e gli sviluppi di Fourier; male funzioni e gli sviluppi di Fourier si incontrano per esempio nello studiodelle vibrazioni di un filo mentre gli sviluppi di Fourier-Bessel si incontranonello studio delle vibrazioni di una membrana. Visto che la membrana diun altoparlante riproduce con buona fedelta il suono di un violino, possiamochiederci quali similitudini ci siano tra le funzioni trigonometriche e le funzionidi Bessel. Una similitudine si e gia vista: le funzioni di Bessel hanno infiniti zerie inoltre sviluppo in serie di Fourier e di Fourier-Bessel hanno una strutturasimile, si veda l’osservazione 245. Valgono inoltre le uguaglianze seguenti, chesi ricavano immediatamente dalle serie che rappresentano le funzioni Jn(x):

d

dx

[x−nJn(x)

]= −x−nJn+1(x)

d

dx

[xn+1Jn+1(x)

]= xn+1Jn(x) .

Page 205: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 199

In particolare, se n = 0, si trova

d

dxJ0(x) = −J1(x) ,

d

dxxJ1(x) = xJ0(x) ,

relazioni che “sostituiscono” quelle tra le derivate di sinx e cos x. Una diffe-renza importante e pero questa:

Teorema 246 Per ogni n esiste una costante Mn tale che

|Jn(x)| < Mn1√x.

Dim. ricordando l’equazione (3.43), basta provare che la funzione u(x) rimanelimitata.

Come si e detto, per x > x0 e q(x) > 1/2. Moltiplichiamo per u′(x) i duemembri di (3.43). Si trova

1

2

d

dx[u′(x)]2 = −q(x)1

2

d

dxu2(x) ≤ −1

4

d

dxu2(x) . (3.45)

Integrando i due membri si trova

[u′(x)]2 +1

2u2(x) = [u′(x0)]

2 +1

2u2(x0) .

In particolare,

[u′(x)]2 ≤ [u′(x0)]2 +

1

2u2(x0) , u2(x) ≤ 2[u′(x0)]

2 + u2(x0)

come volevamo.

Osservazione 247 Si noti che la dimostrazione precedente non usa la li-mitatezza per x → 0 della soluzione e quindi vale per per ogni soluzionedell’equazione di Bessel; anche per quelle illimitate per x→ 0+.

Infine, enunciamo senza dimostrazione il seguente risultato, che lega in modopiu preciso le funzioni di Bessel con quelle trigonometriche: per ogni n esisteuna funzione limitata rn(x) tale che

Jn(x) =

√2

πxcos

(x− π

4− nπ

2

)+rn(x)

x3/2.

Page 206: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

200 CAPITOLO 3. SPAZI DI HILBERT

3.4.6 Le soluzioni dell’equazione di Bessel

E’ immediato verificare che la serie di potenze proposta per Jn(x) ha raggio diconvergenza +∞ e quindi puo essere derivata termine a termine. Sostituendolanell’equazione di Bessel, si vede facilmente che Jn(x) la risolve. E’ pero piuinteressante cercare di ricavarla. Semplifica lievemente i calcoli lavorare conl’equazione (3.43). Ricerchiamo quindi una soluzione non identicamente nulladi tale equazione della forma

u(x) =+∞∑r=0

urxr+m

con m ed i coefficienti ur da determinare. Imporremo la condizione m ≥ 0perche ricerchiamo soluzioni dell’equazione di Bessel che rimangono limitateper x→ 0.

E’:

4x2u(x) =∑+∞r=2 4ur−2x

r+m

4x2u′′(x) = 4m(m− 1)u0xm + 4m(m+ 1)u1x

m+1

+∑+∞r=2 4(r +m)(r +m− 1)urx

r+m

(1− 4n2)u(x) = (1− 4n2)u0xm + (1− 4n2)u1x

m+1

+∑+∞r=2(1− 4n2)urx

r+m .

Sostituendo nell’equazione, si trova una serie che si vuole essere nulla; ossia sivuole che i suoi coefficienti siano tutti nulli. Devono quindi valere le condizioni[

4m(m− 1) + 1− 4n2]u0 = 0[

4m(m+ 1) + 1− 4n2]u1 = 0

ur = − 4ur−2

4(r +m)(r +m− 1) + 1− 4n2.

Dunque, il valore di u0 determina gli u2k mentre il valore di u1 determina icoefficienti u2k+1. Se u0 = u1 = 0 si trova la soluzione identicamente nulla,caso che non ci interessa. Quindi esaminiamo separatamente il caso u0 = 0 edu1 = 0 dal caso u0 = 0 ed u1 = 0.

Se u1 = 0 e u0 = 1 allora m deve verificare

4m2 − 4m+ (1− 4n2) = 0 e quindi m = n+1

2

(la soluzione m = −n+ 1/2 si esclude perche si e chiesto m ≥ 0. Una ragionepiu cogente per escluderla si dira in seguito).

Page 207: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.4. ESEMPI DI SISTEMI ORTOGONALI MASSIMALI 201

In questo modo gli addendi della serie con r = 2k vengono ad essere

u2kx2k+n+1/2 ,

u2k = −4u2(k−1)

4(2k + n+ 1/2)(2k + n− 1/2) + 1− 4n2

= − u2k−2

4k(k + n). (3.46)

Se invece si decide di lavorare con u0 = 0 ed u1 = 1 allora

m = n− 1

2.

Questo caso quindi non va considerato se n = 0 perche conduce ad m < 0. Sipuo considerare se n ≥ 1. In tal caso gli addendi della serie con r = 2k + 1vengono ad essere

u2k+1x2k+n+1/2 , u2k+1 = − u2k−1

4(2k + n+ 1/2)(2k + n− 1/2) + 1− 4n2.

Si vede quindi che i due casi apparentemente diversi conducono alla medesimasoluzione.

Consideriamo quindi il caso u1 = 0, u0 = 1 ossia il caso (3.46). Si vede che

u2k = (−1)k(n− 1)!

4kk!(n+ k)!.

Dunque,

u(x) = 2n[(n− 1)!]√x

[+∞∑k=0

(−1)k

k!(n+ k)!

(x

2

)2k+n].

Dividendo per 2n[(n− 1)!]√x si trova la funzione Jn(x).

L’equazione di Bessel, come l’equazione per u(x), e un’equazione differen-ziale del secondo ordine e quindi ammette una seconda soluzione, linearmenteindipendente dalla Jn(x). Ovviamente, questa si ottiene dividendo per

√x una

seconda soluzione della (3.45), linearmente indipendente dalla soluzione u(x)appena trovata. Sembrerebbe naturale ricercare questa soluzione scegliendoper m il valore negativo che abbiamo scartato, m = −n + 1/2 e quindi ripe-tendo i calcoli precedenti. E’ facile vedere che in questo modo non si trovauna soluzione dell’equazione perche la relazione di ricorrenza che permette dicostruire u2k noto u2k−2 ha denominatore che si annulla per certi valori di k.Invece, nota la soluzione u(x) di (3.45), ricerchiamo una seconda soluzione diforma

u(x)v(x) .

Page 208: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

202 CAPITOLO 3. SPAZI DI HILBERT

Sostituendo nell’equazione si vede che la funzione v(x) deve soddisfare

u(x)v′′(x) = −2u′(x)v′(x) .

Questa e un’equazione differenziale lineare del primo ordine per l’incognitaw(x) = v′(x), che da

w(x) = c1

u2(x).

Questa funzione non e limitata per x → 0+ quando n > 0. Integrandola peresempio su un intervallo a cavallo di 1 si trova una funzione v(x), definita perx > 0, anch’essa illimitata per x→ 0+ quando n > 0 perche l’integrale impro-prio di 1/u2(x) non converge su un intervallo che ha 0 come estremo sinistro.Infatti, la u(x) ha uno zero, per x = 0, di ordine n + 1/2. Moltiplicando l’in-tegrale per u(x) e quindi dividendo per

√x si ottiene una seconda soluzione

dell’equazione di Bessel di ordine n, linearmente indipendente dalla Jn(x) e sinoti che questa e illimitata per x→ 0+ anche quando n = 0, e priva di zeri inun intorno di 0.

3.5 Il duale di uno spazio di Hilbert

Il paragrafo 2.7 riporta un elenco di spazi di Banach e ne rappresentain modo “concreto” i duali. Puo essere opportuno, ma non e indi-spensabile, conoscere queste rappresentazioni per la lettura di questoparagrafo.

Abbiamo gia notato che, per ogni k fissato, il funzionale lineare

h→ ⟨h, k⟩

e continuo grazie alla disuguaglianza di Schwarz

|⟨h, k⟩| ≤M ||h|| con M = ||k|| .

Dunque la norma di questo funzionale non supera ||k|| e in realta e uguale a||k||, come si vede scegliendo

h =k

||k||.

Cosı come in dimensione finita, si mostra che questi funzionali esaurisconotutto il duale diH, ossia cheH e un modello per il suo duale. Piu precisamentevale:

Page 209: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.5. IL DUALE DI UNO SPAZIO DI HILBERT 203

Teorema 248 (di Riesz) Sia ϕ un funzionale lineare e continuo su H. Esi-ste un unico xϕ ∈ H tale che

ϕ(h) = ⟨h, xϕ⟩ ∀h ∈ H . (3.47)

La corrispondenza che a ϕ fa corrispondere xϕ e antilineare e inoltre

||ϕ||H∗ = ||xϕ||H .

Dim. Si e appena detto che la trasformazione h→ ⟨h, y⟩ e lineare e continuasu H, per ogni fissato y ∈ H. Ossia, almeno alcuni elementi del duale di Hpossono rappresentarsi come

ϕ(h) = ⟨h, y⟩ .

Mostriamo che questa rappresentazione, se esiste, e unica. Infatti sia

ϕ(h) = ⟨h, y⟩ = ⟨h, x⟩ ∀h ∈ H .

Sottraendo, si trova ⟨h, x − y⟩ = 0 per ogni h ∈ H e quindi x − y ⊥ H, ossiax− y = 0.

Proviamo ora che ogni elemento ϕ di H∗ si rappresenta come in (3.47).Se ϕ = 0 allora xϕ = 0. Se ϕ = 0,

kerϕ = H

e la continuita di ϕ mostra che kerϕ e un s.spazio chiuso di H, diverso da Hstesso. Dunque esiste z = 0, z ⊥ kerϕ. Non e restrittivo assumere

||z|| = 1 .

Si sa che kerϕ ha complementare di dimensione 1, si veda il teorema 81.Quindi

H = (kerϕ)⊕ span z .

Si rappresenti ogni h ∈ H nella forma

h =

(h− ϕ(h)

ϕ(z)z

)+ϕ(h)

ϕ(z)z .

Essendo (h− ϕ(h)

ϕ(z)z

)∈ kerϕ , z ∈ [kerϕ]⊥

Page 210: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

204 CAPITOLO 3. SPAZI DI HILBERT

si ha

⟨h, [ϕ(z)z]⟩ = ⟨ϕ(h)ϕ(z)

z, ϕ(z)z⟩ = ϕ(h) .

Dunque,

xϕ = ϕ(z)z .

Cio prova che ogni ϕ ∈ H∗ si rappresenta come in (3.47)E’ immediato verificare che la trasformazione ϕ → xϕ, definita su H∗, e

antilineare. Inoltre, si e notato che la norma della trasformazione h→ ⟨h, xϕ⟩e uguale a ||xϕ||.

Osservazione 249 E’ importante notare che nella dimostrazione preceden-te il funzionale continuo ϕ potrebbe anche avere soltanto dominio denso inX. Anche in tal caso l’elemento xϕ puo costruirsi, e il funzionale h →⟨h, xϕ⟩ e l’estensione per continuita di ϕ ad H. Useremo quest’osservazione alteorema 252.

Notiamo inoltre che con le notazioni del paragrafo 2.9, la (3.47) si scrive

ϕ(h) = ⟨⟨ϕ, h⟩⟩ = ⟨h, xϕ⟩ .

3.6 L’operatore aggiunto

Siano ora H e K due spazi di Hilbert e sia A un operatore lineare da H in Kanche NON continuo, ma con dominio denso in H. Associamogli un opera-tore lineare da K in H che chiameremo operatore aggiunto. L’operatoreaggiunto di A si indica col simbolo A∗.

Dobbiamo definire prima di tutto il dominio di A∗. Per definizione,

domA∗ = k ∈ K | ∃z ∈ H per cui ⟨Ah, k⟩K = ⟨h, z⟩H .

Vale:

Teorema 250 L’elemento z, se esiste, e unico.

Dim. Ne esistano due, z e ζ. Per ogni h ∈ domA vale

⟨Ah, k⟩K = ⟨h, z⟩H = ⟨h, ζ⟩H

e quindi

⟨h, z − ζ⟩H .

Page 211: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 205

Quest’uguaglianza vale per ogni h ∈ domA, che e denso in H. cio implica cheζ = z.

E’ quindi lecito definireA∗k = z .

E’ immediato verificare che l’operatore A∗, da K in H, e lineare.E’ facile vedere che domA∗ puo essere “molto piccolo”:

Esempio 251 Sia H = L2(0, 1) e sia

domA = x ∈ L2(0, 1) con rappresentante continuo .

Sia x il rappresentante continuo e

Ax = x(0) .

Ossia, A e un funzionale. Se k ∈ IC e nel dominio di A∗, esiste z ∈ L2(0, 1) percui

kh(0) =∫ 1

0z(s)h(s) ds ∀h ∈ L2(0, 1) .

Cio puo solo aversi se k = 0 (e allora anche z = 0); ossia, domA∗ = 0.

E’ chiaro che, se domA∗ e “troppo piccolo” allora A∗ conterra “pocheinformazioini” e sara di scarsa utilita. E’ quindi importante individuare classidi operatori il cui aggiunto ha dominio denso. A questo proposito vale:

Teorema 252 Se A e lineare e continuo da H in K, con dominio denso inH, allora il suo aggiunto ha dominio uguale a K.

Dim. Infatti, il funzionaleh→ ⟨Ah, k⟩

e continuo per ogni k e quindi, per il teorema di Riesz, si rappresenta nellaforma ⟨h, z⟩.

Prima di studiare casi piu generali, conviene studiare piu in dettagliol’aggiunto di un operatore continuo.

3.6.1 L’aggiunto di un operatore continuo

Vale:

Lemma 253 Sia A lineare e continuo da H in K, con dominio denso in H.Allora, A∗ ∈ L(K,H) e ||A∗||L(K,H) ≤ ||A||.

Page 212: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

206 CAPITOLO 3. SPAZI DI HILBERT

Dim. Si e gia notato che A∗ e definito su K. Dalla disuguaglianza di Schwarz,

||A∗k|| = sup||h||=1

⟨h,A∗k⟩ = sup||h||=1

⟨Ah, k⟩ ≤ sup||h||=1

||Ah|| · ||k|| = ||A|| · ||k|| .

Dunque, A∗ e un operatore limitato e

||A∗|| ≤ ||A|| .

Possiamo quindi calcolare A∗∗ = (A∗)∗. Dal lemma precedente, ||A∗∗|| ≤||A∗||. Proviamo ora:

Teorema 254 Sia A lineare e continuo da H in K, con dominio denso in H.L’operatore A∗∗ e l’estensione continua di A ad H e quindi, in particolare,

||A|| = ||A∗|| .

Dim. Si sa gia che A∗∗ e definito su H. Proviamo che estende A. Per questoconsideriamo il funzionale

k → ⟨A∗k, h⟩H .Per definizione, se h ∈ domA, questo e uguale a

⟨k,Ah⟩H

e quindi h ∈ domA∗∗, con A∗∗h = Ah, ossia A∗∗ estende A.Di conseguenza vale anche ||A∗|| ≤ ||A|| ≤ ||A∗∗|| ≤ ||A∗|| e quindi ||A|| =

||A∗||.Se in particolare A ∈ L(H,K) (e quindi con dominio H) vale

⟨Ah, k⟩K = ⟨h,A∗k⟩H ∀h ∈ H , k ∈ K .

E’ inoltre facile verificare che valgono le seguenti regole di calcolo:

Teorema 255 Sia A ∈ L(H,K). Vale:

(αA)∗ = αA∗ ; (A+B)∗ = A∗ +B∗ .

Se A−1 esiste allora esiste anche (A∗)−1 e vale

(A−1)∗ = (A∗)−1 . (3.48)

Se B ∈ L(K,Z) allora vale

(BA)∗ = A∗B∗ .

Una forma piu generale della (3.48) sara provata nel Teorema 263. Le altreproprieta sono ovvie.

Page 213: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 207

3.6.2 Operatori aggiunti ed operatori chiusi

In questa parte servono alcune nozioni del paragrafo 2.8.Ricordiamo che il grafico di un operatore A da X in Y e l’insieme

G(A) = (x,Ax) , x ∈ domA .

Il grafico di ogni operatore lineare continuo definito su X e un s.spaziochiuso di X×Y . Il grafico puo essere chiuso anche se A non e continuo.Operatori che hanno grafico chiuso si dicono operatori chiusi. Use-remo le seguenti proprieta: 1) un operatore chiuso con dominio ugualea tutto lo spazio e continuo; 2) Se A−1 esiste ed e continuo allora A echiuso.

Proviamo:

Teorema 256 Ogni operatore aggiunto e chiuso.

Dim. Sia A un operatore lineare da H in K, con dominio denso in H, e siaA∗ il suo aggiunto. Dobbiamo provare che il grafico di A∗ e chiuso. Sia perquesto ( (yn, A

∗yn) ) una successione che appartiene al grafico di A∗ e che econvergente,

lim yn = η , limA∗yn = ξ .

Dobbiamo provare che (η, ξ) appartiene al grafico di A∗, ossia che η ∈ domA∗

e che inoltre ξ = A∗η.Per ogni x ∈ domA vale

⟨Ax, yn⟩ = ⟨x,A∗yn⟩ .

Passando al limite rispetto ad n si ha:

⟨Ax, η⟩ = ⟨x, ξ⟩ ∀x ∈ domA .

Dunque, η ∈ domA∗ e A∗η = ξ. Cio volevamo provare.

Si noti: nel teorema precedente non si e supposto che A sia continuo oppurechiuso.

Osservazione 257 Si e notato che se A e continuo allora A∗ ha dominio K.Abbiamo ora visto che A∗ e chiuso e quindi, se A e continuo, anche A∗ loe per il teorema 102. E’ questa una diversa dimostrazione di una parte dellemma 253.

Page 214: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

208 CAPITOLO 3. SPAZI DI HILBERT

Se anche A∗ ha dominio denso in K allora si puo definire A∗∗. Vale:

Teorema 258 L’operatore A∗∗ estende A.

Dim. Sia h ∈ domA, k ∈ domA∗. Da

⟨Ah, k⟩ = ⟨h,A∗k⟩

si vede che la funzione k → ⟨h,A∗k⟩ e continua, cosı che h ∈ domA∗∗ e inoltreA∗∗h = Ah.

Dunque, A∗∗ e un’estensione chiusa di A e si potrebbe provare che e laminima estensione chiusa.

Osservazione 259 Si noti quindi che se A∗ e continuo con dominio densoanche A e continuo; e cio spiega perche nel caso dell’esempio 251 il dominiodell’aggiunto deve essere 0: se il dominio fosse IR si potrebbe definire A∗∗,estensione continua di A, che invece non e continuo.

Quest’argomento si puo ripetere per ogni funzionale lineare: l’aggiunto diun funzionale lineare non continuo ha dominio uguale a 0.

Supponiamo ora che A sia esso stesso chiuso. In tal caso vale

Teorema 260 Se A e chiuso con dominio denso anche A∗ e chiuso con do-minio denso; e quindi A∗∗ puo definirsi, ed e uguale ad A.

La dimostrazione e posposta.Abbiamo cosı identificato una classe di operatori, piu generale di L(H,K),

nella quale il calcolo dell’aggiunto ha buone proprieta.Concludiamo infine con alcune regole di calcolo per gli operatori aggiunti.

E’ immediato verificare che

(αA)∗ = αA∗ .

Valgono inoltre le regole:

Teorema 261 Siano A e B operatori lineari da H in K, ambedue con dominiodenso in H.

a) Supponiamo che dom (A+B) sia denso in H. Se k ∈ (domA∗)∩(domB∗)allora k ∈ dom (A∗ +B∗) e

(A+B)∗k = A∗k +B∗k ;

In particolare, se i due operatori A e B sono continui, (A + B)∗ =A∗ +B∗.

Page 215: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 209

b) Sia A continuo. Allora,

(AB)∗ = B∗A∗ , dom (AB)∗ = k ∈ domA∗ | A∗k ∈ domB∗ .

Se anche B e continuo, (AB)∗ = B∗A∗.

c) Sia B continuo e sia imB ⊆ domA. In tal caso (AB)∗ estende B∗A∗.

La dimostrazione e posposta.

3.6.3 Operatori aggiunti e spettro

Vogliamo ora studiare piu in dettaglio lo spettro degli operatori (ovviamente,con dominio denso in H). Premettiamo due risultati che valgono anche peroperatori lineari che operano tra spazi diversi, senza ulteriori ipotesi a partequella di avere dominio denso.

Lemma 262 Sia A lineare da H in K con dominio denso. Si equivalgono lecondizioni

1) k ∈ [imA]⊥ ; 2) A∗k = 0 .

In particolare, se H = K, 0 ∈ σp(A∗) se e solo se l’operatore A non ha

immagine densa.

Dim. E’ k ∈ [imA]⊥ se e solo se

⟨Ah, k⟩ = 0 ∀h ∈ domA .

Se cio accade allora h→ ⟨Ah, k⟩ e continuo e quindi k ∈ domA∗. Dunque valeanche

⟨h,A∗k⟩ = 0 ∀h ∈ domA .

Essendo denso il dominio di A, segue che A∗k = 0.L’implicazione opposta si vede in modo analogo.

Inoltre,

Teorema 263 Sia A lineare da H in K con dominio denso e supponiamo che:1) kerA = 0; 2) imA denso in K. Allora A∗ ammette inverso e vale

[A∗]−1 =[A−1

]∗. (3.49)

Inoltre, se A−1 e continuo allora [A∗]−1 lo e; se [A∗]−1 ha dominio densoin H ed e continuo, anche A−1 e continuo.

Page 216: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

210 CAPITOLO 3. SPAZI DI HILBERT

La dimostrazione e posposta.

Usando il Teorema 263, proviamo prima di tutto:

Teorema 264 0 ∈ ρ(A) se e solo se 0 ∈ ρ(A∗).

Dim. Sia 0 ∈ ρ(A). In questo caso l’immagine di A e densa e quindi kerA∗ = 0.Usando ancora la condizione 0 ∈ ρ(A), si vede che A−1 esiste continuo condominio denso. Dunque, [A−1]

∗e definito su H ed e continuo. Da (3.49) si

vede che [A∗]−1 e continuo con dominio uguale ad H, ossia che 0 ∈ ρ(A∗).

Sia invece 0 ∈ ρ(A∗). In tal caso l’operatore [A∗]−1 ha dominio denso ed econtinuo. Mostriamo che kerA = 0 notando che se Ah0 = 0 allora per ogni ksi ha

⟨Ah0, k⟩ = 0 .

Se in particolare k ∈ domA∗ si ha

⟨h0, A∗k⟩ = 0

e quindi deve essere h0 = 0, altrimenti sarebbe 0 ∈ σr(A∗). Quindi, A−1

puo definirsi e vale (3.49). Per ipotesi, (A∗)−1 e continuo con dominio densocosı che anche (A−1)∗ ha tali proprieta. Dunque, anche A−1 e continuo, ossia0 ∈ ρ(A).

Segue quindi:

Teorema 265 Sia A lineare con dominio denso. Vale:

0 ∈ σ(A) ⇐⇒ 0 ∈ σ(A∗) .

Studiamo ora con maggiori dettagli le relazioni tra lo spettro di un opera-tore e quello del suo aggiunto. Dato che λ ∈ ρ(A) equivale a 0 ∈ ρ(λI −A) sivede che:

Teorema 266 Vale: λ ∈ ρ(A) se e solo se λ ∈ ρ(A∗); λ ∈ σ(A) se e solo seλ ∈ σ(A∗).

Invece, le singole componenti dello spettro non si conservano. Si ha invece:

Teorema 267 Sia A un operatore lineare da H in H, con dominio denso. Seλ ∈ σp(A) allora λ ∈ σp(A

∗) ∪ σr(A∗); se λ ∈ σr(A) allora λ ∈ σp(A

∗); seλ ∈ σc(A) allora λ ∈ σc(A

∗) ∪ σr(A∗).

Page 217: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 211

La dimostrazione della seconda proprieta e immediata: se λ ∈ σr(A) alloraesiste h ⊥ im (λI − A) e per esso

0 = ⟨h, (λI − A)x⟩ = ⟨(λI − A∗)h, x⟩ ∀x ∈ domA .

E quindi (λI − A∗)h = 0 .Proviamo la prima. Se λ ∈ σp(A) allora esiste x0 per cui

0 = ⟨(λI − A)x0, h⟩ = ⟨x0, (λI − A∗)h⟩ ∀h ∈ domA∗ .

Cio vuol dire che im (λI −A∗) non e densa e quindi, se λ /∈ σp(A∗) deve essere

λ ∈ σr(A∗).

Sia ora 0 ∈ σc(λI −A). In questo caso (λI −A)−1 non e continuo e quindi(λI − A∗)−1 non e continuo, si veda il Teorema 266. Se (λI − A∗)−1 non hadominio denso in H allora λ ∈ σr(A

∗), altrimenti λ ∈ σc(A∗).

La situazione e riassunta nello specchietto seguente.

λ ∈ ρ(A) ⇐⇒ λ ∈ ρ(A∗)

λ ∈ σ(A) ⇐⇒ λ ∈ σ(A∗)

λ ∈ σp(A) =⇒ λ ∈ σp(A∗) ∪ σr(A∗)

λ ∈ σr(A) =⇒ λ ∈ σp(A∗)

λ ∈ σc(A) =⇒ λ ∈ σc(A∗) ∪ σr(A∗)

Un corollario interessante del teorema (267) e:

Corollario 268 Si sappia che σ(A) e reale e che A∗ = A. In tal caso σr(A) =∅.

Dim. Infatti, se λ ∈ σr(A) allora deve aversi anche λ = λ ∈ σp(A∗) = σp(A).

Cio e impossibile perche le tre componenti dello spettro sono disgiunte.

E’ importante sapere che il corollario precedente contiene un’ipotesi ridon-dante. Infatti

Teorema 269 Se A = A∗ allora σ(A) e reale.

Page 218: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

212 CAPITOLO 3. SPAZI DI HILBERT

La dimostrazione e posposta.Gli operatori per cui A = A∗ si chiamano autoaggiunti e sono impor-

tantissimi nelle applicazioni. Per essi vale anche

Teorema 270 Sia A autoaggiunto e siano λ e µ autovalori tra loro diversi.Siano x ed y non nulli e tali che

Ax = λx , Ay = µx .

Allora, x ⊥ y.

Dim. Dal Teorema 269 si sa che λ e µ sono reali. Come nel caso delle matrici,si moltiplichi scalarmente la prima per y, la seconda per x e si sommi. Si trova:

(λ− µ)⟨x, y⟩ = 0 .

Dato che λ = µ, deve essere x ⊥ y.

Osservazione 271 E’ bene notare che la condizione A = A∗ in particolarerichiede l’uguaglianza dei domini. Se invece A∗ estende A, senza che si abbial’uguaglianza dei domini, l’operatore A si chiama simmetrico. Esattamentecome in dimensione finita, si prova che se A e simmetrico i suoi autovalori sonoreali e che autovettori corrispondenti ad autovalori diversi sono ortogonali.Infatti, sia A simmetrico e sia λ un suo autovalore. Sia x = 0 un autovettore,ossia si abbia x ∈ domA e inoltre Ax = λx. Moltiplicando scalarmente per xi due membri di quest’uguaglianza si trova

λ||x||2 = ⟨x, λx⟩ = ⟨x,Ax⟩ = ⟨Ax, x⟩ = ⟨λx, x⟩ = λ||x||2 .

Semplificando ||x||2 si trova λ = λ.Noto il fatto che gli autovalori sono reali, la dimostrazione dell’ortogonalita

e uguale a quella vista per gli operatori autoaggiunti nel Teorema 270.Notiamo infine che le due definizioni di operatore simmetrico e di operatore

autoaggiunto coincidono nel caso degli elementi di L(X). Si vedra invecenell’esempio 272 che esistono operatori illimitati che sono simmetrici ma nonautoaggiunti.

Esempio 272 Mostriamo un operatore simmetrico che non e autoaggiunto.Ricordando il Teorema 269, si vede che basta mostrare un esempio di operatoresimmetrico il cui spettro contiene il punto i, non reale. Consideriamo per

Page 219: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 213

questo lo spazio X = L2(0,+∞). Si verifica facilmente che l’operatore lineareda X in se stesso definito da

f −→∫ t

0et−sf(s) ds

non e continuo. Consideriamo ora l’operatore A cosı definito:

domA =x ∈ C1(0,+∞) , x(0) = 0 e x′ ∈ L2(0,+∞)

, Ax = ix′ .

Integrando per parti si vede che l’operatore e simmetrico. Infatti, siano x edy in domA:

⟨Ax, y⟩ =∫ +∞

0ix′(s)y(s) ds = lim

t→+∞ix(t)y(t)−

∫ +∞

0ix(s)y′(s) ds = ⟨x,Ay⟩

perche una funzione che appartiene ad L2(0,+∞) insieme alla sua derivata halimite nullo per t→ +∞. Calcolando

(iI − A)x = f

si trova l’equazione

x′ = x+ if

la cui soluzione e

x(t) =∫ t

0et−s[if(s)] ds

e quindi non dipende da f in modo continuo.

3.6.4 Risolvente di operatori chiusi

Sia A un operatore lineare da H in se, con dominio denso. Ricordiamo cheλ ∈ ρ(A) quando (λI − A)−1 ha dominio denso in H ed e continuo. L’inversoche figura in questa definizione e l’inverso sinistro, perche non si richiede che(λI − A) abbia immagine uguale ad H e cio e alquanto insoddisfacente. Peresempio, se (λI − A)−1 e continuo definito su un s.spazio denso, esso puoestendersi per continuita ad H ma la relazione tra A e tale estensione non echiara. Mostriamo che questa difficolta scompare se l’operatore A e chiuso:

Teorema 273 Sia A chiuso e sia λ ∈ ρ(A). In tal caso (λI−A) ha immagineuguale ad H.

Page 220: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

214 CAPITOLO 3. SPAZI DI HILBERT

Dim. notando che λ ∈ ρ(A) se e solo se 0 ∈ ρ(λI − A), basta provare che se0 ∈ ρ(A) allora imA = H.

Sia k0 ∈ H qualsiasi. Dobbiamo provare che k0 ∈ imA. Essendo 0 ∈ρ(A), l’operatore A ha immagine densa ed inverso continuo. Esiste quindi unasuccessione (hn) tale che limAhn = k0.

La continuita di A−1 mostra che

hn = A−1(Ahn)

converge,7

limhn = h0 .

Dunque, hn → h0 e Ahn → k0. Grazie al fatto che l’operatore A e chiusopossiamo dedurre che h0 ∈ domA e Ah0 = k0, come dovevamo provare.

3.6.5 Spazi di Sobolev ed operatori aggiunti

Per semplicita lavoriamo con funzioni di una variabile definite su un intervallo(a, b), ma cio che andiamo a dire si estende facilmente a funzioni di piu variabili,a parte una precisazione importante, gia notata al Paragrafo 2.3.1, e che oraripeteremo.

Abbiamo detto che una funzione f(s) appartiene a W 1,2(a, b) quando e unelemento di L2(a, b) e inoltre esiste la sua derivata in senso debole e questa euna funzione di L2(a, b). Questa e la precisazione importante da fare: se lafunzione dipende da piu variabili ovviamente si considerano tutte le derivateparziali prime, in senso debole. Non e detto che le derivate parziali debbanoesistere come limite del rapporto incrementale, nemmeno quasi ovunque; seinvece si lavora con una funzione di una sola variabile allora questa appar-tiene a W 1,2(a, b) se e solo se essa e derivabile q.o. in senso usuale e la suaderivata appartiene a L2(a, b). In tal caso la derivata calcolata nel senso delledistribuzioni coincide con la derivata usuale.8

Consideriamo ora l’operatore A da L2(a, b) in se, il cui dominio sono lefunzioni ϕ di classe C∞ e a supporto compatto9 su (a, b) e definito da:

(Aϕ)(s) = ϕ′(s) .

7sia h0 = limhn = limA−1[Ahn] ed Ahn → k0. Non si puo dedurre da qui cheh0 = A−1k0 perche ancora non sappiamo che k0 ∈ domA−1 = imA: questa inclusionee precisamente l’inclusione da provare.

8piu correttamente, la derivata calcolata come limite del rapporto incrementaleappartiene alla classe di equivalenza della derivata debole.

9ossia nulle per x /∈ [c, d] ⊆ (a, b).

Page 221: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 215

Calcoliamo domA∗. Una x ∈ L2(a, b) e in domA∗ se e solo se la trasfor-mazione

x −→∫ b

ax(s)ϕ′(s) ds

e continua su L2(a, b); ossia se e solo se essa si rappresenta come prodottointerno: ∫ b

ax(s)ϕ′(s) ds =

∫ b

ag(s)ϕ(s) ds ∀ϕ ∈ domA . (3.50)

In tal caso, x ∈ W 1,2(a, b) e la sua derivata, in senso debole, e −g.Viceversa, sia x ∈ W 1,2(a, b) e sia −g la sua derivata in senso debole.

Allora, la (3.50) vale per ogni ϕ di classe C∞ ed a supporto compatto in (a, b).Dunque, x ∈ domA∗ se e solo se x ∈ W 1,2(a, b). Si puo quindi dire che lo spazioW 1,2(a, b) si introduce per identificare il dominio degli operatori aggiunti dioperatori di derivazione.

Analogamente, gli spazi di SobolevW k,2(a, b) si introducono per descrivereil dominio dell’operatore A∗

k, con

(Akϕ)(s) = ϕ(k)(s)

ancora definito sulle funzioni ϕ di classe C∞ e a supporto compatto su (a, b).

3.6.6 Ortogonalita ed operatori aggiunti

In questo paragrafo illustriamo le proprieta intercorrenti tra nucleo ed imma-gina di un operatore lineare A e del suo aggiunto. Cio fara intervenire certeproprieta di ortogonalita e quindi richiamiamo alcune proprieta gia viste. SiaH uno spazio di Hilbert e sia X un suo s.spazio. Le proprieta seguenti sonoprovate nei paragrafi 3.3, 3.6.3 :

• l’insieme X⊥ = ξ | ⟨x, ξ⟩ = 0 e sempre un s.spazio chiuso (proprietache vale se X e un qualsiasi s.insieme di H);

• Sia X un s.spazio. E’ X⊥ = 0 se e solo se il s.spazio X e denso in H;

• Per ogni insieme X non vuoto si ha X ⊆[X⊥

]⊥;

• Si ha X =[X⊥

]⊥se e solo se X e un s.spazio chiuso e in tal caso si ha

H = X ⊕X⊥;

• L’operatore A abbia dominio denso. Vale (A∗)−1 = (A−1)∗. In partico-lare, A−1 e continuo se e solo se (A∗)−1 e continuo.

Page 222: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

216 CAPITOLO 3. SPAZI DI HILBERT

• Sia A un operatore lineare da H in H. Si ha 0 ∈ ρ(A) se e solo se0 ∈ ρ(A∗).

Infine, proveremo al succesivo Lemma 280:

• Se X ⊆ Y allora vale Y ⊥ ⊆ X⊥.

Premettiamo due osservazioni:

Lemma 274 Sia A ∈ L(H) e sia X0 invariante per A: AX0 ⊆ X0. SiaX = clX0. Il s.spazio chiuso X e invariante per A.

Dim. Sia infatti x ∈ H,

x = lim xn , xn ∈ X0 .

Vale:Ax = limAxn ∈ X

perche Axn ∈ X0 per ogni n e X = clX0.

Lemma 275 Sia A ∈ L(H) e sia X un s.spazio invariante per A: sia cioeAX ⊆ X. Allora, X⊥ e invariante per A∗.

Dim. Bisogna provare che A∗X⊥ ⊆ X⊥. Sia per questo h ∈ X⊥ e sia x ∈ X.Si ha:

⟨x,A∗h⟩ = ⟨Ax, h⟩ = 0

perche Ax ∈ X ed e h ⊥ X. Cio vale per ogni x ∈ X e quindi A∗h ∈ X⊥.

Proviamo ora:

Lemma 276 Sia A lineare da H in K, con dominio denso. Il s.spazio kerA∗

e chiuso in K.

Dim. Essendo il dominio di A denso in H, possiamo definire l’operatore A∗.Questo e un primo uso che faccioamo dell’ipotesi su domA. Questa stessaipotesi sara nuovamente usata piu sotto.

Sia (yn) una successione in kerA∗, yn → y0. Per ogni x ∈ domA vale

0 = ⟨x,A∗yn⟩ = ⟨Ax, yn⟩ → ⟨Ax, y0⟩ .

Dunque, x→ ⟨Ax, y0⟩ ≡ 0 e una funzione continua, ossia y0 ∈ domA∗ e

0 = ⟨Ax, y0⟩ = ⟨x,A∗y0⟩ .

Cio implica A∗y0 = 0 perche il dominio dell’operatore A e denso in H.

Il risultato principale che vogliamo provare e il seguente:

Page 223: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 217

Teorema 277 Sia A lineare da H in K, con dominio denso in H. Si ha:

a) [imA]⊥ = kerA∗;

b) [kerA∗]⊥ = cl (imA);

c) cl (kerA) ⊆ [imA∗]⊥;

d) [kerA]⊥ ⊇ cl (imA∗).

Se l’operatore A e continuo con dominio uguale ad H le proprieta c) e d) siprecisano come segue:

c’) [imA∗]⊥ = kerA;

d’) [kerA]⊥ = cl (imA∗).

Dim. Proviamo a) Se y ∈ kerA∗ allora per ogni x ∈ domA vale

0 = ⟨x,A∗y⟩ = ⟨Ax, y⟩

e quindi y ⊥ imA. Si e cosı provato che

kerA∗ ⊆ [imA]⊥ .

Proviamo l’inclusione opposta. Sia y ⊥ imA. Allora, y ∈ domA∗ perche

⟨Ax, y⟩ = 0 e quindi A∗y = 0 .

La proprieta b) segue dalla proprieta a) passando agli ortogonali.Proviamo che vale c). Sia x ∈ kerA fissato e sia y ∈ domA∗ qualsiasi.

Vale⟨x,A∗y⟩ = ⟨Ax, y⟩ = 0 .

Dunque, kerA ⊆ [imA∗]⊥ e quindi anche

cl ([kerA]) ⊆ [imA∗]⊥ ,

come volevamo provare.Passando agli ortogonali dei due membri in c) si trova

cl (imA∗) ⊆ [kerA]⊥ ,

ossia la d).Sia ora A continuo definito su H. Ricordiamo che in tal caso si ha (A∗)∗ =

A e che kerA e chiuso.

Page 224: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

218 CAPITOLO 3. SPAZI DI HILBERT

Proviamo ora la c’). Dalla a) con A∗ al posto di A si trova

[imA∗]⊥ = ker(A∗)∗ = kerA .

La d’) si prova in modo analogo, scrivendo la b) con A∗ al posto di A. Siottiene in questo modo

[kerA]⊥ = [ker(A∗)∗]⊥ = cl (imA)

e quindi la d’).

Infine, notiamo che la proprieta a) del teorema 277 puo riformularsi comesegue:

Teorema 278 Sia A un operatore lineare da H in K, con dominio denso inH. L’immagine di A e densa in K se e solo se kerA∗ = 0.

Rimane il problema di sapere se la surgettivita di A puo caratterizzarsi me-diante A∗, questione risolta dal risultato seguente:

Teorema 279 Sia A un operatore lineare chiuso di H in K, con dominiodenso in H. L’operatore A e suriettivo se e solo se esiste m > 0 tale che

||A∗y|| > m||y|| ∀y ∈ domA∗ . (3.51)

Dim. La (3.51) mostra che kerA∗ = 0 e quindi l’immagine di A e densa;la (3.51) mostra anche che (A∗)−1 e continuo e quindi anche A−1 e conti-nuo. Dunque, l’operatore A ha immagine densa ed inverso continuo, ossia0 ∈ ρ(A). Essendo A chiuso segue che la sua immagine e chiusa, si ricordi ilTeorema 273.

3.6.7 Dimostrazioni posposte

Dimostrazione del TEOREMA 260. In questa dimostrazione useremopiu volte il teorema 217: sia X e us s.spazio chiuso. Si ha[

X⊥]⊥

= X .

Useremo inoltre questa proprieta, provata nel successivo lemma 280: se X edY sono due s.spazi di H, con X ⊆ Y , allora X⊥ ⊇ Y ⊥.

Se A∗ non ha dominio denso, esiste k ∈ K non nullo ed ortogonale adomA∗. In tal caso,

(k, 0) ∈ [G(A∗)]⊥ .

Page 225: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 219

Si prova che cio non puo darsi identificando esplicitamente lo spazio [G(A∗)]⊥.La definizione di A∗ puo riscriversi in questo modo:

(k, z) ∈ G(A∗) se e solo se ⟨Ah, k⟩ = ⟨h, z⟩ ∀h ∈ domA .

Ossia:

(k, z) ∈ G(A∗) se e solo se ⟨(−Ah, h), (k, z)⟩K×H = 0 . (3.52)

Introduciamo la notazione

G = (−Ah, h) | h ∈ domA .

Essendo A chiuso, G e un s.spazio chiuso di K ×H e (3.52) mostra che

G ⊆ [G(A∗)]⊥ .

Proviamo che vale l’uguaglianza procedendo per assurdo. Se l’inclusione epropria allora esiste (k, z) ∈ [G(A∗)]⊥ non nullo e ortogonale a G, ossia taleche

⟨(−Ah, h), (k, z)⟩K×H = 0

per ogni (−Ah, h) ∈ G, ossia per ogni h ∈ domA. Questo mostra che

(k, z) ∈ G(A∗) ∩ [G(A∗)]⊥

ossia che (k, z) e invece nullo.Abbiamo cosı provato che

G = [G(A∗)]⊥ .

Nota questa uguaglianza, si ha

(k, 0) ∈ [G(A∗)]⊥ = G = (−Ah, h) , h ∈ domA .

Dunque si ha h = 0 e quindi anche k = −Ah = 0, come volevamo.

Per completare la dimostrazione notiamo:

Lemma 280 Siano X ed Y due s.spazi di H, con X ⊆ Y , allora X⊥ ⊇ Y ⊥.

Dim. Se h ⊥ Y allora ⟨h, y⟩ = 0 per ogni y ∈ Y ; in particolare cio vale ancheper ogni x ∈ X, dato che X ⊆ Y . Dunque ogni h ∈ Y ⊥ e anche in X⊥.

Dimostrazione del TEOREMA 261.

Page 226: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

220 CAPITOLO 3. SPAZI DI HILBERT

Proviamo la proprieta a) notando che per ogni x ∈ dom (A+B) vale

⟨(A+B)x, k⟩ = ⟨Ax, k⟩+ ⟨Bx, k⟩ = ⟨x,A∗k⟩+ ⟨x,B∗k⟩ .

Dunque, x → ⟨(A + B)x, k⟩ e continuo e dunque k ∈ dom (A + B)∗. Notatocio, le uguaglianze precedenti implicano che

(A+B)∗k = A∗k +B∗k .

Proviamo b). Essendo A continuo,

⟨ABx, k⟩ = ⟨Bx,A∗k⟩

e questa e una funzione continua di x se e solo se A∗k ∈ domB∗. Se cio accadeallora si ha anche

⟨ABx, k⟩ = ⟨Bx,A∗k⟩ = ⟨x,B∗A∗k⟩ ∀x ∈ domB .

Ricapitolando, k ∈ domB∗A∗ se e solo se A∗k ∈ domB∗ e (AB)∗k =B∗A∗k, come si voleva.

Proviamo infine c) notando che se k ∈ domA∗ si ha

⟨ABx, k⟩ = ⟨Bx,A∗k⟩ = ⟨x,B∗A∗k⟩ .

Cio vale per ogni x perche imB ⊆ domA; e quindi per ogni k ∈ domA∗ si ha

(AB)∗k = B∗A∗k .

Dimostrazione del TEOREMA 263.

L’operatore (A−1)∗ e definito da

⟨h,A−1k⟩ = ⟨(A−1)∗h, k⟩ ∀h ∈ dom (A−1)∗ , k ∈ imA .

Indichiamo con ξ il vettore ξ = (A−1)k ∈ domA. L’uguaglianza precedentediviene

⟨h, ξ⟩ = ⟨(A−1)∗h,Aξ⟩ ∀ξ ∈ domA , h ∈ dom (A−1)∗ .

Cio mostra che (A−1)∗h e nel dominio di A∗ e inoltre che

A∗(A−1)∗h = h ∀h ∈ dom (A−1)∗ . (3.53)

Mostriamo ora che

(A−1)∗A∗k = k ∀k ∈ domA∗ . (3.54)

Page 227: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.6. L’OPERATORE AGGIUNTO 221

Sia h = A−1η un generico elemento di domA. Essendo

⟨h,A∗k⟩ = ⟨Ah, k⟩ ∀h ∈ domA , k ∈ domA∗

si ha⟨A−1η,A∗k⟩ = ⟨η, k⟩ ∀h ∈ domA , k ∈ domA∗ .

Cio prova che A∗k ∈ dom(A−1)∗ per ogni k ∈ domA∗ e che

(A−1)∗A∗k = k ∀k ∈ domA∗ .

Vale dunque (3.54). Le uguaglianze (3.53) e (3.54) insieme equivalgono a (3.49).Proviamo ora l’asserto relativo alla continuita. Una delle due implicazioni

e facile: se A−1 e continuo, anche [A−1]∗e continuo, e abbiamo provato che

quest’operatore e uguale ad [A∗]−1, che pertanto e continuo.L’implicazione opposta richiede piu lavoro. Per ipotesi, [A∗]−1 e continuo,

e quindi limitato. Dunque, esiste M ≥ 0 tale che

|| [A∗]−1 h|| ≤M ||h|| ∀h ∈ dom [A∗]−1 = dom[A−1

]∗.

Dunque, per ogni k ∈ K, con ||k|| ≤ 1, vale

M ||h|| ≥∣∣∣⟨k, [A∗]−1 h⟩

∣∣∣ = ∣∣∣⟨k, [A−1]∗h⟩∣∣∣ .

Questa disuguaglianza vale per ogni h ∈ dom [A∗]−1 e per ogni k con ||k|| ≤ 1.Se inoltre si sceglie k ∈ domA−1, la disuguaglianza precedente si scrive∣∣∣⟨A−1k, h⟩

∣∣∣ ≤M ||h|| ∀h ∈ dom [A∗]−1 = dom[A−1

]∗= dom [A∗]−1 .

Per ipotesi, dom [A∗]−1 e denso in H e quindi si ha

k ∈ domA−1 , ||k|| ≤ 1 =⇒ ||A−1k|| ≤M ,

come si doveva dimostrare.

Dimostrazione del TEOREMA 269.Sia λ = α + iβ ∈ σ(A). Si deve provare che β = 0.Per ogni x ∈ domA vale

⟨(λI − A)x, x⟩ = λ⟨x, x⟩ − ⟨Ax, x⟩ (3.55)

Ma ora, essendo A = A∗, ⟨Ax, x⟩ e reale. Infatti,

⟨Ax, x⟩ = ⟨x,Ax⟩ = ⟨Ax, x⟩ .

Page 228: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

222 CAPITOLO 3. SPAZI DI HILBERT

Dunque si trova⟨(λI − A)x, x⟩ = λ⟨x, x⟩ − ⟨Ax, x⟩ . (3.56)

Sottraendo (3.55) e (3.56),

−2iβ||x||2 = ⟨(λI − A)x, x⟩ − ⟨(λI − A)x, x⟩ = 2i (Im ⟨(λI − A)x, x⟩) .

Passando ai moduli si vede che

|β| · ||x||2 = |Im ⟨(λI − A)x, x⟩| ≤ |⟨(λI − A)x, x⟩| ≤ ||(λI − A)x|| · ||x|| .(3.57)

Cio implica che l’inverso sinistro di (λI − A) e continuo, si veda la (2.62).Dunque, se β = 0 deve essere iβ ∈ σr(A). Esiste quindi ξ = 0 tale che

0 = ⟨ξ, (λI − A)x⟩ ∀x ∈ domA .

Cio in particolare implica che ξ ∈ domA∗ = domA. Dunque, con x = ξ si hadalla (3.57):

|β| ||ξ|| ≤ ||(λI − A)ξ|| = 0

e quindi β = 0, come si voleva.

3.7 Convergenza debole in spazi di Hilbert

Si e visto che in uno spazio di Banach di dimensione infinita i compatti sono“rari”. Lo stesso ovviamente avviene anche nel caso particolare di spazi diHilbert. Nel caso degli spazi di Hilbert la verifica e immediata. Infatti:

Teorema 281 Sia X uno spazio di Hilbert di dimensione infinita. La sferaS = x | ||x|| = 1, che e chiusa, non e compatta.

Dim. Sia infatti en un sistema ortonormale numerabile. La distanza tradue qualsiasi di essi vale

√2. Infatti

||en − ek||2 = ⟨en − ek, en − ek⟩ = ||en||2 + ||ek||2 = 2 .

Dunque la successione en, che appartiene ad S, non contiene s.successioniconvergenti.

Di conseguenza nemmeno la palla x | ||x|| ≤ 1 e compatta e quindi nes-suna palla e compatta. D’altra parte, si sa dai corsi precedenti che la proprietadi compattezza e cruciale nello studio dei problemi di minimo. Infatti:

Page 229: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.7. CONVERGENZA DEBOLE IN SPAZI DI HILBERT 223

Teorema 282 (di Weierstrass) Una funzione f continua su un insiemecompatto K ammette sia minimo che massimo.

Accenniamo alla dimostrazione, che dovrebbe essere nota: per provare l’e-sistenza del minimo, si costruisce una successione minimizzante (kn) in K,ossia una successione tale che

lim f(kn) = inff(k) | k ∈ K .

Si usa la compattezza di K per estrarre una sottosuccessione (knr) convergentea k0 ∈ K; e la continuita di f per concludere

f(k0) = lim f(knr) = inff(k) | k ∈ K . (3.58)

Cio prova che k0 e punto di minimo.

Osservazione 283 Alla medesima conclusione si giunge se la funzione f ,invece di essere continua, vale

lim lim f(knr) ≥ f(k0) .

Ovviamente la disuguaglianza stretta non puo valere, e quindi segue la (3.58);ossia segue che k0 e punto di minimo.

La considerazione nell’osservazione precedente suggerisce di definire10

Definitione 284 Sia f(x) definita su un insieme D di uno spazio di HilbertX e sia x0 ∈ D. La funzione si dice semicontinua inferiormente in x0se per ogni successione (xn) in D, convergente ad x0, si ha

lim f(xn) ≥ f(x0) .

Se −f(x) e semicontinua inferiormente in x0, la funzione si chiama semi-continua superiormente in x0.

Ricapitolando, la proprieta di “continuita” che serve per provare la parte delTeorema di Weierstrass relativa ai minimi e la semicontinuita inferiore; quellache serve paer la parte relativa ai massimi e la semicontinuita superiore.

E’ facile vedere che:

• se un insieme e compatto in una topologia, tale rimane anche in topologiemeno fini;

10si veda l’analoga definizione 131, data nel contesto degli spazi di Banach.

Page 230: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

224 CAPITOLO 3. SPAZI DI HILBERT

• se una funzione a valori reali e continua oppure semicontinua inferior-mente rispetto ad una topologia, tale rimane anche in topologie piufini.

Dunque conviene introdurre topologie meno fini di quella della norma, inmodo da avere piu insiemi compatti; ma sufficientemente fini in modo taleche almeno opportune classi di funzioni continue rimangano, se non continue,almeno semicontinue inferiormente.

Noi ci limiteremo ad introdurre concetti di convergenza per una topologiameno fine di quella della norma. Non descriveremo invece la topologia.

Definitione 285 Sia (xn) una successione in uno spazio di Hilbert X. Dicia-mo che (xn) converge debolmente ad x0 se

lim⟨y, xn⟩ = ⟨y, x0⟩ ∀y ∈ X .

Per indicare la convergenza debole si usa uno dei due simboli

w− limxn = x0 oppure xn x0 .

E’ ovvio che la convergenza in norma implica la convergenza debole. Ilviceversa, in dimensione infinita, non vale.

Esempio 286 Sia X = L2(0, 2π). Si e visto che ogni f ∈ L2(0, 2π) sirappresenta

f(x) =k=+∞∑k=−∞

fkeikx , fk =

1√2π

∫ 2π

0f(x)e−ikx dx = ⟨ek, f⟩

con ek = eikx. Il Teorema di Riesz-Fisher implica che

lim fk = 0 .

Questo vuol dire che,w− lim ek = 0 .

Ma,||ek||2 =

√2π

e quindi la successione (ek) non tende a zero in norma.

Vale pero:

Teorema 287 Per la convergenza debole vale il teorema di unicita del limite.

Page 231: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.7. CONVERGENZA DEBOLE IN SPAZI DI HILBERT 225

Dim. Sew− limxn = x0 ed anche w− limxn = y0

allora si ha⟨y, (x0 − y0)⟩ = lim⟨y, xn⟩ − ⟨y, xn⟩ = 0

per ogni y ∈ X. Scegliendo in particolare y = x0 − y0 si vede che y0 = x0.

Esistono alcune relazioni importanti tra la convergenza debole e le proprietache valgono in norma. Tra queste:

Teorema 288 Ogni successione debolmente convergente e limitata in norma.

La dimostrazione e al paragrafo 2.10, dove e anche provato che ogni fun-zione continua in norma e convessa e debolmente semicontinua inferiormente.Qui limitiamoci a provare un caso particolare di quest’ultima affermazione.

Teorema 289 vale:

Se w− limxn = x0 allora lim inf ||xn||X ≥ ||x0||X .

Dim. Per ogni y, con ||y||X ≤ 1, vale

⟨y, xn⟩ → ⟨y, x0⟩ .

In particolare questa vale scegliendo y = x0/||x0|| e quindi per ogni n si ha

||xn|| ≥ ⟨ x0||x0||

, xn⟩ −→ ⟨ x0||x0||

, x0⟩ = ||x0|| .

Il Teorema 289 puo riformularsi dicendo che la norma di X e debolmentesemicontinua inferiormente.

Ricordiamo ora che una funzione f(x) su H a valori reali si dice convessaquando il suo dominio e un insieme convesso e quando per ogni coppia di puntix ed y del dominio e per ogni λ ∈ [0, 1]si ha:

f (λx+ (1− λ)y) ≤ λf(x) + (1− λ)f(y) .

Vale il seguente risultato (che riformula per il caso degli spazi di Hilbert ilTeorema 156):

Teorema 290 Sia f(x) una funzionale su H a valori reali che e continua econvessa. La funzione f(x) e debolmente semicontinua inferiormente.

Page 232: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

226 CAPITOLO 3. SPAZI DI HILBERT

Si verifica facilmente che la norma e una funzione convessa e quindi ilTeorema 289 e un caso particolare del precedente.

Inoltre:

Teorema 291 Sia xn una successione tale che

• xn x0;

• ||xn|| −→ ||x0||.

Allora, la successione xn converge ad x0 in norma.

Dim. Dobbiamo provare che

||xn − x0|| → 0 .

E’

0 ≤ ||xn − x0||2 = ⟨xn − x0, xn − x0⟩ = ||xn||2 − 2ℜe ⟨xn, x0⟩+ ||x0||2 .

Per ipotesi, ||xn||2 → ||x0||2 e ⟨xn, x0⟩ → ||x0||2. Dunque il membro destro halimite nullo e cio implica l’asserto.

Proviamo ora:

Teorema 292 Sia A un insieme sequenzialmente debolmente chiuso in X.Allora, A e anche chiuso in norma.

Dim. Sia A chiuso rispetto alla convergenza debole. Sia (xn) una successionein A, che converge in norma ad un x0.

La convergenza in norma implica la convergenza debole, e quindi (xn)converge debolmente ad x0. Dato che A e debolmente chiuso, si ha x0 ∈ A; equindi A e chiuso in norma.

L’esempio 286 mostra che la superficie di una sfera di L2(0, 2π), pur es-sendo chiusa in norma, non e debolmente chiusa. Combinando questo colteorema precedente si vede che che la topologia della convergenza debole eeffettivamente meno fine di quella della norma.

Vale pero:

Teorema 293 Sia A un sottoinsieme convesso e chiuso rispetto alla norma.L’insieme A e anche chiuso rispetto alla convergenza debole.

La dimostrazione si trova nel paragrafo 2.10.Inoltre:

Page 233: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 227

Teorema 294 (di Alaoglu in spazi di Hilbert) Ogni successione limita-ta nello SPAZIO DI HILBERT X ammette s.successioni debolmente conver-genti.

La dimostrazione si trova nel paragrafo 2.10.Ricordiamo che il Teorema di Alaloglu NON vale in un generico spazio di

Banach, ma vale in spazi di Banach che sono spazi duali, rispetto ad un diversotipo di convergenza, che si chiama “convergenza debole stella”.

La dimostrazione si trova nel paragrafo 2.10.Infine, il teorema di Riesz mostra che ogni spazio di Hilbert e isomorfo al

suo duale, e quindi anche al suo biduale. Cio prova il Teorema 159.

3.8 Operatori compatti

Siano H e K spazi di Hilbert e sia C ∈ L(H,K). Essendo C continuo, ilsuo nucleo e un s.spazio chiuso di H e inoltre la restrizione di C a [kerC]⊥ einiettiva. Se in particolare [kerC]⊥ ha dimensione finita allora anche imC euno spazio di dimensione finita e lo studio di C si fa semplicemente lavorandotra spazi di dimensione finita. In particolare, esistono basi e1 , . . . , en di[kerC]⊥ ed ϵ1 , . . . , ϵn di imC tali che

Cx =n∑i=1

⟨x, ei⟩ϵi

per ogni x ∈ H (e non solo per ogni x ∈ [kerC]⊥).

Osservazione 295 Si ha quindi una “diagonalizzazione” di C, ma rispetto abasi diverse. Si noti che le basi possono essere diverse anche se H = K. Peresempio sia H = K = IC 2 e sia C rappresentato dalla matrice[

1 10 1

]

rispetto alla base canonica. L’operatore C non e diagonalizzabile scegliendouna medesima base per rappresentare IC 2 sia come spazio di partenza ched’arrivo; se pero si scelgono come e1 ed e2 gli elementi della base canonica einvece

ϵ1 =

[10

], ϵ2 =

[11

]allora

C[x1e1 + x2e2] = x1ϵ1 + x2ϵ2 .

Page 234: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

228 CAPITOLO 3. SPAZI DI HILBERT

La classe degli operatori C il cui nucleo ha codimensione finita ha quindiproprieta ben particolari. Sfortunatamente essa e troppo piccola per le ap-plicazioni. Una classe piu vasta di operatori, che ha proprieta ancora benparticolari e che pero si incontra in numerose applicazioni e quella degli ope-ratori compatti. Per definizione, un operatore si dice compatto quandoogni insieme limitato di H e trasformato in un insieme relativamente compattonella topologia della norma di K.

Naturalmente, per vedere se un operatore e compatto basta verificare cheuna sfera ha per immagine un insieme relativamente compatto.

Osservazione 296 Ricordiamo che ogni insieme relativamente compatto elimitato. Dunque la sola proprieta di trasformare limitati in relativamentecompatti implica la limitatezza e quindi la continuita dell’operatore.

Ricordiamo che una successione e compatta quando ogni sua s.successioneammette punti limite. Ovviamente:

Teorema 297 L’operatore C ∈ L(H,K) e compatto se e solo se trasformaogni successione limitata di H in una successione compatta di K (con latopologia della norma).

Chiaramente tutti gli operatori con nucleo di codimensione finita, ossiacon immagine di dimensione finita, trasformano insiemi limitati in insiemirelativamente compatti e inoltre:

Teorema 298 Sia (Cn) una successione di operatori compatti. Se

C = limCn

(il limite nel senso di L(K,H)), allora C e compatto.In particolare cio vale se per ciascun Cn si ha:

dim [imCn] = cn < +∞ .

Dim. Proviamo il teorema nel caso generale in cui ogni operatore Cn e com-patto, senza fare ipotesi sul suo nucleo.

Proviamo che ogni successione (xn) limitata di H ha per immagine unasuccessione (Cxn) che ammette s.successioni convergenti nella topologia dellanorma di K. Usiamo il procedimento diagonale di Cantor: si consideri lasuccessione

n→ C1xn .

Page 235: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 229

Questa ammette s.successioni convergenti, perche l’operatore C1 e compatto.Indichiamo col simbolo (x1,n) una s.successione di (xn) per cui (C1x1,n) con-verge. La s.successione (x1,n) e limitata perche la successione (xn) e limitata.Dunque (C2x1,n) ammette una s.successione convergente che indichiamo colsimbolo (C2x2,n).

Proseguendo in questo modo si costruiscono successioni (xr,n) tali che:

• (xr,n) e s.successione di (xr−1,n);

• per ogni fissato i, la successione (di indice n) (Cixi,n) e convergente.

• Dunque, (Cjxi,n) e convergente per ogni indice j < i, perche (xi,n) coni > j e s.successione di (xj,n).

Si consideri ora la tabella seguente.

C1x1,1 C1x1,2 C1x1,3 C1x1,4 C1x1,5 . . .C2x2,1 C2x2,2 C2x2,3 C2x2,4 C2x2,5 . . .C3x3,1 C3x3,2 C3x3,3 C3x3,4 C3x3,5 . . .C4x4,1 C4x4,2 C4x4,3 C4x4,4 C4x4,5 . . ....

......

......

Applichiamo l’operatore C alla successione xr,r e proviamo che la suc-cessione (Cxr,r) e convergente. Scriviamo per questo

||Cxn,n − Cxm,m|| ≤ ||Cxn,n − Crxn,n||+ ||Crxn,n − Crxm,m||+||Crxm,m − Cxm,m|| ≤ ||C − Cr||||xn,n||+ ||xm,m||+ ||Crxn,n − Crxmm|| .

Per ipotesi, (xn) e limitata,

||xn|| < M ∀n .

Ancora per ipotesi, Cr → C in L(H,K) e quindi per ogni ϵ > 0 esiste rϵ taleche

||C − Cr|| < ϵ/4M .

Con questo valore di r fissato, si ha

||C − Cr||||xn,n||+ ||xm,m|| < ϵ/2 .

Page 236: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

230 CAPITOLO 3. SPAZI DI HILBERT

Il numero r e ormai fissato e si sa che (Crxn,n) converge. Dunque si trovaNϵ tale che, per n, m maggiori di Nϵ vale

||Crxn,n − Crxmm|| < ϵ/2 .

Dunque la successione (Cxn,n) e fondamentale e quindi convergente.Cio prova che la successione (Cxn) e compatta in K, come volevamo.

In particolare,

Corollario 299 L’insieme degli operatori compatti e un s.spazio chiuso diL(H,K).

Infatti, che e un insieme chiuso discende dalla dimostrazione precedente. Chee un s.spazio si vede facilmente.

Si ricordi che un operatore lineare continuo trasforma limitati in limitati ecompatti in compatti. Dunque, se C e compatto, la sua composizione, a destrao a sinistra, con un operatore continuo e un operatore compatto. Dunque:

Teorema 300 L’insieme degli operatori compatti di L(K) e un ideale chiuso.

Vale inoltre:

Teorema 301 L’operatore C ∈ L(H,K) e compatto se e solo se C∗ e com-patto.

Dim. Dato che C = C∗∗, basta provare che se C e compatto il suo aggiuntolo e.

Per assurdo, supponiamo che C∗ non sia compatto. In tal caso esiste unasuccessione (kn) limitata in K, e tale che (C∗kn) non ammette s.successioniconvergenti. Dunque, per ogni successione di indici (nk) esiste almeno un ϵ > 0tale che

||C∗xnk− C∗xnm || > ϵ

per infiniti indici k ed m. Passando ad una ulteriore s.successione, non erestrittivo assumere che cio avvenga per ogni k e per ogni m.

Sia ora hk,m con ||hk,m|| = 1 e tale che

ϵ/2 ≤ ⟨hk,m, C∗xnk− C∗xnm⟩ = ⟨Chk,m, xnk

− xnm⟩ . (3.59)

Per ipotesi, l’operatore C e compatto. Dunque, l’insieme Chk,m o e finitoo ammette punti di accumulazione. Nel primo caso esiste z0 ed esiste unasuccessione (kr,mr) per cui

Chkr,mr = z0 .

Page 237: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 231

Nel secondo caso esiste una successione (kr,mr) per cui

limChkr,mr = z0 .

Limitandoci a considerare tale successione, si ha, per r sufficentemente grande,

⟨z0, xnkr− xnmr

⟩ = ⟨z0 − Chkr,mr , xnkr− xnmr

⟩+ ⟨Chkr,mr , xnkr− xnmr

⟩ > ϵ/4

perche vale (3.59) e il primo addendo del membro destro tende a zero.Cio non puo darsi perche la successione (⟨z0, xnkr

−xnmr⟩) e una successione

limitata di numeri, e quindi deve avere s.successioni convergenti per il teoremadi Bolzano–Weierstrass.

3.8.1 Lo spettro degli operatori compatti

Consideriamo un operatore compatto C da uno spazio di Hilbert di dimensioneinfinita H in se e studiamone lo spettro. Esponiamo i risultati, posponendo ledimostrazioni.

Essendo C continuo, il suo spettro e non vuoto e limitato. Si sa inoltre che

λ ∈ σ(C) =⇒ |λ| ≤ ||C|| .

Dunque, o lo spettro e finito oppure e dotato di punti di accumulazione.Mostriamo prima di tutto che σ(C) puo essere finito:

Esempio 302 Sia H = L2(0, 1) e sia C l’operatore da H in se definito da

(Ch)(t) =∫ t

0h(s) ds .

E’ noto che σ(C) = 0, si veda l’Esempio 184. Mostriamo che C e compatto.Notiamo per questo che l’immagine di C contiene soltanto funzioni continue eche C e anche continuo da L2(0, 1) in C(0, 1). Inoltre, ogni s.insieme compattodi C(0, 1) e anche un s.insieme compatto di L2(0, 1). Dunque basta provareche e compatto l’operatore

C : L2(0, 1) → C(0, 1) , (Ch)(t) =∫ t

0h(s) ds .

Come si e notato, e sufficiente provare che l’immagine della sfera unita diL2(0, 1) e compatta in C(0, 1). La continuita di C mostra che l’immagine elimitata. La disuguaglianza

|(Ch)(r)− (Ch)(t)| ≤∣∣∣∣∫ t

r|h(s)| ds

∣∣∣∣ ≤ √|t− r|

[∫ 1

0|h(s)|2 ds

]1/2mostra l’equicontinuita dell’immagine, e quindi la compattezzo per il teoremadi Ascoli–Arzela.

Page 238: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

232 CAPITOLO 3. SPAZI DI HILBERT

Nell’esempio precedente, 0 ∈ σ(C). Cio non per caso. Infatti vale

Teorema 303 Sia H uno spazio di Hilbert di dimensione infinita. Se C ecompatto, il suo spettro contiene il punto 0.

Se lo spettro di C e infinito, esso e numerabile ed ha 0 come unico puntodi accumulazione.

Il risultato seguente va sotto il nome di alternativa di Fredholm.

Teorema 304 Se λ = 0, allora im (λI−C) e chiusa. Inoltre, λ appartiene alrisolvente di C oppure appartiene allo spettro di punti di C.

Ossia, gli elementi non nulli dello spettro sono autovalori. Invece, il punto0, che appartiene sempre allo spettro se dimH = +∞, puo essere o meno unautovalore: nel caso dell’operatore visto nell’esempio 302 si ha 0 ∈ σc(C).

Ad ogni autovalore si associano i corrispondenti autovettori, uno o piu,e ad ogni autovettore si associa una catena di Jordan. E’ questa unasuccessione, oppure una sequenza finita, (xn) di vettori tali che

Ax0 = λx0 , Axn = λxn + xn−1 se n > 0 .

Dunque, il primo elemento x0 della catena e un autovettore relativo all’auto-valore λ.

Lo spazio generato da tutti gli elementi di catene di Jordan che corrispon-dono all’autovettore λ si chiama autospazio generalizzato di λ.

Vale:

Teorema 305 Gli autospazi generalizzati di autovalori non nulli hanno di-mensione finita.

Naturalmente, se 0 e l’unico punto dello spettro, o anche se lo spettroe finito, lo spettro dara poche informazioni sull’operatore. Il caso in cui lospettro da informazioni “complete” sull’operatore e il caso in cui le catene diJordan costituiscono un sistema massimale in H o almeno in [kerC]⊥, perchein tal caso l’operatore puo rappresentarsi mediante “blocchi di Jordan”. Uncaso in cui cio avviene e quello degli operatori compatti e autoaggiunti:

Teorema 306 Sia C compatto e autoaggiunto sullo spazio di Hilbert H di di-mensione infinita. Esiste una famiglia ortonormale vn (finita o numerabile)di autovettori di C,

Cvn = λnvn λn = 0 ,

tale cheCx =

∑λn⟨x, vn⟩vn

per ogni x ∈ H.La famiglia vn e massimale in [kerC]⊥.

Page 239: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 233

Questo risultato generalizza la diagonalizzazione delle matrici simmetri-che: rispetto a una base di autovettori l’operatore C puo “scriversi in formadiagonale”.

Chiameremo questa la diagonalizzazione di C.

3.8.2 Operatori compatti tra spazi diversi. Valori sin-golari

Studiamo ora il caso di un operatore C compatto tra due spazi di Hilbert H eK. Niente vieta che possa essere H = K e cio e utile nel caso in cui l’operatoreC non e autoaggiunto. Ciascuno degli operatori

CC∗ ∈ L(K) , C∗C ∈ L(H)

e compatto autoaggiunto e quindi si rappresenta rispettivamente come

C∗Ch =+∞∑i=1

mi⟨h, vi⟩vi , CC∗k =+∞∑i=1

µi⟨k, wi⟩wi . (3.60)

Naturalmente, mi e µi sono gli autovalori non nulli rispettivamente di C∗C edi CC∗ mentre vi e wi rappresentano corrispondenti autovettori normalizzati.

I numeri mi e µi sono reali e positivi. Infatti,

0 ≤ ⟨CC∗vi, vi⟩ = mi||vi||2 = mi , 0 ≤ ⟨C∗Cwi, wi⟩ = µi||wi||2 = µi .

E’ inoltre immediato vedere che i numeri mi (ricordiamo, tutti non nulli)coincidono con i numeri µi (ricordiamo: anch’essi non nulli). Infatti, sia µ = 0tale che

CC∗v = µv .

Essendo µ = 0, C∗v non e 0 e applicando C∗ ai due membri si trova

(C∗C)C∗v = µC∗v

e quindi il numero µ (non nullo) e uno degli m (non nulli). In modo analogosi vede che ciascuno degli mi coincide con uno dei numeri µi.

Osservazione 307 Nelle rappresentazioni (3.60) figurano i soli autovalori nonnulli, ed abbiamo provato che essi sono i medesimi per CC∗ come per C∗C.E’ pero possibile che 0 sia nello spettro di uno solo di questi operatori, comeaccade se H = IR2, K = IR e C =

[1 0

].

Page 240: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

234 CAPITOLO 3. SPAZI DI HILBERT

Introduciamo i numeri non nulli

σi =√mi .

che si possono anche ottenere a partire dai µi e che si chiamano i valorisingolari di C.

Generalmente si assume di ordinare i valori singolari in modo non crescente.Indichiamo con ωi il vettore

ωi =1

σiCvi

(si ricordi che i valori singolari sono non nulli.)Vale:

Lemma 308 L’insieme ωi e ortonormale in K.

Dim. Infatti,

⟨ωr, ωs⟩ = ⟨ 1σrCvr,

1

σsCvs⟩ =

1

σrσs⟨C∗Cvr, vs⟩ =

1

σrσsmr⟨vr, vs⟩

nullo se r = s perche vr ⊥ vs, altrimenti uguale a 1.

Poiche i vi sono un sistema ortonormale massimale in [kerC∗C]⊥, si puoscrivere

x =+∞∑i=1

⟨x, vi⟩vi + n , n ∈ kerC = kerC∗C

e quindi

Cx =+∞∑i=1

⟨x, vi⟩Cvi =+∞∑i=1

σi⟨x, vi⟩ωi . (3.61)

In particolare cio mostra una “diagonalizzazione” per operatori compatti traspazi diversi (in particolare, operanti nello stesso spazio, ma rispetto a basidiverse).

La (3.61) mostra che Cx e somma della serie, per ogni x fissato. In realtavale di piu: indichiamo con CN l’operatore definito da

CNx =N∑i=1

σi⟨x, vi⟩ωi .

Si ha

Lemma 309 La successione di operatori (CN) converge a C in L(H,K).

Page 241: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 235

Dim. Infatti,

||Cx− CNx|| =∣∣∣∣∣∣∣∣∣∣Cx−

N∑i=1

σi⟨x, vi⟩ωi∣∣∣∣∣∣∣∣∣∣ =

∣∣∣∣∣∣∣∣∣∣∣∣

+∞∑i=N+1

σi⟨x, vi⟩ωi

∣∣∣∣∣∣∣∣∣∣∣∣ ≤ σN+1||x||2

e si sa che limσN+1 = 0 perche l’operatore C e compatto.

Dunque, ogni operatore compatto si approssima nella norma di L(H,K)mediante operatori con immagine di dimensione finita. Combinando cio colteorema 298 si trova:

Teorema 310 Un operatore C ∈ L(H,K) e compatto se e solo se e limite, inL(H,K), di una successione di operatori con immagine di dimensione finita.

Osservazione 311 Gli operatori compatti possono definirsi anche in spazi diBanach e il teorema 298 vale anche in spazi di Banach. Pero in spazi di Banachesistono operatori compatti che non possono approssimarsi con operatori la cuiimmagine ha dimensione finita.

Per concludere, mostriamo una particolare rappresentazione sotto cui sipossono porre gli operatori compatti da H in K.

Sia prima di tutto C ∈ L(H) compatto autoaggiunto e positivo. Cio vuoldire che

⟨Cx, x⟩ ≥ 0 ∀x .In tal caso si definisce

C1/2x =+∞∑i=1

√λi⟨x, vi⟩vi .

Sia ora C compatto da H in K. Si definisce l’operatore modulo di Cponendo

|C|x = (C∗C)1/2x =+∞∑i=1

σi⟨x, vi⟩vi .

Si noti che il simbolo |C| indica un operatore, e non un numero.Dato ora un generico operatore compatto, diciamo A, tra spazi diversi,

Ax =+∞∑i=1

σi⟨x, vi⟩ωi

introduciamo l’operatore (continuo ma generalmente non compatto) come se-gue: se

x =+∞∑i=1

⟨x, vi⟩vi + n , n ∈ kerA

Page 242: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

236 CAPITOLO 3. SPAZI DI HILBERT

poniamo

UAx =+∞∑i=1

⟨x, vi⟩ωi .

Le proprieta importanti di UA sono:

• se x ∈ [span vi ]⊥ allora UAx = 0;

• se x ∈ cl span vi allora

||UAx||2 =∣∣∣∣∣∣∣∣∣∣+∞∑i=1

⟨x, vi⟩ωi∣∣∣∣∣∣∣∣∣∣2

=+∞∑i=1

|⟨x, vi⟩|2 = ||x||2 .

E’ ora facile verificare che l’operatore compatto A si rappresenta come

A = UA|A| .

Questa rappresentazione si chiama la rappresentazione polare dell’ope-ratore A.

3.8.3 Proprieta geometriche degli autovalori e valori sin-golari

Sia C compatto da H in K. Si e visto che

Cx =∑

σi⟨x, vi⟩ωi .

Dunque,

||Cx||2 =∣∣∣∣∣∣∣∣∣∣+∞∑i=1

σi⟨x, vi⟩ωi∣∣∣∣∣∣∣∣∣∣2

=+∞∑i=1

σ2i |⟨x, vi⟩|2 ≤ σ2

1||x||2

e l’uguaglianza vale se x = v1. Dunque,

Teorema 312 Il numero σ1, massimo valor singolare di C, e uguale a ||C||.In particolare, se C e compatto ed autoaggiunto, ||C|| e anche uguale a maxλi.

Vogliamo estendere questa caratterizzazione prima al caso di generici au-tovalori di operatori compatti autoaggiunti e poi al caso dei valori singolari.Consideriamo un operatore compatto autoaggiunto C, limitandoci a conside-rare il caso in cui tutti i suoi autovalori sono non negativi. In questo caso,ordiniamo quelli strettamente positivi in modo non crescente, λi ≥ λi+1. Gliautovalori si elencano piu volte quando ad essi corrispondono piu autovettori

Page 243: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 237

linearmente indipendenti. Indichiamo con vi un autovettore di norma 1 di λi,in modo da avere un sistema ortonormale vi massimale in [kerC]⊥.

Indichiamo con L[n] la famiglia di tutti i s.spazi di H di dimensione n. Ungenerico elemento di L[n] e

L = span x1 , . . . , xn.

Con Ln indichiamo il particolare s.spazio generato dai primi n autovettori:

Ln = span v1 , . . . , vn .

Ricordiamo che stiamo studiando gli autovalori λi con i > 1. Un primorisultato e il seguente:

Lemma 313 Sia C compatto autoaggiunto, con autovalori non negativi. Vale:

λn+1 = max⟨Cx, x⟩ | ||x|| = 1 , x ∈ [Ln]

⊥.

Dim. Se x ∈ [Ln]⊥, si ha

x =∞∑

i=n+1

xivi + n , xi = ⟨x, vi⟩ , n ∈ kerC

e quindi, essendo ||x||2 = ∑ |xi|2 + ||n||2 = 1,

⟨Cx, x⟩ =∞∑

i=n+1

λix2i ≤ λn+1

∞∑i=n+1

x2i

≤ λn+1 .

In conclusione, per ogni x ∈ [Ln]⊥ e di norma 1 si ha ⟨Cx, x⟩ ≤ λn+1.

D’altra parte, se x = vn+1 si ha ⟨Cvn+1, vn+1⟩ = λn+1. Cio prova il teorema.

Il risultato precedente richiede l’esplicita conoscenza degli autospazi. Inpratica interessano risultati che non fanno uso esplicito degli autospazi. Traquesti:

Teorema 314 Sia C come nel Lemma 313. Si ha:

λn+1 = min

max

⟨Cx, x⟩ | ||x|| = 1 , x ∈ L⊥

, L ∈ L[n]

.

Dim. Il lemma 313 mostra che

λn+1 = max⟨Cx, x⟩ , | ||x|| = 1 , x ∈ [Ln]

⊥.

Page 244: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

238 CAPITOLO 3. SPAZI DI HILBERT

Per provare il teorema basta mostrare che per ogni altra scelta di L ∈ L[n] siha

λn+1 ≤ max⟨Cx, x⟩ , | ||x|| = 1 , x ∈ L⊥

. (3.62)

Sia L = span h1 , . . . , hn e sia

ϕ =n+1∑i=1

ϕivi .

Mostriamo che e possibile scegliere i coefficienti ϕi, non tutti nulli, in mododa avere ϕ ∈ L⊥. Cio avviene se si trova una soluzione non nulla del sistemalineare

n+1∑i=1

ϕi⟨hj, vi⟩ = 0 j = 1 , . . . n .

Questo e un sistema di n equazioni in (n + 1) incognite e quindi ammettesoluzione non nulla. Si puo quindi effettivamente trovare ϕ ⊥ L e, dividendoper ||ϕ|| = 0, si puo assumere ||ϕ|| = 1. Per questo particolare elemento ϕ vale

⟨Cϕ, ϕ⟩ =n+1∑i=1

λiϕ2i ≥ λn+1||ϕ||2 = λn+1 .

Dunque vale (3.62), come volevamo.

Proviamo ora una caratterizzazione importante dei valori singolari. Inquesto caso C e compatto tra spazi di Hilbert H e K, puo essere tra lorodiversi.

Ricordiamo che i valori singolari per definizione sono non nulli ed ordinatiin modo decrescente.

Con A[n] indichiamo la famiglia degli operatori lineari da H in K, ciascunodei quali ha immagine di dimensione n al piu.

Teorema 315 Vale:

σn+1 = min||C − A|| | A ∈ A[n] .

Dim. Consideriamo l’operatore A definito da

Ax =n∑i=1

σi⟨x, vi⟩ωi .

Per quest’operatore si ha

(C − A)x =∞∑

i=n+1

σi⟨x, vi⟩ωi

Page 245: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 239

e quindi ||C − A|| = σn+1. Ovviamente, A ∈ A[n].Sia ora A un generico operatore che appartiene ad A[n]. La sua restrizione

a span v1 , . . . , vn+1 non e iniettiva, perche A ha immagine di dimensione nal piu, minore di quella del dominio. Dunque esiste x =

∑n+1i=1 xivi tale che

Ax = 0 e inoltre ||x|| = 1. Per quest’elemento x vale

||(C − A)x|| = ||Cx|| ≥ σn+1

e cio completa la dimostrazione.

3.8.4 Operatori compatti ed equazioni integrali di Fre-dholm

Consideriamo una funzione K(t, s) continua su [a, b] × [a, b] e l’operatore daL2(a, b) in se definito da

x→ Kx =∫ b

aK(t, s)x(s) ds .

Si sa gia che quest’operatore e continuo. Mostriamo che esso e addiritturacompatto, usando il teorema di Ascoli–Arzela. Cio generalizza l’osservazioneusata nell’Esempio 302.

Sia x ∈ B,

B = x | ||x|| < 1 .

Se possiamo provare che KB e un insieme relativamente compatto di L2(a, b)allora K e un operatore compatto.

Si sa anche che K trasforma L2(a, b) in C(a, b) e, come si e gia visto, bastaprovare che KB e un s.insieme compatto di C(a, b). La uniforme limitatez-za di KB discende dalla continuita di K. Proviamo quindi l’equicontinuita.Notiamo:

|(Kx)(t)− (Kx)(t′)| =∣∣∣∣∣∫ b

a[K(t, s)−K(t′, s)]x(s) ds

∣∣∣∣∣≤[∫ b

a|K(t, s)−K(t′, s)|2

]1/2 [∫ b

a|x(s)|2

]1/2≤[∫ b

a|K(t, s)−K(t′, s)|2

]1/2.

Sia ϵ > 0. L’uniforme continuita di K mostra che esiste δ > 0 tale che

|t− t′| < δ =⇒ |K(t, s)−K(t′, s)| < ϵ2

Page 246: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

240 CAPITOLO 3. SPAZI DI HILBERT

e quindi, per |t− t′| < δ,

|(Kx)(t)− (Kx)(t′)| < ϵ .

Cio prova l’equicontinuita e quindi la compattezza.Consideriamo ora l’equazione integrale

x = µKx+ ϕ = µ∫ b

aK(t, x)x(s) ds+ ϕ(t) .

Nel caso in cui K sia autoaggiunto, ossia nel caso in cui

K(t, s) = K(s, t) ,

l’operatoreK si puo diagonalizzare rispetto ad un sistema ortonormale, mentrein generale si potra scrivere

Kx =+∞∑i=1

σi⟨x, vi⟩ωi .

Se accade che questa somma e finita, l’equazione integrale di Fredholm hanucleo degenere; altrimenti, l’equazione integrale diviene

x(t) =+∞∑i=1

σi

[∫ b

ax(s)vi(s) ds

]ωi(t) + ϕ(t) ,

forma che generalizza quella che abbiamo introdotto, per le equazioni connucleo degenere, al paragrafo 1.0.3.

3.8.5 Dimostrazioni posposte

Si provano ora i teoremi relativi agli operatori compatti. Per questo avremobisogno di introdurre alcune proprieta che valgono anche per operatori noncompatti. Per chiarezza, indicheremo con A un generico operatore lineare econ C uno che e anche compatto.

Conviene seguire un’ordine un po’ diverso da quello del paragrafo 3.8.1 espezzare le dimostrazioni in vari lemmi.

Avremo spesso bisogno di lavorare con successioni limitate o addiritturaconvergenti (vn) di elementi dell’immagine di λI − C,

vn = (λI − C)xn .

La successione (xn) in generale non sara ne convergente ne limitata. Pero:

Page 247: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 241

Lemma 316 Sia (vn) una successione limitata che appartiene ad im(λI−C),con C compatto e λ = 0:

vn = lim(λI − C)xn , λ = 0 . (3.63)

Esiste una successione (kn) limitata e tale che

vn = (λI − C)kn .

Dim. Se (xn) stessa e limitata, niente e da provare. Consideriamo il caso incui l’uguaglianza (3.63) vale, con (xn) successione illimitata.

Si rappresenti

X = ker(λI − C)⊕ [ker(λI − C)]⊥ , xn = hn + kn .

Ovviamente, (λI − C)xn = (λI − C)kn e quindi si puo sostituire xn con kn.Basta dunque provare che la successione (kn) e limitata.

Sia per assurdo la successione (kn) illimitata. In tal caso,

yn = limvn

||kn||= 0

perche (vn) e limitata.Usiamo l’ipotesi che l’operatore C e compatto, e la limitatezza di (kn/||kn||),

per estrarre dalla successione(C kn

||kn||

)una s.successione convergente. Cam-

biando nome agli indici, si puo supporre

limCkn

||kn||= w0 .

Essendo

(λI − C)kn

||kn||=

vn||kn||

−→ 0 , (3.64)

si ha anche

limλkn

||kn||= limC

kn||kn||

= w0 . (3.65)

Questo ha due conseguenze:

1. Poiche λ e non nullo e kn/||kn|| ha norma 1, segue che

||w0|| = |λ| = 0 ossia w0 = 0 . (3.66)

Page 248: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

242 CAPITOLO 3. SPAZI DI HILBERT

2. Essendo kn ∈ [ker(λI − C)]⊥, segue che

w0 ∈ [ker(λI − C)]⊥ . (3.67)

D’altra parte,

(λI − C)w0

λ= lim(λI − C)

kn||kn||

= limλkn

||kn||− limC

kn||kn||

= 0

per (3.64) e (3.65). Dunque,

w0 ∈ ker(λI − C) .

Questa e la (3.67) implicano w0 = 0, in contrasto con (3.66).La contraddizione trovata mostra che kn e limitata, come volevamo.

Osservazione 317 Si noti che l’ipotesi della compattezza di C si e esplicita-mente usata. L’asserto precedente non vale per generici operatori.

Usiamo questo lemma per provare:

Teorema 318 Se C e compatto e λ = 0 allora (λI −C) ha immagine chiusa.

Dim. Sia (vn) una successione in im (λI − C), convergente a v0. Dobbiamoprovare v0 ∈ im (λI − C) ossia che, per un opportuno x0, si ha

v0 = (λI − C)x0 .

Assumiamo quindi che valga (3.63). Come si e visto al Lemma 316, possiamoassumere che la successione (xn) sia limitata. In questo caso, passando ad unas.successione, si puo assumere limCxn = y, perche C e compatto. Si ha quindiche

xn =1

λ[vn + Cxn] , limxn =

1

λ[v0 + y] ,

ossia (xn) converge ad x0 = [v0 − y]/λ. D’altra parte C, essendo compatto, econtinuo. Dunque, da vn = (λI −C)xn, si ha v0 = (λI −C)x0. Cio prova chev0 ∈ im (λI − C), come volevamo.

Proviamo ora:

Page 249: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 243

Teorema 319 Se l’operatore C ∈ L(H,K) e compatto e se lo spazio di HilbertK ha dimensione infinita, allora 0 ∈ σ(C).

Dim. Supponiamo che 0 sia nel risolvente di C. In questo caso, C−1 e continuoe quindi

I = CC−1

e un operatore compatto. Dunque, la sfera x | ||x|| ≤ 1 e compatta. Cionon puo essere se lo spazio di Hilbert H ha dimensione infinita, si veda ilTeorema 56.

Proviamo ora un lemma che sara reso piu preciso in seguito11:

Lemma 320 Sia C compatto. Se λ ∈ σ(C) non e zero, allora λ ∈ σp(C) ∪σr(C).

Dim. Sia λ = 0, e sia λ /∈ σp(C). Si e visto che l’immagine di (λI − C), conλ = 0, e chiusa. Se questa e diversa da X allora λ ∈ σr(C). Se l’immaginee X allora, per il teorema di Banach, Teorema 101, (λI − C)−1 e continuo equindi λ ∈ ρ(C).

Osservazione 321 In particolare si e provato che lo spettro continuo di unoperatore compatto, se non e vuoto, contiene il solo elemento 0.

Notiamo che non abbiamo ancora provato che gli elementi non nulli di σ(C)sono autovalori. Possiamo pero provare:

Lemma 322 L’insieme degli autovalori dell’operatore compatto C, se non efinito, ha per unico punto di accumulazione il punto 0.

Dim. Ricordiamo che autovettori corrispondenti ad autovalori diversi sonolinearmente indipendenti. Questo risultato, noto dai corsi di algebra lineare,e provato per completezza nel Lemma 325.

Essendo C continuo, il suo spettro e un insieme limitato e quindi se C hainfiniti autovalori, si trova una successione (λk) di autovalori tra loro diversi,che converge a λ0. Supponiamo per assurdo che sia λ0 = 0. Indichiamo conxk un autovettore di λk di norma 1 e sia Xn = span x1 , . . . xn.

Lo spazio lineare Xn e trasformato in se dall’operatore C,

CXn ⊆ Xn

11la dimostrazione usa il Teorema di Banach, Teorema 101: se un operatore lineare econtinuo, invertibile e suriettivo, il suo inverso e continuo.

Page 250: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

244 CAPITOLO 3. SPAZI DI HILBERT

ed inoltre(λnI − C)Xn ⊆ Xn−1

perche (λnI − C)xn = 0.Grazie al Lemma 325, la dimensione diXn e esattamente n e quindiXn−1 ⊆

Xn, l’inclusione essendo stretta. Dunque in Xn puo trovarsi un vettore en dinorma 1, che dista 1 da Xn−1. Mostriamo che se λ0 = 0, la successione

(C enλn

)non ammette s.successioni convergenti. Cio contrasta con la compattezza diC e mostra che λ0 = 0. Per ottenere cio, basta provare che per ogni n, m vale∣∣∣∣∣∣∣∣C enλn − C

emλm

∣∣∣∣∣∣∣∣ > 1 .

Per fissare le idee, sia n > m e si scriva

Cenλn

− Cemλm

= en −Cemλm

+(I − C

λn

)en

.

I due vettori (I − C

λn

)en , C

emλm

appartengono a Xn−1 mentre en ∈ Xn. Dunque,∣∣∣∣∣∣∣∣C enλn − Cemλm

∣∣∣∣∣∣∣∣ ≥ dist(en, Xn−1) ≥ 1 .

Si trova quindi che la successione (en/λn) ha immagine priva di s.successioniconvergenti; e la successione (en/λn) e limitata se λn → λ0 = 0. Cio contrastacon la compattezza di C e mostra che deve essere λ0 = 0.

Vorremo provare cheσr(C)− 0 = ∅ .

Per ora pero proviamo:

Corollario 323 Sia C compatto. L’insieme σr(C) e finito oppure ha 0 comeunico punto di accumulazione.

Dim. Infatti, si sa dal teorema 267 che se λ ∈ σr(C) allora λ ∈ σp(C∗) e C∗

e compatto, si veda il Teorema 301; e quindi l’unico punto che puo essere diaccumulazione per σr(C) e il punto 0.

Per completare le dimostrazioni dei risultati relativi allo spettro di ope-ratori compatti, dobbiamo far intervenire le proiezioni spettrali introdotte alTeorema 191.

Page 251: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 245

Per i risultati gia provati, si puo trovare una successione di numeri positivi(rn), rn → 0, tali che

λ : |λ| = rn ⊆ ρ(C) .

Infatti, 0 e l’unico punto di accumulazione sia di σp(C) che di σr(C); e si e giavisto che σc(C) ⊆ 0.

Con un abuso di linguaggio comune nella teoria delle funzioni olomorfe,indichiamo con Γn la “curva” costituita dalle due circonferenze di centro 0 e diraggio rispettivamente rn, rn+1. Sia Ωn la corona circolare delimitata da Γn.Consideriamo l’operatore

Pn =1

2πi

∫Γn

(zI − C)−1 dz .

Ricordiamo, dal Teorema 191:

• I due s.spazio imPn ed im (I − Pn) sono complementari;

• L’insieme σn = σ(C) ∩ Ωn e lo spettro della restrizione di C ad imPn(che e un s.spazio invariante per C).

Proviamo ora:

Teorema 324 Sia C compatto. La proiezione Pn ha immagine di dimensio-ne finita e quindi ogni elemento non nullo di σ(C) e un autovettore il cuiautospazio generalizzato ha dimensione finita.

Dim. Notiamo che la funzione 1/z e olomorfa in Ωn e quindi

Pn =1

2πi

∫Γn

(zI − C)−1 dz =1

2πi

∫Γn

(zI − C)−1 − 1

z

dz

=1

2πi

∫Γn

(zI − C)−1C

zdz .

L’ultimo integrale si approssima nella topologia di L(X), mediante le sommedi Riemann

Pn =1

2πi

∑r

(zrI − C)−1 zr − zr−1

zr

C

(i punti zr sono quelli di una partizione del sostegno di Γn). Per il Teorema 300,ciascuno degli operatori Pn e compatto e quindi anche P lo e, si ricordi ilteorema 298.

Dunque, la palla di imPn e compatta e quindi, per il Teorema 191, imPnha dimensione finita.

Infine, per completezza, proviamo:

Page 252: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

246 CAPITOLO 3. SPAZI DI HILBERT

Lemma 325 Siano λ1,. . . , λk autovalori distinti di un operatore lineare A esia xk un autovettore di λk. Gli autovettori xk sono linearmente indipendenti.

Dim. Ricordiamo che gli autovettori, per definizione, sono non nulli. Dunque,in particolare x1 = 0 cosı che l’insieme x1 e linearmente indipendente e, se gliautovettori non sono linearmente indipendenti, esiste un primo n0 per cui

xn0+1 =n0∑i=1

αixi . (3.68)

Applicando l’operatore A ai due membri dell’uguaglianza si trova

λn0+1xn0+1 =n0∑i=1

αiλixi . (3.69)

Moltiplicando i due membri della (3.68) per λn0+1 e sottraendo la (3.69), si trova

n0∑i=1

[λn+1 − λi]αixi = 0 .

Cio mostra che xn0+1 non e il primo degli autovettori linearmente dipendente daiprecedenti. Cio contraddice la scelta di n0 e prova l’asserto.

Osservazione 326 Si noti che l’asserto precedente vale per ogni operatorelineare A, anche non compatto ed anche non continuo.

Il caso degli operatori compatti autoaggiunti

In questa parte useremo i lemmi 275 e 274, che ricapitoliamo:

• Sia A ∈ L(K) e sia X un s.spazio invariante per A: sia cioe AX ⊆ X.Allora, X⊥ e invariante per A∗.

• Sia A ∈ L(K) e sia X0 invariante per A: AX0 ⊆ X0. Sia X = clX0. Ils.spazio chiuso X e invariante per A.

Gli operatori compatti autoaggiunti godono della proprieta seguente:

Teorema 327 Sia C ∈ L(H) un operatore compatto e autoaggiunto. Almenouno dei due numeri ||C|| oppure −||C|| appartiene a σ(C).

Page 253: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 247

Proveremo in seguito questo teorema. Per ora illustriamone le conseguenze.Una prima conseguenza e che il raggio spettrale di un operatore compatto

autoaggiunto e uguale a ||C||. In generale invece il raggio spettrale di un gene-rico operatore lineare A e minore della sua norma: r(A) ≤ ||A|| . La disugua-glianza puo essere stretta, anche se l’operatore e compatto (non autoaggiunto)come prova l’esempio della trasformazione da IR2 in se rappresentata, rispettoalla base canonica, dalla matrice [

0 10 0

].

In questo caso lo spettro e 0 mentre la norma dell’operatore e 1.Notiamo ora che ||C|| = 0 se e solo se C = 0 e in questo caso σp(C) = 0,

ossia σp(C) = ∅. Se C = 0,

+||C|| , −||C|| ∩ σ(C) = +||C|| , −||C|| ∩ σp(C) .

Corollario 328 Se C ∈ L(H) e compatto autoaggiunto allora σp(C) = ∅. Seinoltre C = 0 allora C ha un autovalore non nullo.

Assumiamo quindi esplicitamente C = 0. Il corollario precedente mostrache esistono autovalori non nulli dell’operatore C. Indichiamo con X0 lo spaziolineare generato dagli autovettori di C relativi ad autovalori non nulli. Questoe un s.spazio di H invariante per C:

CX0 ⊆ X0 con X0 = span vk | Cvk = λkvk = 0 .

Sia X = clX0 cosı che X stesso e invariante per C.

Lemma 329 Siano X0 ed X gli spazi appena definiti. E’: X = clX0 =[kerC]⊥.

Dim. Sia per assurdo X = [kerC]⊥ e quindi X⊥ = kerC. Essendo X inva-riante per C, allora X⊥ e invariante per C∗ ed essendo C = C∗, X⊥ e anch’essoinvariante per C. La restrizione di C ad X⊥ e essa stessa un operatore autoag-giunto e quindi ammette un autovalore, per il Corollario 328 e se X⊥ = kerCallora la restrizione di C ad X⊥ e non nulla. Esiste quindi un autovalore di Cun cui autovettore appartiene ad X⊥. Cio contrasta con la definizione di Xche, per costruzione, contiene tutti gli autovettori di C relativi ad autovalorinon nulli. La contraddizione trovata prova il teorema.

Per costruzione, l’insieme degli autovettori (normalizzati) di C che corri-spondono ad autovalori non nulli generaX0 ed e quindi un sistema ortonormalemassimale in X. Mostriamo:

Page 254: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

248 CAPITOLO 3. SPAZI DI HILBERT

Teorema 330 Sia C compatto autoaggiunto. Si possono scegliere gli autovet-tori di C, di autovalore non nullo, in modo da avere un sistema ortonormalemassimale di X = [kerC]⊥.

Dim. Basta provare che gli autovettori si possono scegliere due a due ortogona-li. Si e gia visto al Teorema 270 che l’ortogonalita e automatica per autovettoriche corrispondono ad autovalori diversi. Sia ora λ0 = 0 un autovettore di mol-teplicita maggiore di 1 e sia N0 il relativo autospazio. Essendo C compatto,la dimensione di N0 e finita e quindi N0 ammette una base ortonormale diautovettori perche la restrizione di C ad N0 e un operatore autoaggiunto suuno spazio di dimensione finita.

Osservazione 331 Supponiamo che X = H, ossia che 0 ∈ σp(C). Sia F lafamiglia ortonormale degli autovettori costruita sopra, e sia F0 una famiglialinearmente indipendenti di autovettori tutti con autovalore 0. Si sa che F euna famiglia numerabile mentre F0 potrebbe anche essere non numerabile.

In conclusione, ogni h ∈ H puo rappresentarsi come

h = h0 ++∞∑i=1

⟨h, ei⟩ei

con

Cei = λiei , λi = 0 , Ch0 = 0 .

Dunque, per ogni h ∈ H si ha anche

Ch =+∞∑i=1

λi⟨h, ei⟩ei .

Questa e la forma diagonale cercata dell’operatore C.

Passiamo ora a provare il Teorema 327. La dimostrazione richiede di-versi passi. Proviamo prima di tutto due lemmi che valgono per operatoriautoaggiunti, anche non compatti.

Lemma 332 Siano x ed y in H e sia A ∈ L(H) un operatore autoaggiunto.Si ha:

4ℜe ⟨Ax, y⟩ = ⟨A(x+ y), (x+ y)⟩ − ⟨A(x− y), (x− y)⟩ .

Page 255: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 249

Dim. Usando A = A∗, calcoliamo:

⟨A(x+ y), (x+ y)⟩ = ⟨Ax, x⟩+ ⟨Ay, y⟩+ ⟨Ax, y⟩+ ⟨Ay, x⟩= ⟨Ax, x⟩+ ⟨Ay, y⟩+ ⟨Ax, y⟩+ ⟨y,Ax⟩= ⟨Ax, x⟩+ ⟨Ay, y⟩+ 2ℜe ⟨Ax, y⟩ . (3.70)

Analogamente si vede che

⟨A(x− y), (x− y)⟩ = ⟨Ax, x⟩+ ⟨Ay, y⟩ − 2ℜe ⟨Ax, y⟩ . (3.71)

L’asserto segue sottraendo la (3.71) da (3.70).

Proviamo ora:

Lemma 333 Sia A un operatore lineare continuo ed autoaggiunto. Vale:

||A|| = sup |⟨h,Ah⟩| , ||h|| = 1 .

Dim. Siaα = sup |⟨h,Ah⟩| , ||h|| = 1 .

Per ogni operatore lineare A vale α ≤ ||A||. Si deve provare che se A eautoaggiunto, allora la disuguaglianza non puo essere stretta; ossia, si deveprovare che se A e autoaggiunto, allora

||A|| ≤ α .

Ricordiamo, come conseguenza del Teorema di Riesz e del Teorema 117che

||A|| = sup ⟨Ah, k⟩ , ||h|| = 1 , ||k|| = 1 .D’altra parte, per il Lemma 332 e per l’identita del parallelogramma, essendo||h|| = 1, ||k|| = 1,

4ℜe ⟨Ah, k⟩ ≤ |⟨A(h+ k), (h+ k)⟩|+ |⟨A(h− k), (h− k)⟩|≤ α

||h+ k||2 + ||h− k||2

= 2α

||h||2 + ||k||2

= 4α

ossiaℜe ⟨Ah, k⟩ ≤ α .

In generale, ⟨Ah, k⟩ e un numero complesso,

⟨Ah, k⟩ = eiθ |⟨Ah, k⟩| .

Sostituendo h con z = e−iθh si trova

|⟨Ah, k⟩| ≤ α .

Questo calcolo puo venir ripetuto per ogni h, k di norma 1, come volevamoprovare.

Page 256: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

250 CAPITOLO 3. SPAZI DI HILBERT

Osservazione 334 Come si e detto, per ogni operatore lineare A vale

||A|| = sup⟨Ah, k⟩ . (3.72)

L’estremo superiore si calcola al variare di h e di k in modo indipendente nellapalla di raggio 1. Se A e autoaggiunto vale di piu:

||A|| = sup||h||=1

|⟨Ah, h⟩| .

Si noti la presenza del modulo in quest’ultima uguaglianza.E’ indifferente mettere o meno il modulo nella (3.72).

Torniamo ora a considerare un operatore compatto autoaggiunto C e pro-viamo il Teorema 327.

Come si e notato, si puo assumere C = 0.Sappiamo gia che lo spettro dell’operatore C e reale, perche C e autoag-

giunto; e quindiσ(C) ⊆ [−||C||, ||C|| ] .

Bisogna provare che uno almeno degli estremi di quest’intervallo appartieneallo spettro.

Si e provato nel Lemma 333 che

||C|| = sup |⟨h,Ch⟩| , ||h|| = 1 .

Esiste quindi una successione (hn), con ||hn|| = 1, tale che

lim⟨Chn, hn⟩ = α dove α = ||C|| oppure α = −||C||.

Si noti che α = 0 perche si suppone C = 0.Proviamo prima di tutto che

lim[Chn − αhn] = 0 . (3.73)

Calcoliamo per questo

||Chn − αhn||2 = ||Chn||2 − 2α⟨Chn, hn⟩+ α2 .

In questo calcolo si sono utilizzate le ipotesi che C e autoaggiunto, che α ereale e che ||hn|| = 1.

Si sa che lim⟨Chn, hn⟩ = α cosı che

lim[−2α⟨Chn, hn⟩+ α2

]= −α2 .

Page 257: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

3.8. OPERATORI COMPATTI 251

Consideriamo ora la successione (||Chn||2). Vale

||Chn||2 ≤ α2 .

Non supponiamo che la successione ||Chn||2 sia convergente. Pero la dimo-strazione precedente implica

0 ≤ lim sup ||Chn − αhn||2 = lim sup||Chn||2 − 2α⟨Chn, kn⟩+ α2

≤ 0 .

Cio prova (3.73).La dimostrazione del Teorema 327 si completa come segue: essendo C com-

patto ed (hn) limitata, esiste una s.successione (Chnr) di (Chn), convergentein norma,

limChnr = k . (3.74)

Usiamo ora il fatto che α = 0 e notiamo che

hnr =1

αChnr − [Chnr − αhnr ] .

Si e visto che il termine in parentesi quadra tende a zero, mentre (Chnr) tendea k. Dunque,

limhnr =1

αk e quindi limChnr = C

[1

αk].

Di conseguenza, da (3.74),

C[1

αk]= k ossia Ck = αk .

Cio prova che α e un’autovalore di C. Ricordando che α e ||C|| oppure −||C||,si vede che l’asserto e provato.

Page 258: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

252 CAPITOLO 3. SPAZI DI HILBERT

Page 259: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

Capitolo 4

Distribuzioni e Trasformata diFourier

In questo capitolo introduciamo i fatti essenziali della teoria delle “distribuzio-ni”. Lo spazio lineare delle distribuzioni e dotato di una topologia la qualenon proviene da una norma e quindi quest’argomento e sostanzialmente piucomplesso di quelli visti in precedenza. Non volendo entrare in queste com-plicazioni, ci limiteremo a definire la relazione di convergenza, invece dellatopologia.

Una classe particolare di distribuzioni e quello delle “distribuzioni tempe-rate”. E’ questo l’ambiente in cui e naturale definire la trasformata di Fourier.Le distribuzioni in generale vengono definite nel paragrafo 4.1 mentre le di-stribuzioni temperate e la trasformata di Fourier sono nel paragrafo 4.2. Idue paragrafi sono scritti in modo da poter essere letti indipendentemente,con l’eccezione del paragrafo 4.3.2, nel quale si mostra che ogni distribuzio-ne temperata e anche una distribuzione, nel senso della definizione data alparagrafo 4.1.

4.1 Le distribuzioni

Prima di introdurre le distribuzioni, conviene vedere un esempio che ne giu-stifica l’uso. Consideriamo l’equazione a derivate parziali

xt = xs , x = x(t, s) . (4.1)

Quest’equazione puo scriversi nella forma

(1,−1) · ∇x(t, s) = 0

253

Page 260: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

254 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

e ricordiamo che (1,−1) · ∇x(t, s) e la derivata di x(t, s) nella direzione dit+ s = 0. Consideriamo quindi una qualsiasi retta

t = −s+ k

e la restrizione di x(t, s) ad essa; ossia consideriamo la funzione x(−s + k, s).Da

d

dsx(−s+ k, s) = −xt(−s+ k, s) + xs(−s+ k, s) = 0

si vede che la funzione x(−s + k, s) e costante. Naturalmente, il valore dellacostante dipende dalla retta su cui stiamo lavorando, ossia dipende da k:

x(−s+ k, s) = ϕ(k) .

Essendo k = t+ s, la funzione x(t, s) ha forma

x(t, s) = ϕ(t+ s) (4.2)

per una “qualsiasi” funzione ϕ. Ovviamente pero per poter giustificare i calcoliprecedenti, dovremo richiedere che la ϕ sia almeno derivabile. Si capisce peroche la (4.2) si potra sostituire in (4.1) anche se ϕ non e ovunque derivabile,trovando che l’uguaglianza (4.1) vale “nei punti nei quali i calcoli hanno senso”.Pero, non e immediato capire quali proprieta piu deboli la ϕ debba avere pergiustificare i calcoli. Piu ancora, ogni funzione continua e limite di funzioni diclasse C1 e quindi si puo intendere la (4.2) come “soluzione in senso debole”di (4.1), indipendentemente dalla regolarita della ϕ e quindi senza preoccuparcidell’effettiva possibilita di sostituire la (4.2) nella (4.1).

Queste considerazioni, in quest’esempio semplicissimo, sono gia un po’ dif-ficili da formalizzare. Ovviamente non si potranno estendere a casi piu com-plessi. Mostriamo pero un altro modo per verificare che la funzione x(t, s) =ϕ(t+ s) e soluzione di (4.1). Moltiplichiamo ambedue i membri per una “fun-zione test” ψ(t, s) di classe C∞(IR2) e integriamo per parti. Per evitare lacomparsa di integrali impropri e dei termini sulla frontiera del dominio su cuisi integra, supponiamo che ψ(t, s) abbia supporto compatto, ossia che siazero per t ed s abbastanza grandi. Integrando per parti si trova ∫

IR2 xt(t, s)ψ(t, s) dt ds = −∫IR2 x(t, s)ψt(t, s) dt ds ,∫

IR2 xs(t, s)ψ(t, s) dt ds = −∫IR2 x(t, s)ψs(t, s) dt ds

e quindi l’uguaglianza

−∫IR2x(t, s)ψt(t, s) dt ds = −

∫IR2x(t, s)ψs(t, s) dt ds (4.3)

Page 261: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 255

e soddisfatta da tutte le soluzioni x(t, s) di (4.1) che sono di classe C1. Si notipero che la (4.3) non richiede nessuna regolarita alla x(t, s). Interpretiamoquindi la (4.3) come una “forma debole” di (4.1) e cio suggerisce di dire cheuna funzione g(t, s) che verifica

−∫IR2x(t, s)ψt(t, s) dt ds = −

∫IR2g(t, s)ψ(t, s) dt ds

e “derivata in senso debole” (rispetto a t) di x(t, s). Analogamente si definiscela derivata in senso debole rispetto ad s. Si confronti con l’analoga definizionegia incontrata nella definizione degli spazi di Sobolev.

La teoria delle distribuzioni nasce tentando di estendere le considerazioniprecedenti.

4.1.1 Lo spazio D(IRn) delle funzioni test

Si ricordi l’esempio di Cauchy di funzione di classe C∞ non sviluppabile inserie di Taylor:

ϕ(x) =

e−1/x2 x > 00 x ≤ 0 .

Sia ora

ϕ(x) =

e−1/(1−x2) −1 < x < 10 |x| ≥ 1 .

Questa e una funzione di classe C∞(IR) nulla per |x| ≥ 1. A partire da questafunzione si costruiscono facilmente funzioni di classe C∞ su IRn, nulle per||x|| ≥ R. Per esempio la funzione

ϕ(x1, x2, . . . , xn) =

e−1/(1−||x||2/R2) ||x||2 = x21 + · · · x2n < R2

0 ||x|| ≥ R2 .

Cio suggerisce:

Definitione 335 Sia ϕ definita su IRn. Si chiama supporto di ϕ l’insieme

suppϕ = cl x | ϕ(x) = 0 .

Una funzione definita su IRn, di classe C∞ ed a supporto compatto si chiamauna funzione test su IRn.

L’insieme delle funzioni test e ovviamente uno spazio lineare che si indicacol simbolo D(IRn). Nello spazio D(IRn) si definisce una topologia la cuidescrizione e piuttosto complessa. Limitiamoci a definire la convergenza disuccessioni:

Page 262: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

256 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Definitione 336 Sia (ϕn) una successione in D(IRn) e sia ϕ ∈ D(IRn). Dicia-mo che

limϕn = ϕ

se:

• Esiste un compatto K che contiene i supporti sia delle ϕn che di ϕ;

• vale ϕn(x) → ϕ(x) uniformemente su IRn ed inoltre anche ciascuna deri-vata parziale di ogni ordine di ϕn converge alla corrispondente derivatadi ϕ, uniformemente su IRn.

L’enunciato della seconda proprieta e alquanto involuto. Per semplificarlo,conviene introdurre una notazione per le derivate parziali. Introduciamo pri-ma di tutto la notazione di multiindice. Un multiindice α e una sequenzaordinata di n interi non negativi. Il numero n e uguale alla dimensione di IRn.Dunque,

α = (k1, k2, . . . , kn) , ki ≥ 0 .

La lunghezza di α e

|α| = k1 + k2 + · · ·+ kn .

Al multiindice α si associa l’operatore di derivata parizale

Dα =∂|α|

∂xk1

1 ∂xk22 · · · ∂xknn

.

Come al solito, la derivata di ordine zero lascia invariata la funzione. Peresempio, con n = 2 ed α = (0, 4), si trova

∂0+4

∂x01∂x42

ϕ(x1, x2) =∂4

∂x42ϕ(x1, x2) .

Con questa notazione, la seconda proprieta richiesta per la convergenza e

Dαϕn → Dαϕ

uniformemente su IRn, per ogni multiindice α.Lo spazio D(IRn) si intendera sempre dotato della relazione di convergenza

sopra descritta.

Osservazione 337 Sia α un multiindice. La relazione di convergenza inD(IRn) e stata definita in modo che Dα sia una trasformazione continua daD(IRn) in se.

Page 263: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 257

4.1.2 Le distribuzioni

Si chiama distribuzione un funzionale lineare e continuo su D(IRn); ossia,una distribuzione e un funzionale lineare χ su D(IRn) tale che

se ϕn → 0 in D(IRn) allora ⟨⟨χ, ϕn⟩⟩ → 0 .

Prima di mostrare le proprieta delle distribuzioni, vediamo alcuni esempi.

Esempio 338 Sia f(x) una funzione su IRn che e localmente integrabile, ossiatale che ∫

K|f(x)| dx < +∞

per ogni compatto K.Se ϕn → 0 in D(IRn) allora esiste un compatto K che contiene i supporti

di tutte le ϕn e quindi∫IRnf(x)ϕn(x) dx =

∫Kf(x)ϕn(x) dx .

Inoltre, ϕn → 0 uniformemente su K. Dunque si ha anche

lim∫IRnf(x)ϕn(x) dx = lim

∫Kf(x)ϕn(x) dx = 0 ;

ossia, la trasformazione

ϕ→ ⟨⟨Df , ϕ⟩⟩ =∫IRnf(x)ϕ(x) dx

e una distribuzione, che si chiama la distribuzione regolare identificatada f . Per evitare ambiguita, noi indicheremo sempre col simbolo Df la di-stribuzione regolare identificata da f ma e ovvio che in pratica questa verraindicata semplicemente col simbolo f .

Si noti che la condizione che i supporti delle ϕn siano contenuti in unostesso compatto K quando ϕn → 0 e essenziale nell’esempio precedente.

Esempio 339 Si indica con δ la distribuzione che a ϕ ∈ D(IRn) associa ϕ(0),

⟨⟨δ, ϕ⟩⟩ = ϕ(0) .

La continuita del funzionale ϕ → ϕ(0) si verifica facilmente. Questa distribu-zione si chiama la δ di Dirac (su IRn).

Page 264: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

258 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Esempio 340 Si fissi ξ ∈ IRn ed una direzione v in IRn e si consideri ilfunzionale che a ϕ ∈ D(IRn) associa

limϵ→0

ϕ(ξ + ϵv/2)− ϕ(ξ − ϵv/2)

ϵ= [∇ϕ(ξ)] · v

La continuita su D(IRn) del funzionale cosı costruito si verifica facilmente (siricordi l’osservazione 337) e quindi questo funzionale e una distribuzione, chesi chiama il dipolo in ξ di asse v.

Esempio 341 Sia f(x) una funzione definita su una superficie Σ, localmenteintegrabile su Σ. E’ una distribuzione la trasformazione

ϕ→∫Σf(x)ϕ(x) dΣ .

Questa distribuzione, pur essendo definita da un integrale, non e una distri-buzione regolare perche l’integrale non e esteso a IRn. In questo contesto, lafunzione f(x) si chiama densita superficiale (di massa, di carica, . . . ).

Questa distribuzione si chiama anche distribuzione di semplice stra-to su Σ.

Esempio 342 Sia f(x) una funzione definita su una superficie Σ, localmenteintegrabile su Σ. E’ una distribuzione la trasformazione

ϕ→∫Σf(x)

d

dnϕ(x) dΣ

dove d/ dn indica la derivata normale a Σ. Si interpretra questo numero comeottenuto da una distribuzione di dipoli su Σ, ciascuno di asse perpendicolarea Σ. Questa distribuzione si chiama distribuzione di doppio strato suΣ, di densita f(x).

4.1.3 Lo spazio (D(IRn))′

Col simbolo (D(IRn))′ si intende lo spazio lineare delle distribuzioni su IRn,dotato della relazione di convergenza seguente:

χn → χ quando per ogni ϕ si ha ⟨⟨χn, ϕ⟩⟩ → ⟨⟨χ, ϕ⟩⟩

(si confronti con la definizione di convergenza debole e debole stella).Si provi per esercizio che le due trasformazioni seguenti sono lineari e

continue da (D(IRn))′ in se:

χ→ χ0 + χ , χ→ αχ .

Page 265: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 259

Esempio 343 Sia (hn) un’identita approssimata. Per ogni ϕ ∈ D(IR) si ha

limn

∫ +∞

−∞hn(t− s)ϕ(s) ds = ϕ(t) ,

si veda il paragrafo 2.4. Cio vale in particolare per t = 0 e quindi

limn

∫ +∞

−∞hn(−s)ϕ(s) ds = ϕ(0) , ϕ ∈ D(IR) .

Dunque, la successione di distribuzioni regolari definite da

ϕ→∫ +∞

−∞hn(−s)ϕ(s) ds

converge in (D(IR))′ alla δ di Dirac. Si dice piu brevemente che “le identitaapprossimate approssimano la δ di Dirac”.

Nello spazio (D(IRn))′ possono definirsi altre operazioni. Tra queste:

• la traslazione. Sia h ∈ IRn fissato. La traslazione Th su D(IRn) edefinita da

[Thϕ](x) = ϕ(x− h) .

Si verifica facilmente che questa trasformazione e lineare e continua daD(IRn) in se. Si estende questa trasformazione alle distribuzioni ponendo

⟨⟨Thχ, ϕ⟩⟩ = ⟨⟨χ, T−hϕ⟩⟩ .

Si noti che se χ = Df , una distribuzione regolare, questa definizionecorrisponde alla formula di cambiamento di coordinate:∫

IRnf(x− h)ϕ(x) dx =

∫IRnf(x)ϕ(x+ h) dx.

• l’omotetia. Sia a un numero reale. L’omotetia Ra su D(IRn) e definitada

[Raϕ](x) = ϕ(ax)

e corrisponde a cambiare la scala del fattore a su ciascun asse coordinato.Si verifica facilmente che questa trasformazione e lineare e continua daD(IRn) in se. Quest’operazione si estende alle distribuzioni ponendo

⟨⟨Raχ, ϕ⟩⟩ =1

|a|n⟨⟨χ, [R1/aϕ]⟩⟩ .

Page 266: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

260 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Per capire la ragione di questa definizione, si esamini il comportamentosulle distribuzioni regolari:

⟨⟨RaTf , ϕ⟩⟩ =1

|a|n⟨⟨Tf , [R1/aϕ]⟩⟩ =

1

|a|n∫IRn

[f(x)ϕ(x/a)] dx

=∫IRnf(ax)ϕ(x) dx .

• il prodotto con una funzione. Sia g ∈ C∞(IRn) e sia χ unadistribuzione. Il prodotto gχ si definisce ponendo:

⟨⟨gχ, ϕ⟩⟩ = ⟨⟨χ, gϕ⟩⟩ .

Cio e lecito perche abbiamo richiesto che g sia di classe C∞.

• la derivata. La formula di integrazione per parti,∫IRnfxi(x)ϕ(x)dx = −

∫IRnf(x)ϕxi(x)dx

suggerisce di definire

⟨⟨Dχ, ϕ⟩⟩ = −⟨⟨χ,Dϕ⟩⟩ .

Si vede facilmente che la trasformazione cosı definita elineare e continua da (D(IRn))′ in se. Questa trasformazionesi chiama la i-ma derivata parziale della distribuzione χ.

E’ facile provare:

Teorema 344 Ciascuna delle trasformazioni appena introdotte opera da (D(IRn))′

in se ed e continua.

Osservazione 345 Sia t → χ(t) una funzione da IR in (D(IRn))′. Si puodefinire la derivata di questa funzione rispetto al parametro t nel punto t0ponendo

limh→0

χ(t0 + h)− χ(t0)

h,

il limite essendo inteso nel senso di (D(IRn))′. Questo limite, se esiste, siindichera col simbolo χ′(t0) oppure col simbolo ( dχ(t0)/ dt, da non confonderecon Dχ(t0), derivata della distribuzione χ(t0):

dχ(t0)

dt= χ′(t0) = lim

h→0

χ(t0 + h)− χ(t0)

h.

Page 267: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 261

In particolare, mentre Dχ(t0) esiste sempre, χ′(t0) puo esistere o meno e,se esiste, non ha relazione con Dχ(t0). C’e pero un caso in cui la relazioneesiste, ed e il caso particolare in cui

χ(t) = T−tχ .

In tal caso,

dχ(t0)

dt= lim

h→0⟨⟨T−[t0+h]χ− T−t0χ

h, ϕ⟩⟩ = lim

h→0⟨⟨χ, Tt0+hϕ− Tt0ϕ

h⟩⟩

= limh→0

⟨⟨χ, ϕ(t− (t0 + h))− ϕ(t− t0)

h⟩⟩ = −⟨⟨χ, Tt0ϕ′⟩⟩

= −⟨⟨T−t0χ, ϕ′⟩⟩ = ⟨⟨DT−t0χ, ϕ⟩⟩ .

Scegliendo t0 = 0 si trova

Dχ =dχ(t0)

dt= lim

h→0

T−hχ− χ

h,

eguaglianza che estende alle distribuzioni l’usuale definizione di derivata comelimite del rapporto incrementale.

Sottolineiamo che la derivata di una distribuzione e ancora una distribuzio-ne e quindi e ulteriormente derivabile. Ossia, le distribuzioni hanno derivatedi ogni ordine. Le funzioni localmente integrabili identificano distribuzioni re-golari. La derivata della distribuzione Df si chiama la derivata di f nelsenso delle distribuzioni. Dunque, ogni funzione localmente integrabile ederivabile nel senso delle distribuzioni. Pero, la derivata di Df non e general-mente una distribuzione regolare. E’ pero facile verificare che se f ∈ Ck(IRn)e se α e un multiindice con |α| ≤ k, si ha

DαTf = TDαf .

Le relazioni tra la derivata in senso ordinario e nel senso delle distribuzionisono nell’esempio seguente. Per semplicita consideriamo il caso delle funzionisu IR ma ovviamente l’esempio si estende al caso delle derivate parziali.

Esempio 346 Sia f(x) una funzione di classe C1(IR). Sia Df la distribuzioneregolare corrsipondente ad f . La distribuzione Df , come tutte le distribuzioni,e derivabile e, dalla definizione di derivata e di distribuzione regolare,

⟨⟨DDf , ϕ⟩⟩ = −⟨⟨Df , Dϕ⟩⟩ =∫ +∞

−∞f(x)ϕ′(x) dx

= −∫ +∞

−∞f ′(x)ϕ′(x) dx = ⟨⟨Df ′ , ϕ⟩⟩ .

Page 268: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

262 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Ossia,

DDf = Df ′ . (4.4)

Calcoliamo ora la derivata di alcune distribuzioni regolari che non corri-spondono a funzioni derivabili.

Esempio 347 Sia n = 1 e sia h(x) la funzione di Heaviside

h(x) =

0 se x < 01 se x > 0 .

Questa funzione non e continua e quindi non e derivabile. E’ pero localmenteintegrabile e quindi e derivabile nel senso delle distribuzioni; ossia e derivabilela distribuzione regolare Dh. Per definizione si ha

⟨⟨DDh, ϕ⟩⟩ = −⟨⟨Dh, Dϕ⟩⟩ = −∫ +∞

0ϕ′(x) dx = ϕ(0) .

Dunque,

DDh = δ

non e una distribuzione regolare.Iterando questo procedimento si vede che

Dn(Dh) = (−1)n−1ϕ(n−1)(0) .

E, ovviamente, anche δ e derivabile, con

⟨⟨Dnδ, ϕ⟩⟩ = −ϕ(n)(0) .

Esempio 348 Sia ancora n = 1 e consideriamo la funzione f(x) = log |x|.Questa funzione e localmente integrabile, e quindi ammette derivata nel sensodelle distribuzioni. Pero la sua derivata non potra essere identificata da 1/xche, non essendo localmente integrabile, non definisce una distribuzione. Percalcolare la derivata di χ = Df , rifacciamoci direttamente alla definizione. E’:

⟨⟨Dχ, ϕ⟩⟩ = −⟨⟨χ, ϕ′⟩⟩

= − lima→0, b→0+

∫ a

−∞ϕ′(x) log |x| dx+

∫ +∞

bϕ′(x) log x dx

= − lim

a→0, b→0+

ϕ(a) log |a| −

∫ a

−∞ϕ(x)

1

xdx− ϕ(b) log b−

∫ +∞

bϕ(x)

1

xdx.

Page 269: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 263

Quest’ultima espressione e la derivata di χ nel senso delle distribuzioni. Dun-que, l’espressione della derivata distribuzionale di log |x| fa intervenire la fun-zione 1/x, ma non e da essa rappresentata.

Per vedere un altro esempio, consideriamo invece la funzione

f(x) =

log x se x > 00 se x < 0 .

Indicando ancora con χ la distribuzione regolare Df , si trova:

⟨⟨Df, ϕ⟩⟩ = −⟨⟨χ, ϕ′⟩⟩

= − lima→0+

∫ +∞

aϕ′(x) log x dx

= − lima→0+

−ϕ(a) log a−

∫ +∞

aϕ(x)

1

xdx.

Studiamo ora le derivazione per serie. Lavoriamo ancora con funzioni diuna variabile.

Esempio 349 Sia∑+∞n=0 χn una serie di distribuzioni. Supponiamo che la serie

converga nel senso di (D(IR))′, ossia supponiamo che esista il limite

χ = limN

N∑n=0

χn .

Si e visto che l’operazione di derivazione, da (D(IR))′ in se e lineare e continua.Dunque essa si scambia sia con le somme finite che col segno di limite; ossiasi scambia col segno di serie:

D+∞∑n=0

χn =+∞∑n=0

Dχn .

Siano in particolare le χn distribuzioni regolari, χn = Dfn . Supponiamoche ciascuna funzione fn sia di classe C1 e supponiamo che la serie

+∞∑n=0

fn(x)

converga uniformemente su IR. Si vede facilmente che cio implica la conver-genza in (D(IR))′ della serie delle distribuzioni regolari Dfn e quindi

D+∞∑n=0

Dfn =+∞∑n=0

DDfn =+∞∑n=0

Df ′n .

Quest’uguaglianza si scrive piu comunemente nella forma

D+∞∑n=0

fn =+∞∑n=0

f ′n . (4.5)

Page 270: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

264 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Prodotto diretto di distribuzioni

Suddividiamo le componenti di x ∈ IRn in due parti, rappresentando

x =

[yz

], y ∈ IRk , z ∈ IRn−k .

Allora, per ogni fissato z, la funzione y → ϕ(y, z) appartiene a D(IRk) e quindiper ogni z risulta definita la funzione

z → ⟨⟨χ, ϕ(·, z)⟩⟩ = ψ(z) .

In quest’espressione, χ ∈ (D(IRk))′. Questa funzione ha supporto compatto,perche la ϕ ha supporto compatto, ed inoltre e di classe C∞. Limitiamoci aconsiderare il caso in cui z ha dimensione 1 e facciamo vedere che ψ(z) e diclasse C1, con

d

dzψ(z) = ⟨⟨χ, ϕz(·, z)⟩⟩ .

Cio fatto, e ovvio che il medesimo argomento si possa ripetere per le derivatesuccessive, e che si possa facilmente adattare al caso in cui z ∈ IRn−k conn− k > 1.

Osserviamo che, per ogni z fissato,

ϕ(·, z + h)− ϕ(·, z)h

−→ ϕz(·, z) (4.6)

nel senso di D(IRk). Infatti, i rapporti incrementali hanno supporto in unmedesimo insieme compatto e inoltre∣∣∣∣∣ϕ(·, z + h)− ϕ(·, z)

h− ϕz(·, z)

∣∣∣∣∣ ≤ h

[max(y,z)

||∇ϕ(y, z)||].

Cio prova la convergenza in (4.6), uniforme su IRk. In modo analogo si provala convergenza di tutte le derivate successive. Di conseguenza,

d

dz⟨⟨χ, ϕ(·, z)⟩⟩ = lim

h→0⟨⟨χ, ϕ(·, z + h)− ϕ(·, z)

h⟩⟩ = ⟨⟨χ, ϕz(·, z)⟩⟩ . (4.7)

In particolare, la funzione z → ⟨⟨χ, ϕ(·, z)⟩⟩, che ha supporto compatto, econtinuamente derivabile.

Notando che anche la funzione ϕz(y, z) e una funzione test, l’argomentoprecedente puo iterarsi e si conclude che la funzione z → ⟨⟨χ, ϕ(·, z)⟩⟩ e una

Page 271: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 265

funzione test. Dunque, ad essa puo applicarsi una ξ ∈ (D(IRn−k))′, ossia sipuo considerare il funzionale

ϕ→ ⟨⟨ξ , ⟨⟨χ, ϕ⟩⟩ ⟩⟩

Mostreremo che questa funzione dipende con continuita da ϕ ∈ D(IRn). Sie cosı costruita una distribuzione di D(IRn) a partire da una di IRk e di unadi IRn−k. Questa distribuzione si chiama il prodotto diretto delle duedistribuzioni χ e ξ e si indica col simbolo χξ. E’ facile vedere che

χξ = ξχ .

Per completare questo argomento, dobbiamo provare la continuita di ϕ→⟨⟨ξ , ⟨⟨χ, ϕ⟩⟩ ⟩⟩ e per questo basta notare la continuita della trasformazione

ϕ −→ ⟨⟨χ, ϕ⟩⟩ , D(IRn) −→ D(IRn−k) .

Sia per questo ϕn → 0 in D(IRn) e proviamo che ⟨⟨χ, ϕ⟩⟩ → 0 in D(IRn−k). Ilfatto che le ψn = ⟨⟨χ, ϕ⟩⟩ abbiano supporto in un medesimo compatto e ovvio.Proviamo che ψn → 0 uniformemente. La convergenza delle derivate delle ψnsi potra poi provare in modo analogo, grazie alla (4.7).

La convergenza puntuale a zero e ovvia perche (ϕ(·, z)) tende a zero inD(IRk). Per assurdo, la convergenza non sia uniforme. Allora, esiste ϵ0 > 0 edesiste una successione (zk) tale che

|ψn(zk)| > ϵ0 .

La (zk) prende valore in un compatto e quindi, passando ad una sottosucces-sione, si puo assumere zk → z0.

Dato che ϕk → 0 nel senso di D(IRn), si ha

ϕk(·, z0) → 0 , ϕk(·, z0)− ϕk(·, zk) → 0 in D(IRk) .

Scrivendo

⟨⟨χ, ϕk(·, z0⟩⟩ = ⟨⟨χ, ϕk(·, z0)− ϕk(·, zk)⟩⟩+ ⟨⟨χ, ϕk(·, zk)⟩⟩

si vede che⟨⟨χ, ϕk(·, z0)⟩⟩ >

ϵ02

in contrasto col fatto che, invece, ⟨⟨χ, ϕk(·, z0)⟩⟩ → 0 dato che, come abbiamonotato, ϕk(·, z0) tende a zero in D(IRk).

Page 272: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

266 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Esempio 350 Sia n = 2 e sia

x =

[yz

].

Siano δ(y) e δ(z) la delta di Dirac di IR. La δ di Dirac non e una funzione equindi la notazione δ(y) non indica il “valore in y”. Questa notazione si usaper dire che δ(y) agisce sulla variabile y. Ossia che:

⟨⟨δ(y), ϕ(y, z)⟩⟩ = ϕ(0, z) .

Analogo significato per δ(z). Sia invece δ(x) = δ(y, z) la delta di Dirac su IR2.Mostriamo che

δ(y, z) = δ(x)δ(z) .

Questo si vede facilmente notando che

ψ(z) = ⟨⟨δ(y), ϕ(y, z)⟩⟩ = ϕ(0, z)

e quindi⟨⟨δ(z), ψ(z)⟩⟩ = ϕ(0, 0) = ⟨⟨δ(x), ϕ⟩⟩ .

Ci aspetteremmo ora di definire la convoluzione di distribuzioni. Pero laconvoluzione non si puo definire per ogni coppia di distribuzioni: questa si puodefinire solo se le distribuzioni hanno proprieta particolari. La convoluzionedi distribuzioni e le sue proprieta verranno introdotte al paragrafo 4.3.6.

4.1.4 Il supporto di una distribuzione

Una distribuzione non e una funzione nel senso ordinario e quindi non ha sensoparlare del valore che essa assume in un punto. E’ pero possibile dire quandoessa e nulla su un aperto Ω: diciamo che una distribuzione χ e nulla sull’apertoΩ quando

⟨⟨χ, ϕ⟩⟩ = 0

per ogni ϕ il cui supporto e contenuto in Ω. Si chiama supporto di χ ilcomplementare dell’unione degli aperti Ω su cui χ e nulla.

Diremo che due distribuzioni χ′ e χ′′ sono uguali su un aperto Ω quandoχ′ − χ′′ e nulla su Ω.

Esempio 351 Sia χ una distribuzione a supporto in una palla ||x|| < R di IRn

e sia v ∈ IRn un vettore fissato. Consideriamo le traslazioni Tnv e mostriamoche

lim Tnvχ = 0 .

Page 273: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.1. LE DISTRIBUZIONI 267

Ricordando la definizione di limite in (D(IRn))′, dobbiamo far vedere che

lim⟨⟨Tnvχ, ϕ⟩⟩ = lim⟨⟨χ, T−nvϕ⟩⟩ = 0 .

Questo e ovvio perche per ogni valore di n abbastanza grande, il supporto diT−nvϕ non interseca la palla ||x|| < R e quindi, per ogni valore di n abbastanzagrande,

⟨⟨χ, T−nvϕ⟩⟩ = 0 .

Supponiamo ora che una funzione f(x) sia localmente integrabile su IRe che essa sia derivabile (come funzione) su un aperto Ω con derivata che elocalmente integrabile su Ω; ossia con derivata f ′(x) che e integrabile su ognicompatto contenuto in Ω.

Sia invece χ la derivata della distribuzione Df . Mostriamo che su Ω valeχ = Df ′ . Infatti, se ϕ ha supporto in Ω, si ha

⟨⟨χ, ϕ⟩⟩ = −⟨⟨Df , ϕ′⟩⟩ = −

∫IRf(x)ϕ′(x) dx

per definizione di derivata nel senso delle distribuzioni e per la definizione diDf .

D’altra parte,

⟨⟨Df ′ , ϕ⟩⟩ =∫IRf ′(x)ϕ(x) dx =

∫Ωf ′(x)ϕ(x) dx = −

∫Ωf(x)ϕ′(x) dx = ⟨⟨χ, ϕ⟩⟩ ,

perche il supporto di ϕ e un compatto contenuto in Ω.Quest’osservazione si generalizza facilmente a funzioni e distribuzioni su

IRn. Anzi, si prova facilmente:

Teorema 352 Siano χ1 e χ2 due distribuzioni e sia K un aperto che contieneil supporto di χ1 − χ2. Allora, K contiene anche il supporto di χ′

1 − χ′2.

Ossia, se due distribuzioni operano nello stesso modo su tutte le funzionitest che hanno supporto in un aperto Ω, nello stesso modo operano anche leloro derivate.

Esempio 353 All’esempio 348 abbiamo calcolato la derivata di log |x|. Con-sideriamo ora la funzione log

√x2 + y2 su IR2. Si vede facilmente che questa

funzione e localmente integrabile (si passi a coordinate polari) e quindi cheidentifica una distribuzione regolare. Vogliamo calcolarne il laplaciano.

Un calcolo diretto mostra che per (x, y) = 0 si ha

∆ log√x2 + y2 = 0 .

Page 274: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

268 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Dunque, per quanto detto sopra, il laplaciano della funzione log√x2 + y2 cal-

colata nel senso delle distribuzioni e nullo in ogni aperto che non contienel’origine; ossia, il supporto del laplaciano di log

√x2 + y2 e l’origine. Calco-

liamolo ora usando direttamente la definizione. Sia ϕ(x, y) una funzione test.Iterando la definizione delle derivate, si vede che

⟨⟨∆χ, ϕ⟩⟩ = ⟨⟨χ,∆ϕ⟩⟩

e quindi, se χ e la distribuzione regolare che corrisponde a log√x2 + y2, va

calcolato∫IR2

[log

√x2 + y2

][∆ϕ(x, y)] dx dy = lim

ϵ→0

∫IR2−Bϵ

[log

√x2 + y2

][∆ϕ(x, y)] dx dy .

Qui, Bϵ e una palla di raggio ϵ intorno all’origine.Indicando con Cϵ la frontiera di Bϵ e integrando per parti si trova∫

IR2−Bϵ

[log

√x2 + y2

][∆ϕ(x, y)] dx dy

=∫Cϵ

∂νϕ(x, y) log ϵ ds−

∫Cϵ

ϕ(x, y)∂

∂νlog

√x2 + y2 ds . (4.8)

In questo calcolo si e usato il fatto che ∆ log√x2 + y2 = 0 per x2 + y2 > ϵ2 e

il fatto che ϕ(x, y) ha supporto compatto.La derivata ∂

∂νe la derivata “esterna” alla circonferenza Cϵ e quindi

∂νf = (∇f) ·

[− cos θ− sin θ

].

Si noti infatti che [− cos θ− sin θ

]e il versone normale alla circonferenza, orientato verso l’origine, e quindi“esterno” rispetto alla regione IR2 −Bϵ.

Dunque,∫Cϵ

∂νϕ(x, y) log ϵ ds

= −2∫ 2π

0ϕx(ϵ cos θ, ϵ sin θ) cos θ + ϕy(ϵ cos θ, ϵ sin θ) sin θ[ϵ log ϵ] dθ → 0

per ϵ→ 0. Notiamo ora che

∇ log√x2 + y2 =

1

x2 + y2

[x y

].

Page 275: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 269

Si ha quindi

−∫Cϵ

ϕ(x, y)∂

∂νlog

√x2 + y2 ds =

−∫ 2π

0ϕ(ϵ cos θ, ϵ sin θ)

1

ϵ2

[ϵ cos θ ϵ sin θ

] [ − cos θ− sin θ

]ϵ dθ

=∫ 2π

0ϕ(ϵ cos θ, ϵ sin θ) dθ → 2πϕ(0, ) .

Passando al limite per ϵ→ 0+ in (4.8), si trova quindi

∆ log√x2 + y2 = 2πδ .

4.2 La trasformata di Fourier di funzioni

Sia f(x) una funzione definita su IR, a valori reali o complessi. La suatrasformata di Fourier e la funzione della variabile reale ω

f(ω) =∫ +∞

−∞e−iωtf(t) dt . (4.9)

Noi ci limiteremo a studiare la trasformata di Fourier di funzioni definitesu IR; e pero importante sapere che se f(x) e definita su IRn allora la suatrasformata di Fourier e

f(ξ) =∫IRne−iξ·xf(x) dx , ξ ∈ IRn

(in questa formula, ξ · x indica il prodotto scalare di ξ e di x).Talvolta indicheremo la trasformata di Fourier di f col simbolo F(f).Si noti che f denota sia la trasformata di Fourier che la trasformata di

Laplace di f . Il contesto chiarisce il significato del simbolo; si noti pero che sef(x) = 0 per x < 0 e se la sua trasformata di Laplace esiste per ℜe λ > −ϵ,ϵ > 0, allora vale

L(f)(iω) =∫ +∞

0e−iωtf(t) dt =

∫ +∞

−∞e−iωtf(t) dt = F(f)(ω) .

Pero, in generale, la trasformata di Fourier non ammette estensione alpiano complesso.

Prima di studiare la trasformata di Fourier, e necessario dire per qualeclasse di funzioni essa e definita. E’ immediato notare che la definizione di

Page 276: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

270 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

trasformata di Fourier ha senso se f e integrabile (nel senso di Lebesgue) suIR e anzi per ogni ω vale

|f(ω)| ≤ ||f ||L1(IR) .

Dunque, la trasformazionef → f(ω)

e continua da L1(IR) in IC , per ogni ω fissato. Vale anche di piu:

Teorema 354 Sia (fn) una successione in L1(IR), convergente a f0 nellanorma di L1(IR). Allora,

lim fn(ω) = f0(ω) ,

uniformemente su IR.

L’immediata dimostrazione si omette.In realta lo spazio L1(IR) e troppo piccolo per la maggior parte delle appli-

cazioni nelle quali la trasformata di Fourier interviene. Pero, come primo pas-so, limitiamoci a studiare le proprieta della trasformata di Fourier di funzioniintegrabili.

Vale:

Teorema 355 Se f ∈ L1(IR) allora la sua trasformata di Fourier e uniforme-mente continua su IR.

Dim. E’:

f(ω)− f(ω′) =∫ +∞

−∞[eiω − eiω

′]f(t) dt .

Si impone prima di tutto la condizione |ω − ω′| < 1. Si fissa quindi ϵ > 0e Tϵ tale che ∫

|t|>Tϵ|f(t)| dt < ϵ/4 .

Allora,

|f(ω)− f(ω′)| =∣∣∣∣∣∫ −Tϵ

−∞[eiωt − eiω

′t]f(t) dt

∣∣∣∣∣+

∣∣∣∣∣∫ Tϵ

−Tϵ[eiωt − eiω

′t]f(t) dt

∣∣∣∣∣+∣∣∣∣∫ +∞

−Tϵ[eiωt − eiω

′t]f(t) dt∣∣∣∣

≤ ϵ

2+∫ Tϵ

−Tϵ|e−iωt − e−iω

′t| |f(t)| dt

≤ ϵ

2+ max

t∈[−Tϵ,Tϵ]|e−iωt − e−iω

′t|∫ +∞

−∞|f(t)| dt .

Page 277: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 271

La funzione s→ es e uniformemente continua sui compatti e quindi esisteσ = σϵ > 0 tale che se

|ωt− ω′t| ≤ |ω − ω′|Tϵ < σϵ , ossia se |ω − ω′| < σϵ/Tϵ ,

allora|eiωt − eiω

′t| < ϵ

[2∫+∞−∞ |f(t)| dt]

.

Dunque, per |ω − ω′| < σϵ/Tϵ vale

|f(ω)− f(ω′)| < ϵ .

4.2.1 Le proprieta della trasformata di Fourier

La trasformata di Fourier e ovviamente lineare,

F(αf + βg) = αf + βg

e inoltre valgono le proprieta seguenti, di immediata dimostrazione:

se g(t) = f(t− h) allora g(ω) = e−iωhf(ω) ,

se a = 0 e g(t) = f(at) allora g(ω) =1

|a|f(ω

a

),

Si confrontino con le corrispondenti proprieta della trasformata di Laplace.Ricordiamo ora1 che se f e g sono integrabili su IR allora la convoluzione

h(t) = (f ∗ g)(t) =∫ +∞

−∞f(t− s)g(s) ds

esiste in L1(IR) (non e detto che debba esistere puntualmente). Vale inoltre

||h||L1(IR) ≤ ||f ||L1(IR)||g||L1(IR) .

Dunque, h esiste e, per il teorema di Fubini2,

h(ω) =∫ +∞

−∞e−iωt

∫ +∞

−∞f(t− s)g(s) ds dt =

∫ +∞

−∞

∫ +∞

−∞e−iωtf(t− s) dt g(s) ds

=∫ +∞

−∞

∫ +∞

−∞e−iω(s+r)f(r) dr g(s) ds = f(ω)g(ω) .

1dalla teoria dell’integrazione secondo Lebesgue.2relativo allo scambio di ordine di integrazione dell’integrale di Lebesgue.

Page 278: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

272 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Osservazione 356 La formula precedente e importantissima per le applica-zioni. Si osservi che la sua dimostrazione dipende dal fatto che la misura diLebesgue e invariante per traslazioni e dal fatto che t→ et e un omomorfismodel gruppo additivo IR nel gruppo moltiplicativo dei reali positivi.

L’operazione di convoluzione ha le seguenti proprieta;

• f ∗ (g + h) = f ∗ g + f ∗ h;

• f ∗ g = g ∗ f .

Per questo si parla anche di “prodotto di convoluzione”. Pero si tratta di unprodotto privo di elemento neutro perche non esiste una funzione g tale chef ∗ g = f per ogni f .

4.2.2 Il teorema di Riemann-Lebesgue

Vogliamo ora studiarelim

|ω|→+∞f(ω)

quando f e integrabile. Consideriamo prima di tutto gli operatori di traslazionesu L1(IR). Se τ e fissato, con Tτ indichiamo l’operatore da L1(IR) in se definitoda

(Tτf)(t) = f(t− τ)

Ovviamente:

Teorema 357 Sia τ fissato. L’operatore Tτ da L1(IR) in se e lineare e conti-nuo.

Studiando invece la dipendenza di Tτ da τ si trova che vale il teoremaseguente, di difficile dimostrazione:

Teorema 358 (di Lebesgue) Si fissi f ∈ L1(IR) e si consideri la funzioneτ → Tτf da IR in L1(IR). Questa funzione e continua.

Usando il teorema 358 si prova:

Teorema 359 (di Riemann-Lebesgue) Sia f ∈ L1(IR). Vale:

lim|ω|→+∞

f(ω) = 0 .

Page 279: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 273

Figura 4.1:

−2 −1.5 −1 −0.5 0 0.5 1 1.5 20

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

f(t)=e(−5t2)

f(t)=e−5(t+.2)2

f(t)=e−5(t−.2)2

Dim. Per definizione,

f(ω) =∫ +∞

−∞e−iωtf(t) dt . (4.10)

Si faccia la sostituzione t = τ + πωe si noti che

e−iω(τ+π/ω) = e−iωτe−iπ = −e−iωτ .

Si trova:

f(ω) = −∫ +∞

−∞f(τ + π/ω)e−iωτ dτ . (4.11)

Sommando (4.11) e (4.10) si trova

f(ω) =1

2

∫ +∞

−∞[f(τ)− f(τ + π/ω)]e−iωτ dτ

cosı che

|f(ω)| ≤ 1

2

∫ +∞

−∞|f(τ)− f(τ + π/ω)| dτ .

Essendo f ∈ L1(IR), il membro destro tende a zero per |ω| → +∞, dalteorema 358.

Osserviamo ora:

Page 280: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

274 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Teorema 360 Sia f una funzione derivabile su IR e siano integrabili sia fche la sua derivata f ′. Allora vale:

(Ff ′) (ω) = iωf(ω) .

Dim. L’uguaglianza

f(T ) = f(0) +∫ T

0f ′(s) ds

e l’integrabilita di f e di f ′ mostrano

lim|T |→+∞

f(T ) = 0 .

Scriviamo ora∫ +T

−Te−iωtf ′(t) dt = e−iωTf(T )− eiωTf(−T ) + iω

∫ +T

−Te−iωtf(t) dt .

L’asserto segue passando al limite per |T | → +∞.

Nelle ipotesi del teorema 360, applicando il teorema di Riemann–Lebesguead f ′, si trova

lim|ω|→+∞

ωf(ω) = 0

e in generale se esistono e sono integrabili f , f ′, . . . f (k), allora

lim|ω|→+∞

ωkf(ω) = 0 : (4.12)

la regolarita di f si riflette sul comportamento asintotico di f . D’altra parte:

Teorema 361 Se f(t) e tf(t) sono ambedue integrabili, allora f(ω) e deriva-bile, con derivata

d

dωf(ω) =

∫ +∞

−∞e−iωt[−itf(t)] dt .

Dim. L’integrabilita di tf(t) permette di giustificare lo scambio della derivatarispetto ad ω con l’integrale.

Analogamente si vede che se f e continua e tkf(t) e integrabile allora f(ω)e k volte derivabile. Dunque, il comportamento asintotico di f(t) si riflettesulla regolarita di f(ω).

E’ importante ricordare queste proprieta, che sono la chiave per l’estensionedella definizione della trasformata di Fourier.

Page 281: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 275

4.2.3 L’antitrasformata di Fourier

Vogliamo ora capire sotto quali condizioni la conoscenza di f permette diricostruire f . Consideriamo prima di tutto il caso particolare

h(t) = e−|t| .

In questo caso, h si calcola facilmente usando la definizione della trasformatadi Fourier,

h(ω) =2

1 + ω2

e quindi h e integrabile.Sia t > 0. Usando il metodo dei residui3 si vede facilmente che∫ +∞

−∞eiωt

2

1 + ω2dω = 2πiRes

[eizt

2

1 + z2, i]= 2πe−t .

In modo analogo, se t < 0 si ha∫ +∞

−∞eiωt

2

1 + ω2dω = 2πiRes

[eizt

2

1 + z2,−i

]= 2πet .

Dunque, in quest’esempio particolare, nota h, la funzione h si ritrova calco-lando

1

∫ +∞

−∞eiωth(ω) dω .

Questa relazione tra h ed h vale molto piu in generale; ma non puo valere perla generica funzione integrabile perche generalmente la sua trasformata non eintegrabile.

Esempio 362 La funzione caratteristica dell’intervallo [−T, T ],

χ[−T,T ](t) =

1 se t ∈ [−T, T ]0 altrimenti

e integrabile. La sua trasformata di Fourier si calcola immediatamente ed e

f(ω) = 2sinωT

ω.

Questa funzione non e integrabile secondo Lebesgue, perche si sa che non eassolutamente integrabile.

3concernente le funzioni analitiche.

Page 282: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

276 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Limitiamoci dunque a provare un teorema, sotto ipotesi assai piu restrittivedel necessario, ma sufficiente per il seguito.

Notiamo prima di tutto che

1

∫ +∞

−∞

2

1 + ω2dω = 1

e quindi, come si e visto al paragrafo 2.4, da essa si puo costruire l’identitaapprossimata (hν),

hν(ω) =1

ν

[1

2

1 + (ω/ν)2

].

Vale quindi

f(t) = limν→0

1

∫ +∞

−∞f(t− s)

1

ν

2

1 + (s/ν)2ds . (4.13)

Inoltre, ciascuna delle funzioni hν e una trasformata di Fourier,

hν(ω) = F(e−|νt|) . (4.14)

Fatte queste premesse, possiamo provare:

Teorema 363 Sia f ∈ C2(IR) e siano f , f ′, f ′′ in L1(IR). Allora vale

f(t) =1

∫ +∞

−∞e+iωtf(ω) dω . (4.15)

Dim. Si e gia notato che, nelle ipotesi del teorema,

lim|ω|→+∞

ω2f(ω) = 0

(si veda (4.12)) e quindi la funzione continua f e integrabile su IR. Cio mostrache l’integrale in (4.15) ha senso. Inoltre, l’integrabilita di f ′ mostra che f elimitata.

Consideriamo l’uguaglianza (4.13). Usando (4.14), questa si scrive

f(t) =1

2πlimν→0+

∫ +∞

−∞f(t− s)

[∫ +∞

−∞e−isre−ν|r| dr

]ds .

La funzione (r, t) → f(t− s)e−isre−ν|r| e integrabile su IR2 e quindi si puousare il teorema di Fubini per scambiare l’ordine di integrazione ottenendo

f(t) = limν→0

∫ +∞

−∞

[1

∫ +∞

−∞f(t− s)e−isr ds

]e−ν|r| dr

= limν→0+

1

∫ +∞

−∞

[∫ +∞

−∞f(ξ)e−i(t−ξ)r dξ

]e−ν|r| dr

=1

∫ +∞

−∞e−itrf(−r) dr = 1

∫ +∞

−∞eitωf(ω) dω .

Page 283: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 277

Lo scambio del segno di limite col segno di integrale e lecito perche∣∣∣∣[∫ +∞

−∞f(ξ)e−iξr dξ

]e−ite−ν|t|

∣∣∣∣ ≤ |f(t)|

e, nelle ipotesi del teorema, f e integrabile.Cio completa la dimostrazione.

La formula (4.15) si chiama la formula dell’antitrasformata di Fou-rier. Ripetiamo che essa vale sotto condizioni assai piu generali di quelleassunte nel teorema 363. Per esempio, si e visto che essa vale per la funzionee−|t| che non e derivabile su IR. Pero l’enunciato del teorema 363 e sufficienteper il seguito.

Osservazione 364 Siaf(x) = e−x

2/2 . (4.16)

Si puo provare che la sua trasformata di Fourier e

f(ω) =√2πe−ω

2/2 ,

una funzione integrabile su IR e non negativa. Si ricordi infatti l’integrale diLaplace, ∫ +∞

−∞e−x

2/2 dx =√π .

Si scriva quindi∫ +∞

−∞e−x

2/2e−iωx dx = e−ω2/2

√2∫ +∞

−∞e−[(x/

√2)+i(ω/

√2)]2 d[(x/

√2) + i(ω/

√2)]

= e−ω2/2

√2∫ +∞

−∞e−s

2

ds =√2πe−ω

2/2 .

Si vede immediatamente che (hν),

hν(x) =1

νe−(x/ν)2/2

e un’identita approssimata, la cui antitraformata di Fourier e

e−(xν)2/2 .

Il teorema 363 si puo provare anche usando quest’identita approssimata.Si noti che l’identita approssimata costruita a partire da (4.16) e quella che

permette di provare il Teorema di Weierstrass, Teorema 46.

Page 284: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

278 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

4.2.4 La trasformata di Fourier su L2(IR)

Abbiamo detto che intendiamo estendere la trasformata di Fourier ad un insie-me assai piu grande di L1(IR). Come primo passo, estendiamola ad L2(IR). No-tiamo pero che anche L1(IR)∪L2(IR) e ancora troppo piccolo per le applicazioninelle quali interviene la trasformata di Fourier.

Il simbolo D(IR) indica4 l’insieme delle funzioni di classe C∞ a supportocompatto in IR. Una proprieta5 che non e difficile mostrare, e cheD(IR) e densosia in L1(IR) che in L2(IR). Inoltre, ogni f ∈ D(IR) verifica le condizioni delteorema 363 e quindi per essa vale la formula dell’antitrasformata.

Introduciamo la trasformazione lineare F su D(IR), definita da

Ff = f .

Consideriamo questa come trasformazione su L2(IR), con dominio D(IR) densoin L2(IR).

Si e gia notato che il teorema di Riemann–Lebesgue implica che, se f ∈D(IR),

limω→+∞

ω2f(ω) = 0

e quindi che f ∈ L2(IR). Dunque, F e una trasformazione da L2(IR) in se, condominio denso.

Siano ora f e g elementi di D(IR). Vale:∫ +∞

−∞f(x)g(x) dx =

1

∫ +∞

−∞f(x)

∫ +∞

−∞e+iωxg(ω) dω dx

=1

∫ +∞

−∞

[∫ +∞

−∞f(x)eiωx dx

]g(ω) dω =

1

∫ +∞

−∞f(−ω)g(ω) dω .

Notando che ∫ +∞

−∞f(x)eiωx dx =

∫ +∞

−∞f(x)e−iωx dx = F(f)(ω) ,

l’uguaglianza precedente conduce a:

Teorema 365 Se f , g appartengono a D(IR) allora vale∫ +∞

−∞f(x)g(x) dx =

1

∫ +∞

−∞F(f)(ω)g(ω) dω .

4Le proprieta di questo spazio sono state studiate al paragrafo 4.1.1. Non e peronecessario conoscerle per leggere questa parte sulla trasformata di Fourier.

5che non abbiamo provato

Page 285: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.2. LA TRASFORMATA DI FOURIER DI FUNZIONI 279

In particolare, ∫ +∞

−∞f(x)g(x) dx =

1

∫ +∞

−∞f(ω)g(ω) dω . (4.17)

Ponendo f = g in (4.20) si trova l’identita di Parseval

||f ||L2 =1√2π

||f ||L2 .

Cio mostra che

Teorema 366 La trasformazione F , definita su D(IR), da L2(IR) in se econtinua, con norma 1/

√2π, e quindi ammette estensione unica ad L2(IR).

Un calcolo analogo a quello visto sopra mostra che vale anche l’uguaglianza∫ +∞

−∞f(s)g(s) ds =

∫ +∞

−∞f(s)g(s) ds (4.18)

che va sotto il nome di identita di Plancherel. Introducendo il simbolo

⟨⟨x, y⟩⟩ =∫ +∞

−∞x(t)y(t) dt = ⟨x, y⟩ , (4.19)

la (4.18) si scrive⟨⟨f , g⟩⟩ = ⟨⟨f, g⟩⟩ . (4.20)

Osservazione 367 Si noti che il funzionale ⟨⟨x, y⟩⟩ e lineare sia in x, tenendoy costante, che in y, tenendo x costante.

Indichiamo momentaneamente con F l’estensione di F ad L2(IR) (e ovvioche in pratica si usera il medesimo simbolo per le due trasformazioni). Per latrasformazione F continuano a valere le identita di Parseval e di Plancherel.

Osservazione 368 La trasformata di Fourier F e definita su L2(IR) comeestensione per continuita. In generale, l’integrale (4.9) non converge se lafunzione e a quadrato integrabile.

Tutti gli argomenti precedenti possono ripetersi per la trasformazione G daD ⊆ L2(IR) in L2(IR),

(Gϕ)(t) = 1

∫ +∞

−∞e+iωtϕ(ω) dω .

Anche G si estende per continuita ad L2(IR). Provvisoriamente, indichiamocon G tale estensione. Per essa vale

F G = GF = I ,

ossia:

Page 286: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

280 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Teorema 369 La trasformazione di Fourier e biunivoca su L2(IR).

Si noti che una proprieta analoga non vale ne su L1(IR) ne su D(IR).Ricapitolando, abbiamo esteso la trasformata e l’antitrasformata di Fourier

ad L2(IR) per continuita. Si sa, dal teorema 254 che l’estensione per continuitapuo anche costruirsi calcolando aggiunti. Consideriamo quindi due funzioni fe ϕ ambedue in D, che e un s.spazio denso di L2(IR). La formula di Plancerelmostra che

⟨⟨Ff, ϕ⟩⟩ = ⟨Ff, ϕ⟩ = ⟨f,F∗ϕ⟩ .

E’ immediato calcolare che:

F∗ϕ = Fϕ = ϕ .

L’uguaglianza precedente ha senso se sia f che ϕ sono elementi di D, ma ilmembro destro definisce un funzionale

ϕ→ ⟨f,F∗ϕ⟩ = ⟨f, ϕ⟩ = ⟨⟨f, ϕ⟩⟩ (4.21)

che e lineare e continuo su D denso in L2(IR); e questo non solo per f ∈D ma per ogni f ∈ L2(IR). Questo suggerisce di definire l’estensione dellatrasformata di Fourier ad ogni f ∈ L2(IR), ossia Ff , come il funzionale linearee continuo in (4.21); ossia, Ff e definita mediante l’uguaglianza

⟨⟨Ff, ϕ⟩⟩ = ⟨⟨f, ϕ⟩⟩ ∀ϕ ∈ D . (4.22)

Questa e una diversa interpretazione della trasformata di Fourier, equiva-lente a quella ottenuta estendendo per continuita. Suggerisce pero un modoper estendere la trasformata di Fourier ad uno spazio molto grande: primasi identifica uno spazio con una topologia molto forte, su cui la trasformatadi Fourier e continua e biunivoca. Si usa quindi un metodo “di dualita” perestenderla al duale dello spazio. L’idea intuitiva e che se lo spazio ha unatopologia “molto forte” il suo duale sara “grande”.

Notiamo che

F∗ϕ =∫ +∞

−∞e+iωtϕ(ω) dω .

Dunque, con la notazione (4.20), la (4.22) si scrive

⟨⟨Ff, ϕ⟩⟩ = ⟨⟨f,Fϕ⟩⟩ ∀ϕ ∈ D .

Converra quindi usare, come punto di partenza per l’estensione della tra-sformata di Fourier, la formula di Plancherel (4.20). Va notato subito peroche lo spazio D e troppo piccolo. In particolare, la trasformata di Fourier

Page 287: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 281

di una ϕ ∈ D non appartiene a D. Vedremo pero al paragrafo successivo lospazio S, piu grande di D, ancora denso sia in L1(IR) che in L2(IR) e su cui latrasformata di Fourier e invertibile. Gli argomenti appena presentati valgonoanche sostituendo ovunque D con S.

Concludiamo questa parte esaminando l’esempio seguente:

Esempio 370 Applichiamo l’identita di Parseval alla funzione χ[−1,1], studia-ta all’esempio 362. La sua trasformata di Fourier

2sinω

ω

e in L2(IR), come si verifica immediatamente, e come deve essere perche χ[−1,1]

e a quadrato integrabile. Dunque,∫ +∞

−∞

[2sinω

ω

]2dω = 2π

∫ +∞

−∞[χ[−1,1](x)]

2 dx = 4π .

Si trova quindi ∫ +∞

−∞

[sinω

ω

]2dω = π .

4.3 Distribuzioni temperate

4.3.1 Lo spazio S e il suo duale

L’idea per la scelta dello spazio S su cui definire la trasformata di Fourier efornita dal teorema di Riemann-Lebesgue, e dalle sue conseguenze: la rego-larita di f si trasferisce nel comportamento asintotico di f ; il comportamentoasintotico di f si trasferisce nella regolarita di f , e viceversa. Cio suggeriscedi introdurre lo spazio S i cui elementi sono le funzioni ϕ ∈ C∞(IR) tali che:

lim|x|→+∞

xkϕ(n)(x) = 0 ∀k , n . (4.23)

E’ chiaro che S e un sottoinsieme sia di L1(IR) che di L2(IR) e che per glielementi di S valgono sia la formula della trasformata che dell’antitrasformatadi Fourier:

ϕ(ω) =∫ +∞

−∞e−iωtϕ(t) dt , ϕ(t) =

1

∫ +∞

−∞eiωtϕ(ω) dω .

Vogliamo mimare su S la costruzione della trasformata ottenuta per dualitasu L2(IR). Per questo e necessario munire S di una topologia la quale tenga

Page 288: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

282 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

conto della proprieta (4.23). E’ un fatto che cio non puo farsi introducendouna norma in S. D’altra parte, la definizione della topologia porterebbe viatroppo tempo. Dunque limitiamoci a introdurre un concetto di convergenzadi successioni in S.

Per definizione,limϕn(x) = 0

quando per ogni k intero non negativo e per ogni r intero non negativo si ha

limnxkϕ(r)

n (x) = 0

uniformemente su IR.Esplicitamente questo vuol dire che per ogni ϵ > 0 esiste N = N(ϵ, k, r)

tale che se n > N(ϵ, k, r) allora

|xkϕ(r)n (x)| < ϵ .

Si e scritta esplicitamente questa condizione per sottolineare che la convergenzaNON e uniforme in k ed r.

Definiamo inoltre:

limϕn = ϕ0 ⇐⇒ lim[ϕn − ϕ0] = 0 .

Lo spazio lineare S, dotato della definizione di convergenza appena introdotta,si chiama lo spazio delle funzioni rapidamente decrescenti su IR.

Sia ora A un funzionale su S oppure una trasformazione da S in se. Diremoche A e continuo quando

limϕn = ϕ0 =⇒ limAϕn = Aϕ0 .

Si prova immediatamente:

Teorema 371 L’operazione di derivazione:

ϕ→ Dϕ

e continua da S in se.

Con S ′ indichiamo lo spazio lineare dei funzionali lineari e continui su S,dotato della relazione di convergenza seguente

lim ln = l0 ⇐⇒ lim ln(ϕ) = l0(ϕ) ∀ϕ ∈ S .

Si confronti questa definizione di convergenza con la convergenza debole stellae con la convergenza in (D(IR))′.

Page 289: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 283

Gli elementi di S ′ si chiamano distribuzioni temperate.Come al solito, per indicare l’azione di l ∈ S ′ su ϕ ∈ S, invece di scrivere

l(ϕ) scriveremo⟨⟨l, ϕ⟩⟩ .

Mostriamo alcuni esempi di trasformazioni continue da S in se.

Esempio 372 le trasformazioni

ϕ→ ϕ+ ψ , ϕ→ αϕ

(con ψ fissata) sono continue e la seconda e anche lineare.Piu ancora, sia p un polinomio. La trasformazione lineare

ϕ(x) → p(x)ϕ(x)

e continua.Sono anche continue le trasformazioni seguenti:

ϕ(x) → ϕ(rx) , r ∈ IR

ϕ(x) → ϕ(k)(x) .

Per ogni ω fissato, la trasformazione

ϕ(x) → eiωxϕ(x)

e continua. In generale, se f ∈ C∞(IR) e se f e tutte le sue derivate sonolimitate, la trasformazione lineare

ϕ(x) → f(x)ϕ(x)

e continua. Per esempio, sono anche continue le trasformazioni

ϕ→ e−x2

ϕ(x) , ϕ→ ϕ(x) sin x .

Mostriamo ora alcuni esempi di distribuzioni temperate.

Esempio 373 Sia l tale che

⟨⟨l, ϕ⟩⟩ = ϕ(0) .

E’ immediato verificare che l e lineare e continuo, ossia che l ∈ S ′.Questa distribuzione e particolarmente importante per le applicazioni ed

ha un simbolo standard: si indica col simbolo δ,

⟨⟨δ, ϕ⟩⟩ = ϕ(0)

Page 290: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

284 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

e si chiama delta di Dirac.E ancora immediato verificare la continuita di

ϕ→ν∑k=0

akϕ(k)(xk) .

In seguito chiariremo le relazioni tra le due distribuzioni temperate intro-dotte nell’esempio precedente.

Consideriamo ora:

Esempio 374 Sia f ∈ Lp(IR), 1 ≤ p ≤ +∞. E’ una distribuzione temperataquella definita da

ϕ→∫ +∞

−∞f(s)ϕ(s) ds .

Questo si verifica immediatamente usando il teorema della convergenza do-minata, se p = 1. Se p > 1 si usa la disuguaglianza di Hoelder per notareche

1

x2 + 1f(x) ∈ L1(IR) .

Si scrive quindi∫ +∞

−∞f(s)ϕ(s) ds =

∫ +∞

−∞

f(x)

1 + x2

[(1 + x2)ϕ(x)

]dx .

Sappiamo gia che la trasformazione che a ϕ associa (1 + x2)ϕ(x) e conti-nua. E quindi la trasformazione che stiamo studiando e continua, essendocomposizione delle due trasformazioni lineari e continue

ϕ→ (1 + x2)ϕ(x) , ψ →∫ +∞

−∞

f(x)

1 + x2ψ(x) dx .

Le particolari distribuzioni introdotte nell’esempio 374 si chiamano distri-buzioni regolari. Esse si indicano con un simbolo del tipo Df o piu spessosemplicemente f o

∫fϕ. In analogia con questo simbolo, specialmente nei testi

piu applicativi, una distribuzione l si indica col simbolo

ϕ→∫lϕ

attribuendo al simbolo “∫” il significato del simbolo “⟨⟨·, ·⟩⟩”.

In pratica, non si distingue tra le funzioni e le distribuzioni regolari ad esseassociate.

Riportiamo di nuovo l’esempio seguente:

Page 291: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 285

Esempio 375 Sia (hn) un’identita approssimata. Per ogni ϕ ∈ S si ha

limn

∫ +∞

−∞hn(t− s)ϕ(s) ds = ϕ(t) ,

si veda il paragrafo 2.4. Cio vale in particolare per t = 0 e quindi

limn

∫ +∞

−∞hn(−s)ϕ(s) ds = ϕ(0) , ϕ ∈ S .

Dunque, la successione di distribuzioni regolari definite da

ϕ→∫ +∞

−∞hn(−s)ϕ(s) ds

converge in S ′ alla δ di Dirac. Si dice piu brevemente che “le identita appros-simate approssimano la δ di Dirac”.

4.3.2 Distribuzioni e distribuzioni temperate

Scegliendo di chiamare “distribuzioni temperate” gli elementi di S ′, abbiamosuggerito l’inclusione

S ′ ⊆ (D(IR))′ .

Quest’inclusione si prova facimente perche ogni ϕ ∈ D(IR) e anche in S e se(ϕn) e una successione tendente a zero nel senso di D(IR), essa tende a zeroanche nel senso di S. Infatti,

dr

dxrxkϕn(x)

e somma finita di termini del tipo

xjϕ(m)(x)

e questi tendono a zero uniformemente su IR, perche se ϕn → 0 in D(IR) alloraesiste un compatto K che contiene i supporti di tutte le ϕn.

Ossia, ogni elemento di S ′ ammette restrizione a D(IR) e questa restrizionee una distribuzione. Ci si puo chiedere se due diversi elementi l1 ed l2 in S ′

ammettano la medesima restrizione χ a D(IR). Se cio accade, l = l1− l2 e nonnullo, ma

⟨⟨l, ϕ⟩⟩ = 0 ∀ϕ ∈ D(IR) .

Usando il teorema seguente, che non proviamo, si vede che cio non avviene:

Page 292: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

286 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Teorema 376 Lo spazio D(IR) e denso in S.

Sia ϕ0 ∈ S tale che

⟨⟨l, ϕ0⟩⟩ = 0 .

Sia (ϕn) una successione in D(IR) convergente a ϕ0 nel senso di S. Se l fossel’elemento nullo in (D(IR))′, dovrebbe essere

0 = lim⟨⟨l, ϕn⟩⟩ = ⟨⟨ϕ0, l⟩⟩ = 0 .

Cio prova che l, non zero su S, e non zero anche su D(IR).

Ricapitolando, abbiamo visto che ogni distribuzione temperata e una di-stribuzione. Mostriamo che esistono distribuzioni che non sono distribuzionitemperate:

Esempio 377 Consideriamo la funzione f(x) = ex4. Questa funzione e local-

mente integrabile e quindi definisce una distribuzione. Non definisce pero unadistribuzione temperata. Per vederlo, consideriamo la funzione ψ(x) = e−x

2,

che e un elemento di S. Ovviamente,

∫ +∞

−∞ex

4

e−x2

dx = +∞ .

Questo mostra che ex4non e una distribuzione temperata regolare. Per mo-

strare che non e nemmeno una distribuzione temperata, usiamo di nuovo ilTeorema 376. Sia ϕn una successione in D(IR) che tende a ψ nel senso di S.Possiamo supporre che per ogni x sia

M < ϕ1(x) ≤ ϕn(x) ≤ ϕn+1(x) ≤ ψ(x) .

La funzione f(x) definisce una distribuzione che associa a ϕn il valore

⟨⟨Df , ϕn⟩⟩ =∫ +∞

−∞f(x)ϕn(x) dx .

Questa successione di integrali tende a +∞ per n → +∞ grazie al teoremadi Beppo Levi6 e questo non potrebbe accadere se la distribuzione Df fosseanche una distribuzione temperata.

6concernente lo scmbio dell’integrale di Lebesgue con i limiti.

Page 293: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 287

4.3.3 La trasformata di Fourier su S ′

Si e gia detto che su S la trasformata di Fourier e definita dall’integrale (4.9)e che su S vale la formula dell’antitrasformata. Proviamo ora:

Teorema 378 La trasformata di Fourier F trasforma S in se, e continua ebiunivoca.

Dim. Si e gia notato che F trasforma S in se.La linearita e ovvia. Proviamo la continuita. Sia (ψn) una qualsiasi suc-

cessione tendente a zero. Basta provare che la successione (Fψn) tende a zero.Fissiamo per questo k ed r e consideriamo

ωkdr

dωr

∫ +∞

−∞e−iωxψn(x) dx = ωk

∫ +∞

−∞(−1)re−iωx[xrψn(x)] dx

=∫ +∞

−∞(−1)r(i)k

[dk

dxke−iωx

][xrψn(x)] dx .

Integriamo per parti tenendo conto che

lim|x|→+∞

[xrψn(x)] = 0 .

Si trova: ∫ +∞

−∞(−1)r+k(i)ke−iωx

[dk

dxkxrψn(x)

]dx

= (−1)r+k(i)k∫ +∞

−∞

e−iωx

1 + x2

[(1 + x2)

dk

dxkxrψn(x)

]dx .

Sia ora ϵ > 0. Esiste N(ϵ, k, r) tale che

n > N(ϵ, k, r) =⇒∣∣∣∣∣(1 + x2)

dk

dxkxrψn(x)

∣∣∣∣∣ < ϵ

cosı che, per tali indici n si ha anche∣∣∣∣∣ωk dr

dωr

∫ +∞

−∞e−iωxψn(x) dx

∣∣∣∣∣ ≤ πϵ .

Questo prova la continuita di F .La trasformazione F e suriettiva perche ammette l’inversa.

Possiamo ora estendere la trasformata di Fourier ad S ′.

Page 294: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

288 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Si ricordi che se f ∈ L2(IR) la sua trasformata di Fourier puo definirsiusando la formula (4.22) e che questa puo interpretrarsi dicendo che f e quelfunzionale lineare e continuo che a ϕ associa ⟨⟨f, ϕ⟩⟩.

Traendo ispirazione da quest’osservazione, definiamo la trasformata diFourier di distribuzioni temperate come segue: Sia l ∈ S ′. La suatrasformata di Fourier l e il funzionale lineare

ϕ→ ⟨⟨l, ϕ⟩⟩ .

E’ immediato verificare7 che l ∈ S ′. Quindi l’uguaglianza

⟨⟨l, ϕ⟩⟩ = ⟨⟨l, ϕ⟩⟩

che ora definisce la trasformata di Fourier l, estende la formula di Plancerel.Cosı come si estende ad S ′ la trasformazione F , si estende anche l’antitra-

sformata G:G : ⟨⟨Gl, ϕ⟩⟩ = ⟨⟨l,Gϕ⟩⟩

e la relazione⟨⟨F [Gl] , ϕ⟩⟩ = ⟨⟨l,G [F ]ϕ⟩⟩ = ⟨⟨l, ϕ⟩⟩

mostra che l’estensione di G e inversa destra di F . Procedendo in modo analogosi vede che e anche inversa sinistra, e quindi che e l’antitrasformata di Fourier.

Notiamo che:

Teorema 379 La trasformata di Fourier e continua e biunivoca da S ′ in se,con inversa continua.

Dim. Sialim ln = l0

ossialim⟨⟨ln, ϕ⟩⟩ = ⟨⟨l0, ϕ⟩⟩ ∀ϕ ∈ S .

Vogliamo provare che lim ln = l0. Ogni ϕ e in S e quindi la precedente si scrive,scegliendo per ϕ la ϕ:

lim⟨⟨ln, ϕ⟩⟩ = ⟨⟨l0, ϕ⟩⟩ ossia lim⟨⟨ln, ϕ⟩⟩ = ⟨l0, ϕ⟩⟩ .

Cio vuol direlim ln = l0 ,

7notando che ϕ → ⟨⟨l, ϕ⟩⟩ e un funzionale lineare e continuo, come composizione ditrasformazioni lineari e continue.

Page 295: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 289

ossia la proprieta che volevamo provare.La biunivocita della trasformata si ottiene perche, come si e gia notato,

anche l’antitrasformata si estende per dualita ad S ′.Infine, l’argomento precedente puo usarsi anche per provare la continuita

dell’antitrasformata.

Ricordiamo che una distribuzione della forma

ϕ→∫ +∞

−∞f(x)ϕ(x) dx ,

con f(x) integrabile su IR, si chiama distribuzione regolare che, per chiarez-za, indicheremo col simbolo Df (ma che in pratica si indica col simbolo f ,confondendo il simbolo della funzione e della distribuzione da essa identificata).

Conviene ora vedere il calcolo di alcune trasformate.

Esempio 380 Sia f ∈ L1(IR) ed Df la distribuzione regolare

⟨⟨Df , ϕ⟩⟩ =∫ +∞

−∞f(x)ϕ(x) dx .

La trasformata di Fourier di Df e la distribuzione

ϕ→ ⟨⟨Df , ϕ⟩⟩ =∫ +∞

−∞f(ω)

∫ +∞

−∞e−iωxϕ(x) dx dω

=∫ +∞

−∞

[∫ +∞

−∞e−iωxf(ω) dω

]ϕ(x) dx = ⟨⟨Df , ϕ⟩⟩ :

la trasformata di Fourier della distribuzione regolare identificata dalla funzionef e la distribuzione regolare identificata dalla funzione f .

In particolare,

Esempio 381 Sia

f(t) =

1 se |t| < T0 se |t| > T .

Allora, come si e visto all’esempio 362,

f(ω) =sinωT

ω.

La funzione f non appartiene ad L1(IR); e pero limitata e quindi identificauna distribuzione regolare Df .

Ad f come funzione la formula dell’antitrasformata che abbiamo provatoal paragrafo 4.2.3 non puo applicarsi. Invece, ad essa puo applicarsi la formuladell’antitrasformata nel senso che abbiamo introdotto in S ′.

Page 296: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

290 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Esempio 382 Consideriamo ora la funzione f(t) = eiαt, che non e ne inte-grabile ne a quadrato integrabile, e quindi non ha trasformata di Fourier nelsenso che abbiamo introdotto per le funzioni. Nel senso delle distribuzioni, lasua trasformata di Fourier e

ϕ→ ⟨⟨Df , ϕ⟩⟩ =∫ +∞

−∞eiαxϕ(x) dx = 2πϕ(α) .

Indicando con δα la distribuzione

⟨⟨δα, ϕ⟩⟩ = ϕ(α) ,

si vede cheF(eiαx) = 2πδα .

Usando le formule di Eulero,

F(sinαx) = −iπδα − δ−α , F(cosαx) = πδα + δ−α .

Quest’esempio mostra che la trasformata di una distribuzione regolare puonon essere una distribuzione regolare.

Veniamo ora al calcolo della trasformata di Fourier di distribuzioni che nonsono regolari.

Esempio 383 La trasformata δ della delta di Dirac e la distribuzione

ϕ→ ⟨⟨δ, ϕ⟩⟩ = ϕ(0) =∫ +∞

−∞ϕ(s) ds .

E’ quindi la distribuzione regolare identificata dalla funzione identicamente 1.Diremo, piu semplicemente, che e la funzione 1:

δ = 1 ;

Viceversa, sia f(x) ≡ 1. Dalla formula dell’antitrasformata si vede imme-diatamente che la sua trasformata e la distribuzione 2πδ.

Indichiamo provvisoriamente con λ la distribuzione

ϕ→ ⟨⟨λ, ϕ⟩⟩ = ϕ′(0)

(vedremo piu avanti un simboli “migliore” per identificare questa distribuzio-ne). La sua trasformata di Fourier e

ϕ→ ⟨⟨λ, ϕ⟩⟩ = ϕ′(0) =∫ +∞

−∞ixϕ(x) dx :

la sua trasformata e ix. Si noti:

F(λ) = ixF(δ) .

Page 297: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 291

Quest’esempio mostra che la trasformata di una distribuzione che non eregolare puo essere una distribuzione regolare.

Osservazione 384 Si e detto, nell’esempio 350 del paragrafo 4.1.3 che perindicare una distribuzione χ che agisce sulle funzioni ϕ della variabile x si indicaanche la notazione χ(x), anche se ovviamente non ha alcun senso parlare del“valore in x” della distribuzione χ. Analogamente, per indicare Thχ e comunescrivere χ(x− h). Con queste notazioni si ha:

eiαx 2πδ(ω − α)1 2πδ(ω)δ 1

sinαx = −iπδ(ω − α)− δ(ω + α)cosαx πδ(ω − α) + δ(ω + α)

4.3.4 Le operazioni sulle distribuzioni

Si sa gia che S ′ e uno spazio lineare, ossia che in S ′ e definito il prodottoper scalari e la somma8; e in S ′ si e definita la trasformata di Fourier, conun metodo di dualita. Ancora con un metodo di dualita si definiscono altreoperazioni, a partire dalle corrispondenti operazioni su S. Sia h ∈ IR e Th latraslazione in S,

(Thϕ)(x) = ϕ(x− h)

(se h > 0 questa si interpreta come traslazione verso destra). Ovviamente, The continua su S e quindi per ogni l ∈ S ′ si definisce

T ∗h l : ϕ→ ⟨⟨l, Thϕ⟩⟩ .

Se h > 0 questa si interpreta come traslazione (applicata ad l) verso sinistra.Si esprima in modo esplicito l’effetto di T ∗

h sulle distribuzioni regolari e sigiustifichi la notazione piu comunemente usata “T−h” invece di “T ∗

h ”.

Esempio 385 Sia δ la delta di Dirac. Si ha:

⟨⟨Thδ, ϕ⟩⟩ = ⟨⟨δ, T−hϕ⟩⟩ = ϕ(h) = ⟨⟨δ(x− h), ϕ⟩⟩ .

Sia ora a = 0 e sia

Ra : (Raϕ)(x) = ϕ(ax) .

8la continuita delle trasformazioni χ → αχ e χ → (χ+ λ) si dimostra facilmente.

Page 298: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

292 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Anche Ra e continua da S in se e quindi si puo definire R∗a ponendo

⟨⟨R∗al, ϕ⟩⟩ = ⟨⟨l,Raϕ⟩⟩ .

Si verifica facilmente che se Df e la distribuzione regolare che corrisponde allafunzione integrabile f allora9

R∗a(Df ) = D[ 1

|a|R1/af ]

e quindi, per una generica l ∈ S ′, si definisce

Ral =

[1

|a|R1/a

]∗l .

Ossia, Ral e definita dall’uguaglianza

⟨⟨Ral, ϕ⟩⟩ = ⟨⟨[1

|a|R1/a

]∗l, ϕ⟩⟩ = ⟨⟨l, 1

|a|R1/aϕ⟩⟩ .

Si e notato che se g ∈ C∞(IR) e limitata con tutte le sue derivate, o anche seg e un polinomio, allora Mg: Mgϕ = gϕ e continua da S in se. Cio permettedi definire

⟨⟨(M∗gl), ϕ⟩⟩ = ⟨⟨l,Mgϕ⟩⟩ .

Si esamini l’azione di M∗g sulle distribuzioni regolari e si spieghi perche si

scriveMgl

invece di M∗gl.

Osservazione 386 La Mg e la “moltiplicazione” della distribuzione l per lafunzione g. piu comunemente, invece di scrivere Mgl si scrive gl.

Esempio 387 Sia ψ(x) ∈ S. Si vuol calcolare Mψδα. Si ha:

⟨⟨Mψδα, ϕ⟩⟩ = ⟨⟨δα, ψϕ⟩⟩ = ψ(α)ϕ(α) .

Dunque, usando la notazione piu comune ψ(ω)δ(ω−α) invece di Mψδα, si ha

ψ(ω)δ(ω − α) = ψ(α)δ(ω − α) . (4.24)

9si ricordi che in questa parte si lavora con funzioni e distribuzioni di una variabile. Siveda l’Esempio 343 per il caso generale.

Page 299: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 293

Introduciamo ora la derivata delle distribuzioni.Essendo continua la trasformazione D

ϕ→ Dϕ = ϕ′

da S in se, definiremo⟨⟨D∗l, ϕ⟩⟩ = ⟨⟨l, Dϕ⟩⟩ .

Si esamini l’effetto di D∗ sulle distribuzioni regolari e si chiarisca perche invecedi “D∗” si usa il simbolo “−D”:

⟨⟨Dl, ϕ⟩⟩ = −⟨⟨l, Dϕ⟩⟩ .

La derivata di distribuzioni si indica anche con l’apice:

Dl = l′ .

Presentiamo alcuni calcoli di derivate.

Esempio 388 Si chiama funzione di Heaviside la funzione

u(t) =

0 se t < 01 se t > 0 .

Questa funzione non e derivabile nel senso ordinario. E’ pero derivabilenel senso delle distribuzioni, ossia e derivabile la distribuzione regolare ad essaassociata, e vale

⟨⟨DDu, ϕ⟩⟩ = −⟨⟨u, ϕ′⟩⟩ = −∫ +∞

0ϕ′(s) ds = ϕ(0) .

Dunque la sua derivata e la delta di Dirac e scriveremo brevemente

Du = δ .

Calcoliamo ora la derivata della delta di Dirac:

⟨⟨Dδ, ϕ⟩⟩ = −⟨⟨δ,Dϕ⟩⟩ = −ϕ′(0) .

Dunque, Dδ e la trasformazione (che all’esempio 383 abbiamo chiamato −λ)

ϕ→ −ϕ′(0) .

Sia ora f(x) una funzione di classe C1(IR). Anche se f(x) cresce al piucome un polinomio, la sua derivata puo non crescere polinomialmente. Equindi Df ′ puo non identificare una distribuzione temperata. In tal caso laderivata di Df , nel senso delle distribuzioni temperate non e Df ′ , che non e unadistribuzione temperata. La formula (4.4) vale in S ′ solo se anche f ′ definisceuna distribuzione temperata.

Page 300: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

294 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

4.3.5 Operazioni e trasformata di Fourier

Studiamo ora le relazioni tra le operazioni introdotte in S ′ e la trasformata diFourier.

Calcoliamo prima di tuttoF(Thl) .

Per definizione,⟨⟨F(Thl), ϕ⟩⟩ = ⟨⟨Thl, ϕ⟩⟩ = ⟨⟨l, T−hϕ⟩⟩ .

Ora,

T−hϕ = ϕ(ω + h) =∫ +∞

−∞e−i(ω+h)xϕ(x) dx = F(Mfϕ)

conf(x) = e−ihx .

Dunque,F(Thl) =Mf l ,

la moltiplicazione della distribuzione l per e−ihω.Analogamente, la trasformata di Ral si calcola da

⟨⟨F(Ral), ϕ⟩⟩ = ⟨⟨l, 1

|a|R1/aϕ⟩⟩ .

Ora,[1

|a|R1/aϕ

](ω) =

1

|a|

∫ +∞

−∞e−i(ω/a)xϕ(x) dx =

1

|a|

∫ +∞

−∞e−iω(x/a)ϕ(x) dx =∫ +∞

−∞e−iωtϕ(at) dt = F(Raϕ) .

Dunque,

⟨⟨F(Ral), ϕ⟩⟩ = ⟨⟨l,F(Raϕ)⟩⟩ = ⟨⟨R∗al, ϕ⟩⟩ = ⟨⟨ 1

|a|Ral, ϕ⟩⟩ :

F(Ral) =1

|a|R1/al .

Veniamo infine alla trasformata della derivata di una distribuzione:

⟨⟨F(Dl), ϕ⟩⟩ = ⟨⟨Dl, ϕ⟩⟩ = −⟨⟨l, Dϕ⟩⟩ = −⟨⟨l,F(M−itϕ)⟩⟩ = −⟨⟨M−itl, ϕ⟩⟩

e quindiF(Dl) = iωl .

Page 301: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 295

Osservazione 389 Si consideri la funzione di Heaviside u(t). La sua derivatae δ e quindi

1 = δ = iωu

da cui sembra di poter dedurre u = 1iω. Si noti che questa e una scrittura so-

lamente formale, a cui non abbiamo attribuito alcun significato, perche 1/(iω)non e integrabile.

Un calcolo diretto mostra che u e quella distribuzione che a ϕ ∈ S associa∫ +∞

0ϕ(ω) dω =

∫ +∞

0

[∫ +∞

−∞e−iωxϕ(x) dx

]dω

= limR→+∞

∫ R

0

[∫ +∞

−∞e−iωxϕ(x) dx

]dω = lim

R→+∞

∫ +∞

−∞

[∫ R

0e−iωx dω

]ϕ(x) dx

limR→+∞

∫ +∞

−∞

1− e−iRx

ixϕ(x) dx .

Cio mostra che l’azione di certe distribuzioni viene descritta mediante integralidipendenti da parametri, e loro limiti. Noi non presentiamo questo aspettodel problema. Diciamo solamente che in questo modo si riesce a dare sensoall’espressione u = 1/(iω).

4.3.6 Convoluzione di distribuzioni

Il problema di estendere il concetto di convoluzione al caso delle distribuzionie piuttosto delicato, e ci limitiamo ad enunciare alcuni risultati. Consideriamodue funzioni integrabili f e g. La loro convoluzione h = f ∗ g identifica unadistribuzione regolare Dh, la cui azione su ϕ ∈ S e:∫ +∞

−∞

[∫ +∞

−∞f(s− y)g(y) dy

]ϕ(s) ds =

∫ +∞

−∞

[∫ +∞

−∞f(s− y)ϕ(s) ds

]g(y) dy

=∫ +∞

−∞

[∫ +∞

−∞f(x)ϕ(x+ y) dx

]g(y) dy .

Per interpretare la formula precedente quando f e g sono sostituite dadistribuzioni, e necessario considerare funzioni ϕ dipendenti da due variabili xed y e, per ogni valore di una di esse, per esempio y, applicare una distribuzionel alla funzione x → ϕ(x, y). Per intendere che l agisce sulla ϕ vista comefunzione di x, scriveremo10 lx invece di l.

10abbiamo usato anche il simbolo l(x). In questo paragrafo e probabilmente piu chiarousare il simbolo lx che meno ricorda quello di una funzione della variabile x.

Page 302: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

296 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Siano ora l ed m due distribuzioni. Per definire il significato di l ∗ m,convoluzione di l e di m, dobbiamo spiegare come essa agisce su ciascunafunzione ϕ ∈ S. Per questo, scelta ϕ ∈ S, consideriamo la funzione x →ϕ(x+ y), per ogni scelta di y ∈ IR, e consideriamo il numero

⟨⟨mx, ϕ(x+ y)⟩⟩ .

Si trova in questo modo una funzione

ψ(y) = ⟨⟨mx, ϕ(x+ y)⟩⟩ .

Se accade che ψ ∈ S, allora puo definirsi

⟨⟨l, ψ⟩⟩

e per definizione porremo

⟨⟨l ∗m,ϕ⟩⟩ = ⟨⟨l, ψ⟩⟩ = ⟨⟨ly, ⟨⟨mx, ϕ(x+ y)⟩⟩⟩⟩ . (4.25)

Si noti che per poter utilizzare la definizione precedente abbiamo bisognodi piu che non semplicemente ψ ∈ S: abbiamo bisogno che la funzione

ϕ(x) → ψ(y) = ⟨⟨mx, ϕ(x+ y)⟩⟩

sia continua da S in se, in modo da avere

ϕ→ ⟨⟨l ∗m,ϕ⟩⟩

continua su S.Di conseguenza, la possibilita di definire la distribuzione l∗m dipende dalle

proprieta delle distribuzioni con cui si lavora. I dettagli di quest’argomentosono piuttosto delicati e noi ci limitiamo ad enunciare i due risultati seguenti.Definiamo prima: una distribuzione l ha supporto in un insieme chiuso Kquando ⟨⟨l, ϕ⟩⟩ = 0 per ogni ϕ ∈ S il cui supporto non interseca K; ossia che enulla in un aperto contenente K.

Vale:

Teorema 390 La formula (4.25) definisce la convoluzione delle due distribu-zioni temperate l ed m in uno dei due casi seguenti:

• almeno una delle due distribuzioni ha supporto compatto;

• ambedue le distribuzioni hanno supporto in [0,+∞).

Page 303: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 297

Inoltre:

Teorema 391 In ciascuno dei due casi presentati nel teorema 390, l’opera-zione di convoluzione gode delle seguenti proprieta:

• distributivita:

l ∗ (h+ k) = l ∗ h+ l ∗ k ,(l +m) ∗ h = l ∗ h+m ∗ h ;

• associativita:l ∗ (h ∗ k) = (l ∗ h) ∗ k ;

• commutativita:h ∗ k = k ∗ h ;

• regola di derivazione:

D(l ∗ k) = (Dl) ∗ k = l ∗ (Dk) ;

• regola per la trasformata di Fourier:

F(l ∗ h) = l(ω)h(ω) ;

• esistenza dell’identita rispetto alla convoluzione:

δ ∗ h = h .

L’ultima proprieta, ossia δ∗h = h, si interpreta dicendo che la delta di Dirace l’identita rispetto alla convoluzione. L’Esempio 375 mostra che le identita ap-prossimate approssimano la δ di Dirac, ossia approssimano l’identita rispettoalla convoluzione. Si giustifica cosı il termine “identita approssimata”.

La formula (4.25) puo permettere di definire la convoluzione di due distri-buzioni anche in casi piu generali di quelli descritti dal teorema 390. In talcaso pero si possono incontrare fenomeni indesiderati, come mostra l’esempioseguente.

Esempio 392 Consideriamo le tre distribuzioni seguenti: l e la distribuzio-ne regolare 1; la seconda distribuzione e δ′ mentre la terza e la funzione diHeaviside u. Per ϕ ∈ S

ψ(y) = ⟨⟨ux, ϕ(x+ y)⟩⟩ =∫ +∞

0ϕ(x+ y) dy

Page 304: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

298 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

e in S e la trasformazione da ϕ in ψ e continua. Dunque si puo calcolare

η(ξ) = ⟨⟨δ′y, ψ(y + ξ)⟩⟩ = ψ′(ξ) = ϕ(x) .

E quindi si puo anche definire

⟨⟨l, η⟩⟩ =∫ +∞

−∞ϕ(x) dx = ⟨⟨l, ϕ⟩⟩ .

Dunque,l ∗ (δ′ ∗ u) = l .

Anche (l ∗ δ′) puo calcolarsi, dato che δ′ ha supporto compatto e si vedefacilmente che

l ∗ δ′ = δ .

Dunque,(l ∗ δ′) ∗ u = δ ∗ u .

Calcoliamo esplicitamente δ ∗ u.Ricordiamo che

ψ(y) = ⟨⟨ux, ϕ(x+ y)⟩⟩ =∫ +∞

0ϕ(x+ y) dx

cosı che

⟨⟨δ, ψ⟩⟩ = ψ(0) =∫ +∞

0ϕ(x) dx = ⟨⟨u, ϕ⟩⟩ .

Si e quindi trovato δ ∗ u = u, ossia

(l ∗ δ′) ∗ u = u = l = l ∗ (δ′ ∗ u) .

Dunque, in questo caso la proprieta associativa non vale.

4.3.7 Treno d’impulsi e formula di Poisson

Indichiamo, per ora in modo formale, col simbolo L la formula

L =+∞∑

n=−∞δ(x− n) .

Intendiamo con questo la distribuzione che a ϕ associa

⟨⟨L, ϕ⟩⟩ =+∞∑

n=−∞ϕ(n) . (4.26)

Page 305: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 299

Ovviamente dobbiamo ancora provare che L effettivamente definisce un ele-mento di S ′. Cio avviene, come ora proveremo in due modi diversi, e la distri-buzione temperata L si chiama treno d’impulsi. In modo piu immaginoso,talvolta viene anche chiamata “pettine di Dirac”.

Mostriamo ora che effettivamente L ∈ S ′ basandoci solamente sulla defini-zione di S ′. Essendo ovviamente L lineare, basta provarne la continuita; ossiava provato che se (ϕk) converge a zero in S allora la successione (Lϕk) convergea zero in IR.

Ricordiamo che se (ϕk) converge a zero in S allora in particolare la succes-sione di funzioni (x2ϕk(x)) converge a zero uniformemente su IR. Dunque, perogni ϵ > 0 esiste Kϵ tale che per k > Kϵ ed ogni x ∈ IR si ha

|ϕk(x)| < ϵ , |x2ϕk(x)| < ϵ .

Consideriamo ora l’uguaglianza

⟨⟨L, ϕk⟩⟩ =+∞∑

n=−∞ϕk(n) .

Il modulo del secondo membro, per k > Kϵ, e minore di

|ϕk(0)|+∑n =0

ϵ

n2≤ ϵ

1 +∑n =0

1

n2

< (const) · ϵ ,

come volevamo.Una via un po’ piu involuta per arrivare allo stesso risultato e la seguen-

te. Conviene vederla perche suggerisce un modo semplice per calcolare latrasformata di Fourier del treno d’impulsi.

Consideriamo l’estensione periodica, di periodo 1, della funzione

f(x) = x+ 1/2, −1 < x < 0 (4.27)

(se vogliamo una funzione definita su IR si puo anche imporre f(0) = 0).Dunque,

se n < x < n+ 1 allora f(x) = x− (n+ 1) +1

2= x− n− 1

2.

Il grafico della funzione e nella figura 4.2. Essendo f(x) limitata su IR, essadefinisce una distribuzione temperata, che ancora denotiamo f , la cui derivatasi calcola immediatamente: e

Df = 1−+∞∑

n=−∞δ(x− n) .

Page 306: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

300 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

Figura 4.2:

−4 −3 −2 −1 0 1 2 3 4−1.5

−1

−0.5

0

0.5

1

1.5

Dunque, il treno d’impulsi e uguale a

1−Df

e quindi e una distribuzione temperata.Essendo L una distribuzione temperata, ha una trasformata di Fourier. La

continuita della trasformata di Fourier mostra che

F(

+∞∑n=−∞

δ(x− n)

)=

+∞∑n=−∞

e−iωn =+∞∑

n=−∞eiωn . (4.28)

In particolare cio mostra che la serie a secondo membro converge in S ′ nono-stante che non converga puntualmente.

Vogliamo ora trovare un’espressione diversa per la trasformata.Sviluppiamo la funzione f(x) in (4.27) in serie di Fourier. Si ottiene

f(x) = − 1

π

+∞∑n=1

1

nsin(2nπx) .

Questa serie converge in L2(−n, n) per ogni n. Mostriamo che essa convergeanche nel senso di S ′. Ignorando il fattore −1/π, consideriamo, per ogni ϕ ∈ S,

limN⟨⟨

N∑n=1

1

nsin(2nπx), ϕ⟩⟩ = lim

N

∫ +∞

−∞

[N∑n=1

1

nsin(2nπx)

]ϕ(x) dx

= − limN

∫ +∞

−∞

d

dx

[N∑n=1

1

2n2πcos(2nπx)

]ϕ(x) dx

Page 307: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 301

= limN

∫ +∞

−∞

[N∑n=1

1

2n2πcos(2nπx)

]ϕ′(x) dx =

∫ +∞

−∞

[+∞∑n=1

1

2n2πcos(2nπx)

]ϕ′(x) dx

grazie al Teorema della convergenza dominata. Dunque, la serie converge inS ′. La continuita della trasformata di Fourier mostra che la trasformata dif(x) puo calcolarsi scambiando la trasformata col segno di serie:

f(ω) = i+∞∑n=1

1

n[δ(ω − 2nπ)− δ(ω + 2nπ)] = i

∑n =0

1

nδ(ω − 2nπ)

= −i∑n =0

1

nδ(ω + 2nπ) .

Dunque, la trasformata del treno di impulsi e anche11

F (1−Df) = 2πδ(ω)− iωf(ω) = 2πδ(x) +∑n =0

ω

nδ(ω + 2nπ)

= 2πδ(ω) +∑n=0

2nπ

nδ(ω + 2nπ) = 2π

+∞∑n=−∞

δ(ω − 2nπ) . (4.29)

Questa e la forma piu comunemente usata per la trasformata del trenod’impulsi. Combinandola con la rappresentazione (4.28) si trova

2π+∞∑

n=−∞δ(ω − 2nπ) =

+∞∑n=−∞

e−iωn =+∞∑

n=−∞eiωn .

L’uguaglianza va intesa come uguaglianza in S ′; ossia, applicando i due membriad una ϕ ∈ S si trova lo stesso valore. Si ha quindi

2π⟨⟨+∞∑

n=−∞δ(ω − 2nπ), ϕ⟩⟩ = 2π

+∞∑n=−∞

⟨⟨δ(ω − 2nπ), ϕ⟩⟩

= 2π+∞∑

n=−∞ϕ(2nπ) = ⟨⟨

+∞∑n=−∞

eiωn, ϕ⟩⟩ =+∞∑

n=−∞⟨⟨eiωn, ϕ⟩⟩

=+∞∑

n=−∞

∫ +∞

−∞eiωnϕ(ω) dω =

+∞∑n=−∞

ϕ(−n) =+∞∑

n=−∞ϕ(n) .

Si e cosı trovata l’uguaglianza seguente, nota come Formula di Poisson:

2π+∞∑

n=−∞ϕ(2πn) =

+∞∑n=−∞

ϕ(n) .

11si ricordi che:1) la notazione δ(x) si usa per indicare che la distribuzione agisce sufunzioni della variabile x; 2) la notazione δ(x− a) si usa per indicare la distribuzione δa; 3)per ogni polinomio vale p(x)δ(x− a) = p(a)δ(x− a), si veda la (4.24).

Page 308: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

302 CAPITOLO 4. DISTRIBUZIONI E TRASFORMATA DI FOURIER

4.3.8 Avvertenza finale e ricapitolazione

Abbiamo trattato la trasformata di Fourier per il caso delle funzioni che di-pendono da una sola variabile. In pratica e necessario lavorare anche con latrasformata di Fourier di funzioni che dipendono da n variabili x1 , . . . , xn,n > 1. Si e gia detto che in questo caso la trasformata di Fourier e la funzioneancora di n variabili ξ1 , . . . , ξn. La trasformata di Fourier di f(x1 , . . . , xn) e

f(ξ1 , . . . , ξn) =∫IRne−i[x1ξ1+···+xnξn]f(x1 , . . . , xn) dx1 . . . dxn .

Praticamente nessun cambiamento va fatto a cio che abbiamo visto per lefunzioni di una variabile, salvo che la formula per l’antitrasformata e ora

f(x1 , . . . , xn) =1

(2π)n

∫IRnei[x1ξ1+···+xnξn]f(ξ1 , . . . , ξn) dξ1 . . . dξn .

Naturalmente questa formula vale sotto ipotesi alquanto restrittive ma,esattamente come nel caso delle funzioni di una sola variabile, essa si estendeal caso delle distribuzioni.

E’ importante notare che testi diversi usano definizioni lievemente diver-se della trasformata di Fourier. In particolare, nel caso di funzioni di unavariabile,

f(ω) =∫ +∞

−∞e−2πiωtf(t) dt oppure f(iω) =

1√2π

∫ +∞

−∞e−iωtf(t) dt .

Ovviamente questo non altera la teoria che abbiamo presentato, mentre leformule vengono lievemente diverse: differisco per un fattore a causa del fattoche le formule di inversione sono, rispettivamente,

f(t) =∫ +∞

−∞e+2πiωtf(ω) dω oppure f(t) =

1√2π

∫ +∞

−∞e+iωtf(t) d .

Piu raramente si trova la definizione

f(ω) =∫ +∞

−∞e+iωtf(t) dt .

Infine raccogliamo gli esempi di trasformate di Fourier che abbiamo visto:

Page 309: L. Pandolfi Politecnico di Torino Dipartimento di Matematicacalvino.polito.it/~lucipan/materiale_html/analisifunzionale.pdf · i Le abbreviazioni usate in questo testo sono di immediata

4.3. DISTRIBUZIONI TEMPERATE 303

f(t) f(ω)

e−|t| 21+ω2

χ[−T,T ](t)sinωTω

e−x2/2

√2πe−ω

2/2

eiαt 2πδα

sinαx −iπδα − δ−αcosαx πδα + δ−αδ 1

1 2πδ

Heaviside ϕ→∫+∞0 ϕ(ω) dω