Introduzione al formalismo matematico della meccanica ...

104
Introduzione al formalismo matematico della meccanica quantistica Marco Bramanti Dipartimento di Matematica, Politecnico di Milano 4 giugno 2020 Indice 1 Alcune propriet degli operatori lineari su spazi di Hilbert 8 1.1 Dominio di un operatore lineare ................... 9 1.2 Operatore aggiunto di un operatore lineare e continuo ...... 12 1.3 Operatori lineari illimitati simmetrici, aggiunti, autoaggiunti .. 15 1.4 Spazi di Sobolev hilbertiani ..................... 21 1.5 Spettro di un operatore lineare ................... 27 1.6 Operatori di proiezione ........................ 38 2 Richiami di calcolo delle probabilit 45 3 Il formalismo matematico della meccanica quantistica 55 3.1 Stati, osservabili, valori attesi. Gli operatori fondamentali .... 55 3.2 Misura di un osservabile, autovalori e autofunzioni ........ 67 3.2.1 Dallo stato del sistema al valore misurato ......... 67 3.2.2 Dalla misura di un osservabile allo stato del sistema ... 72 3.2.3 Quando il valore misurato non L un autovalore ...... 76 3.3 Equazione di Schrdinger. Evoluzione del sistema quantistico .. 79 3.3.1 Conservazione della normalizzazione ............ 80 3.3.2 Soluzione per separazione delle variabili e stati stazionari 81 3.3.3 Relazioni soddisfatte dai valori attesi di posizione e momento 82 3.3.4 Equazione unidimensionale della particella libera ..... 84 3.4 Principio di indeterminazione .................... 85 3.5 Legge della v.a. osservabile. Il teorema spettrale ......... 89 3.5.1 Legge di un osservabile .................... 89 3.5.2 Il teorema spettrale ..................... 96 1

Transcript of Introduzione al formalismo matematico della meccanica ...

Page 1: Introduzione al formalismo matematico della meccanica ...

Introduzione al formalismo matematicodella meccanica quantistica

Marco BramantiDipartimento di Matematica, Politecnico di Milano

4 giugno 2020

Indice

1 Alcune proprietà degli operatori lineari su spazi di Hilbert 81.1 Dominio di un operatore lineare . . . . . . . . . . . . . . . . . . . 91.2 Operatore aggiunto di un operatore lineare e continuo . . . . . . 121.3 Operatori lineari illimitati simmetrici, aggiunti, autoaggiunti . . 151.4 Spazi di Sobolev hilbertiani . . . . . . . . . . . . . . . . . . . . . 211.5 Spettro di un operatore lineare . . . . . . . . . . . . . . . . . . . 271.6 Operatori di proiezione . . . . . . . . . . . . . . . . . . . . . . . . 38

2 Richiami di calcolo delle probabilità 45

3 Il formalismo matematico della meccanica quantistica 553.1 Stati, osservabili, valori attesi. Gli operatori fondamentali . . . . 553.2 Misura di un osservabile, autovalori e autofunzioni . . . . . . . . 67

3.2.1 Dallo stato del sistema al valore misurato . . . . . . . . . 673.2.2 Dalla misura di un osservabile allo stato del sistema . . . 723.2.3 Quando il valore misurato non è un autovalore . . . . . . 76

3.3 Equazione di Schrödinger. Evoluzione del sistema quantistico . . 793.3.1 Conservazione della normalizzazione . . . . . . . . . . . . 803.3.2 Soluzione per separazione delle variabili e stati stazionari 813.3.3 Relazioni soddisfatte dai valori attesi di posizione e momento 823.3.4 Equazione unidimensionale della particella libera . . . . . 84

3.4 Principio di indeterminazione . . . . . . . . . . . . . . . . . . . . 853.5 Legge della v.a. osservabile. Il teorema spettrale . . . . . . . . . 89

3.5.1 Legge di un osservabile . . . . . . . . . . . . . . . . . . . . 893.5.2 Il teorema spettrale . . . . . . . . . . . . . . . . . . . . . 96

1

Page 2: Introduzione al formalismo matematico della meccanica ...

Presentazione. Queste note sono state scritte in vista di un corso da tener-si nel 2020 nell’ambito delle iniziative “Passion in Action” del Politecnico diMilano. Il corso è rivolto in particolare a studenti della Laurea Magistrale inIngegneria Nucleare che hanno già seguito il mio corso di Metodi Matematici perl’Ingegneria. Per chi seguisse questo corso senza aver seguito il corso di Metodi,ho riportato qui sotto un syllabus di prerequisiti. Mi è venuto naturale scriverequeste note pensandole come un ipotetico ultimo capitolo del mio testo “Metodidi Analisi Matematica per l’Ingegneria” [3], a cui perciò ho fatto spesso riferi-mento per i prerequisiti matematici. Il contenuto di queste note si basa invecesoprattutto su alcuni capitoli del testo di Hall “Quantum Theory for Mathe-maticians”[12], a cui rimando spesso per le dimostrazioni più impegnative, chequi non ho riportato, e per approfondimenti.

Ringraziamenti. Desidero ringraziare i colleghi che hanno letto questi appuntie hanno fatto osservazioni a riguardo: Matteo Passoni, Gabriele Grillo, FabrizioColombo; e ancora desidero ringraziare Matteo Passoni che ha creduto in questainiziativa.

Syllabus. I prerequisiti matematici necessari per comprendere queste note com-prendono, oltre ai contenuti dei corsi matematici di base, i seguenti argomenti.Nozioni di base della teoria della misura e dell’integrazione secondo Lebsegue.

Nozioni di base sugli spazi vettoriali normati, eventualmente completi, e suglispazi di Hilbert. Nozioni di base sugli operatori lineari continui tra spazi vetto-riali normati e sui funzionali lineari continui su uno spazio vettoriale normato.Convoluzione di funzioni, spazi di funzioni Lp (Rn), spazio di Schwartz S (Rn),trasformata di Fourier e sue proprietà per funzioni L1 (Rn) ,S (Rn) , L2 (Rn). Iproblemi di Sturm-Lioville saranno utilizzati come esempio illustrativo della teo-ria, anche se non sono un argomento essenziale. Infine, non utilizzerò la teoriadelle distribuzioni.Dal punto di vista fisico, mi aspetto che lo studente conosca la meccanica

quantistica molto meglio di me, anche se dal punto di vista strettamente logicoquesto non è necessario.

2

Page 3: Introduzione al formalismo matematico della meccanica ...

Introduzione

La data di nascita della meccanica quantistica è solitamente fissata nel biennio1925-1926, dopo una gestazione di 25 anni, iniziata nel 1900 con l’ipotesi diquantizzazione dell’energia avanzata da Planck per spiegare il fenomeno dellaradiazione del corpo nero. Non ripercorriamo qui le tappe storiche di quei25 anni fondamentali per la storia della fisica e precedenti la nascita vera epropria della meccanica quantistica. Descrizioni di quei fatti (spesso sotto iltitolo di “crisi della fisica classica”) si trovano in molti testi di fisica moderna,ad esempio [6, Introduzione], [12, Chap.1], [4, Cap.4], [10, Chap.1], oltre che inlibri di storia della scienza o di divulgazione scientifica. Qui mi interessa inveceaccennare brevemente ad alcune tappe della formalizzazione matematica dellameccanica quantistica. Per la ricostruzione seguente mi baso su [14, §2.4], [20,Preface, Chap. 1], [19], [11, “Historical Remarks”].Tra il 1925 e il 1926 furono proposte due diverse teorie della nascente mec-

canica quantistica. La prima, la cosiddetta “meccanica delle matrici”, fu for-mulata a Göttingen da Werner Heisenberg, Max Born, Pascual Jordan. Laseconda, la cosiddetta “meccanica ondulatoria”, fu formulata da Ernst (o Er-win) Schrödinger (università di Zurigo, poi Berlino), in una famosa serie di 4paper.Nella prima teoria, più algebrica, un concetto chiave è quello di operatore, in

senso matematico, che rappresenta un osservabile fisico. Così come, nell’algebralineare che si studia al prim’anno, un operatore lineare tra spazi vettoriali didimensione finita è rappresentato dalla moltiplicazione righe per colonne peruna matrice, analogamente gli operatori della “meccanica delle matrici” sonorappresentati da matrici con infinite righe e colonne. Lo stato di un sistemaè rappresentato da una successione numerica (coordinate di un punto in unospazio di dimensione infinita ma numerabile), e l’operatore agisce ancora comeprodotto righe per colonne. Così come l’ordinario prodotto di matrici non ècommutativo, non è commutativa neppure la composizione di due operatoridiversi. Fisicamente, questo significa che se misuriamo successivamente duediverse grandezze fisiche, l’ordine in cui effettuiamo le due misurazioni è impor-tante: la misurazione infatti perturba il sistema osservato. Questo fatto, comenoto, è legato al principio di indeterminazione di Heisenberg, che in questa for-mulazione della teoria ha un’importanza centrale. La relazione tra l’idea fisicadi indeterminazione e l’idea matematica di non commutatività di due operatorifu suggerita per la prima volta da Dirac (Università di Cambridge) e Jordan nel1927. Le successioni numeriche che nella meccanica delle matrici rappresentanostati del sistema sono, più precisamente, successioni cn∞n=1 per cui si abbia∑∞n=1 |cn|

2< ∞, ossia, col linguaggio odierno, elementi dello spazio di Hilbert

“discreto”`2.Sia in questa teoria che in quella di Schrödinger, un obiettivo fondamen-

tale è determinare i possibili livelli energetici del sistema, i corrispondenti statistazionari, e calcolare le probabilità di transizione. Nella meccanica delle matri-ci, i livelli energetici sono visti come autovalori di matrici infinite. Nella teoriadi Schrödinger invece il problema agli autovalori che permette di determinare

3

Page 4: Introduzione al formalismo matematico della meccanica ...

i livelli energetici è quello relativo a un operatore differenziale, l’operatore diSchrödinger appunto, le cui autofunzioni sono gli stati stazionari. Queste fun-zioni sono elementi di uno spazio L2 (Rn), quindi uno spazio di Hilbert “contin-uo”. La “funzione d’onda”che entra nell’equazione di Schrödinger ha la ben notainterpretazione probabilistica legata alla densità di probabilità di transizione delsistema.Ora, è significativo che queste due teorie, formulate quasi contemporanea-

mente, sono oggettivamente molto diverse, pur pervenendo a previsioni fisichesostanzialmente uguali e corrette. Quindi il buon senso suggerisce che dovreb-bero essere due modi diversi di raccontare la stessa storia. Dal punto di vistamatematico, quest’idea è supportata dal teorema di Riesz-Fischer, già noto aitempi, che afferma (detto con linguaggio attuale) che gli spazi di Hilbert `2 eL2 (Rn), in cui le due teorie sono ambientate, sono isomorfi tra loro. Più ingenerale, oggi sappiamo1 che qualsiasi spazio di Hilbert H dotato di un sistemaortonormale completo numerabile ψk∞k=1 è isomorfo a `

2, e l’isomorfismo è re-alizzato dall’operatore F (trasformata di Fourier “astratta”) che a ogni elementof ∈ H associa la successione

fk

∞k=1

dei suoi coeffi cienti di Fourier, dati da

fk = 〈ψk, f〉 . Tradurre quest’idea in una effettiva dimostrazione dell’equivalenzalogica delle due teorie quantistiche, però, non è un esercizio facile.Il primo a porsi questo problema fu Schrödinger, che a una dimostrazione del-

l’equivalenza delle due teorie dedicò un lavoro già nel 1926. Il quadro funzionaledi Schrödinger era quello delle funzioni continue con norma L2 finita, quindiuno spazio vettoriale normato non completo, il che è un elemento che rendenon soddisfacente la sua dimostrazione. Poco dopo Dirac e Jordan proposeroun’altra unificazione delle due teorie, che si rivelò molto influente nell’ambientedei fisici. Il testo [8] di Dirac, del 1930, sarebbe diventato un riferimento au-torevole e nel 1933 Dirac e Schrödinger condivisero il premio Nobel per la fisica.La presentazione di Dirac era però ancor più gravemente mancante di rigorematematico. Infatti, l’idea soggiacente2 è quella di mostrare l’equivalenza tra lameccanica delle matrici, “discreta”, e la meccanica ondulatoria, “continua”, conun processo di limite che trasforma gli operatori della meccanica delle matriciin operatori integrali nel continuo, ossia operatori del tipo

Tf (x) =

∫k (x, y) f (y) dy.

Il problema è che questi operatori integrali dovrebbero rappresentare anche l’op-eratore di Schrödinger, che è un operatore differenziale. Ora, nessun operatoredifferenziale si può rappresentare come operatore integrale! Questo punto non èuna “finezza”matematica, ma un’ostruzione logica fondamentale: gli operatoridifferenziali sono locali (il valore di Tf in un punto x dipende solo dai valoridi f nei punti “molto vicini”a x) mentre gli operatori integrali sono globali (ilvalore di Tf in un punto x dipende dai valori di f in tutti i punti, anche “molto

1v. [3, Teorema 4.9]2Questa illustrazione dell’idea di Dirac è quella che dà von Neumann in [20, Chap.1, §3]

4

Page 5: Introduzione al formalismo matematico della meccanica ...

lontani”da x). Dirac aggirò elegantemente il problema introducendo come pos-sibili nuclei integrali k (x, y) le sue “funzioni”delta di Dirac e, peggio ancora,derivate di delta di Dirac. Si sarebbe dovuto aspettare una ventina d’anni, però,prima che intorno al 1950 Laurent Schwartz [17], [18], con la sua teoria delledistribuzioni3 , desse diritto di cittadinanza a questi oggetti matematici. Neglianni 1930, quando Dirac formulò la sua teoria, dal punto di vista del rigorematematico questa era semplicemente un delirio.Cosa che non mancò di sottolineare John von Neumann4 , che si trovava a

Göttingen, come Heisenberg, Born, Jordan, e come Hilbert. Ricordiamo cheDavid Hilbert è stato il punto di riferimento del movimento matematico che,agli inizi del 1900, ha propugnato l’utilizzo del metodo assiomatico come stradaper fare chiarezza sui fondamenti delle varie discipline. Nel 1899 pubblicò lasua celebre opera “Fondamenti della Geometria”, in cui presentava in forma diteoria assiomatica moderna la geometria euclidea. In un certo senso si può direche Hilbert sia stato il primo a “osare”qualche critica a Euclide sul piano delrigore logico, 2200 anni dopo Euclide. Celebre è l’intervento di Hilbert al primoCongresso Internazionale dei Matematici, tenuto nel 1900 a Parigi. In quell’in-tervento Hilbert pose alla comunità matematica 23 problemi su cui, a suo dire,si sarebbe misurata la matematica del secolo che stava iniziando. Alcuni diquesti problemi sono formulati in modo molto vago, ma molti altri furono dellesfide precise e impegnative, risolte a volte molti decenni dopo e in un paio dicasi ancora aperti (come l’“ipotesi di Riemann”). Il sesto problema di Hilbert(certamente uno di quelli vaghi, ma interessanti), consisteva nell’assiomatizzareanche le teorie fisiche5 . Fu quindi naturale per von Neumann cercare la col-laborazione di Hilbert, e del fisico Nordheim, per lavorare a un fondamentoassiomatico della meccanica quantistica. Ne nacque un primo paper a tre no-mi, nel 1927. Von Neumann proseguì poi con vari lavori su questo tema dal1929 in poi. Fu lui (non Hilbert!) a sviluppare per primo la teoria astrattadegli “spazi di Hilbert”. Apriamo una parentesi su questo punto. Hilbert, neglianni 1904-1910 si era occupato di problemi di autovalori e autofunzioni nel con-testo delle equazioni integrali. In quell’ambito giocavano un ruolo importantele successioni xn∞n=1 per le quali

∑|xn|2 < ∞. Fu Erhard Schmidt, allievo

di dottorato di Hilbert, a riconoscere che lo spazio di successioni `2 aveva unacerta struttura geometrica di ortogonalità, e coniò per questo spazio il nomedi “spazio di Hilbert”, che sarebbe stato ripreso da von Neumann più tardiper indicare la struttura astratta che anche oggi porta questo nome. Nella for-

3per la quale Schwartz ricevette la medaglia Fields nel 1950.4Von Neumann scrive: “The method of Dirac (and this is overlooked today in a great part

of quantum mechanical literature, because of the clarity and elegance of this theory) in no waysatisfies the requirements of mathematical rigor -not even if these are reduced in a naturaland proper fashion to the extent common elsewhere in theoretical physics”. [20, p. IX].Precisiamo che, anche facendo uso del concetto di distribuzione, e quindi dando senso agli

oggetti matematici “delta di Dirac” e “derivata di una delta di Dirac”, rimane impossibilerappresentare un operatore differenziale come operatore integrale.

5Ci fu chi lo prese presto sul serio: ad esempio, nel 1909 Carathéodory scrisse un saggiosui fondamenti assiomatici della termodinamica, [5]. L’opera originale è in tedesco. Unatraduzione inglese si può trovare nel libro [13, Chap. 12].

5

Page 6: Introduzione al formalismo matematico della meccanica ...

mulazione di von Neumann, più precisamente, si parla di spazio di Hilbert, alsingolare, in quanto agli assiomi di spazio di Hilbert che anche oggi diamo (ossiaessere uno spazio vettoriale normato completo, in cui la norma proviene da unprodotto scalare), lui aggiunge un’ulteriore richiesta: che lo spazio sia dotato diun sistema ortonormale completo numerabile. In effetti tutti gli spazi di Hilbertdi questo tipo sono isomorfi a `2 e quindi fra loro6 . Perciò, da un punto di vistaastratto, esiste sostanzialmente un solo spazio di Hilbert, nel quadro teorico divon Neumann7 . I risultati delle ricerche di von Neumann di vari anni confluirononel suo libro del 1932 Matematische Grundlagen der Quantenmechanik (Fonda-menti Matematici della Meccanica Quantistica) [20], che si può considerare laprima formalizzazione matematicamente rigorosa della meccanica quantistica8

e, al tempo stesso, l’atto di nascita della teoria degli spazi di Hilbert e deglioperatori lineari non limitati autoaggiunti su spazi di Hilbert.Possiamo arrischiare la seguente analogia. Così come Newton, per far nascere

la fisica classica, aveva contestualmente inventato il calcolo infinitesimale, cosìvon Neumann, per dare un fondamento alla meccanica quantistica, contestual-mente creò9 questa disciplina matematica astratta moderna. Con due impor-tanti differenze. La prima è che mentre Newton effettivamente creò “di per-sona” l’impianto della sua fisica, von Neumann sistemò una teoria fisica che sidoveva ad altri ricercatori. La seconda è che mentre il calcolo infinitesimale diNewton sarebbe stato posto su basi rigorose quasi 150 anni dopo (con Cauchy,Weierstrass,...), la teoria di von Neumann è matematicamente già matura. VonNeumann raccoglieva i frutti dello sviluppo dell’analisi matematica astratta dei25-30 anni precedenti, che partiva dalla teoria della misura e dell’integrazionedi Lebesgue, e si sviluppava poi nel senso di uno studio sempre più generaledi strutture astratte. Nel 1932, contemporaneamente al testo di von Neumann(in tedesco), apparvero altre due opere fondamentali per l’analisi funzionale:l’opera, in francese, Théorie des Opérations Linéaires di Stefan Banach, polac-co, sulla teoria degli operori lineari su “spazi di Banach” (da lui chiamati piùumilmente “spazi di tipo B”) e l’opera, in inglese, Linear Transformations onHilbert Space10 , di Marshall Stone, statunitense, sugli operatori lineari su spazidi Hilbert, come von Neumann. L’accelerazione della storia della scienza ap-

6Ad esempio, un sistema ortogonale completo numerabile di L2 (0, 2π) è costituito dagliesponenziali complessi exp (inx)n∈Z; uno di L2 (R) è costituito dalle funzioni di HermiteHn (x) e−x

2/2∞n=0

dove Hn sono i Polinomi di Hermite. Si veda [3, §4.4, 4.7.2].7Si può dimostrare, più in generale, che se si dà la definizione moderna di spazio di

Hilbert (spazio vettoriale dotato di prodotto scalare, completo rispetto alla norma del prodottoscalare), allora esiste sempre un s.o.n.c., non necessariamente numerabile, però. La cardinalitàdel s.o.n.c. è tutto ciò che distingue, a meno di isomorfismi, le possibili strutture diverse dispazio di Hilbert.

8Questo è esattamente lo scopo dell’opera, come dichiarato esplicitamente nelle prime righedella prefazione:“The object of this book is to present the new quantum mechanics in a unified representation

which, so far as it is possible and useful, is mathematically rigorous”. [20, Preface, p.VII].9o per lo meno: diede un importante contributo a creare, insieme al lavoro di vari altri

matematici di spicco di quell’epoca, alcuni dei quali ora citeremo.10 si noti che anche qui si usa il singolare per lo Spazio di Hilbert.

6

Page 7: Introduzione al formalismo matematico della meccanica ...

pare notevole agli inizi del ’900. Con la pubblicazione di questi tre testi si puòdire che l’analisi funzionale abbia raggiunto lo status di una disciplina matura edai contorni precisi. Un passo ulteriore nella teoria degli operatori lineari saràl’opera in tre volumi Theory of Linear Operators del 1956 di N. Dunford e J.T. Schwartz (da non confondere con L. Schwartz, autore della teoria delle dis-tribuzioni). Per qualche particolare in più sulle tappe dello sviluppo dell’analisifunzionale di inizio ’900 rimando a [11, “Historical Remarks”].Riguardo all’accoglienza del libro di von Neumann, cito il seguente passo

degli storici Israel e Millàn Gasca:

Il libro divenne l’esposizione standard dei principi della mecca-nica quantistica e il prestigio di von Neumann fu ulteriormente con-solidato quando il suo trattamento matematico dimostrò la sua ca-pacità di render ragione dei successivi sviluppi della teoria, come lameccanica quantistica relativistica e, almeno parzialmente, la teo-ria quantistica dei campi. La formalizzazione di von Neumann ebbeun’influenza molto più limitata sulla pratica di ricerca -la presen-tazione di Dirac era in effetti usata molto più comunemente tra ifisici nello sviluppo della meccanica quantistica. In effetti il legametra fisica teorica e matematica, che era sembrata così solida all’iniziodel secolo, si indebolì, con l’aprirsi di un gap, sia psicologico checulturale, che si allargò progressivamente tra le due discipline (Fad-deev 1990). E’ significativo a questo riguardo che il libro di vonNeumann fu tradotto in Inglese solo nel 1955 -anche se l’edizioneoriginale in Tedesco era stata ristampata negli Stati Uniti nel 1943-.[14, pp.38-39]

Nella tradizione universitaria italiana, credo si possa dire che la presentazionedella teoria degli operatori non limitati su spazi di Hilbert e il relativo utilizzonella presentazione del formalismo della meccanica quantistica, siano parte delbagaglio standard dei laureati in fisica, ma solitamente non lo sono per i laureatiin ingegneria (e non sempre lo sono per i laureati in matematica). Molte presen-tazioni didattiche della meccanica quantistica evitano almeno in parte questoformalismo matematico, a favore di presentazioni che seguono argomentazionidi tipo più fisico-fenomenologico. Anche queste presentazioni non possono peròsfuggire all’utilizzo, almeno parziale, di un certo linguaggio e certe affermazionimatematiche, che rischiano di assumere un aspetto un po’misterioso e arbi-trario. Queste lezioni si propongono di introdurre lo studente alla comprensionedella formulazione matematica degli assiomi della meccanica quantistica e dellatraduzione matematica di alcuni suoi concetti fondamentali, facendo apprezzare(si spera) la coerenza logica, l’unitarietà, e in ultima analisi la non arbitrari-età della formalizzazione matematica della teoria. Per far questo è necessario,partendo da una base matematica di analisi funzionale e teoria della misurache si assume lo studente già possieda, di spingere un po’oltre gli strumentimatematici, nella direzione della teoria degli operatori lineari non continui suspazi di Hilbert. Dopo di che si potranno introdurre gli assiomi (matematici)

7

Page 8: Introduzione al formalismo matematico della meccanica ...

della meccanica quantistica, e rivisitare dal punto di vista matematico alcuniconcetti fondamentali che lo studente probabilmente già conosce dal punto divista fisico.Infine, per circoscrivere il campo di questo corso, chiariamo che il con-

testo fisico delle lezioni è limitato allo studio di una singola particella quan-tistica, priva di spin, non relativistica, in moto sulla retta oppure nello spaziotridimensionale.

1 Alcune proprietà degli operatori lineari su spazidi Hilbert

In questa prima sezione discuteremo alcune proprietà degli operatori lineari,non necessariamente limitati11 , su spazi di Hilbert. Gli spazi di Hilbert sarannoconsiderati sempre sul campo complesso. Conviene ricordare le proprietà delprodotto scalare 〈·, ·〉 in questo caso12 : se H è uno spazio di Hilbert su C, perogni f, g, h ∈ H,λ ∈ C, si ha:

〈f + g, h〉 = 〈f, h〉+ 〈g, h〉〈h, f + g〉 = 〈h, f〉+ 〈h, g〉〈f, g〉 = 〈g, f〉〈f, λg〉 = λ 〈f, g〉〈λf, g〉 = λ 〈f, g〉〈f, f〉 ≥ 0 e (〈f, f〉 = 0⇔ f = 0) .

La relazione tra prodotto scalare e norma è:

‖f‖H =√〈f, f〉.

Così pure, quando lo spazio di Hilbert è uno spazio di funzioni (tipicamente,L2 (Ω) per qualche dominio Ω), le funzioni si considereranno sempre a valoricomplessi, e il prodotto scalare in L2 (Ω) sarà

〈f, g〉 =

∫Ω

f (x)g (x) dx,

11Si ricordi che “operatore lineare limitato” è sinonimo di “operatore lineare continuo”. Sirimanda al [3, Cap.3, §3.1] per le definizioni rilevanti.12Scriviamo queste proprietà nella forma in cui le utilizzeremo nel seguito, seguendo la

convenzione che è più comune sui testi di fisica, ed è diversa da quella che è più comune suitesti di matematica, in cui solitamente si chiede

〈λf, g〉 = λ 〈f, g〉

〈f, λg〉 = λ 〈f, g〉 ,

e il prodotto scalare su L2 (Ω) si definisce come

〈f, g〉 =

∫Ωf (x) g (x)dx.

8

Page 9: Introduzione al formalismo matematico della meccanica ...

col coniugato sul primo fattore f .

1.1 Dominio di un operatore lineare

Uno degli aspetti su cui si differenzia lo studio degli operatori lineari limitati daquello degli operatori lineari non limitati è l’importanza del concetto di dominiodell’operatore. Spesso un operatore lineare continuo su uno spazio di Hilbert, opiù in generale di Banach, è definito in modo naturale su tutto lo spazio. Adesempio, un operatore di convoluzione

T : Lp (R)→ Lp (R)

T : f 7→ k ∗ f,

dove k ∈ L1 (R) è una funzione fissata, è un operatore lineare continuo suLp (R), per qualsiasi p ∈ [1,∞], e l’integrale di convoluzione, come abbiamovisto (Teorema di Young) è ben definito per qualsiasi k ∈ L1 (R) e f ∈ Lp (R).Oppure, la trasformata di Fourier su L1 (R), è definita da

F : L1 (R)→ C0∗ (R)

F : f (x) 7→∫Rf (x) e−2πixξdx,

dove l’integrale che definisce Ff ha senso per ogni funzione f nello spazio diBanach L1 (R).

Altre volte invece avviene che un operatore lineare continuo sia definito suuno spazio di Banach o di Hilbert X con un procedimento in due passi: primaviene definito su un certo sottospazio vettoriale X0 (solitamente di funzioni piùregolari), che è propriamente contenuto in X, ma è denso in X (cioè ogni ele-mento di X può essere approssimato bene quanto si vuole, nella norma di X, daun elemento di X0), e successivamente viene esteso a X con un procedimento dilimite. E’quanto abbiamo visto (v. [3, §§7.4.1-7.4.2]) quando abbiamo definitola trasformata di Fourier in L2 (Rn): si considera prima il sottospazio vettorialeS (Rn) delle funzioni a decrescenza rapida, che è denso in L2 (Rn), ma d’altrocanto è costituito da funzioni anche L1-integrabili, per le quali la definizione ditrasformata di Fourier su L1 ha senso; si prova quindi che l’operatore

F : S (Rn)→ S (Rn)

è lineare continuo nella norma di L2 (Rn), e sfruttando questo fatto (e la densità)si mostra che F può essere esteso a tutto L2 (Rn) in modo unico, preservandola proprietà di essere lineare e continuo. Questo procedimento ha una validitàdel tutto generale:

Teorema 1.1 Siano X,Y spazi vettoriali normati, Y completo, X0 un sot-tospazio vettoriale di X denso in X e sia T : X0 → Y lineare e continuo. Alloraesiste un unico operatore T : X → Y lineare continuo che estende T a X, cioètale che T f = Tf per ogni f ∈ X0. Inoltre T e T hanno la stessa norma.

Il teorema si applica, in particolare, ai funzionali lineari (ossia al caso Y =K) che sono continui su un sottospazio denso X0 di X.

9

Page 10: Introduzione al formalismo matematico della meccanica ...

Dimostrazione. Sia x ∈ X. Poiché X0 è denso in X, esiste una successionexn∞n=1 ⊂ X0 tale che ‖xn − x‖X → 0. Vogliamo definire T x ponendo

T x = limn→∞

Txn

dove Txn ha senso perché xn ∈ X0 e T è definito in X0. Il punto è provareche la successione Txn∞n=1 è convergente in Y . Poiché Y è di Banach, bastaverificare che Txn∞n=1 è di Cauchy in Y . Poiché T è lineare continuo si ha:

‖Txn − Txm‖Y = ‖T (xn − xm)‖Y ≤ ‖T‖ ‖xn − xm‖X → 0

perché xn∞n=1 è convergente (a x) e quindi di Cauchy. Dunque Txn∞n=1 è di

Cauchy e quindi converge a un certo y ∈ Y . Porremo

T x = y.

Dobbiamo però verificare che la definizione sia indipendente dalla scelta dellasuccessione approssimante, cioè: se x∗n

∞n=1 ⊂ X0 è un’altra successione tale

che ‖x∗n − x‖X → 0, dobbiamo provare che è ancora Tx∗n → y. Ma questo segueancora dal fatto che T è lineare continuo, perché

‖Txn − Tx∗n‖Y = ‖T (xn − x∗n)‖Y ≤ ‖T‖ ‖xn − x∗n‖X → 0

in quanto entrambe le successioni xn, x∗n hanno lo stesso limite x.Dunque T x è ben definito in tutto X, ed è lineare per la linearità del limite

e dell’operatore T di partenza: se x, x′ ∈ X e λ, λ′ ∈ C, prese due successionixn∞n=1 , x′n

∞n=1 ⊂ X0 tali che xn → x e x′n → x′ (quindi anche λxn+λ′x′n →

λx+ λ′x′) si ha,

T (λx+ λ′x′) =per def. di T

limn→∞

T (λxn + λ′x′n) =per linearità di T

limn→∞

(λTxn + λ′Tx′n)

=per linearità del limite

λ limn→∞

Txn + λ′ limn→∞

Tx′n =per def. di T

λTx+ λ′T x′.

perciòT (λx+ λ′x′) = λTx+ λ′T x′,

ossia T è lineare. L’operatore T è anche continuo perché se xn∞n=1 ⊂ X0 ètale che xn → x, per continuità di T su X0 si ha

‖Txn‖Y ≤ ‖T‖ ‖xn‖Xe, passando al limite nella disuguaglianza,∥∥∥T x∥∥∥

Y≤ ‖T‖ ‖x‖X

da cui T è continuo e∥∥∥T∥∥∥ ≤ ‖T‖. D’altro canto per definizione di norma di un

operatore,∥∥∥T∥∥∥ ≥ ‖T‖ perché

∥∥∥T∥∥∥ = supx∈X

∥∥∥T x∥∥∥Y

‖x‖X≥ supx∈X0

‖Tx‖Y‖x‖X

= ‖T‖

10

Page 11: Introduzione al formalismo matematico della meccanica ...

in quanto il sup che definisce∥∥∥T∥∥∥ è fatto su un insieme più grande di funzioni

(X anziché X0) rispetto a quello che definisce ‖T‖.In conclusione,

∥∥∥T∥∥∥ = ‖T‖. Infine, l’estensione trovata è unica perché comesi è visto dalla costruzione, i valori di T in X sono necessariamente determinatidai valori di T in X0.

Nel seguito studieremo operatori lineari definiti su uno spazio di HilbertH, oppure su un sottospazio denso di H, a valori in H. Nel secondo caso, inbase al teorema precedente, se T è continuo, si può ancora estendere a tuttoH, vedendolo come operatore T : H → H. Se T è lineare ma non continuo, ilteorema precedente non si applica, e non c’è un modo ovvio di estendere T atutto H se esso è inizialmente definito su un sottospazio di H. In questo casoscriveremo

T : D (T )→ H

dove D (T ), detto dominio dell’operatore T , è un sottospazio vettoriale di H,solitamente denso in H. Molti operatori lineari non continui su uno spazio diHilbert H come L2 (R), ad esempio gli operatori differenziali, hanno la lorodefinizione naturale su un sottospazio di funzioni più regolari, che è denso mapropriamente contenuto in H. Questo è il motivo per cui nello studio deglioperatori lineari non limitati entra in modo importante il concetto di dominiodi un operatore, che invece non appare come un concetto così importante finchési studiano operatori lineari continui.

Esempio 1.1 In H = L2 (R), sia

T : f (x) 7→ xf (x) .

T è definito ad esempio su

D (T ) =f ∈ L2 (R) : xf ∈ L2 (R)

.

Poiché D (T ) ⊃ C∞0 (R) che è denso in L2 (R), a maggior ragione D (T ) è densoin L2 (R).L’operatore è ovviamente lineare, e non è continuo. Per essere continuo

infatti dovebbe valere ∫R|xf (x)|2 dx ≤ c

∫R|f (x)|2 dx

con c indipendente da f . Applichiamo la disuguaglianza precedente a fn (x) =χ[n,n+1] (x) . ∫ n+1

n

x2dx ≤ c∫ n+1

n

dx

cioè(n+ 1)

3 − n3

3≤ c per ogni n,

falso perché la successione a primo membro tende a +∞ come n2.

11

Page 12: Introduzione al formalismo matematico della meccanica ...

1.2 Operatore aggiunto di un operatore lineare e continuo

Il concetto di operatore aggiunto di un operatore lineare non limitato sarà fon-damentale nel seguito. Per gradualità, cominciamo a introdurlo nel caso piùsemplice di un operatore lineare e continuo.

Teorema 1.2 (Operatore aggiunto) Sia T : H → H un operatore linearecontinuo. Esiste uno e un solo operatore T ∗ : H → H lineare continuo chesoddisfa la relazione

〈f, Tg〉 = 〈T ∗f, g〉 per ogni f, g ∈ H.

Inoltre ‖T ∗‖ = ‖T‖.

Dimostrazione. Fissiamo f ∈ H, e consideriamo il funzionale su H definitoda:

Λ : H → CΛ : g 7→ 〈f, Tg〉 .

E’ovviamente lineare (in g), per la linearità di T e la linearità del prodottoscalare rispetto al secondo fattore. Per la disuguaglianza di Cauchy-Schwartz ela continuità di T ,

|Λg| = |〈f, Tg〉| ≤ ‖f‖ ‖Tg‖ ≤ ‖f‖ ‖T‖ ‖g‖ ,

in particolare Λ è continuo, con ‖Λ‖ ≤ ‖T‖ ‖f‖ perciò per il teorema di Rieszesiste h ∈ H tale che

〈f, Tg〉 = Λg = 〈h, g〉

con‖h‖ = ‖Λ‖ ≤ ‖T‖ ‖f‖ .

Ponendoh = T ∗f,

risulta definito l’operatore T ∗ su H, che soddisfa

〈f, Tg〉 = 〈T ∗f, g〉 per ogni f, g ∈ H.

Dall’identità precedente si legge facilmente che T ∗ è lineare, inoltre dal confrontotra le relazioni

‖h‖ ≤ ‖T‖ ‖f‖h = T ∗f

si ha‖T ∗f‖ ≤ ‖T‖ ‖f‖

12

Page 13: Introduzione al formalismo matematico della meccanica ...

perciò T ∗ è lineare continuo, con norma ‖T ∗‖ ≤ ‖T‖ . D’altro canto è facilerendersi conto che iterando il discorso e costruendo l’aggiunto di T ∗ si ottiene

T ∗∗ = T.

Infatti dall’uguaglianza〈f, Tg〉 = 〈T ∗f, g〉

prendendo il coniugato di ambo i membri si ha

〈Tg, f〉 = 〈g, T ∗f〉

per ogni f, g ∈ H, da cui T ∗∗ = T . Poiché per quanto dimostrato in precedenza‖T ∗∗‖ ≤ ‖T ∗‖, si conclude ‖T‖ ≤ ‖T ∗‖ e quindi ‖T‖ = ‖T ∗‖.

Definizione 1.1 L’operatore T ∗ costruito nel teorema precedente si dice ope-ratore aggiunto di T . Se T ∗ = T si dice che T è autoaggiunto.

Esempio 1.2 Sia

Tf (x) =

∫Rk (x, y) f (y) dy

e supponiamo che ∫R

∫R|k (x, y)|2 dxdy <∞.

Si dice allora che k è un nucleo di Hilbert-Schmidt e T un operatore integraledi Hilbert-Schmidt. Sappiamo che (v. [3, Teor. 3.3. cap.3])

T : L2 (R)→ L2 (R)

è lineare continuo. L’operatore aggiunto

T : L2 (R)→ L2 (R)

è quello per cui risulta〈f, Tg〉 = 〈T ∗f, g〉

cioè ∫Rf (x)

(∫Rk (x, y) g (y) dy

)dx =

∫Rg (y)T ∗f (y)dy.

Scambiando l’ordine di integrazione a primo membro (teorema di Fubini-Tonelli),∫Rg (y)

(∫Rk (x, y) f (x)dx

)dy

si riconosce che

T ∗f (y) =

∫Rk (x, y) f (x)dx

13

Page 14: Introduzione al formalismo matematico della meccanica ...

da cui, prendendo il coniugato,

T ∗f (y) =

∫Rk (x, y)f (x) dx.

Scambiando i nomi delle variabili (per confrontare meglio con la definizione diTf (x)) si ha

T ∗f (x) =

∫Rk (y, x)f (y) dy.

Si riconosce quindi che T ∗ è un operatore integrale simile a T , ma avente nucleok (y, x) invece che k (x, y). In particolare, se il nucleo k soddisfa la relazione

k (y, x) = k (x, y) ,

l’operatore risulta autoaggiunto. Questo accade, ad esempio, se k ha valori realied è simmetrico nelle due variabili, cioè k (y, x) = k (x, y).

Esercizio 1.1 SiaF : L2 (Rn)→ L2 (Rn)

l’operatore trasformata di Fourier. Calcolare l’operatore aggiunto F∗ di F ,verificando che

F∗f (x) = Ff (−x) per ogni f ∈ L2 (Rn) .

(In particolare, F non è autoaggiunto).

Esercizio 1.2 SiaT : L2 (Rn)→ L2 (Rn)

l’operatore definito daTf (x) = m (x) f (x)

dove m ∈ L∞ (Rn) è una funzione assegnata. Si dice che T è un operatoredi moltiplicazione. Dopo aver verificato che T è lineare continuo su L2 (Rn),calcolare l’operatore aggiunto T ∗ verificando che

T ∗f (x) = m (x)f (x) .

In particolare, se m (ξ) ha valori reali l’operatore T è autoaggiunto.

Esercizio 1.3 SiaT : L2 (Rn)→ L2 (Rn)

l’operatore definito da

Tf = F−1(m (ξ) f (ξ)

)dove m ∈ L∞ (Rn) è una funzione assegnata. Si dice che T è un operatoremoltiplicatore (cfr. con l’esempio precedente). Dopo aver verificato che T èlineare continuo su L2 (Rn), calcolare l’operatore aggiunto T ∗ verificando che

T ∗f = F−1(m (ξ)f (ξ)

).

In particolare, se m (ξ) ha valori reali l’operatore T è autoaggiunto.

14

Page 15: Introduzione al formalismo matematico della meccanica ...

1.3 Operatori lineari illimitati simmetrici, aggiunti, au-toaggiunti

Vogliamo dare la definizione di operatore aggiunto di un operatore lineare il-limitato (e quindi la definizione di operatore autoaggiunto). Rivedendo la di-mostrazione del Teorema 1.2, si vede che se viene meno la continuità dell’oper-atore T non è ovvio che si possa definire l’aggiunto T ∗ su tutto H o comunquesu un dominio di immediata individuazione. Cominciamo a dare la seguente

Definizione 1.2 (Operatore simmetrico) Un operatore lineare

T : D (T )→ H

si dice simmetrico se〈Tf, g〉 = 〈f, Tg〉

per ogni f, g ∈ D (T ).

Questa definizione “ricorda” la definizione di operatore autoaggiunto dataper operatori lineari continui; tuttavia come vedremo la definizione di operatoreautoaggiunto, per operatori illimitati, è un po’più complicata.

Esempio 1.3 Consideriamo ancora, in H = L2 (R), l’operatore

T : f (x) 7→ xf (x)

definito suD (T ) =

f ∈ L2 (R) : xf ∈ L2 (R)

.

Per f, g ∈ D (T ) ,

〈f, Tg〉 =

∫Rf (x)xg (x) dx

〈Tf, g〉 =

∫Rxf (x)g (x) dx =

∫Rf (x)xg (x) dx

perché essendo x reale, x = x. Quindi T è simmetrico.

Esempio 1.4 Consideriamo, in H = L2 (R), l’operatore di derivata

T : f (x) 7→ f ′ (x)

definito ad esempio suD (T ) = C1

0 (R) .

Per f, g ∈ C10 (R) l’integrazione per parti dà

〈Tf, g〉 =

∫Rf ′ (x)g (x) dx = −

∫Rf (x)g′ (x) dx = −〈f, Tg〉 ,

perciò (per colpa del segno meno) l’operatore T non è simmetrico.

15

Page 16: Introduzione al formalismo matematico della meccanica ...

Esempio 1.5 Se ora definiamo, in H = L2 (R), l’operatore

T : f (x) 7→ if ′ (x)

definito ancora suD (T ) = C1

0 (R) ,

per f, g ∈ C10 (R) l’integrazione per parti (e il fatto che il coniugato di i è −i)

〈Tf, g〉 =

∫Rif ′ (x)g (x) dx =

∫R−if (x)

′g (x) dx =

∫Rif (x)g′ (x) dx = 〈f, Tg〉 ,

perciò quest’operatore è simmetrico.

Gli operatori simmetrici hanno la seguente proprietà, che li renderà utili peri nostri scopi:

Proposizione 1.1 Se T è un operatore lineare

T : D (T )→ H

allora T è simmetrico se e solo se

〈f, Tf〉 ∈ R per ogni f ∈ D (T ) (1.1)

o anche se e solo se

〈f, Tf〉 = 〈Tf, f〉 per ogni f ∈ D (T ) . (1.2)

Dimostrazione. Supponiamo prima che T sia simmetrico; allora ovviamentevale (1.2); proviamo che vale (1.1). Sappiamo che per ogni f ∈ D (T ) si ha

〈Tf, f〉 = 〈f, Tf〉 .

D’altro canto per le proprietà del prodotto scalare,

〈Tf, f〉 = 〈f, Tf〉,

quindi〈f, Tf〉 = 〈f, Tf〉,

perciò questo numero è reale.Viceversa, supponiamo ora che valga (1.1). Poiché per le proprietà del

prodotto scalare è〈f, Tf〉 = 〈Tf, f〉,

se 〈f, Tf〉 è reale anche il suo coniugato è reale, perciò 〈Tf, f〉 = 〈Tf, f〉 edunque vale (1.2). Vogliamo dimostrare che da questo fatto segue che

〈f, Tg〉 = 〈Tf, g〉 per ogni f, g ∈ D (T ) .

16

Page 17: Introduzione al formalismo matematico della meccanica ...

Applicando l’uguaglianza (1.2) a f + λg (con f, g ∈ D (T ) e λ ∈ C) si ha

〈f + λg, T (f + λg)〉 = 〈T (f + λg) , f + λg〉 .

Sviluppando le uguaglianze in base alla linearità di T e le proprietà del prodottoscalare si ha

〈f, Tf〉+ λ 〈f, Tg〉+ λ 〈g, Tf〉+ |λ|2 〈g, Tg〉= 〈Tf, f〉+ λ 〈Tf, g〉+ λ 〈Tg, f〉+ |λ|2 〈Tg, g〉 .

Sfruttando la (1.2) si possono semplificare due coppie di termini, ottenendo

λ 〈f, Tg〉+ λ 〈g, Tf〉 = λ 〈Tf, g〉+ λ 〈Tg, f〉 ,

relazione valida per ogni f, g ∈ D (T ) e λ ∈ C. Scrivendo questa relazione unavolta per λ = 1 e una volta per λ = i otteniamo il sistema

〈f, Tg〉+ 〈g, Tf〉 = 〈Tf, g〉+ 〈Tg, f〉i 〈f, Tg〉 − i 〈g, Tf〉 = i 〈Tf, g〉 − i 〈Tg, f〉

che dà (moltiplicando per i la prima equazione e sommando membro a membro

〈f, Tg〉 = 〈Tf, g〉 ,

quindi T è simmetrico.Notiamo anche che la (1.1) è equivalente alla

〈Tf, f〉 ∈ R per ogni f ∈ D (T ) .

La Proposizione precedente è interessante perché, come vedremo, per l’in-terpretazione che faremo in meccanica quantistica degli operatori che rappre-sentano gli osservabili, avremo bisogno che sia sempre verificata la proprietà

〈Tf, f〉 ∈ R.

Questo significa che gli operatori di interesse per la meccanica quantistica dovran-no essere necessariamente simmetrici.Si può anche dimostrare la seguente proprietà:

Proposizione 1.2 Se T è un operatore lineare simmetrico

T : D (T )→ H

e D (T ) = H (cioè l’operatore è definito su tutto H), allora T è continuo.

(Per la dimostrazione, si veda [Hall], Corollary 9.9). Questo implica che unoperatore lineare simmetrico e illimitato (come saranno gli operatori di inter-esse per la meccanica quantistica), è definito necessariamente su un dominiostrettamente più piccolo di H.

17

Page 18: Introduzione al formalismo matematico della meccanica ...

Vogliamo ora definire la nozione di aggiunto di un operatore lineare (nonlimitato). Come nel caso degli operatori continui, vogliamo che l’aggiunto T ∗

di un operatore T soddisfi la relazione

〈Tf, g〉 = 〈f, T ∗g〉 .

Tuttavia in questo caso non è immediato capire per quali g si può definire T ∗g.

Definizione 1.3 (Aggiunto) Sia T è un operatore lineare

T : D (T )→ H

e supponiamo che il dominio D (T ) sia denso in H. Si dice che f ∈ D (T ∗)(dominio dell’operatore T ∗ che vogliamo definire) se il funzionale (lineare)

Λ : D (T )→ CΛ : g 7→ 〈f, Tg〉

è continuo. In questo caso, in base al Teorema 1.1, il funzionale Λ può essereunivocamente prolungato a un funzionale lineare continuo Λ su tutto H, al qualepossiamo applicare il teorema di Riesz: esiste uno e un solo h ∈ H tale che

Λ (g) = 〈h, g〉 per ogni g ∈ H,

e in particolare per ogni g ∈ D (T )

〈f, Tg〉 = Λ (g) = 〈h, g〉 .

PorremoT ∗f = h.

Risulta quindi

〈f, Tg〉 = 〈T ∗f, g〉 per ogni f ∈ D (T ) , g ∈ D (T ∗) . (1.3)

Da questa relazione si legge facilmente che l’operatore T ∗ è lineare. Questooperatore si dice operatore aggiunto di T .

Esercizio 1.4 Dalla definizione di operatore aggiunto di un operatore lineare(eventualmente illimitato) provare che l’aggiunto è anch’esso un operatore li-neare. Esplicitamente: sfruttando l’uguaglianza (1.3) e la linearità di T , provarela linearità di T ∗.

Si confronti questa definizione di T ∗ con quella data quando T è linearecontinuo: in quel caso il funzionale lineare Λ è continuo per ogni f ; in questocaso invece potrebbe esserlo per certi f e non esserlo per altri. La definizioneprecedente non garantisce che il dominio D (T ∗) sia “grande”. Certamente 0 ∈D (T ∗), perché la funzione f identicamente nulla definisce il funzionale linearecontinuo identicamente nullo. Quindi, formalmente, l’aggiunto esiste sempre,su qualche dominio. Nei casi ragionevoli D (T ∗) sarà “abbastanza grande”, adesempio denso in H.

18

Page 19: Introduzione al formalismo matematico della meccanica ...

Definizione 1.4 (Operatore autoaggiunto) Un operatore lineare

T : D (T )→ H

si dice autoaggiunto (o hermitiano) se

D (T ∗) = D (T ) e T ∗ = T.

Per un operatore autoaggiunto vale, in particolare, la relazione

〈f, Tg〉 = 〈Tf, g〉 per ogni f, g ∈ D (T ) ,

dunque: ogni operatore autoaggiunto è simmetrico. Ma la definizione di opera-tore autoaggiunto richiede anche l’uguaglianza dei domini, D (T ∗) = D (T ), cheè una proprietà ulteriore rispetto alla simmetria.

Esempio 1.6 In H = L2 (0, 1) sia:

T : g 7→ ig′

conD (T ) =

g ∈ C1 [0, 1] : g (0) = g (1) = 0

.

(C1 [0, 1] è denso in L2 (0, 1)). Fissiamo f ∈ L2 (0, 1) e consideriamo il fun-zionale

Λ : g 7→ 〈f, Tg〉 =

∫ 1

0

f (x)ig′ (x) dx.

Se f ∈ C1 [0, 1] integrando per parti si ha, poiché g (0) = g (1) = 0,

Λg = −∫ 1

0

f ′ (x)ig (x) dx =

∫ 1

0

if ′ (x)g (x) dx = 〈if ′, g〉

con|Λg| = |〈if ′, g〉| ≤ ‖f ′‖L2(0,1) ‖g‖L2(0,1)

da cui (essendo ‖f ′‖L2(0,1) < ∞ perché f ∈ C1 [0, 1]) leggiamo che g ∈ D (T ∗)

e T ∗g = ig′. In questo caso si ha

〈Tf, g〉 = 〈f, Tg〉

quindi T è simmetrico, tuttavia D (T ) $ D (T ∗), perciò T non è autoaggiunto.

Esempio 1.7 In H = L2 (R), l’operatore

T : g (x) 7→ xg (x)

definito suD (T ) =

g ∈ L2 (R) : xg ∈ L2 (R)

19

Page 20: Introduzione al formalismo matematico della meccanica ...

è simmetrico, come abbiamo già verificato (Esempio 1.3). Notare che C∞0 (R) ⊂D (T ) perciò D (T ) è denso in L2 (R). E’anche D (T ∗) = D (T ), come si vedefacilmente:

|〈f, Tg〉| =∣∣∣∣∫Rf (x)xg (x) dx

∣∣∣∣ ≤ ‖f‖L2 ‖xg‖L2 ,perciò per ottenere che Λ : f 7→ 〈f, Tg〉 sia continuo occorre e basta che g ∈D (T ). Quindi T è autoaggiunto.

Esempio 1.8 In H = L2 (R), l’operatore

T : g 7→ ig′,

definito su D (T ) = C10 (R), è simmetrico (l’abbiamo visto nell’Esempio 1.5).

Però, per f ∈ C10 (R) si ha

〈f, Tg〉 = 〈Tf, g〉per ogni g ∈ C1 (R) ∩ L2 (R), che è uno spazio più grande di C1

0 (R). Su questodominio quindi T non è autoaggiunto. L’operatore può essere reso autoaggiunto,pur di scegliere un dominio “abbastanza grande”. Ad esempio, se chiediamo:

D (T ) =f ∈ L2 (R) ∩ C (R) : f è derivabile a tratti e f ′ ∈ L2 (R)

(questo è il minimo da chiedere affi nché l’integrazione per parti si possa fare alsolito modo) allora si trova

〈f, Tg〉 = 〈Tf, g〉per ogni g ∈ D (T ) (e non uno spazio più grande).Ragioniamo ora su quest’esempio da un altro punto di vista, utilizzando la

relazione, valida per la trasformata di Fourier,

(if ′) = −2πξf .

Possiamo allora definire Tf mediante la sua trasformata di Fourier, ponendo

T f = −2πξf .

Se poniamoD (T ) =

g ∈ L2 (R) : ξg (ξ) ∈ L2 (R)

,

l’operatore T risulta ben definito13 . Su questo dominio possiamo ora verificareche l’operatore è simmetrico e autoaggiunto. Infatti, fissata f ∈ L2 (R),

〈f, Tg〉 =⟨f , T g

⟩=⟨f ,−2πξg

⟩=⟨−2πξf , g

⟩purché anche ξf (ξ) ∈ L2 (R)

=⟨T f , g

⟩= 〈Tf, g〉 .

13Si potrebbe obiettare che così, però, abbiamo modificato l’operatore, che non agisce piùcome T : g 7→ ig′, perché alcune funzioni di D (T ) potrebbero non essere derivabili. Nellaprossima sezione chiariremo esattamente questo punto. Per ora diciamo che l’operatore defini-to “via trasformata di Fourier” si può ancora identificare come T : g 7→ ig′, pur di intenderela derivata “in senso distribuzionale”, o “in senso debole”, come spiegheremo.

20

Page 21: Introduzione al formalismo matematico della meccanica ...

1.4 Spazi di Sobolev hilbertiani

Nell’ultimo esempio del paragrafo precedente abbiamo visto che per ottenereuna descrizione semplice e naturale del dominio di un operatore differenzialepuò essere utile talvolta tradurre la sua azione in termini di trasformata diFourier. Così facendo, però, non è ovvio che si stia parlando ancora dello stessooperatore. Vediamo ora, brevemente, come sia possibile definire, mediante latrasformata di Fourier, degli spazi di Hilbert di funzioni “derivabili in sensodebole”, che risponderanno a questo problema.Per motivare la prossima definizione, consideriamo una funzione f ∈ S (R);

allora sappiamo che la sua derivata k-esima soddisfa la relazione

F(f (k)

)(ξ) = (2πiξ)

kf (ξ) ,

perciò∥∥∥f (k)∥∥∥2

L2=∥∥∥F (f (k)

)∥∥∥2

L2=∥∥∥(2πiξ)

kf∥∥∥2

L2= (2π)

2k∫R|ξ|2k

∣∣∣f (ξ)∣∣∣2 dξ.

D’altro canto, per qualsiasi funzione L2 si può calcolare la trasformata di Fouriere considerare l’integrale ∫

R|ξ|2k

∣∣∣f (ξ)∣∣∣2 dξ,

che risulterà convergente non per tutte le funzioni L2 ma per una certa classedi queste funzioni, che ci aspettiamo siano più regolari. Infatti, la convergenzadell’ultimo integrale scritto implica che f (ξ) tenda a zero abbastanza veloce-mente all’infinito, e questo per dualità significa che f (x) sarà abbastanza rego-lare. L’idea è di assumere la convergenza di questo integrale come definizionedi una certa classe di funzioni che pensiamo come “derivabili k volte in sensogeneralizzato”:

Definizione 1.5 Per ogni intero k = 1, 2, 3... si definisce lo spazio di funzioni

Hk (Rn) =

f ∈ L2 (Rn) :

∫Rn|ξ|2k

∣∣∣f (ξ)∣∣∣2 dξ <∞ .

E’immediato verificare che Hk (Rn) è un sottospazio vettoriale di L2 (Rn) eche, ad esempio,

Hk (Rn) ⊃ S (Rn) ,

il che garantisce che lo spazio Hk sia “abbastanza grande”. Questo spazio puòessere dotato di una sua norma naturale, proveniente da un prodotto scalare:

Definizione 1.6 Per f, g ∈ Hk (Rn) (a valori reali o complessi) definiamo

〈f, g〉Hk =

∫Rnf (ξ)g (ξ)

(1 + |ξ|k

)2

dξ.

21

Page 22: Introduzione al formalismo matematico della meccanica ...

Si verifica facilmente che 〈·, ·〉Hk soddisfa effettivamente gli assiomi di prodottoscalare, che induce la norma

‖f‖Hk =

(∫Rn

∣∣∣f (ξ)∣∣∣2 (1 + |ξ|k

)2

)1/2

.

Dunque Hk (Rn) risulta uno spazio vettoriale normato, con norma prove-niente da un prodotto scalare. Si osservi, nella definizione di prodotto scalare equindi di norma, il ruolo della funzione(

1 + |ξ|k)2

.

La finitezza della norma garantisce sia quella dell’integrale∫Rn|ξ|2k

∣∣∣f (ξ)∣∣∣2 dξ,

sia quella dell’integrale ∫Rn

∣∣∣f (ξ)∣∣∣2 dξ =

∫Rn|f (x)|2 dx,

il che qualifica Hk come sottospazio di L2. In particolare,

‖f‖2L2 =∥∥∥f∥∥∥2

L2≤∫Rn

∣∣∣f (ξ)∣∣∣2 (1 + |ξ|k

)2

perciò‖f‖L2 ≤ ‖f‖Hk per k = 1, 2, ..

Si noti anche che tra gli spazi Hk (Rn) valgono le inclusioni

L2 (Rn) ⊃ H1 (Rn) ⊃ H2 (Rn) ⊃ H3 (Rn) ⊃ ...

come si verifica facilmente dalla definizione.

Esercizio 1.5 Dimostrare che H1 (Rn) ⊃ H2 (Rn) ⊃ H3 (Rn) ⊃ ... (Suggeri-

mento: provare che k1 < k2 =⇒ 1+|ξ|k1 ≤ 2(

1 + |ξ|k2)per ogni ξ, distinguendo

il caso |ξ| ≤ 1 e |ξ| > 1).

Teorema 1.3 Per ogni k = 1, 2, 3... lo spazio Hk (Rn) risulta completo. Per-tanto è uno spazio di Hilbert.

Dimostrazione. Sia fj ⊂ Hk (Rn) una successione di Cauchy, quindi∫Rn

∣∣∣fj (ξ)− fl (ξ)∣∣∣2 (1 + |ξ|k

)2

dξ → 0 per j, l→∞

22

Page 23: Introduzione al formalismo matematico della meccanica ...

ossia la successionefj

è di Cauchy nello spazio L2 rispetto alla misura pe-

sata14 dµ =(

1 + |ξ|k)2

dξ. Poiché questo spazio è completo, esiste g tale

che ∫Rn|g (ξ)|2

(1 + |ξ|k

)2

dξ <∞ (1.4)

e ∫Rn

∣∣∣fj (ξ)− g (ξ)∣∣∣2 (1 + |ξ|k

)2

dξ → 0 per j →∞. (1.5)

In particolare g ∈ L2 (Rn) perciò è ben definita la funzione f = F−1 (g). Allorala (1.4) dice che f ∈ Hk (Rn) e la (1.5) dice che

‖fj − f‖Hk → 0 per j →∞.

Pertanto Hk (Rn) è completo.Chiediamoci ora in che senso le funzioni di Hk (Rn) possono pensarsi come

funzioni “derivabili k volte in senso generalizzato”. Per semplificare il discorso,concentriamoci sul caso delle funzioni di una variabile e sulla derivata prima,cioè sullo spazio H1 (R).

Definizione 1.7 Se f ∈ H1 (R), definiamo la sua derivata generalizzata almodo seguente:

f ′ = F−1(

2πiξf (ξ)).

Si osservi che la definizione ha senso perché se f ∈ H1 (R) allora 2πiξf (ξ) ∈L2 (R), perciò la sua antitrasformata è ben definita come funzione di L2. Per-tanto:ogni funzione f ∈ H1 (R) ha una derivata generalizzata f ′ ∈ L2 (R). Res-

ta da capire in che senso questa derivata generalizzata ha le proprietà che ciaspettiamo dalla derivata.Anzitutto, è ovvio che l’operatore

d

dx: H1 (R)→ L2 (R)

d

dx: f 7→ F−1

(2πiξf (ξ)

)è lineare. Inoltre la derivata generalizzata soddisfa la seguente formula diintegrazione per parti:

Teorema 1.4 (Derivate generalizzate e integrazione per parti ) Se f ∈H1 (R) e f ′ è definita come sopra, allora∫

Rf (x)φ′ (x) dx = −

∫Rf ′ (x)φ (x) dx per ogni φ ∈ S (R) .

14v. [3, §2.3.1, “Misure con peso”]

23

Page 24: Introduzione al formalismo matematico della meccanica ...

Dimostrazione. Per semplificare leggermente le notazioni, supponiamo chef e φ siano a valori reali (le loro trasformate di Fourier potranno comunqueessere a valori complessi), il che ci permette di non scrivere qualche simbolo dicomplesso coniugato.

−∫Rf ′ (x)φ (x) dx = −〈f ′, φ〉L2 = −

⟨f ′, φ

⟩L2

= −⟨

2πif , φ⟩L2

= −∫R

2πiξf (ξ)φ (ξ) dξ =

∫Rf (ξ) (2πiξ) φ (ξ) dξ

=⟨f , φ′

⟩L2

= 〈f, φ′〉L2 =

∫Rf (x)φ′ (x) dx.

Osservazione 1.1 (Spazi di Sobolev e distribuzioni) Per il seguito del nos-tro discorso, la definizione e il teorema appena enunciati sono tutto ciò che ciservirà sull’argomento “derivata generalizzata”. Per chi è curioso di contestu-alizzare un po’meglio queste cose nell’analisi moderna, aggiungiamo un paiodi informazioni. Esiste una definizione generale di derivata in senso debole,che sta alla base della teoria degli spazi di Sobolev W k,p (Ω), di cui gli spazi diSobolev Hilbertiani che stiamo discutendo in questa sezione sono un caso par-ticolare. Si potrebbero studiare funzioni definite su un dominio qualsiasi, nonnecessariamente tutto lo spazio, e chiedere che siano derivabili in senso debole kvolte, con derivate Lp (Ω) per qualche p ∈ [1,∞] (non necessariamente p = 2).Diamo per semplicità la definizione di derivata debole nel caso unidimensionale.Si dice che una funzione f : (a, b)→ R, f ∈ L1

loc (a, b), ha derivata debole f ′ = gse esiste una funzione g ∈ L1

loc (a, b) tale che∫ b

a

f (x)φ′ (x) dx = −∫Rg (x)φ (x) dx per ogni φ ∈ C∞0 (a, b) .

Si noti che la definizione di derivata debole data via trasformata di Fourier sipresta a trattare solo le funzioni definite su tutto lo spazio. Si dimostra cheche per p = 2 e Ω = Rn lo spazio di Sobolev W k,2 (Rn) coincide con lo spazioHk (Rn). Gli spazi W k,p (Ω) furono introdotti nella seconda metà degli anni1930 dal matematico russo S. L. Sobolev. Il concetto di derivata debole vennepoi generalizzato da L. Schwartz al concetto di derivata di una distribuzione.Per i primi elementi di teoria delle distribuzioni si rimanda ad es. a [3, §9.2].Ad ogni modo, come promesso, queste conoscenze non saranno necessarie nelseguito. Diciamo solo, schematicamente: le distribuzioni sono oggetti più gen-erali delle funzioni; tutte le distribuzioni sono derivabili; se una distribuzioneè una funzione (localmente integrabile), allora la sua derivata nel senso delledistribuzioni può essere a sua volta una funzione (localmente integrabile) op-pure essere un oggetto più generale15 . Il concetto di derivata in senso debole

15Ad esempio: |x| ha derivata distribuzionale sgn (x), che è anche la sua derivata deboleperché è una funzione localmente integrabile. Invece χ(0,+∞) ha derivata distribuzionale δ0,ma non ha derivata debole, perché δ0 non è una funzione.

24

Page 25: Introduzione al formalismo matematico della meccanica ...

coincide con quello di derivata distribuzionale nel caso particolare in cui sia ladistribuzione che deriviamo sia la sua derivata distribuzionale siano funzioni(localmente integrabili). La teoria degli spazi di Sobolev, e la sua applicazione alconcetto di “soluzione in senso debole”di un problema di equazioni alle derivateparziali, fu uno degli antecedenti storici e quindi una motivazione importanteper lo sviluppo della teoria delle distribuzioni intorno al 1950. Diamo un paiodi riferimenti bibliografici per chi volesse approfondire questi argomenti. Una“bibbia” degli spazi di Sobolev è il testo [1]. Una presentazione rigorosa, ricca,ma comunque moderna e leggibile della teoria delle distribuzioni, è il testo [9].

Esercizio 1.6 Riscrivere la dimostrazione del Teorema 1.4 adattandola al casogenerale in cui f e φ hanno valori eventualmente complessi (cioè: tenere contodel coniugato che compare nell’integrale che rappresenta il prodotto scalare).

Con la stessa dimostrazione si prova che in realtà vale∫Rf (x)φ′ (x) dx = −

∫Rf ′ (x)φ (x) dx per ogni f, g ∈ H1 (R) .

Concretamente, ci si può chiedere che relazione ci sia tra la derivata gener-alizzata e quella ordinaria.

Esempio 1.9 Sia f (x) = e−|x|. Classicamente, la funzione non è derivabilenell’origine. E’una funzione L2 (R) e calcolando

f (ξ) =2

1 + 4π2ξ2

si vede che

ξf (ξ) =2ξ

1 + 4π2ξ2∈ L2 (R)

(anche se ξf (ξ) /∈ L1 (R)). Quindi f ∈ H1 (R). Calcoliamo

f ′ (x) = F−1(

2πiξf (ξ))

(x) = F−1

(4πi

ξ

1 + 4π2ξ2

)(x)

= 4πi

∫R

ξ

1 + 4π2ξ2e2πixξdξ

che si calcola col metodo dei residui. La funzione ξ1+4π2ξ2 è dispari, perciò

l’integrale sarà dispari (e immaginario). Calcoliamolo per x > 0.∫R

ξ

1 + 4π2ξ2e2πixξdξ = 2πiRes

(z

1 + 4π2z2e2πixz,

i

)= 2πi

( z

8π2ze2πixz

)/z= i

=i

4πe−x

e

f ′ (x) = 4πii

4πe−x = −e−x per x > 0,

25

Page 26: Introduzione al formalismo matematico della meccanica ...

perciò, simmetrizzando dispari,

f ′ (x) = − sgn (x) e−|x|.

Questa è la derivata generalizzata, che coincide con la derivata classica dovequest’ultima esiste, ma è stata definita globalmente, non punto per punto.Notiamo che questa funzione non ha, a sua volta, una derivata generalizzata,

infatti:

ξ(f ′) = 2πiξ2f (ξ) =4πiξ2

1 + 4π2ξ2/∈ L2 (R) .

In altre parole, f /∈ H2 (R).

Osservazione 1.2 Può valer la pena insistere sul seguente punto, che è spessooggetto di fraintendimento a incontra per la prima volta il concetto di derivatageneralizzata. Classicamente, una funzione può essere derivabile in certi puntie non in certi altri. Ad esempio, e−|x| è derivabile in senso classico in tut-ti i punti tranne lo 0. Invece il concetto di derivata generalizzata è globale.Fissata una funzione f ∈ L2 (R), o f appartiene a H1 (R), e allora diciamoche è derivabile in senso generalizzato, oppure non vi appartiene, e allora di-ciamo che non è derivabile in senso generalizzato. Abbiamo visto, ad esempio,che f (x) = e−|x| è derivabile in senso generalizzato con derivata generalizzatag (x) = − sgn (x) e−|x|. La funzione g è la derivata generalizzata di f . Non ècorretto dire che “g è la derivata generalizzata di f per x 6= 0”e nemmeno che“g è la derivata generalizzata di f per ogni x”. Semplicemente, il concetto diderivata generalizzata non è puntuale ma globale.

Possiamo ora riprendere l’Esempio 1.8, da cui è partita la discussione diquesto paragrafo:

Esempio 1.10 In H = L2 (R), si consideri l’operatore

T : f 7→ if ′

definito sul dominio D (T ) = H1 (R), dove f ′ va intesa come derivata genera-lizzata. Con queste definizioni è ora rigoroso affermare che questo operatore èlo stesso di quello definito, via trasformata di Fourier, dalla relazione

T f = −2πξf .

Si verifica (come abbiamo già fatto nell’Esempio 1.8 pur senza introdurre ilnome dello spazio H1 (R)) che T è autoaggiunto su H1 (R). Infatti, fissataf ∈ L2 (R),

〈f, Tg〉 =⟨f , T g

⟩=⟨f ,−2πξg

⟩=⟨−2πξf , g

⟩purché anche ξf (ξ) ∈ L2 (R) , ossia f ∈ H1 (R) ,

=⟨T f , g

⟩= 〈Tf, g〉 .

26

Page 27: Introduzione al formalismo matematico della meccanica ...

I discorsi precedenti naturalmente si iterano a derivate di qualsiasi ordine efunzioni di più variabili:

Proposizione 1.3 Se, per f ∈ Hk (Rn), definiamo la sua derivata generalizza-ta al modo seguente:

∂αf

∂xα= F−1

((2πiξ)

αf (ξ)

)per ogni multiindice α tale che |α| ≤ k, allora∫

Rf (x)

∂αφ

∂xα(x) dx = (−1)

|α|∫R

∂αf

∂xα(x)φ (x) dx per ogni φ ∈ S (Rn) .

La dimostrazione è un facile esercizio.

Esempio 1.11 Se f ∈ H2 (Rn) allora

∂2f

∂x2i

(x) = F−1(

(2πiξi)2f (ξ)

)= F−1

(−4πξ2

i f (ξ)).

Per linearità, il suo laplaciano generalizzato è dato da:

∆f = F−1(−4π |ξ|2 f (ξ)

)e risulta (poiché la trasformata di Fourier conserva il prodotto scalare di L2)

〈f,∆g〉 =

∫Rf (x) ∆φ (x) dx =

∫Rf (x) ∆φ (x)dx =

∫Rf (ξ)

(−4π2 |ξ|2

)φ (ξ) dξ

=

∫R−4π2 |ξ|2 f (ξ)φ (ξ) dξ =

∫R

∆f (ξ) φ (ξ) dξ =

∫R

∆f (x)φ (x) dx = 〈∆f, g〉

purché anche g ∈ H2 (Rn). Quindi l’operatore ∆ è autoaggiunto in L2 (Rn) suldominio H2 (Rn).

Esercizio 1.7 Decidere quali delle seguenti funzioni appartengono a H1 (R):

(a) e−x2

; (b) e−xχ(0,+∞) (x) ; (c) χ(a,b) (x) ; (d) xe−xχ(0,+∞) (x) .

1.5 Spettro di un operatore lineare

Un concetto chiave nelle applicazioni dell’analisi funzionale alla meccanica quan-tistica è quello di spettro di un operatore.Consideriamo un operatore lineare T : D (T ) → H con H spazio di Hilbert

(in generale, T illimitato). In molte questioni interessa risolvere un’equazionedel tipo

Ty − λy = f

con f ∈ H assegnata, λ ∈ C assegnato, y ∈ D (T ) incognita. Fissato un certoλ ∈ C, il meglio che si possa sperare è che quest’equazione abbia una e una sola

27

Page 28: Introduzione al formalismo matematico della meccanica ...

soluzione per ogni f ∈ H assegnata, e la soluzione dipenda con continuità daltermine noto f . In termini operatoriali, posto I =operatore identità, e riscrittal’equazione

(T − λI) y = f ,

la nostra speranza si traduce nel fatto che l’operatore

(T − λI) : D (T )→ H

sia suriettivo (=per ogni f ∈ H esiste almeno una soluzione y), iniettivo (=perogni f ∈ H esiste al più una soluzione y), e l’operatore inverso

(T − λI)−1

: H → D (T )

(che nelle ipotesi precedenti esiste ed è lineare) sia anche continuo. Tale op-eratore inverso, che al termine noto f associa la soluzione dell’equazione, sichiamerà operatore risolvente. Questo introduce la prossima:

Definizione 1.8 SiaT : D (T )→ H

un operatore lineare e, per λ ∈ C, consideriamo l’operatore lineare

T − λI : D (T )→ H,

dove I sta per “operatore identità”, cioè

(T − λI) f = Tf − λf.

Si dice che λ ∈ C appartiene al risolvente di T , e si scrive λ ∈ ρ (T ),se l’operatore lineare T − λI ammette un operatore inverso, definito su tuttoH, lineare e continuo. Più esplicitamente, λ ∈ ρ (T ) se esiste un operatoreB : H → H lineare e continuo tale che

(T − λI)Bf = f per ogni f ∈ HB (T − λI) y = y per ogni y ∈ D (T ) .

L’operatore B si indica anche con (T − λI)−1 e si chiama il risolvente di T in

λ: associa ad ogni f ∈ H la soluzione y dell’equazione (T − λI) y = f .

Prima di proseguire notiamo che:1) La condizione (T − λI)Bf = f per ogni f ∈ H equivale alla suriettività

di (T − λI), ossia all’esistenza di soluzione: y = Bf risolve (T − λI) y = f .2) La condizione B (T − λI) y = y per ogni y ∈ D (T ) equivale alla iniet-

tività di (T − λI), ossia all’unicità della soluzione: se (T − λI) y = 0 allora0 = B (T − λI) y = y, cioè y = 0.

28

Page 29: Introduzione al formalismo matematico della meccanica ...

Definizione 1.9 Se λ /∈ ρ (T ) si dice che λ appartiene allo spettro di T , e siscrive λ ∈ σ (T ).Si dice che λ ∈ C è un autovalore e che f è un’autofunzione (relativa

all’autovalore λ), se f ∈ D (T ) , f 6= 0 e

Tf = λf.

Se questo accade, (T − λI) non è iniettivo, perciò ogni autovalore sta nellospettro (ma, come vedremo, lo spettro può contenere anche numeri che nonsono autovalori). L’insieme delle autofunzioni relative all’autovalore λ, conl’aggiunta della funzione identicamente nulla16 , prende il nome di autospaziorelativo a λ, e si verifica facilmente che è un sottospazio vettoriale di D (T ).

Col linguaggio standard dell’algebra lineare, l’autospazio relativo a λ è ilnucleo dell’operatore lineare (T − λI), ed è ben noto che questo è un sottospaziovettoriale di H.Gli autovalori di un operatore simmetrico hanno proprietà importanti17 :

Proposizione 1.4 (Autovalori di un operatore simmetrico) Se

T : D (T )→ H

è un operatore lineare simmetrico, allora:1. Ogni suo (eventuale) autovalore è reale.2. Se f, g sono autofunzioni relative a autovalori λ, µ distinti, allora f e g

sono ortogonali.

Dimostrazione. 1. Sia f un’autofunzione relativa all’autovalore λ. Poiché Tè simmetrico,

〈Tf, f〉 = 〈f, Tf〉 ,e poiché f è un’autofunzione di λ

〈Tf, f〉 = 〈λf, f〉 = λ 〈f, f〉 ,〈f, Tf〉 = 〈f, λf〉 = λ 〈f, f〉

dunqueλ 〈f, f〉 = λ 〈f, f〉

ed essendo 〈f, f〉 6= 0 si ha λ = λ, cioè λ è reale.2. Se λ, µ sono autovalori distinti e f, g autofunzioni relative a λ, µ, rispet-

tivamente, si ha:

〈f, Tg〉 = 〈f, µg〉 = µ 〈f, g〉〈Tf, g〉 = 〈λf, g〉 = λ 〈f, g〉 = λ 〈f, g〉

16 In base alla definizione data di autofunzione, la funzione identicamente nulla non è un’au-tofunzione. Tuttavia uno spazio vettoriale deve contenere l’elemento 0, quindi la aggiungiamoall’autospazio perché risulti uno spazio vettoriale.17 che ricordano le proprietà degli autovalori dei problemi di Sturm-Liouville, v. [3, §§4.7.1-

4.7.2]. Naturalmente non si tratta di una coincidenza: spiegheremo in seguito, brevemente, ilperché.

29

Page 30: Introduzione al formalismo matematico della meccanica ...

(sappiamo già che λ ∈ R) e poiché T è simmetrico,

〈Tf, g〉 = 〈f, Tg〉

dunque

λ 〈f, g〉 = µ 〈f, g〉(λ− µ) 〈f, g〉 = 0

ed essendo per ipotesi λ 6= µ si conclude 〈f, g〉 = 0, cioè f e g sono ortogonali.

Enunciamo senza dimostrazione alcune proprietà importanti dello spettrodegli operatori che considereremo.

Teorema 1.5 18Lo spettro di un operatore T lineare:1. è un sottoinsieme chiuso di C se T è limitato oppure se T è illimitato e

autoaggiunto;2. è limitato se T è limitato, è illimitato se T è illimitato e autoaggiunto;3. è contenuto nell’asse reale se T è autoaggiunto;4. contiene sempre elementi complessi non reali se T è simmetrico ma non

è autoaggiunto.

Ricordiamo che gli autovalori sono elementi dello spettro, ma non esauriscononecessariamene lo spettro stesso. Abbiamo dimostrato (Proposizione 1.4) chegli eventuali autovalori di un operatore simmetrico sono sempre reali, tuttavia ilteorema precedente afferma anche che un operatore simmetrico ma non autoag-giunto possiede sempre qualche elemento dello spettro che non è reale, e quindinon sarà un autovalore.

Esempio 1.12 (Operatori lineari simmetrici su spazi di dimensione finita)Come noto, un operatore lineare T : Rn → Rn si identifica (fissata una basein Rn) con una matrice A, n × n: l’operatore x 7→ Ax (prodotto righe percolonne). Il fatto che l’operatore T sia simmetrico è equivalente alla simmetriadella matrice A: indicando con ()

T il vettore o la matrice trasposta,

〈Tx, y〉 = 〈x, Ty〉 ⇐⇒ yTAx = xTAy per ogni x, y ⇐⇒ A = AT .

D’altro canto è noto che una matrice A reale simmetrica è diagonalizzabile medi-ante una matrice ortogonale, il che significa che ha n autovalori reali (computaticon la dovuta molteplicità) ed esiste una base ortonormale di Rn costituita daautovettori di A. Infine, se λ non è un autovalore,

det (A− λI) 6= 0,

perciò l’equazione(A− λI)x = y

18Per la dimostrazione si veda [12] (Proposition 7.5; Theorem 9.17 e osservazione dopol’enunciato; Proposition 9.18).

30

Page 31: Introduzione al formalismo matematico della meccanica ...

per ogni y assegnato ha una e una sola soluzione x. Riassumendo, col linguaggiodegli operatori:un operatore T lineare su Rn (e quindi anche continuo, dato che la dimen-

sione è finita) e simmetrico ha spettro costituito da n autovalori reali (computaticon la dovuta molteplicità), ed esiste una base ortonormale di Rn di autovettoridi T . Se e1, ..., en è una base ortonormale di autovettori di T , relativi rispetti-vamente agli autovalori λ1, ..., λn, allora scrivendo il generico x ∈ Rn rispetto aquesta base, cioè

x =

n∑j=1

〈ej , x〉 ej

si ha la seguente rappresentazione dell’operatore:

Ax = A

n∑j=1

〈ej , x〉 ej =

n∑j=1

〈ej , x〉Aej =

n∑j=1

〈ej , x〉λjej .

Ossia: il valore di Ax si può calcolare conoscendo le coordinate di x rispetto allabase ej e gli autovalori della matrice A.Questa situazione semplice che vale nel caso finito dimensionale è in un certo

senso una situazione modello, che si può presentare (ma non necessariamentesi presenta) anche nei casi infinito dimensionali. Molti risultati di analisi fun-zionale (che vanno sotto il nome di teoria spettrale) sono stati dimostrati perindividuare, in dimensione infinita, un insieme di ipotesi su un operatore lineareT , sotto le quali valgano risultati simili a quelli che abbiamo appena citato.

Esempio 1.13 Determiniamo lo spettro dell’operatore

T : f (x) 7→ xf (x)

definito suD (T ) =

f ∈ L2 (R) : xf ∈ L2 (R)

.

L’equazione

Tf = λf

(x− λ) f (x) = 0

non ha soluzioni f ∈ L2 (R) diverse dalla funzione nulla q.o., perciò non es-istono autovalori. In particolare, per ogni λ ∈ C l’operatore T − λI è iniettivo.Studiamo l’equazione

(T − λI) f = g,

cioè(x− λ) f (x) = g (x)

con g ∈ L2 (R) assegnata. L’unica eventuale soluzione è

f (x) =g (x)

x− λ.

31

Page 32: Introduzione al formalismo matematico della meccanica ...

Ora, se λ è un numero reale e g una funzione L2 (R) strettamente positiva in unintorno di x = λ, certamente questa f (x) non appartiene a L2 (R). Quindi perogni λ ∈ R l’operatore (T − λI) non è suriettivo, perciò ogni λ ∈ R appartieneallo spettro. Se invece λ = a+ ib con b 6= 0, allora la funzione

h (x) =1

x− λ

è continua e limitata in R, perché

|h (x)| = 1√(x− a)

2+ b2

≤ 1

|b| ,

quindi

‖f‖L2 ≤1

|b| ‖g‖L2 ,

il che mostra che l’operatore risolvente (T − λI)−1 è definito su tutto L2 (R),

(lineare e) continuo. Perciò ogni numero complesso non reale sta nel risolvente.La conclusione è che

σ (T ) = R

(pur non possedendo T alcun autovalore).

Esempio 1.14 Determiniamo lo spettro dell’operatore

T : f (x) 7→ if ′ (x) ,

dove f ′ è la derivata generalizzata, assumendo f ∈ H1 (R). T è definito alter-nativamente da

T f (ξ) = −2πξf (ξ)

suD (T ) = H1 (R) .

L’equazioneTf = λf

si traduce nell’equazione differenziale

if ′ (x) = λf (x)

che ha soluzionif (x) = ce−iλx,

32

Page 33: Introduzione al formalismo matematico della meccanica ...

ma queste funzioni non stanno in L2 (R) per c 6= 0, dunque l’operatore non haautovalori. Alternativamente, si poteva ragionare così:

Tf = λf

T f = λf

−2πξf (ξ) = λf (ξ)

(λ+ 2πξ) f (ξ) = 0

f (ξ) = 0 per q.o. ξ

f = 0.

Cerchiamo di risolvere l’equazione

(T − λI) f = g

con g ∈ L2 (R) assegnato. Applicando la trasformata di Fourier si ha

(−2πξ − λ) f (ξ) = g (ξ)

f (ξ) =−g (ξ)

2πξ + λ.

Ragionando in modo simile all’Esempio 1.13 si vede ora che se λ è reale esistesempre una funzione g ∈ L2 (R) tale che f /∈ L2 (R); quindi ogni numero realesta nello spettro di T . Se invece λ = a+ ib con b 6= 0 allora

‖f‖L2 =∥∥∥f∥∥∥

L2≤ ‖g‖L2|b| ≤

‖g‖L2|b| ,

perciò l’operatore risolvente risulta definito su tutto L2 (R) ed è continuo. Sinoti anche che per ξ grande è

c |ξ|∣∣∣f (ξ)

∣∣∣ ≤ ∣∣∣f (ξ) (2πξ + λ)∣∣∣ = |g (ξ)| ∈ L2 (R)

quindi effettivamente f ∈ H1 (R). Quindi, come nell’esempio precedente,

σ (T ) = R

(pur non possedendo T alcun autovalore).

Esempio 1.15 In H = L2 (0, π), si consideri l’operatore T = − d2

dx2 sul dominio

D (T ) =f ∈ C2 [0, π] : f (0) = f (π) = 0

.

Dimostriamo che ha una successione di autovalori ed esiste un s.o.n.c. diL2 (0, L) costituito da autofunzioni di T .

L’equazione differenziale

−y′′ − λy = 0 in (0, π)

33

Page 34: Introduzione al formalismo matematico della meccanica ...

può essere risolta per ogni λ ∈ C assegnato, ma l’unica possibilità perché siabbiano soluzioni y (x) non identicamente nulle ma soddisfacenti

y (0) = y (π) = 0

è che risulti λ = n2 con n = 1, 2, 3... e per questo λ è

y (t) = cn sin (nx) .

Quindi esiste una successione divergente di autovalori e un s.o.n.c. di autofun-zioni, dal momento che √

2

πsin (nx)

∞n=1

sono un s.o.n.c. di L2 (0, π). Non discutiamo la questione se esistano al-tri elementi dello spettro, che porterebbe a problemi non banali sulle serie diFourier.

Esercizio 1.8 Come l’Esempio precedente, ma sul dominio

D (T ) =f ∈ C2 [0, L] : f ′ (0) = f ′ (L) = 0

.

Esempio 1.16 Si consideri l’operatore −∆ (laplaciano) su D (∆) = H2 (Rn) .Dimostriamo che non ha autovalori e lo spettro coincide con [0,+∞).Consideriamo l’equazione:

−∆u = λu.

F-trasformandola si ha:

4π2ξ2u (ξ) = λu (ξ)(4π2ξ2 − λ

)u (ξ) = 0

che implica u (ξ) = 0 q.o. e quindi u = 0. Perciò non ci sono autovalori.Fissato λ ∈ C consideriamo ora l’equazione

−∆u− λu = f con f ∈ L2.

Trasformando si ha: (4π2ξ2 − λ

)u (ξ) = f (ξ)

u (ξ) = f (ξ) · 1

4π2ξ2 − λ

Se la funzione1

4π2ξ2 − λ

34

Page 35: Introduzione al formalismo matematico della meccanica ...

è limitata (e solo in questo caso), moltiplicandola per la generica funzione f ∈ L2

si ottiene una funzione u ∈ L2 e quindi si può antitrasformare e trovare u ∈ L2.Questo accade se e solo se

4π2ξ2 − λ 6= 0 per ogni ξ ∈ R

cioè se λ /∈ [0,∞) (cioè: se λ è un numero reale /∈ [0,∞) oppure è un numerocomplesso con Imλ 6= 0). In questi casi si ha∣∣4π2ξ2 − λ

∣∣ > 4πξ2,

quindi la condizione (4π2ξ2 − λ

)u (ξ) = f (ξ)

implica 4π2ξ2u (ξ) ∈ L2 e perciò u ∈ (Rn), e λ sta nel risolvente. Perciò

σ (T ) = λ ∈ R : λ ∈ [0,∞) .

Esempio 1.17 E’noto che il problema agli autovalori per il laplaciano su sem-plici domini del piano o dello spazio, come il cerchio, il rettangolo, la sfera, concondizione al contorno zero, possiede una successione di autovalori che tendea infinito e un corrispondente sistema ortonormale completo di autofunzioni.Questi problemi si affrontano col metodo classico di separazione delle variabili.Si veda ad esempio [21, Chap.VII].

Nei semplici esempi precedenti si presenta sempre una delle due situazioniseguenti: o si considerano spazi di funzioni definite su tutto R o Rn e allora nonci sono autovalori e lo spettro è costituito dalla retta reale o la semiretta [0,+∞),oppure si considerano funzioni definite su un intervallo limitato, e allora esisteuna successione di autovalori e un s.o.n.c. di autofunzioni. Sono effettivamentedue situazioni tipiche, ma non sono le sole che si possono presentare.Nel prossimo esempio vediamo una situazione in cui si considera uno spazio

di funzioni definite su tutto R ed esiste una successione di autovalori.

Esempio 1.18 (Equazione di Hermite) L’equazione di Hermite, che in mec-canica quantistica compare ad esempio quando si risolve l’equazione di Schrödingerper l’oscillatore armonico quantistico unidimensionale, è:

y′′ − 2xy′ + λy = 0 in R

che moltiplicando per e−x2

si può riscrivere nella forma(e−x

2

y′)′

+ λe−x2

y = 0 in R,

scrittura che suggerisce di ambientare l’equazione nello spazio di Hilbert L2(R, e−x2dx

)(cioè con la misura gaussiana). Metodi classici di risoluzione per serie19 mostra-

no che l’equazione ammette soluzioni appartenenti allo spazio L2(R, e−x2dx

)19v. ad esempio [3, §5.2.]

35

Page 36: Introduzione al formalismo matematico della meccanica ...

se e solo se

λ = 2n con n = 0, 1, 2, 3...

y (x) = Hn (x)

dove Hn (x)∞n=0 sono i polinomi di Hermite, e costituiscono un s.o.n.c. in

L2(R, e−x2dx

). Questa situazione si può descrivere in termini operatoriali al

modo seguente.

Consideriamo, sullo spazio H = L2(R, e−x2dx

), l’operatore

T : y 7→ −

(e−x

2

y′)′

e−x2

ad esempio sul dominio S (R) (in realtà T è ben definito su un dominio molto piùgrande, ma non ci interessa precisarlo). L’operatore T è lineare ed è simmetrico,infatti per f, g ∈ S (R), con integrazioni per parti si ha:

〈f, Tg〉 =

∫Rf (x)

−(e−x

2

g′ (x))′

e−x2

e−x2

dx = −∫Rf (x)

(e−x

2

g′ (x))′dx

=

∫Rf ′ (x)e−x

2

g′ (x) dx = −∫R

(f ′ (x)e−x

2)′g (x) dx

=

∫R

[(f ′ (x) e−x2

)′e−x2

]g (x) e−x

2

dx = 〈Tf, g〉 .

Gli autovalori di T sono gli autovalori dell’equazione di Hermite, quindi lasuccessione 2n∞n=0 e come visto esiste un s.o.n.c. di autofunzioni.Non entriamo nella discussione della presenza di eventuali elementi dello

spettro diversi dagli autovalori.Per inciso, osserviamo che se invece dei polinomi di Hermite si considerano

le funzioni di Hermite, definite daHn (x) e−

x2

2

∞n=0

,

queste costituiscono un s.o.n.c. di L2 (R) (e non più dello spazio pesato).

Esempio 1.19 (Problemi di Sturm-Liouville) Consideriamo un problemadi Sturm-Liouville regolare (v. [3, §4.7.1]):

ddx

(p (x) dudx

)− q (x)u+ λρ (x)u = 0 per x ∈ (a, b)

u (a) = u (b) = 0(1.6)

dove a, b ∈ R e le funzioni p, q, ρ sono coeffi cienti assegnati soddisfacenti leipotesi: p ∈ C1 [a, b] , p (x) > 0 in [a, b] ; q ∈ C0 [a, b] , q (x) ≥ 0 in [a, b] , ρ ∈C0 [a, b] , ρ (x) > 0 in [a, b].

36

Page 37: Introduzione al formalismo matematico della meccanica ...

(Il caso dell’equazione di Hermite trattato sopra non rientra in queste ipotesi;quello è un problema di Sturm-Liouville singolare. D’altro canto, qui consideri-amo un’intera classe di problemi, non uno solo).Possiamo associare al problema l’operatore lineare T sullo spazio di Hilbert

H = L2 ((a, b) , ρ (x) dx)

T : v 7→− ddx

(p (x) dudx

)+ q (x)u

ρ (x)

D (T ) =v ∈ C2 (a, b) ∩ C1 [a, b] : v (a) = v (b) = 0

.

Anche se considereremo funzioni u a valori complessi, i coeffi cienti p, q, ρ sonoreali. Si può dimostrare20 che per un problema di Sturm-Liouville regolareesistono:1) una successione di autovalori λn∞n=1 tutti positivi, successione crescente

e tendente a +∞;2) una successione di autofunzioni un∞n=1 corrispondenti, che costituiscono

un sistema ortonormale completo dello spazio di Hilbert L2 ((a, b) , ρ (x) dx).Gli autovalori del problema si possono vedere come autovalori dell’operatore

T . Per v ∈ D (T ) e u ∈ H fissato, consideriamo

〈u, Tv〉 =

∫ b

a

u (x)− ddx

(p (x) dvdx (x)

)+ q (x) v (x)

ρ (x)ρ (x) dx

=

∫ b

a

[− d

dx

(p (x)

dv

dx(x)

)u (x) + q (x) v (x)u (x)

]dx

se u ∈ C1 (a, b) ∩ C0 [a, b] e u (a) = u (b) = 0, integrando per parti

=

∫ b

a

[p (x) v′ (x)u′ (x) + q (x) v (x)u (x)

]dx

se u ∈ C2 (a, b) ∩ C1 [a, b], integrando ancora per parti

=

∫ b

a

[−v (x)

d

dx

(p (x)u′ (x)

)+ v (x) q (x)u (x)

]dx

=

∫ b

a

[− ddx (p (x)u′ (x)) + q (x)u (x)

ρ (x)

]v (x) ρ (x) dx

= 〈Tu, v〉 .

Dunque T è simmetrico (non discutiamo la questione più delicata dell’autoag-giuntezza). Si dimostra che possiede una successione di autovalori che tende ainfinito (in particolare, quindi, lo spettro è illimitato) ed esiste un s.o.n.c. di Hdi autofunzioni di T . Inoltre, per λ diverso dagli autovalori l’operatore T−λI haeffettivamente un risolvente continuo definito su tutto H. La conclusione è cheper questo operatore σ (T ) coincide con la successione (divergente) di autovalori.

20v. [21] §36 e §28, ma per la dimostrazione rimanda anche a [7], p.122.

37

Page 38: Introduzione al formalismo matematico della meccanica ...

Esercizio 1.9 Si consideri l’operatore di moltiplicazione (v. Esercizio 1.2),lineare continuo,

T : L2 (R)→ L2 (R)

T : f 7→ mf

con m ∈ L∞ (R) assegnata. Si studi lo spettro di T nei seguenti casi:

1) m (x) = χ(a,b) (x)

2) m (x) = e−x2

.

Più in generale, si può dimostrare che lo spettro di T coincide con il rangeessenziale di T , cioè σ (T ) è la chiusura dell’insieme m (x) : x ∈ R.

Esercizio 1.10 Si consideri l’operatore moltiplicatore (v. Esercizio 1.3), lin-eare continuo,

T : L2 (R)→ L2 (R)

T : f 7→ F−1(m (ξ) f (ξ)

)con m ∈ L∞ (R) assegnata.1. Si dimostri che T non ha autovalori supponendo che m (ξ) non sia

costante su alcun intervallo (ad esempio: m (ξ) = ξ2

1+ξ2 ).2. Si determinino gli autovalori di T supponendo invece m (ξ) = χ(−1,1) (ξ).

1.6 Operatori di proiezione

Abbiamo visto ([3, Cap.4]) cos’è e come si calcola la proiezione di un vettorequalsiasi di uno spazio di Hilbert H su un sottospazio Vn di dimensione finita,di cui si conosce una base ortonormale. Il teorema delle proiezioni dimostrato inquel contesto si può generalizzare: anziché su un sottospazio di dimensione fini-ta, si può proiettare anche su un sottospazio di dimensione infinita, purché chiu-so21 . In questo caso la dimostrazione non sfrutta l’esistenza di una base ortonor-male nel sottospazio su cui si proietta, ma un procedimento astratto che sfrutta,oltre alle tecniche di ortogonalità già utilizzate in precedenza, l’uguaglianza delparallelogramma e la completezza di H. Vale il seguente teorema:

Teorema 1.6 Sia H uno spazio di Hilbert e V ⊂ H un suo sottospazio vetto-riale chiuso.(i) Per ogni x ∈ H esiste uno e un solo elemento, che chiamiamo proiezione

di x su V e indichiamo con PV x, che rende minima la distanza di x da V , cioè:

‖PV x− x‖ = miny∈V‖y − x‖ .

21o più in generale su un sottoinsieme chiuso e convesso di H. Ogni generalizzazione servedi quel teorema fondamentale serve a obiettivi diversi.

38

Page 39: Introduzione al formalismo matematico della meccanica ...

In particolare, PV x = x se x ∈ V .(ii) Inoltre si ha:

PV x− x ⊥ V‖Px‖ ≤ ‖x‖ . (1.7)

(iii) Se definiamo l’operatore di proiezione

PV : H → V

PV : x 7→ PV x,

questo risulta lineare continuo, con norma 1.(iv) Infine, l’operatore PV soddisfa le proprietà:

P 2V = PV

(cioè PV (PV x) = PV x per ogni x ∈ H; questa proprietà si dice idempotenzadell’operatore) e

P ∗V = PV ,

cioè PV è autoaggiunto.

Confrontando col teorema della proiezione dimostrato nel Cap. 4, notiamoche l’unica differenza è il fatto che in quel caso disponevamo di un’espressioneanalitica esplicita dell’operatore di proiezione, mediante una base ortonormaledi V , mentre in questo caso infinito dimensionale l’esistenza dell’operatore diproiezione è stabilita astrattamente, e l’operatore può avere forme molto diverserispetto alla combinazione lineare di prodotti scalari con elementi ortonormali,come vedremo.Dimostrazione. (i) Proviamo l’esistenza dell’elemento di minima distanza. Sex ∈ V basta porre PV x = x, perciò supponiamo x /∈ V . Sia d = infv∈V ‖x− v‖.(Questo inf esiste perché V non è vuoto e ‖x− v‖ ≥ 0). Sia xn∞n=1 ⊂ V unasuccessione minimizzante, ossia tale che

‖x− xn‖ → d.

(Tale successione esiste per definizione di estremo inferiore). Proviamo chequesta successione è di Cauchy. Si utilizza a questo scopo l’uguaglianza delparallelogramma:

‖xn − xm‖2 = ‖(xn − x) + (x− xm)‖2

= −‖(xn − x)− (x− xm)‖2 + 2(‖xn − x‖2 + ‖x− xm‖2

).

Ora, per n,m→∞ si ha:

‖xn − x‖2 → d2; ‖x− xm‖2 → d2.

39

Page 40: Introduzione al formalismo matematico della meccanica ...

D’altro canto, per ogni n,m si ha

‖(xn − x)− (x− xm)‖2 = ‖xn + xm − 2x‖2 = 4

∥∥∥∥xn + xm2

− x∥∥∥∥2

≥ 4d2

perché, essendo V un sottospazio vettoriale, xn, xm ∈ V =⇒ xn+xm2 ∈ V. Ne

segue che

‖xn − xm‖2 ≤ 2(‖xn − x‖2 + ‖x− xm‖2

)−4d2 → 2

(d2 + d2

)−4d2 = 0 per n,m→∞

quindi anche ‖xn − xm‖ → 0, ossia xn∞n=1 è di Cauchy. Poiché H è completo,esiste allora v ∈ H tale che xn → v; inoltre, poiché V è un sottospazio chiuso22

di H, v ∈ V . Infine, poiché

‖xn − x‖ → ‖v − x‖ e

‖xn − x‖ → d,

si ha ‖v − x‖ = d. Questo completa la dimostrazione dell’esistenza dell’elementov ∈ V di minima distanza da x. Porremo PV x = v.Proviamo ora l’unicità. Siano dunque v1, v2 due elementi di V tali che

‖vi − x‖ = d per i = 1, 2

e proviamo che allora v1 = v2. Si usa ancora l’uguaglianza del parallelogramma,in modo simile a quello già visto:

‖v1 − v2‖2 = ‖(v1 − x) + (x− v2)‖2

= −‖(v1 − x)− (x− v2)‖2 + 2(‖v1 − x‖2 + ‖x− v2‖2

)= −4

∥∥∥∥v1 + v2

2− x∥∥∥∥2

+ 2(d2 + d2

)≤ −4d2 + 4d2 = 0

in quanto v1, v2 ∈ V ⇒ v1+v22 ∈ V ⇒

∥∥v1+v22 − x

∥∥ ≥ d. Dunque ‖v1 − v2‖ = 0,ossia v1 = v2.(ii) Mostriamo ora che PV x− x ⊥ V , ossia che x−PV x è ortogonale a tutti

gli elementi di V . Sia w = x−PV x, v ∈ V qualsiasi, e proviamo che (w, v) = 0.Per ogni λ ∈ C, scriviamo (essendo PV x+ λv ∈ V e ‖w‖ = d)

‖w‖2 ≤ ‖x− (PV x+ λv)‖2 = ‖(x− PV x)− λv‖2 = ‖w − λv‖2

= 〈w − λv,w − λv〉 = 〈w,w〉 − 〈λv,w〉 − 〈w, λv〉+ |λ|2 〈v, v〉= ‖w‖2 − 2 Reλ 〈w, v〉+ |λ|2 ‖v‖2

22Si ricordi la proprietà: se xn ⊂ V, V è un sottoinsieme chiuso di H, e xn converge aun elemento x ∈ H, allora x ∈ V.

40

Page 41: Introduzione al formalismo matematico della meccanica ...

da cui2 Reλ 〈w, v〉 ≤ |λ|2 ‖v‖2 per ogni λ ∈ C.

Questo implica (v, w) = 0. Per assurdo, sia (v, w) 6= 0. Allora scegliendo

λ = t 〈w,v〉|〈w,v〉| con t reale positivo,

2t |〈w, v〉| ≤ t2 ‖v‖2 ∀t > 0

da cui dividendo per t e facendo tendere t a zero si ottiene 〈w, v〉 = 0, assurdo.Poiché PV x ∈ V e PV x − x ⊥ V possiamo ora scrivere, in base al teorema

di Pitagora,

‖x‖2 = ‖(x− PV x) + PV x‖2 = ‖x− PV x‖2 + ‖PV x‖2 ≥ ‖PV x‖2

da cui‖PV x‖ ≤ ‖x‖ .

(iii) Consideriamo ora l’operatore PV , e mostriamo anzitutto che è lineare,ossia per ogni x1, x2 ∈ H,λ1, λ2 ∈ C. Questo significa provare che

PV (λ1x1 + λ2x2) = λ1PV x1 + λ2PV x2

ossia, per definizione di PV (x) come elemento di V di minima distanza da x,significa provare che

‖(λ1x1 + λ2x2)− (λ1PV x1 + λ2PV x2)‖ = minv∈V‖(λ1x1 + λ2x2)− v‖ .

Fissato un v ∈ V ,

‖(λ1x1 + λ2x2)− v‖2

= ‖[λ1 (x1 − PV x1) + λ2 (x2 − PV x2)] + [v − (λ1PV x1 + λ2PV x2)]‖2

dove [λ1 (x1 − PV x1) + λ2 (x2 − PV x2)] ∈ V ⊥ perché è combinazione lineare didue elementi di V ⊥, e [v − (λ1PV x1 + λ2PV x2)] ∈ V . Dunque per Pitagora

‖(λ1x1 + λ2x2)− v‖2

= ‖λ1 (x1 − PV x1) + λ2 (x2 − PV x2)‖2 + ‖v − (λ1PV x1 + λ2PV x2)‖2

≥ ‖λ1 (x1 − PV x1) + λ2 (x2 − PV x2)‖2 = ‖(λ1x1 + λ2x2)− (λ1PV x1 + λ2PV x2)‖ ,

da cui la linearità di PV .La (1.7) allora mostra che l’operatore PV è continuo e ha norma ≤ 1. D’altro

canto per x ∈ V si ha PV x = x perciò ‖PV x‖ = ‖x‖ e questo mostra che è anche‖PV ‖ ≥ 1, perciò ‖PV ‖ = 1.(iv) Poiché PV x = x se x ∈ V e PV x ∈ V per ogni x ∈ H si ha PV (PV x) =

PV x (perché PV x ∈ V ). Per provare che P = P ∗ scriviamo ora

〈x, PV x〉 = 〈(x− PV x) + PV x, PV x〉 = 〈x− PV x, PV x〉+ ‖PV x‖2 = ‖PV x‖2

41

Page 42: Introduzione al formalismo matematico della meccanica ...

perché 〈x− PV x, PV x〉 = 0 in quanto PV x ∈ V e x−PV x ∈ V ⊥. In particolare〈x, PV x〉 ∈ R per ogni x ∈ H, perciò PV è simmetrico per la Proposizione 1.1,e quindi autoaggiunto (essendo continuo).Una cosa interessante è che le ultime due proprietà dell’operatore enunciate

nel teorema precedente, cioè il fatto che PV sia idempotente e autoaggiunto,caratterizzano astrattamente gli operatori di proiezione ortogonale, come oramostreremo. Diamo anzitutto la seguente:

Definizione 1.10 In uno spazio di Hilbert H, si dice operatore di proiezioneortogonale un operatore P ∈ B (H) (spazio degli operatori lineari continui suH) tale che P 2 = P e P ∗ = P.

La definizione è giustificata dal fatto che un operatore di proiezione ortog-onale, così come è stato ora definito mediante poche proprietà astratte, risultasempre identificabile con un “concreto” operatore di proiezione ortogonale suun sottospazio chiuso di H. Infatti:

Proposizione 1.5 Sia P ∈ B (H) tale che P 2 = P e P ∗ = P. Allora, dettoV = RangeP (cioè V è l’insieme dei valori Px al variare di x in H) si ha:(i) V è un sottospazio vettoriale chiuso di H;(ii) P è l’operatore di proiezione ortogonale di H su V , ossia:

P : H → V

è lineare e continuo e per ogni x ∈ H è:

Px− x ⊥ V‖Px− x‖ = min

y∈V‖y − x‖

‖Px‖ ≤ ‖x‖

(iii) Se P1, P2 sono due diverse proiezioni (cioè soddisfano entrambi le ipotesidel teorema), detti Vi = RangePi per i = 1, 2 si ha che

P1P2 = 0⇐⇒ V1 ⊥ V2.

Dimostrazione. (i) V = P (H) è uno spazio vettoriale perché P è lineare,chiuso perché se yn ⊂ P (H) e yn → y allora:

yn = Pxn per qualche xn ∈ H, dunque Pyn = P 2xn = Pxn = yn. Allorapoiché P è continuo e yn → y, si ha Pyn → Py, d’altro canto yn = Pyn perciòy = Py, dunque y ∈ P (H), e P (H) è chiuso.(ii) Per definizione di V è P : H → V e per ipotesi P ∈ B (H). Mostriamo

che Px− x ⊥ V . Anzitutto, Px− x ∈ kerP perché

P (Px− x) = P 2x− Px = Px− Px = 0.

Se ora y ∈ V cioè y = Pz per qualche z, per la simmetria di P si ha

〈Px− x, y〉 = 〈Px− x, Pz〉 = 〈P (Px− x) , z〉 = 〈0, z〉 = 0,

42

Page 43: Introduzione al formalismo matematico della meccanica ...

dunque Px− x ⊥ V. Allora per ogni y ∈ V possiamo scrivere

‖y − x‖2 = ‖(y − Px) + (Px− x)‖2

e poiché (Px− x) ∈ V ⊥ e (y − Px) ∈ V , per il teorema di Pitagora

= ‖y − Px‖2 + ‖Px− x‖2 ≥ ‖Px− x‖2 .

Inoltre,‖Px‖2 = 〈Px, Px〉 =

⟨x, P 2x

⟩= 〈x, Px〉 ≤ ‖x‖ ‖Px‖

da cui‖Px‖ ≤ ‖x‖ .

(iii) Supponiamo prima che P1P2 = 0, consideriamo yi ∈ Vi per i = 1, 2 emostriamo che 〈y1, y2〉 = 0. Poiché Vi = RangePi esistono x1, x2 ∈ H tali che

yi = Pixi, i = 1, 2.

Allora〈y1, y2〉 = 〈P1x1, P2x2〉 = 〈x1, P1P2x2〉 = 〈x1, 0〉 = 0.

Viceversa, siano V1 ⊥ V2, x ∈ H e mostriamo che P1P2 = 0. Preso x ∈ H siha

‖P1P2x‖2 = 〈P1P2x, P1P2x〉=⟨P2x, P

21P2x

⟩= 〈P2x, P1P2x〉 = 0

perchéP2x ∈ V2, P1P2x ∈ V1 e V1 ⊥ V2.

Perciò P1P2 = 0.

Esempio 1.20 Gli esempi, che già conosciamo (v. [3, Cap.4]), di proiezioneortogonale su un sottospazio vettoriale di dimensione finita in cui è nota unabase ortonormale, rientrano anche in questo quadro generale. Se V è il sot-tospazio generato dalla base ortonormale e1, ..., en l’operatore di proiezione suV è

PV f =

n∑j=1

〈ej , f〉 ej .

E’facile verificare che questo tipo di operatore soddisfa le proprietà che definis-cono una proiezione ortogonale astratta. PV è ovviamente lineare, ed è continuoperché già sappiamo che

‖PV f‖ ≤ ‖f‖ .

Inoltre

P 2V f =

n∑j=1

〈ej , PV f〉 ej =

n∑j=1

⟨ej ,

n∑k=1

〈ek, f〉 ek

⟩ej =

n∑j=1

n∑k=1

〈ek, f〉 〈ej , ek〉 ej

43

Page 44: Introduzione al formalismo matematico della meccanica ...

per l’ortonormalità

=

n∑j=1

〈ej , f〉 ej = PV f,

quindi P 2V = PV . Infine

〈PV f, f〉 =

⟨n∑j=1

〈ej , f〉 ej , f⟩

=

n∑j=1

〈ej , f〉 〈ej , f〉 =

n∑j=1

|〈f, ej〉|2

〈f, PV f〉 =

⟨f,

n∑j=1

〈ej , f〉 ej

⟩=

n∑j=1

〈ej , f〉 〈f, ej〉

=

n∑j=1

〈ej , f〉 〈ej , f〉 =n∑j=1

|〈f, ej〉|2 = 〈PV f, f〉

e in base alla Proposizione 1.1 questo è suffi ciente a provare che PV è simme-trico, e quindi autoaggiunto essendo continuo.

Vogliamo ora fare esempi di operatori di proiezione su sottospazi vettorialidi dimensione infinita. Gli operatori dei prossimi esempi avranno un’espres-sione analitica semplice, ma non esprimibile al modo dell’esempio precedente,mediante un sistema finito di vettori ortonormali.

Esempio 1.21 Sia

P : L2 (R)→ L2 (R)

P : f 7−→ fχ(a,b)

per un certo intervallo (a, b) fissato. L’operatore è ovviamente lineare, inoltre

‖Pf‖22 =

∫ b

a

|f (x)|2 dx ≤∫R|f (x)|2 dx = ‖f‖22 ,

perciò P è continuo. Si ha

P 2f (x) =(f (x)χ(a,b) (x)

)χ(a,b) (x) = f (x)χ(a,b) (x) = Pf (x)

〈Pf, g〉 =

∫Rf (x)χ(a,b) (x) g (x)dx =

∫Rf (x)χ(a,b) (x) g (x)dx = 〈f, Pg〉

per ogni f, g ∈ L2 (R), perciò P ∗ = P . Dunque P è un operatore di proiezioneortogonale. Sia:

V = RangeP =fχ(a,b) : f ∈ L2 (R)

.

Lo spazio V non è altro che il sottospazio delle funzioni L2 (R) identicamentenulle fuori da (a, b); è un sottospazio chiuso e ha dimensione infinita; P è l’op-eratore di proiezione ortogonale su V . Come si vede, in questo caso l’operatorenon agisce mediante il prodotto scalare con elementi ortonormali fissati.

44

Page 45: Introduzione al formalismo matematico della meccanica ...

Esempio 1.22 Sia

P : L2 (R)→ L2 (R)

P : f 7−→ F−1(fχ(a,b)

)per un certo intervallo (a, b) fissato. In altre parole, l’operatore P è un filtroche taglia le frequenze di f fuori dalla banda (a, b). L’operatore è ovviamentelineare, inoltre

‖Pf‖22 =∥∥∥P f∥∥∥2

2=

∫ b

a

∣∣∣f (ξ)∣∣∣2 dξ ≤ ∫

R

∣∣∣f (ξ)∣∣∣2 dξ =

∥∥∥f∥∥∥2

2= ‖f‖22 ,

perciò P è continuo. Si ha

P 2f = F−1

(F−1(fχ(a,b)

)χ(a,b)

)= F−1

(fχ(a,b)χ(a,b)

)= F−1

(fχ(a,b)

)= Pf

〈Pf, g〉 =⟨P f , g

⟩=⟨fχ(a,b), g

⟩=⟨f , χ(a,b)g

⟩=⟨f , P g

⟩= 〈f, Pg〉

per ogni f, g ∈ L2 (R), perciò P ∗ = P . Dunque P è un operatore di proiezioneortogonale. Sia:

V = RangeP =F−1

(fχ(a,b)

): f ∈ L2 (R)

.

Lo spazio V è il sottospazio delle funzioni L2 (R) la cui trasformata di Fourierè identicamente nulla fuori da (a, b); è un sottospazio chiuso e ha dimensioneinfinita; P è l’operatore di proiezione ortogonale su V .

Esercizio 1.11 Partendo dalla scrittura esplicita

Pf (x) = F−1(fχ(a,b)

)(x) =

∫Rf (ξ)χ(a,b) (ξ) e2πiξxdξ,

mostrare che se a, b sono entrambi finiti si può riscrivere P come operatore diconvoluzione

Pf (x) =

∫Rk (x− y) f (y) dy

per un certo nucleo k (t), che si chiede di calcolare esplicitamente. Il problema èche questo nucleo k (t) appartiene a L2 (R) ma non a L1 (R), quindi (ricordandoil teorema di Young: se f ∈ L2 (R) e k ∈ L1 (R) allora f ∗k ∈ L2 (R)) da questarappresentazione non è ovvio che P sia ben definita e continua su L2 (R), cosache invece si legge facilmente dalla sua definizione via trasformata di Fourier.

2 Richiami di calcolo delle probabilità

Nell’impostazione assiomatica moderna del calcolo delle probabilità, dovuta aN. Kolmogorov, negli anni 193023 , uno spazio di probabilità è definito come un23Nel 1933 fu stampata la prima edizione dell’opera di Kolmogorov “Fondamenti di teoria

della probabilità”, in tedesco; fu tradotta in russo nel 1936 e in inglese nel 1950. Si noti

45

Page 46: Introduzione al formalismo matematico della meccanica ...

particolare spazio di misura (nel senso della teoria della misura astratta “allaLebesgue”), precisamente come una terna

(Ω,M, P )

dove:Ω, detto spazio campionario, è un insieme, che rappresenta l’insieme dei

possibili esiti elementari di un esperimento aleatorio; gli elementi di Ω si diconoeventi elementari ;M, detta sigma algebra degli eventi, è una σ-algebra di sottoinsiemi di Ω, e

rappresenta la famiglia dei possibili eventi (non solo elementari) di cui potremmovoler calcolare la probabilità; gli elementi diM si dicono eventi, e sono insiemidi eventi elementari.

P , detta misura di probabilità, è una misura su (Ω,M), tale che P (Ω) = 1.Perciò P è una funzione d’insieme,

P :M→ [0, 1] ,

numerabilmente additiva. Per ogni E ∈ M, P (E) è la probabilità dell’eventoE, ed è espressa da un numero fra 0 e 1.

Esempio 2.1 Se consideriamo l’esperimento aleatorio “lancio di due dadi”, lospazio campionario Ω è l’insieme delle coppie ordinate (i, j) con i, j = 1, 2, ..., 6,dove l’evento elementare (i, j) significa “il primo dado ha fatto i, il secondo hafatto j”. La σ-algebra degli eventi in questo caso è semplicemente24 M = P (Ω),perché nel caso di uno spazio campionario finito possiamo facilmente assegnareuna probabilità a ogni sottoinsieme di Ω. Infine, la misura P è quella uniforme,cioè P (E) è il rapporto tra il numero di elementi di E e il numero totale dielementi di Ω (cioè 36).

Una variabile aleatoria (d’ora in poi abbreviata v.a.) è una quantità cheassume un valore (reale) in dipendenza dall’evento elementare che si è realizzato,perciò è una funzione

X : Ω→ R.

Nell’esempio del lancio dei due dadi, una v.a. potrebbe essere

X = somma dei punti dei due dadi,

che assume valori interi da 2 a 12.Ci interessa calcolare la probabilità che X assuma certi valori, o assuma

valori in certi intervalli di R, ossia ci interessa calcolare, ad esempio

P (ω ∈ Ω : X (ω) ∈ (a, b)) ,

la coincidenza temporale con i lavori fondamentali di analisi funzionale e il fatto, anch’essosegno dei tempi, della ricerca (per la prima volta) di una sistemazione assiomatica di questadisciplina.24 il simbolo P (Ω) indica l’insieme delle parti di Ω, cioè l’insieme di tutti i possibili

sottoinsiemi di Ω, compreso l’insieme vuoto e Ω stesso.

46

Page 47: Introduzione al formalismo matematico della meccanica ...

espressione solitamente abbreviata in

P (X ∈ (a, b)) .

La funzioneI 7→ P (X ∈ I)

che ad ogni intervallo assegna la probabilità che X assuma valori in quell’inter-vallo si dice legge della v.a. X. Se conosciamo la legge di X, siamo in gradodi fare tutti i calcoli che ci interessano sulla v.a. X. Affi nché sia concettual-mente possibile calcolare P (X ∈ (a, b)) occorre che l’insieme (X ∈ (a, b)) siaun evento, cioè appartenga alla σ-algebraM. Col linguaggio della teoria dellamisura, questo significa che una variabile aleatoria su Ω è una (qualsiasi) fun-zione X : Ω → R misurabile. Quest’ultima è la definizione precisa di variabilealeatoria.Si presti attenzione alla differenza tra il concetto di variabile aleatoria e

quello di legge di una variabile aleatoria. Ad esempio, supponiamo di lanciaredue dadi, uno rosso e uno blu. Siano X,Y le variabili aleatorie “punteggio datodal dado rosso”e “punteggio dato dal dado blu”. Ovviamente sono due variabilialeatorie diverse: in ogni lancio, i due dadi potrebbero dare punteggio diverso.Tuttavia è altrettanto evidente che le due variabili hanno la stessa legge: ognunaassume i valori 1, 2, 3, 4, 5, 6 con probabilità 1/6 per ciascun esito.Le due classi più comuni di variabili aleatorie sono le v.a. discrete e le v.a.

continue.Una v.a. X è discreta se i valori che può assumere sono un insieme finito

o numerabile; ad esempio se X assume solo valori interi, o comunque solo unasuccessione λ1, λ2, λ3... di valori possibili25 . Una v.a. X invece si dice continuase può assumere qualsiasi valore reale in un certo intervallo (a, b). La v.a.“somma dei punti dei due dadi”è discreta, mentre la v.a. “tempo di vita di unalampadina, espresso in secondi”è continua, perché il suo valore, potenzialmente,è qualsiasi numero reale in un intervallo (a, b) ragionevole.

Per una v.a. discreta che può assumere solo i valori λ1, λ2, λ3..., una voltache conosciamo i numeri

cn = P (X = λn)

possiamo calcolare la probabilità di qualsiasi evento legato a X, calcolando

P (X ∈ (a, b)) =∑

n:λn∈Ecn,

25Questa definizione, anche se è quella solitamente scritta nei testi, non è del tutto sod-disfacente. Ciò che rende una v.a. “discreta” non è semplicemente la cardinalità numerabiledell’insieme dei valori assunti, ma il fatto che questi valori siano “separati uno dall’altro”. Unadefinizione più soddisfacente potrebbe essere: una v.a. è discreta se l’insieme dei valori chepuò assumere ha chiusura numerabile. Ad esempio Q è un insieme numerabile, ma non è uninsieme discreto, perché la sua chiusura è il continuo R. Invece, l’insieme 1/n : n = 1, 2, 3, ...ha chiusura numerabile. Finezze a parte, le v.a. discrete più comuni hanno semplicementecome possibili valori gli interi.

47

Page 48: Introduzione al formalismo matematico della meccanica ...

dove ovviamente, per il loro significato,

0 ≤ cn ≤ 1 per ogni n, e∞∑n=1

cn = 1.

La successionepX (n) = cn = P (X = λn)

si chiama talvolta densità discreta della v.a. X, e la sua conoscenza, comedetto, è suffi ciente a calcolare le probabilità degli eventi legati a X, medianteuna somma finita o una serie numerica.

Esempio 2.2 Si dice che una v.a. discreta X ha legge di Poisson di parametroλ > 0, e si scrive X ∼ P0 (λ), se assume i valori k = 0, 1, 2, 3, ... con probabilità

pX (k) = e−λλk

k!.

Notiamo che e−λ λk

k! > 0 per ogni k = 0, 1, 2, ... e

∞∑k=0

pX (k) = e−λ∞∑k=0

λk

k!= e−λeλ = 1

(sfruttando la serie di Taylor di ex). Ad esempio,

P (X ≥ 5) = e−λ∞∑k=5

λk

k!.

Per una v.a. continua, la situazione è un po’diversa. Esisterà in generaleuna funzione densità, detta densità continua26 ,

fX (t) ≥ 0, tale che∫RfX (t) dt = 1

e

P (X ∈ (a, b)) =

∫ b

a

fX (t) dt.

Di nuovo, quando conosciamo la funzione densità di X, possiamo calcolarele probabilità di tutti gli eventi che ci interessano.

26Questo nome non deve trarre in inganno: è semplicemente un’abbreviazione di “funzionedensità di una v.a. continua”, ma non significa che la funzione fX sia continua. Ad esempio,potrebbe essere fX (t) = χ(0,1) (t) .

48

Page 49: Introduzione al formalismo matematico della meccanica ...

Esempio 2.3 Si dice che una v.a. continua X ha legge normale standard seha densità

fX (t) =1√2πe−t

2/2.

Si noti che fX (t) > 0 per ogni t e∫R fX (t) dt = 1. Si avrà

P (X ∈ (a, b)) =1√2π

∫ b

a

e−t2/2dt.

Esempio 2.4 Più in generale, una v.a. continua X ha legge normale N(µ, σ2

)(e si scrive X ∼ N

(µ, σ2

)) se X ha densità

fX (t) =1√2πσ

e−(t−µ)2/2σ.

Si noti che fX (t) > 0 per ogni t e∫R fX (t) dt = 1. Si avrà

P (X ∈ (a, b)) =1√2πσ

∫ b

a

e−(t−µ)2/2σdt.

Spesso, nella pratica, dopo aver definito “a parole”il significato di una v.a.X, dal punto di vista analitico ci si limita a esplicitare la sua funzione densità(discreta o continua), senza stare neppure a precisare lo spazio campionario Ωe la definizione di X come funzione da Ω a R. In sostanza, si specifica la leggedella v.a. senza definire accuratamente la v.a. stessa. Delle variabili aleatorieche compaiono nella meccanica quantistica (gli “osservabili”) ci limiteremo aprecisare la legge, senza discutere dello spazio di probabilità su cui sono definite.Una v.a., anziché avere valori scalari, potrebbe avere valori vettoriali. Ad

esempio, la posizione aleatoria di una particella quantistica nello spazio tridi-mensionale è un vettore aleatorio X, ovvero un vettore di v.a.; la sua den-sità continua è una funzione di tre variabili fX (x1, x2, x3) e avrà il significatoespresso dalla formula:

P (X ∈ E) =

∫E

fX (x1, x2, x3) dx1dx2dx3 per E ⊂ R3.

Due quantità fondamentali legati alle v.a. sono il valore atteso e la varianza,che ora definiamo.Il valore atteso di una v.a. X (che indica in un certo senso la sua “media”),

indicato solitamente nei testi matematici col simbolo E (X) e nei testi fisici colsimbolo 〈X〉, è definito formalmente come

E (X) = 〈X〉 =

∫Ω

X (ω) dP (ω) . (2.1)

Si presti attenzione al fatto che questo è un integrale astratto, fatto non (ad es-empio) su R, ma sull’insieme degli eventi elementari; è un integrale rispetto alla

49

Page 50: Introduzione al formalismo matematico della meccanica ...

misura di probabilità. Si noti come il calcolo delle probabilità moderno utilizzia fondo l’astrazione e la generalità della teoria della misura e dell’integrazione“alla Lebesgue”. Questa definizione di valore atteso come integrale della v.a.aiuta a capire e dimostrare facilmente certe proprietà del valore atteso, come lasua linearità, cioè il fatto che risulti

E (λX + µY ) = λEX + µEY,

dal momento che questa relazione non è altro che la linearità dell’integrale.Raramente però la (2.1) è di aiuto al calcolo effettivo del valore atteso. Per ilcalcolo si usa normalmente un’altra caratterizzazione del valore atteso, che sipuò fare, però, separatamente per le v.a. discrete o continue.Se X è una v.a. discreta, che assume i possibili valori λn∞n=1 con proba-

bilitàP (X = λn) = pX (n) ,

allora

EX =

∞∑n=1

λnpX (n) .

Si noti che questa è una serie numerica (a termini non necessariamente positivi),di cui non è garantita a priori la convergenza: il valore atteso potrebbe nonesistere. Del resto, anche dalla definizione astratta (2.1) questo è apparente: unav.a. è per definizione una funzione X : Ω→ R misurabile, non necessariamenteintegrabile.

Esempio 2.5 Calcoliamo il valore atteso di una v.a. X avente legge di PoissonP0 (λ) (v. Esempio 2.2) cioè tale che pX (k) = e−λ λ

k

k! per k = 0, 1, 2... Si ha:

EX =

∞∑k=0

ke−λλk

k!= e−λ

∞∑k=1

λk

(k − 1)!

= λe−λ∞∑k=1

λ(k−1)

(k − 1)!= λe−λ

∞∑k=0

λk

k!= λe−λeλ = λ.

In particolare, il valore atteso è finito.

Esempio 2.6 Una v.a. (discreta) si dice avere legge geometrica di parametrop ∈ (0, 1) se assume i valori possibili

n = 1, 2, 3, ...

con probabilitàpX (n) = p (1− p)n−1

.

Se p = 12 , ad esempio, questa v.a. può rappresentare il “numero di volte in cui

devo lanciare una moneta per ottenere la prima volta testa”. Il suo valore attesoè

EX =

∞∑n=1

np (1− p)n−1=

1

p

(come si può dimostrare). In particolare, è finito.

50

Page 51: Introduzione al formalismo matematico della meccanica ...

Esempio 2.7 Se X è una v.a. che assume i valori

n = 1, 2, 3, ...

con probabilità27

pX (n) =6

π2

1

n2,

allora

E (X) =6

π2

∞∑n=1

1

n= +∞

(serie armonica divergente).

Se invece X è una v.a. continua, con densità fX (t), allora

E (X) =

∫RtfX (t) dt.

Di nuovo, il valore atteso potrebbe anche non esiste finito.

Esempio 2.8 Una v.a. X di legge normale standard, cioè con

fX (t) =1√2πe−t

2/2

avrà

E (X) =1√2π

∫Rte−t

2/2dt = 0.

Esempio 2.9 Una v.a. X con densità continua28

fX (t) =1

π

1

1 + t2

avrà

E (X) =1

π

∫R

t

1 + t2dt non convergente

(almeno nel senso di Lebesgue), perché tende a zero all’infinito come 1/t, nonintegrabile.

27E’noto che∞∑n=1

1

n2=π2

6, quindi

∞∑n=1

pX (n) = 1.

28Si noti che ∫R

1

π

1

1 + t2dt = 1.

51

Page 52: Introduzione al formalismo matematico della meccanica ...

SeX= (X1, X2, X3) è un vettore aleatorio in R3, di densità continua fX (x1, x2, x3),potremo calcolare il valore atteso di ognuna delle sue componenti,

E (Xi) =

∫R3xifX (x1, x2, x3) dx1dx2dx3.

Introduciamo ora la varianza di una v.a. Si tratta di un “indice di dis-persione”che misura quanto i valori assunti dalla variabile sono probabilmentelontani dal suo valore atteso (quindi, quanto sono “dispersi”). La definizione èricondotta a quella di valore atteso:

Var (X) = σ2X = E

((X − EX)

2)

=

∫Ω

(X (ω)− E (X))2dP (ω)

che, fatti i conti in base alla linearità del valore atteso, si può riscrivere anchecosì:

Var (X) = E(X2)− (EX)

2. (2.2)

Per il calcolo effettivo è bene di nuovo distinguere il caso discreto da quellocontinuo. Si usa la formula (2.2), in cui (E (X))

2 sappiamo già calcolarla, mentreE(X2)si calcola nel caso discreto così:

E(X2)

=

∞∑n=1

λ2npX (n)

e nel caso continuo così:

E(X2)

=

∫Rt2fX (t) dt.

Come per il valore atteso, a maggior ragione per la varianza non è garantitala sua finitezza.Dalla prima definizione di varianza si legge in particolare che una v.a. con

varianza nulla è costante:

Var (X) = 0 =

∫Ω

(X (ω)− E (X))2dP (ω)⇒ X (ω)− E (X) = 0,

X = E (X)

(per la precisione, dovremmo dire che è costante quasi ovunque, o come si dicein linguaggio probabilistico, “costante quasi certamente”).Si osservi che, dimensionalmente, la varianza è una grandezza quadratica

rispetto alla v.a. corrisponente. Per avere una grandezza che rappresenti ancoraun indice di dispersione, e sia dimensionalmente omogenea a X, si introduce ladeviazione standard σX , che è per definizione la radice quadrata della varianza:

σX =√

VarX.

52

Page 53: Introduzione al formalismo matematico della meccanica ...

Esempio 2.10 Per una v.a. continua di legge N(µ, σ2

)si ha

E (X) = µ

Var (X) = σ2.

Quindi i due parametri µ, σ della normale hanno il significato di media e devi-azione standard. Si capisce bene il significato della varianza (o della deviazionestandard) come indice di dispersione osservando i grafici di densità normaliper diversi valori di σ. Valori di σ piccoli indicano una legge poco dispersa, cioèmolto concentrata, con un grafico della densità a “campana alta e stretta”, men-tre valori di σ grandi corrispondono a una legge molto dispersa, con un graficodella densità a “campana bassa e larga”:

Grafici di densità N(0, σ2

)con σ = 4 (curva più bassa) e σ = 0.3 (curva più alta)

Un teorema, semplice ma fondamentale, che illustra bene il significato dellavarianza, è il seguente:

Teorema 2.1 (Disuguaglianza di Cebicev) Sia X una v.a. qualsiasi aventevalore atteso µX e varianza σ2

X finiti. Allora per ogni δ > 1 si ha

P (|X − µX | < δσX) ≥ 1− 1

δ2.

Per δ grande la quantità 1 − 1δ2 si avvicina a 1. Dunque la disuguaglianza

precedente esprime il fatto che, con grande probabilità, una variabile aleatoriasi discosta dal proprio valor medio per meno di un certo multiplo della propriadeviazione standard. Qualche esempio numerico spiegherà meglio quest’idea.Scegliendo δ = 2, 3, 5, 10 otteniamo:

P (|X − µX | < 2σX) ≥ 0.75

P (|X − µX | < 3σX) ≥ 0.88

P (|X − µX | < 5σX) ≥ 0.96

P (|X − µX | < 10σX) ≥ 0.99.

53

Page 54: Introduzione al formalismo matematico della meccanica ...

Ad esempio, con probabilità di almeno il 99% una qualsiasi variabile aleatorianon si discosta dalla propria media per più di 10 deviazioni standard. Si riflettasull’interesse di questo tipo di affermazioni quando X rappresenta la misura diuna grandezza fisica e σX l’incertezza di questa misura.La cosa notevole della precedente disuguaglianza è che vale per qualsiasi

v.a., comunque sia distribuita (purché µX e σX siano finite). Questo pregiosuggerisce anche il difetto di questo risultato: dovendo valere così in generale,questa stima non sarà molto precisa. Ad esempio, se sappiamo che X ha leggeGaussiana N

(µ, σ2

)allora si può calcolare che è:

P (|X − µ| < 2σ) ≥ 0.9545

P (|X − µ| < 3σ) ≥ 0.9973

P (|X − µ| < 5σ) ≥ 0.999999

P (|X − µ| < 10σ) ' 1.

Queste ultime stime sono compatibili con quelle del teorema di Cebicev, mamolto più precise. Ad esempio, su molti testi di statistica si dice che una v.a.normale assume “in pratica” valori compresi nell’intervallo (µ− 3σ, µ+ 3σ) .Quel che si può dire rigorosamente è che una v.a. normale assume valori inquest’intervallo con probabilità maggiore di 0.99.

Media e varianza di X richiedono di calcolare E (X) e E(X2). Più in gen-

erale, si dice momento n-esimo di una v.a. X il valore atteso E (Xn). I momentisuccessivi al secondo rappresentano, o servono a costruire, opportuni indici diforma legati alla v.a. Inoltre vari risultati trattano il problema di ricostruire lalegge di una v.a. dai suoi (infiniti) momenti, nell’ipotesi che siano tutti finiti.

Concludiamo con quest’osservazione. In tutte le presentazioni didattiche“elementari”del calcolo delle probabilità ci si limita a considerare le due classidi v.a. discrete e continue, e le si considerano separatamente, stabilendo dueserie distinte di risultati, analoghi, ma comunque differenti. Uno dei punti diforza della teoria di Kolmogorov è che v.a. discrete e continue sono trattatesimultanemanete come casi particolari di un concetto più generale. Ad esempiovalore atteso e varianza di una v.a., non sono definite da formule distinte nelcaso discreto o continuo, ma da un’unica formula generale, che però fa uso diun integrale astratto, di cui le serie numeriche e gli integrali su R sono casiparticolari.

54

Page 55: Introduzione al formalismo matematico della meccanica ...

3 Introduzione al formalismo matematico dellameccanica quantistica

Lo scopo di questa sezione non è introdurre la meccanica quantistica dal pun-to di vista delle sue motivazioni fisiche, ma introdurre e spiegare dal puntodi vista matematico il linguaggio e gli assiomi di base di questa teoria nellasua presentazione formalizzata. Una certa conoscenza e comprensione dei con-cetti matematici che entrano in questa formalizzazione, e che abbiamo discussonelle sezioni precedenti, dovrebbe dare a questo discorso, obiettivamente moltoastratto, una maggior naturalezza e motivazione.Come si vedrà, utilizzeremo qui elementi di teoria degli spazi di Hilbert, in

particolare riguardanti operatori lineari non limitati su spazi di Hilbert, ele-menti di teoria della misura e dell’integrazione di Lebesgue, e qualche nozioneprobabilistica di base sulle variabili aleatorie.

3.1 Stati, osservabili, valori attesi. Gli operatori fonda-mentali

Consideriamo un “sistema quantistico”, che per semplicità per noi consisteràsempre in una singola particella, priva di spin, non relativistica, in moto sullaretta oppure nello spazio tridimensionale.

Assioma 1. Lo stato del sistema è rappresentato da una funzione d’ondaψ (x, t); per ogni t, la funzione ψ (·, t) è un vettore unitario in un opportunospazio di Hilbert H. Per una particella quantistica in moto sulla retta o nellospazio, H è, rispettivamente, L2 (R) o L2

(R3). Se ψ1 e ψ2 sono due vettori

unitari in H e ψ1 = cψ2 per qualche c ∈ C (di conseguenza |c| = 1), allora ψ1 eψ2 rappresentano lo stesso stato.L’interpretazione probabilistica della funzione d’onda è (indicando con P (A)

la probabilità dell’evento A) :

P (trovare la particella nell’insieme E all’istante t) =

∫E

|ψ (x, t)|2 dx

(con E ⊂ R o R3, insieme Lebesgue misurabile).

Diamo qualche spiegazione e traiamo qualche prima conseguenza matematicadi questo assioma. L’interpretazione probabilistica significa che la funzione

x 7→ |ψ (x, t)|2

(per t fissato e x variabile) è la densità di probabilità della variabile aleatoriacontinua (vettoriale, se siamo in R3)

X (t) = “posizione della particella all’istante t”

P (X (t) ∈ E) =

∫E

|ψ (x, t)|2 dx.

55

Page 56: Introduzione al formalismo matematico della meccanica ...

Questo è il motivo per cui dev’essere necessariamente

‖ψ (·, t)‖L2 = 1 per ogni t.

La moltiplicazione per una costante complessa di modulo 1 non altera il valoredi P (X (t) ∈ E). Vedremo in seguito che non altererà nemmeno le probabilitàlegate ad altri osservabili, il che giustifica l’affermazione che moltiplicare per unacostante di modulo 1 non alteri lo stato del sistema. Dalla densità di probabilitàpossiamo calcolare il valore atteso della posizione (v. § 2)

E (X (t)) =

∫Rx |ψ (x, t)|2 dx

o, se siamo in R3,

E (Xi (t)) =

∫R3xi |ψ (x, t)|2 dx per i = 1, 2, 3.

L’operatore posizioneL’integrale precedente, che definisce il valore atteso della posizione, si può anchescrivere (tornando per semplicità al caso unidimensionale)∫

Rx |ψ (x, t)|2 dx =

∫Rxψ (x, t)ψ (x, t)dx = 〈ψ (·, t) , xψ (·, t)〉

il che può suggerire di introdurre l’operatore posizione,

Xψ (x) = xψ (x) .

Nel § 1.3 abbiamo studiato qualche proprietà di quest’operatore (v. Esempi 1.3,1.7, 1.13): è un operatore lineare non limitato, definito sul dominio

D (X) =f ∈ L2 (R) : xf (x) ∈ L2 (R)

,

denso nello spazio di Hilbert H = L2 (R). E’un operatore autoaggiunto, privodi autovalori29 , e il suo spettro è σ (X) = R.Con questa definizione si ha dunque

E (X (t)) = 〈ψ (·, t) , Xψ (·, t)〉 .

Nel caso tridimensionale avremo 3 operatori, di analoghe proprietà,

Xjψ (x) = xjψ (x) per j = 1, 2, 3

29Ricordiamo che la ricerca di autovalori e autofunzioni porta a:

xψ (x) = λψ (x) ,

che evidentemente non ha soluzioni ψ diverse dalla funzione identicamente nulla. Su alcunitesti di fisica si trova scritto che la delta di Dirac δλ sarebbe una “autofunzione generalizzata”corrispondente all’autovalore λ. In effetti è vero che, nel senso delle distribuzioni, risultaxδλ = λδλ. Tuttavia δλ non è una funzione L2, perciò non è un’autofunzione. L’operatore Xnon ha autovalori né autofunzioni.

56

Page 57: Introduzione al formalismo matematico della meccanica ...

definiti suD (Xj) =

f ∈ L2

(R3)

: xjf (x) ∈ L2(R3).

In generale, in meccanica quantistica il valore assunto in una misura da uncerto osservabile è visto come una variabile aleatoria30 . L’idea è associare aogni osservabile A un opportuno operatore lineare A sullo spazio di Hilbert, inmodo che il valore atteso del risultato della misurazione di A per un sistemanello stato ψ risulti

E (A) = 〈A〉 = 〈ψ,Aψ〉

(che è esattamente quanto succede per l’osservabile posizione, se definiamol’operatore posizione come sopra). Più precisamente, si dà il seguente:

Assioma 2. Ad ogni osservabile A del sistema quantistico (posizione, mo-mento, energia...) corrisponde un operatore A lineare, non limitato, autoag-giunto sullo spazio di Hilbert H, tale che se il sistema si trova nello stato ψ (x)(normalizzato in L2) il valore atteso della misura dell’osservabile soddisfa

Eψ (A) = 〈A〉ψ = 〈ψ,Aψ〉 . (3.1)

Più in generale, è anche, per n = 1, 2, 3, ...

Eψ (An) = 〈ψ,Anψ〉

Si noti che la seconda affermazione non è conseguenza logica della prima, marappresenta effettivamente un’ipotesi più forte. Ad esempio, per n = 2, stiamosupponendo che se un osservabile A è rappresentato dall’operatore A, alloral’osservabile A2 (ad es.: il quadrato della posizione, il quadrato dell’energiacinetica, ecc.) sia rappresentato da A2, che significa l’operatore A compostocon A. Questa “regola di sostituzione”è molto naturale, ma non è logicamentenecessaria: è parte del contenuto dell’assioma.D’altro canto, si osservi che nel caso particolare dell’operatore posizione,

tutto ciò che afferma l’assioma 2 è contenuto nell’assioma 1, compreso il fattoche

Eψ (Xn) = 〈ψ,Xnψ〉 .

Infatti, comporre n volte l’operatore di moltiplicazione per x equivale a moltipli-care per xn, di conseguenza il valore atteso di Xn si calcola proprio integrandoxn contro la densità di probabilità della v.a. posizione, cioè |ψ (x)|2: quindi

Eψ (Xn) =

∫Rxn |ψ (x)|2 dx = 〈ψ,Xnψ〉 .

Si osservi che nella (3.1) non compare esplicitamente il tempo. Il tempo ineffetti fino a questo punto della teoria è visto come puro e semplice parametro:

30Come anticipato, rinunceremo a precisare su quale spazi di probabilità sono definite questevariabili aleatorie, accontentandoci di precisare la legge di queste v.a., ossia come si calcola laprobabilità che assumano un qualsiasi valore.

57

Page 58: Introduzione al formalismo matematico della meccanica ...

per ogni istante t possiamo vedere un osservabile come una v.a. A (t), lo statodel sistema è ψ (·, t) e si avrà

Eψ (A (t)) = 〈ψ (·, t) , Aψ (·, t)〉 .

Facciamo qualche commento anche su questo assioma. Per un qualsiasi op-eratore lineare A che vogliamo rappresenti un osservabile, per la disuguaglianzadi Cauchy-Schwartz, ricordando che ‖ψ‖2 = 1, si ha

|〈ψ,Aψ〉| ≤ ‖ψ‖2 ‖Aψ‖2 = ‖Aψ‖2e se fosse A lineare continuo

≤ ‖A‖ ‖ψ‖2 = ‖A‖

cioè: il valore atteso della misura di A sarebbe una grandezza limitata indipen-dentemente dallo stato, cosa che non può essere vera per posizione, momento,energia... (sarebbe come dire che per una particella quantistica qualsiasi la po-sizione, il momento, l’energia non possono crescere oltre un certo limite assoluto,cosa evidentemente falsa dal punto di vista fisico). Quindi:gli operatori lineari che rappresentano osservabili della meccanica quantistica

sono necessariamente illimitati.Un’altra conseguenza logica dell’assioma che vuole il valore atteso di A

espresso da 〈ψ,Aψ〉 è il fatto che dev’essere

〈ψ,Aψ〉 reale per ogni ψ ∈ H.

Questo, come abbiamo visto (v. Proposizione 1.1), accade se e solo se l’operatoreA è simmetrico. A sua volta, abbiamo visto (v. Proposizione 1.2) che unoperatore lineare simmetrico A per il quale si ha D (A) = H è necessariamentecontinuo. Poiché abbiamo già visto che gli operatori della meccanica quantisticadevono essere simmetrici e non limitati, ne segue anche che:gli operatori lineari che rappresentano osservabili della meccanica quantistica

sono necessariamente definiti su un dominio propriamente contenuto in H.Vedremo in seguito qualche motivazione del perché è opportuno chiedere che

gli operatori siano non solo simmetrici ma autoaggiunti.Infine, notiamo che se ψ è un vettore unitario in H e c ∈ C, |c| = 1, allora

〈A〉cψ = 〈cψ,Acψ〉 = c 〈ψ, cAψ〉 = cc 〈ψ,Aψ〉 = |c|2 〈ψ,Aψ〉 = 〈ψ,Aψ〉 = 〈A〉ψquindi: il valore atteso di qualsiasi osservabile non cambia se moltiplichiamo lafunzione d’onda per una costante complessa di modulo 1. Questo è un ulterioreelemento a favore di quanto affermato nell’Assioma 1: ψ e cψ rappresentano lostesso stato del sistema.

Incertezza di una misuraAbbiamo visto che la varianza di una variabile aleatoria X è definita da:

Var (X) = E(

(X − E (X))2).

58

Page 59: Introduzione al formalismo matematico della meccanica ...

Applicando questa definizione a una v.a. osservabile A avremo, se il sistema ènello stato ψ,

Varψ (A) = Eψ

((A− Eψ (A))

2).

Anche (A− Eψ (A))2 è un osservabile, e per l’Assioma 2 il suo valore atteso Eψ

si calcolerà perciò

((A− Eψ (A))

2)

=⟨ψ, (A−Eψ (A))

2ψ⟩.

D’altro canto già sappiamo che l’operatore A è simmetrico, quindi (come si verifi-ca facilmente) lo è anche A−c per c costante, e lo è (A− c)2 (che ora rappresentala composizione dell’operatore (A− c) con se stesso). Di conseguenza⟨ψ, (A−Eψ (A))

2ψ⟩

= 〈(A−Eψ (A))ψ, (A−Eψ (A))ψ〉 = ‖(A−Eψ (A))ψ‖2L2 .

Dunque si ha la seguente espressione per la varianza di un osservabile:

Varψ (A) = ‖(A−Eψ (A))ψ‖2L2 .

Si ha anche, sviluppando il prodotto scalare in base alle sue proprietà e ricor-dando che Eψ (A) è reale perché A è simmetrico e 〈ψ,ψ〉 = 1,

Varψ (A) = 〈(A−Eψ (A))ψ, (A−Eψ (A))ψ〉= 〈Aψ,Aψ〉 − Eψ (A) 〈ψ,Aψ〉 − Eψ (A) 〈Aψ,ψ〉+ (Eψ (A))

2 〈ψ,ψ〉=⟨ψ,A2ψ

⟩− 2Eψ (A)

2+ (Eψ (A))

2= Eψ

(A2)− Eψ (A)

2.

da cui si ottiene la formula di calcolo

Varψ (A) = Eψ(A2)− Eψ (A)

2=⟨ψ,A2ψ

⟩− 〈ψ,Aψ〉2 (3.2)

La deviazione standard√Var (A) è indicata anche con ∆ψA

e prende il nome di incertezza (della misura) di A.

Esercizio 3.1 Dimostrare il seguente fatto che abbiamo sfruttato nell’argomen-tazione precedente: se A è un operatore simmetrico su H, allora anche A − cI(con c costante e I operatore identità) lo è, e (A− cI)

2 lo è.

Dalla definizione di varianza come norma L2 leggiamo che se l’incertezza ènulla allora

(A−Eψ (A))ψ = 0

cioèAψ = λψ con λ = Eψ (A)

cioè ψ è un’autofunzione di A e λ, autovalore, è il valore atteso.

59

Page 60: Introduzione al formalismo matematico della meccanica ...

Viceversa, se il sistema si trova in un autostato ψ (normalizzato in L2) conautovalore λ, allora per l’Assioma 2 si avrà

〈A〉ψ = 〈ψ,Aψ〉 = 〈ψ, λψ〉 = λ 〈ψ,ψ〉 = λ.

Ossia: il valore atteso di un osservabile, se il sistema si trova in un autostato, èil corrispondente autovalore. Si ha anche:⟨

A2⟩ψ

=⟨ψ,A2ψ

⟩= 〈ψ, λAψ〉 =

⟨ψ, λ2ψ

⟩= λ2

da cuiVarψ (A) =

⟨A2⟩ψ− 〈A〉2ψ = λ2 − λ2 = 0

quindi l’incertezza di A è nulla.Abbiamo quindi dimostrato il seguente

Teorema 3.1 Il sistema si trova in un autostato dell’operatore A se e solo se lamisura dell’osservabile A non è aleatoria ma dà “quasi certamente”come esitoil valore λ, autovalore corrispondente all’autostato.

Discutiamo ora il secondo osservabile / operatore fondamentale della mec-canica quantistica.

L’operatore momentoL’ipotesi di De Broglie afferma che se la funzione d’onda di una particella quan-tistica ha frequenza spaziale ν (cioè una lunghezza d’onda λ = 1/ν) allora il suomomento è

p = hν =h

λ,

e viceversa. Il significato di questo enunciato nella cornice matematica vista finqui non è così ovvio, perché una funzione d’onda con frequenza spaziale ν è unafunzione del tipo

ce2πiνx,

che certamente non appartiene a L2 (R). Se però scriviamo31

ψ (x) =

∫Re2πixξψ (ξ) dξ (3.3)

stiamo vedendo la funzione d’onda come sovrapposizione di infinite funzionie2πixξ, ciascuna di frequenza spaziale ξ. Poiché∫

R

∣∣∣ψ (ξ)∣∣∣2 dξ =

∫R|ψ (x)|2 dx = 1,

31Stiamo rappresentando una funzione ψ come antitrasformata della propria trasformata diFourier. Scritta così, la formula non è rigorosa per una qualsiasi ψ ∈ L2 (R) ma, ad esempio,per ψ ∈ S (R). Per una generica ψ ∈ L2 (R) dovremmo scrivere

ψ (x) = limR→∞

∫ R

−Re2πixξψ (ξ) dξ,

con il limite da intendersi in norma L2. Non ci soffermiamo su questo, dal momento che questipassaggi hanno più che altro lo scopo di suggerirci la forma dell’operatore momento.

60

Page 61: Introduzione al formalismo matematico della meccanica ...

anche∣∣∣ψ (ξ)

∣∣∣2 è una densità di probabilità, che interpretiamo come la (densitàdi) probabilità che il sistema abbia momento p = hξ. La (3.3) esprime ψ comesovrapposizione di elementi di frequenza spaziale ξ, quindi momento p = hξ,

con probabilità∣∣∣ψ (ξ)

∣∣∣2. Quindi il valore atteso dell’osservabile momento, Pdovrebbe essere

〈P〉 =

∫Rhξ∣∣∣ψ (ξ)

∣∣∣2 dξ =

∫Rhξψ (ξ) ψ (ξ)dξ =

⟨ψ, hξψ

⟩e ricordando che la trasformata di Fourier conserva il prodotto scalare

= 〈ψ, Pψ〉 ,

dove P è l’operatore definito, via trasformata di Fourier, dall’espressione

Pψ (ξ) = hξψ (ξ)

cioè, ricordando la regola di trasformazione della derivata:

Pψ = −i ∂∂xψ.

Infatti (ricordando che = h/2π)

(−i ∂

∂xψ

)= −i

(∂

∂xψ

)= −i (2πiξ) ψ (ξ) = 2πξψ (ξ) = hξψ (ξ) .

Dunque l’operatore momento (unidimensionale) è

P = −i ∂∂x

o equivalentemente

Pψ = F−1(hξψ (ξ)

),

e

〈P〉ψ = 〈ψ, Pψ〉 =

∫Rhξ∣∣∣ψ (ξ)

∣∣∣2 dξ.Quest’operatore coincide, a meno della costante reale −, inessenziale dal puntodi vista matematico, con l’operatore T = i∂x studiato negli Esempi 1.8, 1.14.Pertanto sappiamo già diverse cose: l’operatore è lineare illimitato, autoaggiuntosul dominio

D (P ) =f ∈ L2 (R) : ξf (ξ) ∈ L2 (R)

= H1 (R) ,

61

Page 62: Introduzione al formalismo matematico della meccanica ...

è privo di autovalori32 , e ha spettro σ (P ) = R.

Per la discussione fatta in precedenza sul significato probabilistico di∣∣∣ψ (ξ, t)

∣∣∣2,ricordando che p = hξ possiamo anche dire, per un qualsiasi intervallo E ⊂ R

P (la particella abbia momento p ∈ E all’istante t)

=

∫E/h

∣∣∣ψ (ξ, t)∣∣∣2 dξ =

∫E

1

h

∣∣∣ψ ( ph, t)∣∣∣2 dp.

Nel caso della particella in R3 avremo una v.a. vettoriale P, cioè 3 v.a.scalari P1,P2,P3 corrispondenti ai tre operatori

Pj = −i∂xj

o equivalentemente

Pjψ = F−1(hξjψ (ξ)

),

per j = 1, 2, 3, ξ ∈ R3, con

D (Pj) =f ∈ L2

(R3)

: ξj f (ξ) ∈ L2(R3)⊇ H1

(R3)

con ξ = (ξ1, ξ2, ξ3). In questo caso si avrebbe

〈Pj〉ψ = 〈ψ, Pjψ〉 =

∫R3hξj

∣∣∣ψ (ξ)∣∣∣2 dξ

e per ogni sottoinsieme E misurabile di R3,

Pψ (P (t) ∈ E) =

∫E/h

∣∣∣ψ (ξ, t)∣∣∣2 dξ =

∫E

1

h

∣∣∣ψ ( ph, t)∣∣∣2 dp

con p = (p1, p2, p3) .

Operatori energia cinetica, energia potenziale, hamiltonianaClassicamente, l’energia cinetica di una particella di massa m è espressa da

Ec =1

2mv2 =

1

2m(v2

1 + v22 + v2

3

)=

1

2m

((mv1)

2+ (mv2)

2+ (mv3)

2)

=1

2m

(p2

1 + p22 + p2

3

).

32Vale un’osservazione analoga a quella fatta per l’operatore posizione. Risolvendol’equazione

−i∂xψ = λψ

si trovaψ (x) = ceiλx/,

che però non è una funzione L2 (tranne il caso c = 0 in cui è identicamente nulla). Quindi,anche se in qualche testo di fisica si trova scritto che le eiλx/ sono autofunzioni generaliz-zate dell’operatore momento, la verità è che l’operatore momento non ha né autovalori néautofunzioni.

62

Page 63: Introduzione al formalismo matematico della meccanica ...

Visto che le componenti pj della quantità di moto nella teoria quantistica sonorappresentate dagli operatori

Pj = −i∂xjè naturale rappresentare l’osservabile energia cinetica con l’operatore

Ec =1

2m

(P 2

1 + P 22 + P 2

3

)= −

2

2m

(∂2x1 + ∂2

x2 + ∂2x3

)= −

2

2m∆

dove ∆ è il laplaciano in R3. Come nel caso dell’operatore momento, è più“maneggevole” nelle dimostrazioni matematiche utilizzare la definizione alter-nativa data “via trasformata di Fourier”:

Ecψ (ξ) = − 2

2m∆ψ (ξ) = −

2

2m

(−4π2 |ξ|2

)ψ (ξ) =

h2

2m|ξ|2 ψ (ξ)

Ecψ = F−1

(h2

2m|ξ|2 ψ (ξ)

)con dominio

D (Ec) = D (∆) =ψ ∈ L2

(R3)

: |ξ|2 ψ (ξ) ∈ L2(R3)

= H2(R3)

Quindi il valore atteso dell’energia cinetica per una particella nello stato ψ è

〈Ec〉ψ = 〈ψ,Ecψ〉 =⟨ψ, Ecψ

⟩=

h2

2m

∫R3|ξ|2

∣∣∣ψ (ξ)∣∣∣2 dξ,

ed è finita se33 ψ ∈ H2(R3). Questo valore atteso si può interpretare anche

in un altro modo significativo, pensandolo come integrale in spazio anziché infrequenza. Per ogni funzione ψ ∈ H2

(R3)vale:

〈Ec〉ψ = 〈ψ,Ecψ〉 = − 2

2m

∫R3ψ (x)∆ψ (x) dx =

2

2m

∫R3|∇ψ (x)|2 dx,

che è il cosiddetto “integrale dell’energia”34 .Se ϕ ∈ L2

(R3),

〈ϕ,Ecψ〉 =⟨ϕ, Ecψ

⟩=

⟨ϕ,

h2

2m|ξ|2 ψ

⟩=⟨Ecϕ, ψ

⟩= 〈Ecϕ,ψ〉

33 In realtà, affi nché sia finito l’integrale che assegna 〈ψ,Ecψ〉 è suffi ciente che ψ ∈ H1, maaffi nché Ecψ esista come funzione L2 occorre che ψ ∈ H2.34Ad esempio, in fisica classica, se u (x) è il potenziale elettrostatico nello spazio, l’energia

totale del campo elettrostatico è proprio, a meno di costanti,∫R3|∇u (x)|2 dx.

Molti problemi di fisica matematica sono affrontati analiticamente, mediante il calcolo dellevariazioni, cercando di minimizzare il funzionale dell’energia, dato dall’integrale precedente,su un opportuno spazio di funzioni u.

63

Page 64: Introduzione al formalismo matematico della meccanica ...

purché anche ϕ ∈ H2(R3). Perciò l’operatore è autoaggiunto su H2

(R3).

Per una particella in moto sulla retta sarà, analogamente,

Ec = − 2

2m∂2x = F−1

(h2

2mξ2ψ (ξ)

)su

D (Ec) =ψ ∈ L2 (R) : ξ2ψ (ξ) ∈ L2 (R)

= H2 (R) .

Se la particella è soggetta anche a una forza conservativa, dal punto di vistaclassico è definita la sua energia potenziale V (x). Dal punto di vista quantisti-co, non sappiamo con certezza in quale punto x si trovi la particella all’istante te quindi quanto valga la sua energia potenziale, tuttavia il valore atteso dell’en-ergia potenziale dovrebbe essere una media dei valori di V (x) pesata in basealle probabilità che la particella sia effettivamente in x, ossia dovrebbe essere

〈Ep〉ψ =

∫R3V (x) |ψ (x)|2 dx.

Poiché in base all’Assioma 2 questa quantità, d’altro canto, deve potersi scriverecome

〈Ep〉ψ = 〈ψ,Epψ〉per un certo operatore lineare autoaggiunto Ep, siamo condotti a definire l’operatoreenergia potenziale semplicemente come operatore di moltiplicazione per V (x):

Epψ (x) = V (x)ψ (x) .

(dove ovviamente V (x) ha valori reali) sul dominio

D (Ep) =ψ ∈ L2

(R3)

: V ψ ∈ L2(R3).

L’operatore Ep è ovviamente simmetrico e si ha, come già detto,

〈Ep〉ψ = 〈ψ,Epψ〉 =

∫R3V (x) |ψ (x)|2 dx.

Delle condizioni più esplicite affi nché V ψ ∈ L2(R3)si potranno dare facendo

qualche ipotesi sul potenziale V . Per ora non ne facciamo, e non approfondiamosubito lo studio di questo operatore.Consideriamo invece l’energia totale della particella,

Etot = Ec + Ep

a cui corrisponderà l’operatore

Hψ = − 2

2m∆ψ + V (x)ψ,

su un opportuno dominio del tipo

D (H) =ψ ∈ L2 (R) : ξ2ψ (ξ) ∈ L2 (R) e V ψ ∈ L2

(R3).

64

Page 65: Introduzione al formalismo matematico della meccanica ...

Facendo qualche ipotesi su V (x) si può dare anche una forma più esplicita aldominio D (H).L’operatore H è detto operatore hamiltoniano, e giocherà un ruolo fonda-

mentale nel seguito. Per la v.a. H energia totale si ha

〈H〉ψ = 〈ψ,Hψ〉 =h2

2m

∫R3|ξ|2

∣∣∣ψ (ξ)∣∣∣2 dξ +

∫R3V (x) |ψ (x)|2 dx.

Si possono dare varie condizioni su V sotto le quali H è autoaggiunto. Adesempio, vale il prossimo

Teorema 3.2 In R3, sia

Hψ = − 2

2m∆ψ + V (x)ψ

e supponiamo che V (x) si possa scrivere come somma V = V1 + V2 con V1 ∈L2(R3)e V2 ∈ L∞

(R3). Allora D (H) = D (∆) = H2 (R), e H è autoaggiunto

su questo dominio.

Per la dimostrazione, si veda [Hall, Theorem 9.38].Questo teorema si applica per esempio all’hamiltoniana dell’elettrone del-

l’atomo di idrogeno, per cui V (x) = c/ |x|, che vicino all’origine è L2 (comesi vede passando in coordinate sferiche), mentre lontano dall’origine è limitata.Perciò si può scrivere V = V1 + V2 con

V1 (x) = V (x)χ|x|<1 (x) ∈ L2(R3)

V2 (x) = V (x)χ|x|≥1 (x) ∈ L∞(R3).

Pertanto H risulta autoaggiunto in questo caso.Un altro caso interessante, che non rientra nel teorema precedente ma si

tratta facilmente in modo diretto, è invece il prossimo

Esempio 3.1 Consideriamo l’oscillatore armonico quantistico unidimensionale,per il quale si ha, in L2 (R),

Hψ = − 2

2mψ′′ (x) +

1

2mω2x2ψ (x) .

L’operatore è ben definito sul dominio

D (H) =f ∈ L2 (R) : x2f (x) ∈ L2 (R) e ξ2f (ξ) ∈ L2 (R)

,

pur di intendere l’operatore differenziale definito via trasformata di Fourier,cioè:

2

2mψ′′ (x) =

2

2m

(4π2ξ2

)ψ (ξ)

(ovvero intendere la derivata ψ′′ in senso generalizzato). Si verifica subito chesu questo dominio l’operatore è autoaggiunto.

65

Page 66: Introduzione al formalismo matematico della meccanica ...

Esercizio 3.2 Verificare che l’Hamiltoniana dell’oscillatore armonico quantis-tico unidimensionale è autoaggiunto sul suo dominio naturale, indicato nell’e-sempio precedente.

Esercizio 3.3 (Particella confinata in un segmento) Si consideri l’opera-tore Hamiltoniano unidimensionale

Hψ = − 2

2mψ′′

definito sul dominio

D (H) =ψ ∈ C2 [0, L] : ψ (0) = ψ (L) = 0

.

Si dimostri che l’operatore H è simmetrico.Il significato fisico di quest’esempio è il seguente. Si consideri una parti-

cella in moto sulla retta che (per qualche causa fisica) è confinata a muoversiin [0, L]. Questo significa che la densità di probabilità |ψ (x)|2 (e quindi ψ)è identicamente nulla fuori dall’intervallo (0, L). Possiamo considerare alloradirettamente funzioni definite solo su [0, L] e nulle agli estremi.

Esempio 3.2 Una particella ha funzione d’onda (non normalizzata)

ψ (x, t) = e−x2

ei(kx−ωt)

per k, ω > 0. Dopo aver normalizzato la funzione d’onda, si calcolino il valoreatteso delle osservabili posizione e momento, e si scriva esplicitamente (sottoforma di integrale) la probabilità che la posizione e il momento (rispettivamente)assumano valori in un fissato intervallo (a, b) .Si ha:

|ψ (x, t)|2 = e−2x2∫Re−2x2dx =

√π

2

perciò la funzione d’onda normalizzata è

ψ (x, t) =4

√2

πe−x

2

ei(kx−ωt).

La densità di probabilità della v.a. posizione è

|ψ (x, t)|2 =

√2

πe−2x2

perciò il valore atteso è

〈X 〉ψ =

∫Rxe−2x2dx = 0

66

Page 67: Introduzione al formalismo matematico della meccanica ...

e la legge è:

P (X ∈ (a, b)) =

√2

π

∫ b

a

e−2x2dx.

Calcoliamo ora la trasformata di ψ.

ψ (ξ, t) =4

√2

πe−iωt

∫Re−x

2

e−2πix(ξ− k2π )dx =

4

√2

πe−iωtF

(e−x

2)(

ξ − k

)=

4

√2

πe−iωt

√πe−π

2(ξ− k2π )

2

Perciò ∣∣∣ψ (ξ, t)∣∣∣2 =

√2πe−2π2(ξ− k

2π )2

e per la variabile momento è

〈P〉ψ =

∫Rhξ√

2πe−2π2(ξ− k2π )

2

dξ =

[ξ − k

2π= u

]=

∫Rh

(u+

k

)√2πe−2π2u2dξ

= hk

∫R

√2πe−2π2u2dξ = h

k

2π= k

e

P (P ∈ (a, b)) =

∫ b

a

1

h

∣∣∣ψ ( ph, t)∣∣∣2 dp =

∫ b

a

1

h

√2πe−2π2( ph−

k2π )

2

dp.

3.2 Misura di un osservabile, autovalori e autofunzioni

3.2.1 Dallo stato del sistema al valore misurato

Sappiamo già (§3.1) che se lo stato del sistema è un’autofunzione di A, il valoremisurato di A sarà certamente l’autovalore corrispondente. In questo caso l’esitodella misura non è aleatorio.Supponiamo ora che λ1, ..., λN siano N autovalori distinti di A, e ψ1, ..., ψN

siano autofunzioni corrispondenti, che supponiamo già normalizzate. Sappiamoche le ψj saranno a due a due ortogonali, perché A è simmetrico. Supponiamoche il sistema si trovi in uno stato che è combinazione lineare di questi autostati,cioè in uno stato

ψ =

N∑j=1

cjψj

per certe costanti c1, ..., cN ∈ C. Poiché le ψj sono ortonormali, per il teoremadi Pitagora sarà

‖ψ‖2L2 =

N∑j=1

|cj |2 .

67

Page 68: Introduzione al formalismo matematico della meccanica ...

Se anche ψ è normalizzato, significa che

N∑j=1

|cj |2 = 1.

In questo caso si ha:

〈A〉ψ = 〈ψ,Aψ〉 =

⟨N∑j=1

cjψj , A

N∑k=1

ckψk

⟩=

N∑j=1

cj

N∑k=1

ck 〈ψj , Aψk〉 =

=

N∑j=1

cj

N∑k=1

ck 〈ψj , λkψk〉 =per ortonormalità

N∑j=1

cjλjcj =

N∑j=1

λj |cj |2 .

Dal confronto tra le identità

〈A〉ψ =

N∑j=1

λj |cj |2

N∑j=1

|cj |2 = 1

si vede che il valore atteso di A è il valore atteso di una v.a. discreta che puòassumere solo i valori λ1, ..., λN e li assume con probabilità, rispettivamente,|c1|2,..., |cN |2.Questo fatto non dimostra rigorosamente che A possa assumere effettiva-

mente solo questi valori: dal punto di vista logico, A potrebbe assumere anchealtri valori che nel calcolo del valore atteso in qualche modo si compensano traloro, non lasciando traccia nel risultato finale, ma è chiaro che quest’ultima èuna supposizione piuttosto innaturale. Siamo cioè indotti a ritenere che:se il sistema si trova in una combinazione lineare di autostati, l’osservabile

può assumere come valore solo uno degli autovalori corrispondenti, e se

ψ =

N∑j=1

cjψj

saràPψ (A = λj) = |cj |2 .

Generalizzando ancora, supponiamo ora che esista un s.o.n.c. di autovettoridi A. Allora qualsiasi stato ψ si può scrivere in serie di autostati

ψ =

∞∑j=1

cjψj

con∞∑j=1

|cj |2 = ‖ψ‖2L2 = 1.

68

Page 69: Introduzione al formalismo matematico della meccanica ...

Se fosse lecito anche in questo caso affermare che

Aψ = A

∞∑j=1

cjψj =

∞∑j=1

cjAψj ,

(cosa che, passando a una somma infinita, cioè a un limite di somme, ora nonè ovvio sia lecito, perché l’operatore A è lineare ma non continuo!), si avrebbeanche in questo caso

〈A〉ψ =

∞∑j=1

λj |cj |2

ossia il valore atteso di A sarebbe quello di una v.a. discreta che assume comepossibili valori solo gli autovalori λn, e assume questi valori con probabilità|cn|2. Mostriamo che la conclusione è legittima, anche se va giustificata conun ragionamento ad hoc, che sfrutta la simmetria dell’operatore anziché lacontinuità:

Proposizione 3.1 Se A : D (A)→ H è un operatore lineare simmetrico, ψjè un s.o.n.c. di H di autovettori di A con autovalori λj, allora per ogniψ ∈ D (A) , scrivendo

ψ =

∞∑j=1

cjψj

si ha

〈ψ,Aψ〉 =

∞∑j=1

λj |cj |2

(come se A fosse lineare e continuo).

Dimostrazione. Preso ψ ∈ D (A), sviluppiamolo in serie di autofunzioni:

ψ =

∞∑j=1

cjψj

e calcoliamo

〈ψ,Aψ〉 =

⟨ ∞∑j=1

cjψj , A

∞∑k=1

ckψk

⟩=

linearità e continuità di 〈·,·〉

∞∑j=1

cj

⟨ψj , A

∞∑k=1

ckψk

=simmetria di A

∞∑j=1

cj

⟨Aψj ,

∞∑k=1

ckψk

⟩=

ψj è autofunzione

∞∑j=1

cj

⟨λjψj ,

∞∑k=1

ckψk

=linearità e continuità di 〈·,·〉

∞∑j=1

cj

∞∑k=1

ck 〈λjψj , ψk〉 =λj è reale

∞∑j=1

cj

∞∑k=1

ckλj 〈ψj , ψk〉

=ortonormalità

∞∑j=1

cjcjλj =

∞∑j=1

λj |cj |2 .

69

Page 70: Introduzione al formalismo matematico della meccanica ...

Dalla dimostrazione si vede che la completezza del s.o.n. in realtà non è statautilizzata nel calcolo. Se ψj è un s.o.n. non completo, semplicemente non saràverò che ogni stato del sistema si può sviluppare in serie di autofunzioni; ma,se uno stato è sviluppabile in serie di autofunzioni, il calcolo fatto è ancoracorretto.

Il quadro che ne consegue quindi è il seguente:Se un osservabile A è rappresentato dall’operatore lineare autoaggiunto A ed

esiste un s.o.n.c. ψj di H di autovettori di A con autovalori λj, alloraA può assumere solo i valori λj; le probabilità con cui assume questi valoridipendono dallo stato del sistema: se lo stato è

ψ =

∞∑j=1

cjψj

(e ogni stato si può sviluppare in modo unico in questa forma, con∑∞j=1 |cj |

2=

1), alloraPψ (A =λj) = |cj |2 . (3.4)

Vedremo in seguito che, grazie alle proprietà generali degli operatori autoag-giunti, il quadro precedente si può rafforzare: se lo spettro di A coincide conuna successione di autovalori, allora tutte le conclusioni precedenti valgono, inparticolare esiste un s.o.n.c. di autofunzioni.Vediamo un paio di esempi, il primo più elementare, il secondo più significa-

tivo, in cui si verifica la situazione appena descritta, ossia esiste un s.o.n.c. diautofunzioni dell’hamiltoniana.

Esempio 3.3 (Particella confinata in un segmento, continuazione) Conriferimento alla particella in moto unidimensionale e confinata in un segmento[0, L], già incontrata nell’Esercizio 3.3, determiniamo autovalori e autofunzionidell’operatore

Hψ = − 2

2mψ′′

definito sul dominio

D (H) =ψ ∈ C2 [0, L] : ψ (0) = ψ (L) = 0

.

Consideriamo il problema agli autovalori− 2

2mψ′′ (x) = Eψ (x)

ψ (0) = ψ (L) = 0.

Si verifica facilmente che il problema ha soluzioni ψ non identicamente nullesolo per E ≥ 0. In questo caso l’equazione differenziale ha integrale generale

ψ (x) = c1 cos

(√2mE

x

)+ c2 sin

(√2mE

x

).

70

Page 71: Introduzione al formalismo matematico della meccanica ...

Imponendo ψ (0) = 0 si trova c1 = 0, quindi

ψ (x) = c2 sin

(√2mE

x

).

Imponendo ψ (L) = 0 si trova

c2 sin

(√2mE

L

)= 0

che, volendo soluzioni non identicamente nulle, perciò c2 6= 0, porta a sin(√

2mE L

)=

0, quindi √2mE

L = kπ per k = 1, 2, 3...

e quindi autovalori (cioè possibili valori energetici della particella confinata nelsegmento)

Ek =1

2m

(kπL

)2

per k = 1, 2, 3...

e autofunzioni

ψk (x) = c2 sin

(kπx

L

)dove c2 va scelto in modo che sia∫ L

0

|ψ (x)|2 dx = 1

quindi

ψk (x) =

√2

Lsin

(kπx

L

)per k = 1, 2, 3...

Si osserva che le autofunzioni costituiscono un s.o.n.c. di L2 (0, T ).

Esempio 3.4 (L’oscillatore armonico quantistico) Per l’oscillatore armon-ico quantistico unidimensionale, l’operatore Hamiltoniano, su L2 (R), è:

Hψ = − 2

2mψ′′ (x) +

1

2mω2x2ψ (x) .

Sappiamo già che questo operatore è illimitato e autoaggiunto sul dominio

D (H) =f ∈ L2 (R) : x2f (x) ∈ L2 (R) e ξ2f (ξ) ∈ L2 (R)

.

Si dimostra35 che H possiede la successione di autovalori

En =

(n+

1

2

)ω, per n = 0, 1, 2, ...

35v. ad es. [3, §5.2]

71

Page 72: Introduzione al formalismo matematico della meccanica ...

con corrispondenti autofunzioni

ψn (x) = e−mωx2

2h Hn

(√mω

hx

)dove Hn sono i polinomi di Hermite. Le autofunzioni ψn sono quindi, a menodi costanti, le funzioni di Hermite, e costituiscono un sistema ortonormalecompleto di L2 (R) (come già accennato nell’Esempio 1.18).

3.2.2 Dalla misura di un osservabile allo stato del sistema

Abbiamo visto cosa ci si può aspettare sulla misura di un osservabile quandosappiamo che il sistema si trova in un autostato, o in una combinazione linearedi autostati, o si può sviluppare in serie di autostati.Tutti questi discorsi riguardano la legge di probabilità (3.4), che descrive le

nostre previsioni prima di effettuare la misura. Cosa succede quando una misuraviene effettuata?

Assioma 3. Se misurando un osservabileA si ottiene la misura λ, autovaloredell’operatore A corrispondente ad A, allora dopo la misura lo stato si troverà inun autostato ψ corrispondente a λ. Più precisamente, la funzione d’onda imme-diatamente dopo la misura sarà (a parte la normalizzazione in L2) la proiezionedella funzione d’onda immediatamente prima della misura sull’autospazio di λ.

Nel caso particolare in cui l’osservabile A è rappresentato dall’operatore lin-eare autoaggiunto A ed esiste un s.o.n.c. ψj di autovettori di A con autovaloriλj, lo stato del sistema passa dallo stato

ψ =

∞∑j=1

cjψj

allo stato36 ψj0 , se è stato osservato il valore λj0 . Questo fenomeno che avvienein seguito alla misurazione viene detto collasso della funzione d’onda. Se mis-urassimo di nuovo, subito dopo, lo stesso osservabile, per quanto già osservatosui sistemi che si trovano in un autostato puro, la misura darebbe ancora λj0 elo stato rimarrebbe ψj0 : questo è un caso in cui l’effetto della misurazione nonè aleatoria. Sul piano interpretativo, cito a questo proposito una frase riportatain [12, p.68]:

Quest’idea di collasso della funzione d’onda ha generato un’enormequantità di discussioni e controversie. Un modo di vedere la situ-azione è pensare che la funzione d’onda ψ non sia effettivamentelo stato del sistema (anche se continuiamo a usare questo termine,“stato”), ma un oggetto che codifica le probabilità dello stato del sis-tema. Il collasso della funzione d’onda è quindi qualcosa di simile al

36Questo nell’ipotesi semplificatrice che l’autospazio abbia dimensione 1. Altrimenti laformulazione corretta è quella espressa dall’assioma in termini di proiezione.

72

Page 73: Introduzione al formalismo matematico della meccanica ...

concetto di probabilità condizionata: le probabilità di misure futuredel sistema devono essere consistenti con l’esito della misurazioneappena fatta. Paul Dirac ha descritto il collasso della funzione d’on-da come non un cambiamento discontinuo dello stato del sistema,ma un cambiamento discontinuo nella nostra conoscenza dello statodel sistema.

Vedremo più avanti che, come conseguenza matematica delle proprietà deglioperatori autoaggiunti, dagli assiomi introdotti fin qui segue che l’insieme degliesiti possibili di una misura coincide con lo spettro dell’operatore. L’assioma3 dice cosa accade quando l’esito di una misura è un autovalore. Quando adessere osservato è un valore dello spettro che non è un autovalore (come accadenel caso di posizione e momento, che non hanno autovalori), non si può parlarea rigore di collasso della funzione d’onda. In questa situazione l’assioma nondice che cosa accade. Ritorneremo più avanti su questo problema. Cominciamoa vedere un paio di esempi significativi in cui lo spettro contiene sia un insiemediscreto di autovalori sia un insieme continuo di elementi dello spettro che nonsono autovalori.

Esempio 3.5 (L’atomo di idrogeno) L’hamiltoniana dell’elettrone di un ato-mo di idrogeno è, in L2

(R3):

Hψ (x) = − 2

2me∆ψ (x)− e2

4πε0 |x|ψ (x) ,

dove e,me sono la carica e la massa dell’elettrone, e ε0 la costante di permittivitànel vuoto. Lo studio dell’equazione agli autovalori37

Hψ = λψ

porta ai seguenti risultati. Esiste una successione di autovalori, negativi, datida:

En = − 1

2n2me

(e2

4πε0

)2

, n = 1, 2, 3...,

che corrispondono fisicamente ai livelli energetici dell’elettrone negli stati in cuiè legato al protone. Il livello più basso, n = 1, è quello stabile, livelli superioricorrispondono agli stati eccitati. A questi autovalori corrisponde una successionedi autofunzioni

ψn,l,mn=1,2,...;l=0,1,...,n−1;m=0,1,...,n ,

che non scriviamo esplicitamente qui, che in coordinate sferiche si scrivonocome prodotto di funzioni di Laguerre, per la parte radiale, e armoniche sferiche,per la parte angolare. Queste autofunzioni costituiscono un sistema ortonor-male non completo di L2

(R3). Prima di motivare il perché di questo fatto,

completiamo il quadro sullo spettro di H.

37v. ad es. [3, §5.3]

73

Page 74: Introduzione al formalismo matematico della meccanica ...

Oltre agli autovalori En (negativi, successione crescente tendente a 0)38 ,lo spettro di H contiene la semiretta reale [0,+∞). Questi elementi non sonoautovalori, ma corrispondono ai possibili livelli energetici dell’elettrone quandoquesto sfugge dall’atomo (stati liberi). Notiamo quindi che complessivamentelo spettro è costituito da: una successione monotona crescente di autovalorinegativi, tendente a zero, unita alla semiretta [0,+∞). Lo spettro è quindi unsottoinsieme chiuso e illimitato dell’asse reale, come previsto dalla teoria per unoperatore non limitato e autoaggiunto.Per convincerci che le autofunzioni ψn,l,m non costituiscono un s.o.n.c. di

L2(R3), ragioniamo al modo seguente. Sappiamo che

Eψn,l,m (H) = 〈ψn,l,m, Hψn,l,m〉 = 〈ψn,l,m, Enψn,l,m〉 = En < 0.

Mostriamo che per qualsiasi stato ψ che si può sviluppare in serie di autofun-zioni si ha Eψ (H) < 0. Infatti (scrivendo ora per semplicità di notazioni ψn,indicando cioè le autofunzion con un indice solo) se

ψ =

∞∑n=1

cnψn con∞∑n=1

|cn|2 = 1,

in base alla Proposizione 3.1 (e osservazione successiva) si ha

〈ψ,Hψ〉 =

∞∑n=1

|cn|2En < 0.

Questo fatto si può interpretare dicendo che uno stato ψ di questo tipo cor-risponde a uno stato legato dell’elettrone, quindi a energia negativa. Esistonoperò stati aventi qualsiasi energia positiva, e non è diffi cile costruire funzioniψ per cui risulti 〈ψ,Hψ〉 > 0. Queste funzioni non possono scriversi in seriedi autofunzioni, quindi il s.o.n. delle autofunzioni non è completo. In effetti,si può dimostrare che le autofunzioni di H sono un s.o.n.c. del sottospazio diL2(R3)corrispondente agli stati a energia negativa (cioè gli stati legati).

Esempio 3.6 (Particella in una buca rettangolare di potenziale) Questoè un esempio unidimensionale, in cui lo spettro dell’hamiltoniana può essere cal-colato analiticamente con metodi “elementari”(il che non significa che i calcolisiano brevi: si veda [12, Chap. 5]). Supponiamo che una particella quantisticadi massa m si muova su una retta, soggetta a una forza il cui potenziale ha laforma

V (x) =

−C per |x| ≤ A0 per |x| > A

con A,C > 0. La regione |x| ≤ A è solitamente chiamata “la buca rettangolare”del potenziale. L’hamiltoniana è quindi

H = − 2

2m

∂2

∂x2+ V (x) .

38per il seguito di questa discussione si rimanda a [12, Chap.18]

74

Page 75: Introduzione al formalismo matematico della meccanica ...

Nella situazione classica corrispondente, se la particella ha energia < C dovràrestare confinata nella regione |x| ≤ A, se ha energia superiore si muoverà sututta la retta.Ci limitiamo a enunciare, senza dimostrazione, i risultati che si dimostrano

per lo spettro di H su L2 (R).1. Il problema agli autovalori Hψ = λψ ha unicamente soluzioni λ < 0.

Precisamente, esiste sempre un numero finito (ma almeno uno) di autovaloriλ ∈ (−C, 0), con autofunzioni L2 (R). Essendo le autofunzioni indipendenti soloun numero finito, certamente non saranno un s.o.n.c. di L2 (R).2. Oltre agli autovalori, lo spettro comprende l’intera semiretta reale [0,+∞).

Quindi lo spettro, nel suo complesso, è un sottoinsieme chiuso e illimitato dellaretta reale, come previsto dalla teoria per gli operatori illimitati autoaggiunti.Fisicamente, significa che la particella ha un numero finito di possibili livel-li energetici negativi, ossia “stati legati” (che sono l’analogo quantistico dellasituazione in cui la particella è vincolata nel segmento |x| ≤ A), e invece puòavere qualsiasi livello di energia positiva.3. Quando si trova nello stato di più bassa energia negativa, l’autofunzione

ha un andamento del tipo:

con decrescita più lenta o più rapida a seconda che la buca di potenziale sia menoprofonda o più profonda. In ogni caso, questo significa che la particella quan-tistica ha una probabilità non nulla di trovarsi fuori dalla zona classicamenteconsentita in caso di energia negativa. Gli (eventuali) stati a energia negativadi livello superiore al primo (“stati eccitati”) mostrano un autostato del tipo:

75

Page 76: Introduzione al formalismo matematico della meccanica ...

3.2.3 Quando il valore misurato non è un autovalore

Come già detto, quando l’osservabile che si misura ha uno spettro che non con-siste unicamente di autovalori (o non contiene alcun autovalore), può accadereche il valore misurato non sia un autovalore ma un altro elemento λ dello spet-tro. In questo caso, dopo la misurazione, lo stato del sistema non può essereun autostato di λ (visto che non esistono autostati di λ), perciò in che stato sitroverà il sistema? Ci si aspetta che, immediatamente dopo una misura, il valoreappena misurato sia ancora un valore “molto probabile”. Come può avvenirequesto?

Esempio 3.7 (Posizione) Per l’operatore X di posizione (unidimensionale,per semplicità) sappiamo che σ (X) = R e non ci sono autovalori. L’equazioneagli autovalori

xψ (x) = λψ (x) ,

nell’ambito della teoria delle distribuzioni ha soluzione ψ (x) = δλ (x) (dis-tribuzione delta di Dirac). Questa non è un elemento di L2 (R), quindi nonè un’autofunzione. Possiamo però considerare una famiglia di funzioni L2 (R)di norma unitaria che tende alla δλ nel senso delle distribuzioni. Ad esempiola famiglia di gaussiane:

ψε (x) =

√1√2πε

e−(x−λ)22ε2 =

1√√2πε

e−(x−λ)2

4ε2 .

Per questi stati si può calcolare:

Eψε (X ) = 〈ψε, Xψε〉 =

∫Rx |ψε (x)|2 dx =

∫Rx

1√2πε

e−(x−λ)2

2ε2 dx = λ

Varψε (X ) = ‖(X − Eψε (X))ψε‖2L2(R) = ‖(x− λ)ψε‖2L2(R) = ε2.

Gli stati ψε sono degli stati ammissibili del sistema, per i quali si ha che il valoreatteso della posizione è λ (quello che si immagina sia appena stato osservato)e la varianza ε2, piccola quanto si vuole. Se lo stato del sistema è ψε con εmolto piccolo, una misura della posizione fatta immediatamente dopo la primamisura non sarebbe certa ma avrebbe una piccola incertezza. Supporre che lostato del sistema subito dopo aver misurato posizione λ sia del tipo di questa

76

Page 77: Introduzione al formalismo matematico della meccanica ...

ψε è un’alternativa accettabile rispetto ad affermare che lo stato del sistema è l’“autofunzione generalizzata” δλ (x), come scrivono certi testi39 .

Esempio 3.8 (Momento) Per l’operatore P di momento (unidimensionale),sappiamo che σ (X) = R e non ci sono autovalori. L’equazione agli autovalori

Pψ = λψ

Pψ = λψ

−2πξψ (ξ) = λψ (ξ)

nell’ambito della teoria delle distribuzioni ha soluzione

ψ (ξ) = δ− λ2π

(ξ) ,

che non corrisponde ad alcuna funzione ψ ∈ L2 (R). Possiamo anche in questocaso approssimare (questa volta in frequenza) la delta con delle Gaussiane dimedia − λ

2π e varianza ε2, e poi antitrasformare. Cioè definiamo:

ψε (ξ) =1√√2πε

e−(ξ+ λ

2π )2

4ε2

e poi antitrasformiamo. Il calcolo dà:

ψε (x) =

√√8πεe−iλxe−4π2ε2x2

39 Il concetto di autofunzione generalizzata, o impropria, può essere reso rigoroso utilizzan-do la teoria delle distribuzioni. Si veda ad esempio la discussione in [4, Cap.VI, § VI.2 eAppendice]. Una volta che è stato reso rigoroso, questo concetto può essere utilizzato nelladiscussione del teorema di risoluzione spettrale, a cui accenneremo nel §3.5. Rimane il fattoche un’autofunzione generalizzata, comunque la si definisca, non è una funzione d’onda am-missibile, cioè in L2 (R), quindi non è la risposta alla domanda “in che stato si trova il sistemadopo una misura”.

77

Page 78: Introduzione al formalismo matematico della meccanica ...

Per questi stati si può calcolare

Eψε (P) = 〈ψε, Pψε〉 =⟨ψε, Pψε

⟩=

∫R−2πξ

∣∣∣ψε (ξ)∣∣∣2 dξ

=

∫R−2πξ

1√2πε

e−(ξ+ λ

2π )2

4ε2 dξ = −2π ·(− λ

)= λ

Varψε (P) = ‖(P − Eψε (P ))ψε‖2L2(R) = ‖Pψε − λψε‖2L2(R)

=∥∥∥Pψε − λψε∥∥∥2

L2(R)=

∫R

(2πξ + λ)2 1√

2πεe−

(ξ+ λ2π )

2

4ε2 dξ = 4π2ε2.

Quindi si ha una probabilità molto concentrata sul valore λ. Questa ψε è unapossibile alternativa accettabile rispetto a parlare dell’“autofunzione generaliz-zata” e−iλx.

Nei due esempi precedenti la semplicità della situazione analitica consentivadi proporre una forma esplicita di funzione di stato che corrisponde a valorimolto concentrati della probabilità. Si può mostrare che qualcosa del genere valepiù in generale, pur di usare il seguente risultato astratto, che non dimostriamo(si veda [12, Proposition 9.18]):

Teorema 3.3 Sia A : D (A)→ H un operatore autoaggiunto. Allora λ ∈ σ (A)se e solo se per ogni ε > 0 esiste ψ ∈ D (A) , ‖ψ‖H = 1, tale che

‖Aψ − λψ‖H < ε.

Sia quindi A l’operatore che corrisponde a un osservabile A, e supponiamodi aver osservato il valore λ ∈ σ (A) (che non è un autovalore). Per ε > 0 fissato,sia ψε come nel teorema precedente, e poniamo

φ = Aψ − λψ.

La funzione φ è un elemento di H che non rappresenta uno stato normalizzato,esprime piuttosto l’errore che commettiamo nell’approssimare Aψ con λψ: si ha‖φ‖H < ε. Possiamo allora calcolare:

Eψε (A) = 〈ψε, Aψε〉 = 〈ψε, λψε + φ〉 = λ 〈ψε, ψε〉+ 〈ψε, φ〉= λ ‖ψε‖2H + 〈ψε, φ〉 = λ+ 〈ψε, φ〉 ,

dove|〈ψε, φ〉| ≤ ‖ψε‖ ‖φ‖ = ‖φ‖ < ε.

Quindi il valore atteso di A si discosta di poco quanto vogliamo da λ. Per lavarianza si ha:

Varψε (A) = ‖(A− Eψε (A))ψε‖2H = ‖Aψε − λψε − 〈ψε, φ〉ψε‖2H≤ (‖Aψε − λψε‖H + ‖〈ψε, φ〉ψε‖H)

2

≤ (ε+ |〈ψε, φ〉|)2 ≤ (2ε)2

= 4ε2.

78

Page 79: Introduzione al formalismo matematico della meccanica ...

Quindi anche in generale esistono stati ammissibili del sistema, centrati (conbuona approssimazione) sul valore misurato e che danno un’incertezza dellamisura piccola quanto si vuole. E’ sensato immaginare che immediatamentedopo una misura il sistema si trovi in uno stato con proprietà di questo tipo.

3.3 Equazione di Schrödinger. Evoluzione del sistema quan-tistico

Nella descrizione degli osservabili, fin qui abbiamo trattato il tempo come unparametro, concettualmente fissato. La descrizione va naturalmente completataspecificando il modo in cui lo stato del sistema si evolve nel tempo. A questoriguardo, il principio fondamentale della meccanica quantistica è il seguente:

Assioma 4. L’evoluzione temporale della funzione d’onda ψ (x, t) è rettadall’equazione di Schrödinger:

i∂ψ

∂t= Hψ,

dove H è l’operatore Hamiltoniano, che rappresenta l’osservabile H energia (to-tale, del sistema), e sarà specificato caso per caso in base alle forze agenti sullaparticella (e alla dimensione dello spazio in cui si muove).

Una possibile argomentazione per mostrare la plausibilità di quest’ipotesi èla seguente. Supponiamo che la particella si trovi all’istante t = 0 in uno statoψ0 (x) di energia E ben definita, il che può accadere se E è un autovalore del-l’operatore Hamiltoniano, cioè Hψ0 = Eψ0. D’altro canto, in base alle relazionidi De Broglie, per una particella quantistica vale la relazione

E = hω

tra l’energia e la frequenza40 (temporale). Allora la funzione d’onda dovràevolversi nel tempo con una frequenza temporale pura ω = E/h, cioè avrà laforma41

ψ (x, t) = exp

(−2πitE

h

)ψ0 (x) = exp

(−iEt

)ψ0 (x) .

Volendo tradurre questo fatto in un’equazione differenziale soddisfatta da ψ (x, t),calcoliamo

∂ψ

∂t(x, t) = −iE

e−i

E tψ0 (x)

40ω è proprio la frequenza, non la pulsazione. Qualche testo chiama frequenza la pulsazionee allora scrive la relazione di De Broglie nella forma E = ω. Le due formule sono identiche,una volta spiegato di chi si sta parlando.41 Il fatto di scegliere come fattore avente frequenza temporale pura ω la funzione e−i

E t

e non eiE t ha una certa arbitrarietà. L’altra scelta del segno nell’esponente porterebbe un

segno diverso anche nell’equazione di Schrödinger. Si può giustificare una certa naturalezzadella scelta di questo segno ragionando sulle funzioni d’onda del tipo ψ (x, t) = ei(kx−ωt),che rappresentano onde piane che viaggiano verso destra con velocità ω/k e risulteranno,formalmente, soluzioni dell’equazione di Schrödinger per la particella libera.

79

Page 80: Introduzione al formalismo matematico della meccanica ...

e ricordando che Hψ0 = Eψ0

= − ie−i

E tHψ0 (x)

poiché H è un operatore differenziale lineare che agisce solo sulle variabilispaziali,

= − iHψ (x, t)

da cui

i∂ψ

∂t(x, t) = Hψ (x, t) .

Quest’equazione differenziale, che è effettivamente soddisfatta se il sistema evolvea partire da uno stato iniziale che è un autostato dell’operatore hamiltoniano,viene assunta come equazione che governa l’evoluzione del sistema anche nelcaso generale.La forma specifica dell’operatore H dipende dal sistema considerato. L’op-

eratore H sarà comunque supposto autoaggiunto sul proprio dominio D (H).Questo fatto (o anche solo la simmetria di H), anche a prescindere dalla formaspecifica di H, ha già alcune conseguenze, sul piano puramente matematico, cheora vediamo.

3.3.1 Conservazione della normalizzazione

Proposizione 3.2 Nelle ipotesi precedenti se lo stato ψ del sistema si evolvenel tempo obbedendo all’equazione di Schrödinger, la quantità

‖ψ (·, t)‖L2

è costante nel tempo.

In particolare, se ψ (·, t) è normalizzata all’istante iniziale, rimane normal-izzata a tutti i tempi successivi. Ciò mostra che l’equazione di Schrödinger ècoerente con l’interpretazione probabilistica della funzione d’onda.

Dimostrazione. Calcoliamo

d

dt‖ψ (·, t)‖2L2

e mostriamo che è zero.

d

dt‖ψ (·, t)‖2L2 =

d

dt〈ψ (·, t) , ψ (·, t)〉 =

⟨∂ψ

∂t(·, t) , ψ (·, t)

⟩+

⟨ψ (·, t) , ∂ψ

∂t(·, t)

⟩in base all’equazione di Schrödinger

=

⟨− iHψ (·, t) , ψ (·, t)

⟩+

⟨ψ (·, t) ,− i

Hψ (·, t)

80

Page 81: Introduzione al formalismo matematico della meccanica ...

per le proprietà del prodotto scalare

=i

〈Hψ (·, t) , ψ (·, t)〉 − i

〈ψ (·, t) , Hψ (·, t)〉

per la simmetria di H

=i

〈Hψ (·, t) , ψ (·, t)〉 − i

〈Hψ (·, t) , ψ (·, t)〉 = 0.

Osservazione 3.1 Si osservi che, sotto le stesse ipotesi sull’operatore H, se ψobbedisse all’equazione differenziale

∂ψ

∂t(x, t) = Hψ (x, t)

(cioè senza la i a primo membro) la quantità ‖ψ (·, t)‖L2 non si conserverebbe.Invece, se ψ obbedisse all’equazione differenziale

−i∂ψ∂t

(x, t) = Hψ (x, t)

(cioè con un segno diverso da quello dell’equazione di Schrödinger) la quantità‖ψ (·, t)‖L2 si conserverebbe ancora. Il lettore è invitato a rifare il calcolo econstatare entrambe le conclusioni.

3.3.2 Soluzione per separazione delle variabili e stati stazionari

Supponiamo di voler risolvere l’equazione di Schrödinger per separazione dellevariabili, cosa suggerita dal fatto che l’operatore hamiltoniano agisce solo sullavariabile x: cerchiamo

ψ (x, t) = φ (x)T (t)

che soddisfi l’equazione. Si trova

iφ (x)T ′ (t) = T (t)Hφ (x)

iT ′ (t)

T (t)=Hφ (x)

φ (x)

che può essere soddisfatta per ogni x, t solo se ogni membro è costante:

Hφ (x) = λφ (x)

T ′ (t) = − iλT (t)

che porta al problema agli autovalori : determinare φ ∈ D (H), φ non identica-mente nulla e λ reale (poiché H è simmetrico) tali che

Hφ (x) = λφ (x) .

81

Page 82: Introduzione al formalismo matematico della meccanica ...

Questi autovalori avranno il significato di possibili valori assunti dall’energia,perciò sono detti livelli energetici. Se sono una successione λn∞n=1 si avrà, incorrispondenza

Hφn (x) = λnφn (x)

Tn (t) = cne− iλnt

eψn (x, t) = e−

iλntφn (x) .

Supponiamo di aver scelto i φn normalizzati. Allora se lo stato iniziale delsistema è esattamente un autostato puro, cioè

i∂ψ∂t = Hψψ (x, 0) = φn (x)

la soluzione sarà proprio

ψn (x, t) = e−iλntφn (x) .

D’altro canto la quantità e−iλnt è indipendente da x e ha modulo 1, perciò

(Assioma 1) la funzione ψn (x, t) rappresenta lo stesso stato fisico di φn (x). Perquesto motivo gli autostati dell’Hamiltoniana si chiamano anche stati stazionari.Notiamo che questo non significa che ogni combinazione lineare delle funzioni

ψn (x, t) sia uno stato stazionario. Ad esempio

ψ (x, t) =1√2

e−

iλ1tφ1 (x) + e−

iλ2tφ2 (x)

non lo sarebbe, se λ1 6= λ2, perché questa ψ non è semplicemente il prodotto diφ1 (x) + φ2 (x) /

√2 per un numero complesso di modulo 1.

Nell’ipotesi che esista un s.o.n.c. di autofunzioni di H, per uno stato inizialequalsiasi, che si può sempre scrivere nella forma

ψ0 (x) =

∞∑n=1

cnφn (x) ,

la soluzione dell’equazione di Schrödinger con questa condizione iniziale sarebbe

ψ (x, t) =

∞∑n=1

cne− iλntφn (x) .

3.3.3 Relazioni soddisfatte dai valori attesi di posizione e momento

Anche se il valore della posizione e del momento di una particella sono variabilialeatorie, sotto certe ipotesi i loro valori attesi obbediscono a leggi determi-nistiche, in accordo con la fisica classica. Ragioniamo per semplicità sul casounidimensionale.

82

Page 83: Introduzione al formalismo matematico della meccanica ...

Proposizione 3.3 Per una particella in moto sulla retta, con hamiltoniana

H = − 2

2m

∂2

∂x2+ V (x)

e che si trova nello stato ψ, si ha:

d

dt〈X 〉ψ =

1

m〈P〉ψ

(che corrisponde alla relazione classica p = mv).Se inoltre V (x) ≡ 0 (ossia sulla particella non agiscono forze)

d

dt〈P〉ψ = 0

(che corrisponde al principio classico di conservazione della quantità di moto).

Dimostrazione. Utilizzando l’equazione di Schrödinger

∂ψ

∂t= − i

calcoliamo

d

dt〈X 〉ψ =

d

dt〈ψ, xψ〉 =

⟨∂ψ

∂t, xψ

⟩+

⟨ψ, x

∂ψ

∂t

⟩=

⟨− iHψ, xψ

⟩+

⟨ψ,− i

xHψ

⟩=i

〈Hψ, xψ〉 − 〈ψ, xHψ〉 =

simmetria di H

i

〈ψ,H (xψ)〉 − 〈ψ, xHψ〉

=i

〈ψ,H (xψ)− xHψ〉 .

Calcoliamo ora

H (xψ)− xHψ = − 2

2m

∂2

∂x2(xψ) + V (x)xψ − x

[−

2

2m

∂2

∂x2ψ + V (x)ψ

]= −

2

2m

[∂2

∂x2(xψ)− x∂

∂x2

]= −

2

2m2∂ψ

∂x= −

2

m

∂ψ

∂x

perciò

d

dt〈X 〉ψ =

i

⟨ψ,−

2

m

∂ψ

∂x

⟩=

1

m

⟨ψ,−i∂ψ

∂x

⟩=

1

m〈ψ, Pψ〉 =

1

m〈P〉ψ .

83

Page 84: Introduzione al formalismo matematico della meccanica ...

Per provare la seconda relazione, scriviamo

d

dt〈P〉ψ =

d

dt〈ψ, Pψ〉 =

d

dt

⟨ψ,−i∂ψ

∂x

⟩= −i

⟨∂ψ

∂t,∂ψ

∂x

⟩+

⟨ψ,

∂t

∂ψ

∂x

⟩= −i

⟨− iHψ,

∂ψ

∂x

⟩+

⟨ψ,

∂x

(− iHψ

)⟩= −i

i

⟨Hψ,

∂ψ

∂x

⟩− i

⟨ψ,

∂x(Hψ)

⟩=

simmetria di H

⟨ψ,H

∂ψ

∂x

⟩−⟨ψ,

∂x(Hψ)

⟩=

⟨ψ,H

∂ψ

∂x− ∂

∂x(Hψ)

⟩= 0

perché, nell’ipotesi V (x) ≡ 0,

H∂ψ

∂x− ∂

∂x(Hψ) = −

2

2m

(∂2

∂x2

∂ψ

∂x− ∂

∂x

∂2ψ

∂x2

)= 0.

Osservazione 3.2 (Il segno del termine i ∂∂t) L’argomentazione che abbiamoutilizzato per giustificare l’equazione di Schrödinger rende ragione di quell’e-quazione solo a meno di un segno. Se avessimo scelto come onda di frequenzatemporale ω = E/h una funzione eiEt/h anziché e−iEt/h avremmo ottenutol’equazione

−i∂ψ∂t

= Hψ anziché i∂ψ

∂t= Hψ.

Notiamo che se l’equazione di Schrödinger fosse quella col segno −, le osser-vazioni fatte sulla conservazione della normalizzazione in L2, sul significato degliautostati come stati stazionari, e anche sulla conservazione della quantità dimoto, continuerebbero a valere. Invece, se proviamo a ripetere la dimostrazionedella relazione d

dt 〈X 〉ψ = 1m 〈P〉ψ usando l’equazione di Schrödinger col seg-

no −, otteniamo la relazione, fisicamente errata ddt 〈X 〉ψ = − 1

m 〈P〉ψ. Questomostra che il segno nell’equazione di Schrödinger è quello giusto, non è pura-mente convenzionale. C’è una coerenza tra l’argomentazione che abbiamo usatoper dedurre l’espressione dell’operatore momento dalla relazione di De Brogliep = hν mediante il ragionamento sull’onda e2πiνx e l’argomentazione che abbi-amo usato per dedurre l’equazione di Schrödinger dalla relazione di De BroglieE = hω mediante il ragionamento sull’onda e−2πiωt.

3.3.4 Equazione unidimensionale della particella libera

Consideriamo l’equazione di Schrödinger per la particella libera (cioè senza forzaagenti, perciò V (x) = 0), in moto sulla retta. Il problema di Cauchy

i∂ψ∂t (x, t) = − 22m

∂2ψ∂x2 (x, t)

ψ (x, 0) = ψ0 (x)

84

Page 85: Introduzione al formalismo matematico della meccanica ...

può essere facilmente risolta con la trasformata di Fourier rispetto a x:

i∂ψ

∂t(ξ, t) = −

2m

(−4π2ξ2

)ψ (ξ, t)

∂ψ

∂t(ξ, t) = −iπhξ

2

mψ (ξ, t)

ψ (ξ, t) = ψ0 (ξ) e−iπhξ2

m t (3.5)

e quindi antitrasformando

ψ (x, t) =

∫Rψ0 (ξ) e−i

πhξ2

m te2πiξxdξ. (3.6)

Questa formula rappresenta la soluzione con condizione iniziale ψ0. Al variaredi ψ0 (ξ) in tutti i modi possibili tra le funzioni L2 di norma unitaria, la formulaassegna l’integrale generale dell’equazione per la particella libera. Se ad esempioψ0 (e quindi ψ0) rappresenta una funzione a decrescenza rapida (o comunque unafunzione a decrescita esponenziale, anche eventualmente non regolare) si possonoanche calcolare le derivate di ψ (x, t) derivando sotto il segno di integrale.

3.4 Principio di indeterminazione

Per un sistema quantistico nello stato ψ e per un osservabile A, abbiamo definitol’indeterminazione (o incertezza di misura) ∆ψA di A come la sua deviazionestandard, quindi se A è l’operatore che rappresenta A

∆ψA =⟨A2⟩ψ− 〈A〉2ψ =

⟨ψ,A2ψ

⟩− 〈ψ,Aψ〉2 .

Consideriamo gli operatori posizione e momento di una particella, per sempli-cità nel caso unidimensionale:

Xψ = xψ

Pψ = −i∂xψ

e consideriamo il commutatore dei due operatori:

[X,P ]ψ = XPψ − PXψ = −ix∂xψ + i∂x (xψ)

= −ix∂xψ + iψ + ix∂xψ= iψ

perciò[X,P ] = iI

con I =operatore identità. I due operatori non commutano tra loro, e il lorocommutatore quantifica in qualche modo questa proprietà.Una delle proprietà fondamentali delle particelle quantistiche è espressa,

come ben noto, dal principio di indeterminazione di Heisenberg: è impossibile

85

Page 86: Introduzione al formalismo matematico della meccanica ...

misurare con precisione arbitraria contemporaneamente posizione e quantità dimoto di una particella. Un’idea fisica strettamente legata a questo principioè che ogni nostra misurazione in qualche modo perturba il sistema. Perciòquando misuriamo successivamente due diverse grandezze fisiche, i risultati ot-tenuti dipendono anche dall’ordine in cui abbiamo eseguito le due misure. Nellaformalizzazione matematica della meccanica quantistica, questo si traduce nelfatto che certe coppie di operatori (che rappresentano certi due osservabili chevogliamo misurare) non commutano tra loro, ossia per certi operatori A,B si haAB 6= BA (analogamente a quanto accade nel prodotto di matrici).

Adottando questo punto di vista si capisce allora che il principio di inde-terminazione di Heisenberg si può vedere come caso particolare di un risultatoastratto sugli operatori simmetrici, che a sua volta rende ragione di diverse altresituazioni fisiche in cui si ha indeterminazione nella misurazione simultanea dicerte coppie di osservabili. Il principio è il seguente:

Teorema 3.4 Siano A,B due operatori lineari simmetrici e sia ψ un vettoreunitario appartenente a Dom (AB) ∩Dom (BA) . Allora

(∆ψA) (∆ψB) ≥ 1

2

∣∣∣〈[A,B]〉ψ∣∣∣

dove 〈[A,B]〉ψ indica il valore atteso dell’osservabile corrispondente all’opera-tore [A,B], cioè 〈[A,B]〉ψ = 〈ψ, [A,B]ψ〉 .

Nell’esempio più noto, A = X,B = P e si ha

〈[A,B]〉ψ = 〈iI〉ψ = 〈ψ, iIψ〉 = i

quindi

(∆ψX) (∆ψP ) ≥ 2,

che è la formulazione classica del principio di indeterminazione di Heisenberg:il prodotto dell’incertezza di misura della posizione e l’incertezza di misura delmomento di una particella non può essere inferiore a /2. La cosa notevole èche questo fatto fondamentale è una conseguenza matematica del fatto che Xe P sono due operatori lineari simmetrici che non commutano tra loro, ed è uncaso particolare di altre possibili coppie di osservabili rappresentate da operatoricon proprietà analoghe, come illustreranno gli esempi.

Dimostrazione. Consideriamo

〈[A,B]〉ψ = 〈ψ, [A,B]ψ〉 = 〈ψ,ABψ〉 − 〈ψ,BAψ〉=

simmetria di A e B〈Aψ,Bψ〉 − 〈Bψ,Aψ〉

= 〈Aψ,Bψ〉 − 〈Aψ,Bψ〉 = 2 Im 〈Aψ,Bψ〉

quindi∣∣∣〈[A,B]〉ψ∣∣∣ = |2 Im 〈Aψ,Bψ〉| ≤ 2 |〈Aψ,Bψ〉| ≤

Cauchy-Schwartz2 ‖Aψ‖ ‖Bψ‖ .

86

Page 87: Introduzione al formalismo matematico della meccanica ...

Il calcolo precedente vale per A,B operatori simmetrici qualsiasi. Ricordandoche

(∆ψA) =∥∥∥Aψ − 〈A〉ψ ψ∥∥∥

L2

(∆ψB) =∥∥∥Bψ − 〈B〉ψ ψ∥∥∥

L2

possiamo applicare il risultato precedente con A e B sostituiti rispettivamenteda A−〈A〉ψ I e B−〈B〉ψ I (con I operatore identità). Poiché 〈A〉ψ e 〈B〉ψ sonocostanti, il commutatore di A,B non cambia, in quanto, per α, β costanti si ha

[A− αI,B − βI] = (A− αI) (B − βI)− (B − βI) (A− αI)

= (AB − αB − βA+ αβI)− (BA− βA− αB + αβI)

= AB −BA = [A,B] .

Perciò otteniamo∣∣∣〈[A,B]〉ψ∣∣∣ ≤ 2

∥∥∥Aψ − 〈A〉ψ ψ∥∥∥∥∥∥Bψ − 〈B〉ψ ψ∥∥∥ = 2 (∆ψA) (∆ψB) ,

che è la tesi.

Esempio 3.9 Limitiamoci per semplicità al caso unidimensionale.a. Gli operatori momento e energia cinetica commutano tra loro:

P = −i ∂∂x

Ec = − 2

2m

∂2

∂x2

perciò[P,Ec] = 0

(derivate rispetto alla stessa variabile, moltiplicate per costanti, commutano traloro). Quindi non c’è limitazione dal basso al prodotto delle incertezze di misura.b. Gli operatori posizione e energia potenziale commutano tra loro:

Xψ = xψ

Epψ = V ψ

perciò[X,Ep] = 0

(due operatori di moltiplicazione commutano tra loro).c. Gli operatori posizione e energia cinetica non commutano tra loro:

Xψ = xψ

Ecψ = − 2

2m

∂2ψ

∂x2

87

Page 88: Introduzione al formalismo matematico della meccanica ...

perciò

[X,Ec]ψ = − 2

2m

(x∂2ψ

∂x2− ∂2 (xψ (x))

∂x2

)= −

2

2m

(x∂2ψ

∂x2− ∂

∂x

(x∂ψ

∂x+ ψ

))= −

2

2m

(x∂2ψ

∂x2−(

2∂ψ

∂x+ x

∂2ψ

∂x2

))=2

m

∂ψ

∂x

ossia

[X,Ec] =2

m

∂x.

Questo significa che

(∆ψX) (∆ψEc) ≥1

2

∣∣∣∣∣⟨2

m

∂x

⟩ψ

∣∣∣∣∣ =1

2

2

m

∣∣∣∣⟨ψ, ∂ψ∂x⟩∣∣∣∣ =

1

2

2

m

∣∣∣∣∫Rψ (x)

∂ψ

∂x(x) dx

∣∣∣∣ .Notiamo che, a differenza dell’indeterminazione della coppia posizione-momento,in questo caso il limite inferiore dipende dallo stato ψ, in particolare per certistati potrebbe essere nullo e per altri no. Facciamo un paio di esempi numeri-ci, nel caso di una ψ soluzione dell’equazione di Schrödinger per una particellalibera, per la quale conosciamo formule esplicite per ψ (3.6) e ψ (3.5).⟨

ψ,∂ψ

∂x

⟩=

⟨ψ,∂ψ

∂x

⟩=

∫Rψ0 (ξ) e−i

πhξ2

m t (2πiξ) ψ0 (ξ) e−iπhξ2

m tdξ

= 2πi

∫Rξ∣∣∣ψ0 (ξ)

∣∣∣2 dξ.Ora, a seconda del tipo di funzione ψ0 che scegliamo come stato iniziale, pos-siamo trovare un integrale zero o positivo. Ad esempio se ψ0 è una funzione

reale, allora ψ0 è pari, perciò ξ∣∣∣ψ0 (ξ)

∣∣∣2 è dispari e si ha∫Rξ∣∣∣ψ0 (ξ)

∣∣∣2 dξ = 0.

In questo caso non c’è indeterminazione.Se invece scegliamo una ψ0 per cui ψ0 (ξ) = 0 per ξ < 0, si ha∫

Rξ∣∣∣ψ0 (ξ)

∣∣∣2 dξ =

∫ +∞

0

ξ∣∣∣ψ0 (ξ)

∣∣∣2 dξ > 0,

per cui c’è indeterminazione.Ad esempio per

ψ0 (x) =1

π

1

x+ irisulta:

ψ0 (ξ) = −2ie−2πξχ(0,+∞) (ξ) ,

88

Page 89: Introduzione al formalismo matematico della meccanica ...

si ha ∫Rξ∣∣∣ψ0 (ξ)

∣∣∣2 dξ = 4

∫ +∞

0

ξe−4πξdξ =1

4π2

(∆ψX) (∆ψEc) ≥1

2

2

m2π

1

4π2=

2

4πm.

3.5 Legge della v.a. osservabile. Il teorema spettrale

3.5.1 Legge di un osservabile

In base all’Assioma 2, ad ogni osservabile A corrisponde un operatore A chepermette, noto lo stato ψ del sistema, di calcolare il valore atteso di A:

〈A〉ψ = 〈ψ,Aψ〉 .

Vorremmo, naturalmente, poter calcolare non solo il valore atteso di A, mapiù in generale le probabilità

Pψ (A ∈ I) per I intervallo ⊂ R,

cioè conoscere la legge della v.a. A. Abbiamo visto come calcolare questaprobabilità nei casi specifici degli osservabili posizione X , momento P, e perl’osservabile energia H quando lo stato ψ del sistema si può sviluppare in seriedi autofunzioni dell’hamiltoniana. Quest’ultima situazione si verifica ad esempionel caso dell’oscillatore armonico quantistico unidimensionale, per il quale esisteun s.o.n.c. di autofunzioni, quindi ogni stato si sviluppa in serie di autofunzioni(v. Esempio 3.4), o per l’elettrone dell’atomo di idrogeno, quando si trova inuno stato legato, cioè a energia negativa (abbiamo visto che esiste un s.o.n.c.del sottospazio degli stati a energia negativa, v. Esempio 3.5).Ricapitoliamo e confrontiamo queste tre situazioni, esemplificando per sem-

plicità nel caso unidimensionale.Se ψ rappresenta lo stato del sistema (ad un dato istante t), allora

Pψ (X ∈ I) =

∫I

|ψ (x, t)|2 dx

Pψ (P ∈ I) =

∫I

1

h

∣∣∣ψ ( ph, t)∣∣∣2 dp

e, nell’ipotesi che esista un s.o.n.c. di autofunzioni ψj di H aventi autovaloriλj, se ψ =

∑∞j=1 cjψj (normalizzato), allora

Pψ (H ∈ I) =∑λj∈I|cj |2 .

In tutti e tre i casi, all’osservabile A e allo stato ψ è associata una misura diprobabilità µAψ tale che

Pψ (A ∈ I) = µAψ (I)

89

Page 90: Introduzione al formalismo matematico della meccanica ...

per ogni intervallo I ⊂ R. Inoltre, nel caso in cui H ha un s.o.n.c. di autofun-zioni, la misura µAψ è concentrata sull’insieme di autovalori λj, che coincidecon l’insieme dei valori possibili per la misura di H. Nei primi due casi inveceogni numero reale può essere l’esito della misura di X o P. Ricordiamo chequesti due operatori non hanno autovalori, ma hanno spettro uguale a R. Laproprietà comune ai tre esempi è che la misura µAψ è concentrata sullo spet-tro di A, che rappresenta l’insieme dei valori che possono essere misurati perl’osservabile A.Questa proprietà che abbiamo constatato nei tre specifici esempi considerati,

è in realtà una conseguenza matematica della proprietà dell’operatore di essereautoaggiunto. Questo fatto è contenuto nel teorema spettrale, che ora vogliamoenunciare. Il teorema ci dirà anche che la situazione in cui esiste un s.o.n.c. diautofunzioni dell’operatore non accade per caso ma rappresenta una situazionein qualche modo “naturale”.Ci occorre qualche preliminare.

Definizione 3.1 Sia B la σ-algebra dei Boreliani42 in R, sia H uno spazio diHilbert e B (H) lo spazio degli operatori lineari continui su H. Si dice misura avalori di proiezione una funzione d’insieme

P : B → B (H)

P : E 7→ P (E)

(che ad ogni sottoinsieme di Borel della retta associa un operatore lineare con-tinuo su H) tale che:(i) P (E)

∗= P (E) e P (E)

2= P (E)

(ii) P (R) = I (operatore identità)(iii) P è numerabilmente additiva: se En∞n=1 sono sottoinsiemi boreliani

della retta a due a due disgiunti, allora per ogni ψ ∈ H si ha:

P

( ∞⋃n=1

En

)ψ =

∞∑n=1

P (En)ψ.

Le proprietà (i)-(ii), insieme al fatto che P (E) ∈ B (H), esprimono il fattoche P (E) sia un operatore di proiezione ortogonale, nel senso della Definizione1.10. In base alla Proposizione 1.5, possiamo pensare a P (E) come all’operatoredi proiezione ortogonale sul sottospazio chiuso

VE = RangeP (E) ,

dove VE che coincide con tutto H se E = R.La (iii) esprime invece il fatto che P è in un certo senso una misura.Per il fatto di essere una misura a valori di proiezione, P ha ulteriori proprietà

che si possono dimostrare in base alla definizione:42La σ-algebra di Borel, o degli insiemi boreliani, in R, si può definire come la più piccola σ-

algebra contenente tutti gli intervalli (a, b). E’una σ-algebra strettamente contenuta in quelladegli insiemi Lebesgue misurabili, ma contiene tutti gli insiemi che ci possono ragionevolmenteinteressare.

90

Page 91: Introduzione al formalismo matematico della meccanica ...

Proposizione 3.4 Se P è una misura a valori di proiezione, allora(i) P (∅) = 0 e P (Ec) = I − P (E)(ii) P (E1 ∩ E2) = P (E1)P (E2) (dove il prodotto è la composizione di

operatori lineari)

La (i) è una conseguenza ovvia dell’additivià. Per la dimostrazione di (ii),v. [16], Teor. 52. Da queste proprietà segue ad esempio il prossimo fatto utile:

Proposizione 3.5 Se P è una misura a valori di proiezione, E1, E2 ⊂ R sonoboreliani,

VEi = RangeP (Ei) per i = 1, 2,

alloraE1, E2 disgiunti =⇒ VE1 ⊥ VE2 .

Dimostrazione. Per (i) e (ii) della proposizione precedente, sappiamo che seE1, E2 sono insiemi disgiunti,

0 = P (∅) = P (E1 ∩ E2) = P (E1)P (E2) .

Per il punto (iii) della Proposizione 1.5 P (E1)P (E2) = 0 implica VE1 ⊥ VE2 .

Se P è una misura a valori di proiezione, ad ogni operatore di proiezioneP (E) ottenuto al modo precedente e a ogni stato ψ si può associare una veramisura, al modo seguente:

Proposizione 3.6 Se P è una misura a valori di proiezione e ψ ∈ H un vettoreunitario, allora

µψ : B → [0, 1]

µψ (E) = 〈ψ, P (E)ψ〉

è una misura sulla σ-algebra dei Boreliani di R, e inoltre è una misura diprobabilità, cioè µψ (R) = 1.

Dimostrazione. Poiché P (E)2

= P (E) e P (E)∗

= P (E) si ha

µψ (E) = 〈ψ, P (E)ψ〉 = 〈ψ, P (E)P (E)ψ〉 = 〈P (E)ψ, P (E)ψ〉 = ‖P (E)ψ‖2 ≥ 0.

Poiché P (R) = I,

µψ (R) = 〈ψ, P (R)ψ〉 = 〈ψ,ψ〉 = 1

perché ψ è normalizzato.Se En∞n=1 sono boreliani a due a due disgiunti, poiché P è numerabilmente

additiva,

µψ

( ∞⋃n=1

En

)=

⟨ψ, P

( ∞⋃n=1

En

⟩=

⟨ψ,

∞∑n=1

P (En)ψ

91

Page 92: Introduzione al formalismo matematico della meccanica ...

per la continuità del prodotto scalare

=

∞∑n=1

〈ψ, P (En)ψ〉 =

∞∑n=1

µψ (En) .

In questa sezione enunceremo un risultato astratto, il teorema spettrale, chevale per ogni operatore lineare autoaggiunto su uno spazio di Hilbert. Applican-dolo agli operatori che rappresentano gli osservabili della meccanica quantistica,troveremo che ad ogni osservabile è effettivamente associata, in modo unico, unamisura a valori di proiezioni, che a sua volta induce una misura di probabilitàche costituisce la legge dell’osservabile. Per rendere il nostro percorso logicomeno astratto, invece di partire dal teorema spettrale, cominciamo a enunciareil risultato sulla legge di un osservabile, che ne sarà una conseguenza:

Teorema 3.5 (Legge di un osservabile) 43Se A : D (A) → H è un opera-tore autoaggiunto sullo spazio di Hilbert H (associato all’osservabile A) esisteuna misura a valori di proiezione PA univocamente associata ad A (vedremo inseguito come), tale che PA è concentrata su σ (A) e per ogni stato ψ ∈ H lacorrispondente misura µAψ , definita da

µAψ (E) =⟨ψ, PA (E)ψ

⟩,

e anch’essa concentrata su σ (A), ha il seguente significato:

Pψ (A ∈ E) = µAψ (E) per ogni boreliano E ⊂ R.

La misura di probabilità µAψ è la legge dell’osservabile A.Vediamo qualche osservazione e qualche conseguenza di questo teorema.

Osservazione 3.3 (Sottospazi spettrali) Se per un boreliano E ⊂ R, defini-amo il sottospazio spettrale VE ⊂ H ponendo

VE = Range(PA (E)

),

allora, in base alla Proposizione 3.5, sottospazi spettrali relativi a insiemi dis-giunti sono ortogonali tra loro:

E1 ∩ E2 = ∅ =⇒ VE1 ⊥ VE2 .

Osservazione 3.4 (Moltiplicazione di ψ per c di modulo 1) La relazione

µAψ (E) =⟨ψ, PA (E)ψ

⟩implica in particolare che per ogni costante complessa c di modulo 1 risulta

µAcψ (E) =⟨cψ, PA (E) cψ

⟩= c

⟨ψ, cPA (E)ψ

⟩= cc

⟨ψ, PA (E)ψ

⟩= |c|2

⟨ψ, PA (E)ψ

⟩= µAψ (E) ,

43Per la dimostrazione, v. [12], Thm. 10.4

92

Page 93: Introduzione al formalismo matematico della meccanica ...

ossia: per ogni osservabile A e ogni stato ψ, la probabilità che A assuma certivalori non cambia se moltiplichiamo ψ per una costante complessa di modulo 1.Un’analoga proprietà era già stata verificata per il valore atteso di A. Il fattoche non solo il valore atteso, ma, più in generale, la legge della v.a. A noncambi moltiplicando ψ per una costante complessa di modulo 1 è coerente colfatto che, come affermato nell’Assioma 1, ψ e cψ rappresentano lo stesso statofisico.Notiamo anche, esplicitamente, che in questo contesto “costante” significa

“indipendente da x”, mentre c può essere una funzione della sola t (che si portafuori dal prodotto scalare come una costante). Abbiamo già usato esplicita-mente questo fatto in precedenza, quando abbiamo affermato che se ψ0 (x) è unautostato dell’hamiltoniana, l’equazione di Schrodinger prescrive un’evoluzionedel tipo e−i

E tψ0 (x) e questa funzione d’onda rappresenta lo stesso stato fisico

del sistema rispetto a ψ0 (x).

Esempio 3.10 (Operatore posizione) Sia X : D (X) → H l’operatore po-sizione

Xψ (x) = xψ (x)

definito sul dominio

D (X) =f ∈ L2 (R) : xf (x) ∈ L2 (R)

.

Sappiamo che σ (X) = R. Allora

PX (E)ψ (x) = χE (x)ψ (x) ;

VE = f ∈ D (X) : f (x) = 0 fuori da E ;

µXψ (E) =⟨ψ, PX (E)ψ

⟩=

∫E

|ψ (x)|2 dx.

Esempio 3.11 (Operatore momento) Sia P : D (P ) → H l’operatore mo-mento

P = −i∂xo equivalentemente

Pψ = F−1(hξψ (ξ)

),

definito sul dominio

D (P ) =f ∈ L2 (R) : ξf (ξ) ∈ L2 (R)

.

Sappiamo che σ (P ) = R. Allora

PP (E)ψ (x) = F−1(χE/h (ξ) ψ (ξ)

);

VE =f ∈ D (P ) : f (ξ) = 0 fuori da E/h

;

µPψ (E) =⟨ψ, PP (E)ψ

⟩=⟨ψ, PP (E)ψ

⟩=

∫E/h

∣∣∣ψ (ξ)∣∣∣2 dξ =

∫E

1

h

∣∣∣ψ ( ph, t)∣∣∣2 dp.

93

Page 94: Introduzione al formalismo matematico della meccanica ...

Esempio 3.12 (Oscillatore armonico quantistico) Consideriamo l’hamil-toniana H dell’oscillatore armonico quantistico unidimensionale,

Hψ = − 2

2mψ′′ (x) +

1

2mω2x2ψ (x)

per il quale sappiamo che esiste un s.o.n.c. di autofunzioni

ψn (x) = e−mωx2

2h Hn

(√mω

hx

), n = 0, 1, 2, ....

En =

(n+

1

2

)ω, per n = 0, 1, 2, ...

(v. Esempio 3.4). Sappiamo che se lo stato ψ è sviluppato in serie di autofun-zioni

ψ =

∞∑n=0

cnψn,

con∑∞n=0 |cn|

2= 1, allora

Pψ (H ∈ E) =∑

n:λn∈E|cn|2

Quest’espressione uguaglia

µHψ (E) =⟨ψ, PH (E)ψ

⟩ponendo

PH (E)ψ =∑

n:λn∈E〈ψn, ψ〉ψn

in altre parole PH (E) è l’operatore di proiezione ortogonale sul sottospaziogenerato da tutti gli autospazi relativi agli autovalori λn ∈ E.

Sviluppo in serie di vettori ortogonaliGeneralizziamo quanto descritto nell’esempio dell’oscillatore armonico quantis-tico. Ricordiamo che PA, in quanto misura a valori di proiezione concentratasu σ (A) ha le proprietà:

PA (σ (A)) = I

(dove I è l’operatore identità) e PA è numerabilmente additiva: se En∞n=1

sono sottoinsiemi boreliani della retta a due a due disgiunti, allora per ogniψ ∈ H si ha:

P

( ∞⋃n=1

En

)ψ =

∞∑n=1

P (En)ψ.

94

Page 95: Introduzione al formalismo matematico della meccanica ...

Supponiamo che σ (A) consista di una successione di autovalori,

σ (A) =∞⋃n=1λn .

Allora per ogni ψ ∈ H possiamo scrivere

ψ = PA (σ (A))ψ = PA

( ∞⋃n=1

λn)ψ =

∞∑n=1

PA (λn)ψ.

PA (λn) è l’operatore di proiezione ortogonale sul sottospazio spettrale

Vn = RangePA (λn) ,

dove questi sottospazi Vn sono a due a due ortogonali. Quindi: ogni operatorelineare autoaggiunto il cui spettro consista di una successione di autovalori in-duce un modo “canonico” di sviluppare un qualsiasi elemento di H in serie dielementi ortogonali.

Osservazione 3.5 Supponiamo ora che lo spettro dell’Hamiltoniana σ (H) con-sista di una successione di autovalori e una parte continua, come nel casodell’elettrone dell’atomo di idrogeno per cui è

σ (H) =

− 1

2n2me

(e2

4πε0

)2∞n=1

∪ [0,+∞),

In questo caso la rappresentazione PH (σ (H)) = I dà lo sviluppo

ψ =

∞∑n=1

PH (λn)ψ + PH [0,+∞)ψ.

L’operatore PH [0,+∞) proietta ψ sullo spazio degli stati (non legati) a ener-gia positiva. In particolare questo significa che le autofunzioni non possonocostituire un s.o.n.c. dello spazio di Hilbert.Consideriamo l’operatore momento (che non ha autovalori e ha spettro = R).

La rappresentazione integrale di Fourier

ψ (x) =

∫Rψ (ξ) e2πiξxdξ

(che è esattamente quella da cui siamo partiti per individuare la forma analit-ica dell’operatore momento) si può vedere come uno sviluppo, integrale anzichéin serie, di ogni stato ψ mediante sovrapposizione di elementi e2πiξx, che nonstanno in L2, e si possono vedere in un certo senso come “autofunzioni gener-alizzate”dell’operatore momento (si veda la nota 3.1).Per l’operatore posizione (che non ha autovalori e ha spettro = R) si può

scrivere simbolicamente

ψ (x) =

∫Rψ (y) δy (x) dy

95

Page 96: Introduzione al formalismo matematico della meccanica ...

dove, di nuovo, le Delta di Dirac non sono elementi di L2 ma si possono vederecome autofunzioni generalizzate dell’operatore posizione.Il concetto di misura a valori di proiezione e il teorema spettrale, che ora

enunceremo, sostituiscono queste scritture simboliche con qualcosa di rigoroso,anche se più astratto.

3.5.2 Il teorema spettrale

Il prossimo risultato astratto, riguardante una qualsiasi misura a valori di proiezione,ci permetterà di enunciare il teorema spettrale.

Teorema 3.6 (Integrale a valori operatoriali) 44Sia B la σ-algebra dei Bore-liani in R, P : B → B (H) una misura a valori di proiezione e, per ogni ψ ∈ H,sia µψ la misura definita da

µψ (E) = 〈ψ, P (E)ψ〉 .

Allora per ogni funzione misurabile f : R→ C esiste un unico operatore lineareillimitato, denotato con ∫

RfdP

e avente dominio

Wf =

ψ ∈ H :

∫R|f (λ)|2 dµψ <∞

tale che, per ogni ψ ∈Wf⟨

ψ,

(∫RfdP

⟩=

∫Rfdµψ. (3.7)

Inoltre:se f ha valori reali, l’operatore

∫R fdP è autoaggiunto su Wf ;

se la funzione f (λ) è limitata, allora Wf = H e∫R fdP è limitato.

Il fatto che l’azione dell’operatore T =∫R fdP sia specificata dalla (3.7),

che non assegna direttamente Tψ ma solo il valore di 〈ψ, Tψ〉 può sembrareinsuffi ciente a determinare completamente Tf . Tuttavia si può dimostrare che

Proposizione 3.7 Se A,B sono due operatori lineari simmetrici su H tali che

〈ψ,Aψ〉 = 〈ψ,Bψ〉 per ogni ψ ∈ D (A) ∩D (B)

e inoltre D (A) ∩D (B) è denso in H, allora

Aψ = Bψ per ogni ψ ∈ D (A) ∩D (B) .

44Per la dimostrazione si veda [12], Prop. 10.1 e osservazione dopo l’enunciato, Prop. 10.3.

96

Page 97: Introduzione al formalismo matematico della meccanica ...

Perciò in realtà la relazione (3.7), per una P e una f assegnati, specificaunivocamente l’operatore

∫R fdP .

Dimostrazione. (La dimostrazione è simile a quella della Proposizione 1.1, incui abbiamo caratterizzato gli operatori simmetrici come quelli per cui 〈ψ,Aψ〉 =〈Aψ,ψ〉 per ogni ψ ∈ D (A)). Dimostreremo che se A è un operatore linearesimmetrico a dominio denso in H tale che

〈ψ,Aψ〉 = 0 per ogni ψ ∈ D (A) ,

allora A = 0. Applicando questo fatto all’operatore A − B seguirà l’assertovoluto.Per ogni φ, ψ ∈ D (A) e λ ∈ C possiamo scrivere

0 = 〈φ+ λψ,A (φ+ λψ)〉= 〈φ,Aφ〉+ λ 〈φ,Aψ〉+ λ 〈ψ,Aφ〉+ |λ|2 〈ψ,Aψ〉= 0 + λ 〈φ,Aψ〉+ λ 〈ψ,Aφ〉+ 0

= λ 〈φ,Aψ〉+ λ 〈Aψ, φ〉= λ 〈φ,Aψ〉+ λ〈φ,Aψ〉= 2 Reλ 〈φ,Aψ〉 .

Applicando quest’uguaglianza una volta a λ = 1 e una volta a λ = i otteniamo

Re 〈φ,Aψ〉 = 0

Im 〈φ,Aψ〉 = 0

cioè 〈φ,Aψ〉 = 0 per ogni φ, ψ ∈ D (A) . Per ψ fissato, il fatto che

〈φ,Aψ〉 = 0 per ogni φ ∈ D (A) ,

con D (A) denso in H, implica Aψ = 0. Infatti, basta scegliere una successioneφn ⊂ D (A) tale che φn → Aψ in H, e per la continuità del prodotto scalaresi ha

0 = 〈φn, Aψ〉 → 〈Aψ,Aψ〉 = ‖Aψ‖2 ,perciò Aψ = 0.

Proposizione 3.8 L’integrale operatoriale è numerabilmente additivo rispettoall’insieme di integrazione, cioè, se

σ (A) =

∞⋃n=1

En

con gli insiemi En a due a due disgiunti, allora(∫⋃∞n=1En

fdPA

)ψ =

∞∑n=1

(∫σ(A)

(χEnf) dPA

per ogni ogni ψ ∈ H

97

Page 98: Introduzione al formalismo matematico della meccanica ...

Dimostrazione. Sfruttando la (3.7) e il fatto che µAψ è una misura, quindi ènumerabilmente additiva,⟨

ψ,

(∫σ(A)

fdPA

⟩=

∫⋃En

fdµAψ =

∞∑n=1

∫En

fdµAψ

=

∞∑n=1

⟨ψ,

(∫σ(A)

(χEnf) dPA

⟩per linerarità e continuità del prodotto scalare

=

⟨ψ,

∞∑n=1

[(∫σ(A)

(χEnf) dPA

]⟩

=

⟨ψ,

[ ∞∑n=1

(∫σ(A)

(χEnf) dPA

)]ψ

⟩dove l’ultima uguaglianza è la definizione stessa dell’operatore somma della seriedi operatori. E’un operatore lineare e simmetrico, perché l’ultima espressionescritta uguaglia

∞∑n=1

⟨ψ,

(∫σ(A)

(χEnf) dPA

⟩=

∞∑n=1

⟨(∫σ(A)

(χEnf) dPA

)ψ,ψ

=

⟨ ∞∑n=1

(∫σ(A)

(χEnf) dPA

)ψ,ψ

⟩,

dove si è sfruttato il fatto che(∫

σ(A)(χEnf) dPA

)è simmetrico. Allora dalla

Proposizione 3.7 segue che(∫⋃∞n=1En

fdPA

)ψ =

∞∑n=1

(∫σ(A)

(χEnf) dPA

Possiamo ora enunciare il seguente

Teorema 3.7 (spettrale) 45Se A : D (A) → H è un operatore autoaggiuntosullo spazio di Hilbert H allora esiste una e una sola misura a valori di proiezionePA, concentrata su σ (A), tale che

A =

∫σ(A)

λdPA (λ) . (3.8)

In particolare, D (A) coincide con il dominio Wf per f (λ) = λ, cioè

D (A) =

ψ ∈ H :

∫σ(A)

λ2dµAψ <∞.

45Per la dimostrazione, v. [12], Thm. 10.4.

98

Page 99: Introduzione al formalismo matematico della meccanica ...

Nella (3.8) si può anche scrivere

A =

∫RλdPA (λ)

ricordando che la misura a valori di proiezioni è concentrata su σ (A), per cuil’integrale su tutto R coincide con l’integrale sul solo spettro di A.

Vediamo ora qualche commento suggerito dal teorema precedente.

Teorema spettrale e legge dell’osservabileIl teorema spettrale completa la descrizione della legge dell’osservabile A da-ta dal Teorema 3.5: la misura a valori di proiezione PA che induce la leggedell’osservabile mediante la relazione

µAψ (E) =⟨ψ, PA (E)ψ

⟩,

è quell’unica misura a valori di proiezione che rende vera la rappresentazionedi A nella forma (3.8). Il teorema spettrale consente anche di rendersi contoperché non è arbitrario identificare la misura di probabilità µAψ con la leggedell’osservabile A. Per capire questo, ripartiamo dall’assioma 2, che prescrive

Eψ (A) = 〈ψ,Aψ〉 .

Utilizzando il teorema spettrale, possiamo riscrivere

A =

∫σ(A)

λdPA (λ)

per una certa misura a valori di proiezioni PA e quindi

Eψ (A) =

⟨ψ,

(∫σ(A)

λdPA (λ)

⟩.

Utilizzando la relazione (3.7) che fa parte dell’enunciato del teorema sull’inte-grale a valori operatoriali, possiamo riscrivere

Eψ (A) =

⟨ψ,

(∫σ(A)

λdPA (λ)

⟩=

∫RλdµAψ (λ)

e questo significa appunto che la misura µAψ (λ) è la legge di A, cioè che

Pψ (A ∈ I) = µAψ (I) .

Perciò la relazione tra misura a valori di proiezione che rappresenta A e leggedell’osservabile non è arbitraria.Inoltre il fatto che i valori assunti da A siano solo i valori dello spettro è

anch’esso una conseguenza dell’autoaggiuntezza di A.

99

Page 100: Introduzione al formalismo matematico della meccanica ...

Teorema spettrale e sviluppo in operatori di proiezioneIl teorema spettrale esprime l’operatore A mediante una sovrapposizione diinfiniti operatori di tipo proiezione ortogonale, su sottospazi dipendenti daglielementi dello spettro di A.Si noti che per un operatore lineare illimitato autoaggiunto, lo spettro è

illimitato (v. Teorema 3.7), perciò la funzione λ è illimitata e la convergenzadell’integrale che determina se ψ ∈ D (A) non è automatica, in altre paroleD (A) è propriamente contenuto in H.

La situazione in cui il contenuto di questo teorema diventa più trasparente(e significativa per noi) è quando σ (A) consiste di una successione di autovalori,

σ (A) =∞⋃n=1λn .

Allora, per la numerabile additività dell’integrale operatoriale (Proposizione3.8),

A =

∫∞⋃n=1λn

λdPA (λ) =

∞∑n=1

∫λn

λdPA (λ) =

∞∑n=1

λnPA (λn) ,

Ponendo Vn = RangePA (λn),

A =

∞∑n=1

λnPVn

dove PVn rappresenta l’operatore di proiezione ortogonale sul sottospazio chiusoVn. Supponiamo per semplicità che, per ogni n, Vn abbia dimensione 1 e ψn siaun elemento non nullo di Vn. Ricordando che

n 6= m⇒ λn , λm disgiunti, e quindi Vn ⊥ Vm

ψn ∈ Vn ⇒ PVmψn = 0 per ogni m 6= n,

perciò

Aψn =

∞∑m=1

λmPVmψn = λnψn,

ossia: ψn è un’autofunzione di A, ossia Vn è proprio l’autospazio di λn.L’operatore A si può vedere quindi come serie di operatori di proiezione sui

suoi autospazi, con gli autovalori come coeffi cienti dello sviluppo. Inoltre, comegià osservato, in queste ipotesi le autofunzioni ψn rappresentano un s.o.n.c.Otteniamo quindi le seguenti conclusioni:

Se lo spettro di un operatore lineare autoaggiunto A consiste di una succes-sione di autovalori λn, e gli autospazi Vn corrispondenti hanno dimensione 1,allora esiste un s.o.n.c. di autofunzioni di A, e l’operatore ha la forma

A =

∞∑n=1

λnPVn .

100

Page 101: Introduzione al formalismo matematico della meccanica ...

In particolare, se sviluppiamo un generico stato ψ ∈ D (A) in serie di autofun-zioni,

ψ =

∞∑n=1

cnψn,

si ha

Aψ =

∞∑n=1

λncnψn

e

〈ψ,Aψ〉 =

∞∑n=1

λn |cn|2 .

Si ha anche

PA (E) =∑λn∈E

PA (λn)

PA (λn)ψ = cnψn

PA (E)ψ =∑λn∈E

cnψn

µAψ (E) =⟨ψ, PA (E)ψ

⟩=

⟨ ∞∑k=1

ckψk,∑λn∈E

cnψn

⟩=∑λn∈E

|cn|2

Notiamo anche che per ogni ψ =∑∞n=1 cnψn ∈ H normalizzata si deve avere

∞∑n=1

|cn|2 = 1.

D’altro canto se per ψ ∈ D (A) si ha

Aψ =

∞∑n=1

λncnψn

significa che∞∑n=1

λ2n |cn|

2<∞,

il che, essendo λn → +∞ (lo spettro di un operatore illimitato autoaggiunto è il-limitato), è una condizione più restrittiva sui coeffi cienti cn. Possiamo affermareche

ψ ∈ D (A)⇐⇒∞∑n=1

λ2n |cn|

2<∞.

Del resto, questa condizione coincide con la definizione del dominio Wf che, perf (λ) = λ, dà: ψ ∈Wf se e solo se converge l’integrale∫

R|f (λ)|2 dµψ =

∫σ(A)

λ2dµψ =

∞∑n=1

λ2nµψ (λn) =

∞∑n=1

λ2n |cn|

2.

101

Page 102: Introduzione al formalismo matematico della meccanica ...

Supponiamo ora che lo spettro dell’Hamiltoniana σ (H) consista di unasuccessione di autovalori e una parte continua, come nel caso dell’elettronedell’atomo di idrogeno per cui è

σ (H) =

− 1

2n2me

(e2

4πε0

)2∞n=1

∪ [0,+∞),

oppure per la particella in moto sulla retta in presenza di una buca rettangolaredi potenziale (v. Esempio 3.6), per cui è:

σ (H) = λknk=1 ∪ [0,+∞),

per un certo numero finito n di autovalori negativi. In questo caso la rappre-sentazione spettrale dell’hamiltoniana dà (ad es. per l’atomo di idrogeno)

H =

∞∑n=1

λnPVn +

∫ +∞

0

λdPH (λ) .

(Non cerchiamo qui di descrivere più esplicitamente l’operatore∫ +∞

0λdPH (λ)).

Osservazione 3.6 Per manipolare in modo più trasparente l’epressione∫R λdP

A (λ),osserviamo che l’integrale a valori operatoriali si può vedere come opportunolimite di somme “alla Cauchy-Riemann”, al modo seguente: anzitutto pensiamoall’integrale R come una sorta di integrale di Riemann generalizzato, cioè:∫

R= limk→+∞

∫ k

−k.

Quindi vediamo∫ k−k come limite di somme di Cauchy-Riemann, suddividendo

[−k, k] in intervalliniI

(k)j

Nkj=1

di ampiezza ∆k → 0. Otteniamo, per opportuni

punti λ(k)j ∈ I(k)

j ∫RλdPA (λ) = lim

k→+∞∆k→0

Nk∑j=1

λ(k)j PA

(I

(k)j

). (3.9)

Il prossimo esempio contiene un’applicazione di questo fatto.

Esempio 3.13 (Operatore posizione) Sappiamo già che per

Xψ (x) = xψ (x)

si ha σ (X) = R e:

PX (E)ψ (x) = χE (x)ψ (x) ;

µXψ (E) =⟨ψ, PX (E)ψ

⟩=

∫E

|ψ (x)|2 dx.

102

Page 103: Introduzione al formalismo matematico della meccanica ...

La rappresentazione spettrale, sfruttando la (3.9), si può scrivere così:

Xψ = limk→+∞∆k→0

Nk∑j=1

λ(k)j PX

(I

(k)j

)ψ = lim

k→+∞∆k→0

Nk∑j=1

λ(k)j χ

I(k)jψ

che restituisce Xψ (x) = xψ (x). Si noti anche che il dominio

D (X) =ψ ∈ L2 (R) : xψ (x) ∈ L2 (R)

è effettivamente quello definito dalla condizione∫

σ(X)

λ2dµXψ <∞,

infatti, poiché dµXψ = |ψ (x)|2 dx si ha∫σ(X)

λ2dµXψ =

∫Rλ2 |ψ (λ)|2 dλ.

Riferimenti bibliografici

[1] R. Adams, J.F.F. Fournier: Sobolev spaces. Second edition. Elsevi-er/Academic Press, 2003.

[2] P. Blanchard, E. Brüning: Mathematical Methods in Physics. Birkhauser,2015.

[3] M. Bramanti: Metodi di Analisi Matematica per l’Ingegneria. Esculapio,2019.

[4] P. Caldirola, R. Cirelli, G.M. Prosperi, Introduzione alla Fisica Teorica,UTET, Torino, 1982.

[5] C. Carathéodory: Untersuchungen über die Grundlagen der Thermody-namik. Math. Ann. 67 (1909), no. 3, 355—386.

[6] F. Ciccacci: Fondamenti di fisica atomica e quantistica. EdiSES 2012.

[7] R. Courant, D. Hilbert: Methods of mathematical physics. Vol. I.Interscience Publishers, Inc., New York, N.Y., 1953.

[8] P. A. M. Dirac: The principles of quantum mechanics. First edition: 1930.Fourth edition 1958, Oxford University Press, reprinted in 1967.

[9] J.J. Duistermaat, J.A.C. Kolk: Distributions. Cornerstones. Birkhäuser2010.

103

Page 104: Introduzione al formalismo matematico della meccanica ...

[10] G. Fano, S. M. Bindler: Twenty-First Century Quantum Mechan-ics: Hilbert Space to Quantum Computers. Mathematical Methods andConceptual Foundations. Springer. 2017.

[11] M. Haase: Functional Analysis. An elementary introduction. GraduateStudies in Mathematics. Vol. 156. American Mathematical Society. 2014.

[12] B. Hall: Quantum Theory for Mathematicians. Springer, 2013.

[13] J. Kestin (ed.): The second law of thermodynamics. Dowden, Hutchinson& Ross, Inc. Stroudsburg, Pennsylvania, 1976.

[14] G. Israel, A. Millán Gasca: The world as a mathematical game. Johnvon Neumann and Twentieth Century Science. Science Networks Histor-ical Studies, vol. 38. Birkhauser, 2009. Esiste anche la versione italiana: Ilmondo come gioco matematico. La vita e le idee di John von Neumann.Bollati Boringhieri, 2008.

[15] A. C. Phillips. Introduction to quantum mechanics. Wiley. 2003.

[16] A. Sacchetti: Note del corso di Metodi Matematici della MeccanicaQuantistica,http://cdm.unimo.it/home/matematica/sacchetti.andrea/IstituzioniFisicaMatematica.pdf

[17] L. Schwartz: Théorie des distributions. Tome I. Actualités Sci. Ind., no.1091 = Publ. Inst. Math. Univ. Strasbourg 9. Hermann & Cie., Paris,1950.

[18] L. Schwartz: Théorie des distributions. Tome II. Actualités Sci. Ind., no.1122 = Publ. Inst. Math. Univ. Strasbourg 10. Hermann & Cie., Paris,1951.

[19] Stanford Encyclopedia of Phylosophy: Quantum theory and mathematicalrigor. https://plato.stanford.edu/entries/qt-nvd/

[20] J. von Neumann: Mathematical Foundations of Quantum Mechanics.Princeton University Press, 1955. (Traduzione inglese dell’opera originale:Matematische Grundlagen der Quantenmechanic, 1932).

[21] H. W. Weinberger: A first course in PDEs. Dover, 1965.

[22] E. Zeidler: Nonlinear Functional Analysis and its Applications. IV.Applications to mathematical physics. Springer, 1988.

104