PARTE I: PLANCK EINSTEIN E POINCARÉ, KUBO E FERMI · 2017-05-23 · Einstein su Planck. L’unico...

159
PARTE I: PLANCK EINSTEIN E POINCARÉ, KUBO E FERMI Prefazione alla prima parte Le formulazioni della meccanica quantistica che si trovano in tutti i manuali sono sostanzialmente delle parafrasi della formulazione data da Dirac nel suo libro del 1930, la “bibbia” della MQ. In quel libro furono fissate le scoperte accumulatesi in maniera travolgente nell’eroica fase iniziata il 29 luglio del 1925, con i contributi del circolo di Göttingen esteso a Cambridge (Heisenberg, Born, Jordan e Dirac) e l’indipendente contributo di Schrödinger del 26 gennaio 1926, ispirato dalle fantasie di de Broglie. Di questa fase (concentrata sul problema della stabilità dell’atomo di Rutherford, e delle righe spettrali) ci occuperemo nella seconda parte di queste note. In questa parte ci occuperemo invece della prima fase di creazione della mec- canica quantistica. Tale fase si svolse nell’ambito della termodinamica statistica, ovvero nell’ambito degli studi compiuti (da Boltzmann, sulla scia di Clausius e Maxwell) al fine di “dedurre”, con procedimenti statistici, la termodinamica ma- croscopica a partire da modelli microscopici coinvolgenti atomi e molecole. Dei contenuti di questa prima parte diamo qui un brevissimo riassunto, che potrebbe aiutare il lettore a tenere le fila, durante la dettagliata discussione storico–critica dei singoli argomenti che verrà data nel seguito. Fu proprio nell’ambito degli studi sulla termodinamica statistica che, per su- perare una grave difficoltà connessa al principio di equipartizione dell’energia, Planck pervenne, tra il 19 ottobre e il 14 dicembre del 1900, alla sofferta introdu- zione dell’idea che si debba accettare (o forse anche solo ammettere per sempli- cità di esposizione) che “la natura faccia salti”. Tipicamente, che l’energia di un oscillatore armonico di frequenza ν (ovvero frequenza angolare ω = 2πν ) possa assumere soltanto i valori E n = nh ν n ħ h ω , n = 0,1,2,... , o magari E n =(n + 1 2 ) h ν , dove h è la costante di Planck, e ħ h = h /2π la corri- spondente “costante ridotta”. Questa è l’idea nuova che, inserita sostanzialmente senza altri cambiamenti nel classico procedimento statistico di Boltzmann, per- metteva “miracolosamente” di risolvere i problemi qualitativi che offuscavano come un’ombra i successi della teoria di Clausius, Maxwell e Boltzmann. Infatti, “Ombre sulla fisica del diciannovesimo secolo” è proprio il titolo di un celebre articolo scritto da Lord Kelvin nell’anno 1900, immediatamente pri- ma dei rivoluzionari contributi di Planck. Tali ombre riguardavano appunto 1 1 Oltre ai problemi che condussero nel 1905 alla relatività speciale, di cui qui non ci occupiamo. 1

Transcript of PARTE I: PLANCK EINSTEIN E POINCARÉ, KUBO E FERMI · 2017-05-23 · Einstein su Planck. L’unico...

PARTE I:PLANCK EINSTEIN E POINCARÉ,KUBO E FERMI

Prefazione alla prima parte

Le formulazioni della meccanica quantistica che si trovano in tutti i manuali sonosostanzialmente delle parafrasi della formulazione data da Dirac nel suo libro del1930, la “bibbia” della MQ. In quel libro furono fissate le scoperte accumulatesi inmaniera travolgente nell’eroica fase iniziata il 29 luglio del 1925, con i contributidel circolo di Göttingen esteso a Cambridge (Heisenberg, Born, Jordan e Dirac)e l’indipendente contributo di Schrödinger del 26 gennaio 1926, ispirato dallefantasie di de Broglie. Di questa fase (concentrata sul problema della stabilitàdell’atomo di Rutherford, e delle righe spettrali) ci occuperemo nella secondaparte di queste note.

In questa parte ci occuperemo invece della prima fase di creazione della mec-canica quantistica. Tale fase si svolse nell’ambito della termodinamica statistica,ovvero nell’ambito degli studi compiuti (da Boltzmann, sulla scia di Clausius eMaxwell) al fine di “dedurre”, con procedimenti statistici, la termodinamica ma-croscopica a partire da modelli microscopici coinvolgenti atomi e molecole. Deicontenuti di questa prima parte diamo qui un brevissimo riassunto, che potrebbeaiutare il lettore a tenere le fila, durante la dettagliata discussione storico–criticadei singoli argomenti che verrà data nel seguito.

Fu proprio nell’ambito degli studi sulla termodinamica statistica che, per su-perare una grave difficoltà connessa al principio di equipartizione dell’energia,Planck pervenne, tra il 19 ottobre e il 14 dicembre del 1900, alla sofferta introdu-zione dell’idea che si debba accettare (o forse anche solo ammettere per sempli-cità di esposizione) che “la natura faccia salti”. Tipicamente, che l’energia di unoscillatore armonico di frequenza ν (ovvero frequenza angolare ω = 2πν ) possaassumere soltanto i valori

En = nhν ≡ nħhω , n = 0,1,2, . . . ,

o magari En = (n +12 ) hν, dove h è la costante di Planck, e ħh = h/2π la corri-

spondente “costante ridotta”. Questa è l’idea nuova che, inserita sostanzialmentesenza altri cambiamenti nel classico procedimento statistico di Boltzmann, per-metteva “miracolosamente” di risolvere i problemi qualitativi che offuscavanocome un’ombra i successi della teoria di Clausius, Maxwell e Boltzmann.

Infatti, “Ombre sulla fisica del diciannovesimo secolo” è proprio il titolo diun celebre articolo scritto da Lord Kelvin nell’anno 1900, immediatamente pri-ma dei rivoluzionari contributi di Planck. Tali ombre riguardavano appunto1

1Oltre ai problemi che condussero nel 1905 alla relatività speciale, di cui qui non ci occupiamo.

1

2 Andrea Carati e Luigi Galgani

il “Principio di equipartizione dell’energia”, che si presentava come un teoremanella trattazione statistica di Clausius, Maxwell e Boltzmann. In effetti questoprincipio (apparentemente, un teorema) da una parte aveva confermato l’inter-pretazione microscopica della legge dei gas perfetti, che era stata data da Clausius,identificando la temperatura di un gas con l’energia cinetica delle sue molecole(o meglio quella dei loro baricentri), e aveva permesso di dimostrare la legge diDulong e Petit sul calore specifico dei solidi alle temperature ordinarie (ben notafin dalla prima metà del secolo diciannovesimo). Ma falliva nello stimare, allebasse temperature, l’energia dei gradi di libertà “interni” , sia per le molecole(rotazioni e vibrazioni), sia per i solidi (modi normali di vibrazione).

In tutti questi casi (tranne che nel caso delle rotazioni delle molecole) il mo-dello fondamentale in cui si manifestava il fallimento della fisica classica è quellodell’oscillatore armonico, la cui hamiltoniana H può sempre essere messa nellaforma

H =12(p2+ω2q2) .

In tal caso, il principio di equipartizione prevede che l’energia media U di unsistema di N oscillatori a temnperatura T sia data da

U =N kB T

dove kB è la costante di Boltzmann, mentre dai dati di osservazione per il corponero Planck indusse, il 19 ottobre 1900, la formula

U =Nhν

eβhν − 1, β=

1kB T

,

che si riduce a quella classica solo nel caso limite di alte temperature e/o altefrequenze, cioè per βhν � 1. Invece, in generale la legge di Planck è qualita-tivamente, si potrebbe dire platealmente, diversa dalla legge di equipartizione,a causa del decadimento esponenziale al crescere di βhν (la cosiddetta legge diWien). Queste differenze qualitative tra i dati di osservazione e la teoria classicaerano dunque le “ombre” cui si riferiva Lord Kelvin.

Una possibile via d’uscita di fronte a queste difficoltà era già stata prospettatada Boltzmann stesso, e consisteva nel tenere presente che il teorema di equiparti-zione è formulato facendo riferimento a una situazione di equilibrio, mentre incasi significativi l’approccio all’equilibrio può richiedere tempi lunghissimi, ad-dirittura tempi di ordine geologico, come avviene tipicamente nel caso di moltereazioni chimiche e dei vetri (che costituiscono un tema centrale negli studi difisica teorica contemporanea). Tuttavia, la semplicità della soluzione “di equili-brio” trovata da Planck, che consisteva nell’introdurre la quantizzazione dell’e-nergia senza neppure sognarsi di dovere considerare processi di non equilibrio,ebbe naturalmente il sopravvento, e le idee (peraltro puramente qualitative) diBoltzmann furono del tutto trascurate.2 Le cose furono poi assestate in maniera

2Salvo che da Rayleigh e (fino al 1912) dal suo allievo Jeans.

3

apparentemente definitiva quando, nel 1912, Poincaré dimostrò (sotto opportu-ne ipotesi) che l’introduzione della quantizzazione è addirittura necessaria se sivuole ottenere con procedimenti statistici la “corretta” formula di Planck perl’energia media dell’oscillatore armonico.3

Vedremo tuttavia che una nuova fase ebbe inizio nel 1954, a seguito sia del-l’ultimo lavoro di Fermi (il celebre lavoro FPU), sia de i risultati sulla teoria deisistemi dinamici classici stimolati dal teorema di Kolmogorov, sia dell’introdu-zione dei metodi di Green–Kubo nella meccanica statistica. Il lavoro di Fermie collaboratori e quello di Kolmogorov produssero una rivoluzione nella teoriamatematica dei sistemi dinamici, mettendo in luce che in generale si ha coesi-stenza di moti “ordinati” e di moti “caotici”, contro la diffusa opinione (un pre-giudizio, del tutto comune fino agli anni sessanta, e perdurante ancor oggi) che,almeno nei modelli di sistemi macroscopici, si avesse a che fare solo con moti“caotici”. I metodi di Green–Kubo misero invece in luce come la presenza dimoti ordinati abbia una concreta implicazione in meccanica statistica. Ad esem-pio, come illustreremo nell’ultimo capitolo, il valore che ci si deve aspettare nellemisurazione del calore specifico sarebbe in generale inferiore a quello previsto dalprincipio di equipartizione. Inoltre, dalla teoria dei sistemi dinamici risulta cheuna delle ipotesi introdotte da Poincaré nel suo teorema del 1912 sulla necessitàdella quantizzazione (appunto, un’ipotesi di caoticità, per i moti di oscillatori dialta frequenza) non è soddisfatta in casi significativi.

Vedremo anche come sia stato compreso che il risultato di Poincaré può es-sere letto in un modo alquanto interessante. Ovvero: se, per semplicità di descri-zione, si rinuncia a tener conto dell’esistenza di moti “ordinati” e ci si comportacome se fossero “caotici”, allora “tutto va come se” il sistema fosse quantizza-to. Certamente questa conclusione sarebbe molto piaciuta ad Einstein. In effettigià nel 1911, nel suo contributo alla prima conferenza Solvay, nella quale venne“ufficialmente” ratificata dalla comunità scientifica l’accettazione della quantizza-zione, egli espresse la convinzione che la quantizzazione sia solo una via d’uscitaprovvisoria, nel senso che “tutto va come se il sistema fosse quantizzato”, opinioneche egli tenne fino alla fine della sua vita, avvenuta ne 1955.

Questi brevissimi cenni potrebbero essere sufficienti per dare una indicazio-ne di come intendiamo affrontare il problema di uno studio storico–critico deifondamenti della MQ. Si tratta di rintracciare vie lasciate aperte nello sviluppostorico effettivamente svoltosi, particolarmente alla luce di risultati matematicimoderni, a quei tempi non disponibili. Nel caso della legge di Planck per l’ener-gia media di un sistema di oscillatori, si tratta essenzialmente della coesistenzadi moti ordinati e moti caotici, che costituisce uno dei temi centrali della attuale

3L’impressione destata da questo risultato fu davvero enorme. Ad esempio, nello stesso anno1912, dopo la pubblicazione del lavoro di Poincaré sulla necessità della quantizzazione, avvenneche Jeans, il quale aveva pubblicato diversi lavori ispirati all’idea di non equilibrio di Boltzmann, ene aveva presentato una relazione alla prima conferenza Solvay del 1911, giunse a fare una pubblicadichiarazione di ritrattazione, riconfermata nella prefazione ad un suo libro pubblicato pochi annidopo, e dedicato alla fisica atomica. Si veda anche il suo libro sulla Teoria Cinetica dei Gas.

4 Andrea Carati e Luigi Galgani

ricerca in fisica–matematica, e fu stimolato proprio dall’ultimo lavoro di Fermi,e dal contemporaneo lavoro di Kolmogorov di cui parleremo più avanti.

D’altronde, la coesistenza di moti ordinati e moti caotici si rivelerà essenzialeanche per il problema delle righe spettrali. Questo è il problema centrale chesottende tutti i lavori di Heisenberg (con il circolo di Göttingen–Cambridge) edi Schödinger, che diedero origine alla meccanica quantistica nella sua formula-zione attuale, e verrà discusso nella seconda parte di queste note. Mostreremoallora anzitutto come la forma dello spettro venga determinata ancora da un pro-cedimento alla Kubo riguardante la polarizzazione. D’altra parte illustreremocome sia stato dimostrato, almeno nei casi che coinvolgono il moto degli ioni,che lo spettro presenta delle righe solo se si ha coesistenza di moti ordinati e moticaotici. Righe che, peraltro, riproducono in maniera sorprendentemente buonai dati sperimentali.

Nota biografica su Planck. In quel fatidico volgere del secolo, nell’anno 1900 in cuifondò la meccanica quantistica, Planck aveva 42 anni, essendo nato a Kiel il 23 aprile1858. La vita di Planck fu accompagnata da tragedie. Egli aveva quattro figli. Il primogli morì da militare nella prima guerra mondiale. Poi venivano due gemelle. Una morìdi parto, e la seconda ebbe la stessa sorte, dopo avere sposato il cognato. L’ultimo figlio,con cui condivideva la passione per il piano e l’organo, fu contattato dai cospiratori inoccasione del putsch contro Hitler. A seguito del fallimento del putsch, fu impiccato.

Einstein su Planck. L’unico grande fisico veramente vicino a Planck nell’atteggiamentoscientifico fu (oltre a Nernst) Einstein. Questi aveva di lui un stima grandissima, cometestimoniato dall’obituario che egli scrisse in occasione della morte di Planck (avvenutaa Göttingen il 4 ottobre 1947), e che qui riproduciamo: 4

“Quante varietà di stili nel tempio della scienza! E come diversi sono gli uomini che lofrequentano e diverse le forze morali che ve li hanno condotti. Più di uno si dedica alla scienzacon la gioia di rendersi conto delle proprie superiori facoltà intellettuali: per lui la scienza èlo sport preferito che gli permette di vivere una vita intensa e di appagare le sue ambizioni.Ve ne sono poi anche molti i quali, unicamente a scopo utilitario vogliono portare le loroofferte all’attività del cervello.

Basterebbe che un angelo divino scacciasse dal tempio gli uomini di queste due categoriee l’edificio rimarrebbe vuoto in modo inquietante, se non ci restassero ancora alcuni uominidel passato e del presente: di questo numero fa parte il nostro Planck ed è questa la ragioneper cui lo amiamo.”

4A. Einstein, Come io vedo il mondo, Newton Compton, pag 36. Citato da P. Campogalliani.

Capitolo 1

Fermi, Pasta ed Ulam (FPU),1954: critica su basi dinamichedel principio di equipartizione

Abbiamo sottolineato nella prefazione come le presenti note non intendono co-stituire soltanto uno studio storico–critico dei lavori che hanno portato alla fon-dazione della MQ (meccanica quantistica). Per noi il problema delle relazionitra MQ e fisica classica è un tema di ricerca della fisica e della matematica attuali,ancora aperto. In effetti esso era sempre rimasto aperto, perché era aperto nellamente di Einstein, e sarebbe veramente ridicolo attribuire la sua insoddisfazioneper la interpretazione che egli stesso chiamava ortodossa, alla stupida cocciutag-gine di un povero vecchio. Vedremo ora come il problema venne riaperto cometema di ricerca attuale, da Fermi, nel 1954, l’anno stesso della sua morte.

È questo un esempio davvero adatto per illustrare che cosa intendiamo quan-do diciamo che ci occupiamo di fondamenti della MQ. Non ci interessa affattoche cosa faccia il gatto di Schrödinger, se sia vivo o se sia morto prima che lo osser-viamo, o se sia vero o no che nell’esperimento delle due fenditure un elettroneinterferisca con se stesso. Queste sono questioni, potremmo dire, di carattereideologico, che non toccano le regole che la MQ detta per riprodurre i risultatidi esperienze fisiche concrete, come la figura di interferenza nel caso dell’espe-rienza delle due fendituire, o la curva del calore specifico dei solidi in funzionedella temperatura. Sulla validità di queste regole nessuno (a partire da Einstein)discute. Quello che ci interessa è di stabilire se sia proprio vero che la fisica classi-ca fallisca in relazione alle esperienze fisiche concrete di tale tipo che hanno datoorigine alla MQ. In altri termini, i problemi matematici che si presentano nel cal-colare le qunatità di interesse fisico sono così formidabili, che al momento non èchiaro quali predizioni la meccanica classica faccia nei regimi in cui solitamente èsupposta fallire. È chiaro che se si riuscisse a mostrare che le previsioni classichesono molto più vicine ai risultati sperimentali di quanto comunemente ritenuto,l’intero problema delle relazioni tra meccanica classica e MQ andrebbe rivisto.

5

6 Andrea Carati e Luigi Galgani

Ad esempio, nella seconda parte mostreremo come i metodi classici permet-tano di riprodurre in modo più che soddisfacente le righe spettrali dei cristalliionici. In tal caso si tratta di un problema relativo alla seconda fase di creazionedella MQ. Per quanto riguarda invece la prima fase, di cui ora ci occupiamo, co-me esempio concreto del modo con cui procediamo, cominciamo dal problemadi Fermi Pasta ed Ulam. Qui si tratta di decidere se sia giustificato applicare ilprincipio di equipartizione dell’energia alle basse temperature. Un principio chesembrerebbe seguire dalle leggi della fisica classica, ma invece è in palese contrad-dizione, ad esempio, con i dati sperimentali sui calori specifici dei solidi alle bassetemperature.

1.1 Il lavoro FPU come lavoro di ricerca sulle relazionitra MQ e fisica classica

La ragione per cui Fermi giunse a compiere questo celebre lavoro FPU, forsel’ultimo lavoro prima della sua morte, è che, al pari di Einstein, anche egli nonamava l’interpretazione ortodossa della MQ. Questo fatto è poco noto, e vale lapena di sottolinearlo. A testimonianza di questo atteggiamento di Fermi esisteanzitutto il lavoro FPU che ora illustreremo (oltre ai tre lavori del 1923 cui accen-neremo). Esiste però anche una testimonianza personale del suo allievo EmilioSegrè. Si tratta di una conversazione che questi ebbe a Berkeley attorno al 1975con il più anziano dei presenti autori, a proposito del lavoro FPU e dei risultatiallora recenti sulle proprietà qualitative dei sistemi dinamici classici riguardantila coesistenza di moti ordinati e moti caotici (come il lavoro di Kolmogorov del1954 e quello di Hénon ed Heiles del 1964). In tale conversazione Segrè disseesplicitamente che Fermi, al pari di Einstein, non amava l’interpretazione orto-dossa. Però, a causa del suo carattere notoriamente molto schivo che lo facevarifuggire da discussioni di tipo, diciamo così, ideologico che non toccavano pro-blemi concreti della fisica,1 non amava discuterne pubblicamente, e lo confidavasoltanto ai suoi amici intimi.2

Dunque non dovrebbe sembrare strano che nel suo ultimo lavoro Fermi ab-bia toccato proprio il punto cruciale nel quale venne per la prima voltra intro-dotta la quantizzazione il 14 dicembra 1900, ovvero la crisi del principio di equi-partizione, in relazione all’energia media di un sistema di oscillatori armonici.

Infatti, lungo tutta la sua vita scientifica Fermi ebbe sempre ben fisso nellamente il fatto che il procedimento usato da Boltzmann per dedurre la sua notadistribuzione di probabilità, (la legge di MB o Maxwell–Boltzmann), da cui segue

1“Solo problemi concreti potevano dargli una immediata sensazione dell’importanza dei risultatiraggiunti”, da E. Segrè, Nota biografica su Fermi, pag. XXVII.

2Esiste tuttavia una testimonianza scritta. Si tratta del suo manoscritto, dal titolo Notes onquantum mechanics, delle lezioni tenute a Chicago nel 1954 sulla MQ. Nelle prime pagine, dopoavere introdotto l’equazione di Schrödinger, parlando della interpretazione di Born la qualifica, inmaniera apparentemente strana, come “provisional”.

Fondamenti della meccanica quantistica: FPU 7

come un corollario il principio di equpartizione dell’energia, richiede in effettiuna giustificazione dinamica. Questa gisutificazione dinamica costituisce quelloche comunemente è noto come il problema ergodico, problema che era statoposto inizialmente da Boltzmann stesso

Ribadiamolo ancora. Il procedimento con cui si deduce la distribuzione diMB (che illustreremo nel prossimo capitolo) ha carattere sostanzialmente cine-matico, perché consiste in un opportuno conteggio coinvolgente tutte le regioniaccessibili dello spazio delle fasi, senza tener conto del fatto che in tale spaziosi presentino delle barriere, dovute all’esistenza di costanti del moto diverse dal-l’energia del sistema. È questa una proprietà di tipo dinamico, che può essereposseduta da un sistema oppure no. Il problema ergodico consiste appunto nellostabilire se un sistema dinamico abbia tale proprietà, oppure no. Più precisa-mente un sistema è ergodico se su ogni superficie di energia costante quasi tuttele orbite sono dense, e la frazione di tempo che ciascuna di esse passa in ogniregione è proporzionale alla misura di quella regione. Concretamente, una con-dizione necessaria per l’ergodicità di un sistema è che non esistano integrali delmoto (o costanti del moto) oltre all’energia.3

Ora, era stato dimostrato da Poincaré che in generale (in un senso che richie-derebbe una accurata precisazione) non esistono costanti del moto diverse dal-l’energia, e dunque in generale i sistemi sarebbero ergodici. Su questo problemaFermi scrisse ben tre lavori nel 1923, mentre si muoveva tra Roma e Göttingen.

Essi sono riprodotti nel primo volume delle opere di Fermi, con una prefa-zione di Segrè a pag. 79. Queste sono le parole di Fermi, quando comincia aricordare il risultato di Poincaré: “Poincaré ha dimostrato che un sistema di equa-zioni canoniche normali, oltre all’integrale della conservazione dell’energia, non puòin generale ammettere altro integrale primo analitico uniforme e indipendente daltempo”.4 Dunque non esisterebbero altre costanti del moto, oltre l’energia.

Si noti che ad ogni costante del moto corrisponde tutta una famiglia di super-fici invarianti (superfici aventi la proprietà che, se contengono un punto, alloracontengono anche tutta l’orbita che da esso si origina). Ebbene, Fermi produceun lavoro matematico in cui generalizza il risultato di Poincaré, nel senso chenon solo non esistono altre costanti del moto (e quindi non esistono le famigliedi corrispondenti superfici invarianti), ma addirittura non esiste neppure una sin-gola superficie invariante che non sia una superficie di energia costante. Nelle sueparole: “Ci proponiamo in questo lavoro di generalizzare tale teorema dimostran-do che . . . all’infuori delle F = cost.” (F denota la funzione hamiltoniana, cioèl’energia) “non esiste in generale neanche una sola ipersuperficie . . . ”.5

3Stiamo escludendo i casi in cui esistano costanti del moto come il momento totale o il mo-mento angolare totale. Queste sono costanti del moto per un sistema isolato, ma non lo sono adesempio per un gas racchiuso in una scatola, a causa delle collisioni delle molecole con le pareti.

4J.H. Poincaré, Méthodes nouvelles de la mécanique celeste, vol. I, cap. 5.5Un punto sottile è che nel teorema di Poincaré, come in quello di Fermi, si ricercano superfici

invarianti singole, o famiglie di tali superfici, che dipendano in maniera analitica dal parametrorilevante (qui, come diremo sotto, l’energia). Invece superfici singole invarianti esistono, come ha

8 Andrea Carati e Luigi Galgani

Questi lavori sono di non facile lettura. Una critica riguardante una appli-cazione alla teoria ergodica fu rivolta da Urbanski, e Fermi subito ne riconobbela fondatezza. (pag. 97 del primo volume delle opere). Una critica venne fattaanche dal noto matematico C.L. Siegel (il maestro di J. Moser) nel 1956 (due annidopo la morte di Fermi). Ma a una successiva revisione compiuta nel 1982 6, ilrisultato di Fermi appare corretto, anzi è stato sddirittura generalizzato.

Ora, non intendiamo qui entrare in una discussione di teoria ergodica suquesti lavori di Fermi del 1923. Ci basta avere segnalato che esisteva un interes-se profondissimo di Fermi per questi problemi matematici. Si noti bene che aFermi la matematica importava solo per il contributo che può dare alla fisica.7Quindi, vogliamo sottolinearlo, tanto interesse in Fermi per questo problemaergodico non era dovuto alla “bellezza” del problema matematico, ma alla suaprofonda rilevanza fisica. E tale rilevanza fisica consiste nel poter decidere se siadavvero giustificato il principio di equipartizione, nel quale sembrava fallire lafisica classica alle basse temperature.

Questo è dunque il motivo per il quale, quando dopo la guerra ebbe per laprima volta a disposizione il computer di Los Alamos per poterlo utilizzare ascopi puramente scientifici, Fermi ne approfittò immediatamente per control-lare, aldilà di tutti i complicati teoremi matematici, se veramente la meccanicaclassica conduca alla proprietà di equipartzione dell’energia. E questo doveva es-sere controllato in una maniera che fosse la più semplice e diretta possibile, che èproprio quello che egli fece, come ora illustriamo.

1.2 Il modello FPU, e i corrispondenti modi normali dioscillazione

Il problema di interesse è dunque la distribuzione di probabilità dell’energia diun oscillatore armonico di data frequenza, e il suo valor medio. Naturalmente,l’energia di un singolo oscillatore isolato, che non interagisca con altri sistemi, èuna costante del moto, non dipende dal tempo, mantiene il valore che le è statodato inizialmente. Abbiamo invece un problema statistico, indotto dalla dina-mica, quando si ha un sistema di oscillatori interagenti mutuamente o con altrisistemi. Il caso più semplice è quello in cui si ha un sistema di N oscillatori, con

mostrato Kolmogorov, ma con regolaritá di tipo C∞ anziché di tipo analitico.6G. Benettin, G. Ferrari, L. Galgani, A. Giorgilli, An extension of the Poincaré–Fermi theorem

on the nonexistence of invariant manifolds in nearly integrable Hamiltonian systems, Nuovo Cim.72B, 137 (1982)

7E questo, nonostante il fatto che egli fosse dotato anche per la matematica. Si veda la nota a pag167 del libro di Levi Civita The absolute differential calculus, Dover (New York, 1970). Riportiamoanche da E. Segrè, Nota biografica su Fermi, pag. XXV: “Anche se ostentava talvolta un certodisprezzo per alcune forme di matematica troppo formali o poco creative . . . , se occorreva Fermi sapevadare stretto rigore matematico a una qualunque dimostrazione, e spesso accadeva che su un esempiofacesse vedere tutte le raffinatezze della critica, ma poi le abbandonava per procedere più speditamentenello svolgere una teoria”.

Fondamenti della meccanica quantistica: FPU 9

N grande, in mutua interazione, sicché in generale l’energia del singolo oscilla-tore varierà nel tempo, e addirittura si possa presumere che non esista nessunacostante del moto oltre l’energia totale del sistema. In tal caso la distribuzionedi probabilità dell’energia di ogni singolo oscillatore sarà determinata dalla di-namica, una volta assegnati i dati iniziali (posizioni e velocità) di tutti i singolioscillatori. I dati iniziali conterranno implicitamente la temperatura attraversoil valore del’energia totale iniziale (che resta costante durante il moto), anche se,in effetti, la relazione tra energia totale e temperatura è tutt’altro che ovvia. Suquesto ritorneremo in seguito.

Il modello, descritto in termini di particlelle

L’esempio considerato da Fermi et al. è quello del più semplice modello mono-dimensionale di solido, che è anche il modello discreto di corda vibrante che fustudiato per la prima volta da Lagrange a Torino nel 1759 (almeno nell’appros-simazione lineare).8 Si hanno N + 2 particelle su una retta, con le posizioni x0,xN+1 delle particelle estreme tenute fisse, mentre le posizioni x1, x2, . . . xN dellealtre sono le coordinate libere del sistema. Le interazioni sono “a primi vicini”,ovvero come dovute a molle che collegano due punti adiacenti, essendo le mollenonlineari, della forma che diremo subito. Si ha dunque una hamiltoniana

H =N∑

i=1

p2i

2+

N+1∑

i=1

V (xi − xi−1) ,

dove l’energia potenziale di ogni molla ha la forma

V (y) =y2

2+α

y3

3+β

y4

4

con due opportuni parametri α, β. Ad esempio, nel caso β = 0 le equazioni dimoto hanno la forma (per i = 1, . . . ,N )

xi = xi+1+ xi−1− 2xi +α�

(xi+1− xi )2− (xi − xi−1)

2� .

Passaggio ai modi normali di oscillazione

Questo per quanto riguarda le particelle costituenti il solido. Veniamo ora aglioscillatori armonici accoppiati. Fin dai tempi di Lagrange era noto che nel casodi forze lineari (α = β = 0), passando ad opportune nuove variabili a1, . . .aN , ilsistema risulta essere equivalente a un sistema di N oscillatori armonici indipen-denti (ovvero disaccoppiati). Si ha dunque una hamiltoniana

H0 =N∑

j=1

a2j

2+ω2

j

a j2

2

8E. Fermi, J. Pasta, S. Ulam, Studies of non linear problema, in E. Fermi, Note e memorie, lavoron. 266, vol. II, pag. 977.

10 Andrea Carati e Luigi Galgani

con equazioni di motoa j +ω

2j a j = 0 , (1.2.1)

e certe frequenze

ω j = 2 sinπ j

2(N + 1).

Per dimostrare questa cosiddetta diagonalizzazione del problema, ovvero, que-sto passaggio ai modi normali di oscillazione, basta eseguire il cambiamento divariabili lineare

a j =∑

k

xk sinπk j

N + 1. (1.2.2)

Nell’approssimazione lineare α = β = 0 le equazioni sono duqnue banali,perché ogni oscillatore si muove per conto proprio, e dunque tutte le singoleenergie E j sono delle costanti del moto. Ma le nonlinearità inducono un ac-coppiamento tra i modi normali di oscillazione, sicché le singole energie nonsono più delle costanti delle moto, e si potrebbe forse presumere che si abbia unastrana proprietà di discontinuità per cui l’energia totale resti l’unica costante delmoto, comunque piccolo sia l’accoppiamento tra gli oscillatori. Ma vedremo chequesto, in effetti, non avviene.

Ora, le equazioni nonlineari del moto per le ampiezze a j dei modi normalisono alquanto complicate, perché mentre le particelle agiscono ciascuna solo sul-le due adiacenti, invece si mostra che le ampiezze dei modi si accoppiano “tuttecon tutte”. In termini delle ampiezze dei modi le equazioni del moto, che aveva-no la forma (1.2.1) nel caso noninteragente (o imperturbato) α=β= 0, nel casoineragente prendono una forma del tipo

a j =−ω2j a j + termini di ordine superiore . (1.2.3)

Il modo piú semplice per studiare il sistema è di integrare numericamente,con opportuni metodi, le equazioni di moto per le particelle, e compiere di tantoin tanto la trasformazione (1.2.2) che fornisce le ampiezze a j dei modi normali,le corrispondente velocità e quindi anche le corrispondenti energie

E j =a2

j

2+ω2

j

a j2

2.

L’energia totale come parametro perturbativo rilevante, e la complessità delproblema ergodico. Il teorema di Kolmogorov

Bisogna dunque tenere conto della perturbazione indotta dalle nonlinearità sulleequazioni del moto per le ampiezze degli oscillatori. A tal fine occorre tenerpresente il fatto che, se l’energia totale è nulla, allora tutte le ampiezze a j e lecorrispondenti velocità sono nulle; nel caso di energia nonnulla esse tendono

Fondamenti della meccanica quantistica: FPU 11

comunque a zero quando l’energia totale tende a zero. Dunque, al diminuire del-l’energia totale in generale la perturbazione, dovuta a termini quadratici o cubicinelle equazioni di moto per le ampiezze, diventa sempre più trascurabile rispettoal termine lineare. In conclusione, l’energia totale agisce da parametro perturba-tivo, perché il sistema si riduce sempre più a un sistema di oscillatori disacoppiatiquanto più viene diminuita l’energia totale. Ma il sistema disaccoppiato è costi-tuito da N oscillatori indipendenti, e pertanto possiede N costanti del moto, lesingole energie E j dei modi normali di oscillazione.

Si capisce allora quanto sia ingenua la presunzione che il sistema possa essereergodico (nessuna costante del moto, oltre l’energia totale) per ogni valore arbi-trariamente piccolo dell’energia. Si avrebbe infatti una stranissima discontinuità:N costanti del moto per il sistema imperturbato, nessuna costante del moto (oltrel’energia totale) comunque piccola sia la perturbazione. Ci si dovrebbe attendereche si incontri invece una qualche sorta di continuità. E, in effetti, l’esistenza diuna continuità in misura (la misura dell’insieme di tutte le singole superfici inva-rianti, che risulta essere un insieme “strano”, con una struttura di tipo Cantor) èla proprietà che fu dimostrata, nel medesimo anno 1954, dal grande Kolmogorov,in un lavoro rivoluzionario che fu capito solo dopo diversi anni. Precisamente,lo capirono il suo allievo Arnold nel 1962, e prima ancora Moser nel 1961. Sipensi tuttavia che Moser usava dire che inizialmente egli non aveva dato creditoal risultato di Kolmogorov, ritenendolo forse addirittura sbagliato. Le dimostra-zioni date da questi due grandi autori furono considerate per molto anni quasiinaccessibili, fino a che venne pubblicata una dimostrazione molto semplice,9che ricalcava quella originale di Kolmogorov (che teneva quattro pagine), com-pletata con semplici elementi accessibili a studenti del terzo anno di fisica o dimatematica.

Questa breve descrizione dovrebbe fare intuire quali siano le difficoltà con-cettuali e tecniche del problema ergodico. Invece, la soluzione trovata nel lavorodi FPU fu molto semplice ed illuminante.

1.3 La scoperta di FPU: nonequipartizione dell’energia abasse energie secondo la fisica classica, e il problemadella caoticità dei moti

Premessa: il problema delle medie temporali

Per andare al cuore del problema nella maniera più semplice possibile. ci restaancora da richiamare come mai entrino in gioco delle medie temporali.

Sappiamo che esiste il principio di equipartizione, che dovrebbe essere unteorema della meccanica classica almeno se il sistema studiato ha la proprietà diergodicità. Sappiamo anche che, secondo tale prinicipio, in un sistema di oscilla-tori di fissata energia totale E , tutti gli oscillatori dovrebbero avere la medesima

9G. Benettin, L. Galgani, A. Giorgilli. J.M. Strelcyn, Nuovo Cim.

12 Andrea Carati e Luigi Galgani

energia media

E j 'EN

, j = 1, . . . ,N .

Qui, anzitutto, occorre precisare cosa si deve intendere per energia media.Fin dai tempi di Boltzmann, e poi quelli successivi di Einstein e di Poincaré, tuttierano d’accordo che si dovesse fare riferimento alla media temporale. Conside-riamo un sistema dinamico in uno spazio delle fasi, denotiamo con z un puntogenerico di tale spazio, e con Φt (z) il suo evoluto temporale secondo la assegnatadinamica. Allora per le energie E j degli oscillatori, come per ogni altra variabiledinamica, la media temporale fino al tempo t è definita

E j =1t

∫ t

0E j (Φ

s (z))ds .

Come si vede, la media temporale dipende dal tempo t di osservazione, e dalpunto iniziale z. Se il sistema è ergodico, la media temporale ammette limiteper t →∞ e il limite non dipende dal punto iniziale z. Naturalmente, non èaffatto chiaro cosa si debba intendere fisicamente per “limite infinito del tempodi osservazione”. È questo un punto cruciale, riguardante il cosiddetto tempo dirilassamento, che studieremo nell’ultimo capitolo di questa prima parte delle no-te. Si ammette che dopo un tempo opportuno (tempo di rilassamento) la mediatemporale diventi costante, non dipenda più dal tempo. L’altro elemento (relati-vo al punto iniziale z ) è veramente cruciale, ed è quello che riguarda la possibileesistenza di altre costanti del moto o di altre superfici invarianti: il valore di equi-librio (quello su cui si è eventualmente stabilizzata la media temporale) non devedipendere dal punto iniziale z. Qui si sottintende che si tratta sempre di punti diuna certa superficie di energia, relativa ad un fissato valore dell’energia totale E ,

Nonequipartizione a basse energie (FPU) vs equipartizione ad alte energie(Izrailev e Chirikov, 1966)

Detto tutto questo, il principio di equipartizione prevede che le medie tempo-rali di tutte le energie E j , oltre ad essersi rilassate nel tempo ed avere un valoreindipendente dal punto iniziale z, siano anche uguali tra di loro. Per questo siparla di equipartizione. L’energia (in media temporale) non dipende dal modonormale, in particolare dalla sua frequenza. Si ha democrazia, tutte le frequenzehanno lo stesso share di energia.

Possiamo ora andare al cuore del problema, e questo lo facciamo rinuncian-do per un momento a riportare i fatti come si sono succeduti in ordine storico,mescolando il contributo di FPU e quello successivo, del 1966, di Chirikov (o diIzrailev e Chirikov). Guardiamo le due figure (1.1) e (1.2) qui sotto.10 Entrambesi riferiscono a un sistema FPU con N = 32 e valori dei parametri α =β= 1/4,

10Si veda A. Carati, L. Galgani, A. Giorgilli, Dynamical Systems and Thermodynamics, inEncyclopedia of Mathematical Physics, Elsevier (Oxford, 2006).

Fondamenti della meccanica quantistica: FPU 13

Figura 1.1: Equipartizione delle energie dei modi (in media temoprale) ad alteenergie

ma a due diversi valori dell’energia totale E (e dunque del parametro perturba-tivo): precisamente E = 10 nella prima ed E = 0.05 (un valore duecento voltepiù piccolo) nella seconda. Il punto iniziale z in entrambi i casi corrisponde adassegnare tutta l’energia iniziale solo al primo modo normale (quello con la fre-quenza minima). Entrambe le figure riportano, in funzione del tempo (in certeunità che qui non ci importano), le medie temporali delle energie E j di 8 fra i 32modi normali del sistema.

Nella prima figura, ad energia alta, si vede che, al passare del tempo, tutte leenergie medie, partendo dai valori iniziali considerati (nulli per tutti i modi tran-ne il primo), vengono poi a formare un fascio sempre più stretto, fino a rilassaretutte ad un valore sostanzialmente unico (il valore di equipartizione, appunto).Si potrebbe mostrare che il risultato finale non cambia se si prende un’altra con-dizione iniziale alla stessa energia, ad esempio tutta l’energia assegnata solo almodo più alto (quello di massima frequenza).

Invece, nella seconda figura, corrispondente a un valore duecento volte piùpiccolo dell’energia, le cose sono completamente diverse. Ogni energia va perconto proprio. L’energia, data inizialmente solo al primo modo, passa ancheagli altri, ma poco (si potrebbe vedere che le energie degli altri modi decresconoesponenzialmente al crescere della frequenza). La cosa interessantissima è che

14 Andrea Carati e Luigi Galgani

Figura 1.2: Nonequipartizione a basse energie

ciononostante si ha ancora un rilassamento, perché le medie temporali rilassanotutte a valori costanti entro il tempo di osservazione, anche se ciascuna a unvalore diverso. È stato dunque ancora raggiunto uno stato di equilibrio (o forsedi metaequilibrio? si veda l’ultimo capitolo di questa prima parte), che tuttavianon è più lo stato di MB. Questa è la grande scoperta di Fermi e compagni.A energia sufficientemente bassa esiste ancora una statistica classica, perché si èavuto un rilassamento, ma non è più quella di MB. Nessuno è ancora in grado didescriverla, ma certo non è quella che conduce alla legge di Dulong e Petit peril calore specifico dei solidi. Nelle parole di Ulam, riportate nella sua prefazioneal lavoro FPU nei Collected Papers di Fermi: “The results of the computations wereinteresting and quite surprising to Fermi. He expressed the opinion that they reallyconstituted a little discovery in providing intimations that the prevalent beliefs in theuniversality of mixing and thermalization in nonlinear systems may not be alwaysjustified.”

Fondamenti della meccanica quantistica: FPU 15

1.4 Il contributo di Chirikov: la congettura sulla sogliadi caoticità al limite termodinamico

Torniamo ora per un momento alla parte storica: la seconda figura riportatasopra è sostanzialmenet l’ultima figura del lavoro originale FPU. In molte pre-cedenti figure tali autori riportano l’andamento dei valori istantanei delle ener-gie dei vari modi in funzione del tempo, e solo nell’ultima sono riportate lemedie temporali.11 Ma l’ultima figura, sostanzialmente quella qui riportata, ècertamente il cuore del loro risultato.

Il lavoro, inizialalmente, non ebbe molto seguito, se non per gli studi di Kru-skal, Zabusky ed altri, attorno all’anno 1966, in cui essi presero spunto dal lavoroFPU per fare interessantissime digressioni sull’esistenza di solitoni, che aprironola via a moltissimi lavori riguardanti la dinamica dei sistemi hamiltoniani ad infi-niti gradi di libertà, che è uno dei temi di ricerca oggi più studiati in matematica(equazioni di Korteweg de Vries ecc.)

L’intervento di Chirikov: la soglia di caoticità

Il problema fisico che stava a cuore a Ferni venne invece ripreso, come problemarilevante, dal fisico russo Boris Chirikov. Egli si rese subito conto dell’interessegrandissimo del lavoro, per il fatto che esso sembrava sconvolgere le convinzionidi tutta la comunità scientifica (ma non di Einstein e di Fermi) sulle relazioni traMQ e fisica classica. L’equipartzione non sarebbe una conseguenza della fisicaclassica a basse energie.

Di fronte a tale situazione Chirikov fece anzitutto anch’egli una rilevantescoperta, complemenatare a quella di FPU, e inoltre pervenne a formulare unacongettura che permettesse di sistemare le cose nella maniera tradizionale che tut-ti desideravano, in modo cioè che il paradosso FPU (così potremmo chiamarlo)venisse eliminato.

La scoperta di Chirikov è implicitamente quella che abbiamo illustrato nellaprima figura. Il fatto è che FPU avevano condotto i loro calcoli per un solo,ben fissato, valore dell’energia. Noi siamo certi che Fermi, se fosse vissuto piùa lungo, avrebbe provveduto egli stesso a colmare questa lacuna. Il grande me-rito della nuova scoperta, dunque, va tutto a Chirikov e ai suoi collaboratori,in particolare a Izrailev, che scrisse con lui il lavoro del 1966. SostanzialmenteChirikov comprese che il paradosso FPU deve scomparire per energie inizialisufficientemente alte. Diciamo che, avendo fissato il tipo di condizioni iniziali,ad esempio tutta l’energia iniziale data al primo modo, deve esistere una soglia dienergia, sopra la quale si ha equipartizione, mentre non si ha equipartizione perenergie inferiori. La prima figura sopra riportata mostra che questo è sostanzial-mente vero. Ad una energia 200 volte più alta di quella relativa alla prima figura,abbastanza rapidamente si ha equipartizione.

11Si noti che il lavoro fu scritto da Pasta ed Ulam nell’anno 1955, dopo la morte di Fermi. Nelloscritto si notano delle insistenze su certi aspetti matematici, sicuramente dovute ad Ulam.

16 Andrea Carati e Luigi Galgani

La congettura di Chirikov

Si presenta allora tutta una serie di problemi su come dipende la soglia dalla for-ma dei dati iniziali. Ma di questo qui non ci occupiamo, e veniamo alla grandeidea di Chirikov. L’osservazione cruciale è che per la termodinamica statisticanon importano le quantità cosiddette estensive, come l’enrgia totale E del si-stema, ma solo quantità intensive. Dal punto di vista matematico, importa ilcosiddetto limite termodinamico, cioè il limite N →∞ in cui però si tenganofissati i valori specifici di energia e volume, E/N , V /N .

Dunque, avendo stabilito che per un sistema di N oscillatori esiste una ener-gia di soglia o energia critica E c , la quantità di interesse è la corrispondenteenergia specifica E c/N . Chirikov formula la congettura che

E c/N → 0 per N →∞ ,

ovvero che nel limite termodinamico il sistema sia sostanzialmente sempre cao-tico. In questo modo, da grande fisico teorico, egli da una parte comprende ilsignificato profondo dell’esistenza del paradosso FPU, e dall’altra si inventa unmodo in cui possa avvenire che tale paradosso sia fisicamente irrilevante. In talemodo, tutti possono stare tranquilli, e dare per assodato che, dove nacque la MQcon i suoi nuovi metodi inconciliabili con i principi classici, veramente la fisicaclassica fallisce.

La stima della soglia di Chirikov, come problema aperto

Chirikov e i suoi collaboratori diedero alcune indicazioni, sia numeriche chesemianalitiche, che sembravano confermare la suddetta congettura. Nel 1971 in-tervenne la scuola di Milano e Pavia, con un lavoro di Bocchieri, Scotti e Loingerin cui si davano fortissime indicazioni numeriche a favore della persistenza dellasoglia in energia specifica, che appariva sostanzialmente non cambiare per N checresce da 10 fino a 100.

Successivamente intervennero altri studiosi da Padova, Roma, Firenze, daBerkeley e dal Brasile, i cui risultati sembravano talvolta supportare la persistenzadella soglia al crescere di N e altre volte venivano interpretati come indicanti ilcontrario.

Ci si doveva allora rivolgere a studi analitici, utilizzando i metodi classici del-la teoria delle perturbazioni, perché la persistenza di moti ordinati al crescere delparametro perturbativo è, potrebbe dirsi, il cuore stesso della teoria perturbati-va. Una teoria che svolge “da sempre” un ruolo fondamentale nella meccanicaceleste e in meccanica analitica, e ha avuto un ruolo rilevante anche per i fon-damenti della meccanica quantistica, negli anni di poco precedenti il 1925. Adesempio nel circolo di Göttingen il capo (Born) aveva affidato ad Heisenberg ilcompito di studiare il classicissimo libro di Poincaré in tre volumi Les méthodesnouvelles de la mécanique celeste. Nell’ambito di problemi di tipo FPU il massi-mo sforzo di utilizzare metodi di tipo classico venne compiuto da D. Bambusi.

Fondamenti della meccanica quantistica: FPU 17

Egli fu in grado di ottenere un risultato nel limite N →∞, ma al costo di doveretenere finita l’energia totale E , sicché l’energia specifica di soglia si annullava allimite termodinamico. Questo fatto venne interpretato da molti come una indi-cazione che al limite termodinamico si potessere avere solo moti caotici, e quindiequipartizione.

A questo punto venne compiuto un nuovo passo significativo, mostrando co-me si possano applicare i metodi perturbativi al limite termodinamico, non insenso classico, ma in senso statistico. Il punto è che nei metodi classici si mira acontrollare i dati iniziali uniformemente in tutto lo spazio delle fasi (ad esempioa fissata energia). Ma è ben noto che esistono dei dati inziali molto speciali in cuile perturbazioni sono tanto grandi da non permettere delle stime uniformi al cre-scere di N . La nuova idea fu allora di ricercare un risultato più debole, che fosseperò significativo per la meccanica statistico. Si tratta di rinunciare a controllaretutti i dati iniziali, controllando solo il comportamento di opportuni valori me-di, calcolati ad esempio usando la misura di Gibbs. In tal modo è stato possibileottenere risultati che valgono uniformemente in N per grandi N , e garantisconouna forma di stabilità dei moti su tempi finiti. Ad esempio nel senso che finoa quei tempi restano diverse da zero le autocorrelazioni temporali di significa-tive funzioni.12 Sulla rilevanza di tali autocorrelazioni torneremo nell’ultimocapitolo di questa prima parte. Come si vede, si tratta di problemi abbastanzacomplicati. Ma in ogni modo il problema della persistenza del paradosso FPU allimite termodinamico, con le sue evidenti implicazioni per le relazioni tra MQe fisica classica, è ormai ridotto a un problema matematico ben definito. E ab-biamo fiducia che troverá presto una soluzione, favorevole alla persistenza delparadosso FPU al limite termodinamico.

Nota biografica su Fermi. Enrico Fermi nacque a Roma il 17 Settembre 1901 e morı`a Chicago il 29 Novembre 1954, poco dopo avere compiuto il 53–esimo anno. Nel 1938le leggi razziali del fascismo, che colpivano la moglie Laura Capon e i figli, e che ripu-gnavano al suo senso morale, lo indussero ad emigrare negli Stati Uniti d’America. Cosìsi esprime Emilio Segrè nella bellissima nota biografica scritta all’inizio del primo volu-me delle Note e Memorie (collected papers), dove giustamente dà il seguente commentoriassuntivo (pag. XLV): “Con lui si spense l’ultimo fisico universale nella tradizione deigrandi del secolo XIX, quando era possibile a una persona sola raggiungere i culmini più altidella teoria e dell’esperimento e dominare tutti i campi della fisica “. Tra i fatti significativie curiosi della vita di Fermi citati da Segrè riportiamo il seguente: “A dieci anni il fattoche il cerchio fosse rappresentato dall’equazione x2 + y2 = r 2 gli aveva dato moltissimo dapensare e creato serie difficoltà“.

12A- Carati, J. Stat. Phys. 128, 1057 (2007).

18 Andrea Carati e Luigi Galgani

Capitolo 2

Boltzmann e la termodinamicastatistica: la crisi del principio diequipartizione

2.1 Le teorie cinetiche e la scoperta di Clausius: l’in-terpretazione meccanicistica della pressione e dellatemperatura

Che la materia sia costituita di atomi e molecole appare oggi quasi ovvio, e si faanzi fatica a comprendere che le cose non stessero in questo modo alla fine dell’ot-tocento, quando erano numerosi gli scienziati antiatomisti, ovvero continuisti (oenergetisti, come allora si diceva).

Atomisti e antiatomisti nella seconda metà dell’ottocento. Da una parte si trovavanogli antiatomisti, tra cui Lord Kelvin e Planck stesso (oltre a Mach, Ostwald – premioNobel per la chimica – e molti altri), dall’altra gli atomisti, con Clausius, Maxwell,Boltzmann e Lord Rayleigh.

Per quanto riguarda il caso paradigmatico di Planck, si usa parlare di una sua “conver-sione” alla concezione atomistica e ai procedimenti statistici. Questa ebbe luogo proprioquando egli si rese conto (14 dicembre 1900) che la sua legge (che diede appunto originealla MQ), che egli aveva dapprima ottenuto per via empirica (19 ottobre 1900), potevainvece essere giustificata facendo uso di procedimenti ispirati a quelli statistici di Boltz-mann. Ma prima era decisamente contrario.1,2 Si capisce così come mai sia stato Planck

1Alcune citazioni in proposito sono riportate in P. Campogalliani, La ragione sommersa, FrancoAngeli (Milano, 2007), specialmente pag. 113. Si veda inoltre il libro di Kuhn, ed anche S. Brush,in The kind of motion we call heat.

2Inoltre, il fatto che la concezione atomistica fosse tutt’altro che ovvia fino ai lavori di Planck edEinstein, è documentato ad esempio anche da titolo che Nernst – forse il più grande chimico fisicodel volgere del secolo, cui è dovuto, tra le altre cose, anche il terzo principio della termodinamica– scelse per il suo celebre libro di chimica teorica, ovvero: “Chimica teorica dal punto di vista dellateoria di Avogadro e della termodinamica’, del 1893. È disponibile la traduzione inglese W. Nernst,Theoretical Chemistry from the standpoint of the Avogadro rule and thermodynamics, MacMillan

19

20 Andrea Carati e Luigi Galgani

stesso ad introdurre la cosiddetta costante di Boltzmann kB definita da

kB = R/NA

dove R è la costante dei gas (quantità macroscopica) ed NA il numero di Avogadro,che costituisce l’emblema stesso della concezione atomistica. Ad esempio, fino al 1917Einstein continua a scrivere R/NA (veramente, R/N ), come prima faceva Boltzmannstesso.

L’emergere della teoria atomistica

Che debbano esistere delle teorie dei continui è ben naturale, perché le esperienzeordinarie ci portano ad esprimerci in termini di campi, ovvero quantità (scalari,vettoriali o tensoriali) funzioni del posto, cioè del vettore posizione x. Ad esem-pio abbiamo la densità di materia ρ(x), connessa alla massa M (V ) contenuta inun volume V dalla relazione M (V ) =

V ρ(x)d3x e analogamente le densità dicarica e di corrente. il campo di velocità v(x) di un fluido, il campo elettrico E(x),e così via. La prima efficace teoria dei continui fu introdotta fin dal 1750, con l’e-quazione della corda vibrante di d’Alembert, seguita dalla trattazione di Lagrangedel 1759 in cui l’equazione di d’Alembert venne ritrovata con una operazione di“passaggio al continuo” a partire da una trattazione con elementi discreti. Vi fu-rono poi le analoghe teorie della elasticità in materiali tridimensionali e le teoriedei fluidi perfetti di Eulero e dei fluidi viscosi di Navier–Stokes. Poi la teoriadel campo elettromagnetico di Maxwell, e infine la teoria della gravitazione diEinstein.

D’altra parte, per non risalire ad Epicuro e a Lucrezio, la concezione cor-puscolare in tempi moderni risale a Galileo e Newton, il quale ad esempio op-pose la sua teoria corpuscolare della luce a quella ondulatoria di Huygens. Unasvolta cruciale si verificò poi nell’ambito della chimica, con la legge di Daltondelle proporzioni multiple. Il fatto che nelle esperienze coinvolgenti reazioni traquantità macroscopiche (litri o chili, quantità della vita ordinaria) di sostanzediverse si riscontrasse che le varie sostanze reagiscono in rapporti di materia bendefiniti, venne “spiegato” da Dalton ammettendo che la materia fosse compostada corpuscoli (atomi) che si combinano tra loro a formare molecole. Infine, larelazione tra mondo macroscopico e mondo microscopico (quello degli atomie delle molecole) venne data nel 1811 da Avogadro, quando egli concepì comesi possa determinare il numero di molecole contenute in una definita quantitàmacroscopica di materia.3

Nacque in tal modo il numero di Avogadro, ovvero il numero di molecole(eventualmente monoatomiche) contenute in una mole di sostanza. La nozionedi mole è alquanto sottile, anche se l’idea centrale è abbastanza semplice. La dif-ficoltà che si incontrava consisteva nella differenza che si riscontrava tra numero

(London, 1895).3Un buon riassunto si trova nelle prime pagine del libro M. Born, Atomic Physics, Dover (New

York, 1969), che costituisce un gioiello come introduzione alla fisica atomica.

Fondamenti della meccanica quantistica: Boltzmann 21

atomico e peso atomico, ovvero nel fatto che i numeri che si incontrano con-cretamente nella legge delle proporzioni multiple per le reazioni chimiche sonoprossimi, ma non esattamente uguali, a numeri interi. Dopo il 1932, anno dellascoperta del neutrone, sappiamo che questa differenza è dovuta alla presenza diisotopi, ovvero al fatto che nel nucleo di un atomo (con numero atomico indi-viduato dal numero di protoni – uguale al numero di elettroni) sono presentianche dei neutroni, e che l’abbondanza relativa dei vari isotopi determina il pesoatomico di una data specie atomica. Ma riuscire a cavarsela in una simile situa-zione senza sapere dell’esistenza dei neutroni (e addirittura del nucleo, scopertoda Rutherford nel 1911) doveva risultare abbastanza difficile.4

Per il numero di Avogadro, che denoteremo con NA, il valore oggi “consiglia-to” è 5,6

NA= 6.02 · 1023 . (2.1.1)

Analogamente, per la costante dei gas il valore “consigliato” è

R= 8.314× 107 (c g s)≡ 8.314 (mk s) . (2.1.2)

sicché per la costante di Boltzmann kB = R/NA si ha

kB = 1.380× 10−16 e r g/K = 1.380× 10−23 J/K .

4Sostanzialmente, si può pensare al numero di Avogadro come al numero di atomi contenutiin un grammo di idrogeno in forma atomica. Questa è in effetti la primitiva definizione intro-dotta da Dalton, e anche quella cui si riferiva sempre ad esempio, almeno fino al 1910, Einsteinstesso. In effetti, le cose sono un po’ più complicate, ed è giusto essere più precisi, avendo peròl’accortezza di non perdere con tale precisione la intuizione fondamentale che sta dietro alla de-finizione. Il problema è che l’idrogeno non è comodo come sostanza di riferimento, perché hapoca disposizione alle combinazioni chimiche. Inoltre, in condizioni ordinarie l’idrogeno si trovain forma molecolare, come molecola biatomica H2. Dunque, dopo la proposta di Dalton di fareriferimento all’idrogeno in forma atomica, in un secondo tempo Berzelius propose di prenderecome riferimento l’ossigeno ponendo il suo peso atomico convenzionalmente pari a 100. In segui-to si venne ad un compromesso con la scelta di Dalton, tenendo l’ossigeno come riferimento maattribuendogli peso atomico esattamente 16, sicché il peso atomico dell’idrogeno (pur non essendointero, a causa alla presenza dei suoi isotopi) rimaneva in ogni caso molto prossimo ad 1. Infine,si pervenne alla convenzione di fare riferimento all’isotopo del Carbonio–12, definendo il nume-ro di Avogadro come “il numero di atomi contenuti in 12 grammi dell’isotopo del carbonio dettoCarbonio–12”. Dunque per definizione una mole di Carbonio–12 pesa 12 grammi. Analogamenteper le moli delle altre sostanze.

5Ricordiamo che il numero di Avogadro venne determinato in maniera notevolmente precisaper la prima volta da Planck, nel lavoro del 14Dicembre 1900 – precisamente nell’ultimo paragrafo,dove lo denota con 1/ω – , proprio sulla base della sua legge per il corpo nero, e poi da Einsteinnei suoi lavori successivi.

6È importante cercare di raffigurarsi l’enormità di questo numero, che fa da ponte tra mondomicroscopico e mondo macroscopico. In un manuale per studenti americani questo viene descrittonel modo seguente. Se ci raffiguriamo una molecola come una pallina da ping pong, allora unnumero di palline dell’ordine di NA ricoprirebbe la superficie degli Stati Uniti da oceano ad oceano,con uno strato dello spessore di qualche metro.

22 Andrea Carati e Luigi Galgani

Il teorema di Clausius

Il primo grande successo della teoria atomica avvenne in relazione alle teoriecinetiche, e fu la “spiegazione” della legge dei gas perfetti mediante una interpre-tazione meccanicistica della pressione e soprattutto della temperatura. Questo fucompiuto in due passi, di cui il primo fu il teorema di Clausius, e il secondo fu ilteorema di equipartizione dell’energia, dovuto a Maxwell e Boltzmann.7 In effet-ti, come vedremo, il teorema di equipartizione da una parte conferma ed estendeil teorema di Clausius. Ma d’altra parte costituisce l’inizio della crisi della fisicaclassica quando viene applicato ai gradi di libertà “interni” delle molecole (rota-zioni e vibrazioni) dove fallisce qualitativamente a basse temperature. e alle altefrequenze, e soprattutto nel caso del corpo nero.

Ma andiamo con ordine, e iniziamo con la legge dei gas perfetti e il teoremadi Clausius.

La legge dei gas perfetti

Tutti conosciamo la legge dei gas perfetti

pV =N RT , (2.1.3)

che lega pressione p, volume V , temperatura (assoluta) T , numero di moli N ,mentre R è la costante dei gas. Anzi, sappiamo anche che furono proprio le pro-prietà termodinamiche dei gas che condussero all’introduzione della temperaturaassoluta T a partire da quella empirica, confrontando l’incremento del prodottopV con quello della temperatura empirica, e giungendo in tal modo a trovare ilcelebre numero 273, che conduce ad “inventare” la nozione di “zero assoluto”.8É proprio il prodotto pV per un gas ideale (riferito ad una mole e diviso per lacostante R) a definire la temperatura.

In particolare tale legge dei gas comporta che, se si fissano volume V , tem-peratura T e numero di moli N , la pressione è la medesima per tutti i gas (nellimite di gas ideali), indipendentemente dalla struttura (in particolare la massa)delle molecole costituenti. Conta solo il numero di molecole. Questo è il cuo-re della concezione di Avogadro. La dimostrazione di questa proprietà (che oraricostruiremo), e l’esperienza della meraviglia che essa suscita, è un utilissimoesercizio per entrare nello spirito delle teorie cinetiche. Si pensi alla meravigliache si prova nel comprendere come, a fissati volume e temperatura, la pressio-ne raddoppia se si verifica la dissociazione di una sostanza biatomica (perchéraddoppia il numero di costituenti).9

7Una raccolta degli articoli rilevanti della teoria cinetica può essere reperita nel già citato libroS. Brush, The kind of motion we call heat.

8W. Nernst, Theoretical Chemistry, pag. 31–32.9Questo è appunto uno dei fenomeni principali per cui si impose “l’ipotesi” di Avogadro. Si

tratta delle difficoltà che si presentava nelle cosiddette densità di vapore anomale, che si presenta-no nei procedimenti di determinazione dei pesi molecolari di molecole complesse. Ad esempio,

Fondamenti della meccanica quantistica: Boltzmann 23

Il teorema di Clausius nel modello delle molecole trattate come punti mate-riali.

Prima di considerare il caso generale di un gas perfetto costituito di molecole,cominciamo a considerare il modello prototipo di un gas che sia privo di gradi dilibertà interni, ovvero sia costituito di atomi trattati come punti materiali (chehanno dunque come uniche proprietà caratteristiche la posizione e la massa10)Ricordiamo che un gas si dice perfetto o ideale se sono nulle le forze mutue trale molecole che lo costituiscono: le uniche forze sono quelle esercitate sui puntidalle pareti. In questo caso il teorema ha la forma data sotto.11

Teorema di Clausius (per un gas perfetto costituito di punti materiali). Perun gas perfetto costituito di punti materiali di massa mi si ha

pV =23

K , (2.1.4)

dove K è l’energia cinetica totale

K =∑

i

12

mi v2i . (2.1.5)

Qui la barra denota una opportuna media sui dati iniziali, mentre la pressione vieneidentificata come una media temporale della forza esercitata da una parete sui puntiche collidono con essa.

Diamo qui uno schizzo della dimostrazione, indicando quale è l’idea centrale;in particolare, procediamo “alla garibaldina” per quanto riguarda il procedimentocon cui si eseguono le due medie che riguardano la pressione e l’energia cinetica.12Per una migliore formalizzazione, che fa uso del teorema del viriale (di Clausius),si vedano ad esempio le nostre lezioni di Meccanica Analitica 2.

Idea della dimostrazione. Consideriamo un sistema di N punti materiali di massa mche rimbalzano elasticamente tra pareti opposte di un cubo di lato L.

1. Problema delle medie sui dati iniziali. Un primo punto riguarda la scelta dei datiiniziali (posizione e velocità di tutti gli atomi). È chiaro che si porebbero considerare datiiniziali in cui tutti gli atomi hanno velocità dirette in una stessa direzione, ad esempio ladirezione mormale a due pareti opposte. Ma è evidente che questi sono casi eccezionali.

tipicamente per il cloruro di ammonio si trova che esso appare avere una densità uguale a circala metà di quella calcolata secondo la formula N H4C l . Di fronte a questa difficoltà, quasi con-temporaneamente, Cannizzaro (1857), Kopp (1858) e Kekule (1858) fecero osservare che le bassedensità di vapore debbono essere spiegate come corrispondenti a un minore o maggiore grado didissociazione. Si veda W. Nernst Theoretical chemistry, pag. 30 e pag. 301.

10Ad esempio, se si considerano gli atomi come delle sfere rigide (una buona approssimazionead esempio per i gas nobili), ciò vuol dire che stiamo trascurando le rotazioni.

11Si veda L. Boltzmann, Lectures on Gas Theory. Dover ed.. Introduzione, sec.2, pag. 104 seg.12Su questo punto ritorneremo ripetutamente nel seguito. Molto interessante a questo proposito

è la lunga discussione tra diversi autori, in particolare tra Einstein e Poincaré. che seguì allarelazione che Einstein tenne alla prima conferenza Solvay. (si veda la riproduzione e traduzionenella raccolta italiana di opere scelte di Einstein.)

24 Andrea Carati e Luigi Galgani

Nei casi generici, o, come si dice, per dati iniziali tipici, si avrà una densità uniforme, einoltre le velocità saranno orientate in maniera isotropa. Problemi di questo tipo sonoquelli affrontati da Maxwell e Boltzmann, sui quali ritorneremo in seguito. Qui saremointeressati alla seguente proprietà, che ammetteremo come plausibile. Se prendiamo assiortogonali paralleli agli spigoli del cubo, e denotiamo con vi x la componente x dellavelocità della i–esima particella, e consideriamo la energia cinetica Kx lungo l’asse x eanalogamente Ky , Kz , dove

Kx =N∑

i=1

12

mv2i x Ky = . . . , Kz = . . . ,

allora, per dati iniziali tipici queste tre quantità saranno uguali, o meglio, il loro valormedio rispetto a dati iniziali distribuiti in maniera tipica saranno uguali, ovvero si avrà(denotando la media con una sopralineatura)

Kx =Ky =Kz =13

K (2.1.6)

doveK =Kx +Ky +Kz

è l’energia cinetica totale. Si noti che le funzioni del tipo dell’energia cinetica totale sidicono “funzioni di tipo somma”, perché definite come somme, estese a tutte le particelle,della medesima quantità relativa a ogni singola particella. Sono funzioni di questo tipoquelle che intervengono nella identificazione di quantità termodinamiche in termini diquantità meccaniche.13 14

2. Definizione meccanica della pressione come media temporale. La pressioneè la forza (per unità di area) esercitata da una parete su tutti gli atomi per obbligarli arimbalzare quando la incontrano. Si pensi al caso significativo di una forza a breve range,che si annulla a distanze piccolissime dalla parete. Possiamo pensare al caso ideale di unaforza di “tipo deltiforme”, detta anche forza impulsiva, che è diversa da zero (in effettiinfinita) solo sulla parete.15

Il punto significativo è comunque che la la forza di pressione è una quantità estrema-mente fluttuamte nel tempo, essendo dovuta alle collisioni con le numerosissime parti-celle costituenti il gas. Quindi la pressione deve essere pensata come la media temporaledelle forze che la parete esercita su tutte le particelle.16 Considerando la pressione eser-citata da una delle pareti ortogonali all’asse delle x parete (diciamo quella destra), sedenotiamo con F e x t

i x (s) la componente x della forza esercitata al tempo corrente s sulla

13Si veda Khinchin. . . . .14Se i dati iniziali su cui si media non sono ditribuiti in modo appropriato – ovvero, come si

dice, se lo stato iniziale non è uno stato di equilibrio, il tempo necessario perché si raggiungal’equilibrio puó essere incredibilmente lungo. Un esempio che riguarda proprio le collisioni dipunti materiali con le pareti di un cubo, come quello qui considerato, fu studiato dal grandePoincaré in un articolo del 1906.

15Ovvero una forza F con la propreità

F (t ) = f δ(t − t ∗) , f = costante .

se t ∗ è l tempo al quale avviene l’urto con la parete.16La prescrizione di dovere compiere una media temporale, viene provata (almeno nella

sostanza), nella trattazione di Boltzmann data nel suo libro.

Fondamenti della meccanica quantistica: Boltzmann 25

particella i–esima,17 definiamo allora la pressione, valutata fino al tempo di osservazionet , mediante la relazione

L2 p(t ) =1t

∫ t

0

i

F e x ti x (s)ds .

Notiamo di passaggio che convenzionalmente si considera la pressione una quantità po-sitiva. Quindi, avendo stabilito quale sia la parete di cui vogliamo calcolare la pressioneesercitata sul gas, orentiamo l’asse ad essa normale in modo tale che la forza esercitatadalla parete sia positiva.

Cominciamo a considerare il contributo p (i) dovuto agli urti con la particella i–esima,

L2 p (i)(t ) =1t

∫ t

0F e x t

i x (s)ds .

Il calcolo dell’integrale temporale della forza, ossia della quantità

Ii x (τ1,τ2) =∫ τ2

τ1

F e x ti x (s)ds ,

che viene chiamato“impulso della forza”, segue immediatamente dall’equazione di New-ton (o meglio, dalla sua componemte lungo l’asse x ). Infatti, facendo l’ipotesi che l’urtosia elastico, ovvero che esso non alteri l’energia cinetica della particella, l’ipotesi chela forza abbia carattere impulsivo significa che l’unico effetto dell’urto è di invertireistantaneamemte il verso della velocità. Allora, integrando l’equazione di Newton

ddt(mvi x ) = F e x t

i x

in un intervallo di tempo (τ1,τ2) in cui avvenga uno e un solo urto con la pareteconsiderata, si ha

Ii x = mvi x (τ2)−mvi x (τ1) = 2mvi x (τ2)) .

Dunque, se al tempo iniziale t0 = 0 la particella parte dalla parete di sinistra con unaassegnata velocità vi x , l’impulso resta nullo fino al tempo di collisione con la parete didestra (che avviene al tempo L/vi x ), poi prende un valore il cui modulo è 2vi x (abbiamoorientato l’asse x verso destra, sicché la prima velocità è positiva e la seconda negativa).

È chiaro allora quale è l’andamento di Ii x (t ) dell’impulso, in funzione del tempo diosservazione t . Esso è una funzione a scalino, inizialmente nulla, che compie un salto di2mv immediatamente dopo il primo urto, al tempo t1 = L/vi x , e resta costante fino altempo t2 = t1+∆t , dove

∆t =2Lvi x

Poi il processo si ripete, e si hanno salti identici a tempi

tn = t1+ n∆t , n = 2,3, . . . . (2.1.7)

Allora la media temporale viene subito calcolata, almeno per i tempi discreti tn , a tuttii quali assume il medesimo valore valore 2mvi x/∆t (se si prende come tempo iniziale

17Veramente, la forza dipende dalla posizione della particella, ma per un assegnato movimentox = x(s) possiamo pensare la forza come funzione del tempo s .

26 Andrea Carati e Luigi Galgani

quello a cui avviene un salto). Ma per tempi lunghi il calcolo diviene esatto anche nelcontinuo, e si ha

L2 p (i)(tn) =n 2mvi x

t1+ n∆t=

2mvi x

(t1/n) +∆t'

2mvi x

∆t.

Ricordando l’espressione (2.1.7) di ∆t abbiamo dunque

L2 p (i) '2mvi x

2L/vi x=

mv2i x

L,

ovverop (i)V = 2Ki x .

Sommando sulle particelle si ottiene poi18

pV = 2Kx .

Infine, prendendo la media sui dati iniziali e usando l’ipotesi di isotropia (2.1.6), si ha lalegge di Pascal (pressione indipendente dalla direzione della paret)e, e la legge di Clausius(2.1.4), pV = (2/3)K .

Confrontando poi la relazione cinetica (2.1.4) con la legge dei gas perfettipV = N RT , si vede che il teorema di Clausius fornisce una identificazionedella quantità microscopica K (energia cinetica totale, mediata) in termini dellaquantità macroscopica T : Identificazione di Clausius

K =32N RT ≡ 3

2N kB T . (2.1.8)

In particolare, questo comporta che l’energia cinetica media di un gas (nelmodello di atomi puntiformi) sia indipendente dalla natura degli atomi: ato-mi più pesanti hanno velocità più piccole. Questo sarà confermato dai meto-di di Maxwell–Boltzmann, che permetteranno inoltre di dedurre la legge delladistribuzione delle velocità degli atomi.

Ma prima di discutere il teorema di equipartizione dell’energia, cui sarà dedi-cato un prossimo paragrafo, veniamo al problema di come si modifica il teoremadi Clausius quando si prendano in considerazione i “gradi di libertà interni”, cioèsi considerino atomi non puntiformi, oppure molecole. Apparirà allora che sul-l’energia che compete ai gradi di libertá interni il teorema di Clausius non dicenulla.

Nel caso delle molecole monoatomiche si deve tener conto del fatto che gli atomi han-no una struttura, ad esempio, nel modello più semplice concepibile, una struttura disfera rigida. Dunque, oltre alle coordinate del baricentro (o centro di massa) si avran-no tre coordinate angolari, cui corrispondono tre ulteriori termini di energia cinetica

18Si avrebbe qui un problema, perché il tempo ∆t dipende dalla velocità della particella consi-derata, e diverge quando la velocità tende a zero. Ma all’equilibrio la frazione di particelle attornoa una data velocità tende a zero con la velocità.

Fondamenti della meccanica quantistica: Boltzmann 27

(in aggiunta ai tre del baricentro). Le cose sono poi alquanto più complesse quando sivengono a considerare le molecole. Ad esempio nel caso delle molecole biatomiche sihanno tipicamente, in aggiunta ai tre termini di energia cinetica del baricentro, tre ul-teriori termini di energia cinetica e uno di energia potenziale.19 In ogni caso, il puntorilevante è che, sull’energia che compete a tutti questi termini aggiuntivi, la trattazioneche generalizza quella di Clausius appena discussa non dice assolutamente nulla. Unarisposta verrà poi data (entro opportune ipotesi) dal teorema di equipartizione. Questarisposta è soddisfacente solo parzialmente, ma in generale fallisce, e qui appunto nasceràla meccanica quantistica.

Il teorema di Clausius per le molecole

Per fissare le idee, consideriamo il caso di N molecole identiche, ciascuna costi-tuita di n atomi. Essendo interessati alla “spiegazione” dell’equazione di stato deigas perfetti che coinvolge (oltre al numero di moliN , al volume V e alla tempe-ratura T ) la pressione p, concentriamoci ancora sulle interazioni che le singolemolecole hanno con una parete, trascurando di discutere le mutue interazioni trale molecole (sul ruolo delle quali torneremo in un prossimo paragrafo).

Denotiamo con xi s il vettore posizione dell’s–esimo atomo della molecolai–esima. Allora il moto della molecola sotto l’azione delle forze esterne dellaparete e delle forze mutue tra i diversi atomi della molecola considerata ha laforma del sistema di n equazioni

mi s xi s =∑

s ′ 6=s

Fi s ,i s ′ +Fe x ti s s = 1, . . . , n ,

dove Fi s ,i s ′ sono le forze “interne” agenti sull’atomo s della molecola i–esimaconsiderata (dovute agli altri atomi s ′ 6= s della stessa molecola), e Fe x t

i s le forze“esterne” sui singoli atomi della molecola dovute alla parete.

A questo punto si tiene conto del risultato fondamentale della meccanica deisistemi di punti, ovvero del teorema del baricentro. Questo si ottiene sommandotermine a termine tutte le equazioni di Newton, tenendo conto del principio diazione e reazione e della definizione del vettore posizione del baricentro. Alloraper il moto della molecola i–esima tale teorema afferma che

ddt(Mi v

c mi ) =

sFe x t

i s

dove Mi è la massa totale della molecola e vc mi la velocità del suo baricentro.

Dunque il baricentro si muove come se fosse un punto materiale soggetto al

19Se i due atomi sono a distanza fissata, si ha come un manubrio (dumbell) con i due atomiagli estremi, e quindi, fissato il baricentro, si hanno come coordinate libere due angoli che fissanol’orientazione del manubrio (come avviene per un atomo singolo, descritto come una sfera rigida,quando si trascuri la “rotazione propria”), In aggiunta però i due atomi possono oscillare, e ilmanubrio può essere trattato come una molla abbastanza rigida, e quindi si ha un oscillatorearmonico monodimensionale, con i familiari termini di energia cinetica e di energia potenziale.

28 Andrea Carati e Luigi Galgani

risultante (la somma vettoriale) delle forze esterne (qui, le forze esercitate dallaparete sui singoli atomi della molecola considerata).

In conseguenza, per quanto riguarda l’interazione di ogni molecola con la pa-rete, ci si è ridotti al caso discusso sopra, di un sistema costituito di singoli puntimateriali (i baricentri, appunto, trattati come atomi puntiformi). Si concludeallora che ogni molecola contribuisce al prodotto pV soltanto con i tre terminidi energia cinetica del baricentro. Ovvero, si ottiene ancora l’equazione di statodei gas perfetti (2.1.3) con una identificazione tra temperatura ed energia cineticaanaloga alla (2.1.8), dove però ora l’energia cinetica è solo quella dei baricentri.

Riassumendo, abbiamo dunque il teorema generale di Clausius e la corri-spondente identificazione:Teorema di Clausius e identificazione della temperatura, per un gas costitui-to di molecole. Per un gas perfetto costituito di molecole si ha

pV =23

K c m , (2.1.9)

doveK c m def=

i

K c mi .

è l’energia cinetica totale dei baricentri. Si ha allora la identificazione

K c m =32N RT ≡ 3

2N kB T . (2.1.10)

Dunque, mediante il teorema di Clausius abbiamo una “spiegazione micro-scopica” della legge dei gas perfetti. In particolare essa comporta che l’energiatotale dei baricentri (media) ha il medesimo valore per tutte le molecole, indi-pendentemente dalla loro struttura (molecole monoatomiche o poliatomiche) edalle loro costanti atomiche caratteristiche (masse, frequenze delle oscillazioneinterne, . . . ). Questo verrà confermato dal teorema di equipartizione di Boltz-mann. Ma sorgerà allora un nuovo problema, perché tale teorema darà ancheinformazione sulle energie medie dei gradi di libertà interni, in disaccordo conl’esperienza.

Se, ad esempio, a fissato volume si incrementa la pressione, e quindi la tempe-ratura, dal punto di vista microscopico ciò vuol dire che si incrementa l’energia(cinetica) totale dei baricentri, ma non abbiamo alcuna informazione su cosa suc-cede delle energie dei gradi di libertà interni. Una eventuale “termalizzazione”che porti ad un incremento corrispondente delle energie interne è possibile, madovrebbe essere determinata da scambi di energia dovuti ad esempio alle colli-sioni tra le molecole. Se poi questo possa avvenire, completamente o forse soloin parte, è un problema aperto legato alla dinamica e alla modellizzazione delleforze mutue. Problema tutt’altro che semplice, la cui rilevanza fu già fortemente

Fondamenti della meccanica quantistica: Boltzmann 29

sottolineata da Boltzmann stesso, nel suo celebre contributo alla rivista Naturedel 1895.20

Osservazione: energia posseduta vs energia scambiata, in termodinamica e in mec-canica statistica. Ribadiamo questo punto delicato. La teoria di Clausius mostra che,almeno per un gas diluito, la temperatura è proporzionale a una quantità meccanica delsistema, ovvero la somma delle energie cinetiche dei baricentri (media). Dunque unincremento di temperatura corrisponde a un incremento di energia cinetica dei baricen-tri. E poiché in meccanica esiste anche l’energia del sistema, si potrebbe congetturareche l’energia meccanica (media) del sistema possa essere identificata con l’energia termo-dinamica U del sistema, che è la quantità fenomenologica definita in virtù del primoprincipio. Ma questa affermazione è fuorviante, perché la termodinamica non parla as-solutamente mai dell’energia di un sistema, ma parla invece dell’energia, diciamola ∆Uche, durante il passaggio (o la trasformazione, come si dice) da uno stato a un altro, ilsistema considerato scambia (con un altro sistema). Ad esempio, nelle trasformazioni distato, tipicamente nel caso liquido–gas, nel passaggio dallo stato liquido allo stato gas-soso, si ha l’energia ∆U di vaporizzazione (alla temperatura di ebollizione, dipendenteparametricamente dalla pressione), e la quantità opposta nella trasformazione inversa diliquefazione. Questa è la quantità che viene misurata, misurando ad esempio quantoghiaccio viene sciolto nel passaggio di stato.21 Analogamente si misura l’energia libera∆F prodotta o assorbita in una trasformazione. La termodinamica non ci dice nullainvece su una eventuale energia U o una energia libera F che il sistema eventualmente“possiede”. Tutta la termodinamica viene costruita sulla base di queste quantità scambia-te, e possiamo parlare ad esempio di una energia U solo se convenzionalmente assegnamoun valore di U , diciamo U0, a uno “stato di riferimento”, e misuriamo (ad esempio conun calorimetro) il calore scambiato nel passaggio tra i due stati.22

Ad esempio, nella fisica atomica, quando si parla dell’energia di un atomo, si pre-scinde dall’energia che possiede il suo nucleo, costituito dai suoi protoni e neutroni (inucleoni). Pare che ai nucleoni si debba attribuire una temperatura enorme, dell’ordinedi 1014 K, ma questa energia non viene scambiata con i gradi di libertà atomici (energiedei baricentri o energie dei gradi di libertà interni) o con gli elettroni, e quindi viene deltutto trascurata nella fisica atomica. I gradi di libertà atomici e quelli nucleari costituisco-no, dal punto di vista termodinamico, due sistemi indipendenti, che non comunicano.Potrebbero forse comunicare su scale di tempi dell’ordine dell’età dell’universo. Analo-gamente, anche le molecole costituenti i vetri non “termalizzano” completamente conl’ambiente, e restano in uno stato di metaequilibrio fino a scale di tempi di ordine geolo-gico. Tuttavia, nei manuali di meccanica statistica si valuta sempre l’energia interna U diun sistema come media dell’energia meccanica e quindi equiparando l’energia possedutacon l’energia scambiabile.23 Questa tradizione in effetti risale a Boltzmann e a Gibbs

20NOTA PER GLI AUTORI. Ritrovare l’articolo di Poincaré (forse del 1906) in cui discute ilgas dentro un cubo a pareti riflettenti. Citare Boltzmann dall’articolo con Barbara e da Nature.Magari, in appendice.

21Spesso si dimentica che queste energie sono enormi. Per fare evaporare l’acqua occorrono540 kilocalorie per kilo, ovvero un’energia grossomodo cinque volte superiore a quella richiestaper portate un litro di acqua da 0 a 100 gradi centigradi (a pressione ordinaria). Ci si rendeconto facilmente che l’energia di condensazione liberata da una grande nuvola in un temporale èdell’ordine dell’energia liberata dall’esplosione di una bomba atomica.

22Questi concetti sono illustrati in maniera limpidissima nel libro di Nernst sul terzo principio,W. Nernst, The new heat theorem.

23Una notevole eccezione è il manuale di G.H. Wannier, Statistical Physics, Dover (New York,

30 Andrea Carati e Luigi Galgani

(anche se Boltzmann manifestò pubblicamente tutti i suoi dubbi sulla sua validità). Essafallisce gravemente nelle trattazioni classiche della fisica atomica, e funziona sostanzial-mente molto bene nelle corrispondenti trattazioni quantistiche. Ma non sempre, comevedremo.24 Vedremo anche come, attraverso un procedimento meccanico statistico “allaKubo”, sia possibile riconoscere in maniera formale quale parte di energia di un siste-ma possa essere scambiata con un altro entro ogni tempo fissato, come conseguenza delcarattere caotico od ordinato della dinamica del sistema totale.

2.2 Il procedimento statistico di Boltzmann e la distri-buzione di Maxwell–Boltzmann

Abbiamo accennato a come la trattazione cinetica di Clausius faccia riferimentoa procedimenti statistici, riguardanti sia la probabilità dei dati iniziali delle mole-cole, sia medie coinvolgenti la dinamica (attraverso medie temporali di variabilidinamiche, come la forza esercitata da una parete sigli atomi). Si presenta allorail problema se sia possibile ed in che modo trattare le variabili dinamiche comefossero variabili casuali. È questo il cosiddetto problema ergodico (introdotto daBoltzmann stesso), che costituisce il cuore della meccanica statistica.

Dopo Clausius, un importantissimo contributo venne dato da Maxwell, chegiustificò, attraverso un procedimento astuto, la forma che ci si deve aspettareper la distribuzione di probabilità delle velocità delle molecole in un gas perfet-to. Il contributo fondamentale venne però dato da Boltzmann, che riuscì nonsolo a generalizzare la distribuzione di Maxwell, ma soprattutto fu in grado digiustificarla sulla base di profonde considerazioni matematiche. In effetti, egliviene considerato il creatore dei cosiddetti metodi delle grandi deviazioni25, checostituiscono il fulcro di tutte le trattazioni meccanico–statistiche moderne. Do-po di lui venne26 il contributo dato da Gibbs nel suo fondamentale libro del1902, moltissimo apprezzato anche da Poincaré (si veda ad esempio La scienceet l’hypothèse, del 1905). Tuttavia, non è forse improprio affermare che, rispettoa quello di Boltzmann, il contributo di Gibbs fu di tipo in qualche modo piùformale. Esso dà di più e di meno. In qualche modo il procedimento di Gibbs èpiù limpido, perché ad esempio permette di separare con chiarezza gli aspetti di-namici da quelli statistici, più di quanto avvenga nella trattazione di Boltzmann.Per questo, giustamente, al procedimento di Gibbs si ispirano praticamente tuttii manuali. Tuttavia, pochissima attenzione è data al ruolo della dinamica, e aiprocediemnti connessi al principio delle grandi deviazioni. Infine, dopo il 1954

1966). Naturalmente, questo concetto, che si debba sempre fare riferimento all’energia scambiata,è ritenuto praticamente ovvio da uno scienziato del calibro di Nernst, sia nel suo manuale chegià abbiamo citato, sia nel suo fondamentale libro sul terzo principio( W. Nernst, The new heattheorem, Dover.)

24Si tratta del problema dell’orto-idrogeno e del para-idrogeno.25Per una prima informazione si può vedere anche Wikipedia, Large deviations theory. Un

classico manuale è quello di Ellis.26Quasi in mezzo tra Boltzmann e Gibbs stanno i primi lavori di Einstein del 1903, 1904, sui

quali ritorneremo più avanti.

Fondamenti della meccanica quantistica: Boltzmann 31

vi fu il contributo di Green–Kubo, che permise di fondere in maniera limpidagli aspetti statistici e quelli dinamici, attraverso l’introduzione delle funzioni dicorrelazione delle variabili dinamiche di interesse. I contributi di Gibbs e diGreen–Kubo (come anche quello di Poincaré del 1912) verranno illustrati piùavanti. Qui cominciamo con il contributo di Boltzmann, limitandoci alla mec-canica statistica di equiìuilibrio, ovvero allo studio degli stati macroscopici dimassima probabilità.

La trattazione probabilistica di Boltzmann: gli stati macroscopici come suc-cessioni {nk} di numeri di occupazione nello spazio µ

Ben sappiamo che i metodi statistici si applicano a situazioni coinvolgenti ungrande numero di eventi individuali, che nei casi più semplici possono essereconsiderati indipendenti. Tipico è il lancio di N monete identiche, che può equi-valentemente pensarsi come una successione di N lanci di una medesima moneta.In tal caso, le quantità di interesse si esprimono come somme di quantità relativeai lanci individuali (sono grandezze di tipo somma, nel limguaggio alla Khinchinusato nel paragrafo precedente). Così, nel caso del lancio di monete, in relazioneall’i–esimo lancio si considera la funzione χ i

T che assume il valore 1 se è uscitatesta, e il valore 0 se non è uscita testa, e analogamente la funzione χ i

C relati-va all’uscita o meno di croce (naturalmente, si ha anche χ i

C = χiT − 1), perché

si hanno solo due possibili uscite). Allora, nell’evento globale costituito da unasuccessione di N lanci, il numero di teste nT è dato dalla somma nT =

i χiT che

coinvolge tutti i lanci (tutte le monete). Analogamente, nel caso del gioco dei da-di si hanno a ogni lancio sei possibili uscite, e quindi per ogni lancio individualei si avranno sei funzioni χ i

k , k = 1,2, . . . , 6. La teoria delle probabilità si interessadi eventi globali, ciascuno dei quali è definito da una ben definita successione diN lanci. Denotiamo con ω un tale evento globale (gli N risultati corrispondentia una successione di N lanci). La conoscenza dello stato globale ω ci dà unainformazione completa del sistema, perché ci dice esattamente lo stato (testa T ocroce C) di ogni singola moneta (o di ogni singolo lancio). Di solito tuttavia si ri-cercano informazioni molto meno dettagliate, come tipicamente il numero nT diteste uscite in una successione di lanci (cioè in uno stato globale ω), indipenden-temente dall’ordine di uscita, e dunque si considera la somma nT =

i χiT . La

stima di somme di questo tipo, somme di funzioni relative ciascuna a un singoloevento elementare (qui, a ogni singolo lancio), costituisce il problema fondamen-tale del calcolo delle probabilità. In tale contesto, ad esempio, la legge dei grandinumeri afferma sostanzialmente che per la stragrande maggioranza degli eventiglobali ω si ha (per monete oneste, (o “unbiased” ) 1

N∑

i χiT ' 1/2, ovvero che

il numero di teste è uguale al numero di croci. Dapprima venne studiato il ca-so più semplice, in cui i singoli eventi “costituenti” un evento globale ω sianoindipendenti e addirittura “identicamente distribuiti”, ovvero “iid” (independent,identically distributed). In seguito i risultati vennero estesi al caso più generale dieventi singoli non identicamente distribuiti o addirittura non indipendenti.

32 Andrea Carati e Luigi Galgani

In maniera analoga la meccanica statistica tratta sistemi fisici costituiti da unenorme numero N di sottosistemi (come avviene in fisica atomica, dove N èdell’ordine del numero di Avogadro NA), con metodi statistici del tipo di quellisopra illustrati. Tipicamente i sottosistemi sono tutti identici, e sono l’analogodel singolo dado. L’analogo dello stato totale (che avevamo denotato con ω) èora il punto rappresentativo del sistema totale nello spazio delle fasi totale delsistema. Questo spazio delle fasi totale é di solito denotato (seguendo Boltz-mann) come spazio Γ (leggi gamma – maiuscolo), mentre lo spazio delle fasi diun singolo sottosositema é chiamato spazio µ (leggi mu oppure mi).

Vediamo dunque come procede Boltzmann. Ogni sottosistema i abbia unnumero µ (leggi mu) – è questo proprio il simbolo usato da Boltzmann – digradi di libertà, e sia riferito a coordinate canoniche zi ≡ (q i

1 , . . . , q iµ, p i

1, . . . , p iµ),

con hamiltonianaH (q (i)1 , . . . , q (i)µ , p (i)1 , . . . , p (i)µ ) .

L’hamiltoniana totale allora avrà la forma

H t ot =N∑

i=1

H (q (i)1 , . . . , q (i)µ , p i1, . . . , p i

µ)+V (q (1)1 , . . . , q (1)µ , . . . , q (N )1 , . . . , q (N )µ )

dove V è una definita energia potenziale che descrive una interazione tra i sot-tosistemi. Tipicamente, si può pensare al caso in cui le interazioni siano a cortoraggio (short range), anche se le interazioni coulombiane (di rilevanza fondamen-tale) sono invece a lungo range: ma di questo per ora non ci occupiamo. Questaenergia potenziale ha un ruolo fondamentale, perché in sua assenza ogni sottosi-stema si muoverebbe come se gli altri non esistessero, e in particolare l’energiadi ogni sottosistema sarebbe una costante del moto. Dunque l’energia potenzialeproduce collisioni tra i sottosistemi, sicché le loro energie variano nel tempo e sipuò presumere che dopo un certo tempo (che di solito si suppone molto breve,dell’ordine del tempo di poche collisioni molecolari) le energie dei singoli sotto-sistemi possano essere trattate come se fossero statisticamente indipendenti. Unaipotesi più o meno di questo tipo potrebbe essere chiamata, per usare un terminedi Boltzmann, la Stosszahlansatz27 o “ipotesi del caos molecolare”

Si osservi anche che, almeno per gas sufficientemente diluiti, in punti tipicidello spazio delle fasi totale avviene che il valore numerico della energia poten-ziale di energia di interazione delle molecole è del tutto trascurabile rispetto allaparte restante dell’hamiltoniana totale (ovvero la somma delle energie dei singolisottosistemi).

A questo punto Boltzmann si è sostanzialmente ricondotto al livello delletrattazioni classiche tradizionali del problema delle successioni di lanci di moneteo di dadi (“schema di Bernoulli”, nella terminologia moderna). Si ha un nume-ro N (un numero enorme, dell’ordine del numero di Avogadro NA) di sistemiindividuali (i sottosistemi, le molecole), le cui energie, chiamiamole Ei , possono

27Assunzione, o ipotesi, sul numero di urti.

Fondamenti della meccanica quantistica: Boltzmann 33

essere trattate come variabili casuali (random variables) che, possono assumerevalori tipicamente nell’intervallo [0,∞). In effetti, per ogni sistema individualel’informazione più rilevante (anzi l’informazione completa) è la conoscenza delpunto dello spazio delle fasi (con 2µ coordinate) in cui il sistema si trova (questoè l’analogo del conoscere lo stato della i–esima moneta: testa T o croce C). QuiBoltzmann introduce nella descrizione una semplificazione, perché discretizza ilproblema, introducendo in ognuno dei singoli spazi della fasi una suddivisionein cellette. Si pensi ad esempio al caso di un oscillatore armonico, in cui ognisottosistema ha due sole coordinate, q (i) e p (i), e si pensi di introdurre in talespazio cartesiano una quadrettatura.

Anticipazione: Planck vs Boltzmann. Naturalmente, Boltzmann pensa all’introdu-zione di questa discretizzazione (quadrettatura) come a un espediente provvisorio, conl’intento di passare poi al limite in cui la quadrettatura scompaia e si riottenga il con-tinuo. Anticipando le cose, facciamo subito presente che quando Planck prenderà inconsiderazione i metodi di Boltzmann, la sua scoperta sarà che il metodo di Boltzmannproduce il risultato ’giusto” se, evitando di “passare al continuo”, si mantiene la cellafinita, esattamente con area uguale ad ħh per ogni grado di libertà.28

L’analogia con la descrizione statistica del problema del lancio della monetaè ormai sostanzialmente completa. Ci resta anzitutto da definire per ogni sotto-sistema i una funzione che sia l’analogo di quello che sono le funzioni χ i

T , χ iC

nel caso delle monete, le quali ci davano una informazione completa sul risultatodel lancio della moneta i , ovvero quale dei due possibili stati (testa T, o croceC) si è presentato. Qui l’informazione completa sarebbe sapere in quale puntodel suo spazio delle fasi si trova il sottosistema i . Per via della discretizzazioneintrodotta, l’informazione completa sul singolo sottosistema è allora sapere inquale cella esso si trova. A ciò provvede la funzione χ i

k che assume il valore 1 seil sottosistema i si trova nella cella k e il valore 0 se si trova fuori.

Ci resta infine un ultimo passaggio. Si tratta dell’analogo della informazio-ne che dice che, in corrispondenza di un completo lancio di monete (ovvero incorrispondenza di quello che abbiamo chiamato un evento totale, e denotato conω), sono uscite un certo numero nT di teste e un numero nC di croci (natural-mente, con il vincolo nT + nC = N ). Ovviamente, l’informazione fornita dalla

28Si constata immediatamente che, qualunque sia la coordinata configurazionale q , con le sueproprie dimensioni (ad esempio, una lunghezza o un angolo, adimensionale), se p è il corrispon-dente momento coniugato, allora il prodotto q p (o anche dqd p, che rappresenta un elemento diarea nello spazio delle fasi) ha le dimensioni di una azione, come h. Basta a tal fine ricordare ladefinizione di momento p coniugato a q in termini della lagrangiana (che è dimensionalmenteun’energia) sicché si ha

pq =∂ L∂ q

q .

Dunque le dimensioni di q si eliminano tra numeratore e denominatore, e si resta con una energiaper un tempo. Ne segue ad esempio che, se q è un angolo, allora il momento coniugato (che èun momento angolare) ha le dimensioni di una azione. Non è un caso che lo stato fondamentaledell’atomo di idrogeno sia quello per cui, facendo riferimento al modello classico, il momentoangolare dell’elettrone ha valore ħh.

34 Andrea Carati e Luigi Galgani

conoscenza dell’evento globale ω ci dice molto di più, perché ci dice anche esat-tamente quali monete (ad esempio. la quinta. le dodicesima, la ventesima, . . . )sono nello stato testa. Nel nostro caso, l’analogo del numero di teste o del nu-mero di croci è il numero di sottosistemi, nk che si trova nella generica cella k,che viene di solito chiamato con il nome “numero di occupazione” della cella k.Evidentemente ancora abbiamo a che fare con funzioni “di tipo somma”, perchési ha

nk =∑

i

χ ik .

Abbiamo già osservato che la descrizione data dalla successione dei numeridi occupazione

{nk} ≡ (n1, n2, n3, . . .) (2.2.1)

è una descrizione altamente ridotta, perché ci dice quanti sottosistemi sono inognuna delle celle, ma non quali. In questo senso la descrizione del sistema to-tale tramite la successione {nk} dei numero di occupazione è una descrizionemacroscopica, e non microscopica. Essa ci permette di avere un informazionesignificativa anche sul sistema globale, ma solo per quantità che abbiamo chia-mato (seguendo Khinchin29) “di tipo somma”, ovvero quantità che sono sommedi funzioni identiche relative ad ogni singolo sottosistema. Infatti, consideriamouna qualsiasi variabile dinamica F di un singolo sottosistema generico nel suospazio delle fasi di dimensioni 2µ, e sia Fk un tipico valore che essa assume nellacella k (ad esempio nel suo “centro”). Allora, se è nota la successione {nk}, ilcorrispondente valore per il sistema totale sarà dato da

k nk Fk . Queste sono lequantità di cui si occupa Boltzmann, eventualmente passando alla corrispondentedescrizione “continua”.

Naturalmente, la descrizione ridotta in termini di successione {nk} di nume-ri di occupazione può essere data in maniera completamente equivalente ancheattraverso la successione di numeri

pk =nk

N

0≤ pk ≤ 1 ,∑

k

pk = 1�

. (2.2.2)

che evidentemente hanno il significato di “frequenze di occupazione delle cel-le”, analoghe alle frequenze di teste o di croci nel lancio di N monete.

Osservazione. Spesso si identifica pk con la probabilità a priori che un singolo puntoha di occupare la cella k (analogo alla probabilità a priori che in un singolo lancio unasingola moneta ha di trovarsi nello stato (nella cella) testa oppure nello stato (nella cella)croce. Questo comunque non é affatto ovvio, perché nel nostro caso non abbiamo adisposizione una probabiltà a priori nello spazio µ.

Notazione: Spazio Γ (Gamma) e spazio µ (mu). Abbiamo detto che lo statodi ogni singolo sottosistema i–esimo (prescindiamo ora dalla discretizzazione mediante

29A. I. Khinchin, Mathematical foundations of statistical mechanics, Dover (New York, 1949).

Fondamenti della meccanica quantistica: Boltzmann 35

cellette) è individuato da un punto zi in uno spazio delle fasi, diciamolo F , che ha unacerta dimensione 2µ. A rischio magari di essere pedanti, potremmo dire che zi ∈ Fidove gli spazi Fi sono spazi tutti uguali, Fi =F . Quest’ultimo spazio viene di solitochiamato “spazio µ”.

Lo stato “microscopico” del sistema totale è allora individuato da un punto nello spa-zio che è il prodotto cartesiano degli spazi delle fasi dei singoli sottosistemi. Tale spaziodelle fasi globale viene chiamato da Boltzmann “spazio Γ ”. Un suo punto generico z èdunque individuato da una successione (z1, z2. . . .), con zi ∈Fi ≡F .footnote Forse, perchiarire il ruolo dello spazio µ, può essere utile avere presente la seguente immagine. Suun asse orizzontale indichiamo, ugualmente distanziati, i punti 1,2 3, . . . che individuanoogni singolo sottosistema i–esimo. Trasversalmente. in corrispondenza di ogni puntoi si disponga lo spazio delle fasi dell’ i–esimo sottosistema (si pensi ad esempio a unospazio bidimensionale, come nel caso di un oscillatore armonico a un grado di libertà).Allora uno stato microscopico z ∈ Γ è definito da una successione di punti

z ≡ (z1, z2, . . .)

dove zi è il punto che definisce lo stato del sottosistema i . Ora, all’origine dell’asseorizzontale, parallelo agli spazi dei singoli sottosistemi, si ponga un ulteriore spazio didimensione 2µ. Se poi con una lampada posta a destra si illumina orizzontalmentetutto il sistema di piani (trasparenti, ma non sono trasparenti i punti che individuanogli stati dei singoli sottosistemi), allora sullo spazio posto nell’origine, che è costruitocome uno schermo (anziché essere trasparente), viene proiettata l’ombra prodotta daipunti rappresentativi di tutti i singoli sottosistemi. In particolare, si possono contare inumeri di occupazione nk di ogni cella. Bene: questo spazio schermo, potremmo dire“spazio totalizzatore”, è quello che deve intendersi per “spazio µ” quando si dice che ladescrizione di Boltzmann si riferisce allo spazio µ anziché allo spazio Γ .

La probabilità degli stati macroscopici

Abbiamo dunque mostrato come Boltzmann si concentri sugli stati macroscopi-ci, che è il nome che abbiamo dato alle successioni {nk} di numeri di occupazionedelle celle nello spazio µ. Che il nome di stati macroscopici sia ragionevole sicapisce bene. Infatti, se trascuriamo le velocità e ci concentriamo sulle posizioni,nel caso di un gas è ben concepibile di suddividere in cellette il volume fisico Vin cui si trova il gas e misurare la densità del gas in ogni cella, e quindi misurareil numero di particelle che vi si trovano. Analogamente, anche se in manierapiù complicata, si concepisce che si possa fare per le velocità. In conclusione,almeno in linea di principio lo stato definito dalla successione {nk} di numeri dioccupazione può essere determinato da un procedimento di misurazione.

A questo punto Boltzmann introduce in maniera ragionevolissima una stimadella probabilità W (n1, n2, n3, . . .) di ogni stato macroscopico {nk}. In conse-guenza può poi calcolare quale è lo stato macroscopico che ha massima proba-bilità (con i vincoli che siano fissati l’ energia totale e il numero di particelle) etrova che tale stato è il cosiddetto stato di Maxwell–Boltzmann. Inoltre, risul-ta non solo che tale stato ha probabilità massima, ma addirittura che ogni altrostato ha probabilità potremmo dire inesistente, nulla, nel senso che essa ha unataglia che decresce esponenzialmente al crescere di N .

36 Andrea Carati e Luigi Galgani

Il punto di partenza consiste nell’assumere che W (n1, n2, n3, . . .) sia sempli-cemente la misura di Lebesgue del volume dell’insieme dei punti dello spazioΓ cui corrisponde la assegnata successione {nk}. Facciamo dunque l’assunzioneche tutti i punti dello spazio delle fasi siano ugualmente probabili, nel senso che,facendo una scelta a caso, sia piú probabile finire in una regione “grande” (cioèdi volume grande) che in una regione “piccola”.30 Si noti bene, di passaggio,che questa assunzione ha carattere in qualche modo cinematico e non dinamico.Ovvero essa prescinde dal problema ergodico, ovvero dalla circostanza se esista-no o no delle costanti del moto (diverse dall’energia, della quale terremo contotra un momento) che impediscano al sistema di visitare tutte le regioni a prioriconcepibili. Questo è un punto rilevante, ad esempio per il problema FPU.

Comunque, prescindendo dal problema ergoodico, veniamo ora al proce-diemnto con cui Boltzmann mostra che, in conseguenza della assunzione fattasopra, la probabilità W di uno stato macroscopico si esprime analiticamente intermini di un classico coefficiente del calcolo combinatorio. Infatti, a meno di uninessenziale fattore coinvolgente il volumetto δVµ di una cella elementare nellospazio µ, si ha

W (n1, n2, n3, . . .) = (δVµ)N P (n1, n2, n3, . . .) (2.2.3)

doveP (n1, n2, n3, . . .) =

N !n1! n2! n3! . . .

. (2.2.4)

è il familiare coefficiente multinomiale del calcolo combinatorio, Qui, in onore diBoltzmann, abbiamo usato la sua notazione per la probabilità, ovvero W che staperWahrscheinlichkeit, ovvero verosimiglianza, cioè probabilità in lingua tedesca.

La dimostrazione della formula di Boltzmann (2.2.3)–(2.2.4) è quasi imme-diata. L’argomento centrale prescinde dalla finitezza delle celle, e riguarda lacorrispondenza tra punto z ∈ Γ da una parte, e N–uple di punti nello spazio µdall’altra. Ogni z produce una ben definita successione {nk}, mentre la corri-spondenza inversa à tutt’altro che univoca. Questo argomento, come ora mo-striamo, conduce alla spiegazione del fattore multinomiale P dato dalla (2.2.4),che Boltzmann chiama con lo strano nome di numero di complessioni. Infatti unpunto z ∈ Γ è definito da una N–upla ordinata di punti nello spazio µ

z ≡ (z1, z2, . . . , zN )

perché ogni punto zi si riferisce a un preciso sottosistema, quello i–esimo. Dun-que un punto z di Γ produce N punti nello spazio µ, che a loro volta produconouna ben definita successione {nk} di numeri di occupazione (stato macroscopi-co). Invece, se si assegna una successione {nk} di numeri di occupazione, restano

30Il fatto di usare la misura di Lebesgue può essere motivato in base alla sua proprietà di esserel’unica misura invariante per traslazioni. Infatti, poiché il passaggio da un osservatore inerziale adun altro corrisponde ad una traslazione nello spazio delle fasi, quella proprietà pone la misura diLebesgue in una posizione privilegiata dal punto di vista della relatività galileiana.

Fondamenti della meccanica quantistica: Boltzmann 37

assegnati (a meno dell’indeterminazione dovuta alla finitezza del volume dellecelle elementari) N punti nello spazio µ, ma questi punti sono sprovvisti di in-dice. É quindi evidente che (ancora trascurando l’indeterminatezza dovuta allafinitezza del volume delle cellette) esistono un numero ben definito di succes-sioni (z1, z2, . . . , zN ) (ovvero di punti z ∈ Γ ) che producono l’assegnato statomacroscopico. Evidentemente se nell’assegnato stato macroscopico i numeri dioccupazione nk fossero tutti 0 o 1, allora il numero di punti diversi in Γ sarebbeN !, che è il numeratore della formula di Boltzmann per il numero di comples-sioni (infatti i diversi punti si ottengono scambiando i nomi dei sottosistemi, equindi compiendo N ! permutazioni). Per comprendere la ragione del denomina-tore, seguendo il ragionamento originale di Boltzmann, esposto nel suo lavorodel 1877, bisogna tenere conto di un altro fatto, ovvero che se ad esempio 3 puntidello spazio µ sono sovrapposti (coincidono), allora, tra gli N ! punti dello spa-zio Γ che già abbiamo individuato, ve ne sono 3! che coincidono (sempre a menodell’indeterminazione dovuta alla finitezza della celletta). In tal modo si spiega ildenominatore della formula di Boltzmann.31

Come avviene che si possa avere la coincidenza di punti dello spazio Γ sopra citata, puòessere illustrato visivamente considerando il caso in cui lo spazio µ è monodimensionale,con coordinata diciamo x, e si ha un sistema di due particelle, sicché lo spazio Γ è il piano.con coordinate (x1, x2). In tal caso, se nello spazio µ si hanno due punti con coordinatead esempio 3 e 10, allora a questo stato corrispondono due punti nello spazio Γ , uno dicoordinate (3,10) e un altro (simmetrico rispetto alla bisettrice) con coordinate (10,3).Ma se i due punti nello spazio µ coincidono, ad esempio con x1 = x2 = 3, allora a questostato corrisponde nello spazio Γ l’unico punto (3,3), disposto sulla bisettrice.

Naturalmente, questo argomento si estende subito al caso in cui si tenga conto dellafinitezza delle celle (ad esempio tutte uguali, di volume δVµ, che comporta una corri-spondente suddivisione dello spazio Γ , in celle di volume (δVµ)

N ). In tal caso stiamo ri-nunciando a considerare diversi i punti che si trovano in una medesima cella dello spazioµ (ovvero identifichiamo tali punti) sicché siamo ridotti all’argomento dato sopra.

Altro procedimento. La formula per il coefficiente polinomiale può essere dedottaanche nel modo seguente (si vedano i due libri di Fermi, Introduzione alla fisica atomica,e Molecole e cristalli) . Dato n1, il numero di modi in cui posso scegliere n1 sottosistemitra gli N è il numero di combinazioni di N oggetti a ni a n1, ovvero

N !n1!(N − n1)!

.

Messa a posto la prima celletta, restano N − n1 sottosistemi, e allora quando assegno n2ho

(N − n1)!n2! (N − n1− n2)!

31Considerazioni analoghe si compiono per determinare ad esempio i coefficienti dello svilup-po di (a + b + c)N . Ogni termine contiene una successione (ordinata !) di N fattori, del tipoaabac b c . . . c . La situazione è la stessa di quando si ha un punto “globale” ω nel problema dellancio di dadi a tre facce. Si hanno N lanci, con tre possibili uscite, a oppure b oppure c . Ad ognipunto ω corrispondono tre numeri di occupazione n1, n2, n3 (le potenze a cui elevare i fattori a,b , c ). Invece, assegnate le tre potenze (la successione di numeri di occupazione), si capisce subitoche il corrispondente fattore è proprio il relativo coefficiente polinomiale.

38 Andrea Carati e Luigi Galgani

scelte possibili per riempire la celletta 2, e così via, sicché il numero totale, che si ot-tiene evidentemente per moltiplicazione di quei numeri parziali, fornisce il risultato(ad ogni moltiplicazione si elimina un fattore a denominatore con un fattore uguale anumeratore).

Lo stato di Maxwell–Boltzmann

Boltzmann può ora chiedersi quale sia lo stato macroscopico (la successione {nk}di numeri di occupazione nello spazio µ ) più probabile.

Qui si incontra un primo fatto significativo, ovvero che, con la definizionedata per la probabilità degli stati macroscopici, lo stato più probabile ha ener-gia media infinita.32 Questo è ovvio, perché l’energia è una quantità illimitatasuperiormente, e abbiamo assunto uniforme la probabilità a priori nello spazioΓ , data dalla misura di Lebesgue. Quindi è nulla la probabilità che il valor me-dio dell’energia del sistema sia finita. Boltzmann assume allora il punto di vistatipico di quella che modernamente, proprio a seguito dei suoi lavori, viene chia-mata la teoria delle grandi deviazioni. Ovvero, prende atto del fatto che possiamoconsiderare un sistema ben concreto (costituito di N particelle) che possiede unaben concreta, nota, energia totale finita E , nonostante che tale situazione abbiaa priori probabilità nulla (si tratta appunto di una “grande deviazione” da quel-lo che a priori sarebbe il valor medio, che qui é infinito). Quindi egli ricercaquale sia lo stato macroscopico che ha probabilità massima, quando si impongadal di fuori la condizione che l’energia sia fissata a un valore finito E (si trattadunque di una probabilità condizionata, nel linguaggio comune della teoria delleprobabilità).

Calcolo del punto di stazionarietà: lo stato di MB

Dobbiamo dunque massimizzare la funzione P (n1, n2, n3, . . .) con i due vincoli∑

nk = N ,∑

εk nk = E , dove εk è un valore tipico dell’energia della celletta k–esima, ed E l’energia totale del sistema. Boltzmann procede pensando al caso dinumeri nk grandi che possano essere trattati come numeri reali (anziché interi),sicché valga l’approssimazione di Stirling n!' (n/e)n , ovvero

log n!' n log n− n .

Massimizzare P è equivalente a massimizzare log P , come ora faremo.

Questo è ovvio, perché il logaritmo è una funzione monotóna. Ma nel nostro caso visono anche due ragioni concrete per questa scelta. La prima è che per calcolare il puntodi stazionarietà si devono eseguire della derivate, e la derivata di una somma à molto piùsemplice di quella di un prodotto. Inoltre si ha a che fare con dei numeri fattoriali, che

32Naturalmente, per energia di uno stato macroscopico intendiamo l’energia totale del sistema,data da

E =∑

k

εk nk ,

dove εk è un valore tipico della cella k, ad esempio il valore “centrale”.

Fondamenti della meccanica quantistica: Boltzmann 39

nel nostro caso sono tanto grandi da essere, potremmo dire, “disumani”. I loro logaritmisono invece più “umani”, come anche la loro approssimazione sopra ricordata.

Cominciamo a determinare una forma significatìva che assume log P , che ciinteresserà in seguito. Dalla definizione si ha

log P =N logN −N −∑

nk log nk +∑

nk .

Ma, scrivendo N logN =∑

k nk logN e utillizzando∑

nk = N per cancellare iltermine N , si ha immediatamente

log P =−∑

nk lognk

N,

ovvero, in termini delle frequenze di occupazione pk = nk/N ,

log P =−N∑

k

pk log pk . (2.2.5)

Quando si passa al continuo, la funzione∑

k pk log pk coincide con la celebre“funzione H di Boltzmann”.

Procediamo ora alla massimizzazione di (log P )/N ). I vincoli sul numero diparticelle e sull’energia prendono allora la forma

pk = 1,∑

pkεk = E/N , econ il metodo dei moltiplicatori di Lagrange dobbiamo allora massimizzare lafunzione

−∑

k

pk log pk −α∑

pk −β∑

pkεk

espressa in termini delle variabili pk , dove α e β sono appunto i due moltiplica-tori di Lagrange. Ricordando che la derivata di x log x è log x + 1, e uguagliandoa zero ognuna delle derivate rispetto alle variabili pk , si ha allora

log pk =−(α+ 1)−βεk ,

ovvero pk = p∗k (β) dove

p∗k (β) = e−(α+1) e−βεk .

La condizione∑

p∗k = 1 fornisce poi

1= e−(α+1)Z (β) ,

dove abbiamo introdotto la funzione di partizione (detta anche, con evidentesignificato sum over states dal tedesco Zustandsumme), definita da

Z (β) =∑

k

e−βεk . (2.2.6)

Verificheremo poco più sotto che il punto di stazionarietà è un punto dimassimo, anzi un massimo piccatissimo (asintoticamente in N ), nel senso che,

40 Andrea Carati e Luigi Galgani

a fissata energia specifica E/N , al crescere di N la probabilità degli altri statimacroscopici è sostanzialmente nulla rispetto a quella dello stato di Maxwell–Boltzmann (MB).

Abbiamo dunque trovato la distribuzione di Maxwell–Boltzmann

p∗k (β) =e−βεk

Z (β)ovvero n∗k (β) =N

e−βεk

Z (β)(2.2.7)

con il suo celebre esponenziale. Inoltre, per quanto riguarda il valore diβ, abbia-mo visto che esso è determinato implicitamente tramite la condizione di fissataenergia

εk n∗k (β) = E , ovvero

E =N∑

εk e−βεk

Z (β). (2.2.8)

La termodinamica statistica nello stato macroscopico di MB (Maxwell–Boltz-mann), e la celebre relazione di Boltzmann S = kB logW

Occupiamoci ora di definire le funzioni termodinamiche nello stato di MB. Co-minciamo dunque con la prima identificazione tra quantità meccaniche e quan-tità termodinamiche (o analogie termodinamiche, come diceva Boltzmann e diràpoi Gibbs).33 Si tratta della identificazione tra energia meccanica E ed energiatermodinamica U ,

E ≡U . (2.2.9)

Chiaramente, la quantità U/N esprime la energia specifica per sottosistema, ovverol’energia totale divisa per il numero di sottosistemi.34 35

33Per la termodinamica statistica si può veder il bel libretto di Schrödinger e una appendice diBorn. Atomic Physics. Per quanto riguarda i lavori originali di Boltzmann, in particolare doveintroduce la relazione dell’entropia con il logaritmo del corrispondente volume nello spazio Γ ,si veda Boltzmann, Gesammelte Werke, n. 39 pag. 121 e n. 42 pag. 193, citato da Sommerfeld(NB Le pagine sopra riportate sono quelle indicate da Sommerfeld, che probabilmente aveva adisposizione una edizione delle opere diversa da quella disponibile oggi). Si veda A. Sommerfeld,Thermodynamics and Statistical Mechanics, pag. 213. La relazione tra entropia e probabilità è datanelle opere i Boltzmann a pag, 215 del secondo volume. Veramente, sembrerebbe trovarsi nellasezione V del lavoro 42 (1877), pag. 215 fino alla fine, nell’edizione delle opere disponibile oggi.

34Quando si parla di “energia specifica” si intende solitamente l’energia totale per mole, ovverodivisa per il numero di moli. Dal punto di vista termodinamico è come se avessimo introdottouna nuova unità di misura della quantitá di materia, in modo che sia 1 mole =NA particelle.

35Usualmente ci si riferisce alla quantità U/N come all’energia media di ogni singolo sottosiste-ma, coerentemente con l’analoga interpretazione per le frequenze pk come probabilità, citata inprecedenza.

Fondamenti della meccanica quantistica: Boltzmann 41

Evidentemente,36 la formula (2.2.8) viene letta come una relazione per l’e-nergia termodinamica. Essa si scrive anche nella forma significativa

U =−N∂

∂ βlogZ (β) , (2.2.10)

Vedremo più avanti che dovremo interpretare β come “temperatura inversa”ovvero come β = 1/kB T dove T è la temperatura assoluta (in particolare siavrà la proprietà β > 0). Allora, confrontando la (2.2.10) con la nota relazionetermodinamica

U = ∂β(βF ) , (2.2.11)

dove F è l’enegia libera di Helmholtz F def= U −T S ed S l’entropia,37 otterremol’ulteriore identificazione

−βF =N logZ , ovvero Z = e−βF /N . (2.2.12)

Veniamo ora alla identificazione dell’entropia termodinamica S, che ci con-durrà alla celebre relazione di Boltzmann S = kB logW tra entropia e probabilitàdello stato macroscopico.

A tal fine, ritorniamo alla espressione (2.2.5) che avevamo trovato per log P ,ovvero log P = −N

pk log pk , e valutiamola nello stato di MB. Ricordandol’espressione di p∗k nello stato di MB, e dunque le espressioni di U e di F intermini di logZ , e ricordando inoltre

pk = 1 e F = U −T S (da cui U − F =T S ), si ha allora

log P (p∗1 , p∗2 , . . .) =N∑

p∗k (βεk + logZ 0) =βU −βF =βT S =S

kB

dove si è usato βT = 1/kB . Infine si ha

S = kB log P nello stato di MB , (2.2.13)

o anche, a meno di una costante additiva, la relazione di Boltzmann S = kB logW .36Basta ricordare la formula per la derivata del logaritmo, e scambiare la derivata con la somma

su k. Ammettendo che tale scambio sia possibile. Ciò non è consentito, ad esempio, nel casodell’atomo di idrogeno, in cui addirittura si ha che la serie definente Z diverge. Questo problemaà stato discusso da Fermi nel 1923, nel lavoro Sulla probabilità degli stati quantici, lavoro n. 7a, pag.118 delle Note e Memorie (Collected Papers), Vol.I.

37La (2.2.11) si ottiene ricordando che la relazione definitoria F = U −T S si scrive anche nellaforma

F =U +T ∂T F ,che costituisce la cosiddetta equazione di Helmholtz (una equazione differenziale del primo ordineche permette di ricavare F quando sia conosciuta la funzione U (T )). Infatti, per le familiariproprietà della trasformata di Legendre, da F = U − T S e da dU = T dS − pdV (che esprimeinsieme il primo e il secondo principio) si ottiene S = −∂T F . D’altra parte esplicitiamo oral’equazione di Helmholtz rispetto ad U , ed osserviamo, come subito si verifica, che vale T ∂T =−β∂β. Dunque si ha

U = F −T ∂T F = F +β∂βF = ∂β(βF ) .ovvero la (2.2.11).

42 Andrea Carati e Luigi Galgani

La proprietà di massimo. Decadimento esponenziale della probabilità relati-va degli altri stati

Resta ancora da mostrare che siamo in presenza di un massimo (cioè non solodi un punto di stazionarietà), e vogliamo inoltre mostrare che, asintoticamentein N , gli stati macroscopici diversi da quello di MB hanno probabilità del tuttotrascurabile.

Un metodo tradizionale. Ad esempio, nell’agile libretto di Pauli, questo risultatosi ottiene compiendo, per la probabilità di uno stato macroscopico, uno sviluppo alsecondo ordine negli scarti δ pk dal punto di stazionarietà, e mostrando che essi sonodistribuiti in maniera gaussiana. Dunque il valor medio di (δ pk )

2 diverge solo comeN e pertanto lo scarto quadratico medio relativo (cioè diviso per (p∗k )

2 ) tende a zeroper N →∞. Dunque lo stato di MB corrisponde a un massimo di probabilità, e si hainoltre che, al limite N →∞, la distribuzione di probabilità degli stati macroscopici èconcentata su quella di MB in maniera deltiforme.

Una dimostrazione ancora più generale, ovvero non limitata al secondo ordi-ne negli scarti, si ottiene in maniera addirittura più semplice con il procedimentoseguente, che è caratteristico dei metodi delle grandi deviazioni, i cui inizi sonoappunto fatti risalire a Boltzmann.

Facciamo ancora riferimento alla espressione fondamentale (2.2.5). Scrivia-mo allora la probabilitá W =C P di un generico stato macroscopico nella forma

W (p1, p2, . . .) =C ′ exp (N s(p1, p2, . . .)) , (2.2.14)

doves(p1, p2, . . .) def= −

k

pk log pk . (2.2.15)

Qui abbiamo introdotto un abuso di notazione, denotando con s la funzione cheavremmo dovuto denotare con s/kB . Come abbiamo appena visto, nello statodi MB essa ha, a meno della costante kB , il significato fisico di entropia specifi-ca per sottosistema. Qui per non appesantire la notazione trascureremo questaprecisazione. Il punto essenziale è che, introduncendo una quantità specifica. èstato messo in evidenza il fattore N all’esponente, mentre la quantità specifica srisulta allora indipendente da N .

Evidentemente s ha valori positivi, e si controlla facilmente che, come fun-zione delle variabili pk è convessa (cioè concava verso il basso). Ora, dato che lafunzione s è convessa e presenta un punto di stazionarietà, si conclude che talepunto può essere solamente un massimo (e non un minimo). Dunque lo stato diMB è lo stato macroscopico di massima probabilità.

Veniamo ora al confronto con la probabilità degli altri stati. Questo si ottienescrivendo l’espressione della probabilità di uno stato generico relativamente allaprobabilità dello stato di MB. Questa è data dal rapporto

W (p1, p2, . . .)W ∗ = exp

N�

s(p1, p2, . . .)− s∗�

. (2.2.16)

Fondamenti della meccanica quantistica: Boltzmann 43

dove abbiamo denotato con con W ∗ def= C P (p∗1 , p∗2 , . . .) la probabilità dello statodi MB e con s∗ la corrispondente entropia specifica. Allora è evidente che, se cisi pone in un punto (p1, p2, . . . ) diverso dal massimo, si ha

s − s∗ < 0 ,

e dunque al crescere di N la probabilità di quel punto decresce esponenzialmentecon N , ovvero il massimo diventa piccato esponenzialmente in N (o anche, comepotremmo dire, si ha asintoticamente un massimo di tipo deltiforme). 38

Boltzmann e i fondamenti della meccanica statistica di non equilibrio

La visione di Boltzmann è allora la seguente. Un sistema potrebbe a priori tro-varsi in un punto qualsiasi dello spazio delle fasi (o su una definita superficie dienergia costante, se è conosciuta l’energia). Ma, come abbiamo visto, lo stato diMB ha probabilità grandissima. E, poiché questa è definita in termini di volu-me nello spaio delle fasi, ciøsignifica che la regione corrispondente allo stato diMB occupa sostanzialmnete tutta la superficie dell’energia (è questo il cosiddetto“mare di Boltzmann”). Se invece il dato iniziale corrispondesse a uno stato ma-croscopico diverso, è opinione diffusa che con grande probabilità la dinamica loporterebbe nello stato di MB.39 Qui allora Boltzmann compie un salto, riguar-dante l’entropia degli stati macroscopici generici, perché concepisce di definireuna entropia, e più in generale anche una termodinamica, per gli stati macrosco-pici generici, anche diversi da quello di MB. In questo senso egli è il fondatoredella meccanica statistica di non equilibrio.

Si consideri uno stato generico, definito da una abitraria successione {nk} dinumeri di occupazione o di frequenze {pk} di occupazione. Allora la corrispon-dente probabilitá dello stato è definita dalla formula generale di Boltzmann. Ilpunto nuovo è che in tal modo, mediante la relazione S = kB logW , resta definitaanche la corrispondente entropia, nonostante il fatto che lo stato macroscopiconon sia uno stato di equilibrio.

La trattazione di questi problemi, nei lavori originali di Boltzmann pubblica-ti su riviste, è di lettura non semplice (anche Maxwell se ne lamentava, in manieraesplicita). Una rassegna (ancora di lettura non agevolissima) è stata data recente-mente da Gallavotti.40 Tuttavia, una trattazione più compatta e decisamente piùabbordabile è stata data da Boltzmann stesso nel suo libro sulla teoria dei gas.Particolarmente rilevante ai nostri fini è la discussione data nel primo capitolo.Nel paragrafo 6 (pag. 55 e seguenti della traduzione inglese pubblicata da Do-ver), vengono date le formule probabilistiche che noi abbiamo riportato sopra.

38Evidentemente, il fattore di normalizzazione C è irrilevante. Ad esempio si può pensare difissare una enorme regione dello spazio Γ che contenga tutte le regioni che interessano per unproblema che si sta studiando, e poi prendere C uguale alla misura di Lebesgue di quella regione.

39Ma il lavoro di Fermi Pasta ed Ulam del 1954, che illustreremo più avanti, ha mostrato checosì non avviene.

40G. Gallavotti, Ergodicity: a historical perspective. Equilibrium and Nonequilibrium, Eur. Phys.J. .. .

44 Andrea Carati e Luigi Galgani

Poi, nel paragfrafo 8 (pag. 68 e eseguenti), dedicato al calore specifico di una gas,viene discusso il significato matematico della sua celebre funzione H (la nostras , a parte il segno e il fattore kB ), e viene mostrato che, nello stato di equilibriodi MB, il logaritmo della probabilità delo stato coincide (a meno di una costantemoltiplicativa) con l’entropia del gas perfetto, scritta in funzione di densità ρe temperatura T (pag. 74). Poi, sulla base del fatto che lo stato di equilibrioè lo stato di massima probabilità, egli viene a congetturare che gli stati di nonequilibrio evolvano spontaneamente in modo da portarsi in stati di probabiltàcrescente, fino a giungere eventualmente allo stato di equilibrio, come stato dimassima probabilità. Infine conclude dicendo (pag. 75):

“In one respect we have even generalized the entropy principle here, in that we have beenable to define the entropy in a gas that is not in a stationary state”.

Il mare di Boltzmann e il problema di Fermi Pasta ed Ulam

Abbiamo mostrato come, a fissata energia totale E (e a fissato numero di sot-tosistemi N , grande), l’insieme degli stati microscopici cui corrispondono statimacroscopici (successioni {nk} di numeri di occupazione) diversi da quelli diMB abbia misura estremamente piccola, sostanzialmente nulla. La stragrandemaggioranza dei punti corrisponde allo stato di MB. Si usa dire che regione checorrisponde allo stato di MB, che prende sostanzialmente tutta la superficie dienergia E nello spazio Γ , costituisce il mare di Boltzmann. Prendendo “a caso”un punto su quella superficie di energia si cade sostanzialmente sempre nel maredi Boltzmann.

Tuttavia è possibile assegnare “a mano” un dato iniziale fuori dal mare. Sitratta di una situazione di grande deviazione, come è avvenuto quando abbiamoassegnato a mano un valore dell’energia E finito, mentre secondo la probabili-tà a priori assegnata nello spazio Γ l’energia avrebbe dovuto essere infinita. Eracomune opinione41 che se a mano si assegna un dato iniziale fuori dal mare diBoltzmann, allora rapidamente la dinamica ricondurrà l’evoluto temporale den-tro il mare di Boltzmann (ma abbiamo menzionato come non fosse questa l’o-pinione di Boltzmann stesso). Costituì allora una grande scoperta quella fattada FPU (acronimo degli autori Fermi, Pasta ed Ulam) nel 1954 (l’anno stessodella morte di Fermi). Per una catena di particelle con interazioni non lineari aprimi vicini, essi assegnarono condizioni iniziali con energia solo su pochi modinormali di bassa frequenza. Questo, come vedremo, è un dato iniziale comple-tamente fuori dal mare di Boltzmann, perché per tutti i punti del mare l’energiaè in media ugualmente distribuita tra tutti i modi normali (è questa la cosidettaproprietà di equipartizione dell’energia). Ci si sarebbe attesi che l’evoluzione di-namica conducesse rapidamente il sistema nel mare, e quindi all’equipartizione.Si vide invece che le energie medie (in media temporale) si stabilizzavano su una

41NOTA PER GLI AUTORI. Controllare il libro di Ford e Uhlenbeck.

Fondamenti della meccanica quantistica: Boltzmann 45

distribuzione in cui l’energia si distribuiva solo in un pacchetto di modi di bassafrequenza.

L’interpretazione di questo fatto, già discusso nel primo capitolo, è che è benvero che il dato iniziale sulla considerata superficie di energia è stato proprioscelto fuori dal mare di Boltzann (nei punti del quale di ha equipartizione dell’e-nergia tra tutti i modi), ma il punto rilevante poi risulta essere di tipo dinamico.Ovvero, a energie sufficientemente basse si è in presenza di altre costanti del mo-to oltre l’energia totale. Quindi vi sono degli ostacoli di carattere dinamico chesuddividono il “mare” di Boltzmann in diverse regioni invarianti, sicché l’evolutodel dato iniziale è costretto a restare nelle regione invariante di partenza, e nonpuò visitare (almeno in tempi rapidi)42 tutta la superficie di energia. Qualchevolta una situazione di questo tipo viene detta situazione di “broken ergodicity”.

Nel 1966 si scoprì poi, da parte di Izrailev e Chirikov, che l’equipartizioneavveniva rapidamente se l’energia iniziale era sufficientemente alta. Izrailev eChirikov, con grande intuizione, immaginarono che il “paradosso” FPU dovessescomparire al limite termodinamico (per N grandissimi). Ma questo restava dadimostrarsi. A quel punto la comunità scientifica si é divisa in due gruppi. Il pri-mo (la stragrande maggioranza) “tifa” per la scomparsa del paradosso. Il secondo(minoritario, di cui fanno parte i presenti autori) “tifa” perché si possa dimostrareche il paradosso resti, e cerca di dimostrarlo. Il problema, sostanzialmente ormaidi carattere matematico, è aperto. Ma gli ultimissimi risultati, di tipo analiticonell’ambito della teoria delle perturbazioni rilevanti per la meccanica statisitica,indicano che al limite temodinamico il paradosso persiste.

Nota critica sulla interpretazione dei numeri di occupazione

Per quanto riguarda il procedimento di Boltzmann, ci si incontra con un pun-to delicato, su cui ritorneremo in seguito. Quando si definisce pk = nk/N , laproprietà

pk = 1 induce in modo spontaneo a riguardare pk come la probabi-lità che un singolo sottosistema si trovi nello stato microscopico εk (quello chediventerà un “livello di energia”). Questo sarebbe l’analogo del procedimentodi assegnare una probabilità a priori per un evento riguardante il singolo sotto-sistema, come la probabilità pT dell’evento “testa” per il singolo lancio di unamoneta. Ma questo non è affatto ovvio, perché nel procedimento di Boltzmannè la probabilità dell’evento macroscopico nk (numero di sottosistemi nello statok ) che viene dedotta, a partire dalla probabilità data dalla misura di Lebesgue nel-lo spazio Γ . É questo uno dei punti cruciali che oppose Einstein e Schrödinger aquasi tutta la comunità scientifica.

42Ciò dipende dalla natura dinamica delle possibili costanti del moto. Se si tratta di vere costantidel moto, allora le barriere “reggono” per tempo infinito. Ma può trattarsi di “quasi costanti delmoto”, che producono barriere efficaci solo fino a tempi finiti, i quali possono essere brevi, maanche lunghissimi, come nei familiari casi di metaequilibrio.

46 Andrea Carati e Luigi Galgani

Osservazione complementare. Deduzione della distribuzione di MB per viatermodinamica.

Nel lavoro di Einstein del 1917 di cui parleremo più avanti, in cui egli fa usodella distribuzione di Maxwell–Boltmann (formula (5) del lavoro), si trova la fra-se seguente: “La formula (5) può essere ricavata dal principio di Boltzmann [comenoi vedremo nel prossimo paragrafo] oppure per via puramente termodinamica.” 43

Questo è proprio vero, ed è un fatto pochissimo conosciuto. Il procedimento è ilmedesimo che conduce alla deduzione della cosiddetta legge di azione di massa (lanota legge degli equilibri chimici), in cui si mostra che il rapporto tra il prodottodelle concentrazioni dei prodotti di una reazione e il prodotto delle concentra-zioni dei reagenti è una costante (a fissata temperatura). La dimostrazione dellalegge degli equilibri chimici è riportata ad esempio nel libro di termodinamica diFermi, e fa uso della cosiddetta Van’t Hoff reaction box.44 L’analogia con la distri-buzione di Maxwell–Boltzmann è la seguente. Consideriamo ad esempio il casosemplice in cui abbiamo un atomo che può esistere in diversi livelli energeticiEn . Allora gli atomi che si trovano in un certo livello sono considerati come unaben definita specie chimica, e si hanno tante specie chimiche quanti sono i livelli.Allora il passaggio da un livello a un altro viene considerato come la reazioneche conduce da una specie chimica ad un’altra, e si applica la legge delle reazionichimiche (o legge di azione di massa).

Si noti che il medesimo procedimento cui accennava Einstein nel suo articolodel 1917 venne esplicitamente seguito da Fermi nel suo articolo del 1923, dal titoloSulla probabilità degli stati quantici, riportato come contributo n. 17 a, a pag.118 delle Note e Memorie. In tale articolo egli mostra come si possa superare ladifficoltà relativa alla funzione di partizione dell’atomo di idrogeno, che è datada una serie divergente.

2.3 La distribuzione di Maxwell–Boltzmann nel limitedel continuo, e il teorema di equipartizione dell’e-nergia

Passando al continuo (è proprio questo il passaggio che verrà poi eliminato daPlanck nella sua seconda comunicazione), in luogo dei numeri di occupazionenk si ottiene una densità nello spazio µ (numero di sottosistemi per unità divolume nello spazio µ). Questa viene denotata da Boltzmann con la lettera f .La densità di massima probabilità, che denoteremo con f ∗, è allora data da

f ∗(q , p) =Ne−βH (q , p)

Z (β)(2.3.1)

43Tra l’altro, questo fatto sembra avere una analogia con procedimento termodinamico, dovutoa Kramers, per giustificare la distribuzione di Bose–Einstein. Si veda il libro di Whittaker, A historyof the theories of ether and electricity.

44E. Fermi, Thermodynamics, Dover (New York, 1956), pag. 101.

Fondamenti della meccanica quantistica: Boltzmann 47

con

Z (β) =∫

e−βH (q , p) dq d p . (2.3.2)

In analogia con il caso discreto si ha allora

UN=∫

H (q , p) f ∗(q , p)dqd p =

H (q , p)e−βE(q , p) dq d p∫

e−βE(q , p) dq d p(2.3.3)

ovveroUN=− ∂

∂ βlogZ . (2.3.4)

Il teorema di equipartizione

Il risultato più rilevante della teoria cinetica è il teorema di equipartizione. Lo di-scutiamo qui nella sua forma più semplice possibile. Succede che per una grandis-sima categoria di sistemi (pensati come costituiti di un enorme numero di sotto-sistemi identici) l’hamiltoniana di un singolo sottosistema è la somma di un certonumero l di termini quadratici nelle posizioni o nei momenti, con coefficienticostanti. Ad esempio, nei casi della particella libera e dell’oscillatore armonico,che sono quelli che maggiormente ci interesseranno, si ha rispettivamente45

H =1

2m

p2x + p2

v + p2z�

H =1

2mp2+

12κx2 =

ω

2

� p2

mω+mω x2�=

ω

2(P 2+Q2) .

Nel caso della molecola monoatomica non puntiforme bisognerebbe tenere con-to dei gradi di libertà rotazionali che entrano nell’energia cinetica e hanno unastruttura più complicata, come anche i gradi di libertà rotazionali della moleco-la biatomica (invece, la “molla” che descrive le oscillazioni della distanza tra gliatomi può essere descritta come un oscillatore armonico).

Dunque l’energia meccanica E del sistema totale risulta decomposta nellasomma di l contributi E = E (1) + E (2) + . . .+ E (l ), e possiamo pensare che inmaniera analoga si decomponga anche l’energia termodinamica U ,

U =U (1)+U (2)+ . . .+U (l ) (2.3.5)

Si ha allora la

45Per l’oscillatore armonico, si introduce la frequenza ω mediante ω2 = κ/m. Poi si effettua lafattorizzazione di ω in maniera da potere eseguire una trasformazione canonica (x, p)→ (Q, P ),perchè allora x e p risultano rispettivamente moltiplicati e divisi per il medesimo fattore,

pmω.

48 Andrea Carati e Luigi Galgani

Proposizione 1 (Teorema di equipartizione dell’energia) . Si consideri un si-stema costituto di N sottosistemi identici. L’hamiltoniana di ogni sottosistema sia lasomma di l termini quadratici nelle posizioni o nei momenti, e sia

U =l∑

j=1

U ( j )

la corrispondente decomposizione dell’energia termodinamica U . Se il sistema sitrova nello stato di Maxwell–Boltzmann (nel continuo) allora tutti gli l terminiU ( j ) in cui si decompone l’energia totale contribuiscono per la medesima quantità(equipartizione !), data da

U ( j ) =N1

2β, j = 1, . . . l . (2.3.6)

Dimostrazione.

La dimostrazione è elementare. La difficoltà consiste solo nel trovare notazionigenerali ma semplici. Sceglieremo di trattare un caso particolare, considerandodunque un sistema costituito di N oscillatori armonici identici, ciascuno conhamiltoniana che scriviamo nella forma

H (x, p) = a p2+ b x2 .

All’energia totale E o equivalentemente all’energia totale termodinamica U con-tribuiscono due termini, quello corrispondente al termine di energia cineticaa p2 in H e quello corrispondente al termine di energia potenziale b q2 in H . Lidenoteremo con U (ki n), U (pot ).

Basta ora calcolare l’energia totale termodinamica secondo la formula genera-le (2.3.4). Si osservi che la funzione di partizione, che coinvolge l’hamiltonianaH di un sottosistema, si fattorizza, con un fattore in corrispondenza di ognitermine quadratico dell’hamiltoniana:

Z =Z (ki n) · Z (pot ) ,

Z (ki n) =∫

e−βa p2d p , Z (pot ) =

e−βb q2dq ,

e dunque si ha U =U (ki n)+U (pot ) con

U (ki n) =−N∂

∂ βlogZ (ki n) , U (pot ) =−N

∂ βlogZ (pot ) ,

Ma ad esempio si ha

Z (ki n) =∫

e−βa p2d p = c

1p

β

Fondamenti della meccanica quantistica: Boltzmann 49

dove c è una costante46 indipendente da β. Qui sta tutto il “trucco”, perché dob-biamo prendere il logaritmo, ed eseguire la derivata rispetto aβ, sicché le costantimoltiplicative indipendenti da β sono irrilevanti. Si noti che nell’eseguire la de-rivata del logaritmo sparisce anche la dipendenza dalla costante a che entra in c ,e caratterizza le diverse specie chimiche. Si trova in tal modo U (ki n) = N/(2β).Evidentemente il calcolo per il termine potenziale è assolutamente identico.

Non è difficile dimostrare che il medesimo risultato vale anche nel caso deitermini quadratici che descrivono le parti rotazionali dell’energia cinetica47

Complementi: il teorema di equipartizione con il procedimento di Einstein. Se-guiremo qui, per dimostrare il teorema di equipartizione, il procedimento che sembraessere quello preferito da Einstein, come si vede ad esempio leggendo il suo lavoro suicalori specifici.

Abbiamo evidentemente

U (ki n)

N=

∫ ∫

a p2 e−β�

a p2+b x2�

dxd p∫ ∫

e−β�

a p2+b x2�

dxd p=

a p2 e−βa p2d p

e−βa p2 d p

dove i due integrali sono entrambi estesi a tutto l’asse reale; scrivendoli come integraliripetuti, un integrale si elimina tra numeratore e denominatore. Dunque, estraendo ilfattore dimensionale 1/β,48 si ha

U (ki n)

N=

t 2 e−t 2dt

e−t 2 dt.

Già questo costituisce il risultato principale, perché il fattore a, che distingue una specieatomica da un’altra, è stato eliminato. Inoltre, scambiando il ruolo di p e q , allo stessomodo si ottiene anche

U (pot )

N=

t 2 e−t 2dt

e−t 2 dt,

e quindi abbiamo già ottenuto il teorema di equipartizione (i due termini portano ilmedesimo contributo all’energia totale).

Comunque si determina subito il fattore adimensionale che resta da calcolare, e sitrova

t 2 e−t 2dt

e−t 2 dt=

12

.

46c = (∫

e−t 2dt )/p

a.47Il metodo più semplice è indicato nel libro G. H Wannier, Statistical Physics, Dover (New

York, 1966), pag. 76. Si osserva che in ogni caso il momento p entra in maniera quadratica, e ilfattore a, invece di essere costante, dipende da una variabile q , un angolo. Ancora si usa la legge diMaxwell–Boltzmann, e si eseguono gli integrali come integrali “ripetuti”, ciascuno rispetto ad unadelle variabili. Allora eseguendo l’integrale su p il fattore a(q) “esce” dall’integrale, e si semplificacon l’analogo fattore al denominatore, esattamente come nel caso di a costante.

48Si compie il cambiamento di variabilip

βa p = t . Si usa dire che in tal modo “siadimensionalizza la variabile di integrazione.

50 Andrea Carati e Luigi Galgani

come si vede eseguendo al denominatore una integrazione per parti (nella quale il termi-ne finito si annulla) e si trova che il denominatore è il doppio del numeratore.49

Conseguenze

Ora, questo risultato conduce alla seconda identificazione fondamentale (dopo laidentificazione E ≡ U ) tra quantità termodinamiche e quantità meccaniche, ov-veroβ= 1/kB T . D’altra parte è evidente che esso estende il risultato di Clausius,perché permette di ottenere le espressioni dei calori specifici. Vedremo tuttaviache i calori specifici predetti dal teorema di equipartizione corrispondono ai datisperimentali solo parzialmente, e anzi sono qualitativamente inadeguati per bas-se temperature e/o alte frequenza. Questo è appunto il fatto che darà origine allacrisi che condurrà all’introduzione della MQ. Si ha anzitutto il

Corollario 1 (Identificazione di β) . Si ha la seconda identificazione fondamen-tale

β=1

kB T, (2.3.7)

e dunque

U ( j ) =NkB T

2, j = 1, . . . l . (2.3.8)

Infatti, il contributo dei baricentri all’hamiltoniana H di un singolo sottosistema è datodai 3 termini quadratici, sicché in base al teorema di equipartizione il corrispondentecontributo U (c m) all’energia termodinamica U è dato da

U (c m) =N3

2β.

D’altra parte, in base al teorema di Clausius si ha

U (c m) =32

N kB T .

e quindi segue la (2.3.7).

Si ha poi il secondo risultato, che di fatto estende quello di Clausius. Si os-servi che i gas perfetti non sono completamente caratterizzati dall’equazione distato pV = N RT , perché i loro calori specifici dipendono dalla loro costitu-zione (atomi, molecole, eccetera). In altri termini, i calori specifici dipendononon solo dalla energia cinetica delle molecole, ma anche dalla loro energia po-tenziale. Al problema del calcolo dei calori specifici una risposta viene data dalteorema di equipartizione. Infatti, mettendo insieme la decomposizione (2.3.5)con il teorema di equipartizione (2.3.6) segue immediatamente il

49Si ha∫

e−t 2dt =−

t d e−t 2= 2

t 2e−t 2d t .

Fondamenti della meccanica quantistica: Boltzmann 51

Corollario 2 (Calori specifici nello stato di MB) . Si consideri un sistema costi-tuto di N sottosistemi identici, e l’hamiltoniana di ogni sottosistema sia la sommadi l termini quadratici nelle posizioni o nei momenti (a coefficienti costanti). Se ilsistema si trova nello stato di Maxwell–Boltzmann (nel continuo), allora l’energiatermodinamica U (T ) in funzione della temperatura è data da

U (T ) =l2

N kB T . (2.3.9)

Pertanto la capacità termica ∂T U e il calore specifico (capacità termica di una mole)sono dati da

∂ U∂ T(T ) =

l2

N kB , CV (T ) =l2

R , (2.3.10)

dove R=NAkB è la costante dei gas.

Difficoltà del principio di equipartizione per le molecole e per i solidi

Per le molecole monoatomiche, nell’approssimazione in cui si trascura il con-tributo all’energia termodinamica (o energia interna) dovuto alle rotazioni, ilcalore specifico teorico è (3/2)R, indipendente dal numero atomico. Questo va-lore è ben verificato per molecole monoatomiche, ma il fatto strano è che essoè ben verificato anche in casi in cui sembrerebbe più adeguato un modello deltipo delle sfera rigida, sicché non si comprende (in ambito classico) perché sia le-cito trascurare il contributo dell’energia rotatoria.50 Abbiamo già ricordato chequesto fatto stava molto a cuore a Boltzmann.

In effetti, le verifiche sperimentali venivano condotte non direttamente sulvalore del calore specifico, perché questo coinvolge la costante dei gas R, il cuivalore era conosciuto entro una notevole incertezza. Si preferiva allora fare rife-rimento a una quantità nella quale scompariva R. Questa quantità è il rapportoγ tra calore specifico a pressione costante e quello a volume costante. Infatti,poiché dalla prima legge della termodinamica si ha (per una mole di sostanza)

Cp =CV +R ,

ricordando che, come appena mostrato, secondo il principio di equipartizione siha

CV =R2

l ,

dove l è il numero di termini quadratici che costituiscono l’energia totale di unsottosistema, risulta infine che il principio di equipartizione comporta

γdef=

Cp

CV= 1+

2l

. (2.3.11)

50NOTA PER Gli AUTORI. Riportare i valori messi in tabella da Rayleigh.

52 Andrea Carati e Luigi Galgani

Si noti tra l’altro che evidentemente il risultato è indipendente dal numero dimoli della sostanza su cui si compie la misura.

Dunque misurando γ si determina l come

l =2

γ − 1. (2.3.12)

Secondo il principio di equipartizione, ci si aspetterebbe quindi di trovare valoridi 2/(γ − 1) vicini ad interi.

Invece in generale i risultati sono molto discordanti. I contributi rotatori perle molecole monoatomiche non si manifestano, quelli rotatori per le molecolebiatomiche si manifestano, ma non sempre, e in genere non in maniera adeguata.Lo stesso avviene per il termine di energia potenziale nelle molecole biatomiche,ed in generale anche per le molecole poliatomiche.

In conclusione, la situazione può descriversi dicendo che il numero dei termi-ni quadratici efficaci di energia cinetica o potenziale dipende dalla temperatura ein generale non coincide con un intero. Questo numero in generale diminuisce aldecrescere della temperatura: alcuni gradi di libertà appaiono come dormienti,51,e non sono efficaci.

Una situazione analoga si presenta per il calore specifico dei solidi. Se siammette che il contributo termico sia dovuto ad atomi o ioni che oscillano at-torno a posizioni di equilibrio, indipendenti l’uno dall’altro, allora si avrebbeun calore specifico indipendente dalla temperatura, e proporzionale al numeroatomico della sostanza considerata. Questa proprietà fu in effetti osservata speri-mentalmente da Dulong e Petit addirittura prima che si dimostrasse il teorema diequipartizione, e veniva utilizzato perfino per stimare il numero atomico dellesostanze. Ma vi erano delle nubi o ombre, perché questa proprietá non era veri-ficata, a temperatura ambiente, per tutte le sostanze, e inoltre, generalmente, ilcalore specifico sembrava diminuire al decrescere della temperatura. Anche qui,come per i gas, si avevano dei gradi di libertà dormienti.

Ci proponiamo di riportare altrove citazioni da Boltzmann, da Kelvin e daRayleigh. Per cominciare, tuttavia, preferiamo citare quasi alla lettera quelloche dice Einstein nel suo lavoro sui calori specifici del 1907. Vedremo che ilproblema centrale si presenta in due forme apparentemente diverse, ma in realtàcomplementari.

Citiamo da Einstein (pag. 194 dell’edizione italiana). Anzitutto egli ricor-da il successo del teorema di equipartizione nello spiegare la legge di Dulong ePetit, dicendo: “Possiamo rappresentarci nel modo più semplice il moto termico neisolidi immaginando che i singoli atomi contenuti nel corpo compiano oscillazionisinusoidali attorno alle posizioni di equilibrio. In tali ipotesi, applicando la teoriacinetico–molecolare [ovvero, il principio di equipartizione], e tenendo conto delfatto che a ogni atomo competono tre gradi di libertà, si deduce che il calore specifi-co, riferito al grammo equivalente [cioè ad una mole] è 3 R n, ovvero, in calorie,

51Il termine dormancy è proprio quello che viene comunemente usato. Si veda G.H. Wannier,Statisticall physics, Dover (New York, 1966), pag. 78–80, 114–115, 215, 224, 258.

Fondamenti della meccanica quantistica: Boltzmann 53

5.94 n, dove n è il numero di atomi in una molecola.52 Come è noto, questa rela-zione è soddisfatta con ottima approssimazione per la maggior parte degli elementi eper molti composti allo stato solido (legge di Dulong e Petit, regola di F. Neumann eKopp).”

Ma poi continua: “A un esame più attento si incontrano due difficoltà chesembrano limitare fortemente l’applicabilità della teoria molecolare.

Anzitutto vi sono elementi (carbonio, boro e silicio) che allo stato solido posseg-gono, a temperatura ambiente, un calore atomico specifico notevolmente inferiore a5.94 n. Inoltre tutti i composti solidi che contengono ossigeno, idrogeno o almenouno degli elementi sopra menzionati, hanno un calore specifico per mole più piccolodi 5.94 n.

In secondo luogo Drude, riconducendo le frequenze proprie infrarosse a oscilla-zioni degli atomi (ioni atomici), e le frequenze proprie ultraviolette a oscillazioni dielettroni, ha dimostrato che i fenomeni ottici (la dispersione) portano ad attribuire aciascuna molecola più masse elementari mobili tra loro indipendenti. Da qui nasceper la teoria cinetico–molecolare del calore una seconda difficoltà significativa, perchéil calore specifico dovrebbe superare di parecchio il valore 5.94n, dato che il numerodi masse puntiformi mobili per molecola è maggiore del numero dei suoi atomi.” 53

Fermiamoci qui. La prima difficoltà è semplice da capirsi, ed è di tipo pre-valentemente quantitativo (ma non del tutto): i valori dei calori specifici sonodiversi da quelli previsti. Dopo Planck ed Einstein (come vedremo più avanti),oggi sappiamo che questa difficoltà si supera affermando che secondo la meccani-ca quantistica l’energia media di un oscillatore dipende dalla temperatura secondouna formula che contiene anche la frequenza (la legge di Planck, per l’appunto),e questo sostanzialmente “spiega” i fatti.

Il secondo punto è più sottile, ma presumibilmente è ancora una diversa for-ma del primo punto. Einstein ricorda che Drude ha fatto presente che nei so-lidi ci sono non solo gli ioni (che oscillano secondo frequenze infrarosse), maanche gli elettroni, e che questi, secondo il principio di equipartizione, dovreb-bero avere anch’essi la loro parte (il loro share) di energia, contribuendo almenoquanto gli ioni. Questa difficoltà, come è ben noto, venne in seguito superata,nell’ambito della meccanica quantistica, utilizzando per gli elettroni la statisticadi Fermi–Dirac.

Si incontrano poi altri problemi analoghi. In generale, possiamo dire, il pro-blema è di stabilire quale sia il numero di gradi di libertà di un sistema. Per unatomo si devono contare i gradi di libertà rotazionali? Dai dati sperimentali sem-bra di no. Per una molecola biatomica, i due termini che entrano nell’energiadella “molla”, relativo al la distanza tra i due atomi, devono essere presi in con-to? Anche su questi problemi la meccanica quantistica sembra dare una rispostacorretta, come vedremo.54

52Einstein sta considerando il caso più generale, di molecole non monoatomiche.53NOTA PER GLI AUTORI. Questi argomenti sono illustrati in modo ancora migliore nel

contributo di Einstein alla Conferenza Solvay.54NOTA PER GLI AUTORI. Resta tuttavia un certo problema di principio, riguardo il nume-

54 Andrea Carati e Luigi Galgani

Il principio di equipartizione nella teoria dei campi, in particolare nel pro-blema del corpo nero

NOTA DIDATTICA. Questa parte deve essere riscritta. Riportiamo tuttaviauna versione preliminare con il contributo di Rayleigh nel suo lavoro del (maggio?) 1900. -

Veniamo ora a Rayleigh, e al suo articolo di due pagine e mezzo del giugno1900.55 A differenza di Planck (il cui approccio sarà illustrato nel prossimo Ca-pitolo), egli non prende in considerazione l’interazione dinamica tra risonatorimateriali e campo elettromagnetico, ma si limita a considerare i gradi di libertàdel campo elettromagnetico, pensato come un sistema analogo alla corda vibran-te, la cui energia può essere decomposta formalmente in energie di oscillatoriarmonici (i modi normali di oscillazione – vedi sotto), sicché ad ognuno di talioscillatori (formali, o virtuali, come potremmo dire) dovrebbe essere assegnata,secondo il teorema di equipartizione, una energia media kB T . Ovvero, come eglidice, “According to the Boltzmann–Maxwell doctrine of the partition of energy, eve-ry mode of vibration should be alike favoured.”. Questo atteggiamento (di fare usodel conteggio dei modi che illustreremo poco sotto), condurrebbe, per la den-sità di energia uν del campo elettromagnetico di frequenza ν (si veda il capitoloseguente), alla cosiddetta legge di Rayleigh–Jeans

uν (T ) =8πν2

c3kB T , (2.3.13)

che è palesemente assurda, perché non presenta decadimento alle alte frequenzeed addirittura produce una densità di energia (energia per unità di volume) infi-nita. Dunque, tenendo un atteggiamento pragmatico, Rayleigh prende atto dellavalidità della legge di decadimento di Wien per le alte frequenze, e si limita adammettere che la legge di equipartizione sia adeguata solo nel caso asintotico del-le basse frequenze (o equivalentemente delle alte temperature). Infatti, dopo lafrase sopra riportata, egli immediatamente aggiunge “And although for some rea-son not yet explained the doctrine fails in general, it seems possible that it may applyto the graver modes”, e pertanto, avendo eseguito il conteggio dei modi normali

ro dei gradi di libertà da assegnare a un sistema. Ad esempio, perché nel calcolo del numero digradi di libertà non dobbiamo comprendere anche i nucleoni (protoni e neutroni) che costitui-scono i nuclei? Sembra che ai nuclei si attribuisca una temperatura di circa 1014K. Quindi nonsono in equilibrio con il baricentro dell’atomo, che ha una temperatura ordinaria. Essi hannouna grandissima energia, ma non la scambiano con noi. Come avviene per le due popolazioni inequilibri separati che si incontrano nel caso delle molecole biatomiche (orto idrogeno e para idro-geno). Possibile via d’uscita dalle difficoltà secondo Boltzmann e Rayleigh. Rilevanza dei tempidi rilassamento, e congettura dei tempi lunghi. Paragrafo non è ancora stato scritto. Si veda A.Carati, L. Galgani, B. Pozzi, The Problem of the Rate of Thermalization and the Relations betweenClassical and Quantum Mechanics , in Mathematical Models and Methods for Smart Materials, editedby M. Fabrizio et al., Series of Advances in Mathematics n. 62, World Scientific (Singapore, 2002).Disponibile nelle home page degli autori di queste note.

55Rayleigh, Remarks upon the law of complete radiation, Phil. Mag. 49. 539 (1900), Opere Vol.5, n. 260, pag. 259.

Fondamenti della meccanica quantistica: Boltzmann 55

tra ν e ν + dν (egli in effetti si riferisce alla decomposizione in lunghezze d’onda)propone le legge che, scritta in termini di frequenze, ha la forma

uν (T ) = c1ν2 kB T e−c2 ν/T . (2.3.14)

Per quanto riguarda il conteggio del numero dei modi normali, prendiamociil piacere di leggere le sue stesse parole. In effetti, egli determina tutto a menodi costanti moltiplicative, prendendo uguale ad uno la velocità di propagazio-ne: daremo subito sotto la forma completa dell’espressione. Egli dunque così siesprime.

“Let us consider in illustration the case of a stretched string vibrating transversally. Ac-cording to the Boltzmann–Maxwell law the energy should be equally divided among all themodes, whose frequencies are as 1,2,3, . . .. Hence, if k be the reciprocal of λ, representing thefrequency, the energy betweem the limits k and k+dk is (when k is large enough) representedby dk simply.

When we pass from one dimension to three dimensions, and consider for example thevibrations of a cubical mass of air, we have (Theory of Sound, section 247) as the expressionfor k2,

k2 = p2+ q2+ r 2 ,

where p, q , r are integers representing the number of subdivision in the three directions. If weregard p, q , r as the coordinates of points forming a cubic array, k is the distance of any pointfrom the origin. Accordingly the number of points for which k lies between k and k + dk ,proportional to the volume of the corresponding spherical shell, may be represented by k2dk ,and this expresses the distribution of energy according to the Boltzmann–Maxwell law, as faras regards the wavelength or frequency.”

Poi egli conclude dando, a meno di fattori moltiplicativi, la forma della co-siddetta legge di Rayleigh–Jeans (2.3.13) che seguirebbe dal principio di equipar-tizione, e infine la legge (2.3.14) che egli propone, che corrisponde ad assumerel’equipartizione soltanto for the graver modes (per i modi più gravi, ovvero per imodi di bassa frequenza).

Per completezza ricordiamo che, come si controlla immediatamente, la for-mula per il conteggio dei modi tra ν e ν+dν per una campo scalare tridimensiona-le caratterizzato da una velocità c (ricavata con il metodo spiccio di Rayleigh)56risulta essere

dNν =4πν2

c3dν .

Nel caso del campo elettromagnetico, a causa del carattere vettoriale del campo,che comporta due possibili polarizzazioni, si hanno poi due vibrazioni trasversalianziché una sola, e la formula diventa

dNν =8πν2

c3dν .

56Metodi più sofisticato furono trovati da Hermann Weyl e da David Hilbert.

56 Andrea Carati e Luigi Galgani

Si riottiene così la formula (3.3.1) di Planck, letta peró in modo diverso, perchéora Uν non è l’energia media di un oscillatore materiale (risonatore) in equilibriodinamico col campo elettromagnetico, ma l’energia media di un oscillatore for-male, un modo normale di oscillazione del campo. Ovviamente, se si considerail campo libero, ogni modo normale di oscillazione mantiene inalterata la suaenergia, che è una costante del moto, e si deve pensare che queste infinite ener-gie del campo, che sono costanti del moto nel caso del campo lineare, venganorimescolate a causa di una mutua interazione, che si dovrebbe pensare determi-nata dall’interazione del campo con dei risonatori materiali. Allora chiaramenteRayleigh pensa al tipico fenomeno della risonanza secondo cui oscillatori aventifrequenza vicina (l’uguaglianza di due frequenze è il prototipo della risonanza)si scambiano continuamente l’energia. Dunque le loro energie sono altamentefluttuanti, in modo tale che le loro energie medie siano uguali. Potremmo deno-tare tale principio come “principio di equipartizione debole”, ovvero principio diequipartizione per risonanza, ristretto a oscillatori aventi frequenze molto vicine.

Capitolo 3

Planck e il corpo nero:19 ottobre e 14 dicembre 1900

Dopo le discussioni date nell’ultimo paragrafo del capitolo precedente, si capisceperché il corpo nero occupasse un posto così rilevante nella Fisica Teorica di fine‘800. Era infatti il banco di prova per tre nuove discipline, elettromagnetismo,termodinamica, meccanica statistica, nate tutte nella seconda metà del secolo: maqueste sembravano in qualche modo essere inconciliabili tra di loro. Ed infattila soluzione proposta da Planck ai problemi legati al corpo nero, portò ad unavera rivoluzione nella concezione della Natura, tra le maggiori mai avvenute inogni epoca. In questo capitolo cominceremo coll’illustrare la fenomenologia delcorpo nero, proseguendo poi con i lavori di tipo termodinamico di Planck per lasua deduzione della legge di Wien, fino alla crisi avvenuta quando nuove misuresperimentali rivelarono l’inadeguatezza della legge di Wien stessa. Mostreremocome dunque Planck fu costretto a proporre una nuova legge fenomenologica (lalegge di Planck appunto) che riuscirà a giustificare tramite dei ragionamenti ditipo meccano–statistici a patto di introdurre i cosíddetti quanti di energia.

3.1 Il corpo nero come sistema termodinamico

Richiami sul corpo nero. La legge di Kirchhoff

Una descrizione compatta e molto bella del problema del corpo nero è data daFermi, nel suo libro Fisica Atomica, cap. IX, paragrafo 4 (Spettro del corpo nero),pag 276 e seguenti.

È noto che un corpo incandescente emette luce, e dunque radiazione elettro-magnetica. Così avviene ad esempio per il Sole, la cui radiazione era stata stu-diata sperimentalmente in maniera spettroscopica (cioè come essa venga dispersada un prisma), determinandone lo ‘spettro”, ovvero l’intensità in funzione del-la frequanza ν (o della corrispondente lunghezza d’onda λ). Come è noto, talespettro si estende ben oltre lo spettro visibile, nell’infrarosso e nell’ultravioletto.

57

58 Andrea Carati e Luigi Galgani

Le esperienza più significative a questo proposito erano state condotte in Italiada Macedonio Melloni e da A.G. Bartoli.1

Ricordiamo che, come è ben noto, lo spettro di un corpo incandescente (in-tensità in funzione della frequenza, o della lunghezza d’onda) ha la forma grosso-modo di una campana asimmetrica, con un decadimento maggiormente piccatodalla parte delle alte frequenze.

Ricordiamo anche che, come il più semplice modello di gas è il gas perfetto,così l’esempio ideale di corpo incandescente è il cosiddetto corpo nero, ovveroun corpo che assorbe tutta la radiazione che incide su di esso. Il motivo è le-gato ad una fondamentale legge stabilita da Kirchhoff, il quale aveva introdottoi classici procedimenti della termodinamica nello studio della radiazione elet-tromagnetica, in relazione al potere emissivo “e” e potere assorbente “a” di uncorpo.

Se e(ν,T )dν è la quantità di energia raggiante, appartenente all’intervallo di frequenzatra ν e ν+dν, che viene emessa, per unità di tempo, dall’unità di superficie del corpo,2 allatemperatura T , allora e viene chiamato potere emissivo del corpo. Invece si dice potereassorbente a di un corpo il rapporto tra la quantità di energia assorbita e quella incidentesul corpo (Fermi, pag. 219–220).

NB. Si noti che l’uso del medesimo termine “potere” (emissivo o assorbente) per le duequantità è fuorviante. Si tratta di due quantità fisiche di natura completamente diversa:il potere emissivo è dimensionale, mentre il potere assorbente è un puro numero.

In particolare, in base alle leggi della termodinamica, nel 1859Kirchhoff avevadedotto che il rapporto tra potere emissivo e potere assorbente relativi a unafrequenza ν alla temperatura T è uguale per tutti i corpi, ed è dunque della forma

ea= E (ν,T )≡Eν (T ) ,

dove E è una funzione universale della temperatura e della frequenza.Per definizione si dice corpo nero un corpo che assorbe completamente la

radiazione incidente, ovvero che ha potere assorbente pari a uno, per cui cioèa = 1. Pertanto, la funzione universale Eν (T ) rappresenta il potere emissivo di uncorpo nero.

A proposito del corpo nero così si esprime Fermi (pag. 278):“Osserviamo che la realizzazione più perfetta di una superficie nera è data da un

piccolo foro che immetta in una grande cavità; infatti la luce che penetra nella cavitàattraverso al foro deve subire numerose riflessioni sulle pareti interne della cavità pri-ma di potere uscire dal foro di accesso e viene assorbita quasi completamente in questeriflessioni multiple. È questa la ragione per cui l’imboccatura di una grotta oppure laporta di una chiesa o di una grande sala appaiono nere a chi la vede dall’esterno.”

1A.G. Bartoli, Sopra i movimenti prodotti dalla luce e dal calore, Le Monnier (Firenze, 1876).2Il fatto che l’energia emessa sia proporzionale alla superficie del corpo, e non al suo volume, è

una proprietà fondamentale, che non ha ancora ricevuto una “spiegazione” microscopica. È nostraopinione che la spiegazione possa essere trovata nell’ambito della “teoria di Wheeler e Feynman”.

Fondamenti della meccanica quantistica: Planck 59

Naturalmente, se all’interno della cavità è presente della radiazione, questapotrà essere emessa attraverso il foro, come un gas che fuoriesca da un recipientebucato. La radiazione elettromagnetica entro una cavità può dunque essere pen-sata come una qualche specie di sostanza avente certe sue proprietà termodinami-che specifiche che la caratterizzano, allo stesso modo in cui certe altre proprietàspecifiche caratterizzano macroscopicamente, dal punto di vista termodinamico,ad esempio la “sostanza” gas perfetto.

Funzioni di stato della termodinamica del corpo nero: l’energia interna e lapressione

Seguiamo qui il libro di Planck Wärmelehrung, la cui seconda edizione del 1912(la prima è del 1906) è disponibile in traduzione inglese, e facilmente accessibile.Una presentazione molto bella e compatta si trova anche nel bellissimo libro diMax Born, Atomic Physics, Dover (New York, 1969), Capitolo VII, pag. 204 eseguenti, e Appendici XXXIII–XXXIV.

La prima funzione di stato che si considera è l’energia interna, che qui deno-tiamo conU , per la quale si ammette che valga

U (T ,V ) =V u(T ) , (3.1.1)

dove la funzione u(T ) può essere chiamata densità di energia (rispetto al volume),ovvero energia per unità di volume. Si noti bene che questa è un’ipotesi tutt’altroche ovvia per una sostanza termodinamica. Infatti, ad esempio il gas perfetto è ad-dirittura caratterizzato dal fatto che l’energia interna, pur essendo proporzionalealla massa del gas, è indipendente dal volume in cui il gas è contenuto.

Questa forma dell’energia interna è dimostrata da Planck nella sezione 22 del suo libro,e sarebbe dovuta unicamente al fatto che la luce si propaga con velocità finita. Comun-que, la si potrebbe ritenere ragionevole come proprietà valida per ogni campo (e quindiin particolare per il campo elettromagnetico), perché per i campi l’energia totale risultaessere l’integrale di una densità di energia locale (funzione del posto). Se si ha omoge-neità, ovvero la densità non dipende dal posto (come dovrebbe avvenire all’equilibriotermico), si ha allora immediatamente la (3.1.1).

La seconda relazione è quella che prende il posto dell’equazione di stato delgas perfetto, pV = N RT (dove N è il numero di moli). Nel caso del corponero tale relazione viene rimpiazzata da

p =u(T )

3. (3.1.2)

È questa infatti la relazione che era stata sostanzialmente stabilita teoricamenteda Maxwell sulla base delle sue equazioni per il campo elettromagnetico.3

3NOTA PER GLI AUTORI. Vedere come mai nel libro di Drude (pag. 490 dell’edizioneinglese) si mostra – e in maniera molto semplice e bella – p = u(T ) senza il fattore 1/3. Forse siha qui il problema citato da Boltzmann nel suo lavoro?

60 Andrea Carati e Luigi Galgani

L’analogia con la legge del gas perfetto diventa ancora più evidente se si moltiplica larelazione (3.1.2) per il volume V , perché allora essa prende la forma

pV =13U , (3.1.3)

dove U è l’energia elettromagnetica (ma si veda la precisazione data subito sotto) con-tenuta nel volume V . D’altra parte, nella deduzione microscopica data da Clausius lalegge del gas perfetto ha la forma

pV =23

K c m

dove la barra denota media temporale, e K c m denota l’energia cinetica totale dei baricen-tri delle molecole costituenti il gas.

Analogamente, a destra della (3.1.3) compare una quantità microscopica, che è l’e-nergia del campo elettromagnetico.4

Vedremo tuttavia più avanti che la analogia del corpo nero con il gas perfetto vale inmaniera solo nel limite di altre frequenze e/o basse temperature, nel quale il corpo neroè descritto dalla legge di Wien anziché dalla legge di Planck. Questo fu dimostrato nelcelebre articolo del 1905 di Einstein, dal quale si vede che l’analogo delle molecole delgas sono quelli che oggi chiamiamo fotoni.

Ricordiamo brevemente che il campo elettromagnetico “microscopico” (secondo laconcezione di Lorentz e Planck) è descritto da campi vettoriali E(x, t ) (campo elettrico)e B(x, t ) (campo magnetico) che ubbidiscono alla leggi di Maxwell (scritte nelle unità diGauss) seguenti

divE= 4πρ(x, t ) , rotE=−1c∂ B∂ t

divB= 0 , rotB=4πc

j(x, t )+1c∂ E∂ t

,

dove si è indicata con c la velocità della luce nel vuoto, e con ρ e j rispettivamente ladensità di carica e di corrente. La densità di energia “microscopica” è allora data da

E(x, t ) =E2(x, t )+B2(x, t )

mentre la forza a livello “microscopico” può ottenersi a partire dal tensore degli sforzi

Ti ,k (x, t ) =1

Ei (x, t )Ek (x, t )+Bk (x, t )Bi (x, t )�

− 12E(x, t )δi ,k ,

Viceversa le quantità macroscopiche, come l’intensità I di irraggiamento, la pressione p,o la stessa densità di energia u(T ), devono essere intese come opportune medie su tempi“lunghi” rispetto ai tempi della dinamica microscopica, e su volumi “grandi” rispetto alledimensioni atomiche.5

4Più precisamente, si tratta della parte radiativa, come discuteremo più avanti. Qui vi è unaanalogia con la legge del gas perfetto, perché in quel caso quella che entra non è tutta l’energiacinetica, ma solo quella dei baricentri delle molecole. A dire il vero, qui vi sarebbe un puntodelicato, su cui ora sorvoliamo.

5NOTA PER GLI AUTORI. Inserire lo spettro alla Wiener, che si trova qui con il percento.

Fondamenti della meccanica quantistica: Planck 61

Il fattore 1/3 che entra nell’equazione di stato (3.1.2) segue proprio facendo questemedie dei valori microscopici, come spiegato da Boltzmann nel 1884, e forse prima daAdolfo Bartoli, cui fa riferimento Boltzmann nel suo lavoro.

Relazione tra potere emissivo e densità di energia

A fissata temperatura, si considera non soltanto la densità di energia u ma anchela sua “componente” spettrale di frequenza ν, che denoteremo con uν . Riser-vandoci di definirla meglio più avanti (essendo il problema della sua definizioneassai delicato) ricordiamo solo che intuitivamente uνdν è l’energia (per unità divolume) contenuta nell’intervallo (ν, ν + dν) di frequenza. Si ha dunque

u(T ) =∫ ∞

0uν (T )dν .

Tenendo conto che i campi si propagano alla velocità della luce c Kirchhoffstabilì che tra il potere emissivo Eν (T ) (la quantità effettivamente osservata) delcorpo nero e la “componente” uν vale la semplice relazione di proporzionalità6,7

Eν (T ) =c4

uν (T ) .

La componente uν è la quantità concretamente studiata da Boltzmann, Wien,Planck, in relazione allo spettro del corpo nero.

Nota: curve isoterme e curve isocromatiche. L’intensità spettrale (o l’energia perunità di volume) è dunque una funzione delle due variabili ν, T . Se si considera T comeparametro e si osserva “lo spettro”, ovvero l’energia come funzione di ν, si dice che si staconsiderando una isoterma, una curva che potremmo denotare con uT = uT (ν). Se invecesi considera ν come un parametro, e si pensa l’energia come funzione della temperaturaT , allora si dice che si sta considerando una isocromatica, che potremmo denotare conuν = uν (T ).

I dati sperimentali per le isoterme venivano più frequentemente riportati in funzionedella lunghezza d’onda λ invece che della corrispondente frequenza ν (dove λν = c ), eallora si ha evidentemente una analoga decomposizione

u(T ) =∫ ∞

0uλ(T )dλ .

A questo proposito si deve porre attenzione al fatto che, per ogni assegnata temperaturaT , non si ha la relazione uλ = uν , bensí la relazione

uλ = cλ−2uν (con ν = c/λ) .

6Si veda Planck, Theory of heat radiation, sect. 23, formula (24) dove c è denotata con q e Eν coKν , oppure formula (21) con un fattore 4π (oppure 8π ?)

7NOTA PER GLI AUTORI. Questa formula deve essere qualitativamente sbagliata, perchénon distingue tra energia e energia scambiata, in analogia con quanto avviene nel problema delcalore specifico trattato alla Kubo. Analoga critica si può fare alla legge di Planck per la relazionetra energia Uν del risonatore materiale ed energia uν del campo.

62 Andrea Carati e Luigi Galgani

Figura 3.1: Spettro del corpo nero. Grafico di sette isoterme (intensità vs lun-ghezza d’onda) tra 700 e 1600 °C per lunghezze d’onda tra 1 e 6 µ. Risultatiottenuti da Lummer e Pringsheim nel Novembre 1899.

Fondamenti della meccanica quantistica: Planck 63

Questo si capisce immediatamente se si tiene presente che l’energia contenuta nell’in-tervallo (λ,λ+ dλ) deve essere uguale a quella contenuta nel corrispondente intervallo(ν , ν + dν), ovvero si deve avere8

uλ(T )dλ= uν (T )dν ,

e si usa|dν |= c

λ2|dλ| .

Un esempio di isoterme è riportato in Fig. 3.1, per temperature tra 700 e 1600 °C.Per una discussione relativa a questa figura, si veda il bel libro H. Kangro, Early history ofPlanck’s radiation law, Taylor & Francis (London, 1976). Un esempio di isocromaticheè riportato più avanti, in Fig. 3.2. Si tratta di una figura di importanza fondamentale,perché convinse Planck che la legge di Wien vale solo come legge limite per grandi valoridi ν/T , sicché egli venne forzato a trovare una diversa forma analitica per la legge delcorpo nero.

La legge di Stefan–Boltzmann

Il primo grande risultato teorico dopo il teorema di Kirchhoff del 1859, fu ottenu-to nel 1884 da Boltzmann,9 che dimostrò la formula che era stata precedentemen-te stabilita sperimentalmente da Stefan. Secondo tale “legge di Stefan–Boltzmann”la potenza (energia per unità di tempo) emessa da un “corpo nero” alla tempe-ratura T cresce come la quarta potenza di T . Equivalentemente, in virtù dellarelazione tra potere emissivo e densità di energia u, si ha

u(T ) = σT 4 , (3.1.4)

dove σ è una certa costante, detta la costante di Stefan–Boltzmann.La dimostrazione è una immediata conseguenza dei primi due principi della termodina-mica, applicata al “fluido elettromagnetico”, il quale è caratterizzato dalle due funzionidi stato sopra illustrate, l’energia internaU (3.1.1), e la pressione p (3.1.2).

Il procedimento originale di Boltzmann, esposto in un articolo che fa seguito a unasua nota sui lavori di Bartoli, non è banale da seguirsi. Seguiamo qui la incredibilmentesemplice esposizione di Planck10

Basta ricordare la relazione dU = δQ − pdV che esprime il primo principio, equella che connette calore ed entropia alla luce del secondo principio, dS = δQ/T , dallequali segue immediatamente

dS =dU + pdV

T.

8Formalmente, si scrive la condizione∫ ∞

0uλ(T )dλ=

∫ ∞

0uν (T )dν

e si esegue il cambiamento di variabile.9L. Boltzmann, Wissenschaftliche Abhandunglen, III, Chelsea R.C. (New York, 1968), N. 72,

Vedi anhe N. 71: Ueber eine von Hrn. Bartoli entdeckte Beziehung derWaermestrahlung zum zweitenHauptsatze.

10Wärmelehrung, sezioni 62–63.

64 Andrea Carati e Luigi Galgani

Sostituendo le relazioni U =V u e p = u/3, per la funzione S(T ,V ) si ottiene immedia-tamente (usando dU =V du + udV )

dS =VT

dudT

dT +43

uT

dV .

Ma S è una funzione di stato, e dunque dS un differenziale esatto. Pertanto le duederivate seconde miste devono essere uguali, e si deve avere (come immediatamente siverifica)

dudT=

4uT

.

Questa è una equazione differenziale del primo ordine nella funzione incognita u(T ),che ha evidentemente come soluzione proprio la (3.1.4) con una costante arbitraria σ ,come si vede subito o come può comunque essere immediatamente verificato.

La legge di spostamento di Wien

Un grande passo venne poi compiuto da Wien nel 1896.11 Si osservava, comesi vede dalla figura (3.1), che al variare della temperatura le isoterme del corponero avevano tutte una forma alquanto simile, l’aspetto caratteristico essendoche al crescere della temperatura le curve uν vs ν (delle specie di campane conuna pendenza decisamente più grande dalla parte delle alte frequenze) si alzavano(in accordo col fatto che l’area sottesa deve crescere come T 4 secondo la legge diStefan–Boltzmann), ed inoltre il picco si spostava verso destra,12 precisamentesecondo la legge λmaxT = cost o equivalentemente

νmax = cost T .

Le curve parevano dunque potersi ricondurre tutte ad una unica curva medianteun opportuno riscalamento.

Questo riscalamento fu determinato da Wien con un argomento teorico cheda una parte faceva uso della seconda legge della termodinamica (come già avve-niva nei procedimenti di Kirchhoff, di Bartoli e di Boltzmann), e dall’altra partesi rifaceva ad un argomento che oggi chiameremmo di teoria dei sistemi dinami-ci. Questo riguardava i cosiddetti invarianti adiabatici, particolarmente studiatida Helmholtz (1821–1894) e Boltzmann.

Gli invarianti adiabatici sono sostanzialmente variabili dinamiche che non soltanto sonopraticamente costanti del moto fino a tempi sufficientemente lunghi, ma hanno inoltre

11W. Wien, Wied. Ann 58, 662 (1896).12Un indicazione di questo tipo si ottiene facilmente scaldando uno spillo su un fornello a gas:

inizialmente lo spillo è opaco, poi diventa incandescente il colore passa da un rosso cupo (diciamomattone, circa 600 gradi), poi ciliegia (circa 700 gradi centigradi) poi rosso ciliegia chiaro (circa800 gradi). Con un fornello non si riesce ad ottenere una temperatura superiore, perchè l’energiache irraggia lo spillo è pari a quella fornita dalla fiamma. Se si ponesse lo spillo in un fornoopportunamente costruito, ad esempio per la fusione dell’acciaio, si vedrebbe lo spillo diventarearancione (circa 1000 gradi), poi giallo circa (1200) gradi, poi bianco cominciando a fondere (circa1400 gradi per l’acciaio).

Fondamenti della meccanica quantistica: Planck 65

la proprietà di mantenere il loro valore inalterato anche quando si varia lentamente unparametro. L’esempio più classico è quello delle piccole oscillazioni del pendolo di cuivenga fatta variare lentamente la frequenza (si pensi ad esempio di allungare lentamentela corda a cui il pendolo è sospeso). In tal caso si mostra che, al variare della frequen-za ν col tempo, varia anche l’energia E . Si dimostra però che fino a tempi lunghi re-sta sostanzialmente inalterato il valore del rapporto I ≡ E/ν . L’invariante adiabatico Iha evidentemente le dimensioni di una azione, energia per tempo, come la costante diPlanck.13

Nel caso del corpo nero, questi invarianti adiabatici riguardano l’energia con-tenuta nell’intervallo tra ν e ν + dν quando si sposta lentamente il bordo dellacavità per ottenere un lavoro pdV . Infatti, alla luce di quello che avviene perla corda vibrante (la cui equazione di moto fu stabilita fin dal 1750), tutti sap-piamo che, al variare della lunghezza della cavità indotto dallo spostamento diuna parete, variano anche le frequenze caratteristiche della cavità. Si ha dunqueil problema di connettere l’energia contenuta nell’intervallo tra ν e ν + dν conquella contenuta nel corrispondente intervallo tra ν ′ e ν ′+ dν ′14.

In ogni caso questi argomenti di Wien, esposti nel Capitolo III del librodi Planck, e nell’appendice XXXIII del libro di Born, conducono alla legge dispostamento di Wien

uv (T ) = ν3 f� ν

T

, (3.1.5)

dove f è ora l’unica significativa funzione universale caratteristica del corpo neroche resta da determinare, teoricamente o empiricamente.

Nota. Il più semplice modo per ottenere la legge di spostamento di Wien è quelloillustrato da Einstein alla Conferenza Solvay del 1911 (pare, seguendo Jeans). Il risultatosegue immediatamente da una analisi dimensionale, allo stesso modo in cui si ottiene adesempio la legge per il periodo del pendolo. Notiamo inoltre che, essendo il rapportoνT dimensionale, deve esistere una costante h con le dimensioni di una azione per cui

si abbia f = f�

hνkB T

. D’altra parte, poiché si pensa di fare una teoria microscopicadell’irraggiamento, nella teoria dovrà necessariamente comparire il valore e della caricamicroscopica ed il valore c della velocità della luce. In effetti, a partire da queste duecostanti si ottiene una azione, data da e2/c , valore non molto discosto da h, in quanto siha ħh ' 137 e2/c . Il numero adimensionale α def= e2/ħhc ' 1/137 viene chiamato costantedi struttura fina, e la sua rilevanza venne messa in luce da Sommerfeld nello studio dellastruttura fina delle righe dell’atomo di idrogeno.

13Questo punto fu particolarmente sottolineato da Paul Ehrenfest. Questi mise in luce comein generale la quantizzazione si dovesse ottenere per hamiltoniane che dipendono da variabili diazione, imponendo che ogni azione fosse un multiplo intero di ħh. Nel lavoro del 1914 riportato nellibro di van der Waerden, la frase conclusiva di Ehrenfest è la seguente: “In any case, it seems to methat the validity of Wien’s displacement law shows that reversible adiabatic changes take a prominentplace in the theory of quanta.”

14Secondo i presenti autori, la trattazione data da Wien lascia aperti problemi non banalissi-mi, che potrebbero forse essere chiariti in futuro. Di questa opinione è anche Giorgio Parisi,dell’Università di Roma La Sapienza.

66 Andrea Carati e Luigi Galgani

Leggi fenomenologiche per il corpo nero: la legge di Wien e le varianti diThiesen e di Rayleigh

Era ben noto che, alle alte frequenze, le isoterme decadono a zero esponenzial-mente al crescere della frequenza. Dunque, in virtù della legge di spostamentodi Wien secondo cui la dipendenza dalla temperatura si presenta nella formaf (ν/T ), anche le isocromatiche devono decadere esponenzialmente come 1/Tal decrescere della temperatura. In conclusione, per alte frequenze e/o bassetemperature, la legge di radiazione deve avere la forma15

uν (T )' c1ν3 e−c2ν/T .

È questa la legge che noi chiameremo legge di Wien in senso proprio (come di-stinta dalla legge di spostamento di Wien). In effetti Wien aveva dato anche degliargomenti di tipo euristico che egli considerava come una deduzione di tale legge,ritenendo addirittura che tale legge avrebbe dovuto valere in tutto il dominio del-le variabili ν,T , e non solo per alte frequenze. Questo fatto veniva confermato daF. Paschen16 ma poi smentito dalle osservazioni di Lummer e Pringsheim17 rela-tive a lunghezza d’onda più lunghe e temperature più alte che nelle osservazioniprecedenti. Infatti, secondo la legge di Wien, su ogni isocromatica (ν fissato) l’e-nergia deve tendere a una costante al crescere della temperatura, mentre i nuovidati mostravano una crescita sistematica al crescere della temperatura.

Vennero allora proposte delle altre leggi semi fenomenologiche. Dapprimada Thiesen, e poi da Rayleigh. In particolare la legge proposta di Rayleigh ha laforma

uν (T )' c1ν2 kB T e−c2ν/T ,

e fu proposta sulla base del fatto che egli accettava il decadimento di Wien per altefrequenze e/o basse temperature, ma voleva avere equipartizione (kB T ) per bassefrequenze (“the graver modes”, i modi più gravi, egli dice) e/o alte temperature.

Argomentazioni di questo tipo, che si rifacevano ai metodi della meccanicastatistica, vennero invece sempre rifiutati da Planck, fino alla sua memoria del 14dicembre. Infatti Planck, che aveva precedentemente sostanzialmente postulatola legge di Wien (lo dice egli stesso ripetutamente), produce poi un argomentodi tipo termodinamico che sembra costituire una dimostrazione della legge diWien. La storia poi cambierà quando il 7 dicembre Rubens gli confermerà inmaniera evidente le indicazioni di Lummer e Pringsheim sulla nonvalidità dellalegge di Wien a basse frequenze e/o alte temperature e proporrà la sua legge il 19ottobre come pura legge fenomenologica, giungendo infine il 14 dicembre a una“giustificazione teorica” basata su argomenti di tipo statistico alla Boltzmann.

15W. Wien, Wied. Ann.58, 662 (1898).16F. Paschen. Sitz. Akad. Wiss. Berlin, pag. 959 (1899).17O.Lummer. E.Pringsheim, Verh. Deuts. Phys. Ges. 1, 215 (1899).

Fondamenti della meccanica quantistica: Planck 67

3.2 I lavori di Planck

A differenza di Rayleigh, che applicava i metodi della meccanica statistica al cam-po elettromagnetico in maniera analoga a quanto si può fare per ogni campo,tipicamente la corda vibrante, inizialmente Planck ha come idea centrale quelladi cercare di ottenere la legge del corpo nero con metodi termodinamici. A talfine egli considera un sistema composto di radiazione elettromagnetica da unaparte, e dall’altra di un numero arbitrario di oggetti macroscopici identici, chepossono oscillare a una ben definita frequenza ν, e che egli chiama “risonatori ma-teriali”. Egli pensa agli oggetti macroscopici che si usano (analogamente a quantoavviene in acustica) per misurare l’intensità della radiazione alla frequenza ν, con-siderata come un parametro, al variare del quale si ottengono informazioni sulleproprietà del campo. Partendo da una situazione di equilibrio tra i due sottosi-stemi (campo e risonatori) egli considera una nuova situazione in cui si ha unafluttuazione fuori dall’equilibrio, in cui l’energia del sistema di risonatori subi-sce una scostamento, diciamo ∆U (e naturalmente l’energia del campo subisceuno scostamento opposto). Il secondo principio della termodinamica richiedeche il sistema torni in equilibrio con una certa crescita dell’entropia, e Plancksi propone di trarre informazioni quantitative sullo spettro a partire da questacircostanza.

Questa idea venne sviluppata in una serie di lavori, di cui quelli rilevanti perla nostra discussione sono due, che vennero pubblicati all’inizio del 1900 sugliAnnalen der Physik. Il primo, dal titolo Sui processi irreversibili di radiazione,18diviso in tre parti, è il riassunto di cinque precedenti contributi, comunicati al-l’Accademia Prussiana delle Scienze tra il 1897 e il 1899, con il medesimo titolo.Il secondo, dal titolo Entropia e temperatura della radiazione termica19, è il più im-portante. In questi lavori Planck pervenne a dare una dimostrazione della leggedi Wien, che, come detto, sembrava descrivere bene i dati sperimentali allora di-sponibili. Ma qualche mese dopo le osservazioni estese all’infrarosso mostraronosenza dubbi che la legge di Wien era qualitativamente errata alle basse frequenzee alle grandi temperature, e suo malgrado Planck si vide costretto a ripensare dacapo al problema, ed ottenne la sua legge, prima (19 ottobre) per interpolazionedei dati sperimentali, e poi (14 dicembre) con argomenti di tipo statistico, allaBoltzmann. I due primi lavori del 1900 si trovano, tradotti in italiano, nel librodi Paolo Campogalliani, Max Planck e la teoria della radiazione termica, F. An-geli (Milano, 1999), dove sono riprodotti anche i lavori del 19 ottobre e del 14dicembre, in cui Planck prima introdusse, e poi “dimostrò”, la sua legge.

18M. Planck, Ann. d. Phys. 1, 69–122 (1900).19M. Planck, Ann. d. Phys. 1, 69 (1900).

68 Andrea Carati e Luigi Galgani

3.3 Deduzione di Planck della lagge di Wien

Relazione tra spettro del corpo nero ed energia di un risonatore materiale.

Anzitutto Planck stabilisce una relazione che svolge un ruolo fondamentale nellateoria del corpo nero, usata da lui stesso e poi da Einstein in maniera essenziale.

Supponiamo di avere un risonatore materiale che possa oscillare con frequen-za ν, di dimensioni (su scala macroscopica) piccolissime, che funga da rivelatoredell’intensità della radiazione in un punto specificato, e denotiamo con U la suaenergia interna. Poniamolo in un certo punto di una cavità in cui vi sia della ra-diazione a una data temperatura. Allora esso scambierà energia con la radiazionefino a giungere ad uno stato di equilibrio in cui esisterà una determinata relazio-ne tra l’energia U (T ) del risonatore e la densità di energia uν (T ) della radiazione.Planck stabilisce che la relazione ha la forma 20

uν (T ) =8πν2

c3U (T ) , ovvero U (T ) =

c3

8πν2uν (T ) . (3.3.1)

Nel dedurre questa relazione Planck opera una separazione tra quantità lenta-mente variabili (quelle macroscopiche) e rapidamente variabili (quelle microsco-piche). Questo è un punto molto importante. Una deduzione forse più limpidaè quella data nella prima edizione (che esiste solo nella lingua originale) del Wär-mestrahlung del 1906, primo capitolo. Questa è la deduzione cui fa riferimentoEinstein nel suo noto lavoro con Stern del 1913.

Dunque, facendo riferimento alla formula (3.3.1) è possibile determinare lospettro uν (T ) se è conosciuta la energia media U (T ) di un risonatore materiale(formula a sinistra della (3.3.1)), o viceversa.

Come vedremo più avanti, il primo atteggiamento (indurre lo spettro del corpo nerodalla energia media del risonatore) fu quello tenuto da Planck nei suoi lavori. InveceEinstein, nel suo lavoro del 1907 sul calore specifico dei solidi, prende il secondo atteg-giamento, determinare U da uν . Assumendo come sperimentalmente nota la legge delcorpo nero, Einstein inferisce l’energia media dei risonatori materiali – tutti della stes-sa frequenza – mediante i quali egli modellizza il solido (e quindi l’energia del solido)in funzione della temperatura e della frequenza, e dunque ricava anche, per semplicederivazione rispetto a T , il corrispondente calore specifico.

Nel capitolo di queste note dedicato alla distribuzione di Maxwell–Boltzmann e al prin-cipio di equipartizione abbiamo illustrato21 il procedimento con cui Rayleigh (nel suoarticolo del giugno del 1900) formulò la proporzionalità (3.3.1) tra uν ed U . La differenzatra i due procedimenti è notevole: quello di Planck, che prende pagine di conti, riguardain realtà il problema di come si possa “misurare” la qunatità uν (la densitá di energiadel campo). Per Planck, quindi, i risonatori Rayleigh, che prende poche righe, è di ca-rattere puramente meccanico–statisitico, relativo al solo campo elettromagnetico libero,

20Si tratta della seconda formula sotto la (41) del primo lavoro, riprodotta in alto a pag. 89 dellatraduzione di Campogalliani. In tale formula, al posto di uν compare Jν (chiamato J0 ) uguale a(8π/3)uν .

21IL PARAGRAFO NON E’ ANCORA SCRITTO

Fondamenti della meccanica quantistica: Planck 69

e si riduce al conteggio del numero di modi normali di oscillazione aventi frequenzanell’intervallo (ν , ν + dν). 22

La prima deduzione della legge di Wien

Come abbiamo già detto, nei suoi primi due lavori del 1900 Planck considerail campo elettromagnetico in equilibrio termico con un sistema di risonatori.Quindi il sistema totale (in un dominio di volume V fissato) avrà una energiadella forma

E t ot =∫

Vu dV +

i

Ui

dove Ui è l’energia di un singolo risonatore, e u l’energia, per unità di volume,del campo. Analogamente il sistema avrà anche una entropia totale della forma

S t ot =∫

Vs dV +

i

Si

dove Si è l’energia di un singolo risonatore e∫

V s dV l’entropia, per unità divolume, del campo. In seguito Planck si limiterà a considerare quantità relativead una frequenza fissata ν, che svolge il ruolo di un parametro, che non vieneneppure indicato esplicitamente.

Riduzione alla termodinamica dei risonatori materiali

A questo punto Planck compie un astuto procedimento tramite il quale riesce adesprimere l’energia uν ≡ u e l’entropia sν ≡ s (per unità di volume) del campoattraverso l’energia U e l’entropia S di un singolo risonatore.23 Sostanzialmentele cose vanno nel modo seguente.

Planck ammette che vi sia uno stato di equilibrio termodinamico, in cui l’en-tropia totale del sistema presenta un massimo. Se ora con una fluttuazione siproduce (nel sistema isolato) uno scostamento ∆U dell’energia di un risonato-re, l’entropia del sistema totale assumerà un valore minore. Allora, partendo

22COMMENTO: DA RIVEDERE. Le dimostrazioni della relazione fondamentale (3.3.1) dateda Planck fanno uso sostanziale della formula di Larmor per l’emissione di radiazione da parte dicariche accelerate, che viene impiegata per le antenne, e qui sembra venire estesa alle cariche mi-croscopiche. Su questo Planck non è chiarissimo. È quindi lecito sollevare dei dubbi sulla validitàdi questa relazione. Ciò è dovuto alla cancellazione dell’emissione microscopica, che si produce invirtù della identità di Wheeler e Feynman. D’altra la relazione fondamentale viene usata in ma-niera essenziale nel lavoro di Einstein del 1907 sui calori specifici, dove produce risultati in ottimoaccordo con i dati sperimentali. La soluzione di questo paradosso potrebbe essere legata alla distin-zione che si deve compiere in ambito classico tra energia meccanica ed energia termodinamica deirisonatori. L’energia interna termodinamica dovrebbe essere la porzione dell’energia meccanicache viene trasferita nei processi termodinamici.

23Vedremo che sarà invece l’entropia del campo la quantità su cui Einstein concentrerà la suaattenzione nell’articolo del 1905 (sui fotoni), mentre vedremoqui sotto che nel suo procedimentoPlanck elimina l’entropia del campo, esprimendola in termini dell’entropia dei risonatori.

70 Andrea Carati e Luigi Galgani

dal nuovo stato, il sistema tenderà a ritornare ad uno stato cui competa il valo-re massimo dell’entropia, e dopo un tempo dt l’entropia totale del sistema saràcresciuta, diciamo di una quantità dU . Planck calcola questo incremento, pro-porzionale al prodotto∆U dU , mediante uno sviluppo in serie di S t ot al secondoordine.

In particolare, dalla condizione di massimo egli deduce un importante risul-tato per l’entropia. Egli trova infatti che sν ed S sono mutuamente proporzio-nali, esattamente tramite il medesimo fattore che si incontrava nella relazionefondamentale di proporzionalità tra uν ed U . Ovvero si ha

sν =8πν2

c3S . (3.3.2)

Ora, per la stazionarietà, i termini coinvolgenti le derivate prime si compen-sano, sicché i primi termini dello sviluppo di Taylor dell’incremento dell’entro-pia totale coinvolgono solo le derivate seconde, anzi (per la proprietà di propor-zionalità sopra menzionata), coinvolgono solo la derivata seconda dell’entropiadel risonatore materiale. Precisamente si trova

dS t ot =35

dU ∆Ud2SdU 2

. (3.3.3)

A questo punto Planck ha già ottenuto un risultato interessantissimo di ca-rattere generale, che noi non abbiamo mai trovato da nessuna altra parte, Si trattadel fatto che la proprietà di massimo dell’entropia totale comporta che si abbia(poiché dU e ∆U hanno evidentemente segni opposti)

d2SdU 2

≤ 0 , (3.3.4)

cioè l’entropia S(U ) del risonatore materiale è concava verso il basso.24 Si con-trolla subito che questa proprietà è equivalente alla proprietà che il calore speci-fico sia positivo.

In particolare, indipendentemente dall’ultima osservazione, risulta che perstudiare la termodinamica del sistema totale basta studiare quella che formal-mente è la termodinamica di un sistema di risonatori materiali, tutti della stessafrequenza.

La termodinamica di un singolo risonatore materiale

Il problema è ora di determinare la termodinamica di un singolo risonatore,avente frequenza fissata ν, che seguendo Planck neppure indichiamo.

24In particolare, in generale l’entropia del risonatore non ha massimi o minimi. Quella che haun massimo è l’entropia del sistema totale rispetto a cambiamenti degli stati dei costituenti.

Fondamenti della meccanica quantistica: Planck 71

Naturalmente, come sappiamo dalla termodinamica, a tal fine basta assegnarela forma analitica (detta relazione fondamentale) di una funzione termodinamica,che può essere una delle seguenti:

U =U (T ) , S = S(U ) ,

o delle loro inverse. Naturalmente, dalla prima legge della termodinamica (rife-rita al caso in cui la frequenza è fissata, analogo al caso in cui è fissato il volumeper un gas) si ha che, essendo δQ = T dS, vale

dU = T dS , ovverodSdU=

1T

, (3.3.5)

sicché come relazione fondamentale di può anche scegliere la relazione funziona-le T = T (U ) o anche

1T=

1T(U ) . (3.3.6)

La scelta arbitraria di Planck nel primo lavoro

Di fatto fu quest’ultima la forma scelta da Planck. Infatti, indotto dalle sue consi-derazioni riguardanti il massimo dell’entropia, egli assegnava la forma funzionaledella funzione25

S ′′(U )≡ d2SdU 2

=d

dU1T

.

Che dalla conoscenza della funzione S ′′(U ) si ricostruisca U = U (T ) si vede subito.Infatti, in virtù della seconda delle (3.3.5) si ha allora

ddU

1T= S ′′(U ) .

Per integrazione si ottiene allora

1T=∫

S ′′(U )dU ≡G(U ) ,

da cui per inversione si ottiene U =U (T )

Dunque ad ogni scelta della funzione S ′′(U ) corrisponde una ben definitafunzione U (T ). Sicuramente procedendo per tentativi (lo dice egli stesso) Planckaveva osservato che la scelta 26

S ′′(U ) =− α

U(3.3.7)

25Si veda il primo lavoro, paragrafo 17, pag. 102 della traduzione. Si legge forse meglio nelsecondo lavoro (paragrafo 5, pag. 132 della traduzione).

26In effetti, egli aveva scritto la relazione in maniera equivalente ma formalmente diversa,ammettendo che fosse

S(U ) =−Uaν

logU

e b νdove e = 2.718 . . . è ovviamente la base dei logaritmi naturali (l’equivalenza si controlla subito conuna doppia integrazione, a meno di una costante che viene scelta nulla).

72 Andrea Carati e Luigi Galgani

dove α è una costante (rispetto a T ) positiva produce la legge di Wien.

L’esercizio è banalissimo. Infatti, integrando la relazione

ddU

1T=− α

U,

si ottiene1T=−α log U + c ,

ovveroU = γ e−1/(αT ) .

Si usa poi il fatto che, in virtù della relazione tra uν e U , la legge di spostamento di Wienprende per un singolo risonatore la forma

U = ν f (ν/T ) , (3.3.8)

sicchè si ottieneU = b ν e− ν/(aT ) ,

ovvero con notazioni moderne,

U = hν e− hν/(kB T ) ,

che corrisponde alla legge di Wien

uν =8πhν3

c3exp(− hν/kB T ) . (3.3.9)

La deduzione della legge di Wien nel secondo lavoro del 1900

Dunque, nel primo lavoro Planck aveva semplicemente introdotto a mano la for-ma funzionale della funzione S ′′(U ) relativa ad un singolo risonatore, che pro-duceva la legge di Wien, assolutamente senza alcuna giustificazione. Nel secondolavoro Planck fornisce una dimostrazione di quella forma funzionale, passandoa considerare le condizioni di equilibrio per un sistema costituito dal campo eda un numero arbitrario di risonatori della stessa frequenza. Si veda il para-grafo 6 del secondo lavoro, pag. 133 della traduzione di Paolo Campogalliani.Riportiamo qui l’argomento di Planck come a noi attualmente riesce di leggerlo.

Dopo le considerazioni svolte per il caso di un singolo risonatore, Planckpassa a considerare un sistema di n risonatori in equilibrio con il campo allatemperatura T , ammettendo che essi compiano i medesimi processi, indipen-dentemente l’uno dall’altro. È questo l’elemento di profonda analogia con latermodinamica del gas perfetto, che sarà portata a compimento nell’articolo diEinstein del 1905 (relativo al corpo nero, nell’approssimazione di Wien) in cuiegli studia la dipendenza dell’entropia dal volume.

Planck continua a denotare con U l’energia media di un singolo risonatore,e con S la sua entropia, mentre denota con Un l’energia del sistema di risonatorie con con Sn la corrispondente entropia. Egli riesce a stabilire due relazioni

Fondamenti della meccanica quantistica: Planck 73

funzionali che legano Sn ed S, che gli permettono poi di dedurre la legge diWien.

Le due relazioni funzionali sono

S ′′n = S ′′ , (3.3.10)

dove l’apice denota derivazione rispetto all’argomento della funzione, e

S ′′n�

nU=

1n

S ′′�

U. (3.3.11)

Da queste segue immediatamente una relazione funzionale per la funzione S ′′,ovvero

S ′′�

nU=

1n

S ′′�

U. (3.3.12)

Dimostrazione. Queste relazioni ruotano attorno alla relazione (3.3.3), che esprimel’incremento di entropia che subisce il sistema totale durante il processo di ritorno al-l’equilibrio, quando sia accaduta una fluttuazione fuori dall’equilibrio con uno scambio∆U di energia e successiva variazione dU nel tempo dt .

Nella relazione (3.3.3) si sta considerando il caso in cui vi sia un solo risonatore,e l’incremento di entropia totale del sistema è espresso in termini dell’incremento dientropia del singolo risonatore. Se invece di un singolo risonatore ci trovassimo in pre-senza di un sistema di n risonatori ad energia Un il cui incremento di energia fosse∆Un ,analogamente si avrebbe

dS t ot =35

dUn∆Un S ′′n ,

dove Sn è l’entropia del sistema di risonatori. Allora Planck assume che l’incrementodi entropia del campo sia il medesimo che si avrebbe nel caso di un singolo risonatoreavente la stessa energia Un che ha il sistema di risonatori e le stesse energie scambiate∆Un , dUn : importa quanta è l’energia che il campo scambia con il sistema di risonatorimateriali, e non il dettaglio di quanti siano i costituenti del sistema materiale.27 Dunquesi ha

35

dUn∆Un S ′′n�

Un

=35

dUn∆Un S ′′�

Un

ovvero S ′′n�

Un

= S ′′�

Un

, ovvero la (3.3.10).

La seconda relazione riguarda ancora l’incremento di entropia del sistema totalequando il sistema di n risonatori, ad energia Un , scambia energia ∆Un con il campo.Ma ora il confronto è con l’incremento di entropia che si ha per il sistema totale quan-do i singoli oscillatori siano ad energia U = Un/n e scambino ciascuno una quantitàdi energia ∆U = ∆Un/n, e l’ipotesi è che l’incremento di entropia ∆Sn del sistema dirisonatori sia n volte l’incremento di entropia ∆S del singolo:

dUn∆Un S ′′n�

Un

= n dU ∆U S ′′�

Use Un = nU , ∆Un = n∆U .

27Questo argomento sembra l’analogo di quello che si ha nel gas perfetto, quando si considerala pressione totale. Si veda più avanti

74 Andrea Carati e Luigi Galgani

Segue quindi S ′′n�

Un

= (1/n) S ′′�

U, ovvero la (3.3.11).

Nelle parole di Planck (con qualche aggiustamento nostro), questo è spiegato nelmodo seguente. “D’altra parte questo aumento di entropia (quello relativo a uno scambio∆Un , e il conseguente dUn con un sistema di n risonatori) è comunque uguale a n volte laespressione (3.3.3) relativa allo scambio∆U (e corrispondente dU ) con un singolo risonatore,se si pone Un = nU . Poiché n processi uguali tra loro hanno luogo contemporaneamente eindipendentemente l’uno dall’altro.” 28

Deduzione della legge di Wien.

La relazione (3.3.12) stabilisce una proprietà di omogeneità per la funzione S ′′.Poiché potrebbe creare confusione il fatto che con l’apice stiamo denotando laderivazione rispetto all’argomento, chiamiamo con il nome F la funzione S ′′,cioè poniamo

F ≡ S ′′ .

Allora la (3.3.12) si esprime come

F (nU ) =1n

F (U )

Ma per n grandi si può pensare ad n come una variabile continua, sicché questarelazione esprime la proprietà che F è una funzione omogenea di grado −1,ovvero F (U ) = α′/U . Tenendo conto del fatto che sappiamo che la funzioneS(U ) è concava verso il basso, concludiamo dunque che si ha

S ′′(U ) =− α

U, (α > 0) ,

che abbiamo già mostrato condurre alla legge di Wien.

Esercizio. Dimostrare che in corrispondenza con la legge di Planck l’entropia risultaessere data da (scriviamo a ≡ k, b ≡ hν )

SkB= (1+

Uhν) log(1+

Uhν)− U

hνlog

Uhν

. (3.3.13)

Esercizio. Mostrare che questa entropia è uguale a quella data da Cercignani.29

28La motivazione generale che Planck indicato è riportata alla pagina 133 della traduzione diCampogalliani, e prende quasi mezza pagina. Egli dice: “Un significato fisico determinato lo possie-de ... l’aumento di entropia dell’intero sistema ... perché questo costituisce la misura per l’irreversibilitàdel processo o per la trasformazioni non compensate di lavoro in calore, e su questa grandezza in ef-fetti si può considerare e portare a termine conseguentemente una corrispondente conclusione. Infattila relazione fisica necessaria tra la variazione di energia e l’aumento di entropia apparirebbe difficil-mente comprensibile se non si assumesse che l’aumento di entropia degli n risonatori nella radiazioneconsiderata è completamente determinato dalla loro energia Un , dalla loro differenza ∆Un dal valorestazionario e dalla variazione di energia dUn nel tempo dt , e di conseguenza che l’aumento di entropiasi ottiene se nell’espressione (3.3.3)— che ricordiamo dà l’incremento dell’entropia totale del sistemacorpo nero più singolo risonatore — si pone ovunque Un dove appare U .”

29NOTA PER GLI AUTORI. Riportare l’argomento di Cercignani dal lavoro Cercignani,Galgani, Scotti del 1972.

Fondamenti della meccanica quantistica: Planck 75

Complementi: Alcuni commenti sulla legge di Wien e sulle ipotesi fatte daPlanck per dedurla

• Rilettura dell’ipotesi (3.3.11) al modo di Einstein. Estensività e legge dei gran-di numeri. La giustificazione della relazione (3.3.11) è limpidissima nella riletturache ne dà Einstein nei suoi lavori successivi (soprattutto in quello del 1911), e puòessere riassunta nel modo seguente. Anzitutto si osserva che la quantità significa-tiva per la termodinamica è il calore specifico, che sostanzialmente è l’inverso diS ′′(U ). Infatti si ha

d2SdU 2

=d

dU1T=− 1

T 2

dTdU=− 1

T 2

1C

,

dove abbiamo denotato con C il calore specifico,

C def=dUdT

.

Dunque la relazione (3.3.10) prende la forma

Cn(nU ) = nC (U ) , (3.3.14)

che esprime la estensività del calore specifico nella maniera consueta della termo-dinamica.Tra l’altro, questa relazione termodinamica di estensività è coerente con una pro-prietà fondamentale della teoria delle probabilità (la legge dei grandi numeri),quando si tenga conto della relazione di Einstein–Boltzmann di proporzionalitàtra calore specifico C e varianza dell’energia σ2

E nell’insieme canonico,

σ2E =−

∂ U∂ β= kB T 2C ,

di cui parleremo più avanti. Secondo la legge dei grandi numeri, sotto condizionimolto generali la varianza di una somma di variabili aleatorie è proporzionale alnumero di addendi, che è proprio la relazione (3.3.14).

• Ancora sulla relazione funzionale (3.3.11): indipendenza mutua dei risonato-ri, e analogia col gas perfetto. Commento al modo di Ehrenfest. Abbiamovisto come la relazione (3.3.11) venga giustificata pensando che la variazione dientropia del campo elettromagnetico sia le medesima, indipendentemente dal nu-mero di risonatori col quale interagisce, per un fissato scambio di energia. Questaipotesi sembra costituire una formalizzazione dell’ipotesi che, per quanto riguardal’entropia, i risonatori si comportino come se fossero indipendenti.Si pensi all’analogia con il caso dei gas perfetti, in relazione alla pressione p. Poi-ché, fissato il volume, la pressione è proporzionale alla somma delle energie cine-tiche del baricentri delle molecole, formalmente sembra aversi che la pressione pnesercitata da un sistema di n molecole avente energia nU sia uguale alla pressioneesercitata da un unico “particellone” avente quella medesima energia nU :

pn(nU ) = p1(nU )≡ p(nU ) .

76 Andrea Carati e Luigi Galgani

L’analogia con il corpo nero è che anche in tal caso la pressione dipende dall’e-nergia u (per unità di volume), e non dalla distribuzione dell’energia tra le variefrequenze. Infatti vale la legge di Stefan–Boltzmann p = u/3. Questa osservazio-ne si trova esposta in una nota a piè di pagina di un articolo di Paul Ehrenfest (del1914, riportato nel libro di van der Waerden, pag. 90), dove dice: “Both examples[gas perfetto e radiazione di corpo nero] have the following property in common. Thepressure depends only on the energy of the system: it is independent of the distributionof the energy over the different normal modes of vibration or over the molecules. In acyclic compression, catalytic process, dilatation, adiabatic process, the same amount ofwork is given to the system or taken from it. For general systems this is no more thecase.”

• Legge di Planck vs indipendenza dei risonatori. Dunque la legge di Wien sem-bra descrivere l’approssimazione in cui i costituenti materiali (i risonatori) sonoconsiderati indipendenti. Pertanto la correzione introdotta successivamente daPlanck nella sua comunicazione del 19 ottobre 1900 sarebbe quella necessaria pertenere conto di una mutua interazione (o misteriosa mutua interazione, per usarele parole di Einstein) che sembra esistere tra i risonatori. Si potrebbe presumereche essa sia indotta dalla interazione che ogni risonatore ha con il campo elettro-magnetico, il quale interviene come mediatore, ma è a sua volta influenzato dairisonatori stessi.30 Se si leggono i lavori di Planck, ci si rende conto che egli lavo-rava nella approssimazione in cui ogni risonatore singolarmente interagisce con ilcampo, pensato come campo esterno, che è presente in una maniera già costituita,come se i risonatori non esistessero. Sembra più ragionevole concepire il campoe i risonatori come un unico sistema fisico globale. 31 Il tener conto di questoaspetto globale ha condotto a significativi risultati recenti. 32

• Il valore positivo della legge di Wien Tuttavia, il fatto che Planck deduca (e inmaniera sorprendentemente semplice e significativa) la legge di Wien costituisceun contributo fondamentale alla teoria del corpo nero, perché sembra mettere inluce l’argomento cruciale, di carattere puramente termodinamico, che stabilisce ildecadimento esponenziale sulle alte frequenze. È questo l’elemento che garanti-sce che l’energia totale del campo, integrata su tutte le frequenze, sia finita. Invecegli argomenti statistici, alla Rayleigh, pur fornendo una ottima spiegazione dellaequipartizione alle basse frequenze, a livello classico producono la cosiddetta ca-tastrofe ultravioletta, ovvero la divergenza dell’energia totale (integrata su tutte lefrequenze). Si noti che questa catastrofe in un certo senso sparisce nella tratta-zione quantistica, ma in effetti vi riappare addirittura in una forma più virulenta,perché il contributo dell’energia di punto zero hν/2 conduce ad una divergenzacome ν3 anziché come ν2.

30NOTA PER GLI AUTORI. Rivedere in questa luce l’espressione della entropia di Cercignani.31A. Carati, L. Galgani, A critical remark on Planck’s model of black–body, Int. Journ. of Mod.

Phys. B 18, 549-553 (2004).32A. Carati, L. Galgani, Non radiating normal modes in a classical many-body model of matter-

radiation interaction, Nuovo Cimento 118 B, 839-849 (2003); A. Lerose, A. Sanzeni, A. Carati, L.Galgani, Classical microscopic theory of polaritons in ionic crystals, Eur. Phys. J. D 68, 35 (2014).

Fondamenti della meccanica quantistica: Planck 77

Figura 3.2: Spettro del corpo nero. Le isocromatiche di Lummer e Pringsheimdel 1900 per cinque frequenze nell’infrarosso. Grafico del logaritmo dell’intensitàin funzione di 1/T . Le linee spezzate sono i fit con la legge di Wien. L’evidentescostamento sistematico a bassi valori di 1/T convinse definitivamente Planck adaccettare che la legge di Wien valesse solo asintoticamente per alti valori di 1/T(in effetti, di ν/T )

3.4 La comunicazione del 19 ottobre 1900

La comunicazione del 19 ottobre, dal titolo Su un miglioramento dell’equazione diWien per lo spettro, consta di due pagine e poche righe.

Nel primo paragrafo Planck prende atto che i recenti risultati sperimentalisulle isocromatiche del corpo nero nell’infrarosso (riprodotta qui nella Figura3.2) hanno mostrato che su ogni isocromatica la legge di decadimento di Wiennon è valida in generale, come si era creduto, ma ha il carattere di una leggelimite valida per alte frequenze e/o le basse temperature (si veda la figura 3.2). Eaggiunge “Poiché io stesso ho espresso davanti a questa società l’opinione che la leggedi Wien deve essere necessariamente vera, mi sia permesso di spiegare brevemente larelazione tra la teoria elettromagnetica da me sviluppata, e i dati sperimentali.”

Egli allora ricorda come sia sufficiente stabilire la legge per la energia mediaU (T ) di un singolo risonatore (oscillatore materiale) di assegnata frequenza, oequivalentemente la forma funzionale della S ′′(U ). Ricorda poi come egli avesse

78 Andrea Carati e Luigi Galgani

dato argomenti che sembravano giustificare la relazione (3.3.7), ovvero la

S ′′(U ) =− α

U,

che produce la legge di Wien

U (ν,T ) = c1ν e−c2ν/T , c2 > 0 . (3.4.1)

Ma i recenti esperimenti condotti sulle isocromatiche nell’infrarosso avevanomostrato che la legge di Wien era qualitativamente errata alle alte temperature.

Infatti la legge di Wien (3.4.1) mostra che l’energia dovrebbe tendere a una costantequando T tende all’infinito, mentre le nuove misure del 7 ottobre mostravano in manie-ra irrevocabile una crescita dell’energia (come d’altra parte era stato anche predetto daRayleigh).

Planck si rende dunque conto che deve rivedere gli argomenti che lo aveva-no condotto ad ammettere la (3.3.7), ma non ha ancora elementi chiari. Alloraprosegue: “Following this suggestion I have finally started to construct completelyarbitrary expressions for the entropy.... I was especially attracted by one of the ex-pressions thus constructed which is nearly as simple as Wien’s expression and whichwould deserve to be investigated since Wien’s expression is not sufficient to cover allobservations. We get this expression by putting” (Planck scrive α invece di a, e βinvece di b )

S ′′(U ) =− aU (b +U )

. (3.4.2)

In tal modo, come mostrato subito sotto, egli ottiene per l’energia U del ri-sonatore una espressione che egli neppure scrive, e che noi scriviamo nella formacoerente con la forma usata nel suo secondo lavoro per la legge di corpo nero,ovvero

U (T ) =hν

e hν/kB T − 1. (3.4.3)

Infine egli scrive la legge per la densità di energia del corpo nero, che qui ripor-tiamo nella forma in cui egli la mette nel secondo lavoro, ovvero

uν =8πν2

c3

hνe hν/kB T − 1

. (3.4.4)

Per ottenere la legge di Planck, si procede esattamente come fatto per la legge di Wien,evidentemente usando

1U (b +U )

=1b

� 1U− 1

b +U

.

Dunque si ha1T=

ab

logb +U

U+ c

Fondamenti della meccanica quantistica: Planck 79

dove c è una costante, che deve essere nulla per soddisfare la condizione

U →∞ per T →∞ .

Segue allora

e b/aT =b +U

U,

ovvero, risolvendo rispetto ad U ,

U =b

e b/aT − 1.

Dunque si hanno le identificazioni

b = hν , a = kB . (3.4.5)

3.5 La comunicazione del 14 dicembre 1900

Leggiamo come Planck stesso descrive i quasi tre mesi trascorsi tra le due comu-nicazioni.33 A proposito della sua formula empirica ottenuta per interpolazione,egli dice: “If, however, the radiation formula should be shown to be absolutely exact,it would possess only a limited value, in the sense that it is a fortunate guess at aninterpolation formula. I have been trying to give it a physical meaning, and thisproblem led me to consider the relation between entropy and probability, along thelines of Boltzmann’s ideas. After a few weeks of the most strenuous work of mylife, the darkness lifted and an unexpected vista began to appear.”

Infatti nel suo lavoro del 14 dicembre Planck dice: “I suspected that one shouldevaluate this quantity [la distribuzione di energia tra molti risonatori] by introdu-cing probability considerations ..., the importance of which for the second law of ther-modynamics was originally discovered by Mr. Ludwig Boltzmann. This suspicionhas been confirmed. I have been able to derive deductively ... the energy distributionin a stationary radiation state, that is, in the normal spectrum.”

Il procedimento di Planck si ispira ai procedimenti statistici di Boltzmann,ma è ben diverso. Infatti Boltzmann si interessava della probabilità degli statimacroscopici, definiti da una successione di numeri di occupazione, e ricercavaquallo più probabile, e infine determinava il valore medio dell’energia per quellostato, in funzione della temparatura. Invece Planck si disinteressa delle succes-sioni di numeri di occupazione, e ricerca direttamente quale sia l’energia media.Più precisamente, considera un sistema composto di sottosistemi di oscillatori didiversa frequenza, e ricerca quale sia la piú probabile distribuzione di energia traquesti, a temperatura fissata.34

33Da The origin and the development of the quantum theory, in M. Planck, A survey of physicaltheories, Dover (New York, 1960), pag 106.

34La connessione con il procedimento di Boltzmann verrà poi resa esplicita da Bose nel suoalvoro del 1924.

80 Andrea Carati e Luigi Galgani

Dunque Planck considera un sistema di N risonatori materiali (Resonatoren)tutti della stessa frequenza ν, aventi energia totale E ; vi saranno poi N ′ risonatoridi frequenza ν ′ ed energia E ′, poi N ′′ risonatori di frequenza ν ′′′ ed energia E ′′,dove E + E ′+ E ′′ . . .= E0 è l’energia totale del sistema di risonatori.35

Come abbiamo anticipato, egli ricerca poi la più probabile distribuzione dienergia E , E ′, E ′′ . . . tra i diversi sistemi di risonatori. Nelle sue parole: “Dobbia-mo assegnare la distribuzione di energia tra i diversi gruppi di risonatori, e anzituttola distribuzione dell’energia E tra gli N risonatori di frequenza ν . Se E è consideratauna quantità infinitamente divisibile, allora tale distribuzione è possibile in infinitimodi. Consideriamo tuttavia – e questo è il punto essenziale di tutto il calcolo – cheE sia composta di un numero ben definito di parti uguali e ci serviamo a tal fine dellacostante h = 6.5510−27 erg sec. Tale costante, moltiplicata per la frequenza comuneν dei risonatori, dà l’elemento di energia ε in erg, e dividendo E per ε si ha il nu-mero P di elementi di energia 36, 37 che devono essere suddivisi tra gli N risonatori.Se il rapporto così calcolato non è un intero, prendiamo per P un intero prossimo. Èchiaro che la distribuzione di P elementi tra N risonatori può avere luogo solo in uncerto numero finito di modi. Ognuno di questi modi di distribuzione lo chiameremouna “complessione”. Se denotiamo i risonatori con i numeri 1,2, . . . ,N e li scriviamosu una riga, abbiamo per ogni complessione un simbolo del tipo seguente:

1 2 3 4 5 6 7 8 9 10

7 38 11 0 9 2 20 4 4 5

se N = 10 e P = 100. Il numero di tutte le possibili complessioni è chiaramenteuguale al numero di tutti i possibili insiemi di numeri che si possono ottenere in talmodo per la successione inferiore, per assegnati N e P . Per eliminare ogni equivoco,osserviamo che due complessioni devono essere considerate diverse se le corrispon-denti successioni contengono gli stessi numeri, ma in ordine diverso.38 Dal calcolo

35In effetti, Planck considera che il sistema totale comprende anche la radiazione. Ma poinei calcoli si concentra solo sull’energia dei risonatori, e per questo abbiamo qui semplificatola notazione, ignorando la radiazione che egli stesso in effetti tralascia di considerare.

36Oggi diremmo “numero di quanti”.37Si veda anche il contributo di Einstein alla Conferenza Solvay del 1911, pag 250 dell’edizione

italiana, dove, per la parte quantistica delle fluttuazioni, introduce l’energia totale dei fotoni anzi-ché quella del singolo risonatore (parla di E = nN E anziché di E . Inoltre aggiunge “Ciò che viè di inesatto, nella forma attuale della teoria dei quanti, discende forse dal fatto che in essa questalimitazione del numero degli stati possibili è stata considerata come una proprietà dei gradi dilibertà presi individualmente.”

38Questo è il punto in cui il conteggio differisce da quello di Boltzmann relativo alle molecole.Oggi diremmo che Boltzmann considera le molecole distinguibili, mentre Planck considera glielementi di energia – oggi diremmo i fotoni – indistinguibili. Ciò è ben naturale dal punto divista di Planck. Perché in termini classici, quando diciamo che l’energia totale Pε del consideratosistema di risonatori si distribuisce tra gli N risonatori, non pensiamo di dire che la porzione dienergia che va ad esempio al terzo risonatore sia distinguibile dalla porzione di energia che va adesempio al quinto, se non per il suo valore (quanti fotoni, e non quali fotoni). La relazione con ilconteggio di Boltzmann apparirà più chiara quando commenteremo il procedimento di Bose del1924.

Fondamenti della meccanica quantistica: Planck 81

combinatorio si ha per il numero di tutte le possibili complessioni39, 40, 41

R=(N + P − 1)!(N − 1)!P !

(3.5.1)

ovvero, con sufficiente approssimazione

R=(N + P )N+P

N N P P. (3.5.2)

Compiamo lo stesso calcolo per i risonatori degli altri gruppi, determinando perogni gruppo di risonatori il numero di possibili complessioni relativo all’energia dataal gruppo. Il prodotto di tutti i numeri così ottenuti ci dà il numero totale di tuttele complessioni relativo all’assegnata distribuzione di energia tra tutti i risonatori.Occorre dunque determinare la distribuzione P, P ′, P ′′ . . . che massimizza il prodot-to R R′R′′ . . . (o, equivalentemente, il suo logaritmo) con il vincolo che sia fissatal’energia totale42 N Pε+N ′P ′ε+N ′′P ′′ε . . .; per il noto metodo del moltiplicatoredi Lagrange, basta allora massimizzare ...”

Nel lavoro del 14 dicembre viene solo dato il risultato del calcolo della mas-simizzazione. Comunque il calcolo è banalissimo. Usiamo la notazione {Pi} inluogo di P, P ′, P ′′ . . ., {Ni} in luogo di N ,N ′,N ′′ . . ., ed {εi} in luogo di ε, ε′, ε′′,.... Tenendo conto del vincolo

i Piεi = E0, usando il metodo dei moltiplicatoridi Lagrange si deve allora di massimizzare l’espressione

∑�

(Ni + Pi ) log(Ni + Pi )−Ni logNi − Pi log Pi −βPiεi

rispetto alla successione Pi e un immediato calcolo fornisce log(Ni+Pi )−log Pi =βεi , ovvero

Pi =Ni

eβεi − 1(3.5.3)

39Questa formula appare nel lavoro di Boltzmann del 1877. Si tratta del numero totale di cellenello spazio Γ a fissata energia totale E . Per Boltzmann questo è dunque il fattore di normalizza-zione da impiegarsi per la probabilità di una successione di numeri di occupazione, a fissata energiatotale del sistema considerato. Si tratta della formula J = .. in fondo a pag. 181 vol.II, lavoro n. 42delle opere. Lui denote E ≡ λ′, P ≡ p = E/ε. Si tratta del classico fattore binomiale, e B. ritieneovvia la dimostrazione. NOTA PER GLI AUTORI. Studiare questa parte di B. Si noti che nellavoro di Einstein 1904 log R(E) sarà l’entropia microcanonica.

40Dobbiamo distribuire P oggetti identici (indistinguibili), i grani di energia, in N celle. Unadistribuzione (o complessione) viene individuata da P palline disposte in fila, con interposte tradi loro N − 1 sbarrette, che definiscono la collocazione delle N celle. A partire da una fissatacomplessione, ne ottengo altre (N + P − 1)! permutando quegli N + P − 1 oggetti (palline e sbar-rette). Ma tra tali permutazioni, alcune (proprio in numero di P ! (N − 1)!) sono evidentementeindistinguibili dalla prima.

41Questo modo di dimostrare la formula combinatoria di Planck fu illustrato in un lavoro diEhrenfest dedicato specificamente a tale calcolo. Sembra quasi incredibile.

42Planck scrive nU in luogo di Pε e così via. Ma subito dopo sostituisce N U = Pε e così via.

82 Andrea Carati e Luigi Galgani

dove β viene identificato con la temperatura inversa.43 Dunque abbiamo ottenu-to il numero Pi di elementi di energia (di quanti, o di fotoni) di frequenza νi , eanche l’energia Piεi . Infine, in virtù della legge generale di spostamento di Wien,si pone εi = hνi .

Moltiplicando ora la (3.5.3) per il singolo “elemento di energia” εi = hνi , siottiene l’energia UN del sistema degli Ni risonatori di frequenza νi , ed avremo(sopprimendo l’indice i )

UN =Nhν

eβhν − 1. (3.5.4)

Possiamo poi considerare l’energia U di un singolo risonatore”,

U def=UN

N,

e si avrà alloraU =

hνeβhν − 1

. (3.5.5)

Nel caso del corpo nero sappiamo che u(ν,T ), la densità di energia (per unitàdi volume) rispetto alla frequenza, si ottiene moltiplicando la energia U (3.5.5)del singolo “risonatore macroscopico” per il noto fattore

N =8πν2

c3dν

determinato da Planck, sicché avremo

u(ν,T ) =8πν2

c3

hνeβhν − 1

. (3.5.6)

Formalmente, questa relazione viene solitamente letta “alla maniera di Raylei-gh”, interpretando U non come energia di un risonatore macroscopico, ma comeenergia media di un singolo “oscillatore del campo elettromagnetico” di frequen-za ν (pensata come energia microscopica, analoga dell’energia di una molecola),moltiplicandola poi per il numero N , interpretato come numero di oscillatoridel campo di frequenza tra ν e ν + dν.

Commento. Il procedimento di Planck venne ripreso in maniera sostanzialmente iden-tica nei lavori di Bose e di Einstein del 1924–1925. Da un certo punto di vista, tali lavoripotrebbero dunque trovare posto in questo stesso capitolo, ma uttavia li rimandiamo alprossimo. In effetti, in mezzo tra il lavoro di Planck e quelli di Bose ed Einstein si trovaun nuovo passaggio logico, cioè quello di considerare il campo elettromagnetico comecostituito di particelle identiche (i fotoni), sicché la legge del corpo nero viene pensatada Bose come la legge di un gas di particelle identiche di un tipo particolare. Einsteinpoi estenderà questa idea al caso di particelle identiche materiali.

43NOTA PER GLI AUTORI. Spiegare come Planck identifica l’entropia S sicché la derivatarispetto ai Pi (come rispetto all’energia) dà la temperatura e dunque la costante β risulta essere latemperatura inversa, uguale per tutti i diversi gruppi di risonatori (con frequenze diverse.

Fondamenti della meccanica quantistica: Planck 83

Dunque il passaggio intermedio è quello di concepire il corpo nero come un gasdi particelle identiche. Questo in effetti è il contributo del celebre lavoro di Einsteindel 1905. Vedremo tuttavia che questa analogia (corpo nero, gas di fotoni) è legittimasoltanto nel limite in cui il corpo nero viene trattato nella approssimazione di Wien.Il “vero” corpo nero corrisponde ad un sistema di particelle che, usando le parole diEinstein stesso, presentano una “misteriosa” interazione mutua.

Commento: i dati sperimentali disponibili sulla legge di Planck per il corpo nero.Può apparire sorprendente il fatto che i dati sperimentali di laboratorio sulla legge delcorpo nero sono piuttosto rari. Gli ultimi dati raccolti in maniera sistematica risalgonoal 1921 (Rubens e Michel), e si riteneva che rispetto alla legge teorica presentassero scartidell’ordine dell’uno per cento. Invece è stato mostrato (L. Crovini, L. Galgani, Lett.Nuovo Cim.) che lo scarto è dell’ordine del tre percento. La situazione è ancora piùstrana per quanto riguarda la costante di Stefan. I dati fino a qualche tempo fa scarta-vano di qualcosa come il 5 percento. Più recentemente è stata eseguita una misura chesembrerebbe dare uno scarto molto più piccolo. Una rassegna dei dati sperimentali peril corpo nero di laboratorio può essere trovata in un articolo pubblicato diversi anni fasugli Annales de la Fondation L. de Broglie.

Una situazione diversa si presenta per i dati sperimentali sulla radiazione di fondodell’universo, che sembrano seguire in maniera buonissima la legge di Planck. Questoavviene per i dati ottenuti da satellite, perché precedenti dati ottenuti da Woody e Ri-chards (articolo su PRL) da palloni indicavano una fortissima discrepanza sul picco (chegli autori attribuivano a difficoltà nel fissare la taratura, o calibrazione, dei rivelatori allediverse frequenze – si noti che qui si ha a che fare con una isoterma invece che con delleisocromatiche). Naturalmente, anche per i dati ottenuti da satellite esiste un delicatoproblema di calibrazione o taratura. Una rassegna di tali metodi sperimentali dovrebbeessere contenuta in un lavoro di Giorgio Sironi in corso di pubblicazione, presentato aPrinceton in occasione del centenario della scoperta della radiazione di fondo.

84 Andrea Carati e Luigi Galgani

Capitolo 4

Einstein e i quanti, e lefluttuazioni di energia

L’ipotesi dei quanti “spiegava” in qualche modo lo spettro del corpo nero, ma dauna parte era in palese contrasto con tutta la tradizione della fisica, dall’altra eratutt’altro che una teoria, era un ipotesi appunto, ristretta ad un fenomeno parti-colare. Tra il 1900 ed il 1911 questa ipotesi fu estesa ad altri ambiti di meccanicastatistica, riuscendo a “spiegare” molta fenomenologia. Molti di questi risultatifurono dovuti ad Einstein, ed in questo capitolo esporremo i suoi contributi piùrilevanti.

4.1 Introduzione

Si possono rintracciare diversi filoni nella ricerca di Einstein sulla teoria dei quan-ti di Planck. Un primo filone, relativo al lavoro del 1905, riguarda l’idea cheil campo elettromagnetico possa essere concepito come costituito da particelleidentiche (oggi dette fotoni), analogamente a quanto avviene per un gas. In effet-ti, questo fatto viene dimostrato solo nel caso limite di alte frequenze e/o bassetemperature, in cui la legge di Planck si riduce a quella di Wien. Un secondo filone(lavoro del 1907) riguarda la teoria dei calori specifici dei solidi; in particolare, fuin questo ambito che Einstein concepí la deduzione forse più significativa dellalegge di Planck. Un terzo filone, culminato nel contributo alla conferenza Solvaydel 1911 e iniziato nel 1906 o addirittura nel 1904, riguarda il ruolo delle fluttua-zioni dell’energia in meccanica statistica, in particolare in relazione alla legge diPlanck. In questo terzo ambito egli descrive anche come ritenga che la quantiz-zazione sia solo una via d’uscita provvisoria, nel senso che “tutto va come se ilsistema fosse quantizzato”, opinione che egli tenne fino alla fine della sua vita. Unquarto filone, sviluppato nel 1925, riguarda la formulazione della cosiddetta sta-tistica di Bose–Einstein per particelle identiche, che egli stesso (nel suo secondolavoro del 1925) espone riprendendo quasi alla lettera il procedimento del lavo-ro di Planck del 14 dicembre 1900. Un quinto filone fu sviluppato in un lavoro

85

86 Andrea Carati e Luigi Galgani

del 1917 in cui, lavorando nell’ambito della concezione dell’atomo introdotta daBohr nel 1913, egli ritrova la legge di Planck come condizione di equilibrio di-namico tra campo elettromagnetico e materia. In particolare vi introduce le suecelebri probabilità di transizione, spontanee e indotte, tra livelli, deducendoneanche la seconda legge (∆E = hν ) che Niels Bohr aveva introdotto nel 1913 comerelazione tra frequenza emessa o assorbita e salto quantico. Inoltre, in tale lavoromette in luce come ai fotoni si debba attribuire non solo un’energia, ma anche unmomento, come in seguito fu osservato sperimentalmente nell’effetto Compton(1923).

4.2 Il lavoro del 1905, sui quanti del campo elettroma-gnetico

Potremmo esporre i risultati di questo lavoro di Einstein in forma compatta,descrivendoli con parole nostre. Preferiamo scegliere la strada un po’ più lungache consiste nel seguire la sua esposizione, come possibile stimolo alla letturadiretta del lavoro originale.

Nell’Introduzione Einstein osserva che vi è una grande distinzione qualitativatra campo elettromagnetico, trattato come un continuo, e sistema di un numeroanche illimitato di atomi ed elettroni. Infatti, “nel caso della luce l’energia deveessere concepita come una funzione spaziale continua, .... mentre ... l’energia diun corpo ponderabile ... non può sparpagliarsi in parti arbitrariamente numerosee arbitrariamente piccole.” Invece egli intende mostrare che le osservazioni sulcorpo nero, e sui fenomeni di generazione e trasformazione della luce, “appaionopiù comprensibili nell’ipotesi di una distribuzione spaziale discontinua dell’energialuminosa. Secondo l’ipotesi che sarà qui considerata, quando un raggio luminosouscente da un punto si propaga, l’energia non si distribuisce in modo continuo inuno spazio via via più grande; essa consiste invece di un numero finito di quanti dienergia, localizzati in punti dello spazio, i quali si muovono senza dividersi e possonoessere assorbiti e generati solo nella loro interezza.”

Il primo paragrafo si legge con grande piacere, e dovrebbe essere ben com-prensibile al lettore che ci ha seguito finora. Egli considera una regione dellospazio in cui si trovano molecole, e particelle cariche attratte da molle verso pun-ti fissi (i risonatori che ben conosciamo). Vi è poi naturalmente la radiazione,che egli ammette essere in equilibrio con i risonatori, se “supponiamo che vi sianopresenti risonatori per tutte le frequenze da prendere in considerazione” (si ricordiil modo in cui l’equilibrio dinamico tra risonatori e campo viene concepito daPlanck). Ricorda poi il principio di equipartizione (che egli tuttavia non nomi-na), e come questo condurrebbe alla legge che oggi chiamiamo di Rayleigh–Jeans.Scrive dunque tale legge, che qui riproduciamo sia nelle nostre notazioni, sia inquelle dell’articolo di Einstein, ovvero

uν =8πν2

c3kB T , ρν =

RN

8πν2

L3T ,

Fondamenti della meccanica quantistica: Einstein 87

perché egli denota

ρν ≡ uν , L≡ c , N ≡NA ,RN≡ kB .

Osserva poi che questa legge corrispondente all’equipartizione condurrebbe evi-dentemente per il campo a una energia per unità di volume divergente.

Nel secondo paragrafo egli assume che valga la legge di Planck, consideran-dola come un fatto di esperienza, “senza presupporre una teoria per la generazionee la propagazione della radiazione”. Scrive dunque la legge di Planck, che quiriproduciamo usando le due notazioni, ossia

uν =8πh ν3/c3

exp(hν/kB T )− 1, ρν =

αν3

exp(βE ν/T )− 1

dove abbiamo denotato con βE quello che Einstein denota con β, per distin-guerlo dal nostro β= 1/kB T . Dunque si ha

α=8π h

c3, βE ≡

hkB

Egli poi osserva che per grandi lunghezze d’onda o per grandi densità di radia-zione si ottiene quella che chiamiamo legge di Rayleigh–Jeans.

Infatti, come ben sappiamo, si ha che la legge di Planck per un oscillatore si riduce akB T , ovvero alla legge “classica” corrispondente al principio di equipartizione, quandola quantità adimensionale

x def=hν

kB T

tende a zero (cioè per basse frequenze e/o per alte temperature):

hνe hν/kB T − 1

' kB T perhν

kB T� 1 . (4.2.1)

Infine, attraverso la conoscenza sperimentale dei coefficienti α, βE , egli de-termina il valore del numero di Avogadro come 6.17 · 1023, concludendone che“un atomo di idrogeno pesa 1/N = 1.62 · 10−24 g. Questo è precisamente il valoretrovato da Planck, e concorda in modo soddisfacente con i valori di questa grandezzatrovati per altre vie.”

Nel terzo paragrafo, riproducendo un argomento di Wien, egli mostra co-me si presenta per il corpo nero l’analogo della relazione termodinamica cheabbiamo ripetutamente usato discutendo il primo lavoro originale di Planck,ovvero

∂ S∂ U

=1T

.

Il procedimento è il seguente. Nel caso del corpo nero, analogamente a quantoavviene per l’energia, anche l’entropia sarà data da una entropia per unità di

88 Andrea Carati e Luigi Galgani

volume moltiplicata per il volume (che Einstein denota con v anziché con V ).Egli compie poi una decomposizione in frequenze analoga alla u =

uνdν, e oraintroduce sν (che egli denota con φ(ν)) l’analoga della uν . Ammette poi che lacomponente della densità di entropia dipenda anche dalla densità di energia uν(per lui ρν ) ( analogamente a come in termodinamica S dipende da U ), per cuiscrive (qui teniamo ancora le due notazioni)

S =V∫

sν (uν )dν , S = v∫

φν (ρν )dν .

Qui la dipendenza dal volume V è essenziale. È proprio questo il punto che mancavanei lavori di Planck del 1900, e che permette ad Einstein di rendere piena la analogia conil gas perfetto (che ora sarà un gas di fotoni).1

Con passaggi semplici egli ottiene allora l’analoga della ∂ S∂ U = 1/T , che evi-

dentemente prende la forma

∂ sν∂ uν

=1T

,∂ φν∂ ρν

=1T

.

Il quarto paragrafo tiene un posto centrale in tutto il lavoro. Egli considerala legge di Planck nel caso limite di grandi ν/T , in cui essa si riduce alla legge diWien,

uν = αν3 exp(−hν/kB T ) , ρν = αν

3 exp(−βE ν/T ) .

Da questa, prendendo il logaritmo, si ricava immediatamente

1T=−

kB

hνlog

uναν3

,1T=− 1

βE νlog

ρναν3

.

A questo punto egli segue esattamente il procedimento di Planck. Per integrazio-ne della ∂ sν

∂ uν= 1/T rispetto ad uν , ottiene immediatamente

sν (uν ) =−uν

hν/kB

h

loguναν3− 1

i

, φν (ρν ) =−ρνβE ν

h

logρναν3− 1

i

.

Da questa, moltiplicando per V dν, ottiene allora l’entropia S della radiazionenell’intervallo (ν , ν + dν), ovvero

S =V sνdν (4.2.2)

e analogamente ottiene l’energia E della radiazione nello stesso intervallo difrequenze, ovvero

E =V uνdν . (4.2.3)1Nel libro del 1906 (paragrafo 125, pag. 125), Planck considera una variazione di volume, ma

poi si limita allo scambio di energia tra radiazione e risonatore, a V fissato. Qui Einstein completail discorso.

Fondamenti della meccanica quantistica: Einstein 89

Si noti che Einstein dispone già della dipendenza dell’entropia dal volume.Qui tuttavia egli compie uno dei suoi tipici salti pindarici. L’astuzia di Einsteinconsiste ora nell’esprimere uν in funzione di E , ovvero nel sostituire uν conE/(V dν). In tal modo egli ottiene

S =−kBEhν

h

logE

V αν3dν− 1

i

≡ − EβE ν

h

logE

V αν3dν− 1

i

, (4.2.4)

Possiamo immaginmare che la sua idea sia stata di ricondursi alle trattazioni dellameccanica statistica in cui si opera ad energia fissata. Egli stesso infatti avevaproceduto in tal modo nei suoi lavori di fondamenti della meccanica statistica,trovando una espressione dell’entropia S a energia E fissata.

Egli dunque pensa ad S come funzione di V dipendente parametricamenteda E , cioè come data da

S = kBEhν

logV + cost

Infatti aggiunge:“Se ci limitiamo a studiare la dipendenza dell’entropia dal volumeoccupato dalla radiazione e denotiamo con S0 l’entropia della radiazione quandooccupa il volume V0, otteniamo”

S − S0 = kBEhν

logVV0

, (4.2.5)

dove noi abbiamo scritto h/kB in luogo di βE . La fondamentale conclusione èallora: “Questa equazione mostra che l’entropia di una radiazione monocromaticadi densità abbastanza piccola varia con il volume secondo la medesima legge con cuivaria l’entropia di una gas perfetto o di una soluzione diluita.”

Infatti, nel paragrafo quinto Einstein ricorda la ben nota formula dell’en-tropia del gas perfetto o di una soluzione diluita, che egli scrive, alla fine delparagrafo, nella forma (stiamo mescolando le notazioni)

S − S0 = kB n logVV0

, (4.2.6)

dove n è il numero di punti costituenti il sistema (gas perfetto o soluzionediluita).

A dire il vero, un punto cruciale di questo paragrafo è che Einstein deduce questa formu-la non nella abituale maniera termodinamica macroscopica, ma muovendosi in ambitoprobabilistico, pensando al gas perfetto come a un sistema di n punti indipendenti, einoltre con distribuzione di probabilità uniforme (nello spazio fisico racchiuso nel volu-me V ), di modo che, come egli stesso dice alla fine del paragrafo, si vede che “per ricavarequesta legge non è necessario fare alcuna ipotesi sulle leggi di moto delle molecole”. Questopunto è fondamentale, perché non saranno le leggi del moto a produrre l’analogia tramolecole e fotoni, ma le leggi probabilistiche (indipendenza, e uniforme distribuzionespaziale).

Riportiamo qui questa sua rilevantissima deduzione di tipo probabilistico. Prelimi-narmente, egli dà un argomento interessantissimo (riportato in tutti i libri) in cui inverte

90 Andrea Carati e Luigi Galgani

la nota relazione di Boltzmann tra entropia S e probabilità W di un stato macroscopico,ovvero

S − S0 = kB logW

(qui W è la probabilità relativa).Seguiamo ora le sue parole. “In un volume V0 siano presenti n punti mobili . . . . Al

sistema considerato competa una certa entropia S0. . . . Immaginiamo ora che tutti gli n puntimobili migrino una parte V del volume V0 ... A questo stato compete evidentemente undiverso valore S dell’entropia. Ci chiediamo: quale è la probabilità del secondo stato rispettoallo stato originario? Ovvero, quale è la probabilità che, in un istante scelto a caso, tutti glin punti, che si muovono indipendentemente l’uno dall’altro in un volume V0 assegnato, sitrovino (per caso) nel volume V ? Questa probabilità ha evidentemente il valore2

W =�

VV0

�n

,

e dunque, applicando il principio di Boltzmann, si ottiene

S − S0 = kB n logVV0

.

Nel sesto paragrafo ottiene la conseguenza principale del lavoro. Egli laesprime in termini della probabilità che hanno le particelle di occupare un vo-lume. Noi otteniamo formalmente lo stesso risultato confrontando il modo incui dipendono dal volume da una parte l’entropia di un sistema di n particellecostituenti un gas perfetto o una soluzione diluita, formula (4.2.6), e dall’altral’entropia della radiazione di fissata frequenza, formula (4.2.5), come dedottadalla legge di Wien.

Dal confronto possiamo quindi concludere, con Einstein (quasi alla fine delparagrafo), che ‘Sotto il profilo della teoria del calore, una radiazione monocromati-ca di piccola densità (nel dominio di validità della legge di Wien) si comporta comese consistesse di quanti di energia tra loro indipendenti, di grandezza hν.”

Nei rimanenti tre paragrafi egli fa poi tre applicazioni fisiche di questa suaconcezione della luce come costituita di grani di energia. La seconda applicazio-ne, all’effetto fotoelettrico, è nota a tutti. 3

La prima riguarda la regola di Stokes sulla fotoluminescenza. Il problema è cheviene assorbita luce di una certa frequenza ν1 e ne viene poi emessa dell’altra difrequenza ν2. Egli osserva che, “secondo il principio di conservazione dell’energia,

2NOTA PER GLI AUTORI. Aggiungere questo punto. Ricordare la legge binomiale e comequesta abbia due limiti, a seconda del valore di N p, dove N è il numero di prove ripetute. SeN � 1/p si ha Gauss, se N � 1/p si ha Poisson. Vedi Doob o Sinai.

3NOTA PER GLI AUTORI Spiegarla rapidamente e anticipare la somiglianza con Franck eHerz. Ci sono i granuli di energia del campo e.m., e in FH ci sono i stati energetici corrispondentiai livelli discreti del singolo atomo. N.B. Come mai sembra si debba parlare del singolo atomo odel singolo fotone, mentre Einstein stesso nel 1911 a Solvay dice di no? Vedere se inserire qui unasubsection messa dopo riguardo Solvay 1911.

Fondamenti della meccanica quantistica: Einstein 91

l’energia di un quanto generato non può essere maggiore dell’energia di un quanto diluce eccitante: deve quindi valere la disuguaglianza hν2 ≤ hν1, ovvero

ν2 ≤ ν1 ,

che è la ben nota regola di Stokes.” La terza applicazione riguarda infine la ioniz-zazione dei gas mediante luce ultravioletta. Osservando che “l’energia di ionizza-zione di una molecola non può essere superiore all’energia di un quanto di energialuminosa assorbita”, e ricordando che, “secondo le misure di Lenard la più gran-de lunghezza d’onda efficace per l’aria è di circa 1.9 · 105 cm”, egli ottiene “unalimitazione superiore per l’energia di ionizzazione”.Osservazione: Legge di Wien e indipendenza; legge di Planck e dipendenza, pre-scrizione di simmetrizzazione. Abbiamo fatto presente che la legge di Wien è l’analogadella legge dei gas perfetti, nelle quale le molecole del gas sono indipendenti l’una dal-l’altra. Questo fatto è rispecchiato, come abbiamo detto, nella deduzione della legge deigas perfetti di tipo probabilistico, che Einstein dà nel suo articolo, in cui le molecolesono supposte indipendenti ed uniformemente distribuite entro il volume V . QuandoEinstein ritornerà su questo problema nel 1925, ancora ripeterà che la legge di Wiencorrisponde alla indipendenza, sicché la legge di Planck in qualche modo tiene conto inmaniera implicita di una certa “misteriosa” influenza reciproca tra i quanti di luce. Ab-biamZo già detto che, in termini moderni, nel caso della statistica di Bose–Einstein que-sta influenza reciproca si rispecchia nella prescrizione che le funzioni d’onda del sistemadi n particelle sia simmetrizzata.4

4.3 Il lavoro del 1907 sui calori specifici

Dal corpo nero ai solidi

Il lavoro consta di tre parti. La prima è molto interessante di per sé, perchéEinstein vi presenta una deduzione della legge di Planck per l’energia media diun oscillatore, con un metodo che è il più economico di tutti quelli possibili, edè in effetti quello riportato in tutti i manuali.

Da questo punto in poi abbandoniamo la notazione di Planck per l’ener-gia media di un oscillatore, ritornando alla notazione termodinamica consueta,ovvero denoteremo con U l’energia interna di un sistema di N oscillatori, econ u = U/N la corrispondente energia specifica, cioè quella intesa per singo-lo oscillatore. Einstein ritorna alla consueta concezione meccanico–statistica incui l’oscillatore é un oggetto miscroscopico inosservabile, per cui la sua energiarisulta inaccessibile. Non ha dunque senso parlarne, se non come energia “per

4NOTA PER GLI AUTORI (sui fotoni). Jeans, nel suo libro Dynamical theory of gases, a pag.379 discute due difficoltà sul concetto di fotoni: 1) interferenza dei fotoni, dovrebbero estendersiper lunghezze dell’ordine di un metro (qualche piede), 2) passano uno alla volta (come riottenutonei lavori che hanno portato il Nobel attorno al 2012). Normalmente si supera la seconda difficoltàammettendo (come Dirac nelle prime pagine del suo libro) che ogni fotone interferisce con sestesso. Ma questo si scontra con la difficoltà che i fotoni non sono indipendenti – vedi Planck vsWien, misteriosa interazione nelle parole di Einstein, dovuta alla simmetrizzazione.

92 Andrea Carati e Luigi Galgani

oscillatore” u = U/N . Viceversa, per Planck l’energia del risonatore ear spe-rimentalmente accessibile, ed è per questo che, nella notazione, essa era statapromossa ad U .

Noi tuttavia rimandiamo deduzione per la legge di Planck data da Einstein,alla parte finale della descrizione del suo lavoro. Il motivo è che, come Einsteinstesso dice, egli considera la legge per l’energia media dell’oscillatore materialecome una conseguenza della legge di Planck per la densità di energia uν del corponero, dovuta all’equilibrio dinamico che si instaura tra radiazione elettromagneti-ca e risonatori materiali. Infatti, la formula (5) dell’articolo di Einstein è propriola (3.3.1) di Planck, che nelle nostre notazioni si scrive ora

u =c3

8πν2uν

che gli permette di dedurre la legge

u =hν

eβhν − 1, (4.3.1)

a partire dalla legge del corpo nero.Proprio dalla concezione che esista questo equilibrio dinamico tra campo e ri-

sonatori scende l’idea centrale del lavoro, ovvero che anche i “portatori di calore”del solido debbano seguire l’analoga (4.3.1) della legge del corpo nero, e quindipresentare un calore specifico corrispondente. Il fatto che poi Einstein presentianche un’altra deduzione indipendente della legge di Planck per un oscillato-re, portando a compimento l’idea della discretizzazione dell’energia dell’oscilla-tore introdotta nel secondo lavoro di Planck, costituisce in qualche modo unaaggiunta, anche se di grande interesse, al contributo centrale del lavoro.

Nella seconda parte Einstein viene al vero problema fisico che gli interessa,ovvero estendere la legge di Planck dal corpo nero al calore specifico dei solidi.Qui egli compie un volo pindarico. Infatti dopo avere osservato come Planckabbia dovuto modificare “la teoria cinetico–molecolare del calore [cioè il principiodi equipartizione] per quanto riguarda la interazione fra radiazione e materia inrelazione al problema del corpo nero”, poco sotto egli aggiunge: “Se la teoria del-la radiazione di Planck coglie il nocciolo del problema, è presumibile che anche inaltri settori della teoria del calore si presentino contraddizioni tra l’attuale teoriacinetico–molecolare e l’esperienza, che si possano rimuovere procedendo per la stradaintrapresa. A mio parere ciò effettivamente avviene, come cercherò di mostrare nelseguito.”

Dunque egli ricorda che, se ci rappresentiamo i portatori di calore in un so-lido come oscillatori armonici (o risonatori), allora per il calore specifico di unamole di solido il principio di equipartizione predice il valore 3R,5 ovvero 5.94calorie, qualunque sia la temperatura. Poi egli ricorda (abbiamo già riportatoquesto fatto in un precedente paragrafo) che, per quanto riguarda l’interazione

5Abbiamo tralasciato il fattore n di Einstein, numero di atomi in una molecola.

Fondamenti della meccanica quantistica: Einstein 93

tra campo elettromagnetico e materia, ovvero per la fenomenologia della disper-sione della luce, secondo Drude si devono ricondurre le frequenze proprie infra-rosse di un solido a oscillazioni degli atomi. Dunque, “Se consideriamo i portatoridel calore nei corpi solidi come strutture in oscillazione periodica di frequenza in-dipendente dall’energia di oscillazione [cioè come oscillatori armonici], stando allateoria della radiazione di Planck non possiamo attenderci che il calore specifico [diuna mole] possieda sempre il valore 5.94 [cioè il valore 3R in calorie]. Dobbiamoanzi porre” per l’energia interna di ogni oscillatore 3 volte la formula di Planck(4.3.1).

Si noti l’inciso “stando alla teoria della radiazione di Planck”. Questo vuol dire che Ein-stein non sta semplicemente quantizzando l’energia dell’oscillatore secondo quella cheoggi chiamiamo la prescrizione della meccanica quantistica, come se questa concernessel’energia di un sistema meccanico che ubbidisce all’equazione di Schroedinger anziché aquella di Newton. Per lui l’oscillatore materiale eredita la quantizzazione dalla interazio-ne col campo elettromagnetico. Addirittura, nel 1911 Einstein giunge a dire che si trattadi una proprietà mutua del sistema campo elettromagnetico ed oscillatore materiale. Èa causa della loro interazione che essi sono quantizzati, o meglio che, ai fini dei calorispecifici, essi si comportano come se fossero quantizzati.

In ogni modo, la formula per il calore specifico CV riferita ad un oscillatorepensato come un oscillatore su una retta (sicché, per un atomo, si dovrà assegnareun oscillatore per ciascuna delle tre direzioni spaziali), si ottiene immediatamentederivando rispetto alla temperatura la formula (4.3.1) per l’energia media di unoscillatore, e si trova immediatamente (usando CV =−

∂ U∂ β /kB T 2)

CV =1

kB T 2

(hν)2 e hν/kB T

e hν/kB T − 1�2 . (4.3.2)

Nella terza parte Einstein confronta la curva teorica del calore specifico infunzione della temperatura con diversi dati sperimentali, trovando un accordoqualitativo, e anche quantitativo (almeno parzialmente), molto buono. Egli stes-so fa presente (pag 198–199 dell’edizione italiana) che in effetti si trova una certadiscrepanza alle frequenze molto alte (o temperature molto basse) dove la curvateorica decade a zero esponenzialmente, molto più rapidamente rispetto ai datiosservati. Questo fatto, ben noto, è oggi spiegato al modo di Debye, facendoriferimento agli oscillatori virtuali corrispondenti ai modi normali del cristallo,da cui si deduce che il calore specifico decade a zero come T 3 (si tratta di unalegge analoga a quella di Stefan–Boltzmann per il corpo nero).

Ma questi sono dettagli. L’idea di applicare al calore specifico dei solidi lalegge di Planck del corpo nero, trasportandola agli oscillatori materiali in virtùdi un equilibrio dinamico tra radiazione e materia, costituisce un grande volopindarico. Il confronto con i dati sperimentali è emozionante, e meriterebbe diessere commentato paragrafo per paragrafo. Così è anche per l’applicazione cheEinstein fa al diamante, la cui frequenza infrarossa non era nota, e viene alloraindotta da Einstein attraverso la conoscenza dei valori del calore specifico.

94 Andrea Carati e Luigi Galgani

Osservazione: portatori di calore e modi normali. Debye come Rayleigh; Debye vsRaman. Aggiungiamo un ulteriore commento. Oggi sembra si dia per scontato che ilcalore specifico dei solidi debba essere stimato a tutte le temperature mediante il metododi Debye, almeno nell’approssimazione armonica. Ovvero, si calcolano i modi normalidel cristallo nell’approssimazione in cui si trascurano le interazioni non lineari tra gliatomi o gli ioni costituenti il cristallo, e si assegna ad ogni modo normale (caratterizzatoda una sua certa frequenza) il calore specifico secondo la formula di Einstein relativaa quella frequenza. Ma concretamente la procedura che si segue è quasi indipendentedal calcolo dei modi normali (se non per la parte di basse frequenze, in cui si usa laprescrizione di Debye). Infatti, si prendono in considerazione le frequenze osservatesperimentalmente (per effetto Raman ad esempio, oppure tramite scattering di neutroniod altro) che in generale dipendono dalla temperatura, e poi ad ognuna di tali frequenzesi assegna il contributo di Einstein, nel range di temperatura considerato.6.

Un atteggiamento di questo tipo fu tenuto per tutta la sua vita anche dal fisico in-diano Raman. Gran parte del sesto e ultimo volume in cui sono raccolte le sue opereè dedicato ad una controversia che egli sempre tenne sostanzialmente tutta la comunitàscientifica (compreso Max Born, la cui tesi era sostenuta perfino dal curatore stesso delleopere di Raman). Raman sosteneva che il procedimento consueto, basato sul metododi Debye, non sia corretto, e che invece si debba applicare la formula di Einstein, masoltanto per le alte frequenze, precisamente quelle relative alla cella elementare di uncristallo.7

Deduzione meccanico–statistica della legge di Planck per un singolo oscilla-tore

Illustriamo infine la deduzione della legge di Planck di tipo “meccanico– statisti-co” (cioè, fatta senza riferimento all’interazione con la radiazione), che Einsteindà nella prima parte del lavoro. Nonostante che all’inizio del lavoro egli si riferi-sca alla meccanica statistica di un sistema macroscopico costituito da un numeroenorme di sottosistemi (sulla linea di due suoi precedenti lavori), egli infine vie-ne a considerare un sistema costituito di un solo oscillatore, con distribuzionedi Maxwell–Boltzmann, e ricorda come allora si ottenga per la sua energia me-dia il valore kB T (in accordo col principio di equipartizione). Egli poi rileggeil procedimento del secondo lavoro di Planck in qualche modo forzandolo, cioèassumendo che l’oscillatore possa veramente assumere solo le energie εn = nhν(come oggi fanno tutti i manuali, riferendosi agli autovalori dell’hamiltoniana diun oscillatore armonico).8

6Si veda ....7Raman, Opere, volume 6.8In effetti, gli autovalori sono

εn = nhν +12

hν .

Il termine additivo hν/2 contribuisce all’energia media per un termine hν/2 che costituisce lacosiddetta “energia di punto zero” (dal tedesco nullspunkt, energia allo zero assoluto). Ma taletermine, non dipendendo dalla temperatura, non contribuisce al calore specifico ed è pertantoirrilevante per la termodinamica. Sembra però che abbia qualche rilievo nella teoria dei solidi enel cosiddetto effetto Casimir, anche se questo punto è tutt’altro che chiaro. La situazione rispettoa questa energia di punto zero è molto ambigua, e non abbiamo qui il tempo di discuterne.

Fondamenti della meccanica quantistica: Einstein 95

Allora Einstein assume che la probabilità di tali livelli sia data formalmenteancora da una distribuzione di Maxwell–Boltzmann, ristretta però ai solo valoriammessi dell’energia, ovvero sia data da9

pn =e−βεn

Z(β)con Z (β) =

ne−βεn .

Infine calcola il valor medio dell’energia

u ≡

E� def=

nεn pn

con un procedimento alquanto curioso, che egli ripeterà esattamente identiconel suo contributo alla conferenza Solvay del 1911. Qui riportiamo il calcoloche si compie oggi su tutti i manuali. Si osserva che, come per il caso continuo,il valor medio u è evidentemente dato dalla consueta formula u = −∂β logZ ,sicchè basta calcolare Z , o addirittura solo il modo in cui logZ dipende da β,trascurando eventuali termini additivi costanti. Per fortuna succede che la seriesi somma immediatamente, essendo una serie geometrica di ragione a con

a = e−βhν ,

e pertanto si ha

Z =∞∑

n=0an =

11− a

=1

1− e−βhν.

Dunque logZ (β) =− log(1− e−βhν ) e

u =hν e−βhν

1− e−βhν

sicché infine, moltiplicando numeratore e denominatore per eβhν , si ha la (4.3.1).10

9In effetti, Einstein si esprime in termini che sembrano essere equivalenti all’ammettere che ladensità di probabilità nello spazio µ sia data da una somma di funzioni δ di Dirac centrate suivalori En . Su questo punto ritorneremo quando discuteremo il lavoro di Poincaré sulla necessitàdella quantizzazione.

10NOTA PER GLI AUTORI. Riportare la dimostrazione in forma compatta. CONFRONTOEinstein–Planck. Einstein procede come Boltzmann (naturalmente, senza passare al continuo).Tra l’altro, citare anche cella nello spazio µ come analoga del principio di indeterminazione, allaSackur–Tetrode. Boltzmann avrebbe avuto la difficoltà che l’indice i delle cellette e’ arbitrario enon si riesce ad avere una espressione di ε= εi in funzione di i . Quindi facendo come Boltzmanne calcolando l’energia media si troverebbe

u =C∑

εi e−βεi .

e non si riuscirebbe a fare la somma. Invece Einstein distingue le celle con l’energia stessa e, comePlanck, tiene il volume finito. Quindi riesce a fare la somma. Planck, fa diversamente, ma ha un

96 Andrea Carati e Luigi Galgani

4.4 Einstein e le fluttuazioni di energia, prima conferen-za Solvay del 1911, La théorie du rayonnement et lesquanta

Veniamo ora ad uno dei temi dominanti nella ricerca di Einstein, quello legatoalle fluttuazioni. Tutti abbiamo sentito parlare dell’articolo del 1905 sul motobrowniano, in cui egli studia le fluttuazioni negli spostamenti di una particella.Ma si possono considerare anche gli spostamenti (le fluttuazioni, appunto) delvalore dell’energia di un sistema in interazione con un termostato. Queste so-no le fluttuazioni che qui considereremo. Il primo contributo di Einstein risaleal 1904, al suo secondo lavoro sui fondamenti della meccanica statistica, in cuimise in rilievo una relazione tra calore specifico e fluttuazioni dell’energia, giàpresente in Boltzmann, che noi chiameremo relazione di Einstein–Boltzmann, amotivo dell’amplissimo rilievo che le attribuì Einstein, facendone uso essenzia-le in molti dei suoi lavori . Ad esempio, questa relazione venne reinterpretatain maniera interessantissima nel lavoro del 1908, in cui venne stabilito il legamedelle fluttuazioni dell’energia con il valore medio di questa, nel caso della leggedi Planck. Questi temi vennero poi ripresi in maniera sistematica nel suo contri-buto alla conferenza Solvay del 1911. Questo contributo (lavoro 10 della raccoltaitaliana delle opere) è veramente interessantissimo, perché Einstein vi condensatutti i suoi pensieri sulla legge di Planck. In particolare, vi manifesta in manieraesplicita e ferma la sua opinione che terrà per tutta la vita (come ribadito nella suaautobiografia scientifica), e che determinò il suo quasi completo isolamento nellacomunità scientifica. Ovvero, che la quantizzazione di un singolo sottosistemanon è necessaria, ma costituisce soltanto una ”via d’uscita provvisoria”.

Fluttuazioni di energia e calore specifico: la lettura dinamica di Einstein

Fin dal suo lavoro del 1904 sui fondamenti della termodinamica statistica Ein-stein aveva messo in luce la relazione fondamentale tra calore specifico e varianzadell’energia. che chiameremo relazione di Einstein–Boltzmann,

σ2E = kB T 2 CV . (4.4.1)

Essa stabilisce il fatto che, per un sistema macroscopico, il calore specifico è so-stanzialmente uguale (a meno del fattore kB T 2) alla varianza σ2

E della sua energia.

trucco per passare all’energia media e calcolarla. Vedere pero’ come nel lavoro del 1925 Einsteinriprende il metodo di Planck. Il motivo è che in tal modo evita di fare le cellette nello spazio µ. Acolpo si calcola l’energia media U (seguendo Planck). Sempre, la probabilità nella spazio µ e’ datadall’esponenziale di MB. Ma vi compare εi , cioe’ i livelli quantistici. Planck evita di parlare deilivelli, e Einstein lo segue quando fa i bosoni. Calcola l’energia media di un pacchetto di oscillatorio sottosistemi, con la formula combinatoria di Planck, che in effetti era già di Boltzmann. N.B.Einstein e’ colpito dal lavoro di Bose, perché lui parla delle energie medie dei pacchetti senzaconoscere i livelli. Planck si interessa alle energie medie dei pacchetti U = P disinteressandosi deilivelli.

Fondamenti della meccanica quantistica: Einstein 97

Ricordiamo che questa è definita da

σ2E

def= ⟨(E −U )2⟩ (4.4.2)

dove E è l’energia, considerata come una variabile aleatoria (random variable),ed U def= ⟨E⟩ il suo valor medio.

La relazione (4.4.2) potrebbe essere dimostrata sotto ipotesi molto deboli, e comunqueviene ottenuta in mezzo minuto se si assume che si abbia un distribuzione di probabilitàcanonica (o di Gibbs) nello spazio delle fasi del sistema totale (spazio Γ , il cui puntogenerico denotiamo con z ), ovvero

ρ(z) =e−βE(z)

Z(β),

dove E è l’energia totale e Z il fattore di normalizzazione (funzione di partizione). For-malmente, questa legge è l’analogo della distribuzione di MB nello spazioµ. In tal modo,come sappiamo, riferendosi alla espressione che definisce il valor medio di E in terminidi ρ, si verifica immediatamente che si ha

U =−∂β logZ ,

e allo stesso modo si verifica subito che si ha

∂βU =−σ2E

Infine, si considera il calore specifico (o la capacità termica – qui confondiamo le duenozioni) definito come la derivata dell’energia media, ∂T U , e si usa

kB T 2∂T =−∂β .

Si noti che la relazione (4.4.2), che abbiamo ricavato a partire dalla distri-buzione di Gibbs o di MB, vale anche per la corrispondente distribuzione neldiscreto, cioè quando la distribuzione viene ristretta ai soli valori quantizzatidell’energia.

Il punto su cui vogliamo mettere l’accento è che questa relazione potrebbeinterpretarsi in maniera puramente cinematica, ovvero: nella distribuzione diMaxwell–Boltzmann (o di Gibbs), l’energia non ha un valore fissato, ma è unarandom variable che ha un suo valor medio < E >≡U ma può assumere tutti glialtri valori, e lo sparpagliamento di tali valori è caratterizzato dalla varianza σ2

E .Nella mente di Einstein, invece, tale sparpagliamento ha una origine dinamica,ed è dovuto al fatto che il sistema considerato è in interazione con un termostatocon cui scambia energia. Per questo il valore istantaneo della sua energia variacol tempo. Nelle parole del suo lavoro del 1904 (edizione italiana, pag. 115),“In genere il valore istantaneo dell’energia E differisce dal suo valor medio di unacerta quantità che chiameremo fluttuazione dell’energia”. E continua: PonendoE =< E >+ε abbiamo

< ε2 >≡ σ2E = kB T 2 ∂ < E >

∂ T.

98 Andrea Carati e Luigi Galgani

Dunque dice valore “istantaneo”, ovvero valore assunto al variare del tempo, enon “valore possibile”, come si dice quando si parla di una random variable.Questo aspetto è fortemente ribadito in un punto dell’articolo del 1911, dove dice (pag.251, abbiamo talora cambiato le notazioni). “Consideriamo un sistema K di capacitàtermica C che sia in uno stato di scambio continuo con un ambiente di capacità termicainfinita a temperatura T . A causa dell’irregolarità dei fenomeni termici elementari, l’energiadiK presenta fluttuazioni attorno a un valore medio U , discostandosi da esso di una quantitàvariabile ε ≡ E − U . Dal principio di Boltzmann risulta che la media quadratica σ2

E diquesta fluttuazione è data da σ2

E = kB T 2C .”

A noi piace leggere questa frase di Einstein come una premonizione delrisultato di Kubo sul calore specifico, di cui parleremo in un prossimo capitolo.

Relazione tra fluttuazioni di energia e valor medio per un sistema di oscilla-tori secondo Planck, secondo Wien e secondo Maxwell–Boltzmann

Vogliamo ora discutere la relazione tra fluttuazioni di energia (varianza σ2E ) e

valor medio U per un sistema di oscillatori. Risulta che questa relazione presen-ta anche una interessante dipendenza sia dal numero N di sottosistemi, sia dalnumero di quanti di energia. Per evidenziare questo duplice aspetto può essereconveniente considerare dapprima il caso di in singolo oscillatore e solo dopopassare al caso del sistema di oscillatori.

Consideriamo dunque il caso di un singolo oscillatore, con energia media udata dalla formula di Planck

u =hν

e hν/kB T − 1.

Per trovare la relazione cercata basta prendere in esame l’espressione (4.3.2) delcalore specifico (per particella) che fu data da Einstein nel 1907, e qui riscriviamonella forma

σ2E ≡ kB T 2CV =

(hν)2 e hν/kB T

e hν/kB T − 1�2 .

Seguiamo il procedimento suggerito da Einstein stesso nel suo contributo allaconferenza Solvay (pag. 249 dell’edizione italiana), dove dice “eliminando T me-diante l’espressione di u”. Dunque, ricordando l’espressione data sopra del valormedio u è evidente che per trovare la relazione con u conviene al numeratorescrivere

e hν/kB T =�

e hν/kB T − 1�

+ 1 ,

sicché si ottiene subitoσ2

E = hν u + u2 . (4.4.3)

Ora, casi limite hν/kB T � 1 e hν/kB T � 1 la legge di Planck si riducerispettivamente a quella di Wien e a quella cosiddetta classica di equipartizione,

uW i en = hν e− hν/kB T , u c l = kB T ,

Fondamenti della meccanica quantistica: Einstein 99

sicché il calore specifico è dato rispettivamente da

C W i enV =

hνkB T 2

e− hν/kB T , C c lV = k ,

e dunque senza alcun calcolo si trova rispettivamente

Wien : σ2E = hν u , classica : σ2

E = u2 . (4.4.4)

Per confronto con la (4.4.3) si vede dunque come la relazione tra varianza e valormedio dell’energia nel caso della legge di Planck costituisca una interpolazione(con pesi identici) delle analoghe relazioni che valgono nei casi limite di altee basse frequenze (o basse temperature ed alte temperature). Commenteremopiù sotto come Einstein rilegge a questa luce il procedimento di interpolazioneseguito da Planck nell’ottobre 1900, aggiungendogli una valenza dinamica che èassolutamente mancante in Planck.

Veniamo finalmente al caso “fisico” di N oscillatori (o, se vogliamo, meglioal caso di N/NA moli), in cui l’energia totale11 ha la forma

U =Nhν

e hν/kB T − 1.

In tal caso il calore specifico, come anche la varianza, hanno le espressionitrovate sopra, ora però moltiplicate per N . È dunque evidente che in quello chediventerà il secondo termine viene a mancare un fattore N per potervi introdurreuno dei due fattori U . In conclusione, invece della formula (4.4.3) si trova ora

σ2E = hνU +

1N

U 2 . (4.4.5)

Ancora più significativa è la formula per lo scarto quadratico medio relativoσ2

E/U 2, che prende la forma

σ2E

U 2=

hνU+

1N

ovveroσ2

E

U 2=

1Nq+

1N

, (4.4.6)

”dove conNq =

Uhν

11È alquanto significativo che, a differenza che nel lavoro del 1907, qui Einstein non nominimai l’oscillatore singolo, ma consideri sempre soltanto il caso macroscopico di N oscillatori. Perlui la distribuzione di MB per il singolo sottosistema semplicemente non esiste. L’unica eccezionesembra essere quella dell’inserto nel lavoro del 1907, ma solo nell’inserto, non nella parte centralecui è veramente rivolto il lavoro. È plausibile che da poco tempo si fosse reso conto di come si possadedurre la legge di Planck nello spazio µ introducendo i livelli di energia, con un procedimentoche poi condusse Bohr alla concezione degli analoghi livelli ad esempio nel caso dell’atomo diidrogeno.

100 Andrea Carati e Luigi Galgani

abbiamo denotato il numero di quanti di Planck presenti in media nel corpo” (Ein-stein, pag. 249) Tra l’altro, come subito si vede, i due termini sono proprio quellirelativi al caso limite di Wien e al caso limite di Maxwell–Boltzmann. Dunque,la dipendenza dal numero di oscillatori (o di moli) è completamente diversa neidue casi limite, e nel caso della formula di Planck si ha una situazione in qualchemodo intermedia.

Le parole di Einstein (articolo del 1908, pag 249) sono le seguenti. “L’equazione (4.4.6)mostra che le fluttuazioni relative dell’energia del sistema dovute all’agitazione termica irre-golare dipendono da due cause distinte, corrispondenti ai due termini del secondo membro.La fluttuazione relativa corrispondente al secondo termine, l’unica che dovrebbe esistere inbase alla meccanica ordinaria, deriva dal fatto che il numero di gradi di libertà del siste-ma è finito; essa esprime l’esistenza degli atomi ed è indipendente dall’energia contenuta nelsistema. La fluttuazione relativa corrispondente al primo termine non dipende in alcunmodo dal numero dei gradi di libertà, ma solo dalla frequenza propria e dalla quantità dienergia presente in media, e si annulla quando questa energia diventa molto grande. Datala sua forma, questa fluttuazione corrisponde esattamente all’ipotesi che l’energia sia com-posta di quanti di grandezza hν che vengono trasferiti indipendentemente l’uno dall’altro”.Riprenderemo più avanti il seguito di questa citazione.

Nota: Fluttuazioni di energia e fluttuazioni di pressione. Nel caso del corponero le fluttuazioni di energia, con la presenza dei due termini indipendenti di Wiene di Maxwell–Boltzmann, hanno un corrispondente nelle fluttuazioni di pressione, cheancora presentano due termini analoghi. Einstein è tornato ripetutamente su questofatto. Nel contributo alla conferenza Solvay egli vi dedica tutto il paragrafo 7.12

L’interpolazione di Planck rivisitata

Quando abbiamo illustrato il modo in cui Planck aveva ottenuto la sua legge me-diante interpolazione, essendoci proposti di seguire per quanto possibile almenole linee del suo procedimento originale siamo stati costretti a tenere un andamen-to in qualche modo elaborato e tortuoso. Nel lavoro del 1911 Einstein dà di taleinterpolazione una rilettura che a posteriori è illuminante.

Si ricorderà che la legge di Planck era stata ottenuta per integrazione di unaequazione del primo ordine nell’incognita U =U (T ). Il secondo membro di taleequazione era stato inventato da Planck, modificando l’espressione che conduce-va alla legge di Wien. Ora Einstein parte dalla constatazione che aveva appenafatto, ovvero, che se vale la legge di Planck per l’energia media U allora il calo-re specifico (o equivalentemente la varianza dell’energia, in virtù del teorema diBoltzmann) è la somma dei due termini che conosciamo, espressi in funzione diU , uno proporzionale ad U , l’altro proporzionale ad U 2. Ma poiché il calorespecifico è la derivata di U rispetto a T , è allora evidente che quella relazio-ne può essere letta come una equazione differenziale (ordinaria) nella incognitaU =U (T ), che, risolta, fornisce proprio la legge di Planck.

12NOTA PER GLI AUTORI. Nell’edizione italiana, a pag. 211 si parla di “uno specchio liberodi muoversi in direzione ortogonale alla sua normale”. Forse si potrebbe trattare di uno specchiolibero di muoversi in direzione ortogonale alla sua giacitura. Controllare.

Fondamenti della meccanica quantistica: Einstein 101

Nelle sue parole. ”Ci si può domandare se l’equazione appena ottenuta per le fluttuazioniesaurisca il contenuto termodinamico della formula della radiazione di Planck, o della for-mula che fornisce l’energia media di un oscillatore. Si vede facilmente che è proprio così. Se ineffetti nell’equazione delle fluttuazioni si sostituisce σ2

E con l’espressione che abbiamo trovatodal teorema di Boltzmann

σ2E = kB T 2 CV = kB T 2 ∂ U

∂ T,

otteniamo per integrazione la formula di Planck”. 13Dunque ora appare manifesto che si sta compiendo una interpolazione tra i due casi

limite di Wien e d Maxwell–Boltzmann.

E immediatamente Einstein aggiunge la sua conclusione, che a nostro avvisopresenta un documento fondamentale per illustrare il punto di vista di Einstein.Egli dice:

”Una meccanica compatibile con l’equazione delle fluttuazioni dell’energia diun corpo solido ideale deve dunque condurre necessariamente alla formula di Planckper l’energia di un oscillatore.”

In altri termini. Se qualcuno è capace di trovare una meccanica che producadelle fluttuazioni di energia della forma adatta, allora avrà dedotto la formula diPlanck. Nella premonizione che Einstein ha di questo fatto, si confrontano dueaspetti. Il primo è di tipo potremmo dire cinematico–statistico: si tratta dellarelazione di Einstein–Boltzmann tra calore specifico e varianza. Il secondo do-vrebbe essere di carattere dinamico,14 e dovrebbe fornire la relazione funzionaletra varianza ed energia media. Quando illustreremo il teorema di fluttuazionedissipazione di Kubo relativo al calore specifico, vedremo che i due aspetti sonoin effetti mescolati, e l’aspetto dinamico si manifesterà in maniera formale attra-verso l’autocorrelazione temporale dell’energia del sistema di oscillatori. In talmodo la eventuale caoticità dei moti renderà possibile ottenere il valore ”classico”mediante l’annullarsi dell’autocorrelazione, mentre la presenza di moti ordinatipotrebbe condurre a calori specifici ”non classici”.

Queste considerazioni di Einstein sembrano indicare che egli non fosse con-vinto della necessità della quantizzazione, nel senso che riteneva che le quantitàmicroscopiche fossero descrivibili tramite funzioni continue. Ad esempio nellaconferenza Solvay, a pag 256 dell’edizione italiana egli dice: Quando un corpo

13Si usa1

hνU +U 2=

1U (U + hν)

=1hν

� 1U− 1

hν +U

.

sicché si deve integrare l’equazione

d(βhν) =� 1

hν +U− 1

U

dU .

Si vede poi che la costante additiva di integrazione deve essere posta uguale a zero, affinché Udiverga al divergere di T .

14Si ricordi la citazione di Einstein, in cui dice esplicitamente che la variazione di energia delsistema studiato deve pensarsi indotta dall’interazione dinamica con il termostato.

102 Andrea Carati e Luigi Galgani

scambia energia mediante un meccanismo quasi periodico di frequenza ν , le proprie-tà statistiche del fenomeno sono le stesse che se l’energia si trasferisse per quanti interidi grandezza hν . Abbiamo già citato nella prefazione le frasi tratte dall’autobio-grafia scientifica che testimoniano come egli abbia tenuto questa posizione finoalla fine della sua vita.15

4.5 Il lavoro sulle probabilità di transizione del 1917. Nuo-va deduzione della legge di Planck

Questo lavoro, dal titolo La teoria quantistica della radiazione (lavoro 12 dellaraccolta italiana delle opere) consta di due parti. La seconda (dal paragrafo 4 allafine) riguarda il fatto che ai quanti di luce di frequenza ν si deve attribuire, nonsolo l’energia hν, ma anche il momento (o quantità di moto) come un vettore dimodulo p = hν/c . Questo è molto importante, perché ci dice che in questo sensoil fotone si comporta come una particella di ben definito momento. Dunque sipotranno studiare gli urti con altre particelle utilizzando la conservazione siadell’energia sia del momento nella maniera familiare. Fu utilizzando questa ideache in seguito (nel 1923) Compton descrisse ed osservò quello che chiamiamoeffetto Compton.

Qui ci occuperemo della prima parte, che è molto breve e semplicissima. eche ebbe una grandissima influenza sui lavori del 1925 con cui Heisenberg, Born,Jordan e Dirac fondarono la meccanica quantistica.

Rispetto ai lavori precedenti il 1912 che abbiamo appena illustrato, questolavoro tiene conto della nuova concezione, introdotta da Niels Bohr nel 1913,che è nota a tutti e discuteremo più ampiamente nella seconda parte di questenote. Si tratta della concezione che

• ogni atomo o ogni molecola o in generale ogni sistema possa esistere indi-sturbato in certi stati, che Einstein denota con Zn , aventi energia εn (ge-neralizzando la concezione di Planck–Einstein per i livelli dell’oscillatorearmonico);

• che il sistema possa “saltare” (è questo il “quantum jump” ) tra due stati conenergia εn , εm , dove ad esempio

εm > εn

emettendo o assorbendo un quanto avente la corrispondente energia εm −εn .

• Bohr aggiunse poi l’ipotesi che il quanto avesse frequenza ν = νmn datadalla relazione

hνmn = |εm − εn | , ovvero νmn =|εm − εn |

h(4.5.1)

15NOTA PER GLI AUTORI. Vedere anche pag. 250, “Non è indispensabile ipotizzare l’esistenzadi quanti” e pag. 208, 203 e 185.

Fondamenti della meccanica quantistica: Einstein 103

(in sintonia con la relazione |∆ε|= hν per i salti di energia dell’oscillatorearmonico di frequenza ν: creare un fotone è equivalente a far saltare diun livello l’energia del corrispondente oscillatore). È questa la cosiddettaseconda legge di Bohr.

Einstein assume le due prime ipotesi e deduce sia la legge di Planck sia la leggedi Bohr (4.5.1) che lega frequenza e salto di energia. A tal fine egli considera unsistema costituito di sistemi identici, con i loro livelli di energia, in interazionecon la radiazione di corpo nero, e ricerca quali siano le condizioni di equilibrio(a fissata temperatura T ) nel processo in cui il sistema atomico e la radiazione siscambino energia (e momento) attraverso i fotoni emessi od assorbiti.

Ovviamente, per procedere occorrerebbe assegnare una dinamica microsco-pica. Come di consueto, Einstein usa invece un procedimento statistico, e an-zitutto assume che all’equilibrio gli stati atomici siano distribuiti con la leggedi Maxwell–Boltzmann. Qui a dire il vero Einstein considera un caso un pocopiù generale (di cui riparleremo nel capitolo su Poincaré), ovvero distribuzionedi MB nello spazio µ, ristretta ai soli livelli. Cominciamo considerando il casosemplice (o di mancanza di degenerazione – livelli tutti distinti) in cui lo statocon energia εn ha probabilità

pn =C e−βεn

dove C è il ben noto fattore di normalizzazione, il cui preciso valore sarà irrile-vante nel ragionamento che si farà.

Il procedimento che egli compie è ora che vi sia una condizione di equilibrionello scambio di energia che si produce tra ogni coppia di livelli εm ,εn (nellenotazioni, seguiamo Einstein, ponendo εm > εn ). Si tratta di una ipotesi chesolitamente va sotto iol nome di “ipotesi del bilancio dettagliato. Questa, nel casodi sistemi discreti in cui si producono salti con assegnata probabilità, é l’analogadell’ipotesi di reversibiltà per i sistemi retti da equazioni differenziali.16)

Per quanto riguarda la interazione fra sistema atomico e radiazione egli in-troduce le seguenti ipotesi.

• Emissione spontanea. Il sistema atomico nello stato di energia εm puòspontaneamente cadere su uno stato di energia inferiore ε. “La probabilitàche ciò avvenga effettivamente nel tempo dt è data da

dW =Anmdt ,

dove Anm indica una costante caratteristica della combinazione di indici con-

siderata.” Con questo processo si ha trasferimento di energia dal sistemaatomico al campo. Nelle parole di Einstein, “La legge statistica ipotizzatacorrisponde a quella di una radiazione radioattiva, e il processo elementarepresupposto corrisponde ad una reazione in cui vengano soltanto emessi raggiγ ”.

16Si veda il celebre articolo di Kolmogorov del 1936.

104 Andrea Carati e Luigi Galgani

• Emissione indotta ed assorbimento indotto. Tuttavia nell’interazionetra sistema atomico e campo, il campo (elettrico) compie lavoro sul sistemaatomico, e questo “a seconda delle fasi del risonatore e del campo” può esseresia positivo sia negativo. In altri termini, il sistema atomico può emettereenergia, ma può anche assorbirla. Si hanno dunque sia una probabilità diassorbimento sua una probabiità di emissione, date rispettivamente da17

dW = B mn ρνdt assorbimento

dW = B nmρνdt emissione

dove B mn e B n

m sono opportune costanti e ρν ≡ uν è la densità di energia delcampo relativa alla frequenza ν associata al salto |εm − εn | considerato.

La condizione di equilibrio per la singola coppia m, n (equilibrio dettagliato)viene dedotta da Einstein nel terzo paragrafo del suo lavoro. Basta richiedereche nel tempo dt gli eventi di emissione e quelli di assorbimento siano dellostesso numero. Naturalmente, il numero di eventi ad esempio di assorbimento èdato dalla probabilità di essere nello stato di energia inferiore moltiplicata per laprobabilità di compiere il salto verso l’alto. Analogamente per il numero di salticon emissione. La condizione di equilibrio è dunque

e−βεn B mn ρν = e−βεm (B n

mρν +Anm) .

Da questa si deduce anzitutto che si deve avere

B mn = B n

m

come si vede immediatamente prendendo il limite T →∞ (in cui gli esponen-ziali tendono a 1) e richiedendo come di consueto che anche ρν diverga. Si hadunque immediatamente

ρν =An

m/B mm

e−β(εm−εn)− 1.

Usando ora la legge di spostamento di Wien si ottengono due conseguenze.Anzitutto si deduce la seconda legge di Bohr ∆E = hν , ovvero la (4.5.1). Poi siricava la relazione

Anm

B mm= αν3

dove α è una costante che potrebbe essere determinata dalla condizione che allimite di basse frequenze o alte temperature valga la legge di Rayleigh–Jeans. Inparticolare, si vede così che i coefficienti B di emissione o assorbimento indottisono determinati dal coefficiente di emissione spontanea A (o viceversa).

17Per molti, risulta difficilissimo ricordare la convenzione di Einstein per le notazioni. L’indicein basso denota lo stato di partenza, e quindi quello in alto denota lo stato di arrivo

Fondamenti della meccanica quantistica: Einstein 105

Esercizio. Verificare che le stesse conclusioni si traggono se la legge di Maxwell–Boltzmann viene assunta in una forma più generale, ovvero

pn =C gn e−βεn ,

dove gn è un fattore positivo (detto fattore di degenerazione), che definisce la molteplicitàdel livello En . Si pensi ad esempio al caso in cui vi siano gn livelli di energia vicinissima.

4.6 I lavori di Bose ed Einstein del 1924–1925

Abbiamo visto come nel 1905 Einstein interpretò la legge di Planck (nel limitedi Wien) in termini di fotoni (come si dice oggi), mostrando come, “forzan-do” il procedimento formale di Planck, davvero si deve considerare la radiazioneelettromagnetica di frequenza tra ν e ν + dν come costituita di quanti di energiahν.

Compiamo ora un salto, e passiamo all’anno 1923, in cui il fisico indiano(di Dacca) S.N. Bose ritrovò la legge di Planck in un modo molto interessante,che diede luogo alla cosiddetta statistica di Bose–Einstein. Il fatto curioso è cheegli inviò il suo breve articolo alla rivista Philosophical Magazine 18 che ne rifiutòla pubblicazione. Allora Bose mandò il manoscritto ad Einstein, che lo studiòe lo generalizzò, come ora diremo. Inoltre Einstein stesso tradusse l’articoloin tedesco, e lo fece pubblicare sulla rivista Zeitschrift für Physik, dove apparvenel 1924, con l’aggiunta della seguente “Nota del traduttore: La derivazione diBose della formula di Planck rappresenta a mio parere un importante progresso. Ilmetodo qui usato pone le basi anche per la teoria quantistica del gas ideale, comeintendo esporre in altra sede”. Infatti Einstein stesso estese il ragionamento diBose applicandolo al caso del gas ideale monoatomico, mostrando che ancheil gas deve essere quantizzato, e che ciò comporta la celebre condensazione diBose–Einstein. Nel suo articolo (del medesimo anno 1924), a parte la differenzatra fotoni e particelle di gas, Einstein riprodusse sostanzialmente lo stesso calcolodi Bose (con la sola differenza di dovere fissare anche il numero di atomi oltre cheil valore dell’energia).

L’articolo ricevette diverse critiche, particolarmente da Paul Ehrenfest, ri-guardo il modo di eseguire i conteggi: il problema era se le particelle dovesseroessere considerate distinguibili o indistinguibili, indipendenti o dipendenti. Que-sto problema fu discusso da Einstein in un secondo articolo, in cui fece anche ilconfronto tra il metodo di conteggio quantistico e quello classico. In particolare,in questo secondo lavoro egli eseguì il conteggio del numero di complessioni noncome nel primo articolo, nel quale riproduceva il calcolo di Bose, ma in un mododiverso, che invece è del tutto uguale a quello originario della seconda deduzionedi Planck (che abbiamo illustrato nel capitolo precedente), con la sola differenzache Einstein usa nomi diversi. Per semplicità di esposizione, sia per il contri-

18Una rivista inglese. La scelta era evidentemente dettata dalla influenza inglese sull’India.

106 Andrea Carati e Luigi Galgani

buto di Bose sia per quello di Einstein riprodurremo qui il secondo metodo diEinstein, cioè quello originario di Planck, usando le notazioni di Planck.19

Bose

Vediamo dunque la prima parte del procedimento di Bose per ritrovare la legge diPlanck del corpo nero. Bose critica la dimostrazione di Planck in quanto farebbeancora riferimento a nozioni classiche riguardanti il numero di oscillatori tra ν eν+dν, che sarebbe “ una ipotesi sul numero dei gradi di libertà dell’etere” che invecepuò “essere dedotto solo per via classica”. Analoga critica egli fa anche all’uso dellalegge di spostamento di Wien.

Dunque egli prende sul serio l’idea di Einstein che il campo elettromagneticodebba pensarsi (almeno nel limite di Wien) composto di quanti di luce indipen-denti, concepiti come particelle20 aventi una posizione nello spazio, e inoltremomento p ed energia E con p2 = E2/c2, come previsto dalla teoria della relati-vità.21 Inoltre, l’energia del quanto è legata alla frequenza da E = hν, e dunque larelazione tra energia e modulo del momento si esprime come

p2x + p2

y + p2z =

h2ν2

c2.

Si noti bene che il campo sparisce e restano solo i fotoni, come particelle.Stranamente, il fattore di Planck e Rayleigh 8πν2/c3 (che già in tali autori avevaorigini molto diverse) riappare quasi in una maniera ancora completamente di-versa. Egli suddivide i quanti di luce (i fotoni) in gruppi, ciascuno relativo ad unintervallo di frequenza tra ν e ν + dν. Poiché fissare la frequenza tra ν e ν + dν ècome fissare l’energia di una molecola tra E ed E +dE (con E = hν ), egli calcolaquale è il volume nello spazio delle fasi (spazio µ) relativo a quanti di frequenzatra ν e ν + dν. Evidentemente, la regione dello spazio delle fasi µ definita da daE < hν, ovvero da p2 < (hν/c)2, ha volume dato da (4/3)π(hν/c)3. Dunque,differenziando, si ha che lo strato (shell) compreso tra ν e ν + dν ha volume

V 4π� hν

c

�2 hc

dν = h3V 4πν2

c3dν ,

19Gli articoli di Bose e di Einstein, insieme con un successivo lavoro di Schrödinger, sono rac-colti e tradotti in italiano nel libro S.N. Bose, A. Einstein, E. Schrödinger, La statistica quantisticae le onde di materia, a cura di P. Bernardini, Bibliopolis (Napoli, 1986).

20L’idea di assegnare energia a questi “quanti” è sostanzialmente implicita nel lavoro di Planck,e venne rese esplicita nel lavoro si Einstein del 1905. Invece, l’idea che essi fossero anche munitidi momento, davvero come delle particelle, fu avanzata da Einstein nel suo articolo del 1917. Inseguito Compton scoprì l’effetto noto con il suo nome, che viene appunto interpretato comecorrispondente a collisioni tra particelle ordinarie e fotoni.

21Si ricordi che per una particella di massa a riposo (rest mass m si ha�E

c

�2

− p2 = m2c2 .

Qui si hanno i fotoni, che devono avere massa a riposo nulla (m = 0) perché si ammette che simuovano alla velocità della luce.

Fondamenti della meccanica quantistica: Einstein 107

dove V è il volume nello spazio fisico in cui è racchiusa la radiazione. Egli molti-plica poi per il consueto fattore due che tiene conto delle possibili polarizzazioni.Infine, divide per il volume h3 di una celletta elementare22 nello spazio µ, e in talmodo riottiene il noto fattore di Planck–Rayleigh che ora denotiamo con gνdν,dove

gν =V8πν2

c3dν , (4.6.1)

interpretato però ora in un modo completamente diverso, ovvero come numerodi celle in cui possono trovarsi i quanti di luce aventi energia tra E ed E + dE (ofrequenza tra ν e ν+dν ). Oggi si preferisce dire che il numero (4.6.1) definisce ladegenerazione del livello di energia E = hν. Cioè vi sono gνdν livelli aventi tuttienergia E ed E + dE , dove gν (con E = hν ) è dato dalla (4.6.1).

Siamo quindi ricondotti alla situazione di Planck. Planck aveva gruppi di Nioscillatori di frequenza νi , (essendo Ni = (8πν

2i /c3)dν il numero di oscillatori

di ogni gruppo), e uno stato macroscopico era una successione {Pi} dove Pi è ilnumero di quanti (fotoni) di ogni gruppo. Fissata l’energia totale, egli trovavaallora lo stato macroscopico di equilibrio come quello di massima probabilità.Qui si cambiano i nomi. Vi sono gruppi di cellette, con gνdν cellette ciascuno,il medesimo che per Planck, e uno stato macroscopico è una successione {Pi} difotoni in ogni gruppo di cellette. La probabilità di ogni stato macroscopico èdata ancora dalla formula di Planck, e quindi si giunge al medesimo risultato.

Einstein

L’idea di Einstein è semplicemente (a posteriori!) di sostituire i fotoni con lemolecole di un gas, e per semplificare la trattazione egli considera un gas monoa-tomico di atomi puntiformi, in cui non esistono dunque gradi di libertà interni(vibrazioni e rotazioni) come avverrebbe per molecole poliatomiche.

Dunque, implicitamente Einstein sta trattando le molecole come se fossero indistingui-bili, come avveniva per i quanti (fotoni) di Planck. Fino ad allora i metodi di Planckerano stati applicati ad oscillatori (che si riferivano al corpo nero o ad oscillatori “ma-teriali” come le molecole di un solido), ed estesi anche ai moti rotatori delle molecolepoliatomiche. Ma era stato suggerito da Nernst che fenomeni “di degenerazione” do-vessero verificarsi anche per le molecole monoatomiche (che hanno solo gradi di libertàtraslazionali), perché questo era richiesto dal terzo principio della termodinamica, da luistesso formulato nel 1906.

Ora, la relazione tra energia E e modulo per momento p di un una molecolamonoatomica è quella di una particella puntiforme,

p2x + p2

y + p2z = 2mE .

22Che il procedimento di Planck avesse come cuore proprio il fatto di considerare lo spazioµ come suddiviso in celle elementari di volume hµ (se µ è il numero di gradi di libertà di unsottosistema) era un fatto acquisito da diverso tempo, certamente dopo il 1911, anno in cui Sackure Tetrode pubblicarono i loro noti lavori.

108 Andrea Carati e Luigi Galgani

Dunque il volume della regione nello spazio µ avente energia minore di E è ora(formula (1a) del primo lavoro di Einstein)

V43π (2mE)3/2

dove V è il volume della regione della spazio fisico in cui è contenuto il gas.Dunque il volume della regione tra E ed E +∆E si ottiene differenziando, ed èdato da

V 2π (2m)3/2 E1/2∆E ,

e dunque il numero N di cellette elementari (di volume h3) contenuto in taleregione è dato da (formula (2) del primo lavoro)

N =1h3

V 2π (2m)3/2 E1/2∆E .

Einstein commenta: “Per ∆E/E fissato piccolo a piacere, si può sempre scegliere Vtanto grande che N sia un numero molto grande.”

Questa è anche la formula (2a) del secondo lavoro di Einstein. Per il numerodi complessioni egli riporta esattamente la formula di Planck (a parte la scelta deisimboli, di cui si dirà qui sotto). Compie allora la massimizzazione del logaritmodella probabilità con i vincoli

Pi Ei = E0 e∑

Pi = n dove n è il numero totaledi particelle, e trova Pi = P ∗i dove

P ∗i =Ni

eα+βEi − 1.

Notazioni moderne. Le notazioni di Einstein nel secondo lavoro sono ni = Pi peril numero di particelle nel gruppo i–esimo di celle, zi = Ni per il numero di celle nelgruppo i–esimo, di energia Ei . Oggi (seguendo il libro di Born Atomic Physics) solita-mente il numero di celle nel gruppo i–esimo, zi = Ni , viene piuttosto denotato con gie detto talvolta fattore di degenerazione. Dunque la formula di Planck per il numero dicomplessioni relativo ad uno stato macroscopico viene scritta

W [n1, n2, n3, . . .] =(gi + ni − 1)!

gi !ni !

e la distribuzione corrispondente allo stato di equilibrio viene scritta

n∗i (α,β) =gi

eα+βEi − 1.

Il problema della distinguibilità

Nel secondo lavoro Einstein prende atto di di una critica sollevata da Ehrenfe-st (ed altri) al suo primo lavoro e a quello di Bose, in cui veniva messo in luceche essi stavano eseguendo dei conteggi non standard (per così dire) riguardo la

Fondamenti della meccanica quantistica: Einstein 109

distinguibilità degli oggetti considerati. A dire il vero, nel caso di Boltzmann ePlanck, la cosa era implicita, ma ovvia. Già Boltzmann considerava P “grani” dienergia che suddivideva tra molecole (mentre Planck li suddivideva tra N risona-tori) .E a nessuno sarebbe venuto in mente di considerare distinguibili due granidi energia. L’energia veniva suddivisa in grani (evidentemente da considerarsiindistinguibili) solo per comodità di conteggio.

Ma quando Einstein trasporta il conteggio alle molecole e, parafrasando Bo-se, conta i modi diversi di distribuire N molecole tra g celle dello spazio µ (celleaventi tutte la medesima energia), allora è evidente che in un conteggio standardsi dovrebbero considerare le particelle distinguibili, come già faceva Boltzmann.Il fatto di non distinguerle costituisce un nuovo assioma, che deve essere dichia-rato esplicitamente. Questo Einstein lo riconosce. Questo nuovo assioma corri-sponde ad una sorta di ipotesi di natura fisica, Einstein dice ripetutamente, e diràcosì anche Fermi. Si tratterebbe del fatto che anche un gas perfetto monoatomicopresenta una sorta di mutua interazione degli atomi (in probabilità si direbbe dimutua dipendenza), che Einstein stesso chiama “misteriosa”. Naturalmente, unatale denotazione, di tipo in qualche modo romantico, scompare assolutamentenella successiva formulazione assiomatica, in cui la “dipendenza” tra le particelledi gas perfetto viene descritta come corrispondente a un procedimento di sim-metrizzazione del prodotto di funzioni d’onda per la statistica di Bose–Einsteine di antisimmetrizzazione per la statistica di Fermi–Dirac.

Per comprendere questa situazione, è un utilissimo esercizio rendersi contodi come la formula di Bose–Einstein per il gas perfetto monoatomico ridiventaquella di Boltzmann se si ammette la distinguibilità delle particelle. Il conto è fat-to da Einstein nel paragrafo 7 del suo secondo lavoro, prima della formula (29b).Noi riproduciamo il calcolo in un modo leggermente diverso. Pensiamo che i gElivelli di energia tra E ed E+dE siano tutti diversi, anche se vicinissimi: Si appli-ca allora il conteggio di Boltzmann (con il consueto contributo N !/(n1!n2! . . .) esi ottengono i numeri di occupazione di MB. Poi, per ottenere l’energia tra E edE + dE si moltiplica per il fattore di degenerazione gE e per l’energia E di ognilivello (cella). SE si procede in maniera analoga per i fotoni, si ottiene la legge diWien invece della legge di Planck.23

23NOTA PER GLI AUTORI. Scrivere meglio questa parte. Citare anche come Einstein descri-ve la condensazione, e la differenza rispetto al gas saturo. Discutere anche il lavoro di Schrödinger,in cui riproduce Einstein, ma introducendo un campo anche per le particelle, una sorta di antici-pazione della seconda quantizzazione, ispirata dal campo di de Broglie (possibile analogia con illavoro Bohr Kramers Slater ?). N.B. Riprendere le citazioni di Paolo Bernardini pag. 55: Hanle( Arch. Hist.Ex. Sc. 17. 165 (1977)) , Landé (Z. f. Phys. 33, 571 (1925) ) sulla Kohärenz dellaradiazione di corpo nero. N.B. Riprodurre il lavoro di Fermi per la statistica di Fermi–Dirac.Accennare alla generalizzazione di Gentile.

110 Andrea Carati e Luigi Galgani

Capitolo 5

Poincaré 1912: sulla necessitàdella quantizzazione

L’idea che le quantità fisiche subiscano variazioni discontinue era veramente estra-nea a tutta la fisica teorica. Essa infatti, a partire da Galileo, basava il suo apparatomatematico sul concetto di derivabilità delle osservabili, e dunque sulla loro rego-larità. Quindi, nonostante gli indubbi successi dell’ipotesi dei quanti, rimanevasempre in sospeso la domanda: ma questa ipotesi è veramente necessaria? Sostan-zialmente in questi termini si esprimeva Poincaré all’inizio del suo lavoro1 “Sur latheorie des quanta”, scritto al suo ritorno a Parigi da Bruxelles, sotto la profondaimpressione delle lunghe discussioni svoltesi alla conferenza Solvay del 1911.2 3

A tale domanda egli rispose in maniera affermativa. Comunque egli espresseanche dei dubbi che il suo teorema fosse la parola definitiva sulla questione, epiù avanti vedremo come la situazione non sia così ovvia. Da una parte, infatti,sembra che la conclusione di Poincaré sia basata su una ipotesi che, come vedre-mo, potrebbe non essere garantita. D’altra parte, dopo il 1963, con la scoperta

1H. Poincaré, Sur la théorie des quanta, Journal de phys. théor. et appliq. 2, 5–34 (1912);Oeuvres IX, pag. 626–653.

2La testimonianza più diretta si ha leggendo le circa 20 pagine in cui sono riportate le discus-sioni che fecero seguito alla relazione di Einstein, pagg. 263–281 della edizione italiana delle operescelte di Einstein. A questa discussione conribuì anche Poincaré con diversi interventi. Egli poimandò anche una nota (inviata da Parigi, e pubblicata a pag. 280 dell’ediziome italiana delle ope-re scelte di Einstein) nella quale annunciava il risultato del lavoro pubblicato nel 1912, che quidiscutiamo. Ricordiamo che Poincaré poi morì nello stesso anno 1912.

3Due importanti lavori sulla necessità della quantizzazione vennero compiuti anche da PaulEhrenfest. Si veda particolarmente P. Ehrenfest, Ann. Phys. 36, 91–118 (1911), dal titolo WelcheZúge der Lichtquantenhypothese spielen in der Theorie del Wärmestrahlung eine wesentliche Rolle? ,riprodotto in P. Ehrenfest, Collected Scientific Papers, North-Holland (Amsterdam, 1959). Si vedaanche l’articolo n. 31 (del 1814) dei Colledcted Papers. Bellissima è la introduzione ai CollectedScientific Papers scritta da Casimir, dove egli confronta lo stile di Ehrenfest con quello di Lorentz(che lo aveva chiamato poco più che trentenne a Leyden), e dove commenta che Ehrenfest eraa central figure in a happy era of physics that will not come again! Si veda anche M.J. Klein, PaulEhrenfest: the making of a theoretical physicist, North Holland (Amsterdam, 1970).

111

112 Andrea Carati e Luigi Galgani

dello “strano attrattore di Lorenz”4 è stato mostrato che anche sistemi alquanto“semplici”, retti da equazioni diffrenziali, e quindi con movimenti lisci, possonopresentare asintoticamente (per tempi lunghi) un comportamento che sembre-rebbe descrivibile come se il sistema si muovesse non su di una varietà liscia, mapiuttosto su di un insieme “strano”, di tipo frattale.

5.1 Introduzione

Di primo acchito l’argomentazione di Poincaré che conduce alla necessitá dellaquantizzazione sembrerebbe avere il carattere di una dimostrazione per assurdo.Infatti egli ammette che il sistema fisico considerato (un sistema di n oscillatoriinteragenti con un gas di p atomi) sia descritto da un modello classico, retto daequazioni differenziali ordinarie (come quelle di Newton), per il quale si hannoorbite continue in uno spazio delle fasi ovviamente pensato come un continuo.A questo punto egli, introducendo l’ipotesi che le energie degli oscillatori sianovariabli causali di tipo iid (indipendenti ed identicamente distribuite), si riduce astudiare il caso di un singolo oscillatore, e deduce quella che sembrerebbe essere lapiù generale espressione possibile per la sua energia media. Infine, ammettendoche tale energia coincida con quella data dalla legge di Planck, che rappresentabene i dati sperimentali, utilizzando la forma in cui viene espressa l’energia mediaegli conclude che l’energia di un singolo oscillatore deve essere necessariamnentequantizzata.

Questo risultato fu inteso come una dimostrazione definitiva ed irrevocabiledella necessità della quantizzazione, ed ebbe immediatamente un grandissimoimpattto sulla cmunitá scientifica.

Davvero caratteristico fu l’atteggiamento di Jeans. Questi aveva partecipa-to alla conferenza Solvay come rappresentante di Rayleigh, illustrando il puntodi vista che fosse possibile spiegare la legge di Planck su basi classiche, quan-do, seguendo Rayleigh e Boltzmann stesso, si tenga conto che possano esserelunghissimi i tempi richiesti per il raggiungimento dell’equilibrio (e quindi del-l’equipartizione) per i gradi di libertà interni alle molecole. Ebbene, dopo lapubblicazione del lavorodi Poincaré, Jeans fece una pubblica ritrattazione (pro-prio così) ed aderì al punto di vista quantistico. Si veda anche il libro di Jeanssulle teorie cinetiche, e la prefazione a un altro libro scritto intorno al 1917, nellaprefazione del quale egli fece ancora sostanzialmente una ritrattazione.5

Del lavoro di Poincaré venne pubblicato nel 1921 un ampio riassunto da Lo-rentz, che evidentemente lo riteneva allo stesso tempo di grande importanza ma

4Questo Lorenz (che si pronuncia come in italiano Lorenzo) non ha nulla a che fare conil grande Lorentz, e nemmeno con l’altro Lorenz che, indipendentemente da Lorentz, e nellostesso anno, giunse a stabilire la cosiddetta “formula di Lorentz–Lorenz”. Questa è una versioneelettromagnetica della formula di Clausius–Mossotti, e svolge un ruolo rilevante nella teoria delladispersione della luce.

5NOIA PER GLI AUTORI: Ritrovare il libro, che esiste nella biblioteca di fisica a Milano.

Fondamenti della meccanica quantistica: Poincaré 113

di difficile lettura.6 Si può poi vedere il libro di Jammer, o i tanti articoli pub-blicati ad esempio sulla autorevole rivista ufficiale per la didattica della fisica,l’American Journal of Physics.7

5.2 L’argomentazione semplificata: la quantizzazione delsingolo oscillatore

Prima di illustrare il lavoro di Poincaré in dettaglio, esponiamo il suo ragiona-mento in forma semplificata, che si applica quando si ammetta di essersi ridottiallo studio dell’energia di un singolo oscillatore. Ci ambientamo dunque nellospazio delle fasi µ di un singolo oscillatore la cui energia, seguendo Poincaré,denoteremo con η.

La quantizzazione viene usualmente recepita come il fatto che l’energia η diun oscillatore possa assumere solo dei valori discreti, mentre Poincaré ragionadifferentemente. Egli cerca di determinare la distribuzione di probabilità dell’e-nergia, o la sua densità w(η),8 e mostrare che questa è “concentrata” sui livellidi energia. In altri termini, i valori di energia diversi da nhν hanno probabilitànulla. Se i due approcci possono sembrare identici dal punto di vista logico, il se-condo permette a Poincaré di seguire una via Statistico–Meccanica per dimostarela necessità della quantizzazione.

La dimostrazione della necessità della quantizzazione è basata dul fatto che ladistribuzione di probabilità w(η) può essere determinata univocamente a partiredalla sua trasformata di Laplace

Z (β) =∫

e−βηdw =∫

e−βηw(η)dη , (5.2.1)

che in Meccanica Statistica è detta funzione di partizione ed in probabilità fun-zione generatrice dei momenti. Pertanto, se vale che l’energia media u di unsingolo oscillatore si può ottenere mediante l’usuale relazione della MeccanicaStatistica

u =− ∂∂ β

logZ , (5.2.2)

allore è evidente che i dati sperimentali di u in funzione della temperatura 1/βpermettono di ricavare (per integrazione) la funzione di partizione e quindiw(η), come antitrasformata di Laplace, che è nota essere unica. Quello che faràPoincaré nel lavoro è proprio dimostrare che vale la relazione (5.2.2), nell’ipotesiche le energie degli oscillatori possano essere considerate variabili causali iid.

6Math Ann. . . . . . . , ristampato anche nelle opere di Poincaré.7Si vedano le relazioni date in F.E. Irons, Am. J. Phys. 69 (9), 879 (2001) e J.J. Prentis, Am. J.

Phys. 63, 339 (1995), che seguono R. McCormmach, Isis 58, 37 (1967).8Ricordiamo che per distribuzione di probabilità di una random variable X si intende la fun-

zione F (x) definita da F (x) = {probabilità che sia X < x}. Invece la funzione f (x) = F ′(x) (dovel’apice ’ denota derivazione) definisce la corrispondente densità di probabilità.

114 Andrea Carati e Luigi Galgani

D’altra parte, fin dal lavoro di Einstein del 1907 sui calori specifici era noto (inuna forma ancora piú diretta che nel lavoro originale di Planck), che la formuladi Planck per l’energia media si ottiene se si ammette che gli unici valori possibilidell’energia dell’oscillatore sono quelli quantizzati dati da

ηn = nhν , n = 0,1,2, . . . , (5.2.3)

e che essi abbianon probabilità pn date da

pn(β) =1Z (β)

e−βηn , Z (β) =∞∑

n=0e−βηn . (5.2.4)

Infatti in tal caso il valor medio u è ancora dato dalla formule (5.2.2) e (5.2.1),prendendo

w(η) =∑

nδ(η−ηn) , (5.2.5)

dove δ(x) è la funzione delta di Dirac. Dunque, per l’unicità dell’antitrasformatadi Laplace, si ottiene che le legge di Planck per l’energia media di un singolooscillatore implica la necessità della quantizzazione.9 10

In conclusione, se ci chiediamo se la discretizzazione o quantizzazione dell’e-nergia sia necessaria quando si voglia dedurre con procedimenti statistici la leggedi Planck, allora seguendo Poincaré otteniamo una risposta positiva.

Osservazione. Abbiamo già fatto presente che Einstein stesso, a partire dal 1911 (anzi,già dal 1908) in maniera decisa espresse l’opinione che la quantizzazione del singolooscillatore (e in generale del singolo sottosistema) non è necessaria. Questo lo espressevividamente nel celebre articolo del 1917, dove dice che la pn che appare nella (5.2.4),che qui denotiamo con pk , non è la probabilità che un singolo oscillatore si trovi nellivello k (come direbbe Bohr), ma è invece la corrispondente “frequenza relativa”. Nellaterminologia che abbiamo usato per descrivere il procedimento di Boltzmann, si ha

pk = nk/N ,

dove nk è il “numero di occupazione” della cella k–esima, rappresentata dal “livello” εk”,e N il numero totale di oscillatori.

9Con un semplicissimo calcolo (somma di una serie geometrica di ragione e−βhν ) si trova

Z (β) = 11− e−βhν

,

e dunque (prendendo la derivata logaritmica)

u(β) =hν

eβhν − 1.

10In effetti, sia Einstein al’inizio dell’articolo del 1907, sia Poincaré nel suo articolo (si veda pag.641, a metà), utilizzano quella che poi diventerà la “funzione delta di Dirac” senza introdurre peressa una notazione ma usando, per definirla, le medesime parole che verranno poi usate da Dirac.

Fondamenti della meccanica quantistica: Poincaré 115

5.3 Il lavoro di Poincaré

Veniamo dunque al lavoro di Poincaré. In effetti, su questo argomento dellanecessità della quantizzazione egli scrisse tre articoli. Il primo costituisce unadiscussione qualitativa, di tipo divulgativo, del problema. Il secondo lavoro, diuna decina di pagine, scritto per fisici, contiene dei calcoli che prendono circatre quarti del lavoro ma non sono completi. I calcoli dettagliati sono invece pub-blicati nel terzo lavoro, di trenta pagine. Egli ne trasse la conclusione che laquantizzazione sia necessaria, e infatti il titolo del paragrafo 8 è proprio Necessitàdell’ipotesi di Planck. Invece, in un altro lavoro Poincaré mostrò qualche perples-sità su tale conclusione,11 e comunque egli purtroppo morí in quello stesso anno1912.

Il problema della misura invariante

Poincaré comincia a discutere quale tipo di modello si debba studiare. Egli ricor-da come Nernst, l’organizzatore della conferenza di Bruxelles, avesse suggeritodi prendere in considerazione modelli in cui si hanno particelle soggette anche aforze proporzionali ad a, cioè alla derivata temporale della accelerazione. Que-sto è un punto molto importante, perché questa è proprio la forma che presentala forza di reazione di radiazione, ovvero la forza di frenamento (una specie diforza di attrito) che si esercita su ogni carica allorché essa irraggia energia elet-tromagnetica. Tale forza fu introdotta fenomenologicamente da Planck verso lafine dell’ottocento, poi studiata attorno al 1905 da Abraham e Lorentz, e infine,in maniera probabilmente definitiva, da Dirac nel 1938. Nella seconda parte diqueste note vedremo come tale forza produca effetti qualitativi inaspettati, e co-me potrebbe condurre a situazioni analoghe a quelle trovate nel 1963 da Lorenzcon il suo “strange attractor”.

Poi Poincaré prende in esame i modelli di interesse per la legge di Planck. An-zitutto si avrebbe il problema di studiare il corpo nero, e dunque l’interazione tracampo elettromagnetico e particelle cariche. Lasciando questo problema a unasuccessivo lavoro (che purtroppo non ebbe il tempo di affrontare), egli infine siconcentrò su un modello completamente meccanico, sostanzialmente un sistemacomposto di due sottosistemi di oscillatori, rispettivamente di bassa frequenza edi alta frequenza, come illustreremo poco più sotto.

Egli si restringe dunque a un modello meccanico, descrivibile mediante equa-zioni differenziali, della forma tipica

x =X (x)

con x ∈ Rn , ed X un campo vettoriale in Rn . Per la dinamica questo è assolu-tamente standard. Il punto delicato è il fatto che ora si intende formulare unameccanica statistica, il che richiede di calcolare delle medie. Come lungamen-te discusso alla conferenza Solvay, particolarmente da Einstein nel suo primo

11NOTA PER GLI AUTORI. Riportare la frase.

116 Andrea Carati e Luigi Galgani

intervento dopo la sua relazione, e come era ben noto a Poincaré12, seguendoBoltzmann stesso egli ammette che le misure significative sono quelle definitedalla dinamica, attraverso i tempi di soggiorno.13 In effetti, misure di tale tiposono comunemente usate mella teoria ergodica, significativamente nel celebre la-voro del 1937 di Krylov e Bogoliubov.14 Nel caso del modello di Lorenz del 1963,la misura così definita risulta proprio essere concentrata sullo strano attrattore,e quindi non può essere rappresentata come integrale di una densità rispetto allamisura di Lebesgue nello spazio delle fasi. Così avviene anche per le equazionidifferenzialì che descrivono un punto soggetto alla forza di reazione di radiazio-ne.15 Comunque, Poincaré esclude situazioni di tale tipo, e infatti si limita alcaso in cui la misura sia descritta da una densità (nello spazio delle fasi), che eglidenota con W .

È noto che una misura µ definita mediante i tempi di soggiorno (rispettoa un “tempo finale” T sufficientemente lungo, eventualmente infinito) risultaessere una “misura invariante”, ovvero ha la proprietà che, per ogni tempo t siha µ(Φt A) = µ(A) per ogni insieme A misurabile. Qui Φt x denota l’evoluto, altempo t , del punto x. È noto anche (si veda il capitolo su Kubo) che, per lemisura invarianti che ammettono densità, questa deve soddisfare l’equazione diLiouville stazionaria

i

∂ xi(W Xi ) = 0 .

Una densità che soddisfi tale equazione viene chiamata da Poincaré con il nomeclassico di “ultimo moltipicatore”. Evidentemente i sistemi hamiltoniani, aven-do la proprietà div X = 0, ovvero

i ∂i Xi = 0, ammettono sempre un ultimomoltiplicatore, proprio W = 1. In altri termini, per i sistemi hamiltoniani lamisura di Lebesgue nello spazio delle fasi è sempre invariante. Questa in effettiè proprio la misura a priori nello spazio delle fasi totale (spazio Γ ) consideratafino dai tempi di Boltzmann. Tuttavia ben sappiamo che la misura di Lebesgueconduce alla statistica di Boltzmann e dunque all’equipartizione dell’energia, cheammettiamo essere adeguata per la statistica degli atomi puntiformi, ma inade-guata per gli oscillatori di alta frequenza. Quindi Poincaré si chiede se nei sistemidi interesse per la legge di Planck (oscillatori armonici) esista un ultimo moltipli-

12NOTA PER GLI AUTORI. Citare il lavoro di P. in cui risolve una diatriba tra due notiscienziati dicenso che uno di loro aveva sbagliato perché non aveva calcolato le medie temporali.

13Si fissa un pempo T sufficientemente lungo. Fissato poi un dato iniziale x, e la corrispsondenteorbita, che denotiamo con Φt x, t ∈ R, per ogni regione V si introduce come misura µ(V ) di V lafrazione di tempo nel quale l’orbita si trova in V . Naturalmente, questa frazione di tempo (dettatempo di soggiorno) dipende dal punto iniziale x e dal tempo finale T . Ma ci si può attendereche la dipendenza dal tempo finale T genericamente scompaia. In molti casi scompare anche ladipendenza dal “dato iniziale” (è questo il cosiddetto “problema ergodico”).

14Annals of Mathematics, 1937.15Un caso é già stato messo in evidenza. Si tratta della collisione di una particella classica con

una barriiera di potenziale, in cui si incontra un analogo classico dell’effetto tunnel. Si veda illavoro Delzann, Carati, Galgani, Sassarini, il cui risultato é riassunto in un lavoro dedicato alproblema di Bell.

Fondamenti della meccanica quantistica: Poincaré 117

catore, diverso da quallo banale di Lebesgue, che possa eventualmente condurrealla statistica di Planck.

Il modello

Poincaré considera un sistema composto da due sottosistemi, uno costituito dap oscillatori tutti uguali, di bassa frequenza (o lungo periodo, come egli dice) ,e l’altro costituito da n oscillatori tutti uguali di grande frequenza (o di piccoloperiodo, o oscillatori hertziani, come egli anche li chiama). L’interazione tra idue sottosistemi avviene attraverso collisioni a due corpi tra componenti dei duesottosistemi. Gli oscillatori di bassa frequenza (sostanzialmente aventi frequenzanulla) possono pensarsi rappresentare un sistema di atomi puntiformi (perché l’e-nergia di un oscillatore armonico diventa quella di una particella libera sulla rettaquando si ponga nulla la frequenza dell’oscillatore), per i quali possiamo ammet-tere che valga il principio di equipartizione. I due sottosistemi verranno chiamatirispettivamente il sistema di atomi e il sistema di oscillatori (che Poincaré chiamaanche sistema dei risonatori, usando la classica terminologia di Planck).

Le quantità di interesse a fini di ottenere una termodinamica in termini mi-croscopici (ovvero formulare una termodinamica statistica) sono allora l’ener-gia media del sistema di atomi e quella del sistema di oscillatori che, seguendoPoincaré, denoteremo rspettivamente con pX e nY , mettendo in rilievo le cor-rispondenti energie specifiche X ed Y . Osserviamo che spesso quando si parladi quantità specifiche ci si riferisce ad una mole. Qui invece Poincaré si riferi-sce a quantità che potremmo chiamare (contrariamente alle convenzioni sin quiadottate per denotare le quantità specifiche) quantità specifiche per atomo, o peroscillatore, ovvero quantità relative ad un sistema (di atomi o di oscillatori), madivisa per il numero di costituenti del sistema (numero p di atomi o numero ndi oscillatori).

Nota: un possibile equivoco. Si potrebbe essere indotti a ritenere che Y definisca l’e-nergia media di un singolo oscillatore, mentre essa definisce l’energia totale (del sistemadi oscillatori), che per pura opportunità di notazione abbiamo diviso per il numero n dioscillatori. Essa coincide con l’energia media di un singolo oscillatore solo nel caso incui le energie dei singoli oscillatori siano variabili casuali indipendenti ed identicamentedistribuite (iid). Questo è un punto rilevante sul quale ritorneremo.16

Ora, ben naturalmente Poincaré ammette che il valor medio X dell’energiaspecifica per atomo sia proporzionale alla temperatura T ≡ X . Anzi, Poincarédefinisce la temperatura T in termini meccanici proprio mediante X ≡ T , ov-vero prendendo unità di misura in cui si ha kB = 1. Il problema che interessa èallora quale sia, come dice Poincaré, la partizione dell’energia, cioè quale sia, infunzione della temperatura (ovvero in funzione di X ) l’energia media specificaper oscillatore Y .

16Effetivamente, a pag 636 in basso. Poincaré stesso dice: “Nel caso che gli oscillatori siano unsistema isolato, l’energia media Y è l’energia di ogni singolo oscillatore".

118 Andrea Carati e Luigi Galgani

In conclusione, il problema è di determinare la funzione Y = Y (T ), ovvero,in termini meccanico–statistici, la funzione Y = Y (X ).

Un problema preliminare di tipo generale: necessità di considerare il casoasintotico di un grandissimo numero di costituenti

Tuttavia, prima di studiare il problema della partizione dell’energia, Poincaré de-dica una notevole parte del lavoro (le prime 15 pagine) a un problema prelminarepiù generale, che in effetti egli studia con tale intensità da dare l’impressione chequesto sia il vero problema che gli sta a cuore (come dice egli stesso; vedi sotto).Si tratta del problema di come sia possibile ottenere una descrizione statisticache sia in accordo con una situazione fisica di equilibrio termico, facendo uso dimisure invarianti diverse da quella di Lebesgue (ovvero usando densitá W 6= 1).Egli formalizza questa condizione richiedendo che la relazione tra le due ener-gie specifiche medie (per atomo e per risonatore) X ed Y sia indipendente dalrapporto n/p (infatti tale relazione dovrebbe dipendere solo dalla temperatura,oltre che dal parametro ν, che rappresenta la frequenza comune degli oscillatori).Anticipiamo qui la conclusione del suo lungo lavoro su questo problema, cheegli ottiene alla tredicesima pagina, dove sostanzialmente conclude che l’equili-brio termico può aversi solo nella situazione limite in cui i numeri n e p deicostituenti dei due sistemi siano molto grandi.

Infatti, dopo avere esaminato diversi casi particolari, egli così si esprime: “Èdunque in casi molto eccezionali che la legge di partizione dell’energia risulta indi-pendente dagli interi n, p . Sembra allora seguirne che non sia possibile alcun equili-brio termico, in contrasto con il secondo principio della termodinamica. Ma bisognaricordarsi che i numeri n, p sono sempre molto grandi.

Conviene dunque porre il problema in modo diverso: è la legge di partizionedell’energia indipendente dal rapporto n/p , quando gli interi sono molto grandi?Se questa indipendenza non avesse luogo, l’equilibrio termico sarebbe impossibile.. . . Finché non venga stabilita tale indipendenza, possono restare dei dubbi sui ra-gionamenti di Planck, che si basano sull’esistenza dell’equilibrio e sul teorema diBoltzmann.”

E conclude con la frase il cui senso avevamo anticipato sopra: “Questo sarebbesufficiente per giustificare il presente lavoro.”

Formalizzazione del problema

Seguendo Poincaré, denotiamo con η1, . . .ηn le energie degli oscillatori e conξ1, . . . ξp le energie degli atomi. Ricerchiamo che forma deve avere la misura in-variante nello spazio delle fasi totale. Assumiamo anche, con Poincaré, che lamisura ammetta densità W (un ultimo moltiplicatore), e allora il problema saràdi stabilire se questa funzione è continua o “fatta a salti” 17. Come coordinate nel-lo spazio delle fasi si possono prendere le energie e le fasi di ogni atomo (pensato

17Poincaré parla, nell’ultima pagina del suo lavoro, di “équations a auts brusques”.

Fondamenti della meccanica quantistica: Poincaré 119

come un oscillatore di bassa frequenza), e quelle di ogni oscillatore (di grande fre-quenza). A questo punto Poincaré, occupandosi di misure di equilibrio (ovveroinvarianti), ritiene ovvio anzitutto che la densità W non dipenda dalle fasi (chesono le variabili “veloci” del sistema), e anzi neppure dalle energie degli atomi(come si assume solitamente quando si discute il sistema dei soli atomi, e si sce-glie la misura di Lebesgue, ovvero si prende W = 1 come ultimo moltiplicatore).Ammettiamo dunque che si abbia punt

W =W (η1, . . .ηn) .

Poi Poincaré compie un altro passo, che svolgerà un ruolo cruciale nella dedu-zione della necessità della quantizzazione. Egli infatti ammette che le energie ηidei singoli oscillatori siano variabili casuali (random variables) di tipo iid, ovveroindipendenti ed identicamente distribuite. Dunque ammette che la funzione Wabbia la forma

W (η1, . . .ηn) = w(η1) . . . w(ηn) , (5.3.1)

cioè una forma fattorizzata (energie indipendenti), e con fattori definiti da fun-zioni (di una sola variabile) tutte uguali (energie identicamente distribuite).

A dire il vero, Poincaré non dice esplicitamente che sta introducendo una ipotesi, e dàinvece una argomentazione che tiene quasi una intera pagina (pag. 633), e che noi nonriusciamo a seguire completamente. Provvisoriamente diciamo che egli introduce questaulteriore proprietà come una ipotesi, e su questo punto ritorneremo più avanti.

Le quantità che interessano sono dunque i valori medi X , Y , rispettivamentedella energia specifica per atomo, e dell’energia specifica per oscillatore. Più pre-cisamente Poincaré vuole calcolare tali valori medi in un insieme di tipo microca-nonico, come diremmo oggi, o più precisamente quando si sappia che il sistematotale ha una energia compresa nello “strato” Et ot , Et ot +δEt ot , che denoteremocon ∆E t ot .

I valori medi di interesse X , Y sono dunque definiti dalle formule

M ·X = 1p

∆E t ot

ξi W dpξ dnη

M ·Y = 1n

∆E t ot

η j W dpξ dnη

dove

M =∫

∆E t ot

W dpξ dnη

e si è denotato

dnη= dη1 . . . dηn , dpξ = dξ1 . . . dξp .

120 Andrea Carati e Luigi Galgani

Osservando che∫

ξi=xdξ1 . . . dξp =

x p−1

(p − 1)!,

è facile vedere che questi tre integrali possono essere espressi in termini dellafunzione

fW (E) =∫

η j<EW (η1, . . .ηn)d

nη . (5.3.2)

Evidentemente, per E fissato questa definisce la probabilità che l’energia tota-le∑

j η j degli oscillatori sia minore di E . Dunque, come funzione di E essarappresenta, nel senso consueto della teoria delle probabilità, la distribuzione diprobabilità della somma delle energie degli oscillatori, la quale può assumere tuttii valori nell’intervallo (0, Et ot ). Ovviamente, per ogni data energia E del sistemadegli oscillatori, la parte restante Et ot − E è l’energia degli atomi.

Si verifica facilmente che, in termini della fW (E), gli integrali assumono laforma

M =1

(p − 1)!

∫ Et ot

0(Et ot − E)p−1

fW (E) dE

M ·X = 1p!

∫ Et ot

0(Et ot − E)p fW (E)dE

M ·Y = 1n(p − 1)!

∫ Et ot

0E(Et ot − E)p−1

fW (E) dE .

Applicazione dei metodi delle grandi deviazioni, e il primo metodo di Poin-caré

Dobbiamo dunque valutare gli integrali scritti sopra, nel limite di grande n (nu-mero di oscillatori) per un fissato valore del rapporto p/n (che Poincaré denotacon k ). A tal fine, Poincaré vuole applicare il classico metodo asintotico di La-place, il quale richiede un opportuno comportamento asintotico (rispetto ad n )della funzione fW (E), la distribuzione

η j , somma delle energie degli n oscil-latori. È questo il problema studiato nella teoria delle grandi deviazioni, i cuirisultati furono stabiliti18 da Cramér nel 1938 nel caso iid, e poi nella sua formagenerale da Gartner nel 1977.

Questo problema viene affrontato da Poincaré con quelli che egli chiamoprimo e secondo metodo. Nel secondo, come vedremo, egli anticipa il risultato diCramér. Il primo metodo, invece, consiste semplicemente nel proporre in formadi Ansatz, sulla base dello studio di alcuni casi particolari, una forma asintoticaanaloga a quella che sará in seguito dimostrata da Gartner.

18H. Cramér, Colloque Consacré à la thèorie des probabilités, 3, 2 (1938), J. Gärtner, Th. Prob.Appl. 22, 24 (1977). Si veda anche Ellis, libro.

Fondamenti della meccanica quantistica: Poincaré 121

Ricordiamo che Gartner sostanzialmente richiede soltanto che esista la tra-sformata di Laplace di fW (E) e che il suo logaritmo cresca linearmente con n,cioè si abbia

log∫ ∞

0e−βE

fW (E) dE ' n ,

condizione ovviamente soddisfatta nel caso particolare iid, che è quello che fuconsiderato da Cramér, e in effetti anche da Poincaré.

In queste ipotesi si dimostra che esiste una funzione s = s(E/n), concava,tale che si abbia

fW (E)' exp�

ns(E/n)+O(p

n)�

, n� 1 . (5.3.3)

Questa formula, a meno del termine di errore O(p

n), è quella che viene propostada Poincaré, con diverse notazioni, nel paragrafo 5 del lavoro.

Nel paragrafo 6 egli calcola anche la forma che prende la funzione fW (E) se vale l’ipotesidi quantizzazione di Planck, mostrando in particolare che allora vale la relazione (5.3.3).Tra l’altro, nel compiere questo calcolo, egli in particolare riottiene la formula combi-natoria che Planck aveva utilizzato nel suo lavoro del 14 dicembre 1900. Inoltre, eglimanipola la “funzione” delta esattamente con il procedimento e anche le parole che ver-ranno usati in seguito da Dirac (come sostanzialmente aveva già fatto Einstein all’iniziodel suo lavoro del 1907 sui calori specifici).

Utilizzando la formula di Gartner (5.3.3), gli integrali prendono una formatipica che, ad esempio, nel caso di M è data da

M = e p−1∫ Et ot

0dE exp

n�

s(En)+

p − 1n

logE − Et ot

p − 1+O(1/

pn)��

(5.3.4)

Quindi, come si vede, nell’argomento dell’esponenziale si ha una funzione chedipende dalle quantità specifiche E/n, p/n, moltiplicata per il fattore n, chesi deve pensare molto grande. Pertanto è chiaro che il valore dell’integrale èdeterminato dal valore di E (che denoteremo con U ) in cui questa funzioneassume valore massimo, in cui quindi la derivata si annulla. È questa l’idea basedel metodo di Laplace per la stima asintotica degli integrali. Situazioni analoghesi presentano nei due integrali che definiscono M X ed M Y , con la sola differenzache vi compaiono due ulteriori fattori. In tal modo, mettendo in rilievo talifattori, è evidente che possiamo scrivere, seguendo Poincaré,

M ·X =�

Et ot −Up

+O(1/p

n)�

1(p − 1)!

∫ Et ot

0(Et ot − E)p−1

fW (E)dE

M ·Y =�U

n+O(1/

pn)�

1(p − 1)!

∫ Et ot

0(Et ot − E)p−1

fW (E)dE .

122 Andrea Carati e Luigi Galgani

Pertanto, trascurando l’errore (piccolissimo nel limite di n molto grande) e sem-plificando per M in entrambi i membri, si ottiene

X =Et ot −U

pY =

Un

.

D’altra parte, come abbiamo detto, il valore di U è quello per cui la deriva-ta dell’argomento dell’esponenziale che compare nell’integrale (5.3.4) per M siannulla, cioè il valore per cui si ha

s ′(Un) =

pEt ot −U

(dove l’apice denota derivazione rispetto all’argomento e abbiamo sostituito p−1con p ), ovvero

s ′(Y ) =1X

.

Questo risolve il problema di Poincaré in quanto mostra che il rapporto Y /Xnon dipende da p e da n (e quindi non dipende da k ≡ p/n ), nel limite in cuivalga la stima, in cui cioè si possano trascurare gli errori, che per le quantitàspecifiche sono di ordine 1/

pn. Abbiamo quindi ottenuto che è possibile avere

una termodinamica statistica anche nel caso in cui la misura di partenza non siaquella di Lebesgue.

Da queste formule si ottiene anche immediatamente la formula per l’entro-pia del sistema di oscillatori, poiché risulta subito che la funzione di grande de-viazione s(u) (dove u = U/n ≡ Y ) è l’entropia specifica di tale sistema. Infatti,avendo identificato il valor medio X dell’energia specifica del gas di atomi con latemperatura termodinamica assoluta T , e denotando S = ns , si ottiene

1T≡ 1

X=

dsdu=

dSdU

,

cioè che a volume costante vale dU = T dS, e questo identifica S = ns comel’entropia termodinamica del sistema di oscillatori.

D’altra parte, nel teorema di grande deviazione di Gartner si ha anche unulteriore risultato, ovvero che la funzione di grande deviazione s(u) è legata allafW (E) dalla relazione seguente: se f (β) è l’energia libera specifica legata alla s(u)dalla consueta relazione termodinamica

β f (β) = infu>0(βu − s(u)) ,

allora si ha

β f (β) =1n

log∫ ∞

0e−βE

fW (E)dE . (5.3.5)

Fondamenti della meccanica quantistica: Poincaré 123

ovvero, in termini dell’energia libera F = n f , si ha

βF (β) = log∫ ∞

0e−βE

fW (E)dE . (5.3.6)

Equivalentemente, ricordando la relazione termodinamica F =U −T S tra ener-gia interna U ed energia libera F , si ha per l’energia media U del sistema dioscillatori l’espressione meccanico–statistica

U (β) =−∂β log∫ ∞

0e−βE

fW (E)dE , (5.3.7)

Si è ottenuta dunque la meccanica statistica del sistema degli oscillatori in inte-razione con un gas di atomi, definita mediante formule che generalizzano quellafamiliare del formalismo canonico, a cui essa si riduce nel caso particolare W = 1.

Ma il punto rilevante ai fini del problema della quantizzazione è che la formu-la (5.3.7) rende possibile risalire dai dati sperimentali alla distribuzione di energiafW (E). Infatti i dati sperimentali forniscono l’energia interna U del sistema dioscillatori, o equivalentemente la loro energia libera F , in funzione di β. Al-lora la (5.3.6) fornisce la trasformata di Laplace di fW (E), e infine, per l’unicitàdell’antitrasfrormata, anche la fW (E) stessa. Questa è proprio la situazione cheavevamo considerato all’inizio del capitolo, con la sola rilevante differenza qui cisi riferisce al sistema totale degli oscillatori, e non ad un singolo oscillatore.

Ora, il procedimento per la determinazione di S(U ) a partire da fW (E), nonera disponibile a Poincaré, perché sarà scoperto da Cramer (almeno nel caso iid)solamente nel 1938, e dunque egli non era in grado di provare la relazione (5.3.7)in tutta generalità. Quindi, mentra era in grado di mostrare che è possibile unatermodinamica, non era ancora in grado di discutere la necessità della quantiz-zazione. A questo scopo egli introdusse il suo secondo metodo (paragrafo 7 eseguenti).

Il secondo metodo di Poincaré: necessità della quantizzazione

Nel secondo metodo, Poincaré, invece di cercare di dare direttamente un’espres-sione generale per fW (E), cerca di riscrivere gli integrali che definiscono M , M X eM Y , in una forma che gli permetta comunque di applicare il metodo di Laplace,ovvero in una forma in cui compaia l’esponenziale di una funzione moltiplica-ta per n. Egli comincia notando che precisamente una forma di tale tipo vieneassunta dalla trasformata di Laplace di fW (E), se si fa uso dell’ipotesi iid per leenergie degli oscillatori. Infatti, indicando con Z(β) la trasformata di Laplace difW (E), si ha

Z(β) =∫

e−βEfW (E)dE =

e−β∑

ηi w(η1) . . . w(ηn)dnη ,

124 Andrea Carati e Luigi Galgani

ovveroZ(β) =Z n(β) = exp(nχ (β))

dove, come nel secondo paragrafo, con Z (β) abbiamo indicato la trasformata diLaplace della distribuzione di probabilità w(η) del singolo oscillatore, e abbiamointrodotto la notazione

χ = logZ ovvero Z = eχ .

È questo il punto dove tecnicamente entra in modo fondamentale l’ipotesi iid,per cui tutti i risultati dei calcoli vengono espressi in termini della funzione Z ,cioè in termini della funzione di partizione del singolo oscillatore. Questo non èpossibile nei casi non iid, in cui le quantità relative ai singoli oscillatori non sonoaccessibili macroscopicamente.

Usando il teorema di inversione della trasformata di Laplace, la funzionefW (E) si esprime dunque come integrale al modo sequente

fW (E) =∫

γdβ′ exp(β′E + nχ (β′)) ,

dove γ è un opportuno cammino nel piano β′ complesso (in genere si prendeuna retta parallela all’asse immaginario con parte reale sufficientemente grande).Si ottiene allora il risultato cercato perché, ad esempio ancora per M , si troval’espressione

M = e p−1∫ Et ot

0dE

dβ′ exp�

n�

β′En+χ (β′)+

p − 1n

logE − Et ot

p − 1)��

,

dove la costante e p−1 si ottiene introducendo l’espressione di Stirling per il fatto-riale (p − 1)! nell’integrale definente M .

A questo punto, come nel caso del primo metodo, abbiamo di nuovo chenell’argomento dell’esponenziale si ha una funzione che dipende dalle quantitáspecifiche E/n, p/n, β, moltiplicata per il fattore n, che si deve pensare moltogrande. Pertanto possiamo ancora applicare il metodo asintotico di Laplace, edil valore dell’integrale è determimato dai valori di E e di β′ (che denoteremocon U e con β) in cui questa funzione assume valore massimo. Una piccolaprecisazione matematica: possiamo sempre deformare il cammino γ , senza checambi l’integrale che definisce l’antitrasformata, in modo tale che il punto dimassimo (U ,β) appartenga al cammino di integrazione. Allora, a meno di erroridi ordine O(1/

pn), come nel caso del primo metodo si otterrà

X =Et ot −U

pY =

Un

.

Notiamo ora che, a differenza del caso precedente, la funzione che comparesotto il segno di integrale dipende da due variabili, per cui il punto di massimo

Fondamenti della meccanica quantistica: Poincaré 125

sarà determinato imponendo che si annulli il gradiente della funzione, cioè chesiano verificate le due relazioni

χ ′(β)+Un= 0 , β−

p − 1Et ot −U

= 0 ,

dove abbiamo indicato con χ ′ la derivata di χ rispetto al suo argomento. Intermini di X e di Y troviamo allora le relazioni seguenti

X =1β

, Y =−χ ′(β) .

Ricordando la definizione di χ , la seconda può essere messa nella forma

Y =− ∂∂ β

logZ ,

che dimostra appunto la validita della formula (5.2.2) che avevamo ammesso alparagrafo 5.2. Si può dunque ripetere il ragionamento là esposto: i dati speri-mentali definiscono univocamente Y (β), e quindi univocamente Z . Ma poi,per l’unicità dell’antitrasformata di Laplace, resta definita univocamente anchela distribuzione di probabilitá ew(η). Dunque, resta dimostrato che l’unico mo-do per riprodurre la legge empirica di Planck, è mediante l’introduzione di unadistribuzione ew(η)) concentrata sui livelli discreti. In realtà Poincaré fa di più:sfruttando le proprietà della trasformata di Fourier, egli riesce a mostrare che lafunzione ew(η) non può essere continua, ma deve presentare delle discontinuitàcorrispondenti a dei livelli, nella sola ipotesi che la densità di energia del corponero (integrata su tutte le frequenze) risulti finita, senza bisogno di richiedereche sia strettamente quella di Planck.19

In conclusione, rimane provato che si ha una termodinamica statistica, sottoipotesi generalissime per la funzione w(η). Queste termodinamiche statistichegeneralizzano quella consueta, che potremmo chiamare gibbsiana, che viene riot-tenuta nel caso particolare w(η) = 1. 20 Infine, essendosi ridotto al caso in un sin-golo oscillatore (qui discusso nella prima sezione), ne conclude che, nell’ipotesiiid, la legge di Planck comporta la necessitá della quantizzazione.

5.4 Osservazioni sulla necessità della quantizzazione

Mostriamo ora come possano ritenersi fondati i dubbi che Poincaré stesso avevaespresso sulla necessità della quantizzazione. Il punto è che tale necessità è statadimostrata da Poincaré nell’ipotesi che le energie dei singoli oscillatori siano va-riabili casuali indipendenti ed identicamente distribuite (iid). Della plausibilitàdi tale ipotesi discuteremo più sotto.

19Come fu fatto osservare da Lorentz, quest’ultima osservazione (relativa però al caso di unsingolo oscillatore) era stata anticipata da Ehrenfest in un suo lavoro del 1911.

20Prima aveva detto non sappiamo ancora se la legge di ripartizione dell’energia sia indipendenedal rapporto k = p/n comunque si prenda la funzione w . (la densità di probabilità della singolaenergia).

126 Andrea Carati e Luigi Galgani

Energia totale vs energia del singolo oscillatore

Ora vogliamo invece discutere che cosa possiamo dire a proposito di tale necessitànel caso generale, in cui si lasci cadere l’ipotesi iid, e si assuma invece che valgail principio di grandi deviazioni al modo di Gartner, il quale assicura comunque,come abbiamo visto, l’esistenza di una termodinamica statistica (indipendenzadal rapporto p/n ).

Assumiamo dunque che l’energia media U del sistema di n oscillatori in in-terazione con un gas di atomi segua la legge di Planck. Dal teorema di grandideviazioni nella forma generale (5.3.3) di Gartner si dedurrebbe ancora la quan-tizzazione del sistema totale se non esistesse il termine di correzione dell’ordinep

n. Ma nel teorema quel termine di correzione esiste, e poiché la quantizza-zione coinvolge una quantità finita (l’azione h di Planck, indipendente da n ),tale quantizzazione non risulta efficace nel caso macroscopico di n dell’ordinedel numero di Avogadro. Infatti la discretizzazione riguarda “salti” minuscolirispetto all’incertezza entro cui è garantito il risultato. Dunque nel caso generalenon sembra si deduca che la distribuzione di energia del sistema di oscillatori siaquantizzata. Si potrebbe soltanto concludere che è quantizzata la distribuzionedi energia di un oscillatore che potremmo chiamare virtuale, di cui nessuno im-maginerebbe di parlare come se fosse qualcosa di reale. Un oscillatore virtualela cui energia ad ogni istante sia definita come l’energia specifica per oscillatoreU/n, ovvero come l’energia totale del sistema macroscopico di oscillatori, divisaper il numero n di oscillatori.

Potrebbe tuttavia darsi che per qualche motivo ci trovassimo in un caso ec-cezionale in cui sia nulla l’incertezza prevista in generale dal teorema di grandideviazioni, e che in tal caso si possa dedurre la necessità per il singolo oscillatore.Ad esempio, è noto che la somma di n variabili iid è gaussiana, asintoticamen-te per grandi n. Ora, questo evidentemente non implica che siano distribuitegaussianamente le singole variabili casuali. Tuttavia, esiste un profondo teoremain virtù del quale si può concludere che le singole variabili sono gaussianamentedistribuite se si ammette che la loro somma sia esattamente distribuita in manie-ra gaussiana per ogni n. Perché queste considerazioni siano significative per ilnostro caso occorrerebbe dunque che il teorema di grandi deviazioni potesse di-mostrarsi senza il termine di incertezza, e inoltre che valesse un teorema del tipodi quello appena citato.

L’esempio di Einstein. A proposito del passaggio dall’energia totale U del sistema dioscillatori all’energia u di un singolo oscillatore, è significativo l’esempio che Einsteinriporta almeno due volte nei suoi lavori.21 Consideriamo il diamante a 73 K, ponendocon Nernst la frequenzaν di oscillazione degli atomi di carbonio pari a 27.3 · 1012 Hz.Allora, se valutiamo l’energia media u di un singolo oscillatore secondo la formula di

21Si veda la relazione alla conferenza Solvay 1911, lavoro 10, pag. 246 dell’edizione italiana delleopere, e anche il lavoro 6 (1906), pag. 185.

Fondamenti della meccanica quantistica: Poincaré 127

Planck (praticamente coincidente con quella di Wien per quei valori di ν e T ) si ha

uhν= e−hν/kB T ' e−18.6 ' 10−8 .

A questo proposito Einstein commenta: “L’energia media dell’oscillatore diventa così unafrazione piccolissima, circa 10−8, del quanto di energia hν . A ogni istante deve dunqueoscillare un solo atomo su 108, mentre gli altri sono in quiete assoluta. Pur convinti dell’ina-deguatezza della nostra meccanica per fenomeni siffatti, un risultato di questo genere appareestremamente singolare.” Da qualche altra parte lo definisce invece “sconcertante”.

Veniamo ora alle incertezze, ovvero alle deviazioni standard (stimate con le formuledi Einstein per le fluttuazioni di energia, illustrate nel capitolo a lui dedicato). Se con-sideriamo una mole di oscillatori, si avrà una energia totale E con valor medio U datoda

U ' 1015hν ,

mentre l’incertezza (standard deviation) σE sarà data da

σE 'p

hνU ' 107hν� hν ,

cioè l’incertezza è enormemente più grande del salto quantico. È proprio questa lasituazione che avevamo incontrato sopra, in relazione all’errore previsto nel teorema digrandi deviazioni.

Invece, se si considera l’oscillatore singolo (virtuale), si avrà una incertezzap

hνu ' 10−4hν ,

molto più piccola del salto quantico.

Sulla plausibilità dell’ipotesi iid per le energie dei singoli oscillatori

Abbiamo visto come l’ipotesi iid svolga una ruolo centrale per dedurre la neces-sitá della quantizzazione, e abbiamo ricordato come Poincaré la discute lungouna intera pagina del suo lavoro, e come anche Lorentz avesse interpretato talediscussione come una dimostrazione della proprietà iid. In effetti l’argomenta-zione di Poincaré non risulta del tutto chiara (almeno a noi) e, anche se conestrema titubanza, ci permettiamo di proporre che tale argomentazione non siauna dimostrazione.

In effetti, sembra che l’unica proprietà degli oscillatori invocata da Poincarénella sua argomentazione sia il fatto che essi sono supposti essere identici. Lasituazione sarebbe dunque simile a quella che si ha nel caso di n monete; se essesono state prodotte tutte con lo stesso materiale e in maniera uniforme, sembre-rebbe che si dovesse attribuire a ciascuna di esse la medesima probabilitá a prioridi condurre, in un lancio, al risultato testa oppure croce. Qui tuttavia le cosesono diverse, a motivo del ruolo della dinamica. Si ricordi che Poincaré avevaconvenuto, con Einstein e seguendo Boltzmann, che la probabilità di trovarsi inun insieme dello spazio delle fasi debba essere definita come frazione del tempodi soggiorno, per tempi sufficientemente lunghi. Ora, i risultati della dinamica

128 Andrea Carati e Luigi Galgani

mostrano che, anche nel caso di oscillatori identici, se la frequenza degli oscilla-tori è abbastanza grande, allora la densità w(η) dell’energia di ogni oscillatore sistabilizza presto su una funzione che dipende fortissimamente dal valore inizia-le dell’energia dell’oscillatore considerato, essendo concentrata attorno al valoreiniziale. Solo nel caso di frequenze basse quelle funzioni sono tutte uguali, e inaccordo con la legge di Maxwell–Boltzmann.

Questo punto, in effetti, era proprio il cavallo di battaglia di Jeans, che loaveva ampiamente uillustrato alla conferenza Solvay, cui aveva partecipato suindicazione di Rayleigh.22 Tuttavia, dopo la pubblicazione dell’articolo di Poin-caré, probabilmente a causa della sua autorità, egli abbandonò completamente lasua tesi, giungendo fino al punto, come abbiamo ricordato piú sopra, di fare unavera e propria ritrattazione pubblica.

La proprietà sopra citata della distribuzione di probabilità dell’energia di un oscillatoredi alta frequenza, ovvero che essa ha una forma strettamentre dipendente dall’energiainiziale, è stata messa in luce in diversi lavori, ad esempio in un lavoro del 2003.23 Pro-prio come nel caso di Poincaré, si considerano degli oscillatori di fissata frequenza checollidono singolarmente con atomi (punti materiali), i cui dati iniziali vengono estrattida un campione a una certa temperatura T . Le collisioni si producono attraverso unfissato potenziale. Nella figura 1 del lavoro citato sono riportate le curve che danno infunzione del tempo i valori assunti da un oscillatore: a sinistra un oscillatore di alta fre-quenza (ω = 15, nelle unità scelte) e a destra uno di bassa frequenza (ω = 3). In effetti,la figura di sinistra è in qualche modo fuorviante, perché la scala delle ordinate è moltoamplificata (di un fattore mille) rispetto a quella della figura di destra. Sulla stessa scaladi quella di destra, l’energia dell’oscillatore di alta frequenza apparirebbe essere costante,indipendente dal tempo. Con l’ingrandimento usato nella figura, si vede che essa in ef-fetti cambia, ma seguendo un moto a salti, della forma che è caratteristica dei cosiddettivoli di Lévy. Nella figura successiva viene poi mostrato che le proprietà statistiche sonocompletamente diverse nei due casi (“code lunghe nel caso delle alte frequenze”).

In conclusione, noi diremmo che le energie degli oscillatori di alta frequenza,a differenza di quelle degli oscillatori di bassa frequenza, anche se possono es-sere considerate variabili casuali indipendenti, tuttavia non sono identicamentedistribuite. Questo fatto potrebbe invalidare la conclusione tratta da Poincarésulla necessità della quantizzazione. Tale necessità è infatti dimostrata solo perun oscillatore virtuale la cui energia sia definita come l’energia totale del sistemadi oscillatori divisa per il numero n di oscillatori. Parafrasando quello che Ein-stein disse nel suo contributo alla conferenza Solvay del 1911 e continuò a ripeterelungo tutta la sua vita, potremmo dire che se, per semplicità di descrizione, trat-tiamo tutti gli oscillatori come se fossero iid, allora “tutto va come se” l’energiadegli oscillatori fosse quantizzata.24

22Si veda la sua lettera riportata all’inizio degli atti della conferenza.23A. Carati, L. Galgani, B. Pozzi, Phys. Rev. Lett. 90, 010601 (2003).24Una vecchia citazione del periodo attorno a quello della prima conferenza Solvay (dove si ha

una analoga ben nota citazione) si trova anche nel celebre articolo del 1909 Lo stato attuale dellateoria della radiazione, lavoro 9 dell’edizione italiana, pag. 214, dove dice che “le variazioni spaziali

Fondamenti della meccanica quantistica: Poincaré 129

Da ultimo, facciamo presente come il problema della necessità della quan-tizzazione prenderebbe un aspetto del tutto nuovo se si considerassero modelliche includono gli effetti del campo elettromagnetico, come discuteremo nella se-conda parte di queste note. In tal caso si dovrebbe tenere conto della forza direazione di radiazione, che comporta effetti qualitativamente nuovi. In partico-lare potrebbero presentarsi fenomeni del tipo di quelli che si incontrano nel casodello strano attrattore di Lorenz, scoperto nel 1963, in cui si ha a che fare con unamisura invariante non assolutamente continua rispetto alla misura di Lebesgue.

5.5 Energia di punto zero e moti ordinati vs quantizza-zione: Planck 1911, Einstein–Stern 1913, Nernst 1916

Planck 1911: la seconda “teoria” e l’energia di punto zero

Il primo tentativo di eliminare la quantizzazione o meglio, di sostituirla con l’e-sistenza di un fenomeno qualitativo in qualche modo equivalente, fu compiutoda Planck nel 1911, con quella che è comunemente nota come la sua seconda teo-ria. Per qualche ragione che non ci ha rivelato, egli fu indotto a descrivere ilprocesso di interazione fra un risonatore e il campo e.m. nel modo seguente. Unrisonatore, partendo da una condizione iniziale di energia nulla, a causa dell’in-terazione con il campo assorbe energia con un processo continuo. Quando poil’energia assorbita è giunta al valore hν il processo diventa dinamicamente cosìcomplesso (caotico o complicato, diremmo oggi25) che una descrizione puramen-te deterministica diventa praticamente impossibile e si richiede una trattazionestatistica. Allora egli ammette che, giunto all’energia hν, il risonatore abbia unacerta probabilità di ripiombare immediatamente allo stato di energia nulla, e laprobabilità complementare di continuare ad assorbire energia con continuità. Sel’oscillatore continua ad assorbire, il processo probabilistico si ripete quando es-so ha assorbito energia totale 2hν e così via. Sulla base di tali considerazioni eglidefinisce un processo stocastico, e la probabilità di salto viene fissata in modotale che l’energia media dell’oscillatore sia proprio quella di Planck.

Questa concezione viene poi rielaborata nella seconda edizione del Wärme-strahlung del 1912, da cui è tratta l’unica traduzione inglese esistente. I livellidell’oscillatore risultano avere i valori

En = nhν +12

hν , n = 0,1,2, . . . (5.5.1)

che saranno poi ritrovati da Heisenberg nel 1925 e da Schrödinger nel 1926.Dunque segue che l’energia media specifica u ha l’espressione

u =hν

eβhν − 1+

12

hν . (5.5.2)

della radiazione e della pressione di radiazione avvengono come se la radiazione consistesse di quanti. . . ”.

25Stiamo citando a mente le parole dell’articolo di Planck.

130 Andrea Carati e Luigi Galgani

Il termine hν/2, che è il solo che resta allo zero assuluto, viene detto energia dipunto zero, ( in inglese, zero–point energy) perché Nullspunkt è il termine tedescoper la temperatura dello zero assoluto.

Nella seconda edizione del Wärmestrahlung, a pag 142 della traduzione ingle-se, Planck commenta: “That the oscillators are said to perform vibrations even atthe temperature zero, the mean energy of which is so large as hν/2 and hence maybecome quite large for rapid vibrations, may at first appear strange. It seems to me,however, that certain facts point to the existence, inside the atoms, of vibrations in-dependent of the temperature, and supplied with appreciable energy ...” Un effettoattribuito in qualche modo all’energia di punto zero è quello detto di Debye–Waller: da misure di dispersione da raggi Röntgen, sembra potersi dedurre chegli atomi o molecole o ioni costituenti un cristallo abbiano una certa velocitànon nulla anche allo zero assoluto.

Può sembrare strano attribuire significato ad un valore defnito di e energia, quando si sache l’energia potenziale è definita a meno di ua arbitraria costante additiva. Dal punto divista della teoria quantistica la cosa si risolve nel modo seguente. Sappiamo che l’energiadi punto zero deve essere identificata con l’energia del livello fondamentale (ground state)E0. Ma questo stato ha distribuzioni di probabilità della posizione e del momento chesono sparpagliate, e danno allora all’energia un contributo che è quello che si avrebbeclassicamente se l’oscillatore si trovasse ad una energia hν/2 sopra il minimo dell’energiapotenziale.

Ai fini di quanto segue, ribadiamo l’idea centrale introdotta da Planck, ov-vero che in corrispondenza dell’energia di punto zero si incontrano situazionidi moto complicato, diciamo di moto caotico, come in presenza di una energiadi soglia: moti ordinati sotto soglia, disordinati sopra soglia. Questa idea verràinfatti ripresa nel 1916 da Nernst (a parte la scelta di porre la soglia all’energia hνinvece che ad hν/2).

Einstein e Hopf, 1911; Einstein e Stern, 1913

Il lavoro di Einstein e Hopf del 1911 è concettualmente molto interessante, mafino ad oggi nessuno è stato in grado di elaborarlo in modo da farlo diventare unavera teoria. Forse gli autori che modernamente vi sono andati vicino sono quelliche si riconoscono nella cosiddetta elettrodinamica stocastica di Boyer. L’ideacentrale di Einstein e Hopf è di studiare il moto di un sistema di molecole biato-miche (sostanzialmente, ciascuna molecola può essere pensata come costituita daun baricentro e da una molla lineare) che interagiscono mutuamente sia per col-lisioni, sia con forze di dipolo elettrico mediate dal campo elettromagnetico. Gliautori impongono che si abbia una situazione di equilibrio statistico. Ammet-tendo che l’energia cinetica media dei baricentri sia identificabile come di con-sueto con la temperatura, essi vogliono studiare che cosa impone la condizione diequilibrio, sulla energia media U delle molle. Quest’ultima energia risulta deter-minata da una equazione differenziale ordinaria del primo ordine nella variabilex = hν/kB T . Naturalmente, per risolvere l’equazione occorre assegnare un dato

Fondamenti della meccanica quantistica: Poincaré 131

iniziale o al contorno, ed essi impongono quello che sembrerebbe spontaneo,ovvero

U (T )→ 0 per T → 0 .

In tal modo ottengono il risultato di equipartizione, energia U =N kB T .Ma dopo la pubblicazione della seconda teoria di Planck, Einstein e Stern

hannno una ispirazione. Risolvere la medesima equazione con la condizione alcontorno

U (T )→ N2

hν per T → 0 .

Con un calcolo immediato ottengono allora che l’energia media specifica è datadalla formula di Planck, con energia di punto zero hν/2, ovvero la formula (5.5.2)di Planck.

Nernst, 1906. Il terzo principio della termodinamica, e l’energia di puntozero come energia ordinata

Nernst formulò il terzo principio, nel 1906, in una maniera completamente feno-menologica e termodinamica, in una maniera che è risultata, almeno ai presentiautori, non semplice da comprendersi. Certamente in una maniera qualitativa-mente ben diversa da quella riportata in una parte preponderante dei manuali,in cui la formulazione viene data in termini di meccanica statistica anziché inmaniera fenomenologica. Per i nostri scopi, la f0rmulazione fenomenologica èrilevante, perché mette in luce il carattere ordinato dei moti in prossimità dellozero assoluto.

Anzitutto bisogna avere chiaro che, a differenza della energia interna U , l’e-nergia libera F risulta essere quella parte di energia interna che è atta a compierelavoro macroscopico. Per questo in tedesco essa viene denotata con la lettere A(Arbeit significa lavoro) e non con la lettera F . Anzi, Nernst formula il secondoprincipio in analogia con il primo. Come il primo principio dice che esiste lafunzione di stato energia interna U (al cui incremento contribuiscono sia il lavo-ro sia il calore), così il secondo dice che esiste una funzione di stato F ≡A, dettaenergia libera, che rappresenta la massima quantità di lavoro che il sistema puòfornire in un processo isotermo.

Egli aveva osservato, dai grafici delle quantità U ed F in funzioni di T (os-servate in processi coinvolgenti delle pile), che tali due energie diventano ugualial di sotto di una temperatura caratteristica T c (detta da lui ‘‘temperatura di dege-nerazione” ). Egli allora formulò il terzo principio asserendo che tale fenomenoè universale, valendo per ogni sistema, al disotto di una corrispondente tempera-tura di degenerazione. Dunque. al di sotto della temperatura di degenerazionetutta l’energia interna è disponibile per compiere lavoro macroscopico, e quindiha carattere “ordinato”: l’energia interna ha carattere ordinato allo zero asso-luto, e addirittuta a tutte le temperature sotto la temperatura di degenerazione(dell’ordine di 300 K per le pile). In termini forse più familiari a molti lettori,questo corrisponde al fatto che l’energia libera è caratterizzata dalla proprietà

132 Andrea Carati e Luigi Galgani

F = U − T S, per cui sotto la temperatura di degenerazione, essendo F = U siha S = 0. L’unico punto che potrebbe non essere evidente a un lettore, è cheNernst non parla mai della energia, o energia libera o entropia possedute da unsistema, ma delle corrispondenti quantitá ∆U , ∆F o ∆S relative ad una certatrasformazione, ad esempio una reazione chimica.

In conclusione, l’aspetto dinamico caratterizzante i moti allo zero assoluto(o meglio, sotto la temperatura di degenerazione) è il loro carattere di moti pre-valentemente (o completamente. per T → 0) ordinati. Si noti bene che fino anon molto tempo fa gran parte della comunità scientifica riteneva, come puropregiudizio di cui sarebbe interessante studiare l’origine, che nei sistemi classicicostituiti da un numero macroscopico di costituenti sarebbero sempre dominan-ti, a tutte le temperature, i moti caotici. Non meraviglia allora che, dopo lascoperta fatta da Fermi nel suo lavoro con Pasta ed Ulam del 1954, che mostra-va l’esistenza di moti ordinati in un modello di solido (monodimensionale), laquasi totalità della comunità abbia creduto che il fenomeno dovesse scomparireper modelli macroscopici. E questo, nonostante il fatto che nello stesso anno1954 del lavoro FPU il grande Kolmogorov avesse pubblicato un sottilissimo la-voro matematico in cui mostrava che i rapporti tra moti ordinati e moti caoticidovessere essere ricompresi in un modo fino ad allora quasi insospettato.

Nernst 1916, risposta a Poincaré: legge di Planck compatibile con la legge diMaxwell–Boltzmann (ovvero, con l’equipartizione)

In un lungo articolo, di difficilissima lettura e di grandiose prospettive,26 daltitolo Su un tentativo di ritornare dalla meccanica quantistica alla concezione divariazioni continue di energia, Nernst fornisce (come dice nelle prime righe) unarisposta al lavoro nel quale Poincaré aveva mostrato che per ottenere la leggedi Planck si deve rinunciare “all’applicabilità del più importante strumento logico,le equazioni differenziali”. Come vedremo, la risposta è basata sull’idea centraleche l’energia termodinamica non coincida con l’energia meccanica del sistemaconsiderato, ma solo con quella frazione di energia che è “disordinata”, e quindipuò effettivamente essere scambiata in un processo termico. In effetti, come eglistesso dice in due punti del suo lavoro, egli fornisce solo una idea, in qualche mo-do “indovina una formula”. Qui cerchiamo di illustrare questa sua divinazione,che corrisponde a rinunciare ad esprimere l’energia termodinamica come valormedio dell’energia meccanica rispetto ad una misura di probabilità invariante.

In breve, egli propone anzitutto la seguenteCongettura dinamica: Per un sistema di oscillatori di frequenza ν, l’energia

ε= hν

26Si tenga presente che, come seguito del lavoro qui discusso, nel 1936 Netnst scrisse un lungoarticolo sull’energia di punto zero in relazione alla cosmologia, in cui tra l’altro propose chedovesse esistere una radiazione di fondo ad una temperatura che stimava dell’ordine di 2.7 K.

Fondamenti della meccanica quantistica: Poincaré 133

costituisce una soglia di caoticità: al di sotto si hanno moti ordinati (geordnete) eal di sopra si hanno mooti disordinati (ungeordnete).

Poi propone il seguenteSchema teorico: Gli oscillatori sono disrtibuiti secondo MB (e quindi con equi-partizione), e mediante tale distribuzione deve essere calcolata l’energia scambia-bile, come la frazione di energia cui si si sottragga opportunamente il contributodell’energia ordinata.

Ricordiamo che la densità di probabilità pβ(E) dell’energia di un oscillatoresecondo MB è data da

pβ(E) =βe−βE .

Si introducono ora le quantità

n0 =∫ ε

0pβ(E)dE , n1 =

∫ ∞

εpβ(E)dE ,

che ovviamente danno la frazione di oscillatori sotto soglia e sopra soglia. Sidefiniscono analogamente le quantità

E0 =1n0

∫ ε

0E pβ(E)dE , E1 =

1n1

∫ ∞

εE pβ(E)dE ,

che danno l’energia media del singolo oscillatore sotto soglia e sopra soglia. Sihanno evidentemente le relazioni

n0+ n1 = 1 , n0E0+ n1E1 = kB T .

Si calcola immediatamente che vale

n1 = e−βε

e quindi si ottiene anche

n0 = 1− n1 = 1− e−βε.

Analogamente, il calcolo di E1 si compie eseguendo una traslazione di ε nell’e-nergia, riconducendosi al classico calcolo che formisce l’equipartizione per MB.In tal modo si ottiene

E1 = kB T + ε ,

Infine dal legame noto tra E0 ed E1 si ottiene

E0 =1n0

kB T −n1

n0E1 ,

e per sostituzione si ottiene la formula divinata da Nernst

E0 = kB T − ε

eβε− 1, (5.5.3)

134 Andrea Carati e Luigi Galgani

nella quale, quasi magicamente, egli vide presentarsi inaspettatamente la formuladi Planck, in un ambito in cui faceva uso della distribuzione di MB.

Da questa formula appare che la legge di Planck può venire pensata nellaforma

ε

eβε− 1= kB T − E0 , (5.5.4)

che sembrerebbe potere rappresentare la frazione di energia scambiabile (in quan-to viene sottratta a kB T l’energia del singolo oscillatore sotto soglia). Si verificafacilmente, usando le relazioni tra no , n1, E0 ed E1, che si ha anche

ε

eβε− 1= n1 (E1− E0) ,

secondo cui l’energia scambiabile è portata solo dagli oscillatori sopra soglia,ciascuno di essi munito della quantità E1− E0.

In altri termini, gli oscillatori sotto soglia restano bloccati, alla loro energia“tipica” E0, e si rimane solo con gli oscillatori sopra soglia, cui è consentito difluttuare al di sopra di E0. Oltre all’energia n0E0 (bloccata) e all’energia termican1(E1−E0), esisterebbe dunque (per completare il bilancio fino a kB T ) l’energian1E0, come una sorta di energia di punto zero posseduta dagli oscillatori soprasoglia. Si osservi infatti che, da uno sviluppo di E0 al primo ordine in hν/kB T ,si ha

E0 'hν2+O(

hνkB T

) .

Relazione con il risultato “alla Kubo” sul calore specifico

Abbiamo già osservato che le espressioni date sopra per la formula di Planck(pensiamo particolarmente alla (5.5.4) ) non hanno l’aspetto di valore medio del-l’energia meccanica rispetto ad una misura di probabilità invariante. Comunque,si verifica a vista che tale espressione si può anche scrivere in termini di unafunzione di partizione efficace Z e f f , ovvero

ε

eβε− 1=−∂β logZ e f f (β) ,

dove

Z e f f (β) =

∫∞0 e−βE dE∫ ε

0 e−βE dE.

Ancora piú significativo è il fatto che nella (5.5.4) l’energia interna di Planckappare come la differenza di due termini, di cui il primo è il valore classico diequilibrio, mentre il secondo appare come una correzione che in qualche modotiene conto del fatto che siamo in presenza di moti non completamente caotici.Se dunque ricaviamo la corrispondente espressione per il calore specifico CV ,semplicemente derivando rispetto a T , troviamo ancora due analoghi termini, di

Fondamenti della meccanica quantistica: Poincaré 135

cui il primo è il calore specifico di equilibrio, e il secondo una correzione dovutaal fatto che siamo in presenza di moti non completamente caotici.

Ora, quasi incredibilmente questo è proprio quello che viene dimostrato nel-la formula alla Kubo che verrà discussa nel prossimo capitolo. La sola, rilevante,differenza, è che la correzione data da Kubo ha una forma ancora alquanto ge-nerale anziché la forma particolare indovinata da Nernst. Un fatto signicativo,tuttavia, è che la formula alla Kubo definisce invece un valore medio, non del-l’energia, ma dello scambio di energia (tra il sistema studiato e un termostato).Tuttavia la misura che interviene é una misura di noneqilibrio anziché una misuradi equilibrio (o invariante).

136 Andrea Carati e Luigi Galgani

Capitolo 6

I tempi di rilassamento intermodinamica e in meccanicastatistica. Da Boltzmann e Gibbsa Kubo

Nei capitoli precedenti si è abbastanza insistito sul fatto che Boltzmann propo-nesse di sfuggire alle conseguenze del principio di equipartizione mediante l’i-potesi che fossero necessari tempi molto lunghi per ottenere la termalizzazionedi tutti i gradi di libertà. Però questa idea non fu da lui mai formalizzata. Fusolo dopo gli anni ’50 del secolo scorso, a seguito dei lavori di Green, Kubo edaltri che è stato possibile chiarire il ruolo che la dinamica gioca nel determinareil valore delle grandezze termodinamiche. In questo capitolo mostreremo comela dinamica possa influire sui valori misurati del calore specifico, cioè come, sela dinamica non è sufficientemente caotica, i valori ottenuti possano essere indisaccordo con il principio di equipartizione.

6.1 Introduzione

Il problema dei tempi di rilassamento in termodinamica e in meccanica statisticaè un oggetto in qualche modo misterioso, che si aggira dappertutto senza esserestato davvero risolto. Il problema si pone già al livello della definizione di unostato termodinamico. Ad esempio, in un sistema fluido a fissato numero di moliuno stato termodinamico è individuato tipicamente da temperatura T e volu-me V , e dunque l’insieme degli stati è un certo dominio in un piano riferito acoordinate (T ,V ). Naturalmente, quando si dice che il fluido si trova in uno diquesti stati si ammette che il sistema sia “in equilibrio”. Poi si compie un certo“processo” che conduce ad un altro punto (T ′,V ′), e si deve attendere un temposufficiente perché il sistema sia ancora in equilibrio e si abbia quindi un nuovo

137

138 Andrea Carati e Luigi Galgani

stato termodinamico individuato dal punto (T ′,V ′). Se ad esempio cambio il vo-lume di un pistone in cui è contenuto il fluido, devo attendere che il fluido ritorni“in quiete”, il che può richiedere “poco tempo”, oppure “molto”. Situazioni ana-loghe si presentano nei processi di misurazione. Ad esempio, nel caso del calorespecifico a volume costante si fa passare il sistema da T a T ′ mettendolo a contat-to con un termostato a temperatura T ′, e durante tale processo si compie ancheuna misura del calore scambiato con il termostato (ad esempio si misura quantoghiaccio si scioglie se il termostato è a zero gradi centigradi, e il sistema a tempe-ratura superiore). Ci sono naturalmente diversi metodi empirici per determinarese è stato raggiunto uno stato di equilibrio o meno. In quesro capitolo mostre-remo che, almeno per il processo di misurazione del calore specifico, esiste unaprescrizione teorica che permette di giudicare se l’equilibrio termodinamico siastato raggìunto o meno. Al tempo stesso questo criterio permette di assegnare alcalore specifico un valore anche per sistemi, diciamo, ordinati, diverso da quelloricavato secondo le usuali formule della meccanica statistica.

Nernst e le misure dei calori specifici dei solidi a basse temperature

Proprio quello della misurazione del calore specifico è un esempio significativo aquesto proposito, quasi paradigmatico, che ha coinvolto nientemeno che il gran-de Walther Nernst. Nel 1911 egli diede inizio a una campagna sistematica di studisperimentali sul calore specifico dei solidi per verificare che esso si annullasse perT tendente a zero. Questo infatti era previsto dal terzo principio della termo-dinamica, che egli stesso aveva formulato nel 1906, ed era suggerito dal lavorodi Einstein del 1907. Tuttavia, nel compiere le misure, proprio quando i valorimisurati cominciavano a diventare sensibilmente inferiori a quello previsto dalprincipio di equipartizione (legge di Dulong e Petit) egli trovò che i tempi ne-cessari perché la misura si stabilizzasse crescevano fortemente. A un certo puntoi tempi divenivano talmente lunghi che egli giunse a dubitare che addirittura“esistesse” un valore per il calore specifico a basse temperature. Poi, inaspetta-tamente, egli trovò che, diminuendo ulteriormente la temperatura, i “tempi dirilassamento” diminuivano, sicché per il calore specifico restavano ben definitidei valori, che effettivamente diminuivano al decrescere della temperatura.1

Tre esempi significativi di situazioni di meta equilibrio

In generale può avvenire che il calore specifico CV abbia un valore misurato benpreciso, che tuttavia non si accorda affatto con quello predetto dalla meccanicastatistica di equilibrio, né classica né quantistica. Un caso tipico è quello discus-so da Landau e Lifshitz, che riguarda “the partial equilibrium of a mixture ofseveral substances which interact chemically”, e viene da loro discusso nel mo-

1Una indicazione di come potrebbe spiegarsi questo fenomeno a livello dinamico potrebbetrovarsi nel lavoro L. Berchialla, L. Galgani, A. Giorgilli, Localization of energy in FPU chains,Discr. Cont. Dyn. Systems -A 11, 855-866 (2004).

Fondamenti della meccanica quantistica: Kubo 139

do seguente. “Owing to the relative slowness of chemical processes, the equilibriumconnected with the motion of molecules (cioè dei baricentri delle molecole) occurs,in general, considerably sooner than the equilibrium connected with the interchan-ge of atoms between the molecules (processo che coinvolge una redistribuzione deglielettroni), i.e., connected with the composition of the mixture”. In un lavoro re-cente2 si trova il seguente esempio. “For example. in a system composed of amole of graphite C and a mole of O2, at room temperature combustion doesnot occur (questo è il processo che richiede un tempo lunghissimo, se non si faintervenire un catalizzatore, qui una fiamma), and the measured heat capacity atconstant volume is simply the sum of the specific heats of the two components,i.e., 1R+ (5/2)R = (7/2)R, whereas at equilibrium the heat capacity is that ofone mole of carbon dioxide C O2, namely, (5/2)R”.

Si ha poi un caso estremamente significativo, in cui si ha discrepanza con leprevisioni della meccanica statistica quantistica di equilibrio. Anche in questo ca-so i valori di equilibrio potrebbero essere misurati in tempi brevi in presenza diopportuni catalizzatori, ma in situazioni ordinarie il raggiungimento dell’equi-librio richiede tempi incredibilmente lunghi. L’esempio è quello dell’orto e delpara idrogeno, che coinvolge la interazione (non efficace) tra nuclei ed elettro-ni; si veda il bellissimo libro di Wannier, sec.11-4, pag. 218.3 Si hanno ancorasostanzialmente due specie chimiche diverse che di fatto (a meno di essere inpresenza di opportuni catalizzatori) non interagiscono, sicché il calore specifi-co misurato risulta essere una somma pesata dei calori specifici delle due specieconsiderate, previsti dalla meccanica statistica quantistica di equilibrio. Ma que-sta somma pesata ha valori diversi da quelli previsti, per il sistema totale, dallameccanica statistica quantistica di equilibrio. Questo fatto sembra suggerire che imetodi della MQ statistica di equilibrio siano adeguati per descrivere i fenomeniempiricamente osservati a livello atomico, ma potrebbero non esserlo se sonocoinvolti gradi di libertà sia atomici che nucleari, perché essi ‘non comunicano”entro tempi “umani”.‘.

Infine, un caso significativo di metastabilità è quello dei vetri. Essi sono con-siderati dei fluidi, ma non appaiono “scorrere”, fluire, su scale di tempi umaniperché a temperature ordinarie hanno una viscosità con un valore che è qualcosacome 1014 volte superiore a quello che presentano diciamo a 1000 K. A tem-perature ordinarie il rilassamento all’equilibrio coinvolge tempi di tipo almenogeologico.

Scopo di questo capitolo

Problemi che coinvolgono tempi di rilassamento all’equilibrio che possono esserelunghissimi, si presentano dunque in molte situazioni. Fu Boltzmann stesso perprimo a suggerire che il tener conto di tale fatto (cioè che i tempi di rilassamento

2A. Carati. A. Maiocchi, L. Galgani, Statistical thermodynamics for metaequilibrium ormetastable states.

3G.H. Wannier, Statistical Physics, Dover (New York, 1966).

140 Andrea Carati e Luigi Galgani

possono essere lunghissimi) possa spiegare il fallimento del principio di equipar-tizione. Egli considera un sistema che si trova in un certo stato termodinamicoe possiede l’energia prevista dal principio di equipartizione. Poi viene diminuitala sua temperatura, sicché il nuovo stato termodinamico richiederebbe una certaben definita diminuzione di energia, ma invece può avvenire che sia lunghissimoil tempo richiesto perché questo processo effettivamente abbia luogo. Il suo esem-pio preferito è quello di un sistema di atomi che siano sfere perfettamente lisce,perché in tal caso le energie cinetiche di rotazione dei singoli atomi sono tuttecostanti del moto, e non si alterano durante le collisioni. Quindi, se si compieun processo di diminuzione di temperatura che coinvolga i baricentri, l’energiadi rotazione resterà eternamente uguale a quella iniziale. Una leggera scabrezzapermetterà invece degli scambi di energia tra baricentri e rotazioni durante lecollisioni, ma il raggiungimento dell’equilibrio corrispondente alla nuova tempe-ratura dei baricentri può richiedere tempi enormi. Questo è un esempio tipiconell’ambito della fisica atomica, in cui falliscono i metodi della meccanica sta-tistica classica di equilibrio (in relazione all’equipartizione dell’energia), sicchépotrebbero risultare rilevanti i metodi di non equilibro. Invece, risultano ade-guati i metodi di equilibrio della meccanica statistica quantistica. Questa sembraessere la situazione che si presenta in generale per la meccanica statistica classicae quella quantistica, di equilibrio e di non equilibrio, per quanto riguarda la fisicaatomica.

A questo punto, se facciamo riferimento alla descrizione classica, il problemasi complica moltissimo, perché dobbiamo distinguere tra energia che un sistemadovrebbe scambiare (con un processo che potrebbe richiedere tempi lunghissimi)ed energia che effettivamente scambia in tempi “umani”, mentre d’altra parte sivuole stabilire con metodi statistici una teoria termodinamica, la quale richiedemisurazioni che in qualche modo si stabilizzino. Come si deve allora forma-lizzare questo fatto? Vedremo nel presente capitolo che, nell’ambito di questoproblema davvero delicato, una risposta incredibilmente limpida e concettual-mente semplice viene fornita da una formula che descrive come, in virtù delladinamica, il risultato di una misurazione dipende dal tempo di osservazione. Ta-le formula, è stata stabilita recentemente nel caso del calore specifico, seguendoun procedimento ispirato ad un metodo generale introdotto nel 1954 da Kubonell’ambito della cosiddetta teoria della risposta lineare, e sembrerebbe costitui-re un paradigma per la descrizione matematica di ogni tipo di misurazione. Ladimostrazione di questa formula costituisce il tema centrale del presente capito-lo. La discussione richiederà di premettere alcune informazioni sul cosiddettoinsieme (o enesemble) di Gibbs. Chiuderà il capitolo una breve discussione delproblema FPU, sollevato da Fermi Pasta ed Ulam nel 1954, con un cenno alcosiddetto problema ergodico.

Fondamenti della meccanica quantistica: Kubo 141

6.2 Da Boltzmann a Gibbs. La formula di Einstein–Boltzmann per il calore specifico

Abbiamo visto in un precedente capitolo come la statistica di Boltzmann si rife-risse a un sistema totale costituito da N sottosistemi identici, come tale statisticariguardasse la distribuzione dei sottosistemi nello spazio µ (lo spazio delle fasi diun generico sottosistema), ovvero la successione {nk} dei numeri di occupazionedelle celle dello spazio µ (o eventualmente – passando al continuo – la densitàdi particelle in ogni punto dello spazio µ). Abbiamo poi visto come venisseattribuita una probabilità ad ognuna di tali distribuzioni, inferendola da una pro-babilità a priori definita nello spazio Γ (lo spazio delle fasi del sistema totale), taleprobabilità essendo proporzionale alla misura di Lebesgue della corrispondenteregione dello spazio Γ . In tal modo, quando sia fissata l’energia totale del sistemala distribuzione di massima probabilità (in effetti l’unica avente probabilità so-stanzialmente non nulla) risultava essere la distribuzione di Maxwell–Boltzmannper i numeri di occupazione delle cellette, che nel caso continuo è proporzionalead exp(−βH ) dove H è la Hamiltoniana di un sottosistema.

Poi, improvvisamente nel 1902 piombò sulla comunità scientifica come unfulmine a ciel sereno l’opera principale di Gibbs, il primo vero scienziato (chimi-co–fisico e matematico) del nuovo mondo. Si tratta del libro (del 1902) Ele-mentary principles in Statistical Mechanics, che venne subito elogiato con grandeenfasi da Poincaré che era allora (al volgere del secolo) uno dei massimi (se nonil massimo) scienziato (matematico e fisico–matematico) del vecchio mondo.

Con Gibbs, dello spazioµ si perde in linea di principio ogni traccia (salvo cheesso ricompaia in seguito per comodità di calcolo), e tutta la trattazione fa riferi-mento allo spazio Γ . Si considera un sistema globale, composto da un numero N(da pensarsi enorme) di sottosistemi, diciamo particelle, completamente arbitrari(in particolare, non necessariamente identici), e con una arbitraria hamiltonia-na H (z) per il sistema totale. Qui z = (q , p) denota l’insieme delle coordinatecanoniche del sistema totale (ad esempio q = (x1, x2, . . . , xN ) se il sistema è costi-tuito di N particelle libere di muoversi su una retta, e x j sono le corrispondenticoordinate cartesiane).

Le misure di probabilità nello spazio Γ , intese , semplicome “stati”

Il grande salto concettuale rispetto a Boltzmann consiste nella assoluta distinzio-ne ed indipendenza mutua tra dinamica e probabilità (o, meglio, come vedremo,tra dinamica e probabilità dei dati iniziali). La dinamica è semplicemente quellahamiltoniana, deterministica, e reversibile sotto inversione temporale (su questosecondo aspetto ritorneremo più avanti). Stiamo considerando il caso tipico diuna hamiltoniana indipendente dal tempo, sicché le equazioni di Hamilton de-finiscono un flusso z → Φt z (soluzione dell’equazioni di moto al tempo t condato iniziale z ) che è un gruppo rispetto a t (sostanzialmente, con la proprietà

142 Andrea Carati e Luigi Galgani

Φs �Φt z�

= Φt+s z ), e per ogni tempo t la trasformazione

z→ Φt z

è canonica. Dunque, in particolare, ogni dominio iniziale D viene trasformato inun dominio Φt D di forma in generale diversa, ma avente il medesimo volume diD (cioè la medesima misura di Lebesgue). Ovvero, nel cambiamento di variabiliy = Φt z si ha

y = Φt z comporta dy = dz .

É questo il cosiddetto primo teorema di Liouville.Questa è la dinamica: ogni punto iniziale z produce una sua orbita {Φt z},

e corrispondentemente ogni variabile dinamica, od osservabile, F (una funzio-ne F (z) su Γ , a valori reali) cambia valore, nel modo dettato dalla dinamica. Seal tempo iniziale il sistema si trova in z, essa vale F (z), mentre al tempo t essaassume il valore F (Φt z). La probabilità in principio entra solo come ausilio difronte all’ignoranza dei dati iniziali (fatto ovvio nel caso di un sistema macro-scopico). Se inizialmente il sistema si trova con probabilità 1/3 nel punto z econ probabilità 2/3 nel punto z ′, allora al tempo t si troverà con probabilità 1/3nel punto Φt z e con probabilità 2/3 nel punto Φt z ′: la probabilità viene dunquetrasportata lungo il flusso.

Più in generale Gibbs introduce una distribuzione di probabilità nello spazioΓ , come una generalizzazione dello stato microscopico del sistema considerato(ricordiamolo: stiamo parlando di un sistema “totale” composto di N sottosiste-mi arbitrari, ad esempio N particelle). Gibbs considera all’istante iniziale nonun singolo sistema “totale”, ma, come egli dice, un insieme (o un ensemble) di si-stemi totali, ciascuno dei quali evolve come se gli altri non esistessero, mediantele leggi dell’unica dinamica che è definita, nello spazio Γ , dalla assegnata hamil-toniana. Si può addirittura passare ad un insieme continuo di sistemi,4 definitoda una densità ρ(z). Un fissato insieme, che permette il calcolo dei valori medidelle variabili dinamiche di interesse, costituisce quindi un “stato”, come genera-lizzazione dello stato microscopico “esatto” che si ottiene nel caso particolare incui si abbia un solo ben determinato punto iniziale z∗, ovvero nel caso in cui ladensita ρ si riduce a una delta di Dirac, ρ0(z) = δ(z − z∗).

Consideriamo dunque uno “stato” iniziale nel caso continuo, definito me-diante una densità di probabilità iniziale ρ0, Ciò vuol dire che la probabilitàiniziale P0(D) che il sistema si trovi in un arbitrario dominio D è data da

P0(D) =∫

Dρ0(z)dz =

Γρ0(z)χD (z)dz

dove χD (z) è la funzione caratteristica del dominio D . Dunque la probabilitàche il sistema si trovi inizialmente nel dominio D viene calcolata come valor me-dio (rispetto alla densità ρ0) della funzione (o variabile dinamica o osservabile)

4Tuttavia, in un suo libro di introduzione alla teoria delle probabilità Varhadan dice che ilpassaggio al continuo “is a mess”.

Fondamenti della meccanica quantistica: Kubo 143

χD (z). Analogamente, il valor medio ⟨F ⟩(0) di ogni variabile dinamica F (z) saràdefinito dalla formula

⟨F ⟩(0) =∫

Γρ0(z)F (z)dz . (6.2.1)

In analogia con l’esempio relativo al “caso discreto” considerato sopra (in cuisi avevano due soli dati iniziali), è allora naturale ammettere che il valor mediodella variabile dinamica F al tempo t , sia dato da

⟨F ⟩(t ) =∫

Γρ0(z)F (Φ

t z)dz . (6.2.2)

Questa formula può essere riscritta in un modo equivalente come

⟨F ⟩(t ) =∫

Γρ0(z)Ft (z)dz . (6.2.3)

dove abbiamo introdotto la funzione Ft (z), “evoluta di F al tempo t”, definitada

Ft (z) = F (Φt z) . (6.2.4)

Il procedimento duale: l’equazione di Liouville

Il modo seguito qui sopra per definire il valor medio ⟨F ⟩(t ) è analogo a quelloche verrà utilizzato in MQ da Heisenberg per definire il valor medio al tempot di una osservabile, utilizzando lo “stato” (ovvero la misura di probabilità) altempo 0 e facendo evolvere le osservabili. Vedremo che il metodo di Heisenbergè equivalente a quello di Schrödinger, in cui evolve lo stato mentre restano fissele osservabili.

L’analogo di questo secondo procedimento, in cui si fa evolvere lo stato la-sciando fisse le osservabili, è in effetti quello che venne introdotto per primoin ambito classico. La relativa formula si ottiene dalla (6.2.2) introducendo ilcambiamento di variabile

y = Φt z .

Ricordando che la trasformazione è canonica sicché dz = dy, e chiamando ancoraz la nuova variabile y (che, nell’espressione del valor medio come integrale, èuna variabile di integrazione o, come si dice, una variabile “muta”, il cui nome èarbitrario), la (6.2.2) prende allora la forma

⟨F ⟩(t ) =∫

Γρt (z)F (z)dz . (6.2.5)

dove entra la densità di probabilità ρt (z) definita da

ρt (z) = ρ0(Φ−t z) , (6.2.6)

144 Andrea Carati e Luigi Galgani

che evidentemente potremo chiamare l’ evoluta al tempo t di ρ0. Per calcolare ilvalor medio ⟨F ⟩(t ) di una osservabile F al tempo t si hanno dunque due proce-dimenti “duali”, basati rispettivamente sulle formule (6.2.3) e (6.2.4) se si fannoevolvere le osservabili, “alla Heisenberg”, e sulle formule (6.2.5) e (6.2.6) se sifanno evolvere gli stati, “alla Schrödinger”.

Dalla relazione (6.2.6) risulta immediatamente5 che la funzione ρ(t , z) ≡ρt (z) soddisfa l’equazione differenziale

∂tρ+ {ρ, H}= 0 , (6.2.7)

dove {ρ, H} è la parentesi di Poisson di ρ con H . É questo il cosiddetto secondoteorema di Liouville, e l’equazione (6.2.7) viene detta equazione di Liouville.

Gli stati di equilibrio, e lo stato di Gibbs (o insieme canonico)

Tra tutti gli stati. i più semplici sono quelli che non cambiano nel tempo, ovverotali che ρt (z) = ρ0(z), e vengono detti stati stazionari o stati di equilibrio. Dalladefinizione ∂tρ= 0, in virtù dell’equazione di Liouville segue subito che gli statidi equilibrio sono caratterizzati dal fatto di essere funzioni che sono costantidel moto non dipendenti esplicitamente dal tempo, ovvero caratterizzate dallaproprietà {ρ, H} = 0. In particolare, sono stati stazionari tutte le densità ρ0(z)che dipendono dal punto z solo attraverso la hamiltoniana H .

Tra tutti gli stati di equilibrio che sono funzioni dell’hamiltoniana, Gibbsprivilegia la famiglia la cui densità è formalmente l’analogo della distribuzione diMaxwell–Boltzmann trasportata nello spazio Γ , ovvero

ρβ(z)def=

e−βH (z)

Z(β), Z(β) =

Γe−βH (z) dz . (6.2.8)

Naturalmente, analogamente a quanto avviene con la distribuzione di Maxwell–Boltzmann, per il valor medio U def= ⟨H ⟩ dell’energia totale si trova ancora

U ≡ ⟨H ⟩=−∂β logZ ,

e si mostra ancora che si ha

β=1

kB T, Z = e−βF .

Una proprietà profonda dell’insieme canonico di Gibbs, si potrebbe dire unaproprietà caratteristica, è la seguente. Se si hanno due sistemi definiti nei rispetti-vi spazi delle fasi Γ , Γ ′, con hamiltoniane H , H ′, che si trovano separatamente in

5Infatti la condizione che il valore di ρ venga trasportato inalterato lungo l’orbita soluzione del-le equazioni di Hamilton, esprime il fatto che la funzione ρ(t , z)≡ ρt (z) è una costante del motodipendente dal tempo, ossia che è nulla la derivata (rispetto al tempo) della funzione compostaρ(t , z(t )).

Fondamenti della meccanica quantistica: Kubo 145

stati di Gibbs alla medesima temperatura (inversa) β, allora risulta che lo statototale, definito nello spazio delle fasi prodotto cartesiano dei due spazi singo-li, con hamiltoniana totale H t ot = H +H ′, è anch’esso uno stato di equilibrioalla medesima temperatura. É questa una proprietà immediatamente evidente,conseguenza della struttura della densità di Gibbs:

ρβ(z) =e−βH (z)

Z(β)e−βH ′(z ′)

Z ′(β)=

e−βH t ot (z,z ′)

Z t ot (β), (6.2.9)

dove

H t ot (z, z ′) =H (z)+H ′(z ′) , Z t ot (β) def= Z(β)Z ′(β) . (6.2.10)

Gibbs e MB

Una banale generalizzazione di queste due ultime relazioni ci permette di mo-strare come una parte considerevole della teoria di MB venga riottenuta a partiredall’insieme canonico di Gibbs. Per confrontarci con lo schema di Boltzmann,consideriamo il caso in cui il sistema totale è composto di N sottosistemi identici,cioè tutti con il medesimo spazio delle fasi, ciascuno con le proprie coordinatecanoniche zi ma con la medesima hamiltoniana H (zi ). Allora l’hamiltonianatotale è data da

H t ot (z1, z2. . . . , zN ) =∑

i

H (zi )

e l’insieme di Gibbs per il sistema totale assume una forma fattorizzata analoga aquella data sopra nel caso di due sottosistemi, ora però con le hamiltoniane tutteidentiche, e anche le funzioni di partizione tutte identiche:

ρβ(z) =e−βH t ot (z1,...,zN )

Z(β)=

1

(Z (β))NN∏

i=1

e−βH (zi ) . (6.2.11)

Notazioni per il sistema totale e i sistemi parziali. Le notazioni usate qui sopra po-trebbero ingenerare qualche confusione. Quando abbiamo definito l’insieme di Gibbsmediante la formula (6.2.8), denotavamo con H l’hamiltoniana del sistema totale, co-stituito di N sottosistemi arbitrari. Qui invece ci stiamo riferendo a un sistema totalecostituito di N sottosistemi identici, e quindi l’insieme di Gibbs ha la forma (6.2.8), incui però deve apparire la hamiltoniana totale H t ot =

i H (zi ). La confusione potrebbeessere generata dal fatto che qui, per conformarci alle notazione che avevamo utilizzatonel discutere la distribuzione di MB, stiamo denotando con H la hamiltoniana di ognisingolo sottosistema, e non la hamiltoniana totale, che ora denotiamo con H t ot . Analo-gamente (a differenza della notazione usata nella formula (6.2.8), qui denotiamo con Z t ot

la funzione di partizione del sistema totale e con Z quella di ogni singolo sottosistema(uguale a quello di tutti gli altri).

In particolare, data l’analogia formale con la distribuzione di MB, avvieneancora che il valor medio U dell’energia totale è dato dalla formula

U =−∂β logZ .

146 Andrea Carati e Luigi Galgani

Tuttavia, in virtù della forma fattorizzata della densità di Gibbs (per cui Z =ZN ), questa prende poi la forma

U =−N∂β logZ ,

che coincide con la formula che si deduce dalla distribuzione di MB nel casocontinuo.

Gibbs vs MB, alla luce della teoria delle grandi deviazioni. Einstein e lastatistica del singolo sottosistema

Vi è tuttavia un punto rilevante in cui la statistica di MB differisce da quella diGibbs. Si tratta di un punto essenziale per comprendere l’argomento crucialeche oppose per tutta la sua vita Einstein a sostanzialmente tutta la comunitàscientifica, per quanto riguarda l’interpretazione della MQ.

Il problema è come si debba intendere la ρ di Gibbs, se in senso forte o insenso debole. Ovvero, se essa possa essere utilizzata per definire i valori medi ⟨F ⟩di tutte le variabili dinamiche o osservabili F (z) (senso forte), oppure soltanto peri valori medi di una classe ristretta di osservabili (senso debole). La classe ristrettaè in effetti quella delle cosiddette funzioni di tipo somma, che sono definite comesomma di un gran numero di variabili ciascuna delle quali coinvolge un singolosottosistema.

Nel primo caso (quando assumiamo la validità dell’insieme di Gibbs, in sensoforte) ci troviamo davanti a un postulato, e questo lo facciamo per decreto, comecorrispondente alla scelta più semplice possibile. Nel secondo caso stiamo facen-do delle ipotesi molto più generali, che sono di tipo alquanto comuni nell’ambitodei fondamenti della teoria delle probabilità, e si trova che allora la validità delprocedimento di Gibbs in senso debole (ovvero solo per valutare i valori medidelle osservabili di tipo somma) discende come un teorema, che viene dimostratonell’ambito della teoria delle grandi deviazioni.

Ma quale è infine la differenza cruciale tra le due possibili utilizzazioni del-l’insieme di Gibbs? Questo possiamo capirlo considerando l’esempio centraleche si presenta nel contesto del metodo di Boltzmann, che consiste nello studiarela successione {nk} di numeri di occupazione delle cellette nello spazio µ. Infatti,in tal caso ciascun numero di occupazione nk è proprio una osservabile di tiposomma, in quanto definito dalla relazione

nk =∑

i

χ ik ,

dove χ ik è la osservabile (definita sullo spazio Γ ) che vale 1 se il punto i si trova

nella cella k, e 0 altrimenti. Dunque, il virtù del teorema di grandi deviazioni, laformula di MB è giustificata per i numeri di occupazione, e si trova

nk =Ne−βεk

Z (β), Z (β) =

k

e−βεk .

Fondamenti della meccanica quantistica: Kubo 147

Ora è evidente che questa formula “invita” a considerare le “frequenze” pk defi-nite da

pkdef=

nk

N,

per le quali si ha∑

k

pk = 1 .

Questo fatto induce spontaneamente a interpretare le pk come probabilità perl’occupazione delle celle da parte di un singolo sottosistema. Analogamente perla distribuzione di MB nel caso continuo. Intesa in questo senso, la distribuzionedi MB fornisce la densità di probabilità di un singolo sottosistema, definita nellospazio µ.

E in effetti questo è proprio quello che si deduce a colpo dall’insieme diGibbs, se lo si intende in senso forte, come significativo anche per le osserva-bili relative a un singolo sottosistema. Naturalmente questo sembra lecito, ed èpossibile che sia logicamente coerente. Ma deve essere chiaro che in ogni casosi tratta di un assioma, un assioma indipendente da tutti gli assiomi tradiziona-li della teoria delle probabilità. Il punto che noi facciamo, seguendo Einstein6

(che purtroppo non aveva a disposizione i risultati della teoria delle grandi de-viazioni), è che questa scelta non è affatto necessaria per la interpretazione degliesperimenti cruciali della fisica atomica che hanno condotto alla MQ.

La formula di Einstein–Boltzmann. Calore specifico e fluttuazioni di energia(all’equilibrio)

Cominciamo a stabilire la formula di Einstein–Boltzmann, e poi la commente-remo cercando di spiegare il significato che le attribuiva Einstein. Si osserva chenell’insieme canonico di Gibbs la energia totale H t ot è una variabile definita sututto lo spazio delle fasi, che assume tutti i valori nel codominio che le compete(ad esempio nel codominio (0,∞)). Fissata la temperatura inversa β, resta cor-rispondentemente definita una distribuzione di probabilità per l’energia totale, ein particolare resta definito un valor medio U = U (β), che abbiamo visto comecalcolare. Come di consueto in tutte le trattazioni probabilistiche, una secondainformazione (alquanto rilevante) sulla distribuzione di probabilità dell’energiaè data dalla sua varianza o scarto quadratico medio σ2

E , definiti da

σ2E

def= ⟨(H −U )2⟩= ⟨H 2⟩−U 2 . (6.2.12)

6Non è un caso che, nei suoi lavori del 1903–1904 sui fondamenti della meccanica statistica,Einstein si muovesse nell’ambito dello spazio Γ , e non in quello dello spazio µ.

148 Andrea Carati e Luigi Galgani

Ora, analogamente alla formula U =−∂β logZ(β) , si ha anche7, 8

σ2E =−∂βU , (6.2.13)

o equivalentemente (ricordando ∂β =−kB T 2∂T )

kB T 2CV = σ2E . (6.2.14)

Capacità termica vs calore specifico. Qui si incontra il fatto, sostanzialmente irri-levante per la nostra discussione, che il calore specifico per definizione è semplicemente lacapacità termica di una mole. Dunque, volendo fare riferimento al calore specifico an-ziché alla capacità termica, lasceremo sottinteso d’ora in poi che stiamo considerando ilcaso in cui il sistema studiato consiste di una mole.

La (6.2.14) è la formula che Einstein dimostrò nel 1904 nel suo secondo lavo-ro sulla termodinamica statistica, e che egli in seguito attribuì a Boltzmann. Daun punto di vista cinematico essa potrebbe apparire come una specie di curiosità.Come abbiamo già detto nel Capitolo 4 per Einstein aveva una profonda valenzadinamica. Egli ha in mente che lo sparpagliamento dei valori dell’energia del si-stema sia dovuto al fatto che il sistema non è isolato, bensì in contatto dinamicocon un termostato. È isolato il sistema totale, mentre l’energia del sistema di inte-resse fluttua al variare del tempo. Ispirandosi ai procedimenti introdotti da Kubonel 1954, questa profonda intuizione è stata dimostrata assolutamente corretta, elo illustreremo nel prossimo paragrafo. Si trova che queste “fluttuazioni dinami-che” coincidono con quelle date dalla formula di Einstein–Boltzmann, ma solose si ha un opportuno rilassamento all’equilibrio. Inoltre sono possibili casi dirilassamento parziale, in cui il calore specifico si stabilizza su un valore inferiorea quello previsto all’equilibrio, dato dalla formula di Einstein–Boltzmann.

6.3 Il processo di misurazione del calore specifico

Mostriamo dunque come una generalizzazione dinamica della formula di Einstein–Boltzmann venga ottenuta con un procedimento alla Kubo, in un modello mi-croscopico che imita un concreto processo di misurazione del calore specifico.

Il calorimetro ad acqua.

È utile avere in mente come si compie la misurazione del calore specifico nel piùsemplice dei metodi classici, quello del calorimetro ad acqua. Si porta il sistema di

7Basta ricordare la definizione

U ≡ ⟨H ⟩=∫

H e−βH dz∫

e−βH dz,

e usare la regola di derivazione nella forma ( f /g )′ = f ′/g − f g ′/g 2.8La formula U = −∂βZ(β) e la (6.2.13) rientrano in una categoria di formule ben familiari

nella teoria delle probabilità.

Fondamenti della meccanica quantistica: Kubo 149

interesse (ad esempio un pezzo di piombo) ad una certa temperatura T , e poi lo siimmerge in una quantità nota di acqua contenuta in un vaso Dewar, che si trovaad una temperatura inferiore T ′. Allora l’acqua si scalda e dopo un certo tempo lasua temperatura si stabilizza, ed allora il processo di misurazione è terminato. Ènoto il calore specifico dell’acqua, ovvero il calore necessario per innalzare di ungrado centigrado la temperatura di un litro di acqua (anzi, è proprio questo cheviene scelto come unità di misura del calore specifico, e venne misurato in terminidi energia meccanica da Joule attorno al 1842). Avendo misurato l’incrementodi temperatura dell’acqua (della quale è noto il peso, compreso il contributoequivalente del calorimetro), si conosce il calore9 trasferito dal piombo all’acqua.Infine, dividendo per la differenza di temperatura del piombo e per il suo peso,si determina il calore specifico del piombo.

Dunque le quantità che concretamente si misurano sono i due incrementi ditemperatura, ∆T del corpo di interesse, e ∆T ′ del calorimetro (l’acqua). Con-sideriamo il caso in cui si misuri la capacità termica di una mole del corpo diinteresse, mentre si abbiano N ′ moli di acqua. Se CV e C ′V sono i corrispon-denti calori specifici (capacità termiche di una mole), poiché è la medesima (inmodulo) la quantità di calore scambiata Q, avremo

|Q|=CV |∆T | = N ′C ′V |∆T ′| . (6.3.1)

Per definizione il calore specifico dell’acqua è conosciuto, e dunque il calorespecifico del corpo di interesse è misurato da

CV =N′C ′V|∆T ′||∆T |

.

Sperimentalmente è possibile realizzare un procedimento leggermente diver-so, in cui non varia la temperatura del secondo sistema (il quale dunque funzionada termostato) e si misura il calore scambiato. Ma questo è possibile solo a poche,ben definite temperature. Ad esempio nel calorimetro ad acqua si tiene il secon-do sistema in contatto con una grande quantità di ghiaccio, in modo che la suatemperatura non vari, e il calore scambiato viene determinato misurando quan-to ghiaccio si è sciolto. Dunque in questa variante il secondo sistema, di massapraticamente infinita, agisce da termostato, e la sua temperatura T ′ rimane fissa,e quando il processo termina il sistema di interesse si è portato alla temperaturaT ′ del termostato. È questo processo che noi modellizzeremo, determinandouna opportuna formula analitica per il calore scambiato, a partire da uno statoiniziale in cui il sistema è a temperatura T , e il termostato a temperatura T ′. Sinoti che in questo caso, quando il processo termina (cioè il sistema totale si èstabilizzato), al sistema di interesse viene attribuita la temperatura T ′, ovvero èstato effettuato un processo, in cui è stata cambiata la temperatura del sistema di

9Qui il calore scambiato coincide con la differenza di energia del sistema misurato, perché nonvi è lavoro meccanico.

150 Andrea Carati e Luigi Galgani

interesse. La formula per il calore specifico é allora quella fornita dalla primarelazione della (6.3.1). Anzi, tenendo conto anche dei segni avremo10

CV =Q

T ′−T(6.3.2)

6.4 Realizzazione matematica: il modello microscopico

Abbiamo dunque a che fare con due corpi, il sistema su cui si compie la misura(che chiamiamo anche sistema di interesse) e il calorimetro, nella forma di ter-mostato. Più in generale, consideriamo il caso di un sistema costituito da duecorpi, un corpo S con hamiltoniana H , definita sullo spazio delle fasiM (le cuicoordinate denoteremo globalmente con x ), e un corpo S′, con hamiltonianaH ′ definita sullo spazio delle fasiM ′, con coordinate x ′. Il sistema compostoSt ot = S+ S′ sarà allora descritto nello spazio delle fasiM t ot def=M ×M ′ le cuicoordinate denoteremo con z = (x, x ′). Più avanti, l’hamiltoniana H del sistemadi interesse sarà denotata semplicemente con E .

Supponiamo inizialmente i due corpi isolati termicamente. Questo implicache le energie dei due corpi sono indipendenti e costanti nel tempo, per cui ilsistema è definito dall’hamiltoniana

H t ot (z) =H (x)+H ′(x ′) , z = (x, x ′) .

Ora, se tra i corpi realizzo un contatto termico, ciò significa che le energie deidue corpi possono cambiare, e quindi vi deve essere una certa hamiltoniana diinterazione H i nt , sicché l’hamiltoniana totale sarà

H t ot (z) =H (x)+H ′(x ′)+H i nt (z) , z = (x, x ′) .

Dunque le due hamiltoniane H ed H ′ non sono più costanti del moto, cioè leenergie dei due sistemi S ed S′ possano variare, e si realizza in tal modo la possi-bilità di scambio di calore tra i due sistemi. Parliamo di calore, perché penseremoche gli scambi avvengano senza che si producano variazioni di volume dei sue si-stemi, cioè senza che si compia lavoro. Ad esempio, i due sistemi siano contenutiin due cilindri, a contatto attraverso una base comune, fissa.

Si ha dunque una hamiltoniana di interazione. Si deve tuttavia pensare che essa sia“piccola”, cioè abbia valori trascurabili relativamente a quelli dei due sistemi. Infatti nor-malmente l’interazione termica dei corpi avviene attraverso le loro superfici a contatto,mediante l’interazione a breve range delle particelle che costituiscono i corpi. Questosignifica che se ad esempio il primo corpo è costituito da N particelle, avrò H ∼ N ,

10Se è T ′−T > 0 (cioè durante il processo la temperatura del sistema di interesse è aumentata),e definiamo Q come il calore assorbito dal sistema di interesse (con segno, cioè il calore è cedutose Q < 0) allora per il secondo principio il calore Q assorbito dal sistema di interesse deve esserepositivo. Viceversa se T ′−T < 0

Fondamenti della meccanica quantistica: Kubo 151

mentre Hi nt ∼ N 2/3 (il contributo è solo superficiale), e dunque il contributo di Hi ntall’energia totale può essere trascurato (per corpi macroscopici).11

Dunque, in presenza dell’hamiltoniana di interazione possono aversi scambidi energia tra i due sottosistemi. In questo modo, però, il secondo principio dellatermodinamica non può essere verificato strettamente se si ammette la reversibi-lità microscopica, che definiremo subito sotto. Infatti, in corrispondenza di uncerto dato iniziale z def= (x, x ′) ∈M t ot e del suo evoluto Φt z al tempo t , conside-riamo l’incremento di energia (inteso come incremento in senso algebrico (cioèincremento che può essere positivo o negativo) del sistema di interesse

∆E(z) def= E(Φt z)− E(z)≡H (Φt z)−H (z) . (6.4.1)

Lo scriveremo anche nella forma

∆E(z) def= Et (z)− E(z) ,

se si usa la notazione già precedentemente introdotta Ft (z)def= F (Φt z) per la

funzione Ft (z), evoluta al tempo t di una generica funzione F (z). Si noti che∆E dipende parametricamente dal tempo t di evoluzione. Questa dipendenzaparametrica verrà in generale sottintesa, cioè non denotata esplicitamente.

Ammettiamo ora che per un “dato iniziale” z l’incremento di energia ∆Erelativo a un dato tempo t sia ad esempio positivo. Avviene allora che, per isistemi che presentano la proprietà di reversibilità temporale, esiste il movimento“inverso” in cui l’incremento di energia (valutato per il medesimo intervallo ditempo) è esattamente uguale in modulo ed opposto di segno.

La reversibilità temporale

Ricordiamo che la proprietà di reversibilità temporale viene formulata in termi-ni della trasformazione di parità, P :M t ot →M t ot , definita come quella cheinverte il segno di tutte le velocità delle particelle costituenti il sistema totale. Sipensi a un sistema costituito da N particelle, e siano q ≡ (q1.q2, . . . , q3N ) le lorocoordinate cartesiane, e p ≡ (p1. p2, . . . , p3N ) i corrispondenti momenti. Allora,12

se z = (q , p) , P z def= (q ,−p) edunque P 2 =I ,

dove I è la trasformazione identità. Allora un sistema dinamico, con una cor-rispondente evoluzione temporale (o “flusso”) Φt , si dice reversibile se, per ognidato iniziale z e per ogni tempo t , si ha ΦtP Φt z =P z, cioè

ΦtP Φt =P ovvero (P Φt )2 =I .11Tipicamente, in opportune unità si ha H ' 1023, Hi nt ' 1016. e quindi Hi nt/H ' 10−6.12La trasformazioneP : (q , p)→ (Q, P ) = (q ,−p) è una trasformazione canonica, avente come

generatrice la funzione S = −q ·Q. Evidentemente si ha P −1 = P , ovvero P 2 = I , dove Idenota la trasformazione identità.

152 Andrea Carati e Luigi Galgani

In altri termini, prendo il punto “finale” Φt z (evoluto al tempo t del dato inizialez ) e inverto le velocità; faccio poi evolvere ancora per il tempo t , e devo ottenereun punto che coincide con quello iniziale z a meno dell’inversione delle velocità.

È ben noto, e si dimostra immediatamente, che nei sistemi hamiltoniani ladinamica è reversibile se le hamiltoniane sono pari nelle velocità delle particelle,cioè se vale13

H (P z) =H (z) .

Consideriamo hamiltoniane H ed H ′ (del sistema di interesse e del termostato)che siano pari nei momenti, sicché sarà pari nei momenti anche l’hamiltonianatotale.14 .

Come banalissimo esercizio si vede allora immediatamente che si ha15

∆E(P Φt z) =−∆E(z) .

Si capisce così come, a prima vista, la reversibilità microscopica sembrerebbecostituire un ostacolo insormontabile se si vuol dedurre il secondo principio del-la termodinamica. È questo il cosiddetto Paradosso di Loschmidt (un allievo diPlanck), che venne formulato verso la fine dell’800 e, insieme con il parados-so della ricorrenza di Zermelo, veniva avanzato come obiezione apparentementeinsormontabile contro le teorie cinetiche, le quali pretendevano di dedurre latermodinamica dalla dinamica microscopica. A obiezioni di questo tipo Boltz-mann rispondeva con argomenti di tipo statistico.16 La trattazione data in questocapitolo fornisce una risposta moderna. La sua caratteristica consiste, piuttostoironicamente, nel dedurre il secondo principio proprio facendo uso essenzialedella proprietà di reversibilitá microscopica. Si potrebbe addirittura congettura-re che non si possa dedurre il secondo principio da una dinamica microscopicache non possieda la proprietà di reversibilità temporale.17, 18

In ogni caso é dunque chiaro che la soluzione al paradosso di Loschmidt puòottenersi solo con metodi statistici. Si rinuncia cioè all’idea di valutare l’incre-mento di energia relativo a ogni singolo dato iniziale, e ci si mette invece al livello

13Basta osservare che nelle equazioni in forma di Hamilton il cambiamento di segno nelle p, asecondo membro, viene compensato dalla variazione di segno nella derivata rispetto al tempo nelprimo membro se, insieme alla trasformazione nelle variabili p si compie anche la trasformazionet →−t .

14Dunque consideriamo una situazione in cui i sistemi non sono immersi in un campomagnetico esterno.

15Infatti

∆E(P Φt z) = E(ΦtP Φt z)− E(P Φt z) = E(z)− E(Φt z) =−∆E(z) .

16Si veda la sezione II, pag. 113 del lavoro n. 39 pag. 116 delle opere di Boltzmann, Vol. 2.17Si noti che invece Clausius si proponeva di dedurre la termodinamica ammettendo la irrever-

sibilità già a livello microscopico. Su questo punto mette l’accento Tatiana Ehrenfest–Afanassjeva,nella sua prefazione al libro P. Ehrenfest, T. Ehrenfest–Afanassjeva, The conceptual foundations ofthe statistical approach in mechanics, Dover (New, York, 1990).

18Stranamente, sembra che questo fosse anche l’atteggiamento di Einstein, nel suo primo lavorodel 1903 sui fondamenti della meccanica statistica (NOTA PER GLI AUTORI: Controllare.

Fondamenti della meccanica quantistica: Kubo 153

in cui si intende per incremento di energia il valore medio degli incrementi re-lativi ai singoli dati iniziali. In altri termini, il secondo principio verrà dedotto,ma solo in senso debole, cioè in senso statistico.

Definizione meccanico–statistica del calore assorbito

Dobbiamo quindi introdurre una densità di probabilità ρ0(z) dei dati inizialinello spazio delle fasi totale. Denotando con

·�

il corrispondente valore medio,definiamo dunque il calore Q assorbito dal sistema di interesse come

Q def=

∆E�

=∫

∆E(z) ρ0(z)dz . (6.4.2)

Questa definizione è veramente naturale. Si pensi ad esempio ad un numerofinito di punti iniziali zi , ciascuno munito di una sua probabilità. Ognuno di essi“produce” una corrispondente energia assorbita ∆E(zi ), e noi semplicemente neprendiamo il valore medio. Tra l’altro, nello spirito delle teorie statistiche, sipensa che il valor medio sia una buona stima per il valore “tipico”, relativo a undato iniziale “tipico”. Ovviamente, come più volte sottolineato, tale variazionedi energia viene interpretato come calore Q assorbito (in senso algebrico, ovveroassorbito o ceduto), perché non si ha lavoro macroscopico (essendo tenute fissele pareti).

6.5 Deduzione del secondo principio

Scelta della misura di probabilità iniziale

Si noti che, dalla definizione data, non risulta affatto ovvio che il calore assorbi-to abbia un segno definito, perché nella formula la variazione di energia ∆E(z)dipendente dai dati iniziali appare alla prima potenza, mentre i dati iniziali sonosuddivisi in coppie che producono il medesimo incremento in modulo, ma di se-gno opposto. D’altra parte appare evidente che il calore assorbito deve dipenderedalla scelta della misura di probabilità dei dati iniziali, e ad esempio esso deve es-sere nullo in una situazione di equilibrio, in cui i due dati iniziali della medesimacoppia (che portano a incrementi uguali ma di segno opposto) devono avere lostesso peso (la stessa densità di probabilità).

Si deve dunque stabilire quale sia la corretta misura di probabilità con cuipesare i dati iniziali in una situazione di non equilibrio19, .20

È ben naturale scegliere la misura richiedendo che, prima che i due corpisiano posti in contatto termico, i dati iniziali siano distribuiti secondo una misurafattorizzata, perché i due sistemi sono indipendenti. La scelta più naturale é

19O meglio, gli insiemi di dati iniziali, perché nel continuo ogni dato iniziale ha misura nulla.20Resterebbe anche da stabilire se la misura dell’insieme dei dati iniziali che fa fluire il calore dal

corpo più freddo al corpo più caldo sia del tutto trascurabile, come accade nel caso del paradossodella ricorrenza di Zermelo, oppure no. Di questo problema non ci occuperemo nel seguito.

154 Andrea Carati e Luigi Galgani

quella di prendere come fattori due misure di Gibbs, a temperatura inversaβ peril corpo di interesse ed a temperatura inversa β′ per il termostato, ovvero

ρ0(z) =e−βH (x)

Z(β)e−β

′H ′(x ′)

Z ′(β′), (6.5.1)

dove Z e Z ′ sono le corrispondenti funzioni di partizione (fattori costanti, rispet-to a z ). Se ora mettiamo istantaneamente in contatto i due corpi (attraverso unabase dei due cilindri in cui sono contenuti), la hamiltoniana di interazione faràvariare nel tempo le loro energie. L’evoluzione in presenza della hamiltoniana diinterazione, avrà l’effetto che ora variano nel tempo i valori medi delle variabilidinamiche F (z).

Naturalmente, nel caso particolare in cui le due temperature siano uguali,β′ = β la densità di probabilità corrisponde a una misura di equilibrio per ilsistema totale, e i valori medi non cambieranno col tempo. Denotando la densitàdi equilibrio con ρeq (z). e i corrispondenti valori medi con ⟨·⟩eq si avrà allora

ρeq (z) =e−β(H (x)+H ′(x ′))

Z(β)Z ′(β), (6.5.2)

⟨F ⟩eq =∫

F (z)ρeq (z)dz ,

⟨∆F ⟩eq = 0 .

La forma differenziale del calore assorbito

Veniamo ora al caso di una misura di probabilità iniziale di non equilibrio, β′ 6=β. Rimandando la discussione del caso generale, consideriamo ora il caso diβ′−β “piccolo”, ovvero

β′ =β+ dβ .

In altri termini, valutiamo la forma differenziale δQ del calore, che si ottienedalla (6.4.2) sviluppandola al primo ordine in β′ attorno a β′ =β. Ricordando⟨∆E⟩eq = 0 si ha

δQ = dβ∫

∆E(z)∂ ρ0

∂ β′|β′=β (z)dz , (6.5.3)

ovvero, 21 in virtù della dipendenza esponenziale di ρ0 da β′

δQ =−dβ∫

∆E(z)H ′(z)ρeq (z)dz . (6.5.4)

21Si osservi che sembrerebbe esserci un altro termine, che si ottiene derivando la funzione dipartizione Z(β). Ma tale termine è proporzionale a ⟨∆E⟩eq , che è nullo in virtù della proprietàdelle misure di equilibrio: Si ha ⟨Et ⟩eq = ⟨E⟩eq , ovvero ⟨∆E⟩eq = 0

Fondamenti della meccanica quantistica: Kubo 155

Un astuto cambiamento di variabile di integrazione

Operiamo ora, nell’integrale (6.5.4), un astuto cambiamento di variabile suggeri-to dalla reversibilità temporale del flusso, ovvero operiamo la sostituzione

z =P Φt y .

Utilizziamo ora le seguenti proprietà

• la trasformazione y → z è canonica (come composizione di due trasfor-mazioni canoniche, l’evoluzione temporale a tempo fissato, e la paritàP ),sicché

dz = dy ;

• si ha∆E(z) =−∆E(y)

come abbiamo visto poco sopra

• la misura di equilibrio è invariante sotto evoluzione temporale, ovvero siha

ρeq (P Φt y) = ρeq (Φt y) = ρeq (y)

(la prima uguaglianza segue dalla assunta invarianza delle hamiltonianeparziali rispetto alla trasformazione di parità)

Si ha allora per δQ una seconda espressione, data da

δQ = dβ∫

∆E(y)ρeq (y)dy . (6.5.5)

Dunque, prendendo per δQ la semisomma delle due espressioni trovate (e na-turalmente usando il fatto che la variabile “muta” y può essere denotata con z ),usando ∆H ′(z) = −∆E(z) (che segue dalla conservazione dell’energia totale) sitrova la formula

δQ =−dβ12

(∆E(z))2 H ′(Φt z)ρeq (z)dz ,

o ancheδQ =− 1

2⟨(∆E(z))2⟩eq dβ .

Quest’ultima espressione mostra manifestamente che il calore assorbito ha unsegno ben determinato (a differenza della espressione corrispondente alla ori-ginaria definizione, che coinvolgeva l’incremento ∆E(z) alla prima potenza, enon al quadrato). Usando l’ovvia relazione dβ = −dT /kB T 2 abbiamo dunquetrovato

δQ =CV dT ,

156 Andrea Carati e Luigi Galgani

con CV risulta avere l’espressione

kB T 2 CV =12⟨(∆E(z))2⟩eq .

Si noti che CV rappresenta coerentemente il calore specifico.22 Avendo dimo-strato che il calore specifico è positivo, segue che il calore assorbito dal sistemadi interesse, δQ = CV dT , ha il segno del suo incremento di temperatura dT ,e dunque il calore fluisce spontaneamente (se non si agisce con altri mezzi sulsistema totale) dal corpo più caldo al corpo più freddo, cioè il secondo principiodella termodinamica nella forma di Clausius. Tale risultato vale anche nel casoin cui sia finita la differenza di temperature T ′−T 23

Nota: Termodinamica statistica di meta equilibrio o metastabilità. Si noti che,considerando il caso più generale in cui possa variare il volume del sistema studiato, ilcalore scambiato δQ risulta essere una forma differenziale nelle due variabili T , V . Si hapoi anche la forma differenziale δW del calore assorbito dal sistema. È stato dimostratoche la forma differenziale δQ−δW è chiusa (cioè le derivate seconde miste sono uguali)sicché esiste l’energia interna U tale che δQ −δW = dU . In altri termini, è ben notoche i principi della termodinamica valgono anche in situazioni di metastabilità, in cuicioè i processi di scambi di calore e di lavoro “non sono terminati”: per quanto riguardala teoria, il primo principio in tali situazioni è stato dimostrato. Si veda A. Carati, A.Maiocchi, L. Galgani, Statistical thermodynamics for metaequilibrium or metastable states.

Come si può constatare il rilassamento all’equilibrio nel modello matemati-co considerato? Si apre il “problema ergodico”

A dire il vero, resta aperto un problema alquanto rilevante. Abbiamo considera-to uno stato iniziale con il sistema di interesse e il termostato a due temperaturediverse T , T ′. Questa situazione iniziale di non equilibrio ha dato allora ori-gine a un “processo”, che si considera terminato quando "più niente si muove”,nel qual caso per definizione il sistema di interesse ha assunto la temperaturaT ′ = T + dT del termostato. Ora questa situazione in cui "più niente si muove”può essere (almeno idealmente) osservata empiricamente, e quindi fenomenolo-gicamente possiamo constatare di essere in una situazione di equilibrio (o almenodi equilibrio apparente). A un livello teorico si pone allora il problema di stabi-lire se esiste anche nella modellizzazione matematica un criterio “interno”, chepermetta di decidere se e quando ci troviamo in una situazione di equilibrio (oalmeno di equilibrio apparente). Vedremo qui sotto che la risposta viene fornitaimmediatamente da una semplicissima rielaborazione della espressione appenatrovata per il calore specifico. Tra l’altro, questa semplicissima rielaborazionepermetterà anche di ritrovare, nel caso limite di equilibrio completo, la classica

22Infatti abbiamo presoβ′ =β+dβ, ovvero T ′ = T+dT , e quindi dT rappresenta l’incrementodi temperatura del sistema di interesse, nel portarsi dalla iniziale temperatura T alla temperaturafinale, coincidente con quella T ′ del termostato. Dunque δQ è l’energia assorbita dal sistema diinteresse quando la sua temperatura viene incrementata di dT .

23NOTA PER GLI AUTORI: Riportare la dimostrazione.

Fondamenti della meccanica quantistica: Kubo 157

espressione di Einstein–Boltzmann per il calore specifico, e ne costituirà comun-que una generalizzazione di limpidissimo significato dinamico e probabilistico.Questo ci condurrà in maniera del tutto naturale a mettere in luce la rilevanzadel cosiddetto “problema ergodico” per tutto lo studio che stiamo compiendo.

6.6 Calore specifico e dinamica. La formula “alla Kubo”e le correlazioni temporali. Generalizzazione dellaformula di Einstein–Boltzmann

La via per la rielaborazione della formula per il calore specifico, che ci permetteràdi constatare se il processo di misurazione è terminato, si apre quando si scrive inmaniera più esplicita l’espressione che abbiamo appena trovata, mettendola nellaforma

kB T 2 CV =12

Et − E�2(z)

�eq , (6.6.1)

in cui figurano esplicitamente sia la quantità E , sia la sua evoluta temporale Et ,sicché nel problema entra ora esplicitamente, in maniera formale, la dinamica.

Sviluppiamo ora il quadrato. Osserviamo che, come consueta proprietàper i valori medi all’equilibrio, si ha

E2t (z)

�eq =

E2(z)�eq , e aggiungiamo e

sottraiamo il termine U 2 dove U ≡ ⟨E(z)⟩eq . Otteniamo allora

kB T 2CV = σ2E −CE (t ) . (6.6.2)

dove σ2E è la varianza di E , mentre

CE (t )def=

Et E�eq −U 2 , (U =

E�eq ) , (6.6.3)

è la cosiddetta autocorrelazione temporale dell’energia E , dove la media è ancoracalcolata all’equilibrio.

Per comprendere il significato di questa definizione, bisogna ricordare che per ognicoppia di variabili aleatorie o casuali (random variables) f , g su uno spazio di probabilità,se si denota il valor medio con

·�

, la corrispondente correlazioneC f ,g è definita da

C f ,g =

f g�

f�

g�

,

ovvero come la differenza tra valor medio del prodotto, e prodotto dei valori medi. Ladifferenza da zero della correlazione è in qualche modo una misura della loro indipen-denza, perché la correlazione di due variabili indipendenti è nulla. Qui le due variabilisono l’energia Et al tempo t e quella, E , al tempo iniziale;24 quindi si parla di autocor-relazione temporale dell’energia del sistema di interesse. Si intuisce immediatamenteche in un moto sufficientemente caotico l’autocorrelazione temporale di ogni variabile

24Si ricordi

Et

�eq =

E�eq =U .

158 Andrea Carati e Luigi Galgani

dinamica tende a zero. Ed in effetti, i sistemi dinamici detti di tipo mixing (ovvero, me-scolanti) vengono definiti proprio come quelli che hanno tale proprietà (le correlazionitemporali di ogni coppia di funzioni tende a zero per t →+∞).25

La formula (6.6.2), che generalizza quella di Einstein–Boltzmann, è davve-ro alquanto rilevante, perché mostra che il calore specifico misurato si riduce aquello di equilibrio se il sistema è abbastanza caotico da far sì che l’autocorrela-zione temporale dell’energia del sistema su cui si esegue la misura si annulli pertempi sufficientemente lunghi. Il tempo dopo il quale la correlazione è prati-camente nulla viene allora identificato con il tempo di rilassamento, o il tempocaratteristico per il compiersi della misura.

Osservazioni conclusive

Ma potrebbe presentarsi anche un fenomeno diverso, ovvero che al crescere deltempo l’autocorrelazione temporale, invece di tendere a zero, tenda a un valorenon nullo in maniera tale che fino a tempi molto più lunghi non si manifestialcuna tendenza a un successivo rilassamento. In tal caso l’osservatore giudiche-rebbe di trovarsi a tutti gli effetti in una situazione di equilibrio (o di almenopratico equilibrio), ma il calore specifico presenterebbe un valore evidentementeinferiore a quello di equilibrio. Almeno qualitativamente ci si troverebbe allorain una situazione analoga a quella che si presenta all’equilibrio secondo la mecca-nica statistica quantistica. Si tratta in effetti di una situazione simile a quella chesi presenta nei vetri, in cui il sistema si trova in una situazione di apparente equi-librio. Esso si trova a tutti gli effetti in un ben definito stato termodinamico, mapresentando valori delle quantità termodinamiche (calore specifico etc.) diversedai valori di equilibrio. La possibilità di questa analogia, nell’ambito del proble-ma FPU, fu messa in luce per la prima volta nel 1982 da un gruppo di studiosiattorno a Parisi.26

Si noti che, mentre il calore specifico di equilibrio è una proprietà che dipende solo dallahamiltoniana del sistema di interesse, essendo del tutto indipendente dalla hamiltonianadi interazione con l’apparato di misura (diciamo il calorimetro), invece il tempo di mi-surazione dipende in maniera essenziale dall’hamiltoniana di interazione. In generale sipresume che tale tempo sia piccolo o almeno ben definito, e che quindi se ne possa pre-scindere. Naturalmente, diventa allora un problema matematico della teoria dei sistemidinamici classici determinare se questo rilassamento avvenga davvero (e, in caso afferma-tivo, dopo quanto tempo) per un dato sistema in interazione con un apparato di misura.Da un punto di vista concettuale, tale punto è stato discusso ad esempio nel lavoro diBirge e Nagel, dal titolo significativo “Observation of time dependent specific heat”.27 Il

25Dunque la sola proprietà di ergodicità, discussa nel corso di Meccanica Analitica 2, non bastaper recuperare i valori canonici per tutte le quantità termodinamiche. Sono necessarie proprietàpiù forti di tipo mixing, anch’esse discusse in quel corso.

26Fucito et al, 198227N.O. Birge, Phys. Rev. B 34, 1631 (1986); N.O. Birge, S.R. Nagel, Phys. Rev. Lett 25, 2674

(1985). Si veda anche A. Carati, L. Galgani, Europhys. Lett. 74, 528 (2006).

Fondamenti della meccanica quantistica: Kubo 159

problema è particolarmente acuto nel caso dei vetri, in cui il rilassamento richiede tempigeologici.